专栏名称: 鲜枣课堂
这里有最通俗易懂的通信知识!
目录
相关文章推荐
国际金融报  ·  连收两张罚单!这家券商被警示 ·  昨天  
晓央就业  ·  央企系 | ... ·  2 天前  
晓央就业  ·  央企系 | ... ·  2 天前  
安泰职发  ·  招聘资讯 | ... ·  2 天前  
国际金融报  ·  又有15家私募机构被注销! ·  2 天前  
51好读  ›  专栏  ›  鲜枣课堂

写给小白的“数据仓库”科普

鲜枣课堂  · 公众号  ·  · 2025-03-11 20:40

正文

请到「今天看啥」查看全文



终极目的,当然是增加收入、提升效率、降低成本。

现在很多企业搞数字可视化大屏,背后就是数据仓库的支持

  • 面向主题

传统数据库,围绕具体的工作(应用 来组织数据,用于一个明确的事务。例如进销存数据库、考勤数据库、财务数据库等。

而数据仓库,是按照主题来组织数据的。所谓主题,是一个特定的业务领域,或者一个明确的分析目标,例如销售分析主题、员工敬业度主题,学生在校表现主题等等。主题的范围更大,level(层级 更高。

简单来说,数据仓库的数据,是多个传统数据库的集合和“拉通”。它把不同数据库表单的信息挑选整合在一起,提供了一个更全面的数据呈现。

主题性的设计,显然更适合支持管理者做决策和分析。

  • 集成

集成,是指数据仓库可以整合来自多个不同数据源(企业内部数据库、供应商数据库、渠道商数据库等)的数据。

多方面的数据源,也是为了提供一个更全面的视角,以便服务于分析和决策。

这些数据,可以包括结构化数据、半结构化数据和非结构化数据等。但数据仓库,主要还是结构化数据为主。

  • 相对稳定

相对稳定,指的是 数据一旦被加载到数据仓库中,通常不会更新或修改,确保了数据的稳定性和用于长期分析的可靠性。

换言之,数据仓库所涉及的操作,主要是数据查询,而不是修改。

除了数据之外,数据仓库的架构一般也不会频繁变化。

  • 反映历史变化

传统数据库,一般都是数据更新。写入新数据,替换旧数据。

数据仓库不一样。它保存了大量的历史数据,有利于企业从时间的维度,分析业务的发展趋势。

面向主题、集成、相对稳定、反映历史变化,这就是数据仓库的四大特征。

我们还是以超市为例,总结一下数据仓库和传统数据库的区别。

假如你有一个大超市。

超市有基于传统数据库的很多个收银台,记录了每天的每一笔交易(卖出了什么商品,金额是多少)。超市还有库存系统,记录了商品的信息(一共有多少个库存)。 还有会员系统、购物卡系统,等等。

所有这些数据,分散在不同的系统里,杂乱无章。

你把所有系统的数据(销售数据、顾客信息、供应商记录等),统一做了整理(比如去掉无效数据、统一“日期”格式),按主题分类(比如“销售分析”、“客户画像”),集中存到一个庞大的数据系统里。这就是数据仓库。

然后,你开发了一些工具,可以分析这些数据,回答你的一些疑问:

“过去5年哪些商品在春节卖得最好?”
“上海和北京的顾客购物习惯有什么差异?”
“如何预测明年的商品库存需求?”
……

也可以以大屏的形式,观看这些数据 (掌控全局、运筹帷幄的老板既视感):







请到「今天看啥」查看全文