专栏名称: 爱数据LoveData
中国统计网(www.itongji.cn),国内最大的数据分析门户网站。提供数据分析行业资讯,统计百科知识、数据分析、商业智能(BI)、数据挖掘技术,Excel、SPSS、SAS、R等数据分析软件等在线学习平台。
目录
相关文章推荐
51好读  ›  专栏  ›  爱数据LoveData

数据分析必不可少—仓库基本架构

爱数据LoveData  · 公众号  · BI  · 2019-05-31 17:00

正文

请到「今天看啥」查看全文



数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层—— 数据获取、数据仓库、数据应用:


数据仓库的结构


数据仓库从各数据源获取数据及在数据仓库内的数据转换和流动都可以认为是ETL(抽取Extra, 转化Transfer, 装载Load)的过程。ETL是数据仓库的流水线,也可以认为是数据仓库的血液,它维系着数据仓库中数据的新陈代谢, 数据仓库日常的管理和维护工作的大部分精力就是保持ETL的正常和稳定。


03 数据仓库


1.数据获取

对于网站数据仓库而言,点击流日志是一块主要的数据来源,它是网站分析的基础数据;当然网站的数据库数据也并不可少,其记录这网站运营的数据及各种用户操作的结果,其他是网站内外部可能其它各类对于公司决策有用的数据。


2.数据仓库

2.1数据模型:

数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。


数据仓库模型是数据模型中针对特定的数据仓库应用系统的一种特定的数据模型








请到「今天看啥」查看全文