专栏名称: 数据分析
专注大数据,移动/互联网,IT科技,电子商务,数据分析/挖掘等领域的综合信息服务与分享平台。合作|约稿请加qq:365242293
目录
相关文章推荐
数局  ·  原想&伊肤泉:2025问题肌抗衰白皮书 ·  11 小时前  
软件定义世界(SDX)  ·  天塌了!苹果刚刚证明:DeepSeek,o3 ... ·  3 天前  
数据派THU  ·  基于相似性的类比比例*Similarity- ... ·  3 天前  
51好读  ›  专栏  ›  数据分析

数据平台维度模型设计十个技巧

数据分析  · 公众号  · 大数据  · 2016-12-19 14:28

正文

请到「今天看啥」查看全文




这两个流程背后代表某个业务事件活动,在不同的环节产生的数据项是不同的,如果将流程不同阶段的指标沉淀下来变为可度量的关键指标,如果将这些关键指标根据关系合并与设计到事实表中,就变为支撑业务人员分析、探索业务的细节数据。


为了能够从业务流程上的多维度来探索数据,所涉及到的很多维度最好是业务流程来做设计,比如上图交易现相关,从订单的来源,所属产品、到支付阶段的资金来源,从业务流程上来看,还可以扩展出更多的维度、与度量值。

在不同的业务环节,业务人员都会“很任性”的需求不同指标,但是在需求中往往是与业务流程有很大关系的。



三:尽量保证每张事实表与时间维度有关联


在原则二中描述那两个案例业务永远是与日期有关系的,不管是月、日、年、还是分、秒,财务年、自定义时间事件段等。


每个事实表至少有一个外键能够与日期维度表相连,时间维度能才能反映出存量与流量,才能分析某一时刻、某一时间段的业务流程变化情况。


四:同一张事实表的指标对应维度层级必须一致


一般的事实表有四种类型,粒度事实、周期性快照事实、聚合快照事实、非事实事实表,不管它们的粒度类型,事实表中的每个度量值在颗粒度上必须保持与维度的颗粒度是一致的,否则就等着崩溃吧。







请到「今天看啥」查看全文