专栏名称: 爱数据LoveData
中国统计网(www.itongji.cn),国内最大的数据分析门户网站。提供数据分析行业资讯,统计百科知识、数据分析、商业智能(BI)、数据挖掘技术,Excel、SPSS、SAS、R等数据分析软件等在线学习平台。
目录
相关文章推荐
51好读  ›  专栏  ›  爱数据LoveData

【社群精选22】数据质量的保障机制

爱数据LoveData  · 公众号  · BI  · 2019-10-15 19:30

正文

请到「今天看啥」查看全文


保障数据质量是谁都意识得到的问题。


但关键是建立一个什么样的“机制”才能让数据质量有保障呢?最重要的是透明及时的沟通。


那么,如何让“透明”和“及时”这两个关键词落地呢?数据分析师需长期做下面几件事情。


建立并维护数据字典


数据字典,就是将数据库中的所有字段及取值的含义做清晰的说明,并可进行方便的查询。用Excel建表后用“Ctrl+F”快捷键查询,也能满足一般的需求。


这里建议,不仅公司的产研部门需要建立数据字典并定期维护,数据分析师(或业务分析部门)也要建立数据字典并及时维护。有时是由业务的分析师及时发现问题,倒逼产研方面的数据字典进行更新。在双方共同努力下,数据字典的及时性和准确性才能得到保证。


建立并维护业务指标说明书


在数据工作中,为了量化业务,一定会有许多指标,有些在指标体系内,有些在指标体系外。指标说明书的作用就是将业务场景中使用到的所有指标进行统一的定义,明确取数来源(数据库、字段)、口径、计算公式和单位。有时也可加上应用场景。要注意的是:指标名称一定要有独立性。


建立并维护标准化的取数代码库






请到「今天看啥」查看全文