专栏名称: CDA数据分析师
CDA数据分析师品牌官方微信,开放、创新、分享。
目录
相关文章推荐
小小挖掘机  ·  KDD 2024 | ... ·  10 月前  
51好读  ›  专栏  ›  CDA数据分析师

如何像数据科学家一样思考

CDA数据分析师  · 公众号  · 大数据  · 2017-05-20 23:34

正文

请到「今天看啥」查看全文



4. 关注正确的指标



• 谨防虚荣指标。

首先,活跃用户本身并没有带来多大信息。我宁愿说“活跃用户中增加了 5% 的妈妈用户”而不是说“ 活跃用户 增加了 10000 人”。这就是虚荣指标,因为活跃用户总是会增加的。我更愿意关注那些活跃的用户百分比,从而了解产品的情况。


试着找出与商业目标相关的衡量标准。

例如,一个月的平均销售量或用户数量。


5. 统计数据也可能说谎



对每件事都要持怀疑态度。过去,统计数据在广告、工作和其他许多营销场合时常常会作假。有时为了获得业绩、升职,人们愿意做任何事情。


比如,你真的相信高露洁声称的有 80% 的牙医推荐他们的牙膏吗?


这些数据一开始看起来还不错。 事实证明, 在采访牙医的时,他们会推荐好几个,而不仅仅是一个品牌。因此,其他品牌也可能像高露洁一样受欢迎。


另一个例子,99% 的正确率并没什么用。如果让我构建一个癌症预测模型,我可以在一行代码中给你一个 99% 准确的模型。怎么做?只要每一个都预测“没有癌症”即可。 因为癌症还是一种较为罕见的疾病,这么看来 我的正确率可能会高于 99% 。即便如此我也一无所获。


6. 理解概率的原理



1913 年夏天的某天,在摩纳哥的一家赌场,赌客们惊讶地目睹了赌盘的筛子连续 26 次都落在黑色区域。因为落在红色和黑色区域的概率正好对半,所以他们就确信总要轮到红色了。赌场在这天赚翻了。这就是 一个 赌徒谬论的完美例子,也就是蒙特卡罗谬论。


这同样也发生在现实生活中。人们倾向于避免连续相同的答案。有时为了得到看似更公平或更有可能的决策而牺牲判断的准确性。


例如,如果一个招生负责人已经通过了三份简历,那么下一份简历很可能被拒绝,即使该生能力出众。


7. 相关性不等于因果关系



数据科学家需要看清事物的本质。 仅仅因为两个变量相继发生改变并不一定意味着两者是因果关系。


过去有过这样的例子,比如: 通过消防局的数据,你似乎可以就此推断,随着更多的消防员到达火灾现场,造成的损失就越大。







请到「今天看啥」查看全文