专栏名称: 零一
零一自己的公微号,不是机器人哦,是真人哦!O(∩_∩)O~
目录
相关文章推荐
庞门正道  ·  真正的闪电侠来了! ·  9 小时前  
室内设计联盟网  ·  首发 x 矩阵纵横 | ... ·  18 小时前  
庞门正道  ·  只让看,不让吃,太馋了~ ·  昨天  
字体设计  ·  标题文字处理小技巧:添加肌理 ·  3 天前  
51好读  ›  专栏  ›  零一

[原创连载]跟数据分析师从0开始学数据-10

零一  · 公众号  ·  · 2018-09-18 16:25

正文

请到「今天看啥」查看全文


经过筛选,可以直接拿出毛衣这组数据。

(为什么散点图是第77个点,而excel中是第78行?这个问题其实之前一直有人问我。但如果阅读到这一篇,还不能独立思考这个问题的话,那请先回过头去看前面的7篇)

经过和生e经的数据对比,这个数据没有错,生e经上面就是这个数据。但是根据逻辑和常识,可以立马判定这个数据是个错误值。

“为什么能立马判定这个是错误值?”如果不明白的话还是自己想啊,哈哈。

确定这个数据是个错误值后,我们也无法更正这个数据了。那要如何处理这个数据呢?已经无法更正了,就剩余两个方法: 1、删除。2、替换。

删除的话,这里不适用。一删就少了一个月的数据了。那这里就用替换。

怎么替换?那方法就多的去了。最简单的方法是用 平均值替换法 ,平均值替换也有多种技巧。

方法1 、取这个值的前后两个数据的平均值,也就是(935086015+894448225)/2=914767120,用这个数字来替换,就要比之前的靠谱多了。

方法2、 先剔除错误行,然后算出平均售价,用平均售价乘以错误行的成交量即可。算得173*5292179=915546967

理论上面来讲应该是方法2比较准确一点。我就用方法2替换这个错误值。替换后的散点图如下。

异常值就不见了,我们就可以对这组数据做分析了。

另一种情况,如果这个孤立点不是错误值呢?也就是数据无误,那这个时候,我们就要深入分析了。

看下面这个案例吧!虽然特别简单,但可以表达清楚即可。

某店的销售额,每天记录下来,通过观察即可发现(如果是淘宝,数据魔方,生e经等工具都有这个数据的,在网上就可以看到)

发现18号销售额突然下降。依然是先判别是否错误值。判别无误。

数据无错的情况下,我们要找原因(这个案例真心太简单,将就着吧)

第一步是分解指标,找到关键指标。

通过分解 销售额=客单价X转化率X访客数







请到「今天看啥」查看全文