专栏名称: 互联网AI早读课
专注互联网产品、用研、交互、设计、运营领域精选内容。信息爆炸的社会,每天用心的去读一篇文章,也许胜过你的走马观花。每早八点,我们等你。
目录
相关文章推荐
新浪科技  ·  【@雷军 ... ·  21 小时前  
新浪科技  ·  【新高!#银行股赢麻了还能上车么#?】 ... ·  20 小时前  
Web3天空之城  ·  Cursor核心成员圆桌:用强化学习训练编码 ... ·  21 小时前  
Web3天空之城  ·  Cursor核心成员圆桌:用强化学习训练编码 ... ·  21 小时前  
成都日报  ·  微周刊|“芒”有所获 ... ·  昨天  
51好读  ›  专栏  ›  互联网AI早读课

如何七周成为数据分析师

互联网AI早读课  · 公众号  · 科技媒体  · 2016-11-29 08:15

正文

请到「今天看啥」查看全文



下面是为了以后更好的基础而附加的学习任务。


了解单元格格式,后期的数据类型包括各类timestamp,date,string,int,bigint,char,factor,float等。


了解数组,以及怎么用(excel的数组挺难用),Python和R也会涉及到 list。


了解函数和参数,当进阶为编程型的数据分析师时,会让你更快的掌握。


了解中文编码,UTF8和ASCII,包括CSV的delimiter等,以后你会回来感谢我的。


这一周的内容我会拆分成两部分:函数篇和技巧篇。


这是一道练习题,我给你1000个身份证号码,告诉我里面有多少男女,各省市人口的分布,这些人的年龄和星座。如果能完成上述过程,那么这一周就直接略过吧。(身份证号码规律可以网上搜索)




第二周:数据可视化


数据分析界有一句经典名言,字不如表,表不如图。数据可视化是数据分析的主要方向之一。除掉数据挖掘这类高级分析,不少数据分析就是监控数据观察数据。

数据分析的最终都是要兜售自己的观点和结论的。兜售的最好方式就是做出观点清晰数据详实的PPT给老板看。如果没人认同分析结果,那么分析也不会被改进和优化,不落地的数据分析价值又在哪里?

首先要了解常用的图表:




Excel的图表可以100%完成上面的图形要求,但这只是基础。后续的进阶可视化,势必要用到编程绘制。为什么?比如常见的多元分析,你能用Excel很轻松的完成?但是在IPython只需要一行代码。




其次掌握BI,下图是微软的BI。




BI(商业智能)和图表的区别在于BI擅长交互和报表,更擅长解释已经发生和正在发生的数据。将要发生的数据是数据挖掘的方向。


BI的好处在于很大程度解放数据分析师的工作,推动全部门的数据意识,另外降低其他部门的数据需求(万恶的导数据)。








请到「今天看啥」查看全文