专栏名称: 网络大数据
打造中国最专业的网络大数据科学门户网站,提供新闻动态、研究资料、测量工具、数据报告、在线测量等各项信息及服务,供IDC,CDN,ICP和普通大众共同学习进步。
目录
相关文章推荐
数据派THU  ·  【斯坦福大学Xiang Lisa ... ·  3 天前  
软件定义世界(SDX)  ·  数据资源入表的理论溯源与研究路径 ·  2 天前  
CDA数据分析师  ·  《CDA二级教材》电子版上线CDA网校,助你 ... ·  2 天前  
51好读  ›  专栏  ›  网络大数据

大数据10的个常见误解:算法即预言家、大数据必干净

网络大数据  · 公众号  · 大数据  · 2017-08-30 17:08

正文

请到「今天看啥」查看全文



3

有人类分析人员会被机器算法取代


数据科学家的建议并不总是被前线的业务经理们执行。行业高管Arijit Sengupta在TechRepublic 的一篇文章中指出,这些建议往往比科学项目更难实施。然而,过分依赖机器学习算法也同样具有挑战性。Sengupta说,机器算法告诉你该怎么做,但它们没有解释你为什么要这么做。这使得很难将数据分析与公司战略规划的其余部分结合起来。


预测算法的范围从相对简单的线性算法到更复杂的基于树的算法,最后是极其复杂的神经网络。

来源:dataiku,dataconomy。

4

数据湖是必不可少的


据丰田研究所数据科学家Jim Adler说,对于巨量存储库,一些IT经理们设想用它来存储大量结构化和非结构化数据,根本就不存在。企业机构不会不加区分地将所有数据存放到一个共享池中。Adler说,这些数据是 “精心规划”的,存储于独立的部门数据库中,鼓励”专注的专业知识”。这是实现合规和其他治理要求所需的透明度和问责制的唯一途径。


5

算法是万无一失的预言家


不久前,谷歌流感趋势项目被大肆炒作,声称比美国疾病控制中心和其他健康信息服务机构更快、更准确地预测流感疫情的发生地。正如《纽约客》的Michele Nijhuis 在2017年6月3日的文章中所写的那样, 人们认为与流感有关词语的搜索会准确地预测疫情即将爆发的地区。事实上,简单地绘制本地温度是一个更准确的预测方法。







请到「今天看啥」查看全文