专栏名称: CDA数据分析师
CDA数据分析师品牌官方微信,开放、创新、分享。
目录
相关文章推荐
数据派THU  ·  CUDA重大更新:原生Python可直接编写 ... ·  2 天前  
数局  ·  林家铺子终于倒闭了 ·  昨天  
数据派THU  ·  【阿姆斯特丹博士论文】在测试时学习泛化 ·  3 天前  
大数据文摘  ·  Meta首席科学家LeCun:当前 AI ... ·  6 天前  
CDA数据分析师  ·  《CDA二级教材》电子版上线CDA网校,助你 ... ·  5 天前  
51好读  ›  专栏  ›  CDA数据分析师

【书单】18本数据科学家必读的R语言和Python相关书籍

CDA数据分析师  · 公众号  · 大数据  · 2017-05-21 21:04

正文

请到「今天看啥」查看全文



R 数据可视化手册

R Graphics Cookbook

作者:Winston Chang

译者:肖楠, 邓一硕 , 魏太云


数据可视化使人能够使用形状和颜色来表达和分析他们的发现,而不仅仅使用表格。透彻的了解图表,明确何时使用哪个图表,以及如何定制图表是数据科学家的关键技能。本书不仅仅具有理论知识,而且强调如何 在 R 中构建 样本数据集。同时专注使用 ggplot2 包来进行可视化。



应用预测建模

Applied Predictive Modeling

作者:Max Kuhn, Kjell Johnson


作者之一 Max Kuhn 本身就是 caret 包的开发者。本书是理论和实践知识的完美融合。它讨论了几个关键的机器学习主题,如过拟合,特征选择,线性和非线性模型,树型方法等。并且使用 caret 包演示了所有算法。Caret 是 CRAN 库中功能强大的机器学习包之一。



统计学习导论:基于 R 应用

Introduction to Statistical Learning

作者:Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani

译者:王星


本书是最详尽统计建模的书之一。此外,它包括对线性回归,逻辑回归,树木,SVM,无监督学习等主题的深入解释。由于是导论,所以解释浅显易懂,任何新手都可以轻松学习。而且还附有练习。推荐这本书给所有使用 R 语言进行机器学习新手。



统计学习要素

Elements of Statistical Learning

作者:Trevor Hastie, Robert Tibshirani, Jerome Friedman


本书是“统计学习导论”的下一部分。它包含更高级的主题,因此不建议跳过上一本书直接读这本。这本书适合掌握机器学习基础知识的人。它涉及收缩方法,不同的线性回归方法,分类,内核平滑,模型选择等。对于想深入了解机器学习的人来说,这是一本必读书。



机器学习与 R 语言

Machine Learning with R

作者: Brett Lantz

译者: 李洪成, 许金炜, 李舰


书中作者解释概念浅显易懂,令人印象深刻。本书围绕机器学习,同时涵盖了很多实践方面的知识。通过案例研究,讨论了 Bagging,Boosting,SVM,神经网络,聚类等算法。这些案例将帮助你了解这些算法。另外还阐述了机器学习参数的知识。



掌握机器学习与 R 语言

Mastering Machine Learning with R

作者: Cory Lesmeister


本书适合所有想要通过掌握 R 语言进行机器学习人。它包括(几乎)所有算法及其在 R 语言中的执行。此外,本书介绍了一些用于机器学习的 R 包,包括最近推出的 H2o 包。本书还介绍了机器学习的最新发展,因此建议每个学习 R 语言的人阅读本书。但是,不能期望从本书中学习到高级机器学习概念,如堆叠。



机器学习:实用案例解析

Machine Learning for Hackers

作者: Drew Conway, John Myles White

译者: 陈开江, 刘逸哲, 孟晓楠


与其他类似书籍相比,本书篇幅较短。但是对每个涉及的主题都进行了深入探讨。为了加强理解,作者还通过例子,在解决问题的同时解释了基础方法。对于想要学习机器学习的人群来说,本书值得一读。



数据科学:理论、方法与 R 语言实践

Practical Data Science with R

作者:Nina Zumel,John Mount

译者: 于戈, 鲍玉斌, 王大玲


顾名思义,本书注重在现实生活中使用数据科学。本书与众不同之处在于,上述其他书籍均未讨论模型构建,模型的部署在现实问题中面对的挑战。本书作者的关注点始终没有偏离构建机器学习的理论与现实世界影响之间的联系。对尚未进入分析行业的人士来说,推荐阅读本书。


数据科学之 Python







请到「今天看啥」查看全文