正文
我们只搜集入门课程,因此这份指南并不包括像约翰霍普金斯大学在Coursera的Data Science Specialization或是Udacity上的Data Analyst Nanodegree这样的专项课程或项目。这些课程的汇编与这份指南的目的相悖:为数据科学教育寻求每个方面最好的单独课程。本系列文章的最后三份指南,将详细介绍数据科学过程中的每个方面。
下面列出来的一些课程需要基础的编程、统计和概率背景。这个要求很容易理解,因为新的内容为进阶阶段,而且这些主题经常要用到这些背景知识。
这些背景知识可以在这份我们推荐的数据科学就业指南的前两章(编程,统计)中获得。
我们认为最好的数据科学入门课程是——
在我们评估的20多门数据科学课程中,Kirill Eremenko在Udemy上的“数据科学从A到Z”不管从广度还是深度上来说都是当之无愧的赢家。它拥有3071条评论,4.5星的加权平均评分,是评分最高、评论最多的入围课程。
它概述了完整的数据科学过程,并提供了真实案例。视频内容为21小时,长度刚好。评论者们喜欢导师的讲解方式和内容组织方式。价格经常会跟着Udemy的优惠而变化,因此你也有可能以10美金的低价购买到该课程。
虽然它并不满足我们“使用通用数据科学工具”的评估原则,但是非Python/R工具的应用(gretl, Tableau, Excel)也都算恰如其分。Eremenko在解释他为什么用gretl(一种统计软件包)时说了以下这段话,这个解释也适用于他所使用的其他工具(敲黑板划重点!):
使用gretl,我们可以像在R和Python中一样建模,但却不必编程。这很重要。你们中的一些人可能已经很熟悉R语言,但还有一些人可能不。而我的目标是向你们展示如何建立稳定的模型,并且给你一个可以应用于任何工具的框架。gretl能够帮助我们避免于纠结编程。
一个著名的评论者是这样写的:
Kirill是我在线上发现的最好的老师。他通过生活中的案例向你解释一些常见问题,这样你就能对课程作业有更深的理解。他还提供了很多关于作为一个数据科学家意味着什么的洞见,从如何处理不充分的数据到向高级管理层汇报工作等。我强烈建议初级和中级数据分析师们学习这门课程。
“数据科学从A到Z”预览视频
Udacity的数据分析入门(Intro to Data Analysis)是门新上线的课程,是受欢迎的Data Analyst Nanodegree系列中的一部分。虽然在建模方面有所欠缺,它仍然清晰地涵盖了使用Python的数据科学过程。预估课程时间是36个小时(跨度六周,每周六小时),尽管以我个人经验看会更短。它仅有1个5星好评(译者安:现在有两个),并且免费。
该课程的视频制作精良,导师(CarolineBuckey)思维清晰、风度翩翩,有大量的编程小测验可以强化人们在视频中学到的概念和知识。课程完成后,学生们会为他们新学和/或提高的NumPy和 Pandas(这两个都是流行的Python库)技能感到自信。最后的作业(在这个单独的免费课程中没有,但是会在Nanodegree中得到评分和评估)是一个很好的额外补充。
Udacity导师Caroline Buckey
概述了数据分析过程(也叫数据科学过程)
数据科学基础是由IBM的大数据大学(Big Data University)提供的有四门课的系列课程。这四门课分别是数据科学101、数据科学方法论、使用开源工具开始学习数据科学,以及R语言 101。
它涵盖了整个数据科学过程,并介绍了Python、R以及其他开源工具。课程的实用价值惊人。估计需要13-18小时学习时间,具体取决于你是否参加最后一门“R 101”。当然,从这份指南的目的来说,这门课也不是必须。不幸的是,我们用于这次分析的主要评论网站上竟然一个评价都没有,因此我们无法基于评论做出评价,不过这个课程是免费的。
来自大数据大学(Big Data University)
数据科学101课程(数据科学基础系列课程)
第一模块的视频
第一名是加权评分4.5星评论超过3068条的课程。下面我们按评分降序排列来看看其他值得一学的课程。如果你对R语言感兴趣,你还能在下面找到重点教授R语言的课程。