正文
微软亚太区资料科学总监 Graham Williams
「R是资料科学家最常用的分析工具!」Graham Williams 一语点出目前分析工具的使用现状,他认为,R能够成为最多资料科学家使用的工具,不仅是因为R是个开源且免费的工具,R更是资料科学家的生态圈。
他表示,R软体的生态圈中,有来自世界各地的资料科学家、统计学家、机器学习工程师等开发人员,都会使用R,若发现需要解决的问题,就会贡献套件(Package)到R的 CRAN(Comprehensive R Archive Network)中。
目前整个生态圈的资料科学家贡献的套件,已高达 10,450 个,「身为一个资料科学家,我拥有 10 万多的套件可以完成我的任务,」他举例,无论是时间序列的分析、金融预测分析和机器学习演算法,R都有相对的资源可以运用。
除此之外,Graham Williams 也补充,R软体与其他分析工具也可以相容,像是数据分析软体 Weka,在R软体中也可以直接呼叫 Weka 的套件来使用。
他认为,对资料科学家而言,R是个很强大的工具,因为只要单一工具,就可以使用相当多元的资源。
R 软体很大的优点就是有许多套件可以使用,不过,R的套件是谁在管理的呢?「R其实分为两个部分,一小部分由R核心团队管理,剩下的另一部分,开发人员可以贡献经过官方审核的套件到 CRAN 中,」Graham Williams 表示。
一般来说,开发人员贡献的套件必须经过缜密的审核,符合核心团队要求的套件,才能放入 CRAN,而R核心团队则负责小于 100 个重要的套件,且有权利修改R软体。
Visual Studio 整合R,打破两大限制
在 2015 年微软并购 Revolution Analytics 后,Graham Williams 强调,微软在 Visual Studio 上将R视为第一优先顺位,提供资料科学家R语言工具 R Tools for Visual Studio(RTVS),而且,R Studio 所拥有的功能 RTVS 几乎都有。
他认为,RTVS 可以让资料科学家不须要重新适应开发环境,可以直接在 Visual Studio 中使用R。