10个令人相见恨晚的R语言包

CDA数据分析师 · 公众号 · 大数据 · 2017-09-14 18:27

正文

请到「今天看啥」查看全文

.packages( "forecast" ) library (forecast) # mdeaths: 英国每月死于肺病的人数fit #定制你的置信区间forecast(fit, level=c( 80 , 95 , 99 ), h= 3 ) # Point Forecast Lo 80 Hi 80 Lo 95 Hi 95 Lo 99 Hi 99#Jan 1980 1822.863 1564.192 2081.534 1427.259 2218.467 1302.952 2342.774#Feb 1980 1923.190 1635.530 2210.851 1483.251 2363.130 1345.012 2501.368#Mar 1980 1789.153 1495.048 2083.258 1339.359 2238.947 1198.023 2380.283plot (forecast(fit), shadecols= "oldstyle" )

我最喜欢的特性是产生预测的时序图。

3. plyr

当我第一次使用R时，我用基本的控制运算来操纵数据(for, if, while, etc.)。我很快知道这是一个业余的做法，并且有更好的方法去实现。

在R中，apply函数族是在对列表或者向量每个元素调用函数的首选方法。虽然R基础库中有这些函数，但它们的使用可能难以掌握。我发现plyr包是一个对R基础库中诸如split,apply, combine的泛函的更好用的替代。

plyr 给予你一些函数 (ddply, daply, dlply, adply, ldply)按照常见的蓝图：将数据结构分组拆分，对每个组应用一个函数，将结果返回到数据结构中。

ddply 拆分一个数据框(data frame)并且返回一个数据框 (所以是 dd)。 daply 拆分一个数据框并且返回一个数组(array) (所以是 da)。希望你明白这个想法。

译者注：plyr包包含了12个命名与功能相关的函数，均以..ply命名，第一个.表示输入的数据类型(a数组 d数据框 l列表)，第二个.表示输出的数据类型(_表示不输出)

install.packages("plyr")library(plyr)# 按照 Species 拆分数据库，汇总一下，然后转换结果# 到数据框ddply(iris, .(Species), summarise,
      mean_petal_length=mean(Petal.Length)
)#     Species mean_petal_length#1     setosa             1.462#2 versicolor             4.260#3  virginica             5.552# 按照 Species 拆分数据库，汇总一下，然后转换结果# 到数组unlist(daply(iris[,4:5], .(Species), colwise(mean)))#    setosa.Petal.Width versicolor.Petal.Width  virginica.Petal.Width#                 0.246                  1.326                  2.026