专栏名称: CDA数据分析师
CDA数据分析师品牌官方微信,开放、创新、分享。
目录
相关文章推荐
CDA数据分析师  ·  【干货】如何用 AI 从0到1 ... ·  2 天前  
数局  ·  原想&伊肤泉:2025问题肌抗衰白皮书 ·  2 天前  
51好读  ›  专栏  ›  CDA数据分析师

10个令人相见恨晚的R语言包

CDA数据分析师  · 公众号  · 大数据  · 2017-09-14 18:27

正文

请到「今天看啥」查看全文


.packages( "forecast" ) library (forecast) # mdeaths: 英国每月死于肺病的人数fit #定制你的置信区间forecast(fit, level=c( 80 , 95 , 99 ), h= 3 ) #         Point Forecast    Lo 80    Hi 80    Lo 95    Hi 95    Lo 99    Hi 99#Jan 1980       1822.863 1564.192 2081.534 1427.259 2218.467 1302.952 2342.774#Feb 1980       1923.190 1635.530 2210.851 1483.251 2363.130 1345.012 2501.368#Mar 1980       1789.153 1495.048 2083.258 1339.359 2238.947 1198.023 2380.283plot (forecast(fit), shadecols= "oldstyle" )

我最喜欢的特性是产生预测的时序图。



3. plyr


当我第一次使用R时,我用基本的控制运算来操纵数据(for, if, while, etc.)。我很快知道这是一个业余的做法,并且有更好的方法去实现。


在R中,apply函数族是在对列表或者向量每个元素调用函数的首选方法。虽然R基础库中有这些函数,但它们的使用可能难以掌握。我发现plyr包 是一个对R基础库中诸如split,apply, combine的泛函的更好用的替代。


plyr 给予你一些函数 (ddply, daply, dlply, adply, ldply)按照常见的蓝图:将数据结构分组拆分,对每个组应用一个函数,将结果返回到数据结构中。


ddply 拆分一个数据框(data frame)并且返回一个数据框 (所以是 dd)。 daply 拆分一个数据框并且返回一个数组(array) (所以是 da)。希望你明白这个想法。


译者注:plyr包包含了12个命名与功能相关的函数,均以..ply命名,第一个.表示输入的数据类型(a数组 d数据框 l列表),第二个.表示输出的数据类型(_表示不输出)

install.packages("plyr")library(plyr)# 按照 Species 拆分数据库,汇总一下,然后转换结果# 到数据框ddply(iris, .(Species), summarise,
      mean_petal_length=mean(Petal.Length)
)#     Species mean_petal_length#1     setosa             1.462#2 versicolor             4.260#3  virginica             5.552# 按照 Species 拆分数据库,汇总一下,然后转换结果# 到数组unlist(daply(iris[,4:5], .(Species), colwise(mean)))#    setosa.Petal.Width versicolor.Petal.Width  virginica.Petal.Width#                 0.246                  1.326                  2.026


4. stringr


我发现R基础库的字符串功能使用起来非常困难和麻烦。Hadley Wickham编写的另一个包, stringr,提供了一些非常需要的字符串运算符。很多函数使用那些做基础分析时不常用的数据结构。



stringr 非常易于使用。几乎所有的(和所有的重要功能)都以”str”为前缀,所以很容易记住。

install.packages("stringr"






请到「今天看啥」查看全文