专栏名称: 爱数据LoveData
中国统计网(www.itongji.cn),国内最大的数据分析门户网站。提供数据分析行业资讯,统计百科知识、数据分析、商业智能(BI)、数据挖掘技术,Excel、SPSS、SAS、R等数据分析软件等在线学习平台。
目录
相关文章推荐
51好读  ›  专栏  ›  爱数据LoveData

R语言多元统计分析初探

爱数据LoveData  · 公众号  · BI  · 2016-12-27 17:20

正文

请到「今天看啥」查看全文




# plot the variables
for(i in 1:numvariables){
vectori
namei
colouri

if(i == 1) {plot(vectori,col=colouri,type="l",ylim=c(mymin,mymax))}
else  {points(vectori,col=colouri,type="l")}

lastxval
lastyval
text((lastxval-10),(lastyval),namei,col="black",cex=0.6)
}
}

例如,为了画出葡萄酒样本中前五种化学物质的轮廓图(他们存储在“wine”变量的V2,V2,V4,V5,V6列),我们输入:

library(RColorBrewer)
names
mylist
makeProfilePlot(mylist,names)

计算多元统计数据的概要统计量

另一件事便是你可能会想计算你的多元统计数据集中每一个变量的概要统计量,像均值、标准偏差之类。

sapply(wine[,2:14],mean)
sapply(wine[,2:14],sd)

我们可以通过标准化来使数据看起来更有意义,以使我们能清楚的比较这些变量。我们需要便准化每一个变量以便使他们样本方差为1,样本均值为0.

每组的均值与方差

通常感兴趣于从一个特定样本群体去计算其均值和标准偏差,例如,计算每一个品种葡萄酒样本。葡萄酒品种被存储在“wine”变量的“V1”列中。

为了仅提取2号品种的数据,我们输入:

cultivar2wine
sapply(cultivar2wine[2:14],mean)
sapply(cultivar2wine[2:14],sd)







请到「今天看啥」查看全文