正文
# plot the variables
for(i in 1:numvariables){
vectori
namei
colouri
if(i == 1) {plot(vectori,col=colouri,type="l",ylim=c(mymin,mymax))}
else {points(vectori,col=colouri,type="l")}
lastxval
lastyval
text((lastxval-10),(lastyval),namei,col="black",cex=0.6)
}
}
例如,为了画出葡萄酒样本中前五种化学物质的轮廓图(他们存储在“wine”变量的V2,V2,V4,V5,V6列),我们输入:
library(RColorBrewer)
names
mylist
makeProfilePlot(mylist,names)
计算多元统计数据的概要统计量
另一件事便是你可能会想计算你的多元统计数据集中每一个变量的概要统计量,像均值、标准偏差之类。
sapply(wine[,2:14],mean)
sapply(wine[,2:14],sd)
我们可以通过标准化来使数据看起来更有意义,以使我们能清楚的比较这些变量。我们需要便准化每一个变量以便使他们样本方差为1,样本均值为0.
每组的均值与方差
通常感兴趣于从一个特定样本群体去计算其均值和标准偏差,例如,计算每一个品种葡萄酒样本。葡萄酒品种被存储在“wine”变量的“V1”列中。
为了仅提取2号品种的数据,我们输入:
cultivar2wine
sapply(cultivar2wine[2:14],mean)
sapply(cultivar2wine[2:14],sd)