专栏名称: 生活统计学
平台致力于将统计学基础与生活实例联系起来,带大家走进生活统计学的世界。介绍统计软件SPSS/SAS/Minitab的生活统计运用技巧。
目录
相关文章推荐
做書  ·  2025“北京书展”BIBF逛展指南 ·  7 小时前  
理想国imaginist  ·  家庭典藏首选,如果你仍然想理解世界|618独家加赠 ·  9 小时前  
理想国imaginist  ·  家庭典藏首选,如果你仍然想理解世界|618独家加赠 ·  9 小时前  
新华每日电讯  ·  “一骑红尘”,你读对了吗? ·  昨天  
范志红_原创营养信息  ·  病毒感染,除了呼吸道还会伤害这个器官 ·  2 天前  
51好读  ›  专栏  ›  生活统计学

统计理论深度阅读:相关系数家谱(第二部)

生活统计学  · 公众号  ·  · 2019-03-20 23:58

正文

请到「今天看啥」查看全文



对比上一篇文章介绍的Gamma相关系数,Yule‘s Q相关系数的公式与Gamma相关系数是一样的,区别在于Yule’s Q相关系数只能用于2*2列联表,而Gamma系数可以用于大于2*2列联表的情况,也就是两个分类变量的水平数大于2。此外,Gamma要求两个分类变量都是定序型变量。


Yule‘s Y相关系数

Yule‘s Y相关系数是Yule‘s Q相关系数的保守修正,通过对一致对和非一致对进行平方根处理,从而达到保守修正的目的。但是这个相关系数不常用,它的计算公式如下所示:


列联系数(C)

列联系数用于表示两个定类型变量之间的相关强度。列联系数是Phi相关系数的应用拓展,因为Phi只能用于两个定类型变量都只有两个水平(2*2列联表),如果水平数大于2,Phi相关系数可能会大于1,所以列联系数对Phi相关系数进行了修正,计算公式如下所示:


从计算公式可知,列联系数列联表尺寸和样本量的影响比较大。统计学家发现,当列联表尺寸小于5*5时,列联系数对于相关强度的表示更为准确,所以列联系数更多用在小于5*5尺寸的列联表中。此外,对于行列数不相等的列联表,列联系数C永远不可能等于1,所以列联系数更多用在尺寸小于5*5的行列数相同的列联表中。此外,还有一个Sakoda列联系数,是针对列联系数在用于5*5及以上尺寸列联表时,表现不佳的修正系数,它的计算公式如下:


Tshuprow’s T系数

对于列联表尺寸大于5*5的情况,列联系数会低估两个变量之间的相关强度,因此可以用Tshuprow‘s T代替,该回归系数的计算公式如下:


Cramer’s V系数

在所有的用于两个分类变量的相关系数中,Cramer’s V是最常用的相关系数,因为Cramer’s V能够用于两个分类变量中,一个是定类变量或者两个都是定类变量情况。此外,Cramer’s V既可以用于行列数相等的情况,也可以用于行列数不相等的情况,适用范围很广。Cramer’s V的计算公式如下:


Lambda系数

Lambda相关系数又被称为Goodmanand Kruskal lambda系数,lambda系数即可以用于两个定类数据的相关分析,也可以用于两个定序数据、一个定类和一个定序变量的相关分析。Lambda系数的计算公式为:







请到「今天看啥」查看全文