专栏名称: 生活统计学
平台致力于将统计学基础与生活实例联系起来,带大家走进生活统计学的世界。介绍统计软件SPSS/SAS/Minitab的生活统计运用技巧。
目录
相关文章推荐
字体设计  ·  一位波兰设计师的创意海报 ·  昨天  
字体设计  ·  旧物观察:早期36款椭圆形酒标及字体设计 ·  2 天前  
字体设计  ·  武藏野美术大学二年级学生 GivU ... ·  3 天前  
设计上海  ·  专访|Markus ... ·  昨天  
51好读  ›  专栏  ›  生活统计学

SPSS分析技术:lambda系数和不确定系数

生活统计学  · 公众号  ·  · 2019-04-17 23:58

正文

请到「今天看啥」查看全文



举个例子来解释lambda系数的计算逻辑。 现在有四种保守疾病治疗方案,选取240个疾病情况相似的病人,随机分配成四组,分别适用四种治疗方案,最后的实验结果如下所示:


需要注意,lambda系数是一种预测性相关性系数,两个变量可以事先确定好因变量和自变量。 在列联表中,我们通常将自变量放在列位置,例如上方的治疗方案; 而将因变量放在行位置,如上方的治疗结果。 黄色数字代表每列中最大的频数,而红色字代表所有行中最大的频数和。 将上方的数字带入lambda公式,得到如下结果:


Lambda系数为0.06,代表行变量治疗效果和列变量治疗方案之间相关性很低。 从计算过程可知,lambda系数表示相关性的计算逻辑就是,如果行变量和列变量之间没有相关性,那么频数和最大的行中的数值,在每列中也应该是最大的数值。 反之,频数和最大的行中数值,在每列中都不是最大数值,那么说明行变量特定水平和列变量特定水平是有对应性的。 例如上例,如果接受方案C和方案D治疗的病人,大多数都好转,而方案A大多数恶化,方案B大多数不变,那么很明显可以说明治疗方案对治疗效果有相助影响,它们是相关的。


不确定系数

不确定系数也被称为Theil‘s U,可以简写为UC。 与lambda系数一样,两个定类变量也会事先确定好因变量和自变量,同样是一种衡量自变量对因变量预测能力的系数,从而判定两个变量的相关强度。 它的计算公式如下:


从不确定系数的计算公式可知,不确定系数与Lambda系数的计算逻辑不同。 Lambda系数只考虑因变量(行变量)的频数变异情况,而不确定系数不仅考虑行变量频数变异情况,而且考虑列变量频数变异情况,所以不确定系数在n*m列联表情况下比lambda系数更常用。 同样用上方案例数据计算其不确定系数,计算过程如下:







请到「今天看啥」查看全文