SPSS分析技术：lambda系数和不确定系数

生活统计学 · 公众号 · · 2019-04-17 23:58

正文

请到「今天看啥」查看全文

举个例子来解释lambda系数的计算逻辑。现在有四种保守疾病治疗方案，选取240个疾病情况相似的病人，随机分配成四组，分别适用四种治疗方案，最后的实验结果如下所示：

需要注意，lambda系数是一种预测性相关性系数，两个变量可以事先确定好因变量和自变量。在列联表中，我们通常将自变量放在列位置，例如上方的治疗方案；而将因变量放在行位置，如上方的治疗结果。黄色数字代表每列中最大的频数，而红色字代表所有行中最大的频数和。将上方的数字带入lambda公式，得到如下结果：

Lambda系数为0.06，代表行变量治疗效果和列变量治疗方案之间相关性很低。从计算过程可知，lambda系数表示相关性的计算逻辑就是，如果行变量和列变量之间没有相关性，那么频数和最大的行中的数值，在每列中也应该是最大的数值。反之，频数和最大的行中数值，在每列中都不是最大数值，那么说明行变量特定水平和列变量特定水平是有对应性的。例如上例，如果接受方案C和方案D治疗的病人，大多数都好转，而方案A大多数恶化，方案B大多数不变，那么很明显可以说明治疗方案对治疗效果有相助影响，它们是相关的。

不确定系数

不确定系数也被称为Theil‘s U，可以简写为UC。与lambda系数一样，两个定类变量也会事先确定好因变量和自变量，同样是一种衡量自变量对因变量预测能力的系数，从而判定两个变量的相关强度。它的计算公式如下：

从不确定系数的计算公式可知，不确定系数与Lambda系数的计算逻辑不同。 Lambda系数只考虑因变量（行变量）的频数变异情况，而不确定系数不仅考虑行变量频数变异情况，而且考虑列变量频数变异情况，所以不确定系数在n*m列联表情况下比lambda系数更常用。同样用上方案例数据计算其不确定系数，计算过程如下：