正文
在这个模型里面,假设了男孩和女孩具有相同的标准差参数 σ,如果数据确实满足这一假设,那么在交互效应的模型里面男女性样本之间可以互相借用信息,从而提高估计(尤其是标准差参数)的准确性。σ 估计得好,对于回归系数们的假设检验的
统计效能
也就更高了。
如果
β
3
显著地大于或小于 0,说明男孩与女孩的身高随父母平均身高的变化率是不一样的,下图中
男孩和女孩的分别拟合的回归线会不平行,也就是存在交互效应
。
加入了交互效应之后的线性模型依然可以用极大似然估计和假设检验来找出最佳的回归系数以及对应的置信区间。
下表是统计软件对这个新模型给出的结果(由于在性别这个变量中,我们把男性标记为 1,为了表达清晰,我们把这个变量称为「男性」):
|
估计值
|
t
值
|
p
值
|
95%
置信区间
|
截距
β
0
|
88.06
|
5.19
|
4.67e-06
|
[54.89,
122.23]
|
父母平均身高
β
1
|
0.20
|
1.95
|
0.057
|
[-0.007, 0.42]
|
男性
β
2
|
-55.02
|
-2.29
|
0.027
|
[-103.37, -6.66 ]
|
父母平均身高
x
男性
(交互作用)
β
3
|
0.38
|
2.56
|
0.014
|
[0.08, 0.68]
|
我们把估计值代入到模型里面,可得到下面的定量关系:
子女身高 ~ 88.06 + 0.20 x 父母平均身高 - 55.02 x 男性 + 0.38 x 父母平均身高 x 男性
根据我们前面的讨论,从这个结果可以推导出
女孩身高 ~ 88.06 + 0.20 x 父母平均身高
以及
男孩身高 ~ 88.06 - 55.02 + (0.20 + 0.38)x 父母平均身高
下面我们来逐个解读上面模型里各个参数的含义:
首先,截距
β
0
和父母平均身高的回归系数
β
1
意义与
单因素
的情况类似:父母身高平均值等于 0 时女孩身高的平均值是 88.06;父母平均身高每增加一个单位,女孩身高也增加 0.2 个单位。 这里我们也可以看到,虽然模型在计算时包含了男孩和女孩的身高数据,回归系数
β
0
以及
β
1
的意义只和女孩的身高有关。
交互效应的
回归系数
β
3
= 0.38
指的是当
父母平均身高
增加一个单位时,男孩会比女孩
多增加
0.38 单位的身高。也就是上面将男孩和女孩数据分别进行线性回归得到对两条回归线的斜率之差。由于
β
3