3.a. 解:薪水 S=f(x)=
=
.
x
10-
x
.
x
1
20
x
1
.
x
07.0
4
.
x
04.0
3
.
x
35
x
50
x
4
x
2
3
2
5
5
因为 x4 是 x1 和 x2 的互作变量,x5 是 x1 和 x3 的互作变量,
因此,上面的式子可以表示为:
f(x)=
50
20
x
1
07.0
x
2
35
x
3
04.0
.
xx
1
2
10-
.
xx
1
3
因此,男性的薪水可以表示为:
f(x3=0)=50+20x1+0.04x1.x2+0.07x2;
女性的薪水可以表示为:
f(x3=1)=85+10x1+0.04x1.x2+0.07x2。
可见男性 GPA 的斜率是女性的两倍。当 GPA 高于 3.5 时,
男性的收入就会比女性高。因此当 IQ 和 GPA 为固定值时,
说法 3 是正确的,即 IQ 和 GPA 固定时,如果 GPA 足够高,
高于 3.5,男性的收入就会比女性高。
b.解:代入上面的 f(x=1)=85+10x1+0.04x1.x2,女性的 IQ 为 110,
GPA 为 4.0 时,收入为 150300 dollars。
c.判断,由于 GPA/IQ 的互作系数非常小,因此它俩的互作效
应可以忽略不计,这种说法是对是错。
答:这种说法是错的。互作系数是根据样本估计出来的,所
以需要探究估计值与真实值之间的接近程度,即需要计算
GPA/IQ 的互作系数的标准误差,标准误差可用于计算 t 分布,
算出 P 值后,如果 P 值足够小,拒绝零假设,也就可以说明
GPQ 的互作系数不可忽略。所以判断 GPA/IQ 的互作效应是
否可以忽略不计,我们需要做参数检验。不能单凭其大小下
结论。另外,根据实验分层原则,如果模型中含有交互项,
那么即使主效应的系数的 P 值不显著,也应包含在模型中。
4. 这个题目考察的是第二章关于模型精度的评价问题。
a. 一般来讲,三次回归模型的光滑度高于一次回归,训练
RSS(训练均方误差)将降低,因为三次回归的拟合度更高。
因此三次回归 RSS 小于一次回归的。
b. 题目中讲 X 与 Y 满足线性关系,说明三次回归过拟合了,
因此三次回归的测试 RSS 大于一次回归的测试 RSS。
c. 情况和答案 a 一致。
d. 根据已知条件无法判断。