logo资料库

《统计学习导论——基于R应用》Chapter3+4课后实验答案.pdf

第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
资料共45页,剩余部分请下载后查看
Contents Chapter 3 ........................................................................................................................................... 1 Question 8 ................................................................................................................................. 1 Question 9 ................................................................................................................................. 4 Question 13 ............................................................................................................................. 13 Question 14 ............................................................................................................................. 18 Chapter 4 ......................................................................................................................................... 25 Question 10 ............................................................................................................................. 25 Question11 .............................................................................................................................. 32 附录-R 代码: ................................................................................................................................ 34 ##Chapter3-8 ........................................................................................................................... 34 ##Chapter3-9 ........................................................................................................................... 35 ##Chapter3-13 ......................................................................................................................... 36 ##Chapter3-14 ......................................................................................................................... 37 ##Chapter4-10 ......................................................................................................................... 38 ##Chapter4-11 ......................................................................................................................... 42
Chapter 3 Question 8 (a) 表 8-1 R 软件回归结果 分析: 对模型 ,有: 1) 回归模型残差序列 中,最小值为-13.571,25%分位数为-3.2592,中位数为-0.3435, 75 分位数为 2.763,最大值为 16.924。残差标准误为 4.906,自由度为 390。 2) 回归模型的截距项为 39.9359,标准误为 0.7175,斜率项为-0.1578,标准误为 0.0064。 拟合优度 ,调整的拟合优度 ,说明模型拟合较好。可以得到如下 的回归模型: 3)回归系数 的显著性检验: 建立检验假设 R 软件回归结果显示, ,因此 在 0.1%的显著性 水平上显著。 1 01mpghorsepoweruiu20.6059R20.6049R22 39.9359-0.1578* (0.7175) (0.0064)0.6059 0.6049mpghorsepowerRRj01:0 :0 (0,1)jjHHj0116,2100.001pp01,
(i) 有关系。 原因: 对 的显著性检验如下: ,拒绝原假设, 在统计上显著。 因此 与 有关系,且 (ii) 说明模型拟合效果较好, 与 关系较强。 (iii) 负相关。 原因: (iv) 表 8-2 R 软件结果 因此, ,95%置信区间为 95%预测区间为 2 01mpghorsepoweru10111:0 :0HH11ˆ1ˆ24.49ˆ()tse162100.05p1horsepowermpg 39.9359-0.1578*mpghorsepower20.6059Rhorsepowermpg10.15784509824.46708horsepowermpg[23.97308,24.96108]14.8094,34.12476
(b) (c) 图 8-1 horsepower 与 mpg 关系图 图 8-2 线性回归拟合的诊断图 拟合中的问题:残差图中,残差呈现出明显的 U 形,说明数据存在非线性关系,原模型 不准确。 3
Question 9 (a) (b) 图 9-1 散点图矩阵 表 9-1 相关系数矩阵 4
(c) 表 9-2 多元线性回归结果 分析: 1) 回归模型残差序列 中,最小值为-9.5903,25%分位数为-2.1565,中位数为-0.1169, 75 分位数为 1.8690,最大值为 13.0604。残差标准误为 3.328,自由度为 384。 2) 可以得到如下的回归模型: 拟合优度 ,调整的拟合优度 ,说明模型拟合较好。 3) 回归系数 的显著性检验: 建立检验假设 R 软件的回归结果显示, 在 1%的显著性水平上显著, 不 5 01234567 mpgcylindersdisplacementhorsepowerweightaccelerationyearoriginuiu17.21840.4934*0.0199* (4.6443) (0.3233) (0.0075) 0.0170*0.0065*0.0806* (0.0138) mpgcylindersdisplacementhorsepowerweightacceleration22 (0.0007) (0.0988) 0.7508*1.4261* (0.0510) (0.2781)0.8215 0.8182yearoriginRR20.8215R20.8182Rj01:0 :0 (0,1,...,7)jjHHj02467,,,,135,,
显著。 (i) R 软件回归结果显示, , ,拒绝原假设,因此 至少有 一个不为零,即预测变量和响应变量之间有关系。 (ii) 建立检验假设 R 软件的回归结果显示, 在 1%的显著性水平上显著, 不显 著。因此,预测变量 与响应变量 在统计上具有显著 关系。 (iii) 系数大于零,说明预测变量 与响应变量 是正相关,且在其他条件不变的情况 下, 每增加 1 单位,对 的影响是增加 0.7508 单位。 (d) 图 9-2 线性回归拟合的诊断图 左上图残差呈现出 U 形,表明数据中存在非线性关系。 6 00171:0:(1,2...7)jHHj至少有一个不为零252.4F162.210pj01:0 :0 (0,1,...,7)jjHHj02467,,,,135,,,,,displacementweightyearoriginmpgyearmpgyearmpg
图 9-3 学生化残差图 学生化残差图显示,有学生化残差绝对值大于 3 的观测点,即为离群点。从残差图中可 看出离群点为第 323,326,327 个观测量。 图 9-4 杠杆图 杠杆图和线性回归拟合的诊断图显示出有异常高杠杆作用的点,为第 14 个观测量。 (e) 例如 模型 1: 表 9-3 模型 1 回归结果表 7 0123mpgcylindersdisplacementcylindersdisplacementu
分享到:
收藏