多元线性回归模型
返回
当影响因变量 Y 的自变量不止一个时,比如有 m 个 ,…,
,这时 Y
和 X 之间的线性回归方程为
(2.12)
其中
为回归系数,ε为随机误差,常假定
。
设
为观测值,回归分析的首要任务是利用它
们来估计
和σ,它们的最小二乘估计记作
求估计值
需要解下面的线性方程组
其中
(2.13)
当
求得后,计算
回归方程(2.12)建立后,检验其是否可信可用方差分析,这时公式(2.8)依
然有效,但
(2.14)
方差分析表(参看表 10)将成为表 12 之形式,其中
(2.15)
表 12 方差分析表
方差来源 平方和自由度
均方
F 显著性
回归
残差
总和
m
n-m-1
n-1
它将与 F 的临界值
来比较,其比较的结果和结论请参见上节
的讨论,反映回归精度的σ的估计公式为
(2.16)
类似于一元回归相产系数 r,可以定义适用于多元回归的全关系数 R,R
定义)为 和 的相关系数,或 定义为
(2.17)
例 4 试用线性回归模型(2.10)来拟合表 9 的试验数据。
解:这时 n=7,7 组观察值为
(0.330,1.0,13,1.5),(0.336,1.4,19,3.0),… (0.482,3.4,28,3.5),它们的
均值和 为
由于
,故它们不必全部列出,将它们代入到方程级(2.13)中可以解得
从而
a=0.3683-0.037×2.2+0.00343 ×19-0.077×2.0
=0.201
(2.18)
σ的估计为
.于是回归方程为
进一步对它作方差分析,其方差分析表列于表 13.
表 13 方差分析表
方差来源 自由度 平方和 均方 F
回归
误差
总和
3
3
6
0.048770
0.016257 3.29
0.014838
0.004946
0.063608
当 α=0.05 时 F 表的临界值
,回
归方程(2.18)不可信.这时,是否 Y 和三个因素之间不可能建立回归关系呢?不
是的,我们还应作进一步探讨,在下节我们将继续讨论该例。