【例 5.1】一位英语教师想检查 3 种不同教学方法的效果,为此随机选取 24 位学生并把他们分成 3 组,
相应用三种方法教学.一段时间后这位教师对这 24 位学生进行统考,统考成绩如表 5.1.试问在 0.05 显著性
水平下,这三种教学方法有无显著性差异?
方法
1A
2A
3A
73
88
68
66
78
79
89
91
71
表 5.1 英语成绩表
学 习 成 绩
82
76
71
43
85
87
80
84
68
63
80
59
96
76
80
表 5.1 中 1
2
3
A A A 是这位英语教师采用的不同教学方法,各有其侧重点.我们的目的是判断不同教学方
,
,
法对英语学习成绩是否有显著影响.若有影响,哪一种教学方法好?
对于例 5.1,所谓方差分析即检验如下假设: 0
:H
3
,其中 i
1
2
i
1,2,3
是第i 个变量的均值.
按照上述步骤,具体的检验过程可由如下 MATLAB 指令集完成.
MATLAB 数据处理⑴
clear
y=[73,66,89,82,43,80,63,88,78,91,76,85,94,80,96,68,79,71,71,87,68,59,76,80];
r=3;
m1=7;m2=8;m3=9;%各总体的样本容量
n=m1+m2+m3;
alpha =0.05;
y1_=sum(y(1:m1));%第一种教学方法下学生的成绩之和
y2_=sum(y((m1+1):(m1+m2)));%第二种教学方法下学生的成绩之和
y3_=sum(y((m1+m2+1):n));%第三种教学方法下学生的成绩之和
y_=sum(y);%各学生成绩之和
yy=sum(y.^2);%各学生成绩平方之和
g=y1_^2/m1+y2_^2/m2+y3_^2/m3;
SST=yy-y_^2/n;%总的偏差平方和
SSA=g-y_^2/n;%因子的偏差平方和
SSE=SST-SSA;%误差平方和
g1=SSA/(r-1);%偏差均方和
g2=SSE/(n-r);%误差均方和
FEST=g1/g2;%由样本计算出的 F 值
FLJ=finv(1-alpha,r-1,n-r);%应用 MATLAB 统计工具箱中 finv 函数求得临界值
p=1-fcdf(FEST,r-1,n-r);
if FEST>FLJ
h=1;
else
h=0;
end
alpha,h,p,FEST,FLJ
alpha =
h =
p =
FEST =
FLJ =
0.0500
1
0.0211
4.6638
3.4668
计算结果表明,在 0.05 显著性水平下,h=1、p
MU3 =
55.1111
a =
b =
c =
62.5592
79.1551
78.2380
93.7620
47.7930
62.4292
计算结果表明,三种教学方法下学生的平均英语成绩分别为 70.8571、86、55.1111;95%的置信区间分
别为[62.5592,79.1551] 、[78.2380,93.7620]、[47.7930,62.4292].
【例 5.3】某钢厂检查一月上旬的五天中生产的钢锭质量,结果如下(单位:kg)
日 期
1
2
4
9
10
5500
5440
5400
5640
5610
质 量
5800
5680
5410
5700
5700
5740
5240
5430
5660
5610
试检验不同日期生产的钢锭有无显著差异
0.05
?
5710
5600
5400
5700
5400
分析 我们把不同日期生产的钢锭质量分别看作一个变量.检验它们的平均质量是否
有明显差异相当于要比较五个变量的均值是否一致.假定:⑴五个变量均服从正态分布;⑵每一变量的方差
相同;⑶从五个变量抽取的样本相互独立.采用方差分析法来检验不同日期生产的钢锭质量是否有明显差异.
设第i 个变量的均值为 i,假设不同日期生产的钢锭平均质量无显著差异.那么就要检验如下假设:
:H
5
3
4
0
1
2
.
具体见以下解题过程.
MATLAB 数据处理
clear
A1=[5500,5800,5740,5710]';
A2=[5440,5680,5240,5600]';
A3=[5400,5410,5430,5400]';
A4=[5640,5700,5660,5700]';
A5=[5610,5700,5610,5400]';
X=[A1,A2,A3,A4,A5];
[p,anovatab,stats]=anova1(X,[],'on')
p =
0.0220
anovatab =
'Source'
'Columns'
'Error'
'Total'
'SS'
[227680]
[216175]
[443855]
'df'
[ 4]
[15]
[19]
'MS'
[
56920]
[1.4412e+004]
[]
'F'
[3.9496]
[]
[]
'Prob>F'
[0.0220]
[]
[]
stats =
gnames: [5x1 char]
n: [4 4 4 4 4]
source: 'anova1'
means: [5.6875e+003 5490 5410 5675 5580]
df: 15
s: 120.0486
5800
5700
5600
s
e
u
a
V
l
5500
5400
5300
1
2
3
Column Number
4
5
图 5.1 五天生产钢锭质量的 box 图
结果表明:⑴返回值 p=0.0220<0.05,认为不同日期生产的钢锭平均质量有显著差异.⑵方差分析表
(anovatab)中有 6 列,第 1 列声明 X 中可变化性的来源;第 2 列显示平方和;第 3 列显示与每一种可变性
有关的自由度;第 4 列显示第 2 列数据与第 3 列数据的比值;第 5 列显示 F 统计量数值,是第 4 列数据的比
值;第 6 列检验的最小显著性概率,即第一输出参数值.(3)stats 返回的附加统计数据结构中 means 一行给
出了各日生产的钢锭平均质量的点估计.(4)从方差分析 Box 图容易看出不同日期生产的钢锭平均质量之间的
直观差异.
【例 5.4】用多重比较的方法确定例 5.1 中哪些水平之间的差异是显著的,同时确定使学生的平均英语
成绩最高的那种教学方法.
分析 例 5.1 中,我们已经得出三种教学方法有显著性差异,即教学方法这一因子对学生的英语成绩是
有显著影响的.进一步分析到底哪两种教学方法对学生的成绩影响差异显著,就需要对三个变量进行多重比
较了.多重比较的方法很多,按照上面介绍的 LSD 方法,利用 MATLAB 计算如下.
MATLAB 数据处理(3)
clear
alpha =0.05;
m1=7;m2=8;m3=9;
n=m1+m2+m3;
r=3;
t=tinv(1-alpha/2,n-r);
SSE =2.3404e+003;%引用 MATLAB 数据处理(1)中结果
LSD12=t*sqrt(SSE/(n-r))*sqrt(1/m1+1/m2);
LSD13=t*sqrt(SSE/(n-r))*sqrt(1/m1+1/m3);
LSD23=t*sqrt(SSE/(n-r))*sqrt(1/m2+1/m3);
MU1 =70.8571;%引用 MATLAB 数据处理(2)中结果,下同
MU2 =86;
MU3 =55.1111;
if abs(MU1-MU2)>=LSD12
h(1)=1;
else
h(1)=0;
end
if abs(MU1-MU3)>=LSD13
h(2)=1;
else
h(2)=0;
end
if abs(MU2-MU3)>=LSD23
h(3)=1;
else
h(3)=0;
end
h %结果依次显示第 1 和 2,1 和 3,2 和 3 种方法下学生平均成绩差异的显著性
h =
1
1
1
计算结果表明:三种教学方法对学生英语平均成绩的影响有显著差异;第二种教学方法使学生的英语平
均成绩最高.
【例 5.5】对例 5.1 中三种教学方法下学生的英语成绩这三个变量作方差齐性检验.
分析 假设
H
0 :
2
3
2
1
2
2
,即三个变量的方差相等.按照上述结论,分别求得例 5.1 中检验统计量 B
的值和本题的拒绝域,经过比较得出结论.
MATLAB 数据处理(4)
clear
y=[73,66,89,82,43,80,63,88,78,91,76,85,94,80,96,68,79,71,71,87,68,59, 76,80];
alpha =0.05;
m1=7;m2=8;m3=9;
r=3;
SSE=2.3404e+003;%引用 MATLAB 数据处理(1)中结果
n=m1+m2+m3;
fE=n-r;
c=(1/(m1-1)+1/(m2-1)+1/(m3-1)-1/fE)/(3*(r-1))+1;
s1=var(y(1:m1));s2=var(y((m1+1):(m1+m2)));s3=var(y((n-m3+1):n));
chi2EST=(fE*log(SSE/fE)-(m1-1)*log(s1)-(m2-1)*log(s2)-(m3-1)*log(s3))/c;
LJZ=chi2inv(1-alpha,r-1);
p=1-chi2cdf(chi2EST,r-1);
if chi2EST>LJZ
h=1;
else
h=0;
end
alpha,h,p,chi2EST,LJZ
alpha =
0.0500
h =
p =
0
0.1330
chi2EST =
4.0348
LJZ =
5.9915
计算结果表明,在 0.05 显著性水平下,h=0、p>alpha 不能拒绝原假设,即认为三种教学方法下学生的
英语成绩这三个变量方差相等.