logo资料库

SPSS中如何检验数据是否服从正态分布(含举例).doc

第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
资料共3页,全文预览结束
如何检验数据是否服从正态分布 (转载) 一、图示法 1、P-P 图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵 坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点 应围绕第一象限的对角线分布。 2、Q-Q 图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐 标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈 一条围绕第一象限对角线的直线。 以上两种方法以 Q-Q 图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g1 表示偏度,g2 表示峰度,通过计算 g1 和 g2 及其标准误σg1 及σg2 然后作 U 检验。两种检验同时得出 U0.05 的结论时,才可以认为该组资 料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近 0……可 以认为……近似服从正态分布”并不严谨。 2、非参数检验方法 非参数检验方法包括 Kolmogorov-Smirnov 检验(D 检验)和 Shapiro- Wilk (W 检验)。 SAS 中规定:当样本含量 n ≤2000 时,结果以 Shapiro – Wilk(W 检验)为准, 当样本含量 n >2000 时,结果以 Kolmogorov – Smirnov(D 检验)为准。 SPSS 中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位 于 3 和 50 之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在加权 样本大小位于 3 和 5000 之间时,计算该统计量。由此可见,部分 SPSS 教材里 面关于“Shapiro – Wilk 适用于样本量 3-50 之间的数据”的说法是在是理解片 面,误人子弟。(2)单样本 Kolmogorov-Smirnov 检验可用于检验变量(例如 income)是否为正态分布。 对于此两种检验,如果 P 值大于 0.05,表明资料服从正态分布。 三、SPSS 操作示例
SPSS 中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的 操作: 1、工具栏--分析—描述性统计—探索性 2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图 和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项(Both)。 3、Output 结果 (1)Descriptives:描述中有峰度系数(Ku)和偏度系数(Sk),根据上述判断 标准,数据不符合正态分布。 Sk=0,Ku=0 时,分布呈正态,Sk>0 时,分布呈正偏态,Sk<0 时,分布呈负 偏态,时,Ku>0 曲线比较陡峭,Ku<0 时曲线比较平坦。由此可判断本数据分布 为正偏态(朝左偏),较陡峭。
(2)Tests of Normality:D 检验和 W 检验均显示数据不服从正态分布,当 然在此,数据样本量为 1000,应以 W 检验为准。 (3)直方图 直方图验证了上述检验结果。 (4)此外还有茎叶图、P-P 图、Q-Q 图、箱式图等输出结果,不再赘述。结果同样验证数 据不符合正态分布。
分享到:
收藏