IBM SPSS Advanced
Statistics 25
IBM
注释
在使用本资料及其支持的产品之前,请阅读第 93 页的『通知』中的信息。
产品信息
本版本适用于 IBM SPSS Statistics V25.0.0 及所有后续发行版和修订版,直到在新版本中另有声明为止。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
目录
高级统计 .
Advanced Statistics 简介 .
GLM 多变量分析 .
GLM 多变量:模型 .
GLM 多变量:对比 .
GLM 多变量:概要图 .
GLM 多变量:事后比较 .
GLM 估计边际平均值 .
GLM: 保存 .
GLM 多变量:选项 .
GLM 命令的附加功能 .
GLM 重复测量 .
GLM 重复测量定义因子 .
GLM 重复测量:模型 .
GLM 重复测量:对比 .
GLM 重复测量:概要图 .
GLM 重复测量:事后比较 .
GLM 估计边际平均值 .
GLM 重复测量:保存 .
GLM 重复测量:选项 .
GLM 命令的附加功能 .
方差成分分析 .
方差成分:模型 .
方差成分:选项 .
方差成分:保存到新文件 .
VARCOMP 命令的附加功能 .
线性混合模型 .
线性混合模型:选择主体/重复变量 .
线性混合模型:固定效应 .
线性混合模型:随机效果 .
线性混合模型:估计 .
线性混合模型:统计 .
线性混合模型:EM 平均值 .
线性混合模型:保存 .
MIXED 命令的附加功能 .
广义线性模型(Z) .
广义线性模型响应 .
广义线性模型:预测变量 .
广义线性模型:模型 .
广义线性模型:估计 .
广义线性模型:统计 .
广义线性模型:EM 平均值 .
广义线性模型:保存 .
广义线性模型:导出 .
GENLIN 命令的附加功能.
广义估计方程 .
广义估计方程:模型类型 .
广义估计方程:响应 .
广义估计方程:预测变量 .
广义估计方程:模型 .
广义估计方程:估计 .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 1
. 1
. 1
. 2
. 3
. 4
. 5
. 5
. 6
. 6
. 7
. 7
. 9
. 10
. 11
. 11
. 12
. 13
. 13
. 14
. 14
. 14
. 15
. 16
. 17
. 17
. 17
. 18
. 19
. 21
. 21
. 22
. 22
. 23
. 23
. 23
. 25
. 26
. 27
. 27
. 28
. 29
. 30
. 30
. 31
. 31
. 33
. 35
. 35
. 36
. 36
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
广义估计方程:统计 .
广义估计方程:EM 平均值 .
广义估计方程:保存 .
广义估计方程:导出 .
GENLIN 命令的附加功能.
广义线性混合模型 .
获取广义线性混合模型 .
目标 .
固定效应 .
随机效应 .
权重和偏移量 .
常规构建选项 .
估计 .
估计均值 .
保存 .
模型视图 .
模型选择对数线性分析 .
对数线性分析:定义范围 .
对数线性分析:模型 .
模型选择对数线性分析:选项 .
HILOGLINEAR 命令的附加功能 .
常规对数线性分析 .
一般对数线性分析模型 .
一般对数线性分析:选项 .
一般对数线性分析:保存 .
GENLOG 命令的附加功能 .
Logit 对数线性分析.
Logit 对数线性分析:模型 .
Logit 对数线性分析:选项 .
Logit 对数线性分析:保存 .
GENLOG 命令的附加功能 .
寿命表 .
寿命表:为状态变量定义事件 .
寿命表:定义范围 .
寿命表:选项 .
SURVIVAL 命令的附加功能 .
Kaplan-Meier 生存分析 .
Kaplan-Meier:为状态变量定义事件 .
Kaplan-Meier:比较因子级别 .
Kaplan-Meier:保存新变量 .
Kaplan-Meier:选项 .
KM 命令的附加功能 .
Cox 回归分析 .
Cox 回归:定义分类变量 .
Cox 回归:图 .
Cox 回归:保存新变量 .
Cox 回归:选项 .
Cox 回归:为状态变量定义事件 .
COXREG 命令的附加功能 .
计算依时协变量 .
计算依时协变量 .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 38
. 38
. 39
. 40
. 40
. 41
. 42
. 42
. 44
. 45
. 46
. 46
. 47
. 47
. 48
. 49
. 52
. 52
. 53
. 53
. 53
. 54
. 55
. 55
. 56
. 56
. 56
. 57
. 58
. 58
. 59
. 59
. 60
. 60
. 60
. 60
. 61
. 61
. 61
. 62
. 62
. 62
. 63
. 63
. 64
. 64
. 65
. 65
. 65
. 65
. 66
iii
.
.
.
.
.
.
.
贝叶斯单一样本推论:泊松 .
贝叶斯相关样本推论:正态 .
贝叶斯独立样本推论 .
关于 Pearson 相关性的贝叶斯推论.
关于线性回归模型的贝叶斯推论 .
贝叶斯单向 ANOVA .
贝叶斯对数线性回归模型 .
通知 .
商标 .
索引 .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 76
. 77
. 78
. 81
. 82
. 86
. 88
. 93
. 94
. 97
.
.
.
.
.
.
.
.
.
Helmert
.
分类变量编码方案 .
偏差 .
简单(S) .
差值 .
多项式 .
重复 .
特殊 .
指示灯 .
协方差结构 .
贝叶斯统计信息 .
贝叶斯单一样本推论:正态 .
贝叶斯单一样本推论:二项式 .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 66
. 66
. 67
. 67
. 67
. 68
. 68
. 68
. 69
. 69
. 72
. 72
. 75
iv IBM SPSS Advanced Statistics 25
v
v
v
v
v
v
高级统计
SPSS® Statistics Standard Edition 或"高级统计"选项中包含以下高级统计功能。
Advanced Statistics 简介
与 SPSS Statistics Standard Edition 或"高级统计"选项中提供的建模选项相比,"高级统计"提供的过程提供了
更高级的建模选项。
"GLM 多变量"对"GLM 单变量"提供的一般线性模型进行了扩展,以允许使用多个因变量。更进一步的扩展
"GLM 重复测量"允许重复测量多个因变量。
v
"方差成分分析"是将因变量的可变性分解为固定和随机成分的特定工具。
"线性混合模型"对一般线性模型进行了扩展,因此允许数据表现出相关的和不恒定的可变性。因此,线性混
合模型提供了不仅能够就数据的平均值还能够就其方差和协方差建模的灵活性。
"广义线性模型"(GZLM) 放宽了误差项的正态假设,仅要求因变量通过转换或关联函数与预测变量线性相关。
"广义估计方程"(GEE) 对 GZLM 进行了扩展,以允许重复测量。
"一般对数线性分析"允许您为交叉分类计数数据拟合模型,"模型选择对数线性分析"可帮助您在模型间选
择。
"Logit 对数线性分析"允许您拟合对数线性模型来分析分类因变量与一个或多个分类预测变量之间的关系。
"生存"分析通过"寿命表"提供,用于检查时间事件变量的分布,可能按因子变量水平分析;"Kaplan-Meier"
生存分析用于检查时间事件变量的分布,可能按因子变量水平分析,或按分层变量水平产生单独的分析;
"Cox 回归"用于根据给定协变量的值对指定事件的时间建模。
v 贝叶斯统计分析通过根据观察到的数据和有关参数的先验信息生成未知参数的后验分布来进行推论。 IBM®
SPSS Statistics 中的贝叶斯统计侧重于对单一样本分析平均值的推论,包括贝叶斯因子单一样本(配对的双
样本)、t 检验和贝叶斯推论(通过描述后验分布的特征)。
GLM 多变量分析
"GLM 多变量"过程通过一个或多个因子变量或协变量为多个因变量提供回归分析和方差分析。因子变量将总体
划分成组。通过使用此一般线性模型过程,您可以检验关于因子变量对因变量联合分布的各个分组的平均值的
效应的原假设。可以调查因子之间的交互以及单个因子的效应。另外,还可以包含协变量的效应以及协变量与
因子的交互。对于回归分析,自变量(预测变量)指定为协变量。
平衡与非平衡模型均可进行检验。如果模型中的每个单元格包含相同的个案数,则设计是平衡的。在多变量模
型中,模型中的效应引起的平方和以及误差平方和以矩阵形式表示,而不是以单变量分析中的标量形式表示。
这些矩阵称为 SSCP(平方和与叉积)矩阵。如果指定了多个因变量,则提供使用 Pillai 的轨迹、Wilks 的
lambda、Hotelling 的轨迹、Roy 的最大根条件以及近似 F 统计的多变量方差分析,同时还提供每个因变量
的单变量方差分析。除了检验假设,"GLM 多变量"过程还生成参数估计。
常用的先验对比可用于执行假设检验。另外,在整体的 F 检验已显示显著性之后,可以使用事后检验评估指定
平均值之间的差值。估计边际平均值为模型中的单元格提供了预测平均值估计值,且这些平均值的概要图(交
互图)允许您轻松对其中一些关系进行可视化。单独为每个因变量执行两两多重比较检验。
© Copyright IBM Corporation 1989, 2017
1
残差、预测值、Cook 距离以及杠杆值可以另存为数据文件中检查假设的新变量。另外还提供残差 SSCP 矩阵
(残差的平方和与叉积的方矩阵)、残差协方差矩阵(残差 SSCP 矩阵除以残差的自由度)和残差相关性矩阵
(残差协方差矩阵的标准化形式)。
WLS 权重允许您指定一个变量,用来针对加权最小平方 (WLS) 分析为观察值赋予不同权重,这样也许可以补
偿测量的不同精确度。
示例。某塑料制造商要测量塑料膜的三种属性:耐撕裂性、光泽和不透明度。厂商使用两种挤出速度和添加剂
量进行了尝试,并对挤出速度和添加剂量的各种组合度量了这三种属性。厂商发现挤出速度和添加剂量单独产
生的结果很明显,但这两种因子的交互作用并不明显。
方法。类型 I、类型 II、类型 III 和类型 IV 的平方和可用来评估不同的假设。类型 III 是缺省值。
统计。 两两范围检验和多重比较:最小显著性差异、Bonferroni、Sidak、Scheffé、Ryan-Einot-Gabriel-
Welsch 多重 F、Ryan-Einot-Gabriel-Welsch 多范围、Student-Newman-Keuls、Tukey’s 真实显著性差异、
Tukey’s b、Duncan、Hochberg’s GT2、Gabriel、Waller Duncan t 检验、Dunnett(单侧和双侧)、Tamhane’s
T2、Dunnett’s T3、Games-Howell 和 Dunnett’s C。描述统计:所有单元格中所有因变量的观察平均值、标
准差和计数;Levene 的方差同质性检验;对因变量协方差矩阵的同质性 Box 的 M 检验以及 Bartlett 的球形
度检验。
图。 分布-水平图、残差图以及概要图(交互)。
GLM 多变量数据注意事项
数据。因变量应是定量的。因子应是分类因子,可以具有数字值或字符串值。协变量是与因变量相关的定量变
量。
假设。对于因变量,数据是来自多变量正态总体的随机向量样本;在总体中,所有单元格的方差-协方差矩阵
均相同。尽管数据应对称,但方差分析对于偏离正态性是稳健的。要检查假设,您可以使用方差同质性检验
(包括 Box 的 M 检验)和分布-水平图。您还可以检查残差和残差图。
相关过程。在进行方差分析之前使用"探索"过程来检查数据。对于单个因变量,请使用"GLM 单变量"。如果您
针对每个主体的多种情况度量相同的因变量,请使用"GLM 重复测量"。
获取 GLM 多变量表
1. 从菜单中选择:
2. 请选择至少两个因变量。
或者,您也可以指定"固定因子"、"协变量"和"WLS 权重"。
GLM 多变量:模型
指定模型。全因子模型包含所有因子主效应、所有协变量主效应以及所有因子间交互。它不包含协变量交互。
选择定制可以仅指定其中一部分的交互或指定因子协变量交互。必须指定要包含在模型中的所有项。
因子与协变量。列出因子与协变量。
模型。模型取决于数据的性质。选择定制之后,您可以选择分析中感兴趣的主效应和交互效应。
平方和。计算平方和的方法。对于没有缺失单元格的平衡或非平衡模型,类型 III 平方和法最常用。
分析 > 一般线性模型 > 多变量...
2 IBM SPSS Advanced Statistics 25
项。
在模型中包含截距。 模型中通常包含截距。如果您可以假设数据穿过原点,则可以排除截距。
构建项和定制项
建立项:当您想要为一组选定因子和协变量的所有组合包含特定类型(例如主效应)的非嵌套项时,使用该选
构建定制项如果要包含嵌套项,或者想要按变量显式构建任何项,请使用该选项。构建嵌套项包括以下步骤:
平方和
对于该模型,您可以选择平方和类型。类型 III 最常用,并且是缺省类型。
类型 I。此方法也称为平方和分层解构法。在模型中,每一项只针对它前面的那项进行调整。类型 I 平方和常
用于:
v 平衡 ANOVA 模型,其中任何主效应在任何一阶交互效应之前指定,任何一阶交互效应在任何双向交互效
应之前指定,依此类推。
v 多项式回归模型,其中任何低阶项在任何高阶项之前指定。
v 纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应嵌套在第三个指定的
效应中,依此类推。(此嵌套形式只能通过使用语法来指定。)
类型 II。 此方法在为所有其它"相应的"效应进行调节的模型中计算某个效应的平方和。相应的效应是指,与所
有效应(不包含正被检查的效应)相对应的效应。类型 II 平方和法常用于:
v 平衡 ANOVA 模型。
v 任何只有主要因子效应的模型。
v 任何回归模型。
v 纯嵌套设计。(此嵌套形式能通过使用语法来指定。)
类型 III。 缺省类型。此方法在设计中通过以下形式计算某个效应的平方和:据任何不包含该效应的其他效应,
以及与包含该效应的任何效应的正交(如果存在)进行调整的平方和。类型 III 平方和具有一个主要优点,那
就是只要可估计性的一般形式保持不变,平方和对于单元格频率就保持不变。因此,我们常认为此类平方和对
于不带缺失单元格的不平衡模型有用。在不带缺失单元格的因子设计中,此方法等同于 Yates 加权均方方法。
类型 III 平方和法常用于:
v 任何在类型 I 和类型 II 中列出的模型。
v 任何不带空白单元格的平衡或非平衡模型。
类型 IV。 此方法针对存在缺失单元格的情况设计。对于设计中的任何效应 F,如果任何其它效应中不包含 F,
则类型 IV = 类型 III = 类型 II。当 F 包含在其它效应中时,则类型 IV 将 F 中的参数中正在进行的对比相
等地分配到所有较高水平的效应。类型 IV 平方和法常用于:
v 任何在类型 I 和类型 II 中列出的模型。
v 任何带有空白单元格的平衡或非平衡模型。
GLM 多变量:对比
"对比"用于检验效应水平之间是否存在显著性差异。您可以为模型中的每个因子指定一个对比。对比代表参数
的线性组合。
高级统计 3
假设检验基于原假设 LBM = 0,其中 L 是对比系数矩阵,M 是恒等矩阵,该矩阵的维数等于因变量的个数,
B 是参数向量。当指定对比之后,创建一个 L 矩阵,使得与因子对应的列与对比匹配。对剩余的列进行调整,
使 L 矩阵可以估计。
除了使用 F 统计的单变量检验和基于跨所有因变量的对比差分的 Student 的 t 分布的 Bonferroni 型同时置
信区间以外,还提供使用 Pillai 的轨迹、Wilks 的 lambda、Hotelling 的轨迹以及 Roy 的最大根条件的多变
量检验。
可用对比有偏移对比、简单对比、差分对比、Helmert 对比、重复对比和多项式对比。对于偏移对比和简单对
比,您可以选择参考类别是最后一个类别还是第一个类别。
对比类型
偏差。 将每个水平(参考类别除外)的平均值与所有水平的平均值(总平均值)进行比较。因子的水平可以为
任何顺序。
简单。 将每个水平的平均值与指定水平的平均值进行比较。当存在控制组时,此类对比很有用。可以选择第一
个或最后一个类别作为参考类别。
差分。 将每个水平的平均值(第一个水平除外)与前面水平的平均值进行比较。(有时候称为逆 Helmert 对
比。)
Helmert。 将因子的每个水平的平均值(最后一个水平除外)与后面水平的平均值进行比较。
重复。 将每个水平的平均值(最后一个水平除外)与后一个水平的平均值进行比较。
多项式。 比较线性效应、二次效应、三次效应等等。第一自由度包含跨所有类别的线性效应;第二自由度包含
二次效应,依此类推。这些对比常常用来估计多项式趋势。
GLM 多变量:概要图
概要图(交互图)对于比较模型中的边际平均值是有用的。概要图是一个线图,其中每个点表示因子的一个水
平上的估计因变量边际平均值(已针对任何协变量进行调整)。第二个因子的水平可用来绘制分离线。第三个
因子中的每个水平可用来创建分离图。所有因子都可用于图。为每个因变量创建概要图。
单因子的概要图显示估计边际平均值是沿水平增加还是减小。对于两个或更多因子,平行线表示因子之间没有
交互,这意味着您只能调查一个因子的水平。不平行的线则表示交互。
图 1. 不平行图(左)和平行图(右)
在通过为水平轴选择因子,以及通过为分离线和分离图选择因子(后者可选)指定了图之后,该图必须添加到
"图"列表中。
4 IBM SPSS Advanced Statistics 25