"
$
$
均
值
多
重
比
较
#变量 1
理论与方法
使用 SPSS 软件进行因子分析
和聚类分析的方法
通灵珠宝( 中国) 有限公司 陈 治
一、方法原理
得分析的复杂性 增 加; 同 时 在 实 际 工 作 中, 指 标 间 经 常 具
备一定的相关性, 使 得 观 测 数 据 所 放 映 的 信 息 有 重 叠, 故
人们希望用 较 少 的 指 标 代 替 原 来 较 多 的 指 标, 但 依 然 能
1.因子分析( Factor Analysis)
放映原有的全部信息, 于是就产生了因子分析方法。
因 子 分 析 是 从 多 个 变 量 指 标 中 选 择 出 少 数 几 个 综 合
2.聚类分析( Cluster Anlysis)
变量指标的一种降维的多元统计方法。
聚 类 分 析 是 根 据 事 物 本 身 特 性 来 研 究 个 体 分 类 的 统
我们在多元分析中处理的是多指标的问题, 观察指标
计方法, 是按照物以类聚的原则来研究的事物分类。
的增加是为了使研 究 过 程 趋 于 完 整, 但 由 于 指 标 太 多, 使
3.市场细分方法的流程图
因子 1
因子 2
因子 3
因子 4
变量 2
变量 3
变量 n
因
子
分
析
类 1
类 2
类 3
聚
类
分
析
类型
因子 1
因子 2
因子 3
因子 4
类 1
类 2
类 3
A
B
B
C
B
B
A
B
C
A
C
A
注: 表中大写字母表示各类对于 4 个因子的重视程度
6
■
2006
市场研究
■
45
理 论 与 方 法
二、实证分析
总人口
生产总值
消费总额
人均年工资
年度总储蓄
年度财政
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
启东市
江都市
丹阳市
如皋市
兴化市
东台市
如东县
沭阳县
邳州市
海安县
沛 县
姜堰市
射阳县
阜宁县
大丰市
宝应县
建湖县
东海县
高邮市
赣榆县
丰 县
滨海县
盐都县
仪征市
泗 洪
新沂市
涟水县
灌云县
扬中市
盱眙县
溧水县
灌 南
响水县
金湖县
洪泽县
( 亿)
114.38
106.69
80.25
143.87
154.99
116.24
109.36
174.54
158.04
96.54
119.50
90.70
104.70
105.00
73.37
91.99
79.12
114.35
83.06
107.91
109.00
108.00
85.00
59.35
103.00
95.60
103.00
107.23
27.24
73.22
40.23
72.71
57.00
36.04
39.00
( 亿)
( 亿)
( 千)
额/万亿
总收入/亿
153.63
139.29
174.75
98.76
103.29
135.08
102.57
87.05
92.63
93.54
88.60
86.33
98.15
73.50
90.60
67.86
81.22
58.28
70.51
61.78
54.20
56.70
90.60
72.40
58.90
54.20
52.60
40.02
80.11
58.85
61.26
29.47
29.47
31.45
25.30
50.27
43.36
46.01
37.36
26.00
36.02
36.80
21.35
23.79
26.44
18.53
31.51
25.50
19.70
24.25
20.35
23.26
18.24
20.95
19.29
16.80
14.60
22.00
29.00
12.30
17.80
14.70
14.51
19.18
13.99
19.71
9.86
8.97
10.40
11.10
10.88
10.64
13.50
11.29
10.37
10.60
11.62
9.15
8.66
11.55
8.84
10.95
9.60
9.25
9.88
9.75
9.51
8.24
10.20
9.58
8.25
9.39
9.78
14.56
7.92
8.31
8.03
7.95
13.12
10.00
13.97
7.95
8.94
9.85
10.25
124.55
119.42
95.81
93.18
78.61
85.39
83.68
28.40
40.24
101.76
53.51
76.40
46.48
40.81
53.33
47.38
46.21
28.04
51.59
27.47
28.85
27.19
12.75
52.35
22.06
26.15
19.41
19.85
51.22
16.47
22.23
11.58
15.36
17.56
14.30
10.02
11.19
16.62
9.04
7.55
8.20
8.87
3.81
5.70
8.51
5.06
8.62
5.90
3.85
6.31
4.83
5.82
3.08
5.56
3.02
2.53
3.00
5.01
11.25
3.36
3.33
2.51
1.97
8.31
3.08
6.77
2.06
2.04
2.73
2.24
已调查 35 个城市的总人口、生产总值、消费总额、人均年工资、年度总储蓄额、年度财政总收入等数据, 试对上述城
市进行分类研究。
46
市场研究 2006
■
6■
理论与方法
1.因子分析:
"选用 Analyze→Data Reduction→Factor ……
"引入因子分析的 6 个变量( 总人口、生产总值、消费总额、人均年工资、年度总储蓄额、年度财政总收入)
"提取公因子的方法( Method) : 主成分分析法
"提取( Extract) 可选: 提取特征值大于 1 的因子
"旋转( Rotation) 的方法: 方差最大正交旋转
"因子得分( Factor Scores) : 作为新变量存入
表 1 方差解释表( Total Variance Explained)
因子
1
2
特征值
贡献率
累计贡献率
4.08
1.43
68%
24%
68%
92%
我 们 从 原 始 表 格 中 的 5 个 变 量 中 提 取
出 2 个 公 因 子, 用 这 2 个 公 因 子 就 可 以 解
释原始表格中 92%的信息量
根 据 原 始 表 格 中 的 5 个 变 量 与 新 生 的 2
个公因子之间的相关程度, 我们为这 2 个公
因子取名为消费因子和人口因子
表 2 旋转后的因子负荷矩阵( Rotated Component Matrix)
因子 1
因子 2
消费因子
人口因子
总人口
生产总值
消费总额
人均年工资
年度总储蓄额
年度财政总收入
※
0.944
0.973
0.630
0.934
0.945
0.914
※
※
※
※
※
2.聚类分析:
"选用 Analyze→Classify→K- Means Cluster ……
"引入聚类分析的 2 个变量( 即上面的 2 个公因子)
"聚类的数目( Number of Clusters) : 3 类
"聚类方法( Method) : 仅分类
"储存新变量( Save New Variables) : 聚类成员
表 3 各类数量分布表( Number of Cases in each Cluster)
类别
1
2
3
数量
12
16
7
3.均值多重比较:
"选用 Analyze→Compare Means→One- Way ANOVA ……
"将 2 个因子移入因变量, 3 个类移入“Factor”
"多重比较方法( Multiple Comparisons) : 邓肯法 Duncan
6
■
2006
市场研究
■
47
理 论 与 方 法
表 4 3 个类对于因子 1 的重视程度比较
Cluster Number of Case
Subset for alpha = 0.05
1
2
3
1
2
- 0.5466864
- 0.2118928
1.4215031
简化
"
表 5 3 个类对于因子 2 的重视程度比较
Cluster Number of Case
Subset for alpha = 0.05
1
2
3
1
2
- 0.7803180
- 0.4155008
0.7670201
简化
"
4.综合
类别
对于因子 1 的重视程度
1
B
B
1
2
3
2
A
注: A 表示最重视, B 表示一般
类别
对于因子 2 的重视程度
1
B
B
1
3
2
2
A
注: A 表示最重视, B 表示一般
第 1 类
第 2 类
第 3 类
折中型城市
人口型城市
消费型城市
消费因子
人口因子
B
B
B
A
A
B
注: A 表示最重视, B 表示一般
根 据 不 同 类 别 对 于 2 个 公 因 子 的
重 视 程 度 划 分 等 级, 我 们 将 被 调 查 城
市 划 分 为 3 类 并 分 别 为 其 命 名: 折 中
型 城 市 、人 口 ( 突 出 ) 型 城 市 、消 费 ( 突
出) 型城市。
折中型城市
人口型城市
消费型城市
大丰市
扬中市
如皋市
射阳县
泗洪
启东市
仪征市
宝应县
盱眙县
兴化市
阜宁县
新沂市
江都市
建湖县
溧水县
东台市
东海县
涟水县
丹阳市
高邮市
灌南
沭阳县
赣榆县
灌云县
如东县
"
盐都县
响水县
邳州市
丰县
金湖县
洪泽县
沛 县
滨海县
海安县
姜堰市
#
48
市场研究 2006
■
6■