多 元 统 计 分 析 课 程 设 计
——Fisher 判别法在城镇居民家庭可支配分析中的应用
宁坤 统计学 08 级 01 班
信息科学与工程学院
2011 年 6 月 15 日
目录
摘要.............................................................................................1
一、问题及背景
1.1 背景.................................................................................. 2
1.2 问题.................................................................................. 2
1.3 数据来源...........................................................................2
二、详细分析过程
2.1 数据录入...........................................................................3
2.2 进行 Fisher 判别分析 ........................................................ 3
2.3 得到分析结果....................................................................6
三、 应用 Fisher 判别方程对未分组省份进行分组及分析
.................................................................................................... 7
多元统计分析课程设计
摘要
城镇居民家庭可支配收入是指家庭成员得到的最终消费支出和其他非义务
性支出以及储蓄的总和,即居民家庭可以用来自由支配的收入。它是家庭
总收入扣除缴纳的所得税、个人缴纳的社会保障支出以及记账补贴后的收
入,它主要由以下几部分组成:工薪收入、经营净收入、财产性收入和转
移性收入。
本文利用 Fisher 判别法,将沿海 11 省市作为先验组得到 Fisher 判别函数
D
(其中 1X 2X 3X
然后将剩余未分组省市代入判别函数,与先验组的临界值比较进行分
组。分组结果显示高收入组(北京、上海、天津、广东、浙江)都在
沿海省市,内陆省市则都属于次高收入组,这与我国东部沿海地区省
市的城镇居民家庭收入较中西部高的国情吻合。
1
5X 分别代表城镇居民家庭总收入、工资性收入、经营性收入、财产性收入、转移性收入)
4X
1.322*
2.94*X 1.892*X 0.943*
1.112*
X
X
3
2
X
4
5
- 1 -
多元统计分析课程设计
一、问题及背景
1.1 背景
城镇居民家庭可支配收入是指家庭成员得到的最终消费支出和其他非
义务性支出以及储蓄的总和,即居民家庭可以用来自由支配的收入。
它是家庭总收入扣除缴纳的所得税、个人缴纳的社会保障支出以及记
账补贴后的收入,它主要由以下几部分组成:工薪收入、经营净收入、
财产性收入和转移性收入。我国东部沿海地区省市的城镇居民家庭收
入较中西部高,但是各省市之间也存在差距。
1.2 问题
根据我国东部沿海 11 个省市城镇居民家庭平均每人全年家庭收入的 5
个指标(工薪收入、经营净收入、财产性收入和转移性收入)数据将
各省市城镇居民家庭分为高收入组和次高收入组,建立判别函数进而
判定未分组省市的类别。
1.3 数据来源
《2010 年中国统计年鉴》
- 2 -
二、详细分析过程
多元统计分析课程设计
本文主要利用 spss 软件进行数据分析
2.1 数据录入
通过国家统计局网站得到我国东部沿海 11 省市的城镇居民家庭平均每
人全年家庭收入的 5 个指标(工薪收入、经营净收入、财产性收入和
转移性收入)数据得到 excel 表格,并将 11 个省份划分为高收入组(代
号为 1)和次高收入组(代号为 2),分类如图 2-1 组别,将其导入 spss
得到如图 2-1 所示:
2.2 进行 Fisher 判别分析
图 2-1
在 SPSS 中进行如下操作:
步骤一 在 analyze 菜单中的 classify 子菜单中选择 discriminant 命令如
2-2 图所示。
- 3 -
多元统计分析课程设计
图 2-2
步骤二 在如图 2-3 所示的 discriminant analyze 对话框中,从左侧变量
的变量列表中选择“工薪收入”、“经营净收入”、“财产性收入”和“转
移性收入”变量,使之添加到 independents 框中
图 2-3
- 4 -
多元统计分析课程设计
步骤三 选择“组别”变量使之添加到 group ariable 框中。这时 group
ariable 框下的 define range 按钮变为可用,单击,弹出 discriminant
analyze:difine 对话框如图 2-4 所示,并在 minium 中输入 1,在 maximum
中输入 2.
步骤四 在 discriminant analyze 对话框中单击 statistics 按钮,弹出
discriminant analyze:statistics 对话框,如图 2-5 所示。
图 2-4
步骤五 在 discriminant analyze 对话框中单击 classify 按钮弹出
discriminant analyze:classification 对话框,如图 2-6 所示
图 2-5
步骤六 单击图 2-3 所示的 discriminant analysis 对话框中的 ok 键,完
成操作。
图 2-6
- 5 -
2.3 得到分析结果
多元统计分析课程设计
得到分析结果如下:
如表 2-1 所示可知只有一个判别函数:
D1=2.94*城镇居民家庭总收入-1.892*工资
性收入+0.943*经营性收入-1.322*财产性收
入-1.112*转移性收入
由分析结果表 2-2 可知高收入组的
Fisher 线性判别函数为:
F1=0.025*城镇居民家庭总收入-0.018*
工资性收入+0.014*经营性收入-0.064*
财 产 性 收 入 -0.009* 转 移 性 收 入
-105.381
次 高 收 入 组 的 Fisher 判 别 函 数 为 :
F2=0.021*城镇居民家庭总收入-0.015*
工资性收入+0.009*经营性收入-0.05*
财 产 性 收 入 -0.009* 转 移 性 收 入
-55.554。
标准化的典型判别式函数系数
函数
1
城镇居民家庭总收入
工资性收入
经营性收入
财产性收入
转移性收入
表 2-1
分类函数系数
2.940
-1.892
.943
-1.322
-.112
组别
高收入
次高收入
.025
-.018
.014
-.064
-.009
.021
-.015
.009
-.050
-.009
-105.381
-55.554
城镇居民家庭总收入
工资性收入
经营性收入
财产性收入
转移性收入
(常量)
Fisher 的线性判别式函数
表 2-2
分类结果 a
预测组成员
将初始数据代入判别函数可得到表
2-3,可知判别函数对初始分组案例
100%的进行了正确分类。
组别
高收入 次高收入
合计
初始 计数 高收入
次高收入
5
0
0
6
5
6
%
高收入
100.0
.0 100.0
次高收入
.0
100.0 100.0
a. 已对初始分组案例中的 100.0% 个进行了正确分
类。
表 2-3
- 6 -