应用数理统计
第一次大作业
关于影响财政收入因素的回归分析
院 系 名 称
专 业 名 称
学 生 姓 名
学
号
任 课 教 师
关于影响财政收入因素的回归分析
摘要
财政是同国家的产生和存在紧密相连的,财政收入是衡量一个国家财力的重
要指标,是实现国家职能的财力保证,关系到社会经济发展和人民生活水平的提
高,政府在社会经济活动中提供的公共物品和服务的范围和数量在很大程度上决
定于财政收入的充裕状况。本文通过调研了解了一些对财政收入影响的因素,并
在《中国统计年鉴》和《中国统计摘要》上查找二十多年来我国财政收入,以及
相关影响因素的统计,通过多元线性回归分析和逐步回归法对各影响因素进行建
模,借助SPSS 统计分析工具对相关的统计数据进行处理分析,建立能够反映财
政收入和各影响因素之间的最优回归方程,并结合实际情况对得到的模型进行合
理性分析和解释。
关键词 财政收入,多元线性回归,逐步回归法,SPSS
1. 引言
财政作为一国政府的活动,是政府职能的具体体现,主要有资源配置、收入再
分配和宏观经济调控三大职能。财政收入是政府部门的公共收入,是国民收入分
配中用于保证政府行使其公共职能、实施公共政策以及提供公共服务的资金需
求。财政收入的增长情况关系着一个国家经济的发展和社会的进步。对国家财政
的收入状况进行研究是十分必要的。
研究财政收入的影响因素离不开一些基本的经济变量。大多数相关的研究文
献中都把各项税收这个指标作为影响财政收入的基本因素,还有一些文献中也提
出了其他一些变量, 比如社会消费品零售总额、人口状况、第一产业的发展情况、
第二产业的发展情况、第三产业的发展情况等。影响财政收入的因素众多复杂, 但
是通过研究经济理论对财政收入的解释以及对实践的观察, 对财政收入影响的因
素主要有总税收、各项税收、企业所得税和就业人数等。为了研究影响国家财政
收入的因素,很有必要对财政收入和影响财政收入的因素作必要的认识,如果能
对他们之间的关系作一下回归,并利用所知道的数据建立起回归模型这对研究财
政收入很有意义。
由于统计数据限制,本文选取了 1990-2012 年间的年度财政收入及主要影响
因素的数据,包括工业,农业,建筑业,社会消费品零售总额,人口总数等,运
用回归分析方法,通过 SPSS 软件对这些因素与就业人数之间的线性关系进行分
析,寻找其中潜在的关系。
2. 解决问题的方法和计算结果
2.1 要解决的问题与数据采集
财政收入是社会各种因素相互影响相互作用的结果,本文从财政收入的部门
构成来分析财政收入的影响因素。从国民经济部门结构看,财政收入又表现为来
自各经济部门的收入。财政收入的部门构成就是在财政收入中,由来自国民经济
各部门的收入所占的不同比例来表现财政收入来源的结构,它体现国民经济各部
门与财政收入的关系。我国财政收入主要来自于工业、农业、商业、交通运输和
服务业等部门,其中工业和农业对财政收入的影响最大。
本文在进行统计时,查阅《中国统计年鉴 2013》[2]和《中国统计摘要》[3]中
收录的 1990 年至 2012 年的全国财政收入为因变量,初步选取各项税收、工业总
产值、建筑业总产值、农业总产值、社会消费品零售总额、人口总数、受灾面积、
国内生产总值为自变量,分析它们之间的联系,如表 1 所示。
表 1: 1990 年-2012 年间财政收入与相关影响因素统计表
年份 财政收入 工 业 总
产值
建 筑 业
总产值
农 业 总
产值
人口数 受灾
面积
国内生产
总值
各项税收
5062
5342.2
5866.6
6963.8
9572.7
12135.8
14015.4
14441.9
14817.6
14770
14944.7
15781.3
16537
17381.7
21412.7
22420
24040
28627
33702
35226
40533.6
47486.2
52373.6
6858
8087.1
10284.5
14188
19480.7
24950.6
29447.6
32921.4
34018.4
35861.5
40033.6
43580.6
47431.3
54945.5
65210
77230.8
91310.9
110534.9
130260.2
135239.9
160722.2
188470.2
199670.7
2937.1
3149.48
3483.37
4348.95
5218.1
6242.2
7407.99
8651.14
9875.95
11444.08
13395.23
16386.04
18903.64
21715.25
26396.47
31649.29
38760.2
51321.78
61330.35
68518.3
83101.51
103874.43
117253.52
本文首先对上述数据通过使用 SPSS 软件做数据散点图,观察每个影响因素
与就业人数之间的关系,是否具有线性特点;然后通过逐步回归过程,在偏 F
检验显著的前提下,去除模型中不显著的变量,最终建立对财政收入有显著影响
的线性回归模型。
18667.8
21781.5
26923.5
35333.9
48197.9
60793.7
71176.6
78973.0
84402.3
89677.1
99214.6
109655.2
120332.7
135822.8
159878.3
184937.4
216314.4
265810.3
314045.4
340902.8
401512.8
473104.0
518942.1
114333
115823
117171
118517
119850
121121
122389
123626
124761
125786
126743
127627
128453
129227
129988
130756
131448
132129
132802
133450
134091
134735
135404
3847
5547
5133
4883
5504
4582
4699
5343
5015
4998
5469
5221
4695
5451
3711
3882
4109
4899
3999
4721
3743
3247
2496
2821.86
2990.17
3296.91
4255.30
5126.88
6038.04
6909.82
8234.04
9262.80
10682.58
12581.51
15301.38
17636.45
20017.31
24165.68
28778.54
34804.35
45621.97
54223.79
59521.59
73210.79
89738.39
100614.28
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
社 会 消
费 品 零
售总额
8300.1
9415.6
10993.7
14270.4
18622.9
23613.8
28360.2
31252.9
33378.1
35647.9
39105.7
43055.4
48135.9
52516.3
59501
68352.6
79145.2
93571.6
114830.1
132678.4
156998.4
183918.6
210307
859.4
1015.1
1415
2266.5
2964.7
3728.8
4387.4
4621.6
4985.8
5172.1
5522.3
5931.7
6465.5
7490.8
8694.3
10367.3
12408.6
15296.5
18743.2
22398.8
26661
31942.7
35491.3
2.2 模型建立与分析
2.2.1 变量选取
首先通过 SPSS 软件构造以上数据的散点图,初步观察每个影响指标与就业
人数之间是否具有线性关系,如图 1 至图 8 所示。
图 1:财政收入与工业总产值的散点图
图 2:财政收入与各项税收的散点图
图 3:财政收入与建筑业总产值的散点图
图 4:财政收入与农业总产值的散点图
图 5:财政收入与人口数的散点图
图 6:财政收入与社会消费品零售总额的散点图
图 7:财政收入与受灾面积的散点图
图 8:财政收入与国内生产总值的散点图
从散点图中看出,各项税收、工业总产值、农业总产值、建筑业总产值、社
会消费品零售总额、国内生产总值这五个变量与财政收入基本呈线性分布;而人
口总数虽然也与财政收入存在正比的关系,但是从直观上看线性关系不显著,并
且人口因素呈现指数关系。受灾面积与财政收入总量的关系不明显。因此为使得
到的模型有显著的线性关系,在选取进入回归模型的自变量时,就要进行筛选。
故选择自变量为:各项税收、工业总产值、农业总产值、建筑业总产值、社会消
费品零售总额、国内生产总值。
2.2.2 模型建立
以国家财政收入为因变量,各项税收、工业总产值、农业总产值、建筑业总
产值、社会消费品零售总额、国内生产总值为自变量建立线性回归模型:
其中:y 为国家财政收入;
y=β0+β1x1+β2x2+β3x3+β4x4+β5x5+β6x6+ε
x1 为各项税收;
x2 为工业总产值;
x3 为农业总产值;
x4 为建筑业总产值;
x5 为社会消费品零售总额;
x6 为国内生产总值;
ε为随机误差项,β0 为常数项,βi 为待估计的参数;
为了便于模型的参数估计,对回归模型做如下基本假设:
假设 1:自变量是确定性变量,不是随机变量;
假设 2:随机误差项具有 0 均值和等方差;
假设 3:正态分布的假定条件为:εi~ N(0, σ2),ε1,ε2,…,εn 相互独立。
2.2.3 数据生成及分析
本文使用运行软件 SPSS,利用逐步回归法对该问题进行分析。该方法从一
个自变量开始,视自变量对 y 的显著程度,从大到小地依次逐个引入回归方程,
但当引入的自变量由于后面的引入而变得不显著时,将其剔除。引入一个自变量
或从回归方程剔除一个自变量,为逐步回归的一步,对每一步都要进行 F 值检验,
以确保每次引入新的显著性自变量前回归方程中只包含对 y 作用显著的变量。这
个过程反复进行,直到既无不显著的变量从回归方程中剔除,又无显著变量可引
入为止。
本文通过对影响国家财政收入的 6 个指标进行逐步回归,步进方法标准选为
F 概率,进入为 0.050,移除为 0.100。
在第一次逐步回归分析中,用 SPSS 软件进行案例诊断,发现异常数据——
第 21 行,即 2010 年数据,如图 9 所示。所以删除此行数据后再进行逐步回归分
析。