STATA 十八讲1入门
STATA 统计分析教程
中国人民大学 陈传波
chrisccb@126.com
1
STATA 十八讲1入门
目录
STATA统计分析教程 ........................................................................................................................1
目录 ..................................................................................................................................................2
1 STATA入门.....................................................................................................................................6
1.1 安装.....................................................................................................................................6
1.2 启用和退出.........................................................................................................................6
1.3 打开和查看数据.................................................................................................................8
1.4 寻求帮助与网络资源.........................................................................................................9
1.5 命令示例...........................................................................................................................10
1.6 几个环境设置...................................................................................................................11
1.7 复习和练习.......................................................................................................................12
1.8 附录...................................................................................................................................13
2 命令语句 .....................................................................................................................................15
2.1 掌握命令语句的格式.......................................................................................................15
2.2 命令command...................................................................................................................15
2.3 变量varlist.........................................................................................................................15
2.4 分类操作by varlist...........................................................................................................16
2.5 赋值及运算=exp..............................................................................................................16
2.6 条件表达式if exp ............................................................................................................17
2.7 范围筛选in range.............................................................................................................17
2.8 加权weight.......................................................................................................................17
2.9 其他可选项,options.........................................................................................................18
2.10 复习与练习....................................................................................................................19
3 数据 .............................................................................................................................................20
3.1 打开示例数据和网络数据:use ....................................................................................20
3.2 数据类型...........................................................................................................................21
3.3 数据类型转化...................................................................................................................24
3.4 数据显示格式:format.......................................................................................................26
3.5 在STATA中直接录入数据:input..................................................................................27
3.6 导入其他格式数据:insheet ...........................................................................................30
3.7 标签数据:label..................................................................................................................32
3.8 复习与练习......................................................................................................................35
4 数据整理 ....................................................................................................................................36
4.1 拆分与连接数据文件要掌握的命令...............................................................................36
4.2 案例:拆分与连接数据......................................................................................................36
4.3 案例:连接数据文件.......................................................................................................39
4.4 数据重整...........................................................................................................................39
4.5 案例:数据转置..................................................................................................................41
4.6 复习与作业.......................................................................................................................42
5 函数与运算符 .............................................................................................................................44
5.1 运算符exp.........................................................................................................................44
5.2 函数概览function .............................................................................................................46
5.3 数学函数math functions...................................................................................................47
中国人民大学 陈传波
chrisccb@126.com
2
STATA 十八讲1入门
5.4 字符函数string functions..................................................................................................50
5.5 分类操作by......................................................................................................................51
6 程序 ............................................................................................................................................54
6.1 标准的程序文件格式......................................................................................................54
6.2 创造自己的命令:与STATA互致问候 ...........................................................................54
6.3 暂元Macros: local/global.................................................................................................57
6.4 自带命令参数..................................................................................................................59
6.5 scalar标量 .........................................................................................................................60
6.6 临时变量和临时数据文件:tempvar和tempfile ...............................................................61
6.7 基尼系数命令的创建案例 (选学内容)....................................................................62
7 流程语句 ....................................................................................................................................67
7.1 循环语句:while.................................................................................................................67
7.3 循环语句:forvalues...........................................................................................................68
7.3 循环语句:foreach..............................................................................................................69
7.4 嵌套循环...........................................................................................................................71
7.5 条件语句...........................................................................................................................72
7.6 复习和练习.......................................................................................................................74
8 矩阵 ............................................................................................................................................75
8.1 生成矩阵...........................................................................................................................75
8.2 矩阵四则运算...................................................................................................................76
8.3 矩阵函数...........................................................................................................................78
8.4 随机向量与矩阵代数(选学内容)...............................................................................81
9 绘图 .............................................................................................................................................84
9.1 绘图命令...........................................................................................................................84
9.2 几种常用的图...................................................................................................................89
9.3 同时做多个图by(varname) ..............................................................................................96
9.4 模板及图文件处理...........................................................................................................98
9.5 附录...................................................................................................................................99
10 随机模拟.................................................................................................................................100
10.1 伪随机数.......................................................................................................................100
10.2 简单模拟.......................................................................................................................101
10.3 复杂模拟.......................................................................................................................103
10.4 多阶段模拟...................................................................................................................105
10.5 商店案例.......................................................................................................................107
10.6 练习...............................................................................................................................108
10.7 附录...............................................................................................................................109
11 分布函数................................................................................................................................115
11.1 二项分布.......................................................................................................................115
11.2 标准正态分布函数.......................................................................................................115
11.3 正态分布函数及其反函数...........................................................................................116
11.4 服从正态分布的随机数...............................................................................................117
11.5 正态分布密度函数.......................................................................................................118
11.6 分位数...........................................................................................................................119
11.7 卡方分布.......................................................................................................................120
中国人民大学 陈传波
chrisccb@126.com
3
STATA 十八讲1入门
11.8 t分布的分位数..............................................................................................................122
11.9 F分布 ............................................................................................................................122
12 抽样分布.................................................................................................................................125
12.1 经验分布.......................................................................................................................125
12.2 均值的抽样分布:正态总体的小样本抽样分布.......................................................126
12.3 中心极限定理:非正态总体大样本下均值的抽样分布 ...........................................126
12.4 卡方分布与样本标准差的抽样分布...........................................................................128
12.5 构造F分布 ....................................................................................................................129
12.6 t分布:未知总体方差时的抽样分布..........................................................................130
12.7 多元正态分布...............................................................................................................131
13 参数估计与假设检验 ............................................................................................................133
13.1 极大似然估计的原理...................................................................................................133
13.2 正态总体均值和方差的极大似然估计.......................................................................133
13.3 最小二乘估计OLS原理 ...............................................................................................134
13.4 矩估计MM原理............................................................................................................135
13.5 区间估计原理...............................................................................................................135
13.6 假设检验原理...............................................................................................................136
14 简单回归原理 ........................................................................................................................138
14.1 回归分析原理...............................................................................................................138
14.2 模拟实验.......................................................................................................................142
14.3 回归报告结果中各项的手工计算...............................................................................143
14.3 线性模型的最大似然估计...........................................................................................145
15 异方差模拟.............................................................................................................................147
15.1 条件分布图示...............................................................................................................147
15.2 异方差的后果...............................................................................................................148
15.3 图形检验与怀特检验..................................................................................................150
15.4 检验的功效(选读内容) ...............................................................................................151
15.5 估计方法:WLS与GLS..............................................................................................154
15.6 广义最小二乘估计与FGLS........................................................................................155
Equation Chapter 1 Section 116 随机过程模拟 ..........................................................................157
16.1 时间数据函数...............................................................................................................157
16.2 模拟白噪声及检验白噪声..........................................................................................158
16.3 模拟自回归过程AR并检验稳定性 ............................................................................160
16.4 模拟移动平均过程MA ...............................................................................................163
16.5 序列相关性检验..........................................................................................................167
16.6 单位根检验...................................................................................................................168
16.7 平滑分析......................................................................................................................170
17 计量经济学基本理论模拟 .....................................................................................................172
17.1 经典假设满足时OLS估计量的小样本性质 ..............................................................172
17.2 条件误差服从正态分布的假设不成立时OLS的小样本性质...................................173
17.3 条件误差服从正态分布假设不成立时OLS的大样本性质 ......................................173
17.4 第一假设不成立时......................................................................................................175
17.5 第二假设不成立时......................................................................................................176
17.6 第三假设不成立时......................................................................................................177
中国人民大学 陈传波
chrisccb@126.com
4
STATA 十八讲1入门
17.7 第四假设不成立时......................................................................................................177
17.8 第五假设不成立时(略)..........................................................................................177
18 计量经济学综合案例 .............................................................................................................179
18.1 简单回归分析..............................................................................................................179
18.2 多元回归分析..............................................................................................................181
18.3 非线性回归分析..........................................................................................................182
18.4 回归模型的有效性......................................................................................................184
18.5 实验与自然实验..........................................................................................................187
参考文献.......................................................................................................................................189
中国人民大学 陈传波
chrisccb@126.com
5
STATA 十八讲1入门
1 STATA 入门
Stata 统计软件包是目前世界上最著名的统计软件之一,与 SAS、SPSS 一起
被并称为三大权威软件。它广泛的应用于经济、教育、人口、政治学、社会学、
医学、药学、工矿、农林等学科领域,同时具有数据管理软件、统计分析软件、
绘图软件、矩阵计算软件和程序语言的特点,几乎可以完成全部复杂的统计分析
工作。其功能非常强大且操作简单、使用灵活、易学易用、运行速度极快,在许
多方面别具一格。
Stata 的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条
理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用
相同功能的选项,这使得用户学习时极易上手。Stata 语句在简洁的同时又拥有
着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正
做到随心所欲。尽管它也提供了窗口菜单式的操作方式,但强烈建议大家坚持使
用命令行/程序操作方式,很快你就会体会到使用程序和命令方式所带来的那种
随心所欲地处理和分析数据的快感。
Stata 的另一个特点是他的许多高级统计模块均是编程人员用宏语言写成的
程序文件(ADO 文件),这些文件可以自行修改、添加和下载。用户可随时到
Stata 网站寻找并下载最新的升级文件。这一特点使得 STATA 始终处于统计分析
方法发展的最前沿,用户几乎总是能很快找到最新统计算法的 Stata 程序版本,
而这也使得 Stata 自身成了几大统计软件中升级最多、最频繁的一个。
STATA 由美国计算机资源中心(Computer Resource Center)研制,现为 STATA
公司的产品。从 1985 至 2007 的二十多年时间里,已连续推出 1.1,1.2,…,7.0,
8.0,9.0,10.0 等多个版本。我们将要学习的是 9.2 版本。
1.1 安装
(1) http://www.pinggu.org/bbs/dispbbs.asp?boardID=67&ID=97705&page=2 上
有 stata9.rar 下载,但是做正式的论文或工作还是应该尽量用正版软件。
(2)将其解压到 D:/stata9。
(3)点击 setup 安装>>改变安装路径到 D:/stata9>>选择 Stata/SE 版本。
1.2 启用和退出
(1) 程序→Stata,即可进入 Stata,启动后出现文件对话框,要求输入注册单
位和密码等。
中国人民大学 陈传波
chrisccb@126.com
6
STATA 十八讲1入门
(2)打开 D:/stata9>>点击 wsestata>>打开 sn 文件找到注册信息,进行注册(注
意用户名和单位要多于 5 个英文字符)。完成注册后,出现如下画面。
(3)调整和保存界面设置:拖动各个窗口,将其调整为如下合适的格式,然
后选择 Prefs>>save windowing preference
中国人民大学 陈传波
chrisccb@126.com
7
STATA 十八讲1入门
Stata 的界面主要是由四个窗口构成:
结果窗口:位于界面右上部,软件运行中的所有信息,如所执行的命令、执
行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,
如白色表示命令,红色表示错误信息。
命令窗口:位于结果窗口下方,相当于 DOS 软件中的命令行,此处用于键
入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。
命令回顾窗口:即 review 窗口,位于界面左上方,所有执行过的命令会依
次在该窗口中列出,选中某一行单击后命令即被自动拷贝到命令窗口中;如果需
要重复执行,用鼠标双击相应的命令行即可。
变量名窗口:位于界面左下方,列出当前数据集中的所有变量名称,。
除以上四个默认打开的窗口外,在 Stata 中还有数据编辑窗口、程序文件编
辑窗口、帮助窗口、绘图窗口、Log 窗口等,如果需要使用,可以用 Window 或
Help 菜单将其打开。
(4)点击右上角的 X 号退出。
建议安装路径为: D: /stata9。一般不要安装在 C 盘下,更不要直接放在桌
面上。这是因为我们通常会将数据和程序存储于安装目录下,如果安装 c 盘,
一旦计算机出现意外故障,很可能导致我们存储在上面的数据无法恢复。
1.3 打开和查看数据
打开和查看一个数据文件有三种方式,这三种方式分别是窗口式操作、命令
式和程序式操作。例:我们要打开 STATA 自带的示例数据文件 auto.dta。
1.3.1 窗口执行方式
(1)点左上角的第一个按扭 ,弹出一个对话框,选择 STATA 软件自带
的示例数据文件 auto.dta,双击即打开该文件。
(2)然后点击倒数第四个按扭 图标,弹出一个数据库窗口,显示的是 auto
数据文件包含的具体内容。
中国人民大学 陈传波
chrisccb@126.com
8