Stata统计分析与行业应用案例详解(第2版)
作者: 张甜
出版社:清华大学出版社 2017年09月
简介:
Stata是公认的应用*广泛的专业数据分析软件之一,因其功能丰富、效率高、操作简便,深受广大用户,尤其受在校师生的青睐。本书为《Stata统计分析与行业应用案例详解》的升级版本(Stata 14.0),沿用*版(Stata 12.0)的写作风格,采用先讲解Stata的各个操作功能再通过综合案例讲述Stata在各个行业中实际应用的思路编写。本书内容共分为两个部分:第1部分是第1~16章,按照统计类型讲述Stata的具体应用;第2部分是第17~23章,分行业讲述了Stata的具体应用。各章均附有与正文部分对应的上机操作练习题,目的是着重培养读者的动手能力,使读者在实际练习的过程中能够快速提高应用水平。本书面向具备一定统计学基础和计算机操作基础的在校各专业学生,以及企事业单位的相关数据统计分析人员。
【目录】
目 录
第1章 Stata 14.0的基本窗口及管理变量与数据1
1.1Stata 14.0窗口说明 1
1.2Stata 14.0数据文件的创建与读取 2
1.2.1Stata 14.0数据文件的创建 2
1.2.2Stata 14.0数据文件的读取 3
1.3 创建和替代变量 4
1.3.1创建和替代变量概述 4
1.3.2相关数据来源 4
1.3.3Stata分析过程 4
1.3.4结果分析 5
1.3.5案例延伸 6
1.4 分类变量和定序变量的基本操作 7
1.4.1分类变量和定序变量概述 7
1.4.2相关数据来源 7
1.4.3Stata分析过程 8
1.4.4结果分析 9
1.4.5案例延伸 9
1.5 数据的基本操作 10
1.5.1数据的基本操作概述 10
1.5.2相关数据来源 10
1.5.3Stata分析过程 11
1.5.4结果分析 12
1.5.5案例延伸14
1.6 定义数据的子集 14
1.6.1定义数据的子集概述 14
1.6.2相关数据来源 15
1.6.3Stata分析过程 15
1.6.4结果分析 16
1.6.5案例延伸 17
1.7 本章习题 17
第2章 Stata图形绘制 20
2.1 实例一——直方图 20
2.1.1直方图的功能与意义 20
2.1.2相关数据来源 20
2.1.3Stata分析过程 21
2.1.4结果分析 21
2.1.5案例延伸 22
2.2 实例二——散点图 24
2.2.1散点图的功能与意义 24
2.2.2相关数据来源 24
2.2.3Stata分析过程 24
2.2.4结果分析 25
2.2.5案例延伸 25
2.3 实例三——曲线标绘图 27
2.3.1曲线标绘图的功能与意义 27
2.3.2相关数据来源 27
2.3.3Stata分析过程 28
2.3.4结果分析 28
2.3.5案例延伸 29
2.4 实例四——连线标绘图 31
2.4.1连线标绘图的功能与意义 31
2.4.2相关数据来源 31
2.4.3Stata分析过程 31
2.4.4结果分析 32
2.4.5案例延伸 33
2.5 实例五——箱图 34
2.5.1箱图的功能与意义 34
2.5.2相关数据来源 34
2.5.3Stata分析过程 35
2.5.4结果分析 35
2.5.5案例延伸 36
2.6 实例六——饼图 37
2.6.1饼图的功能与意义 37
2.6.2相关数据来源 37
2.6.3Stata分析过程 37
2.6.4结果分析 38
2.6.5案例延伸 38
2.7 实例七——条形图 39
2.7.1条形图的功能与意义 39
2.7.2相关数据来源 40
2.7.3Stata分析过程 40
2.7.4结果分析 41
2.7.5案例延伸 41
2.8 实例八——点图 42
2.8.1点图的功能与意义 42
2.8.2相关数据来源 42
2.8.3Stata分析过程 43
2.8.4结果分析 43
2.8.5案例延伸 44
2.9 本章习题 45
第3章 Stata描述统计 48
3.1 实例一——定距变量的描述性统计 48
3.1.1定距变量的描述性统计功能与意义 48
3.1.2相关数据来源 48
3.1.3Stata分析过程 49
3.1.4结果分析 49
3.1.5案例延伸 50
3.2 实例二——正态性检验和数据转换 53
3.2.1正态性检验和数据转换功能与意义 53
3.2.2相关数据来源 53
3.2.3Stata分析过程 53
3.2.4结果分析 54
3.2.5案例延伸 55
3.3 实例三——单个分类变量的汇总 57
3.3.1单个分类变量的汇总功能与意义 57
3.3.2相关数据来源 57
3.3.3Stata分析过程 57
3.3.4结果分析 58
3.3.5案例延伸 58
3.4 实例四——两个分类变量的列联表分析 59
3.4.1两个分类变量的列联表分析功能与意义 59
3.4.2相关数据来源 59
3.4.3Stata分析过程 59
3.4.4结果分析 60
3.4.5案例延伸 61
3.5 实例五——多表和多维列联表分析 61
3.5.1多表和多维列联表分析功能与意义 61
3.5.2相关数据来源 62
3.5.3Stata分析过程 62
3.5.4结果分析 63
3.5.5案例延伸 65
3.6 本章习题 65
第4章 Stata参数检验 68
4.1 实例一——单一样本T检验 68
4.1.1单一样本T检验的功能与意义 68
4.1.2相关数据来源 68
4.1.3Stata分析过程 69
4.1.4结果分析 69
4.1.5案例延伸 70
4.2 实例二——独立样本T检验 70
4.2.1独立样本T检验的功能与意义 70
4.2.2相关数据来源 71
4.2.3Stata分析过程 71
4.2.4结果分析 72
4.2.5案例延伸 72
4.3 实例三——配对样本T检验 73
4.3.1配对样本T检验的功能与意义 73
4.3.2相关数据来源 74
4.3.3Stata分析过程 74
4.3.4结果分析 75
4.3.5案例延伸 75
4.4 实例四——单一样本方差的假设检验 76
4.4.1单一样本方差假设检验的功能与意义 76
4.4.2相关数据来源 76
4.4.3Stata分析过程 76
4.4.4结果分析 77
4.4.5案例延伸 77
4.5 实例五——双样本方差的假设检验 78
4.5.1双样本方差假设检验的功能与意义 78
4.5.2相关数据来源 78
4.5.3Stata分析过程 79
4.5.4结果分析 79
4.5.5案例延伸 80
4.6 本章习题 80
第5章 Stata非参数检验 83
5.1 实例一——单样本正态分布检验 83
5.1.1单样本正态分布检验的功能与意义 83
5.1.2相关数据来源 83
5.1.3Stata分析过程 84
5.1.4结果分析 84
5.1.5案例延伸 85
5.2 实例二——两独立样本检验85
5.2.1两独立样本检验的功能与意义 85
5.2.2相关数据来源 86
5.2.3Stata分析过程 86
5.2.4结果分析 87
5.2.5案例延伸 87
5.3 实例三——两相关样本检验88
5.3.1两相关样本检验的功能与意义 88
5.3.2相关数据来源 88
5.3.3Stata分析过程 88
5.3.4结果分析 89
5.3.5案例延伸 90
5.4 实例四——多独立样本检验90
5.4.1多独立样本检验的功能与意义 90
5.4.2相关数据来源 91
5.4.3Stata分析过程 91
5.4.4结果分析 92
5.4.5案例延伸 92
5.5 实例五——游程检验 92
5.5.1游程检验的功能与意义 92
5.5.2相关数据来源 93
5.5.3Stata分析过程 93
5.5.4结果分析 94
5.5.5案例延伸 94
5.6 本章习题 95
第6章 Stata方差分析 97
6.1 实例一——单因素方差分析97
6.1.1单因素方差分析的功能与意义 97
6.1.2相关数据来源 97
6.1.3Stata分析过程 98
6.1.4结果分析 98
6.1.5案例延伸 99
6.2 实例二——多因素方差分析100
6.2.1多因素方差分析的功能与意义 100
6.2.2相关数据来源 100
6.2.3Stata分析过程 100
6.2.4结果分析 101
6.2.5案例延伸 103
6.3 实例三——协方差分析103
6.3.1协方差分析的功能与意义 103
6.3.2相关数据来源 104
6.3.3Stata分析过程 104
6.3.4结果分析 105
6.3.5案例延伸 107
6.4 实例四——重复测量方差分析108
6.4.1重复测量方差分析的功能与意义 108
6.4.2相关数据来源 108
6.4.3Stata分析过程 109
6.4.4结果分析 110
6.4.5案例延伸 110
6.5 本章习题 111
第7章 Stata相关分析 113
7.1 实例一——简单相关分析113
7.1.1简单相关分析的功能与意义 113
7.1.2相关数据来源 113
7.1.3Stata分析过程 114
7.1.4结果分析 114
7.1.5案例延伸 115
7.2 实例二——偏相关分析117
7.2.1偏相关分析的功能与意义 117
7.2.2相关数据来源 117
7.2.3Stata分析过程 117
7.2.4结果分析 118
7.2.5案例延伸 119
7.3 本章习题 119
第8章 Stata主成分分析与因子分析121
8.1 实例一——主成分分析121
8.1.1主成分分析的功能与意义 121
8.1.2相关数据来源 121
8.1.3Stata分析过程 122
8.1.4结果分析 123
8.1.5案例延伸 125
8.2 实例二——因子分析 127
8.2.1因子分析的功能与意义 127
8.2.2相关数据来源 127
8.2.3Stata分析过程 127
8.2.4结果分析 130
8.2.5案例延伸 149
8.3 本章习题 151
第9章 Stata聚类分析 152
9.1 实例一——划分聚类分析152
9.1.1划分聚类分析的功能与意义 152
9.1.2相关数据来源 152
9.1.3Stata分析过程 153
9.1.4结果分析 154
9.1.5案例延伸 161
9.2 实例二——层次聚类分析164
9.2.1层次聚类分析的功能与意义 164
9.2.2相关数据来源 164
9.2.3Stata分析过程 164
9.2.4结果分析 168
9.2.5案例延伸 178
9.3 本章习题 186
第10章 Stata*小二乘线性回归分析187
10.1实例一——简单线性回归分析 187
10.1.1简单线性回归分析的功能与意义 187
10.1.2相关数据来源 187
10.1.3Stata分析过程 188
10.1.4结果分析 188
10.1.5案例延伸 192
10.2实例二——多重线性回归分析 194
10.2.1多重线性回归分析的功能与意义 194
10.2.2相关数据来源 194
10.2.3Stata分析过程 195
10.2.4结果分析 196
10.2.5案例延伸 200
10.3本章习题 202
第11章 Stata回归诊断与应对 204
11.1实例一——异方差检验与应对 204
11.1.1异方差检验与应对的功能与意义 204
11.1.2相关数据来源 204
11.1.3Stata分析过程 205
11.1.4结果分析 206
11.1.5案例延伸 214
11.2实例二——自相关检验与应对 217
11.2.1自相关检验与应对的功能与意义 217
11.2.2相关数据来源 218
11.2.3Stata分析过程 218
11.2.4结果分析 220
11.2.5案例延伸 226
11.3实例三——多重共线性检验与应对 227
11.3.1多重共线性检验与应对的功能与意义 227
11.3.2相关数据来源 228
11.3.3Stata分析过程 228
11.3.4结果分析 229
11.3.5案例延伸 233
11.4本章习题 235
第12章 Stata非线性回归分析 237
12.1实例一——非参数回归分析 237
12.1.1非参数回归分析的功能与意义 237
12.1.2相关数据来源 237
12.1.3Stata分析过程 238
12.1.4结果分析 239
12.1.5案例延伸 242
12.2实例二——转换变量回归分析 244
12.2.1转换变量回归分析的功能与意义 244
12.2.2相关数据来源 244
12.2.3Stata分析过程 245
12.2.4结果分析 246
12.2.5案例延伸 251
12.3实例三——非线性回归分析 251
12.3.1非线性回归分析的功能与意义 251
12.3.2相关数据来源 251
12.3.3Stata分析过程 252
12.3.4结果分析 253
12.3.5案例延伸 257
12.4本章习题 259
第13章 Stata Logistic回归分析 261
13.1实例一——二元Logistic回归分析 261
13.1.1二元logistic回归分析的功能与意义 261
13.1.2相关数据来源 261
13.1.3Stata分析过程 262
13.1.4结果分析 263
13.1.5案例延伸 268
13.2实例二——多元Logistic回归分析 270
13.2.1多元Logistic回归分析的功能与意义 270
13.2.2相关数据来源 270
13.2.3Stata分析过程 271
13.2.4结果分析 272
13.2.5案例延伸 274
13.3实例三——有序Logistic回归分析 275
13.3.1有序Logistic回归分析的功能与意义 275
13.3.2相关数据来源 275
13.3.3Stata分析过程 276
13.3.4结果分析 277
13.3.5案例延伸 279
13.4本章习题 281
第14章 Stata因变量受限回归分析 283
14.1实例一——断尾回归分析 283
14.1.1断尾回归分析的功能与意义 283
14.1.2相关数据来源 283
14.1.3Stata分析过程 284
14.1.4结果分析 285
14.1.5案例延伸 288
14.2实例二——截取回归分析 289
14.2.1截取回归分析的功能与意义 289
14.2.2相关数据来源 289
14.2.3Stata分析过程 289
14.2.4结果分析 290
14.2.5案例延伸 293
14.3本章习题 295
第15章 Stata时间序列分析 296
15.1时间序列分析的基本操作 296
15.1.1时间序列分析的基本操作概述 296
15.1.2相关数据来源 296
15.1.3Stata分析过程 297
15.1.4结果分析 298
15.1.5案例延伸 302
15.2单位根检验 303
15.2.1单位根检验的功能与意义 303
15.2.2相关数据来源 303
15.2.3Stata分析过程 303
15.2.4结果分析 305
15.2.5案例延伸 310
15.3协整检验 311
15.3.1协整检验的功能与意义 311
15.3.2相关数据来源 312
15.3.3Stata分析过程 312
15.3.4结果分析 313
15.3.5案例延伸 316
15.4格兰杰因果关系检验 320
15.4.1格兰杰因果关系检验的功能与意义 320
15.4.2相关数据来源 320
15.4.3Stata分析过程 320
15.4.4结果分析 321
15.4.5案例延伸 324
15.5本章习题 325
第16章 Stata面板数据分析 327
16.1实例一——短面板数据分析 327
16.1.1短面板数据分析的功能与意义 327
16.1.2相关数据来源 327
16.1.3Stata分析过程 328
16.1.4结果分析 330
16.1.5案例延伸 341
16.2实例二——长面板数据分析 343
16.2.1长面板数据分析的功能与意义 343
16.2.2相关数据来源 343
16.2.3Stata分析过程 344
16.2.4结果分析 346
16.2.5案例延伸 356
16.3本章习题 357
第17章 Stata在研究城市综合经济实力中的应用 359
17.1研究背景及目的 359
17.2研究方法 359
17.3数据分析与报告 360
17.4描述性分析 361
17.4.1Stata分析过程 361
17.4.2结果分析 361
17.5相关分析 365
17.6回归分析 367
17.7因子分析 372
17.8因子分析之后续分析 379
17.9研究结论 380
17.10本章习题 381
第18章 Stata在旅游业中的应用 383
18.1研究背景及目的 383
18.2研究方法 384
18.3数据分析与报告 384
18.3.1各城市国内旅游出游人均花费按性别和年龄进行的聚类分析 384
18.3.2各城市国内旅游出游人均花费按职业进行的聚类分析 390
18.3.3各城市国内旅游出游人均花费按文化水平进行的聚类分析 397
18.3.4各城市国内旅游出游人均花费按旅游目的进行的聚类分析 403
18.3.5各风景区按其自身特点进行的聚类分析 410
18.4研究结论 417
18.5本章习题 418
第19章 Stata在经济增长分析中的应用422
19.1数据来源与研究思路 422
19.2描述性分析 423
19.2.1Stata分析过程 423
19.2.2结果分析 425
19.3时间序列趋势图 428
19.3.1Stata分析过程 428
19.3.2结果分析 429
19.4相关性分析 432
19.4.1Stata分析过程 432
19.4.2结果分析 433
19.5单位根检验 435
19.5.1Stata分析过程 435
19.5.2结果分析 437
19.6协整检验 443
19.6.1Stata分析过程 443
19.6.2结果分析 444
19.7格兰杰因果关系检验 446
19.7.1Stata分析过程 446
19.7.2结果分析 446
19.8建立模型 448
19.9研究结论 450
19.10本章习题 451
第20章 Stata在原油与黄金价格联动关系研究中的应用 452
20.1数据来源与研究思路 452
20.2描述性分析 453
20.2.1Stata分析过程 453
20.2.2结果分析 454
20.3时间序列趋势图 455
20.3.1Stata分析过程 455
20.3.2结果分析 456
20.4相关性分析 459
20.4.1Stata分析过程 459
20.4.2结果分析 459
20.5单位根检验 462
20.5.1Stata分析过程 462
20.5.2结果分析 463
20.6协整检验 468
20.6.1Stata分析过程 468
20.6.2结果分析 469
20.7格兰杰因果关系检验 471
20.7.1Stata分析过程 471
20.7.2结果分析 472
20.8建立模型 473
20.9研究结论 475
20.10本章习题 476
第21章 Stata在ROE与股权集中度之间关系研究中的应用 477
21.1研究背景 477
21.2基本概念与数据说明 478
21.3实证分析 479
21.3.1描述性分析 479
21.3.2图形分析 480
21.3.3普通*小二乘回归分析 482
21.3.4面板数据回归分析 484
21.4研究结论 497
21.5本章习题 498
第22章 Stata在农业中的应用 499
22.1研究背景 499
22.2研究方法 500
22.3数据整理 500
22.4描述性分析 501
22.4.1Stata分析过程 501
22.4.2结果分析 502
22.5相关分析 506
22.6回归分析 510
22.7因子分析 518
22.8聚类分析 528
22.9研究结论 534
22.10本章习题 535
第23章 Stata在保险业中的应用 537
23.1研究背景及目的 537
23.2研究方法 538
23.3数据整理 538
23.4描述性分析 539
23.4.1Stata分析过程 540
23.4.2结果分析 540
23.5相关分析 544
23.6回归分析 548
23.7因子分析 555
23.8聚类分析 566
23.9研究结论 569
23.10本章习题 571
【免费在线读】
第1章 Stata 14.0的基本窗口及管理变量与数据Stata是一种功能全面的统计软件包,是目前欧美*为流行的计量软件之一。它具有容易操作、运行速度快、功能强大的特点。Stata不仅包括一整套预先编排好的分析与数据功能,同时还允许软件使用者根据自己的需要来创建程序,从而添加更多的功能。该软件自从被引入我国后,迅速得到了广大学者的认可与厚爱,适用范围越来越广泛。Stata 14.0是目前Stata的*版本。本章将初步介绍Stata 14.0的基本窗口、变量管理与数据管理。1.1 Stata 14.0窗口说明在正确安装好Stata 14.0以后,单击Stata主程序的图标文件,即可打开Stata的主界面,如图1.1所示。 图1.1 Stata 14.0主界面与大部分的程序窗口类似,Stata 14.0也有自己的菜单栏、工具栏,但其特色在于主界面中的5个区域:Review、Variables、Command、Results、Properties。? Review(历史窗口)显示的是自本次启动Stata 14.0以来执行过的所有命令。? Variables(变量窗口)显示的是当前Stata数据文件中的所有变量。? Command(命令窗口)是*重要的窗口,在本窗口内可输入准备执行的命令。? Results(结果窗口)显示的是每次执行Stata命令后的执行结果,无论成功还是失败。? Properties(性质窗口)显示的是当前数据文件中制定变量以及数据的性质。各个窗口的大小都可以调节,读者可以用鼠标进行伸缩操作,使其符合自己的风格。1.2 Stata 14.0数据文件的创建与读取1.2.1 Stata 14.0数据文件的创建 下载资源:\video\chap01\… 下载资源:\sample\chap01\正文\案例1.1.dta【例1.1】表1.1记录的是我国2000-2009年上市公司数量的数据。试创建Stata格式的数据文件并保存。表1.1 我国2000-2009年的上市公司数量年份 上交所 深交所2000 572 5162001 646 5142002 715 5092003 780 5072004 837 5402005 834 5472006 842 5922007 860 6902008 864 7612009 870 848操作过程如下: 进入Stata 14.0,打开主程序,弹出如图1.2所示的主界面。 选择“Data”|“Data Editor”|“Data Editor(Edit)”命令,弹出如图1.3所示的“Data Editor(Edit)”对话框。 图1.2 主界面 图1.3 “Data Editor”对话框 在“Data Editor(Edit)”对话框左上角的单元格中输入我们的第1个数据“2000”,系统即自动创建“var1”变量,如图1.4所示。 单击右下方“Properties”(性质窗口)中的“Variables”,“Variables”中的变量特征(包括名称、类型、长度等)即可进入可编辑状态,如图1.5所示。 图1.4 “Data Editor”对话框 图1.5 编辑变量特征 我们对变量名称进行必要的修改,因为第1个变量是年份,所以把“var1”修改为“year”,其他采取系统默认设置,修改完成后在左侧数据输入区域单击,即可弹出如图1.6所示的对话框。 逐一数据录入,其他两个变量参照年份进行设置,并分别将其定义为“shangjiao”和“shenjiao”,数据录入完毕后如图1.7所示。 图1.6 修改“Name”变量 图1.7 录入数据 关闭“Data Editor(Edit)”对话框,在主界面的工具栏里面单击 按钮进行数据保存。1.2.2 Stata 14.0数据文件的读取读取以前创建的Stata格式的数据文件比较简单,有3种方式:? 直接双击该文件,即可打开数据。? 在主界面的菜单栏里面选择“File”|“Open”命令,找到文件后打开即可。? 在主界面的“Command”(命令窗口)中,输入命令:use filename(文件的名称)。1.3 创建和替代变量1.3.1 创建和替代变量概述前面已经介绍了创建、修改数据文件和变量的通用方式,但在有些情况下,我们需要利用现有的变量生成一个新的变量,那么如何快捷方便地实现这种操作呢?Stata 14.0提供了generate以及replace命令以供我们选择使用,其中generate命令是利用现有变量生成一个新的变量,并保留原来的变量不变;而replace命令则是利用现有变量生成一个新的变量替换原来的变量。下面我们就用实例的方式来讲解一下这两个重要命令的应用。1.3.2 相关数据来源 下载资源:\video\chap01\… 下载资源:\sample\chap01\正文\案例1.2.dta【例1.2】我国2009年各地区的就业人口以及工资总额数据如表1.2所示。请使用Stata命令进行操作:(1)试生成新的变量来描述各地区的平均工资情况;(2)试生成平均工资变量来替代原有的工资总额变量;(3)对生成的平均工资变量数据均做除以10的处理;(4)对就业人口变量进行对数平滑处理,从而产生新的变量。