SPSS统计分析与数据挖掘

副标题:无

作   者:谢龙汉,尚涛编著

分类号:C819

ISBN:9787121152191

微信扫一扫,移动浏览光盘

简介

本书基于SPSS 19.0而编写,结合大量实例对SPSS各模块的统计分析功能进行详细讲解,具体包括SPSS简介、SPSS数据挖掘系统、SPSS数据文件管理、SPSS数据预处理、SPSS基本统计分析、多重反应分析、均值比较与检验、统计图制作、参数检验、回归分析、方差分析、相关分析、聚数分析、判别分析、因子分析、对应分析与结合分析、信度分析、生存分析、对数线性模型、时间序列分析、缺失值分析以及SPSS在财务智能、数据预测、股市分析、社会经济分析等。

目录

第1章 SPSS软件概述 1
1.1 SPSS简介 1
1.2 SPSS操作入门 2
1.2.1 软件安装、启动及退出 3
1.2.2 操作环境 4
1.2.3 系统参数的设置 7
1.3 SPSS的帮助系统 15
第2章 SPSS数据挖掘系统 17
2.1 数据挖掘概述 17
2.1.1 数据挖掘的含义 17
2.1.2 数据挖掘与OLAP 18
2.1.3 数据挖掘和统计学 18
2.1.4 数据挖掘的目的 19
2.1.5 数据挖掘应用 19
2.1.6 数据挖掘流程 19
2.2 成功的数据挖掘 20
2.2.1 CRISP-DM方法论 21
2.2.2 选择数据挖掘工具 25
2.2.3 SPSS数据挖掘 26
2.3 SPSS数据挖掘的过程 29
2.3.1 商业理解 29
2.3.2 数据理解 29
2.3.3 数据准备 29
2.3.4 数据模型 30
2.3.5 评估 30
2.3.6 部署 31
第3章 数据文件、变量与函数 33
3.1 SPSS的变量类型 33
3.1.1 数据的输入 34
3.1.2 变量的编辑 35
3.2 数据文件的打开和保存 37
3.2.1 打开SPSS数据文件 37
3.2.2 打开其他格式的数据文件 38
3.2.3 数据文件保存 38
3.3 SPSS函数 39
3.3.1 算术函数 39
3.3.2 统计函数 40
3.3.3 逻辑函数 41
3.3.4 日期和时间函数 41
3.3.5 随机变量函数 42
3.3.6 反分布函数 44
3.3.7 累计分布函数 45
3.3.8 缺失值函数 47
3.3.9 字符串函数 48
第4章 数据预处理 50
4.1 数据文件的整理 50
4.1.1 排序个案(Sort Case)过程 51
4.1.2 转置(Transpose)过程 52
4.1.3 合并文件(Merge File)过程 52
4.1.4 分类汇总(Aggregate)过程 54
4.1.5 拆分文件(Split File)过程 56
4.1.6 选择个案(Select Cases)
过程 57
4.1.7 加权个案(Weight Cases)
过程 58
4.2 数据变量的变换和计算 58
4.2.1 计算变量(Compute Variables)
过程 59
4.2.2 计数(Count)过程 60
4.2.3 重新编码(Recode)过程 62
4.2.4 个案排秩(Rank Cases)
过程 64
4.2.5 自动重新编码(Automatic
Recode)过程 65
第5章 基本统计分析 67
5.1 基本概念 67
5.1.1 基本的统计概念 67
5.1.2 描述性统计分析 69
5.2 频数分析 70
5.2.1 Frequencies过程的操作界面 70
5.2.2 实例分析 72
5.3 描述性统计分析过程 74
5.3.1 Descriptive过程的参数设置 74
5.3.2 实例分析 74
5.4 数据探索性分析过程 76
5.4.1 Explore过程的参数设置 76
5.4.2 实例分析 77
5.5 列联表分析过程 80
5.5.1 Crosstabs过程的参数设置 80
5.5.2 实例分析 83
第6章 参数检验 86
6.1 参数估计和假设检验概述 86
6.1.1 参数估计 86
6.1.2 假设检验 89
6.2 均值(Means)过程 94
6.2.1 SPSS的Means过程参数
设置 94
6.2.2 Means过程实例 95
6.3 单样本t检验 96
6.3.1 One-Sample t Test过程的
参数设置 96
6.3.2 实例分析 97
6.4 独立两样本t检验 99
6.4.1 Independent-Sample t Test
过程的参数设置 99
6.4.2 实例分析 101
6.5 配对两样本t检验 102
6.5.1 Paired-Sample t Test过程的
参数设置 102
6.5.2 实例分析 103
第7章 基本图形的绘制 105
7.1 统计图概述 105
7.2 条形图 106
7.3 线图 110
7.4 面积图 112
7.5 饼图 114
7.5.1 SPSS设置 114
7.5.2 实例分析 114
7.6 高低图 115
7.7 质量控制图 118
7.8 箱图 123
7.8.1 SPSS参数设置 123
7.8.2 实例分析 124
7.9 散点图 125
7.9.1 SPSS参数设置 126
7.9.2 实例分析 127
7.10 直方图 128
7.10.1 P-P图和Q-Q图 129
7.11 时间序列图 130
7.11.1 SPSS参数设置 131
7.11.2 实例分析 134
第8章 非参数检验 137
8.1 非参数检验概述 137
8.2 检验 138
8.2.1 检验的参数设置 139
8.2.2 检验实例分析 141
8.3 二项分布检验 143
8.3.1 二项分布检验的参数设置 143
8.3.2 实例分析 143
8.4 游程检验 145
8.4.1 游程检验的参数设置 146
8.4.2 实例分析 146
8.5 单样本K-S检验 148
8.5.1 单样本K-S检验的参数
设置 149
8.5.2 实例分析 149
8.6 两独立样本分布位置检验 152
8.6.1 两独立样本分布位置检验的
参数设置 152
8.6.2 实例分析 153
8.7 多个独立样本分布位置检验 154
8.7.1 SPSS参数设置 155
8.7.2 实例分析 155
8.8 两相关样本分布位置检验 157
8.8.1 SPSS参数设置 158
8.8.2 实例分析 158
8.9 多个配对样本分布位置检验 160
8.9.1 SPSS参数设置 160
8.9.2 实例分析 161
第9章 方差分析 163
9.1 方差分析的基本原理 163
9.1.1 自由度与平方和分解 164
9.1.2 F检验 166
9.1.3 多重比较 167
9.2 单因素方差分析 168
9.2.1 单因素方差分析步骤 169
9.2.2 判断与结论 170
9.2.3 One-Way ANOVA过程的
参数设置 170
9.2.4 实例分析 173
9.3 多因素方差分析 174
9.3.1 只考虑主效应的多因素方差
分析 174
9.3.2 存在交互效应的多因素方差
分析 176
9.3.3 Univariate过程参数设置 178
9.3.4 实例分析 183
9.4 协方差分析 188
9.4.1 协方差分析概述 188
9.4.2 实例分析 189
第10章 回归分析 192
10.1 线性回归 192
10.1.1 线性回归模型 193
10.1.2 最小二乘估计 193
10.1.3 回归方程的显著性检验 194
10.1.4 预测问题 196
10.1.5 SPSS线性回归分析设置 197
10.1.6 回归分析模型的实例分析 201
10.2 非线性回归 204
10.2.1 非线性回归分析的基本
原理 204
10.2.2 非线性回归参数设置 205
10.2.3 案例——销售数量和广告
投入的非线性回归分析 208
10.3 Logistic回归 210
10.3.1 Logistic回归模型概述 210
10.3.2 Binary Logistic回归模型
参数设置 212
10.3.3 案例——银行贷款的信用
风险分析 214
第11章 相关分析 219
11.1 相关分析概述 219
11.1.1 相关关系 219
11.1.2 相关图形和相关系数 220
11.1.3 SPSS的相关分析功能
简介 222
11.2 Bivariate过程 222
11.2.1 两变量相关分析简介 222
11.2.2 Bivariate过程的参数设置 224
11.2.3 案例——汽车销售中各变量
之间的相关分析 225
11.3 Partial过程 228
11.3.1 Partial过程的参数设置 228
11.3.2 案例——医疗门诊病人的
流动情况分析 229
11.4 Distances(距离)过程 231
11.4.1 距离分析参数设置 231
11.4.2 案例——全国各个省市自
治区直辖市的农民家庭收支
的分布研究 234
第12章 聚类分析 236
12.1 聚类分析的原理 236
12.1.1 一般原理 237
12.1.2 聚类分析步骤 240
12.1.3 系统聚类方法 241
12.2 快速样本聚类过程 244
12.2.1 快速聚类简介 244
12.2.2 SPSS快速聚类的设置 244
12.2.3 案例——2006年中国主要
城市空气质量的比较分析 246
12.3 分层聚类过程 250
12.3.1 分层聚类简介 250
12.3.2 SPSS分层聚类设置 250
12.3.3 案例——中国经济地理区域
的聚类分析 253
12.4 两阶段聚类分析 256
12.4.1 两阶段聚类简介 256
12.4.2 SPSS两阶段聚类的设置 257
12.4.3 案例——两阶段聚类分析
应用于农村居民人均收入
与生活消费支出研究 259
第13章 判别分析 265
13.1 判别分析的基本原理 265
13.1.1 判别分析简介 265
13.1.2 判别分析的数学模型与
判别方法 266
13.2 一般判别分析 272
13.2.1 一般判别分析的参数设置 272
13.2.2 案例——上市公司类型的
比较分析 275
13.3 逐步判别分析 280
13.3.1 逐步判别的参数设置 280
13.3.2 案例——全国各个省市地区
的农民家庭收支的分布规律
研究 281
第14章 因子分析 287
14.1 因子分析简介 287
14.1.1 因子分析的基本原理 288
14.1.2 因子分析的基本步骤和
过程 290
14.2 SPSS软件进行因子分析 290
14.2.1 SPSS因子分析的参数
设置 290
14.2.2 案例——汽车销售的数据中
各变量的因子分析 294
第15章 对应分析 299
15.1 对应分析的基本原理 299
15.2 简单对应分析 301
15.2.1 Correspondence Analysis
过程 301
15.2.2 案例——简单对应分析
实例 304
15.3 Optimal Scaling过程 307
15.3.1 Optimal Scaling过程的
SPSS参数设置 307
15.3.2 案例——最优尺度分析
实例 313
第16章 可靠性和多维尺度分析 318
16.1 可靠性分析 318
16.1.1 可靠性分析的基本原理 318
16.1.2 可靠性分析的参数设置 320
16.1.3 案例——电视节目调查数据
可靠性分析 322
16.2 多维尺度分析 324
16.2.1 多维尺度分析简介 324
16.2.2 ALSCAL过程的参数
设置 325
16.2.3 案例——多维尺度实例
分析 328
第17章 生存分析 331
17.1 生存分析简介 331
17.1.1 生存分析的基本概念 331
17.1.2 生存资料的特点 333
17.1.3 生存分析方法 333
17.1.4 SPSS中的生存分析过程 334
17.2 Life Tables过程 335
17.2.1 Life Tables过程的参数
设置 335
17.2.2 案例——电信公司客户流失
分析 336
17.3 Kaplan-Meier分析 340
17.3.1 Kaplan-Meier分析的步骤 340
17.3.2 案例——新药开发的数据
分析 342
17.4 Cox模型回归分析 345
17.4.1 Cox回归模型 345
17.4.2 Cox模型参数设置 347
17.4.3 案例——电信公司的客户流失
的Cox回归模型分析 351
第18章 对数线性模型 357
18.1 对数线性模型概述 357
18.2 General过程 358
18.2.1 General过程的参数设置 358
18.2.2 实例分析 361
18.3 Logit过程 363
18.3.1 Logit过程的参数设置 363
18.3.2 实例分析 366
18.4 模型(Model)Selection过程 369
18.4.1 模型(Model)Selection的
参数设置 369
18.4.2 实例分析 371
第19章 时间序列分析 374
19.1 时间序列概述 374
19.1.1 时间序列的组成部分 374
19.1.2 时间序列的数学模型 375
19.1.3 时间序列的分析步骤 377
19.1.4 SPSS时间序列分析功能 377
19.2 时间序列数据的预处理 384
19.2.1 缺失值替换 384
19.2.2 定义时间变量 385
19.2.3 时间序列的平稳化 385
19.3 指数平滑模型过程 386
19.3.1 指数平滑的基本原理 386
19.3.2 指数平滑模型的参数设置 389
19.3.3 案例——销售数据预测分析 390
19.4 ARIMA模型 395
19.4.1 ARIMA模型的基本原理 395
19.4.2 ARIMA模型的参数设置 398
19.4.3 案例——上海证券交易所
综合指数收益率模拟预测
分析 399
19.5 季节分解模型过程 403
19.5.1 季节分解模型的参数设置 403
19.5.2 案例——具有季节因素的
服装销售数据的预测分析 404
第20章 缺失值分析 409
20.1 缺失值理论概述 409
20.1.1 数据缺失方式 410
20.1.2 缺失值处理方法 410
20.2 SPSS缺失值分析操作 414
20.2.1 缺失值分析的参数设置 414
20.2.2 案例——数据集中缺失值的
实例分析 418
第21章 决策树模型 424
21.1 决策树模型概述 424
21.1.1 CHAID算法 426
21.1.2 Exhaustive CHAID算法 427
21.1.3 CART算法 427
21.1.4 QUEST算法 428
21.2 决策树的参数设置 428
21.2.1 变量设置 428
21.2.2 类别(Categories)设置 429
21.2.3 输出(Output)设置 430
21.2.4 验证(Validation)设置 432
21.2.5 保存(Save)设置 433
21.2.6 条件(Criteria)设置 434
21.2.7 CHAID算法设置 435
21.2.8 CART算法设置 435
21.2.9 QUEST算法设置 436
21.2.10 修剪(Pruning)设置 436
21.2.11 替代变量(Surrogates)
设置 437
21.2.12 选项(Options)设置 437
21.2.13 误分类成本设置 438
21.2.14 利润(Profits)设置 438
21.2.15 先验概率(Prior
Probabilities)设置 439
21.2.16 实例分析 440
21.2.17 模型建立 440
21.2.18 模型评估 442
第22章 神经网络 449
22.1 神经网络概述 449
22.1.1 历史及现状 450
22.1.2 神经网络特点 451
22.1.3 神经元模型 452
22.1.4 神经网络模型 453
22.1.5 神经网络的学习规则 453
22.1.6 SPSS神经网络模型 454
22.2 SPSS神经网络模型的设置 456
22.2.1 多层感知器(MLP)的
设置 456
22.2.2 径向基函数(RBF)的
设置 464
22.3 实例分析 466
22.3.1 参数设置 467
22.3.2 结果分析 469
第23章 信用风险分析 475
23.1 信用风险概述 475
23.1.1 信用风险基本概念 475
23.1.2 信用风险度量方法 476
· · · · · · ( 收起)

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

SPSS统计分析与数据挖掘
    • 名称
    • 类型
    • 大小

    联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    亲爱的云图用户,
    光盘内的文件都可以直接点击浏览哦

    无需下载,可直接在线浏览

    loading icon