微信扫一扫,移动浏览光盘
简介
大数据时代已经来临,这将引起深刻的行业变革。但是,大数据的真意在于数据分析,即从繁多的数据中找出洞见,并将其应用于实际决策中,以产生更明智的决策。这是一个看起来简单、做起来较难的事情。 《发现数据之美:数据分析原理与实践》从一个自底向上的角度,全面地阐述了数据分析所涉及的知识和技术,对于经典算法和工具的介绍也不止于泛泛而谈,而是加入了作者的经验和理解。所谓自底向上的角度,即从数据分析实践开始时所需要的数据准备、数据探查、数据再处理等,到经典的统计分析和数据挖掘算法及应用,还讲述了模型的部署,优化技术的引入,最终到决策自动化。 《发现数据之美:数据分析原理与实践》对企业管理者、数据分析从业者及高校的学生都有参考意义。管理者能看到一个较全面的数据分析的阐述,明确自身的需求;从业者能看到经验的总结及经典工具的使用;高校学生能看到数据分析所涉及的知识,对数据分析有一个全面的认识。
目录
第1章 业务分析是一个蓬勃发展的方向
1.1 业务分析是什么
1.2 业务分析的应用现状
1.3 如何应用业务分析
1.4 大数据与业务分析
1.5 我们还在等什么
第2章 开始我们的旅程――从数据谈起
2.1 我们讨论的数据结构
2.1.1 行(Row)是什么
2.1.2 列(Column)是什么
2.1.3 多少行数据才合适
2.1.4 我们需要什么样的列
2.2 Statistics和Modeler的基本知识
2.3 数据导入(Loading Data)
2.4 数据探查(Data Exploring)
2.4.1 正态分布(Normal Distribution)
2.4.2 数据探查的常见统计量
2.4.3 数据可视化
2.5 本章小结
第3章 在分析之前,还需要数据预处理
3.1 数据的问题
3.2 数据校验
3.2.1 验证规则
3.2.2 验证数据
3.2.3 数据审计(Data Audit)
3.2.4 识别异常数据
3.3 数据集成(Data Integration)
3.3.1 在Statistics中进行数据集成
3.3.2 在Modeler中进行数据集成
3.4 数据转换(Data Transformation)
3.4.1 分箱(Binning)
3.4.2 数据调整(Data Rescale)
3.4.3 数据重新编码(Recode)
3.5 自动数据准备
3.5.1 Statistics中的自动数据准备
3.5.2 Modeler中的自动数据准备
3.6 本章小结
第4章 经典分析――统计学的魅力
4.1 随机变量及分布
4.2 数理统计导引
4.3 参数估计
4.3.1 点估计
4.3.2 区间估计
4.4 假设检验
4.4.1 正态分布检验和t检验
4.4.2 非参数检验
4.5 相关分析
4.6 方差分析
4.7 回归分析
4.7.1 线性回归分析
4.7.2 自动化线性回归分析
4.7.3 广义线性模型
4.7.4 广义线性混合模型(Generalized Linear Mixed Mode,GLMM)
4.8 本章小结
第5章 我想预测未来
5.1 数据挖掘的技术分类
5.1.1 有监督的建模技术
5.1.2 无监督的建模技术
5.1.3 Feature Selection对于分类的意义
5.1.4 查看建模的结果
5.2 决策树
5.2.1 C5.0算法
5.2.2 分类和回归树
5.2.3 卡方自动交互检测法(CHAID)
5.2.4 快速、无偏、高效的统计树(QUEST)
5.2.5 交互式的决策树构建方式
5.3 决策表
5.3.1 决策表算法的设置
5.3.2 交互式决策表的生成方式
5.4 贝叶斯网络
5.4.1 一些基本概念
5.4.2 IBM SPSS的做法
5.5 神经网络(Neural Networks)
5.5.1 神经网络是什么
5.5.2 SPSS神经网络算法
5.6 支持向量机(Support Vector Machine)
5.6.1 什么是线性分类器
5.6.2 Modeler中的支持向量机
5.7 最近相邻(Nearest Neighbor)
5.8 我该选用哪种算法
5.9 如何评价预测结果
5.9.1 基本指标
5.9.2 Gains
5.9.3 Lift
5.9.4 Response
5.9.5 Profit
5.9.6 ROI.
5.10 本章小结
第6章 我想发现聚类(Cluster)
6.1 聚类技术
6.2 分层聚类
6.3 K-
6.4 Tw
6.4.1 预聚类
6.4.2 离群值处理
6.4.3 聚类
6.4.4 TwoStep的使用
6.5 Kohonen ne
6.6 我怎么知道聚类结果是好的
6.6.1 考察聚类的数量和每个聚类中的记录数
6.6.2 考察聚类内的特征
6.6.3 考察聚类间的特征
6.6.4 一个综合的考察指标Silho
6.7 自动聚类
6.8 理解聚类的结果
6.9 一个聚类分析应用的例子
6.10 本章小结
第7章 周而复始的规律――时间序列分析
7.1 时间序列
7.1.1 时间序列的类型
7.1.2 时间序列的特征
7.2 指数平滑模型
7.2.1 简单指数平滑法
7.2.2 带有趋势调整的指数平滑法(霍尔特指数平滑法)
7.2.3 带有阻尼趋势的指数平滑法
7.2.4 简单季节指数平滑法
7.2.5 带有趋势和季节调整的指数平滑法(温特斯指数平滑法)
7.2.6 指数平滑法的初始化
7.2.7 去除时间序列的趋势和季节性因素
7.3 自回归模型
7.3.1 自回归模型
7.3.2 移动平均模型
7.3.3 自回归移动平均模型(ARMA)
7.3.4 差分自回归移动平均模型
7.4 SPSS产品中的时间序列模型
7.4.1 Statistics中的时间序列模型
7.4.2 Modeler中的时间序列模型
7.5 时间序列分析的评价
7.6 本章小结
第8章 你的行为完全可能被猜中――关联规则分析
8.1 基本概念
8.2 Apriori算法
8.2.1 Apriori算法工作步骤
8.2.2 Apriori算法的评估方法
8.2.3 Apriori节点
8.3 CARMA算法
8.3.1 CARMA算法的工作步骤
8.3.2 CARMA节点
8.4 序列算法
8.5 关联规则的评价
8.6 典型应用案例
第9章 我们还需要优化技术的帮忙
9.1 什么是优化技术
9.2 优化问题的分类
9.2.1 线性规划
9.2.2 整数规划
9.2.3 多目标规划
9.2.4 动态规划
9.3 IBM ILOG Optimization介绍
9.4 本章小结
第10章 有关方法论的问题
10.1 为什么我们要讨论方法论
10.2 CRI
10.2.1 CRISP-DM方法学
10.2.2 CRISP-DM参考模型
10.3 IBM SPSS
10.3.1 Repos
10.3.
10.3.3 Model Refresh and Champion Chall
10.3.4 Sc
10.4 模型的部署不是终点
第11章 一个时髦的领域――决策管理
11.1 决策管理系统
11.1.1 什么是决策
11.1.2 什么是决策管理系统
11.1.3 决策支持与决策管理的比较
11.2 构建决策管理系统
11.2.1 构建决策支持系统的原则
11.2.2 合适的决策
11.2.3 如何找到合适的决策
11.2.4 怎样在决策管理系统中定义决策
11.2.5 决策管理系统中的优化技术
11.2.6 决策影响的评估
11.2.7 监控决策
11.2.8 决策的持续改进
11.2.9 构建和部署决策服务
11.2.10 实施决策管理的一些要求
11.3 IB
11.3.1 ADM是SPSS数据分析能力的窗口
11.3.2 ADM的着眼点是将数据分析结果转化为决策
11.3.3 ADM是一个可以配置的决策服务平台
11.3.4 ADM的工作步骤
11.4 本章小结
后记 为未来做好准备
1.1 业务分析是什么
1.2 业务分析的应用现状
1.3 如何应用业务分析
1.4 大数据与业务分析
1.5 我们还在等什么
第2章 开始我们的旅程――从数据谈起
2.1 我们讨论的数据结构
2.1.1 行(Row)是什么
2.1.2 列(Column)是什么
2.1.3 多少行数据才合适
2.1.4 我们需要什么样的列
2.2 Statistics和Modeler的基本知识
2.3 数据导入(Loading Data)
2.4 数据探查(Data Exploring)
2.4.1 正态分布(Normal Distribution)
2.4.2 数据探查的常见统计量
2.4.3 数据可视化
2.5 本章小结
第3章 在分析之前,还需要数据预处理
3.1 数据的问题
3.2 数据校验
3.2.1 验证规则
3.2.2 验证数据
3.2.3 数据审计(Data Audit)
3.2.4 识别异常数据
3.3 数据集成(Data Integration)
3.3.1 在Statistics中进行数据集成
3.3.2 在Modeler中进行数据集成
3.4 数据转换(Data Transformation)
3.4.1 分箱(Binning)
3.4.2 数据调整(Data Rescale)
3.4.3 数据重新编码(Recode)
3.5 自动数据准备
3.5.1 Statistics中的自动数据准备
3.5.2 Modeler中的自动数据准备
3.6 本章小结
第4章 经典分析――统计学的魅力
4.1 随机变量及分布
4.2 数理统计导引
4.3 参数估计
4.3.1 点估计
4.3.2 区间估计
4.4 假设检验
4.4.1 正态分布检验和t检验
4.4.2 非参数检验
4.5 相关分析
4.6 方差分析
4.7 回归分析
4.7.1 线性回归分析
4.7.2 自动化线性回归分析
4.7.3 广义线性模型
4.7.4 广义线性混合模型(Generalized Linear Mixed Mode,GLMM)
4.8 本章小结
第5章 我想预测未来
5.1 数据挖掘的技术分类
5.1.1 有监督的建模技术
5.1.2 无监督的建模技术
5.1.3 Feature Selection对于分类的意义
5.1.4 查看建模的结果
5.2 决策树
5.2.1 C5.0算法
5.2.2 分类和回归树
5.2.3 卡方自动交互检测法(CHAID)
5.2.4 快速、无偏、高效的统计树(QUEST)
5.2.5 交互式的决策树构建方式
5.3 决策表
5.3.1 决策表算法的设置
5.3.2 交互式决策表的生成方式
5.4 贝叶斯网络
5.4.1 一些基本概念
5.4.2 IBM SPSS的做法
5.5 神经网络(Neural Networks)
5.5.1 神经网络是什么
5.5.2 SPSS神经网络算法
5.6 支持向量机(Support Vector Machine)
5.6.1 什么是线性分类器
5.6.2 Modeler中的支持向量机
5.7 最近相邻(Nearest Neighbor)
5.8 我该选用哪种算法
5.9 如何评价预测结果
5.9.1 基本指标
5.9.2 Gains
5.9.3 Lift
5.9.4 Response
5.9.5 Profit
5.9.6 ROI.
5.10 本章小结
第6章 我想发现聚类(Cluster)
6.1 聚类技术
6.2 分层聚类
6.3 K-
6.4 Tw
6.4.1 预聚类
6.4.2 离群值处理
6.4.3 聚类
6.4.4 TwoStep的使用
6.5 Kohonen ne
6.6 我怎么知道聚类结果是好的
6.6.1 考察聚类的数量和每个聚类中的记录数
6.6.2 考察聚类内的特征
6.6.3 考察聚类间的特征
6.6.4 一个综合的考察指标Silho
6.7 自动聚类
6.8 理解聚类的结果
6.9 一个聚类分析应用的例子
6.10 本章小结
第7章 周而复始的规律――时间序列分析
7.1 时间序列
7.1.1 时间序列的类型
7.1.2 时间序列的特征
7.2 指数平滑模型
7.2.1 简单指数平滑法
7.2.2 带有趋势调整的指数平滑法(霍尔特指数平滑法)
7.2.3 带有阻尼趋势的指数平滑法
7.2.4 简单季节指数平滑法
7.2.5 带有趋势和季节调整的指数平滑法(温特斯指数平滑法)
7.2.6 指数平滑法的初始化
7.2.7 去除时间序列的趋势和季节性因素
7.3 自回归模型
7.3.1 自回归模型
7.3.2 移动平均模型
7.3.3 自回归移动平均模型(ARMA)
7.3.4 差分自回归移动平均模型
7.4 SPSS产品中的时间序列模型
7.4.1 Statistics中的时间序列模型
7.4.2 Modeler中的时间序列模型
7.5 时间序列分析的评价
7.6 本章小结
第8章 你的行为完全可能被猜中――关联规则分析
8.1 基本概念
8.2 Apriori算法
8.2.1 Apriori算法工作步骤
8.2.2 Apriori算法的评估方法
8.2.3 Apriori节点
8.3 CARMA算法
8.3.1 CARMA算法的工作步骤
8.3.2 CARMA节点
8.4 序列算法
8.5 关联规则的评价
8.6 典型应用案例
第9章 我们还需要优化技术的帮忙
9.1 什么是优化技术
9.2 优化问题的分类
9.2.1 线性规划
9.2.2 整数规划
9.2.3 多目标规划
9.2.4 动态规划
9.3 IBM ILOG Optimization介绍
9.4 本章小结
第10章 有关方法论的问题
10.1 为什么我们要讨论方法论
10.2 CRI
10.2.1 CRISP-DM方法学
10.2.2 CRISP-DM参考模型
10.3 IBM SPSS
10.3.1 Repos
10.3.
10.3.3 Model Refresh and Champion Chall
10.3.4 Sc
10.4 模型的部署不是终点
第11章 一个时髦的领域――决策管理
11.1 决策管理系统
11.1.1 什么是决策
11.1.2 什么是决策管理系统
11.1.3 决策支持与决策管理的比较
11.2 构建决策管理系统
11.2.1 构建决策支持系统的原则
11.2.2 合适的决策
11.2.3 如何找到合适的决策
11.2.4 怎样在决策管理系统中定义决策
11.2.5 决策管理系统中的优化技术
11.2.6 决策影响的评估
11.2.7 监控决策
11.2.8 决策的持续改进
11.2.9 构建和部署决策服务
11.2.10 实施决策管理的一些要求
11.3 IB
11.3.1 ADM是SPSS数据分析能力的窗口
11.3.2 ADM的着眼点是将数据分析结果转化为决策
11.3.3 ADM是一个可以配置的决策服务平台
11.3.4 ADM的工作步骤
11.4 本章小结
后记 为未来做好准备
发现数据之美:数据分析原理与实践
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×