SPSS Modeler+Weka数据挖掘从入门到实战

副标题:无

作   者:经管之家

分类号:

ISBN:9787121319112

微信扫一扫,移动浏览光盘

简介


内 容 简 介本书是一本面向商业数据挖掘建模分析人员的教材,从具体的商业数据分析案例入手,帮助读者掌握数据挖掘的目的、方法、工具与分析步骤。本书所采用的分析工具为目前颇受好评的IBM SPSS Modeler及开源软件Weka。IBM SPSS Modeler有很好的用户接口,也有不错的分析功能,但缺乏比较前沿的分析模块,以及很难与现有的信息系统结合,而Weka恰能弥补其缺憾。同时,这两个软件都不需要编程,适合初学者。本书具体内容由四位活跃在数据挖掘教学和项目开发一线的人员完成,内容侧重软件的实际操作。力图将复杂的技术以浅显的方式进行解释,尽量避免涉及过多的数学内容。

目录


第1 篇 理论篇
第1 章 数据挖掘简介 ................................................................................... 1
1.1 数据挖掘的起源、定义及目标 ....................................................................................... 2
1.2 数据挖掘的发展历程 ....................................................................................................... 2
1.3 SPSS Modeler 和Weka 基础操作 .................................................................................... 4
1.3.1 SPSS Modeler 软件简介 ....................................................................................... 4
1.3.2 建立一个SPSS Modeler 项目 .............................................................................. 5
1.3.3 Weka 软件环境简介 ............................................................................................. 8
1.3.4 Weka 简单操作实例 ............................................................................................. 9

第2 章 数据挖掘方法论 .............................................................................. 15
2.1 数据挖掘方法论 ............................................................................................................. 16
2.1.1 CRISP-DM .......................................................................................................... 16
2.1.2 SEMMA .............................................................................................................. 16
2.2 数据库中的知识挖掘步骤 ............................................................................................. 17
2.2.1 字段选择 ............................................................................................................. 17
2.2.2 数据清洗 ............................................................................................................. 18
2.2.3 字段扩充 ............................................................................................................. 18
2.2.4 数据编码 ............................................................................................................. 19
2.2.5 数据挖掘 ............................................................................................................. 20
2.2.6 结果呈现 ............................................................................................................. 21
2.3 案例:运用SPSS Modeler 和Weka 做客户的信用风险评分模型 ............................. 22
2.3.1 案例说明 ............................................................................................................. 22
2.3.2 案例实操 ............................................................................................................. 23
2.3.3 运用SPSS Modeler 进行初步的数据挖掘 ........................................................ 28
2.3.4 运用Weka 进行数据汇入 .................................................................................. 34
2.3.5 Weka 自有数据存储格式arff 简介 ................................................................... 36

第3 章 基本的数据挖掘技术 ...................................................................... 38
3.1 描述性统计 ..................................................................................................................... 39
3.1.1 案例:通过数据判断客户是否需要新增电话线路 ......................................... 39
3.1.2 案例:运用描述性统计分析杂志社的客户特征 ............................................. 40
3.2 可视化技术 ..................................................................................................................... 42
3.3 KNN 原理及实例 ........................................................................................................... 44
3.3.1 KNN(K *近邻)算法 ..................................................................................... 44
3.3.2 使用KNN 算法计算距离 .................................................................................. 45
3.3.3 案例:使用KNN 算法向用户推荐电影 ........................................................... 49
3.4 案例:运用Weka 的KNN 算法对诊断结果进行预测 ..................................................... 52
3.4.1 案例说明 ............................................................................................................. 52
3.4.2 运用Weka 中的IBk 模型进行预测 .................................................................. 53
3.5 案例:运用SPSS Modeler 的KNN 算法预测客户是否接受人寿保险推销 ............. 58
3.5.1 案例说明 ............................................................................................................. 58
3.5.2 案例实操 ............................................................................................................. 59

第4 章 数据挖掘进阶技术 .......................................................................... 68
4.1 数据挖掘的功能分类 ..................................................................................................... 69
4.1.1 描述型数据挖掘(无监督数据挖掘) ............................................................. 69
4.1.2 预测型数据挖掘(有监督数据挖掘) ............................................................. 70
4.2 数据挖掘的绩效增益 ..................................................................................................... 72
4.2.1 数据挖掘模型评估指标:正确率、响应率、查全率、F 值 .......................... 72
4.2.2 数据挖掘模型评估指标:Gain Chart ................................................................ 74
4.2.3 数据挖掘模型评估指标:Lift Chart ................................................................. 75
4.2.4 数据挖掘模型评估指标:Profit Chart .............................................................. 76
4.3 数据挖掘网站 ................................................................................................................. 77
4.3.1 KDnuggets ........................................................................................................... 77
4.3.2 Kaggle ................................................................................................................. 80
4.4 案例:评估新产品的促销活动效果 ............................................................................. 82
4.4.1 案例说明 ............................................................................................................. 83
4.4.2 数据及字段描述 ................................................................................................. 83
4.4.3 效能评估方式 ..................................................................................................... 85
4.4.4 比赛结果排名 ..................................................................................................... 85

第2 篇 准备篇
第5 章 数据预处理 ..................................................................................... 87
5.1 字段选择 ......................................................................................................................... 88
5.1.1 数据整合 ............................................................................................................. 88
5.1.2 数据过滤 ............................................................................................................. 88
5.1.3 案例:运用SPSS Modeler 过滤数据 ................................................................ 89
5.2 数据清洗 ......................................................................................................................... 92
5.2.1 错误值的检测及处理 ......................................................................................... 92
5.2.2 案例:运用SPSS Modeler 进行错误值的检测及处理 .................................... 92
5.2.3 离群值的检测及处理 ......................................................................................... 96
5

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

SPSS Modeler+Weka数据挖掘从入门到实战
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon