微信扫一扫,移动浏览光盘
简介
这是公认的、权威的适合教学和零基础自学的R语言与数据挖掘教程,华南师范大学、广东工业大学、广西科技大学等20余所大学选为教材。即便你完全没有R语言编程基础和数据挖掘基础,根据本书中的理论知识和上机实践,你也能迅速掌握如何使用R语言进行数据挖掘。本书已经被多少高校预定为教材,为了便于教学,书中还提供了大量的上机实验和教学资源。本书主要分为三个部分:基础篇(1~5章),主要包括R语言及图形操作工具RStudio的安装及使用方法、数据类型和数据对象、数据预处理的常用操作(包括数据重命名、缺失值分析、排序、随机抽样等)、绘图功能(包括散点图、直方图、条形图、箱线图等)。建模应用篇(6~10章),主要对数据挖掘中的常用算法的函数在R语言中的使用方法及其结果解释进行了介绍。涵盖了目前数据挖掘的5大类算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式。按照模型建立至模型评价的架构进行介绍,使读者能熟练的掌握从建模到对模型评价的完整建模过程。Rattle篇(11章),此工具能够在一个图形化的界面上对本书所介绍的R语言功能进行操作,使读者能更好的体验到使用R语言进行数据挖掘的整个流程。书中配套提供了原始样本数据文件及对应章节示例代码。每个章节有对应的练习实验和教学PPT,读者可通过完成对应的练习,迅速掌握R语言的用法和数据挖掘的方法。
目录
前 言
第一部分 基础篇
第1章 R语言的安装与使用 2
1.1 R安装与升级 3
1.2 R使用入门 4
1.2.1 R操作界面 4
1.2.2 RStudio窗口介绍 5
1.2.3 R常用操作 6
1.3 R数据分析包 8
1.4 配套资源使用说明 10
1.5 小结 10
1.6 上机实验 10
第2章 数据对象与数据读写 12
2.1 数据类型 12
2.2 数据结构 16
2.2.1 向量 16
2.2.2 矩阵 19
2.2.3 数组 24
2.2.4 数据框 25
2.2.5 因子 28
2.2.6 列表 31
2.3 数据文件的读写 34
2.3.1 键盘输入数据 34
2.3.2 读取不同格式的数据 35
2.3.3 从其他统计软件获取数据 37
2.3.4 从数据库获取数据 37
2.3.5 从网页获取数据 39
2.4 小结 40
2.5 上机实验 40
第3章 R语言常用数据管理 42
3.1 变量的重命名 42
3.2 缺失值分析 45
3.3 数据排序 46
3.4 随机抽样 48
3.5 数值运算函数 49
3.6 字符串处理 52
3.7 文本分词 56
3.8 apply函数族 62
3.9 数据整合 65
3.10 控制流 68
3.11 函数的编写 71
3.12 小结 72
3.13 上机实验 73
第4章 图形探索 75
4.1 图形元素 76
4.1.1 颜色 76
4.1.2 点 80
4.1.3 文本 82
4.1.4 线条 86
4.1.5 图例 91
4.1.6 坐标轴 92
4.2 图形组合 94
4.3 图形保存 97
4.4 图形函数 98
4.5 小结 116
4.6 上机实验 116
第5章 高级绘图工具 117
5.1 lattice包绘图工具 117
5.1.1 绘图特色 117
5.1.2 基本图形 122
5.2 ggplot2包绘图工具 135
5.2.1 从qplot开始 135
5.2.2 ggplot作图 137
5.3 交互式绘图工具简介 142
5.3.1 rCharts包 143
5.3.2 recharts包 147
5.3.3 googleVis包 147
5.3.4 htmlwidgets包 148
5.3.5 shiny包 153
5.4 小结 163
5.5 上机实验 163
第二部分 建模应用篇
第6章 分类与预测 166
6.1 回归分析 166
6.2 决策树 175
6.2.1 C4.5算法 176
6.2.2 CART算法 178
6.2.3 C5.0算法 180
6.3 人工神经网络 181
6.4 KNN算法 183
6.5 朴素贝叶斯分类 185
6.6 其他分类与预测算法函数 187
6.7 分类与预测算法评价 192
6.8 小结 196
6.9 上机实验 196
第7章 聚类分析 198
7.1 K-Means聚类分析函数 199
7.2 层次聚类算法 204
7.3 其他聚类分析函数 207
7.4 小结 211
7.5 上机实验 212
第8章 关联规则 213
8.1 Apriori关联规则 214
8.2 小结 226
8.3 上机实验 226
第9章 智能推荐 228
9.1 智能推荐模型构建 228
9.2 智能推荐模型评价 232
9.3 小结 235
9.4 上机实验 235
第10章 时间序列 237
10.1 ARIMA模型 237
10.2 其他时间序列模型 245
10.3 小结 250
10.4 上机实验 251
第三部分 Rattle篇
第11章 可视化数据挖掘工具Rattle 254
11.1 Rattle简介及其安装 254
11.1.1 Rattle简介 254
11.1.2 Rattle安装 254
11.2 功能预览 255
11.3 数据导入 256
11.3.1 导入CSV数据 256
11.3.2 导入ARFF数据 261
11.3.3 导入ODBC数据 262
11.3.4 R Dataset——导入其他数据源 264
11.3.5 导入RData File数据集 267
11.3.6 导入Library数据 268
11.4 数据探索 269
11.4.1 数据总体概况 269
11.4.2 数据分布探索 272
11.4.3 相关性 275
11.4.4 主成分 277
11.4.5 交互图 278
11.5 数据建模 283
11.5.1 聚类分析 283
11.5.2 关联规则 288
11.5.3 决策树 291
11.5.4 随机森林 293
11.6 模型评估 296
11.6.1 混淆矩阵 296
11.6.2 风险图 296
11.6.3 ROC图及相关图表 297
11.6.4 模型得分数据集 298
11.7 小结 299
11.8 上机实验 299
参考资料 301
第一部分 基础篇
第1章 R语言的安装与使用 2
1.1 R安装与升级 3
1.2 R使用入门 4
1.2.1 R操作界面 4
1.2.2 RStudio窗口介绍 5
1.2.3 R常用操作 6
1.3 R数据分析包 8
1.4 配套资源使用说明 10
1.5 小结 10
1.6 上机实验 10
第2章 数据对象与数据读写 12
2.1 数据类型 12
2.2 数据结构 16
2.2.1 向量 16
2.2.2 矩阵 19
2.2.3 数组 24
2.2.4 数据框 25
2.2.5 因子 28
2.2.6 列表 31
2.3 数据文件的读写 34
2.3.1 键盘输入数据 34
2.3.2 读取不同格式的数据 35
2.3.3 从其他统计软件获取数据 37
2.3.4 从数据库获取数据 37
2.3.5 从网页获取数据 39
2.4 小结 40
2.5 上机实验 40
第3章 R语言常用数据管理 42
3.1 变量的重命名 42
3.2 缺失值分析 45
3.3 数据排序 46
3.4 随机抽样 48
3.5 数值运算函数 49
3.6 字符串处理 52
3.7 文本分词 56
3.8 apply函数族 62
3.9 数据整合 65
3.10 控制流 68
3.11 函数的编写 71
3.12 小结 72
3.13 上机实验 73
第4章 图形探索 75
4.1 图形元素 76
4.1.1 颜色 76
4.1.2 点 80
4.1.3 文本 82
4.1.4 线条 86
4.1.5 图例 91
4.1.6 坐标轴 92
4.2 图形组合 94
4.3 图形保存 97
4.4 图形函数 98
4.5 小结 116
4.6 上机实验 116
第5章 高级绘图工具 117
5.1 lattice包绘图工具 117
5.1.1 绘图特色 117
5.1.2 基本图形 122
5.2 ggplot2包绘图工具 135
5.2.1 从qplot开始 135
5.2.2 ggplot作图 137
5.3 交互式绘图工具简介 142
5.3.1 rCharts包 143
5.3.2 recharts包 147
5.3.3 googleVis包 147
5.3.4 htmlwidgets包 148
5.3.5 shiny包 153
5.4 小结 163
5.5 上机实验 163
第二部分 建模应用篇
第6章 分类与预测 166
6.1 回归分析 166
6.2 决策树 175
6.2.1 C4.5算法 176
6.2.2 CART算法 178
6.2.3 C5.0算法 180
6.3 人工神经网络 181
6.4 KNN算法 183
6.5 朴素贝叶斯分类 185
6.6 其他分类与预测算法函数 187
6.7 分类与预测算法评价 192
6.8 小结 196
6.9 上机实验 196
第7章 聚类分析 198
7.1 K-Means聚类分析函数 199
7.2 层次聚类算法 204
7.3 其他聚类分析函数 207
7.4 小结 211
7.5 上机实验 212
第8章 关联规则 213
8.1 Apriori关联规则 214
8.2 小结 226
8.3 上机实验 226
第9章 智能推荐 228
9.1 智能推荐模型构建 228
9.2 智能推荐模型评价 232
9.3 小结 235
9.4 上机实验 235
第10章 时间序列 237
10.1 ARIMA模型 237
10.2 其他时间序列模型 245
10.3 小结 250
10.4 上机实验 251
第三部分 Rattle篇
第11章 可视化数据挖掘工具Rattle 254
11.1 Rattle简介及其安装 254
11.1.1 Rattle简介 254
11.1.2 Rattle安装 254
11.2 功能预览 255
11.3 数据导入 256
11.3.1 导入CSV数据 256
11.3.2 导入ARFF数据 261
11.3.3 导入ODBC数据 262
11.3.4 R Dataset——导入其他数据源 264
11.3.5 导入RData File数据集 267
11.3.6 导入Library数据 268
11.4 数据探索 269
11.4.1 数据总体概况 269
11.4.2 数据分布探索 272
11.4.3 相关性 275
11.4.4 主成分 277
11.4.5 交互图 278
11.5 数据建模 283
11.5.1 聚类分析 283
11.5.2 关联规则 288
11.5.3 决策树 291
11.5.4 随机森林 293
11.6 模型评估 296
11.6.1 混淆矩阵 296
11.6.2 风险图 296
11.6.3 ROC图及相关图表 297
11.6.4 模型得分数据集 298
11.7 小结 299
11.8 上机实验 299
参考资料 301
R语言与数据挖掘
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×