高等学校大数据技术与应用规划教材:Hadoop大数据分析

副标题:无

作   者:高永彬

分类号:

ISBN:9787113259198

微信扫一扫,移动浏览光盘

简介


本书从Hadoop的原理和使用出发,在重点介绍Hadoop生态系统的重要组件HDFS、MapReduce、YARN、Hive和Spark的同时,注重大数据分析能力的全面提高。本书共分13章,主要内容包括Hadoop简介、HDFS文件系统、YARN资源管理、MapReduce计算框架、Hive简介、Hive数据定义、Hive数据操作、Hive数据查询、Spark简介、Spark大数据处理、Spark机器学习流程、Spark有监督学习模型和Spark无监督学习模型。本书内容丰富、体系新颖、结构合理、文字精练,适合作为普通高等院校信息类专业Hadoop大数据分析课程的教材,也可以作为数据科学行业相关从业人员的自学教材。

目录


第1部分 Hadoop核心基础

第1章 Hadoop简介 2

1.1Hadoop产生背景 2

1.2Hadoop简要历史 3

1.3Hadoop生态系统组件 3

1.4Hadoop版本和商用支持 5

1.5Hadoop的基础环境配置 6

1.6Hadoop的安装 7

1.7Hadoop的配置 11

1.8Hadoop的运行 14

小结 19

习题 19

第2章 HDFS文件系统 20

2.1HDFS简介 20

2.2HDFS架构 20

2.3HDFS文件块 21

2.4HDFS常用操作 22

小结 24

习题 24

第3章 YARN资源管理 25

3.1YARN架构 25

3.2YARN调度策略 26

3.3YARN常用操作 28

小结 30

习题 31

第4章 MapReduce计算框架 32

4.1MapReduce原理 32

4.2MapReduce作业数据流 33

4.3Hadoop流处理 35

4.4MapReduce程序实现词频

统计 35

4.5MapReduce程序的Reducer

数量 40

4.6MapReduce程序的Combiner 41

4.7MapReduce程序实现数据

连接 43

小结 49

习题 49

第2部分 Hive数据仓库

第5章 Hive简介 52

5.1Hive概述 52

5.2Hive的安装 53

5.3Hive的运行 56

小结 59

习题 59

第6章 Hive数据定义 60

6.1 数据库操作 60

6.2 数据表基本操作 62

6.3 存储格式和行格式 65

6.4 数据类型 67

6.5 外部表 70

6.6 分区表 72

小结 74

习题 74

第7章 Hive数据操作 75

7.1 数据导入 75

7.2 数据插入 78

7.3 数据导出 82

小结 84

习题 84

第8章 Hive数据查询 85

8.1 基本查询 85

8.2 数据聚合 87

8.3 数据连接 90

小结 92

习题 93

第3部分 Spark数据分析

第9章 Spark简介 96

9.1Spark概述 96

9.2Spark原理 97

9.3Spark的安装 98

9.4Spark运行方式 99

9.5Spark运行位置 101

9.6Spark运行参数 104

小结 104

习题 104

第10章 Spark大数据处理 105

10.1数据框的创建 105

10.2数据框的选择 107

10.3数据框的运算和聚合 110

10.4数据框的增加、删除

和修改 114

10.5数据框的连接 116

10.6数据框的变形 119

小结 120

习题 120

第11章 Spark机器学习流程 121

11.1数据探索 122

11.2数据划分 123

11.3数据填充 124

11.4类别变量处理 125

11.5特征选择 128

11.6建模与调优 131

11.7测试与评估 133

小结 135

习题 135

第12章 Spark有监督学习模型 136

12.1线性回归模型 140

12.2逻辑回归模型 142

12.3决策树模型 145

12.4随机森林模型 152

12.5神经网络 158

12.6协同过滤 163

小结 166

习题 166

第13章 Spark无监督学习模型 167

13.1k均值聚类模型 168

13.2主成分分析模型 172

13.3关联分析模型 173

小结 176

习题 176


已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

高等学校大数据技术与应用规划教材:Hadoop大数据分析
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon