大数据Hadoop 3.X分布式处理实战 Hadoop教程书籍大数据处理宝典分析指南 hive编程

副标题：无

作者：吴章勇,杨强

分类号：

ISBN：9787115524669

收录收藏 (0) 评论纠错

微信扫一扫,移动浏览光盘

简介

简介

本书以实战开发为原则，以Hadoop 3.X生态系统内的主要大数据工具整合应用及项目开发为主线，通过Hadoop大数据开发中常见的11个典型模块和3个完整项目案例，详细介绍HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大数据工具的整合使用。本书附带资源包括本书核心内容的教学视频，本书所涉及的源代码、参考资料等。全书共14章，分为3篇，涵盖的主要内容有Hadoop及其生态组件伪分布式安装和完全分布式安装、分布式文件系统HDFS、分布式计算框架MapReduce、NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark、海量Web日志分析系统、电商商品推荐系统、分布式垃圾消息识别系统等。本书内容丰富、案例典型、实用性强，适合各个层次希望学习大数据开发技术的人员阅读，尤其适合有一定Java 基础而要进行Hadoop应用开发的人员阅读。

第一篇　Hadoop技术　1

第 1章　大数据与Hadoop概述　03

1.1　大数据概述　03

1.1.1　大数据的定义　03

1.1.2　大数据行业的发展　04

1.1.3　大数据的典型应用　04

1.2　Hadoop概述　06

大数据Hadoop 3.X分布式处理实战 Hadoop教程书籍大数据处理宝典分析指南 hive编程

已确认勘误

第次印刷

大数据Hadoop 3.X分布式处理实战 Hadoop教程书籍 大数据处理宝典分析指南 hive编程

已确认勘误

第次印刷 筛选

大数据Hadoop 3.X分布式处理实战 Hadoop教程书籍大数据处理宝典分析指南 hive编程

第次印刷