从零开始学Hadoop大数据分析
作者: 温春水
出版社:机械工业出版社 2019年03月
简介:
资深专家12年一线开发经验总结,业内7位大咖点评力荐
采用“理论讲解→环境搭建→项目案例实战”的科学编排体系
赠送20小时(118段)高质量、高价值大数据核心技术配套教学视频
全面涵盖Hadoop的14个基础组件:HDFS、ZooKeeper 、MapReduce、YARN、Hive、HBase、Flume、Sqoop、Kafka、Redis、Spark及Mahout等
详解30个中小案例及4个项目实战案例,提高读者的实际动手能力
赠送教学PPT,方便教学与学习
7位重量级大咖力荐:
见知集团董事长 张之戈
中软国际CTO 徐建民
慧科集团研究院院长 陈滢
微软高级架构师 韩亮
51CTO学院总监 张宝龙
CDA数据分析师协会理事 赵坚毅
大唐网络副总裁 张文杰
本书内容速览:
Hadoop基础知识
初识Hadoop
Hadoop的安装与配置
Hadoop分布式文件系统
基于Hadoop 3的HDFS高可用
Hadoop核心技术
Hadoop的分布式协调服务——ZooKeeper
分布式离线计算框架——MapReduce
Hadoop的集群资源管理系统——YARN
Hadoop的数据仓库框架——Hive
大数据快速读写——HBase
海量日志采集工具——Flume
Hadoop和关系型数据库间的数据传输工具——Sqoop
分布式消息队列——Kafka
开源的内存数据库——Redis
Ambari和CDH
快速且通用的集群计算系统——Spark
Hadoop项目案例实战
基于电商产品的大数据业务分析系统实战
用户画像分析实战
基于个性化的视频推荐系统实战
电信离网用户挽留实战
本书超值配套资源:
20小时配套教学视频
案例源代码文件
教学PPT
本书4大实战案例
基于电商产品的大数据业务分析系统实战
用户画像分析实战
基于个性化的视频推荐系统实战
电信离网用户挽留实战
本书全面介绍了Hadoop大数据分析的基础知识、14个核心组件模块及4个项目实战案例。为了帮助读者高效、直观地学习,作者特意为本书录制了20小时同步配套教学视频。
本书共19章,分为3篇。第1篇Hadoop基础知识,涵盖大数据概述、Hadoop的安装与配置、Hadoop分布式文件系统及基于Hadoop 3的HDFS高可用等相关内容;第2篇Hadoop核心技术,涵盖的内容有Hadoop的分布式协调服务——ZooKeeper;分布式离线计算框架——MapReduce;Hadoop的集群资源管理系统——YARN;Hadoop的数据仓库框架——Hive;大数据快速读写——HBase;海量日志采集工具——Flume;Hadoop和关系型数据库间的数据传输工具——Sqoop;分布式消息队列——Kafka;开源内存数据库——Redis;Ambari和CDH;快速且通用的集群计算系统——Spark。第3篇Hadoop项目案例实战,主要介绍了基于电商产品的大数据业务分析系统、用户画像分析、基于个性化的视频推荐系统及电信离网用户挽留4个项目实战案例,以提高读者的大数据项目开发水平。
本书内容全面,实用性强,适合作为Hadoop大数据分析与挖掘的入门读物,也可作为Java程序员的进阶读物。另外,本书还特别适合想要提高大数据项目开发水平的人员阅读。对于专业的培训机构和相关院校而言,本书也是一本不可多得的教学用书。