高等学校大数据技术与应用规划教材:Hadoop大数据分析
作者: 高永彬
出版社:中国铁道出版社 2019年07月
简介:
本书从Hadoop的原理和使用出发,在重点介绍Hadoop生态系统的重要组件HDFS、MapReduce、YARN、Hive和Spark的同时,注重大数据分析能力的全面提高。本书共分13章,主要内容包括Hadoop简介、HDFS文件系统、YARN资源管理、MapReduce计算框架、Hive简介、Hive数据定义、Hive数据操作、Hive数据查询、Spark简介、Spark大数据处理、Spark机器学习流程、Spark有监督学习模型和Spark无监督学习模型。本书内容丰富、体系新颖、结构合理、文字精练,适合作为普通高等院校信息类专业Hadoop大数据分析课程的教材,也可以作为数据科学行业相关从业人员的自学教材。