简介
本书以附录形式呈现大数据分析实验环境搭建、Hadoop组件参数配置,以及大数据分析相关学习资源。此外,我们还制作了配套PPT课件、案例、习题、试卷及答案等电子资源,以及实验所用完整数据,方便读者动手实践书中所讲解的实例。
本书适合于电子商务、信息管理与信息系统及相关专业的大学生和研究生学习,以及对大数据分析感兴趣和有志于从事数据分析工作的读者阅读使用。
目录
第1章 大数据概述1.1 大数据的背景1.2 大数据的基本概念1.3 大数据的来源及分类1.4 大数据分析的价值1.5 案例:上海联通大数据应用实践【本章小结】【关键术语】【复习思考题】第2章 大数据生态系统2.1.Hadoop生态系统2.2 Spark生态系统2.3 Hadoop和Spark的应用案例【本章小结】【关键术语】【复习思考题】第3章 大数据收集3.1 Flume3.2 Kafka3.3 Kafka和Flume的区别【本章小结】【关键术语】【复习思考题】第4章 大数据计算4.1 MapReduce4.2 Impala4.3 Stolln【本章小结】【关键术语】【复习思考题】第5章 大数据挖掘5.1 机器学习5.2 Mahout5.3 Weka5.4 R语言【本章小结】【关键术语】【复习思考题】第6章 大数据可视化6.1 Tableau6.2 ECharts6.3 大数据可视化应用实例【本章小结】【关键术语】【复习思考题】第7章 大规模搜索日志用户行为分析7.1 Linux环境下进行数据预处理7.2 基于Hive构建日志数据的数据仓库7.3 搜索日志数据分析【本章小结】【关键术语】【复习思考题】第8章 电子商务大数据推荐系统8.1 电子商务推荐系统8.2 数据预处理8.3 Mahout基于项目的推荐方法【本章小结】【关键术语】【复习思考题】附录附录1 Flume中组件的度量附录2 Linux系统下配置实验环境附录3 安装部署Hive附录4 Mahout实验环境配置及数据准备附录5 大数据分析学习资源参考文献
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问