微软大数据解决方案 大数据应用与技术丛书

副标题:无

作   者:(美)约根森 等著,王翔,杨道文 译

分类号:

ISBN:9787302396529

微信扫一扫,移动浏览光盘

简介

  Microsoft强大的大数据平台Windows Azure HDInsight和Hortonworks Data Platform for Windows改变了企业处理、存储和管理数据的方式。Microsoft的大数据解决方案套件被设计用于与公司现有的数据基础设施以及SQL Server、Hadoop等产品进行无缝集成,使客户不必中断工作流或关键流程即可实施这些方案。假如需要设计和实施全面部署的大数据解决方案的详明规划蓝图,《微软大数据解决方案》一书无疑是最 佳选择。  主要内容  使用Windows Azure HDInsight、Hortonworks Data Platform for Windows和开源工具将大数据解决方案集成到企业中  在企业内部存储、管理、分析和共享大数据  安装和配置Hortonworks Data Platform for Windows  学习大数据与SQL Server及Hadoop的整合  使用Microsoft和Hadoop BI工具呈现数据  为企业创建和执行综合性大数据战略  直接获取Microsoft大数据产品团队的最前沿研究成果

目录

第Ⅰ部分 大数据的含义
第1章 行业需求与解决方案
1.1 何谓"大"数据
1.2 Hadoop简史
1.2.1 Google
1.2.2 Nutch
1.3 Hadoop的概念
1.3.1 衍生品和分发版
1.3.2 Hadoop分发版
1.3.3 Hadoop生态系统的核心
1.3.4 Hadoop中的重要Apache项目
1.3.5 Hadoop的未来
1.4 本章小结
第2章 Microsoft大数据解决方法
2.1 "优质组合"的故事
2.2 生态系统中的竞争
2.2.1 SQL on Hadoop现状
2.2.2 Hortonworks和Stinger
2.2.3 Cloudera和Impala
2.2.4 Microsoft对Hadoop中SQL应用的贡献
2.3 Hadoop的部署
2.3.1 部署要素
2.3.2 部署拓扑结构
2.3.3 部署计分卡
2.4 本章小结


第Ⅱ部分 使用Microsoft建立大数据
第3章 配置首个大数据环境
3.1 入门
3.2 开始安装
3.3 安装过程
3.3.1 本地安装:单节点安装
3.3.2 HDInsight服务:云端安装
3.3.3 Windows Azure存储管理器选项
3.4 验证新集群
3.4.1 登录HDInsight服务
3.4.2 通过日志验证HDP功能
3.5 常见的安装后任务
3.5.1 加载首个文件
3.5.2 验证Hive和Pig
3.6 本章小结


第Ⅲ部分 存储并管理大数据
第4章 HDFS、Hive、HBase和HCatalog
4.1 探讨HDFS
4.1.1 HDFS体系结构阐述
4.1.2 与HDFS交互
4.2 探讨Hive:Hadoop数据仓库平台
4.2.1 设计、构建和加载表
4.2.2 查询数据
4.2.3 配置Hive ODBC驱动程序
4.3 探讨HCatalog:HDFS表和元数据管理
4.4 探索HBase:面向列的HDFS数据库
4.4.1 面向列的数据库
4.4.2 定义和填充HBase表
4.4.3 使用查询操作
4.5 本章小结
第5章 HDFS的数据存储与管理
5.1 了解HDFS基本原理
5.1.1 HDFS体系结构
5.1.2 名称节点和数据节点
5.1.3 数据复制
5.2 使用常用命令与HDFS进行交互
5.2.1 使用HDFS的界面
5.2.2 文件处理命令
5.2.3 HDFS的管理功能
5.3 在HDFS中移动和组织数据
5.3.1 在HDFS中移动数据
5.3.2 实现便于管理的数据结构
5.3.3 重新平衡数据
5.4 本章小结
第6章 添加Hive结构
6.1 理解Hive的作用和角色
6.1.1 为非结构化数据提供结构
6.1.2 启用数据访问与转换
6.1.3 鉴别Hive与传统RDBMS系统
6.1.4 使用Hive
6.2 创建和查询基本表
6.2.1 创建数据库
6.2.2 创建表
6.2.3 添加和删除数据
6.2.4 查询表
6.3 使用Hive的高级数据结构
6.3.1 设置分区表
6.3.2 加载分区表
6.3.3 使用视图
6.3.4 创建表索引
6.4 本章小结
第7章 使用HBase和HCatalog来扩展功能
7.1 使用HBase
7.1.1 创建HBase表
7.1.2 将数据加载到HBase表
7.1.3 执行快速查找
7.1.4 加载和查询HBase
7.2 使用HCatalog管理数据
7.2.1 使用HCatalog和Hive
7.2.2 定义数据结构
7.2.3 建立索引
7.3 创建分区
7.4 HCatalog与Pig和Hive的集成
7.5 使用HBase或Hive作为数据仓库
7.6 本章小结


第Ⅳ部分 使用大数据
第8章 使用SSIS、Pig和Sqoop
进行有效的大数据ETL
8.1 结合大数据与SQL Server工具获取更优解决方案
8.1.1 为何要移动数据
8.1.2 在Hadoop和SQL Server之间移动数据
8.2 使用SSIS和Hive
8.3 配置包
8.3.1 将数据加载到Hadoop
8.3.2 从SSIS获得最 佳性能
8.4 使用Sqoop转移数据
8.4.1 从SQL Server复制数据
8.4.2 将数据复制到SQL Server
8.5 使用Pig移动数据
8.5.1 使用Pig转换数据
8.5.2 同时使用Pig和SSIS
8.6 选择正确的工具
8.6.1 何时使用SSIS
8.6.2 何时使用Pig
8.6.3 何时使用Sqoop
8.7 本章小结
第9章 使用Pig和Hive进行数据研究和高级数据清理
9.1 了解Pig
9.1.1 使用Pig的时机
9.1.2 利用内置函数
9.1.3 执行用户自定义函数
9.1.4 使用UDF
9.1.5 为Pig创建专属UDF
9.2 使用Hive
9.2.1 使用Hive进行数据分析
9.2.2 Hive函数类型
9.2.3 使用map-reduce脚本扩展Hive
9.2.4 创建自定义map-reduce脚本
9.2.5 为Hive创建专属UFD
9.3 本章小结


第Ⅴ部分 大数据与SQL Server的整合
第10章 数据仓库与Hadoop整合
10.1 行业状况
10.2 传统数据仓库架构面临的挑战
10.2.1 技术制约
10.2.2 业务挑战
10.3 Hadoop在数据仓库市场上的影响
10.3.1 保持一切
10.3.2 代码优先(模式延后)
10.3.3 塑造价值
10.3.4 计算问题
10.4 介绍并行数据仓库
10.4.1 何谓PDW
10.4.2 PDW为什么重要
10.4.3 PDW的工作方式
10.5 Polybase项目
10.5.1 Polybase架构
10.5.2 当今Polybase的商业案例
10.5.3 预测Polybase的未来
10.6 本章小结
第11章 使用Windows BI呈现大数据
11.1 工具生态系统
11.1.1 Excel
11.1.2 PowerPivot
11.1.3 Power View
11.1.4 Power Map
11.1.5 报表服务
11.2 使用PowerPivot的自助式大数据
11.2.1 设置ODBC驱动程序
11.2.2 加载数据
11.2.3 更新模型
11.2.4 添加度量标准
11.2.5 创建数据透视表
11.3 使用Power View加速大数据探索
11.4 使用Power Map的快速空间探索
11.5 本章小结
第12章 大数据分析
12.1 数据科学、数据挖掘与预测分析
12.1.1 数据挖掘
12.1.2 预测分析
12.2 Mahout介绍
12.3 构建一个推荐引擎
12.3.1 开始
12.3.2 运行用户到用户推荐作业
12.3.3 运行项目到项目推荐作业
12.4 本章小结
第13章 大数据与云
13.1 定义云
13.2 探索大数据云提供商
13.2.1 Amazon
13.2.2 Microsoft
13.3 在云端设置大数据沙盒
13.3.1 开始使用Amazon EMR
13.3.2 开始使用HDInsight
13.4 在云端存储数据
13.4.1 存储数据
13.4.2 上传数据
13.4.3 探索大数据存储工具
13.4.4 整合云端数据
13.4.5 其他云端数据源
13.5 本章小结
第14章 现实生活中的大数据
14.1 常见行业分析
14.1.1 电信
14.1.2 能源
14.1.3 零售
14.1.4 数据服务
14.1.5 IT/托管优化
14.1.6 市场社会情绪
14.2 运营分析
14.2.1 快速失败
14.2.2 一个新的技术生态系统
14.2.3 用户受众
14.3 本章小结


第Ⅵ部分 继续向前发展大数据
第15章 创建和执行大数据计划
15.1 获得赞助方和利益相关方的认同
15.1.1 问题定义
15.1.2 范围管理
15.1.3 利益相关方的期望
15.1.4 定义成功的标准
15.2 确定技术上的挑战
15.2.1 环境的挑战
15.2.2 技能的挑战
15.3 确定运营上的挑战
15.3.1 制定设置/配置计划
15.3.2 制定运行维护计划
15.4 更进一步
15.4.1 交付到运营
15.4.2 部署之后
15.5 本章小结
第16章 运营的大数据管理
16.1 混合型大数据环境:云端与本地解决方案协同工作
16.2 使用云计算和本地解决方案的动态数据集成
16.3 大数据的集成思想
16.4 大数据环境中的备份和高可用性
16.4.1 高可用性
16.4.2 灾难恢复
16.5 大数据解决方案的管理
16.6 创建运营分析
16.6.1 HDP系统中心运营管理器
16.6.2 安装Ambari SCOM管理软件包
16.6.3 使用Ambari SCOM管理软件包进行监控
16.7 本章小结

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

微软大数据解决方案 大数据应用与技术丛书
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon