Greenplum企业应用实战

副标题:无

作   者:何勇,陈晓峰 著

分类号:

ISBN:9787111481003

微信扫一扫,移动浏览光盘

简介

  全书一共15章,分为三个部分:基础篇(第1~3章)首先介绍了Greenplum的应用场景、功能特性以及与PostgreSQL的关系,然后讲解了Greenplum的安装配置、语法以及相关操作,最后通过两个具体的数据仓库ETL案例加强读者对Greenplum的功能特性的了解和操作能力;进阶篇(第4~7章)围绕数据字典、执行计划、系统架构、高级特性等主题对Greenplum进行了更深入地讲解,不仅能让读者更深入理解Greenplum的工作原理,也能让读者游刃有余地应对各种日常操作;管理篇(8~15章)从运维和管理的角度讲解了Greenplum的线上部署、数据库管理、脚本维护、监控、权限控制、容灾/扩容、备份恢复、性能调优、常用技巧和常见问题等。

目录

上篇  基础篇第1章  Greenplum简介1.1  Greenplum的起源和发展历程1.2  OLTP与OLAP1.3  PostgreSQL与Greenplum的关系1.3.1  PostgreSQL1.3.2  Greenplum1.4  Greenplum特性及应用场景1.4.1  Greenplum特性1.4.2  Greenplum应用场景1.5  小结第2章  Greenplum快速入门2.1  软件安装及数据库初始化2.1.1  Greenplum架构2.1.2  环境搭建2.1.3  Greenplum安装2.1.4  创建数据库2.1.5  数据库启动与关闭2.2  安装Greenplum的常见问题2.2.1  /etc/hosts配置错误2.2.2  MASTER_DATA_DIRECTORY设置错误2.3  畅游Greenplum2.3.1  如何访问Greenplum2.3.2  数据库整体概况2.3.3  基本语法介绍2.3.4  常用数据类型2.3.5  常用函数2.3.6  分析函数2.3.7  分区表2.3.8  外部表2.3.9  COPY命令2.4  小结第3章  Greenplum实战3.1  历史拉链表3.1.1  应用场景描述3.1.2  原理及步骤3.1.3  表结构3.1.4  Demo数据准备3.1.5  数据加载3.1.6  数据刷新3.1.7  分区裁剪3.1.8  数据导出3.2  日志分析3.2.1  应用场景描述3.2.2  数据Demo3.2.3  日志分析实战3.3  数据分布3.3.1  数据分散情况查看3.3.2  数据加载速度影响3.3.3  数据查询速度影响3.4  数据压缩3.4.1  数据加载速度影响3.4.2  数据查询速度影响3.5  索引3.6  小结中篇  进阶篇第4章  数据字典详解4.1  oid无处不在4.2  数据库集群信息4.2.1  Gp_configuration和gp_segment_configuration4.2.2  Gp_id4.2.3  Gp_configuration_history4.2.4  pg_filespace_entry4.2.5  集群配置信息表转化4.3  常用数据字典4.3.1  pg_class4.3.2  pg_attribute4.3.3  gp_distribution_policy4.3.4  pg_statistic和pg_stats4.4  分区表信息4.4.1  如何实现分区表4.4.2  pg_partition4.4.3  pg_partition_rule4.4.4  pg_partitions视图及其优化4.5  自定义类型以及类型转换4.6  主、备节点同步的相关数据字典4.7  数据字典应用示例4.7.1  获取表的字段信息4.7.2  获取表的分布键4.7.3  获取一个视图的定义4.7.4  查询comment(备注信息)4.7.5  获取数据库建表语句4.7.6  查询表上的视图4.7.7  查询表的数据文件创建时间4.7.8  分区表总大小4.7.9  如何分析数据字典变化4.7.10  获取数据库锁信息4.8  Gp_toolkit介绍4.9  小结第5章  执行计划详解5.1  执行计划入门5.1.1  什么是执行计划5.1.2  查看执行计划5.2  分布式执行计划概述5.2.1  架构5.2.2  重分布与广播5.2.3  Greenplum Master的工作5.3  Greenplum执行计划中的术语5.3.1  数据扫描方式5.3.2  分布式执行5.3.3  两种聚合方式5.3.4  关联5.3.5  SQL消耗5.3.6  其他术语5.4  数据库统计信息收集5.4.1  Analyze分析5.4.2  固定执行计划5.5  控制执行计划的参数介绍5.6  规划器开销的计算方法5.7  各种执行计划原理分析5.7.1  详解关联的广播与重分布5.7.2  HashAggregate与GroupAggregate5.7.3  Nestloop Join 、 Hash Join 与Merge Join5.7.4  分析函数:开窗函数和grouping sets5.8  案例5.8.1  关联键强制类型转换,导致重分布5.8.2  统计信息过期5.8.3  执行计划出错5.8.4  分布键选择不恰当5.8.5  计算distinct5.8.6  union与union all5.8.7  子查询not in5.8.8  聚合函数太多导致内存不足5.9  小结第6章  Greenplum高级应用6.1  Appendonly表与压缩表6.1.1  应用场景及语法介绍6.1.2  压缩表的性能差异6.1.3  Appendonly表特性6.1.4  相关数据字典6.2  列存储6.2.1  应用场景6.2.2  数据文件存储特性6.2.3  如何使用列存储6.2.4  性能比较6.3  外部表高级应用6.3.1  外部表实现原理6.3.2  可写外部表6.3.3  HDFS外部表6.3.4  可执行外部表6.4  自定义函数-各个编程接口6.4.1  pl/pgsql6.4.2  C语言接口6.4.3  plpython6.5  Greenplum MapReduce6.6  小结第7章  Greenplum架构介绍7.1  并行和分布式计算7.2  并行数据库7.3  Greenplum架构分析7.4  冗余与故障切换7.5  数据分布及负载均衡7.6  跨库关联7.7  分布式事务7.8  其他大数据分析方案7.9  小结下篇  管理篇第8章  Greenplum线上环境部署8.1  服务器硬件选型8.1.1  CPU8.1.2  内存8.1.3  磁盘及硬盘接口8.1.4  网络8.2  服务器系统参数调整8.2.1  Solaris参数修改8.2.2  Linux参数修改8.2.3  系统参数及性能验证8.3  计算节点分配技巧8.4  数据库参数介绍8.5  数据库集群基准测试8.6  小结第9章  数据库管理9.1  用户及权限管理9.1.1  Greenplum数据库逻辑结构9.1.2  Grant语法9.2  登录权限控制9.3  资源队列及并发控制9.4  Greenplum锁机制9.5  数据目录结构9.6  数据文件存储分布9.7  表空间管理9.8  小结第10章  数据库监控及调优10.1  Linux监控工具介绍10.1.1  监控磁盘10.1.2  监控网络10.1.3  监控CPU10.1.4  监控内存10.2  安装Performance Monitor10.3  监控Segment是否正常10.4  VACUUM系统表10.5  数据倾斜排查10.6  查看子节点的SQL运行状态10.7  自动加分区10.8  自动赋权10.9  清理过期数据10.10  小结第11章  解读Greenplum维护脚本11.1  添加Greenplum Contrib模块11.2  启动和关闭脚本gpstart和gpstop11.3  初始化系统脚本gpinitsystem11.4  集群操作脚本gpssh和gpscp11.5  数据库状态检查脚本gpstate11.6  数据库升级脚本gpmigrate11.7  参数修改脚本gpconfig11.8  数据库一致性检查脚本gpcheckcat11.9  小结第12章  备份及恢复策略12.1  Greenplum 3.x12.2  Greenplum 4.x12.3  gp_dump和pg_dump12.4  Greenplum Master备份策略12.4.1  增加Standby Master12.4.2  重新同步Standby Master12.4.3  启用Standby Master12.5  小结第13章  数据库扩容13.1  迁移计算节点13.1.1  两种备份方案13.1.2  数据迁移实战13.2  增加计算节点13.3  小结第14章  基于Greenplum的海量数据实时分析服务平台14.1  需求概述14.2  典型方案14.2.1  NoSQL14.2.2  分布式数据库/集群14.2.3  分表分库14.2.4  方案优劣分析14.3  基于Greenplum的混合架构14.3.1  架构分析14.3.2  实施要点14.4  小结第15章  使用Greenplum的常见报错及小技巧15.1  分析常见报错15.2  常见问题及解决办法15.3  常用的一些小技巧15.4  小结 

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

Greenplum企业应用实战
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon