简介
本书从大数据生命周期的角度阐述大数据技术体系与开源生态的发展。全书分为7篇,包括大数据技术体系与开源生态概述、大数据获取技术、大数据管理技术、大数据处理技术、大数据分析与挖掘技术、大数据可视化与交互技术、大数据安全与治理技术。又分为15章,详细介绍大数据的技术概况、发展近况和技术优势、软件架构、和应用场景等内容。本书适合大数据和人工智能业内人员、各大高校相关专业的高年级本科生和研究生、以及对大数据应用中各类框架组件的爱好者阅读。
目录
目录:
第 一篇 大数据技术体系与开源生态概述
第 1章 大数据技术体系概述 3
1.1 大数据技术的主要内容 3
1.2 大数据开源框架 4
1.2.1 大数据获取技术 4
1.2.2 大数据管理技术 5
1.2.3 大数据处理技术 5
1.2.4 大数据安全与治理技术 5
1.2.5 大数据分析与挖掘技术 6
1.2.6 大数据可视化技术 6
1.3 本章小结 7
第 2章 开源生态与代码托管平台简介 8
2.1 开源和开源软件的简介 8
2.1.1 开源的简介 8
2.1.2 开源软件的简介 8
2.2 开源代码托管平台——GitHub 9
2.3 本章小结 10
第3章 大数据开源生态的介绍 11
3. 1 Apache软件基金会 11
3.1.1 发展历史 11
3.1.2 主要参与者 12
3.1.3 开源项目 13
3.2 Linux 基金会 14
3.2.1 发展历史 15
3.2.2 主要参与者 15
3.2.3 开源项目 17
3.3 开源中国 18
3.3.1 发展历史 18
3.3.2 主要参与者 19
3.4 本章小结 19
第4章 云计算开源生态的介绍 20
4.1 OpenStack 基金会 20
4.1.1 发展历史 21
4.1.2 主要参与者 21
4.1.3 开源项目 22
4.2 Cloud Native Computing Foundation 23
4.2.1 发展历史 23
4.2.2 主要参与者 23
4.2.3 开源项目 25
4.3 本章小结 25
第二篇 大数据获取技术
第5章 消息队列相关技术 29
5.1 ZeroMQ 29
5.1.1 技术概况 29
5.1.2 发展近况和技术优势 30
5.1.3 软件架构 31
5.1.4 应用场景 33
5.2 RabbitMQ 34
5.2.1 技术概况 34
5.2.2 发展近况和技术优势 35
5.2.3 软件架构 36
5.2.4 应用场景 38
5.3 Active MQ 40
5.3.1 技术概况 40
5.3.2 发展近况和技术优势 40
5.3.3 软件架构 42
5.3.4 应用场景 43
5.4 Apache Kafka 44
5.4.1 技术概况 44
5.4.2 发展近况和技术优势 45
5.4.3 软件架构 46
5.4.4 应用场景 47
5.5 本章小结 50
第三篇 大数据管理技术
第6章 数据库相关技术 53
6.1 传统关系型数据库 53
6.1.1 MySQL 53
6.1.2 PostgreSQL 60
6.2 文档型数据库 65
6.2.1 MongoDB 65
6.2.2 Apache CouchDB 69
6.3 列存储数据库 73
6.3.1 Vertica 73
6.3.2 Apache HBase 76
6.4 键/值对型数据库 80
6.4.1 Redis 80
6.4.2 Riak 82
6.5 图形数据库 85
6.5.1 Neo4j 85
6.5.2 OrientDB 90
6.5.3 InfiniteGraph 93
6.6 基于内存的分布式文件系统之Alluxio 95
6.6.1 技术概况 95
6.6.2 发展近况和技术优势 96
6.6.3 软件架构 97
6.6.4 应用场景 98
6.7 数据仓库系统之ApacheTajo 99
6.7.1 技术概况 99
6.7.2 发展近况和技术优势 100
6.7.3 软件架构 101
6.7.4 应用场景 103
6.8 本章小结 105
第7章 大数据平台资源管理技术 106
7.1 Apache ZooKeeper 106
7.1.1 技术概况 106
7.1.2 发展近况和技术优势 107
7.1.3 软件架构 108
7.1.4 应用场景 110
7.2 Apache Hadoop YARN 111
7.2.1 技术概况 111
7.2.2 发展近况和技术优势 112
7.2.3 软件架构 113
7.2.4 应用场景 116
7.3 Apache Mesos 119
7.3.1 技术概况 119
7.3.2 发展近况和技术优势 120
7.3.3 软件架构 120
7.3.4 应用场景 122
7.4 Apache Mnemonic 123
7.4.1 技术概况 123
7.4.2 发展近况和技术优势 124
7.5 本章小结 125
第四篇 大数据处理技术
第8章 开源批处理平台 129
8.1 Apache Hadoop 129
8.1.1 技术概况 129
8.1.2 发展近况和技术优势 130
8.1.3 软件架构 131
8.1.4 应用场景 136
8.2 Apache Spark 142
8.2.1 技术概况 142
8.2.2 发展近况和技术优势 142
8.2.3 软件架构 144
8.2.4 应用场景 146
8.3 Apache Kylin 150
8.3. 1 技术概况 150
8.3.2 发展近况和技术优势 150
8.3.3 软件架构 152
8.3.4 应用场景 153
8.4 本章小结 159
第9章 开源实时处理平台 160
9.1 Apache Storm 160
9.1.1 技术概况 160
9.1.2 发展近况和技术优势 161
9.1.3 软件架构 162
9.1.4 应用场景 163
9.2 Apache Spark Streaming 169
9.2.1 技术概况 169
9.2.2 发展近况和技术优势 170
9.2.3 软件架构 170
9.2.4 应用场景 171
9.3 Apache Flink 173
9.3.1 技术概况 173
9.3.2 发展近况和技术优势 174
9.3.3 软件架构 175
9.3.4 应用场景 176
9.4 Apache Beam 179
9.4.1 技术概况 179
9.4.2 发展近况和技术优势 180
9.4.3 软件架构 181
9.4.4 应用场景 182
9.5 Apache Apex 186
9.5.1 技术概况 186
9.5.2 发展近况和技术优势 187
9.5.3 软件架构 188
9.5.4 应用场景 191
9.6 本章小结 194
第五篇 大数据分析与挖掘技术
第 10章 开源数据分析平台 199
10.1 Apache Mahout 199
10.1.1 技术概况 199
10.1.2 发展近况和技术优势 200
10.1.3 应用场景 202
10.2 Apache Spark MLlib 204
10.2.1 技术概况 204
10.2.2 发展近况和技术优势 204
10.2.3 软件架构 205
10.2.4 应用场景 207
10.3 Apache Lens 208
10.3.1 技术概况 208
10.3.2 发展近况及技术优势 209
10.3.3 软件架构 213
10.3.4 应用场景 214
10.4 Scikit-Learn 217
10.4.1 技术概况 217
10.4.2 发展近况与技术优势 217
10.4.3 软件架构 218
10.4.4 应用场景 220
10.5 本章小结 223
第 11章 开源深度学习平台 225
11.1 TensorFlow 225
11.1.1 技术概况 225
11.1.2 发展近况和技术优势 226
11.1.3 软件架构 226
11.1.4 应用场景 230
11.2 Tensorflow Lite 233
11.2.1 技术概况 233
11.2.2 发展近况和技术优势 233
11.2.3 软件架构 234
11.3 Caffe 237
11.3.1 技术概述 237
11.3.2 发展近况和技术优势 237
11.3.3 软件架构 239
11.3.4 应用场景 241
11.4 PyTorch 243
11.4.1 技术概况 243
11.4.2 发展近况和技术优势 243
11.4.3 软件架构 245
11.4.4 应用场景 247
11.5 本章小结 248
第六篇 大数据可视化与交互技术
第 12章 主流大数据可视化与交互工具 251
12.1 Tableau 251
12.1.1 技术概况 251
12.1.2 发展近况和技术优势 252
12.1.3 软件架构 255
12.1.4 应用场景 256
12.2 Apache Zeppelin 260
12.2.1 技术概况 260
12.2.2 发展近况和技术优势 261
12.2.3 软件架构 262
12.2.4 应用场景 263
12.3 本章小结 266
第 13章 其他大数据可视化与交互工具 267
13.1 Jaspersoft Community 267
13.1.1 技术概况 267
13.1.2 发展近况和技术优势 268
13.1.3 软件架构 270
13.1.4 应用场景 271
13.2 BIRT 274
13.2.1 技术概况 274
13.2.2 发展近况和技术优势 275
13.2.3 软件架构 278
13.2.4 应用场景 280
13.3 KNIME 281
13.3.1 技术概况 281
13.3.2 发展近况和技术优势 281
13.3.3 软件架构 283
13.3.4 应用场景 285
13.4 本章小结 285
第七篇 大数据安全与治理技术
第 14章 大数据治理技术 289
14.1 Apache Falcon 289
14.1.1 技术概况 290
14.1.2 发展近况和技术优势 290
14.1.3 软件架构 292
14.1.4 应用场景 294
14.2 Apache Atlas 297
14.2.1 技术概况 298
14.2.2 发展近况和技术优势 301
14.2.3 软件架构 306
14.3 本章小结 314
第 15章 大数据安全技术 316
15.1 Apache Ranger 316
15.1.1 技术概况 316
15.1.2 发展近况和技术优势 318
15.1.3 软件架构 321
15.1.4 应用场景 322
15.2 Apache Sentry 324
15.2.1 技术概况 324
15.2.2 发展近况和技术优势 326
15.2.3 软件架构 332
15.3 Apache Kerberos 334
15.3.1 技术概况 335
15.3.2 发展近况和技术优势 336
15.3.3 软件架构 337
15.4 Apache Metron 339
15.4.1 技术概况 339
15.4.2 发展近况及技术优势 340
15.4.3 软件架构 344
15.5 Hyperledger 346
15.5.1 技术概况 346
15.5.2 发展近况和技术优势 347
15.5.3 软件架构 348
15.5.4 应用场景 349
15.6 本章小结 351
结束语 353
名词索引 355
大数据技术体系与开源生态
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×