微信扫一扫,移动浏览光盘
简介
数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。《数据科学与大数据分析——数据的发现 分析 可视化与表示》总共分为12章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用R语言进行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分类、时间序列分析、文本分析等方法。此外,本书还涵盖了用来进行高级数据分析所使用的技术和工具,比如MapReduce和Hadoop、数据库内分析等。《数据科学与大数据分析——数据的发现 分析 可视化与表示》内容详细,示例丰富,侧重于理论与练习的结合,因此比较适合对大数据分析、数据科学感兴趣的人员阅读,有志于成为数据科学家的读者也可以从本书中获益。
目录
第1章 大数据分析介绍 1
1.1 大数据概述 2
1.1.1 数据结构 4
1.1.2 数据存储的分析视角 9
1.2 分析的实践状态 10
1.2.1 商业智能 VS 数据科学 11
1.2.2 当前分析架构 12
1.2.3 大数据的驱动力 14
1.2.4 新的大数据生态系统和新的分析方法 15
1.3 新的大数据生态系统中的关键角色 17
1.4 大数据分析案例 20
1.5 总结 21
1.6 练习 21
参考书目 21
第2章 数据分析生命周期 23
2.1 数据分析生命周期概述 24
2.1.1 一个成功分析项目的关键角色 24
2.1.2 数据分析生命周期的背景和概述 26
2.2 第1阶段:发现 28
2.2.1 学习业务领域 29
2.2.2 资源 29
2.2.3 设定问题 30
2.2.4 确定关键利益相关者 30
2.2.5 采访分析发起人 31
2.2.6 形成初始假设 32
2.2.7 明确潜在数据源 32
2.3 第2阶段:数据准备 33
2.3.1 准备分析沙箱 34
2.3.2 执行ETLT 35
2.3.3 研究数据 36
2.3.4 数据治理 37
2.3.5 调查和可视化 37
2.3.6 数据准备阶段的常用工具 38
2.4 第3阶段:模型规划 39
2.4.1 数据探索和变量选择 40
2.4.2 模型的选择 41
2.4.3 模型设计阶段的常用工具 42
2.5 第4阶段:模型建立 42
2.5.1 模型构建阶段中的常用工具 44
2.6 第5阶段:沟通结果 45
2.7 第6阶段:实施 46
2.8 案例研究:全球创新网络和分析(GINA) 49
2.8.1 第1阶段:发现 50
2.8.2 第2阶段:数据准备 51
2.8.3 第3阶段:模型规划 51
2.8.4 第4阶段:模型建立 51
2.8.5 第5阶段:沟通结果 53
2.8.6 第6阶段:实施 54
2.9 总结 55
2.10 练习 55
参考书目 55
第3章 使用R进行基本数据分析 57
3.1 R简介 58
3.1.1 R图形用户界面 6
1.1 大数据概述 2
1.1.1 数据结构 4
1.1.2 数据存储的分析视角 9
1.2 分析的实践状态 10
1.2.1 商业智能 VS 数据科学 11
1.2.2 当前分析架构 12
1.2.3 大数据的驱动力 14
1.2.4 新的大数据生态系统和新的分析方法 15
1.3 新的大数据生态系统中的关键角色 17
1.4 大数据分析案例 20
1.5 总结 21
1.6 练习 21
参考书目 21
第2章 数据分析生命周期 23
2.1 数据分析生命周期概述 24
2.1.1 一个成功分析项目的关键角色 24
2.1.2 数据分析生命周期的背景和概述 26
2.2 第1阶段:发现 28
2.2.1 学习业务领域 29
2.2.2 资源 29
2.2.3 设定问题 30
2.2.4 确定关键利益相关者 30
2.2.5 采访分析发起人 31
2.2.6 形成初始假设 32
2.2.7 明确潜在数据源 32
2.3 第2阶段:数据准备 33
2.3.1 准备分析沙箱 34
2.3.2 执行ETLT 35
2.3.3 研究数据 36
2.3.4 数据治理 37
2.3.5 调查和可视化 37
2.3.6 数据准备阶段的常用工具 38
2.4 第3阶段:模型规划 39
2.4.1 数据探索和变量选择 40
2.4.2 模型的选择 41
2.4.3 模型设计阶段的常用工具 42
2.5 第4阶段:模型建立 42
2.5.1 模型构建阶段中的常用工具 44
2.6 第5阶段:沟通结果 45
2.7 第6阶段:实施 46
2.8 案例研究:全球创新网络和分析(GINA) 49
2.8.1 第1阶段:发现 50
2.8.2 第2阶段:数据准备 51
2.8.3 第3阶段:模型规划 51
2.8.4 第4阶段:模型建立 51
2.8.5 第5阶段:沟通结果 53
2.8.6 第6阶段:实施 54
2.9 总结 55
2.10 练习 55
参考书目 55
第3章 使用R进行基本数据分析 57
3.1 R简介 58
3.1.1 R图形用户界面 6
数据科学与大数据分析 数据的发现 分析 可视化与表示
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×