学习Spark
作者: (美)卡劳 等著
出版社:东南大学出版社 2015年8月
简介: 所有领域中产生的数据都越来越大。你如何有效 地利用这些数据?本书介绍了Apache Spark,一种能 迅速执行数据分析过程的开源集群计算系统。利用 Spark,你能够通过Python、Java和Scala中的简单 API迅速地处理大数据集 卡劳主编的《学习Spark(影印版)(英文版)》由 Spark的开发者撰写完成,得到数据科学家和工程师 的支持,本书中的内容能够随时运行。你将学习如何 只通过几行代码执行并行任务,并覆盖了从简单批量 作业到流处理和机器学习等应用。