数据科学概论(第2版)(普通高等学校应用型教材·数据科学)
作者: 覃雄派 陈跃国 杜小勇
出版社:中国人民大学出版社 2021-10-29
简介:本教材的内容,分为四大模块,分别是:(1) 数据科学基础(Fundamentals):讲述数据科学的基本概念和原则。(2) 数据和数据上的计算(Data and Computing on Data):讲述不同的数据类型及其分析方法,数据类型包括结构化数据、非结构化数据、半结构化数据,分析方法包括统计学方法、数据挖掘方法、和机器学习方法等。(3) 数据处理基础设施、平台和工具(Infrastructure, Platforms and Tools):讲述云计算平台、数据库、大数据平台及工具、以及编程语言 Python 等。(4) 数据科学案例和实践(Applications and Practice):讲述大数据应用的案例;并且面向金融领域的量化交易应用,从数据采集、模型训练、预测、评价、到可视化等环节,带领读者完成数据分析处理的实践。