Data manipulation with R
作者: (美)菲尔·斯佩克特(Phil Spector)著;朱钰,柴文义,张颖译
出版社:西安交通大学出版社,2011
简介: 自创立以来,R已经成为统计计算和数据分析的一个优秀软件。该软件
的唾手可得以及范围广泛的程序包再加上随时提供支持的R社区,使R成为
几乎任何一种和统计相关的计算任务的一个极好选择。然而,很多用户,
特别是那些有其它程序语言经验的用户,并没有完全利用R的能力。由于R
的特性,在其它程序语言中有用的方法在R中可能效率并不高。菲尔?斯佩
克特的《R语言数据操作》展示了一系列将数据读入R并进行高效处理的方
法。
除了内置的函数,还包括了可以从CRAN(综合R档案网络)下载的大量现
成的程序包。展示的所有方法都利用了R的核心特性:对于通常的数据管理
任务所提供的向量化运算,高效的下标使用,R函数的正确使用。
最有经验的R用户发现,特别是在处理大型数据集时。将R和其它程序
结合使用可能会有帮助,尤其是数据库程序。因此,对于在R中使用数据库
,以及从电子表格和其它程序创建的数据集中提取数据的方法,这些都有
详细的论述。R中虽然有时会忽略字符操作,在这里却作了详细的论述。使
得那些传统地使用脚本语言解决的问题完全可以用R解决。对于那些有其它
程序语言经验的用户提供了有效使用程序结构――例如循环――的指南。
由于许多统计建模和图形函数需要数据框形式的数据,全书自始至终都提
供了将普通函数的输出结果转化为数据框的技术。
通过使用各种不同的例子(其数据来源于R或者是轻松可得的模拟数据
集),《R语言数据操作》可推荐给任何想从运行简单的例子提高到可以对
实际的真实数据提供操作解决方案的R使用者。