DATA Mining Concepts:Models, Methods, and Algorithms
作者: (美)Mehmed Kantardzic著;闪四清等译
出版社:清华大学出版社,2003
简介: 作为一本教科书,本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录,全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程,以及数据挖掘工具及其典型应用领域。
本收编写严谨、内容权威、结构合理、科学规范、语言流畅,特别适合作为高等院校数据挖掘课程的教科书,还适合作为数据挖掘研究人员必备的参考书。
我们被数据所包围着,这些数据是数值型或其他类型,它们都必须经过分析和处理,转换成通知、指导、回答或辅助决策和理解的信息。由于当今数据集的大小和复杂性的增加,就产生了数据挖掘这个新术语,它描述了间接的、自动化的数据分析技术,这些技术所利用的工具比分析人员过去做基本的数据分析所使用的工具更加复杂和尖端。
本书讨论了数据挖掘的原理,接着描述了一些具有代表性的艺术级的方法和算法。这些方法和算法起源于不同的学科,如统计学、机器学习、计算机图形学、数据库、信息检索、神经网络、模糊逻辑和进化计算。本书还提供了详细的算法,而且这些算法都带有必要的解释和图形示例。
本书提供了一个指南:在面对一个待挖掘的数据集(以及它们的伴随数据集)时,怎样和何时从成百上千种软件工具中选择特定的一种。本书允许分析人员用书中提供的方法和技术来创建和执行他们自己的数据挖掘实验。
本书强调选择合适的方法和数据分析软件,并根据实际情况选择相应的参数。只有在深入理解了参数的意义及其在所提供技术中的作用的情况下,才能作出这些非常重要的、定性的决策。数据挖掘是一个正在蓬勃发展的领域,本书提供了从大量可用的分析程序中进行选择所急需的指南。