Data mining in finance
作者: 马超群,兰秋军,陈为民著
出版社:科学出版社,2007
简介:全书分成九章,第一章绪论,从整体的角度介绍数据挖掘产生的背景、技术与步骤以及一些关键问题,讨论金融数据的基本特点与挖掘业务需求;第二章金融数据预处理,主要讨论金融数据来源、数据可能面临的错误与去噪处理方法;提出的小波去噪方法克服了频谱分离、卡尔曼滤波、维纳滤波、匹配滤波等常见的去噪方法所不能解决的问题,对具有非平稳、非线性、缺乏先验信息等特点的金融时间序列数据的去噪效果比较好。第三章关联规则挖掘技术,在介绍多层关联规则挖掘与多维关联规则挖掘的基础上给出了银行卡关联规则挖掘的案例分析,提出了一种基于共同机制的时间序列关联模式挖掘算法,设计出了一种高效率获取不同序列间关联模式的算法。该挖掘方法快速、简单,能探测出微观局部隐含存在的关联性,;第四章分类技术,首先介绍了分类的基本概念与方法及评价,研究了判别式分类、决策树分类、贝叶斯分类和粗糙集方法,以及分类技术在信用卡管理中的应用;第五章预测技术,介绍了传统的线性回归与非线性回归方法,灰色预测与组合预测技术,以及混合预测模型在股票价格预测中的应用;第六章神经网络与支持向量机,主要研究了前向型神经网络、Hopfield网络、自组织特征映射神经网络、统计学习理论以及支持向量机及其在金融预测中的应用;第七章聚类分析,主要介绍了聚类的相关概念,研究了数据类型及相似性度量、分割聚类算法、层次聚类法、基于密度与模型的聚类方法;第八章时间序列数据挖掘,首先给出了时间序列相似性度量的一般方法,从心理偏好角度研究了时间序列相似性度量,提出了一种新的时间序列相似度量的主观偏好模型及其偏好系数的"锚点"估计方法。该方法从水平偏移、幅度伸缩和波动一致性等角度来度量相似程度,并将投资者决策偏好融入相似度模型,从而在数据挖掘过程中,可充分利用挖掘者的经验背景知识,提高了模式的有趣性和有效性;创造性提出了用金融时间序列局部模式来挖掘金融市场局部规律特征的建模思想;提出了一种新的具有预测性的时间序列事件征兆模式挖掘方法TSEOPM(TimeSeriesEventOmenPatternMining),该方法主要基于"模式点聚集性"原理,通过聚类、候选模式生成、以及候选模式判别技术获取序列中隐含的预测性序列模式。它与以往的序列模式挖掘重在发现"所有"频繁的模式不同,主要是将目标聚集于能预测挖掘者感兴趣的事件的序列模式。因而其搜索空间大为减少,而且模式是有趣的,避免了常见的所谓"坏模型"问题对检验结果的影响,是实