文本挖掘原理

副标题:无

作   者:程显毅,朱倩编著

分类号:

ISBN:9787030293060

微信扫一扫,移动浏览光盘

简介

   在信息时代,存储大量数据比较容易。通过Web、企业内部网、电传新   。闻获得的文本数量在急剧增加,这导致信息过载。然而,数据量虽然增   加了,但可用的信息却在减少。文本挖掘是一个新的令人振奋的研究领域   ,其试图通过综合数据挖掘、机器学习、自然语言处理、信息检索和知识   管理等技术来解决信息过载问题。    文本挖掘包括文本集合的预处理(文本分类、信息抽取)、中间结果存   储、中间结果分析技术(分布分析、聚类、趋势分析、关联规则抽取)和最   终结果的可视化。它与关联分析类似,为人们提供了分析海量文本数据的   新工具,并且通过学习模式来指导抽取实体关系。    本书首先讨论了文本挖掘的总体结构以及文本挖掘预处理算法,然后   深入地研究了文本挖掘核心操作,最后探讨真实世界中文本挖掘的主要应   用和DIAL,弥补了理论和实践的脱节。    本书主要可供对文本挖掘感兴趣的本科高年级学生、研究生、研究人   员和专业开发人员参考,对从事文本挖掘开发和使用文本挖掘系统的人也   会有很大帮助。   

目录

《文本挖掘原理》

前言

第1章 文本挖掘概述

1.1 文本挖掘的产生背景

1.2 文本

1.2.1 文本格式

1.2.2 动态文本集

1.3 文本挖掘的概念

1.4 文本挖掘的任务

1.4.1 文本挖掘预处理

1.4.2 文本模式挖掘

1.4.3 挖掘结果可视化

1.5 文本挖掘系统的通用体系结构

第2章 文本表示

2.1 向量空间模型

2.2 概率模型

2.3 概念模型

2.4 特征生成

2.5 特征选择

2.6 特征抽取

.第3章 文本挖掘预处理——文本分类

3.1 文本分类的种类

3.2 文本分类的应用

3.3 文本分类的知识工程方法

3.4 文本分类的机器学习方法

3.5 bootstrapping算法

3.6 文本分类器的评价

第4章 文本挖掘预处理——文本聚类

4.1 聚类的任务

4.2 聚类的基本问题

4.3 聚类算法

4.4 文本聚类

第5章 文本挖掘核心操作——信息抽取

5.1信息抽取简介

5.2信息抽取任务

5.3信息抽取实例

5.4 信息抽取系统的体系结构

5.5 指代消解

5.6 规则学习

5.7视觉信息抽取

第6章 文本挖掘核心操作——关系抽取

6.1 实体关系抽取

6.2 web中的实体关系发现

6.3 实体关系发现的难点

6.4 基于社会网络的实体关系发现

6.5 实体包含关系的抽取

6.6 基于全信息的隐含的多实体关系抽取

6.7 基于核函数的实体关系抽取

6.8 基于混合概率模型的实体关系抽取系统——teg

第7章 文本挖掘核心操作——关联分析

7.1 实例——“9.11"劫机者

7.2 网络的自动布局算法

7.3 实体之间的关联路径

7.4 中心性

7.5 网络的分割

7.6 网络中的模式匹配

7.7 关联分析软件包

第8章 文本挖掘结果的可视化

8.1 浏览器

8.2 表示层

8.3 文本知识发现语言kdtl

8.4可视化方法

第9章 文本挖掘的应用

9.1行业分析器

9.2 专利分析解决方案

9.3 生物学路径信息挖掘

第10章 专门用于文本挖掘的信息抽取语言——dial

10.1 文本模式定义

10.2 基于dial的信息抽取

10.3 文本标注

10.4 概念和规则结构

10.5 模式匹配

10.6 模板元素

10.7 规则约束和概念保护

10.8 dial实例

参考文献


已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

文本挖掘原理
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon