Lucene搜索引擎开发权威经典

副标题:无

作   者:于天恩著

分类号:

ISBN:9787113092511

微信扫一扫,移动浏览光盘

简介

  这本书基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精练简洁,恰到好处。    本书共包括16章,分为6部分。第1部分:Lucene基础。介绍了Lucene的基础知识,包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目。第2部分:数据解析。介绍解析不同格式数据(如Word、PDF等)的方法,包括常用的数据解析组件、Lucene自身的数据解析机制和Lius类库。第3部分:索引的高级知识。介绍了Lucene建立索引的过程,索引的查看和删除,索引的同步,索引的合并和优化等内容。第4部分:搜索的高级知识。介绍使用不同的Query对象构建搜索请求,使用QueryParser解析用户的搜索请求,搜索结果的过滤和排序等内容。第5部分:LuceNe应用实例。应用本书介绍的所有知识构建一个桌面搜索引擎和一个Web搜索引擎。这部分作为对前面所有内容的总结。第6部分:Nutch搜索引擎框架。介绍了基于Luceng的完整搜索引擎Nutch。    本书适合从Lucene初学者到高级开发人员之间的一切Lucene爱好者。

目录

第1章 Lucene简介
1.1 认识Lucene
1.1.1 Lucene是什么
1.1.2 Lucene的作者
1.1.3 Lucene的历史
1.1.4 Lucene的现在
1.2 Lucene体验实例
1.2.1 下载Lucene
1.2.2 编写辅助类
1.2.3 最简单的搜索引擎
1.2.4 索引器的开发
1.2.5 索引器的运行
1.2.6 搜索器的开发
1.2.7 搜索器的运行
小结

第2章 创建索引
2.1 创建索引的基本方式
2.1.1 理解创建索引的过程
2.1.2 创建Field
2.1.3 创建Document
2.1.4 创建IndexWriter
2.2 创建索引实例
2.2.1 简单索引
2.2.2 复杂一点的索引
2.2.3 为文件创建索引
2.2.4 为某一目录下的所有文件创建索引
小结

第3章 执行搜索
3.1 执行搜索的基本方式
3.1.1 创建搜索器对象:Indexsearcher
3.1.2 封装搜索条件:使用Tem和Query对象
3.1.3 执行搜索
3.1.4 提取搜索结果:了解Hits对象
3.1.5 提取搜索结果:了解Document对象
3.1.6 提取搜索结果:了解Field对象
3.2 执行搜索实例
3.2.1 简单搜索
3.2.2 分词问题
小结

第4章 中文分词
4.1 说说分词
4.1.1 分词的方法
4.1.2 做分词器
4.2 Lucene的分词器
4.2.1 二分法分词器
4.2.2 Lucene自带的中文分词器
4.2.3 NGram分词器的原理和用法
4.2.4 JE分词器的原理和用法
4.2.5 IK分词器的原理和用法
4.2.6 其他分词器
小结

第5章 Lucene搜索引擎开发基础实例
5.1 概述
5.2 桌面搜索引擎:索引器
5.2.1 索引器简介
5.2.2 索引器设计
5.2.3 索引器实现
5.2.4 实例效果
5.3 桌面搜索引擎:搜索器
5.3.1 搜索器简介
5.3.2 搜索器设计
5.3.3 搜索器实现
5.3.4 实例效果
5.4 web搜索引擎:搜索器
5.4.1 搜索器简介
5.4.2 搜索器界面
5.4.3 搜索器实现
5.4.4 搜索器部署
5.4.5 实例效果
小结

第6章 常用的数据解新组件
6.1 常见二进制文档的解析
6.1.1 解析PDF文档
6.1.2 解析Word文档
6.1.3 解析Excel文档
6.2 XML文档的解析
6.2.1 使用DOM4J解析XML文档
6.2.2  XML文档标准解析器
6.3 HTML文档的解析
6.3.1 下载HTMLParser组件
6.3.2 网页编码问题
6.3.3 网页解析的一般方法
6.3.4 常见的解析要求
6.4 集成的数据解析器
6.4.1 文本文件解析器
6.4.2 集成解析器
6.5 改良的搜索引擎
6.5.1 改良的索引器
6.5.2 测试搜索器
小结

第7章 Lucene自身的数据解新方法
7.1 处理PDF文档——LucenePDFDocument
7.2 处理纯文本文件——TextDocument
7.3 综述
小结

第8章 Lius类库
8.1 初识Lius
8.1.1 Lius简介
8.1.2 Lius的功能
8.1.3 下载Lius
8.1.4 Lius的目录结构
8.1.5 一个简单的例子
8.2 借助Lius解析普通数据
8.2.1 取我所需,为我所用
8.2.2 解析Word
8.2.3 解析Excel
8.2.4 解析PDF
8.2.5 解析PowerPoint
8.2.6 解析RTF
8.2.7 解析TXT
8.2.8 解析XMI
8.3 借助Lius解析HTML数据
……
第3部分 索引的高级知识(第9~10章)
第4部分 搜索的高级知识(第11~12章)
第5部分 Lucene应用实例(第13~14章)
第6部分 Nutch搜索引擎框架(第15~16章)

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

Lucene搜索引擎开发权威经典
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    亲爱的云图用户,
    光盘内的文件都可以直接点击浏览哦

    无需下载,在线查阅资料!

    loading icon