图书介绍
Lucene搜索引擎开发权威经典PDF|Epub|txt|kindle电子书版本网盘下载
![Lucene搜索引擎开发权威经典](https://www.shukui.net/cover/23/30144495.jpg)
- 于天恩著 著
- 出版社: 北京:中国铁道出版社
- ISBN:9787113092511
- 出版时间:2008
- 标注页数:631页
- 文件大小:226MB
- 文件页数:651页
- 主题词:计算机网络-程序设计
PDF下载
下载说明
Lucene搜索引擎开发权威经典PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1部分 Lucene基础(第1~5章)3
第1章 Lucene简介3
1.1认识Lucene3
Lucene是什么3
Lucene的作者3
Lucene的历史3
Lucene的现在4
1.2 Lucene体验实例4
下载Lucene4
编写辅助类6
最简单的搜索引擎10
索引器的开发11
索引器的运行18
搜索器的开发20
搜索器的运行27
小结28
第2章 创建索引29
2.1创建索引的基本方式29
理解创建索引的过程29
创建Field31
创建Document31
创建IndexWriter31
2.2创建索引实例32
简单索引32
复杂一点的索引35
为文件创建索引39
为某一目录下的所有文件创建索引42
小结46
第3章 执行搜索47
3.1执行搜索的基本方式47
创建搜索器对象:IndexSearcher47
封装搜索条件:使用Term和Query对象47
执行搜索48
提取搜索结果:了解Hits对象48
提取搜索结果:了解Document对象49
提取搜索结果:了解Field对象49
3.2执行搜索实例49
简单搜索49
分词问题52
小结53
第4章 中文分词55
4.1说说分词55
分词的方法55
做分词器56
4.2 Lucene的分词器56
二分法分词器56
Lucene自带的中文分词器62
NGram分词器的原理和用法68
JE分词器的原理和用法69
IK分词器的原理和用法75
其他分词器87
小结87
第5章 Lucene搜索引擎开发基础实例89
5.1概述89
5.2桌面搜索引擎:索引器89
索引器简介89
索引器设计89
索引器实现91
实例效果99
5.3桌面搜索引擎:搜索器101
搜索器简介101
搜索器设计101
搜索器实现101
实例效果109
5.4 Web搜索引擎:搜索器111
搜索器简介111
搜索器界面111
搜索器实现112
搜索器部署115
实例效果117
小结118
第2部分 数据解析(第6~8章)121
第6章 常用的数据解析组件121
6.1常见二进制文档的解析121
解析PDF文档121
解析Word文档131
解析Excel文档137
6.2 XML文档的解析145
使用DOM4J解析XML文档146
XML文档标准解析器149
6.3 HTML文档的解析151
下载HTMLParser组件151
网页编码问题153
网页解析的一般方法154
常见的解析要求162
6.4集成的数据解析器172
文本文件解析器172
集成解析器174
6.5改良的搜索引擎177
改良的索引器177
测试搜索器186
小结193
第7章 Lucene自身的数据解析方法195
7.1处理PDF文档——LucenePDFDocument195
7.2处理纯文本文件——TextDocument195
7.3综述199
小结199
第8章 Lius类库201
8.1初识Lius201
Lius简介201
Lius的功能202
下载Lius202
Lius的目录结构204
一个简单的例子208
8.2借助Lius解析普通数据209
取我所需,为我所用209
解析Word210
解析Excel211
解析PDF213
解析PowerPoint215
解析RTF217
解析TXT218
解析XML220
8.3借助Lius解析HTML数据221
Lius解析HTML的方式221
JTidyHtmllndexer的使用222
NekoHtmlIndexer的使用224
小结225
第3部分 索引的高级知识(第9~10章)229
第9章 索引的建立和优化229
9.1索引建立的过程229
Lucene的索引机制229
文本的分析230
9.2索引文件的生成244
生成索引文件的过程244
索引文件的格式247
9.3索引的优化248
索引优化的本质248
复合式索引格式248
调整索引优化参数259
内存缓冲器与索引合并264
限制每个Field的词条数量274
索引本身的优化276
查看索引的过程279
小结285
第10章 索引的管理287
10.1查看索引的信息287
使用IndexWriter类读取索引的相关信息287
使用IndexReader及其子类读取索引的相关信息289
10.2删除索引中的文档296
使用IndexReader从索引中删除文档296
使用IndexModifier从索引中删除文档304
10.3更新索引中的文档307
更新索引中的单个文档307
批量更新索引中的文档310
10.4索引的同步314
Lucene的并发访问规则314
线程安全性314
索引锁机制315
10.5使用Luke管理索引315
下载Luke315
使用Luke317
10.6使用Limo管理索引321
下载Limo322
使用Limo324
小结324
第4部分 搜索的高级知识(第11~12章)327
第11章 搜索请求的构建和解析327
11.1构建多种搜索请求327
词条搜索327
组合搜索330
范围搜索344
前缀搜索350
短语搜索353
多短语搜索360
模糊搜索364
通配符搜索370
正则表达式匹配搜索373
综述376
11.2解析搜索请求376
QueryParser的基本使用377
使用QueryParser解析多个关键词380
11.3高级搜索387
多字段搜索387
多索引搜索397
多线程搜索402
小结404
第12章 搜索结果的处理和显示405
12.1提取搜索结果405
Hits对象的方法405
对性能的说明410
12.2过滤搜索结果413
简单的结果过滤414
利用Filter类实现过滤421
QueryFilter的使用421
PrefixFilter的使用432
RangeFilter的使用439
ChainedFilter的使用446
Caching WrapperFilter的使用455
FilteredQuery的使用458
综述462
12.3搜索结果的排序462
按照文档得分排序462
自定义排序规则477
让系统决定如何排序479
按照索引中的文档编号排序483
按照文本字段排序487
指定字段的数据类型491
按多个字段排序496
综述504
12.4搜索结果的高亮显示504
关于高亮显示504
Lucene高亮处理的基本方式506
Lucene高亮处理的基本设置511
为高亮显示设置新的格式515
小结519
第5部分 lucene应用实例(第13~14章)523
第13章 桌面搜索引擎开发实例523
13.1桌面搜索引擎简介523
13.2桌面搜索引擎索引器524
索引器简介524
索引器设计524
解析器实现525
获取文件列表536
索引器实现538
实例效果545
13.3桌面搜索引擎搜索器547
搜索器简介547
搜索器设计548
搜索器实现548
实例效果556
小结557
第14章 Web搜索引擎开发实例559
14.1 Web搜索引擎简介559
14.2 Web搜索引擎索引器559
索引器简介559
索引器设计559
解析器实现561
获取文件列表572
索引器实现574
实例效果581
14.3 Web搜索引擎搜索器583
搜索器简介583
搜索器界面584
搜索器实现584
实例效果589
综述590
小结592
第6部分 Nutch搜索引擎框架(第15~16章)595
第15章 了解Nutch595
15.1搭建搜索引擎的方法595
搭建搜索引擎的一般方法595
搭建网络搜索引擎的方法595
15.2关于Nutch596
Nutch是什么596
Nutch和Lucene597
Nutch的架构597
Nutch的未来597
15.3获得Nutch599
下载Nutch599
Nutch的不同版本601
小结602
第16章 使用Nutch603
16.1安装Nutch的准备603
安装JDK603
安装Tomcat604
安装Cygwin607
配置环境变量611
16.2运行Nutch0.8.1612
安装Nutch0.8.1612
使用Nutch抓取网页613
使用Nutch执行搜索618
16.3运行Nutch0.9622
安装Nutch0.9622
使用Nutch抓取网页622
使用Nutch执行搜索626
Nutch的二次开发629
小结629
后记631