图书介绍

Lucene搜索引擎开发权威经典PDF|Epub|txt|kindle电子书版本网盘下载

Lucene搜索引擎开发权威经典
  • 于天恩著 著
  • 出版社: 北京:中国铁道出版社
  • ISBN:9787113092511
  • 出版时间:2008
  • 标注页数:631页
  • 文件大小:226MB
  • 文件页数:651页
  • 主题词:计算机网络-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Lucene搜索引擎开发权威经典PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1部分 Lucene基础(第1~5章)3

第1章 Lucene简介3

1.1认识Lucene3

Lucene是什么3

Lucene的作者3

Lucene的历史3

Lucene的现在4

1.2 Lucene体验实例4

下载Lucene4

编写辅助类6

最简单的搜索引擎10

索引器的开发11

索引器的运行18

搜索器的开发20

搜索器的运行27

小结28

第2章 创建索引29

2.1创建索引的基本方式29

理解创建索引的过程29

创建Field31

创建Document31

创建IndexWriter31

2.2创建索引实例32

简单索引32

复杂一点的索引35

为文件创建索引39

为某一目录下的所有文件创建索引42

小结46

第3章 执行搜索47

3.1执行搜索的基本方式47

创建搜索器对象:IndexSearcher47

封装搜索条件:使用Term和Query对象47

执行搜索48

提取搜索结果:了解Hits对象48

提取搜索结果:了解Document对象49

提取搜索结果:了解Field对象49

3.2执行搜索实例49

简单搜索49

分词问题52

小结53

第4章 中文分词55

4.1说说分词55

分词的方法55

做分词器56

4.2 Lucene的分词器56

二分法分词器56

Lucene自带的中文分词器62

NGram分词器的原理和用法68

JE分词器的原理和用法69

IK分词器的原理和用法75

其他分词器87

小结87

第5章 Lucene搜索引擎开发基础实例89

5.1概述89

5.2桌面搜索引擎:索引器89

索引器简介89

索引器设计89

索引器实现91

实例效果99

5.3桌面搜索引擎:搜索器101

搜索器简介101

搜索器设计101

搜索器实现101

实例效果109

5.4 Web搜索引擎:搜索器111

搜索器简介111

搜索器界面111

搜索器实现112

搜索器部署115

实例效果117

小结118

第2部分 数据解析(第6~8章)121

第6章 常用的数据解析组件121

6.1常见二进制文档的解析121

解析PDF文档121

解析Word文档131

解析Excel文档137

6.2 XML文档的解析145

使用DOM4J解析XML文档146

XML文档标准解析器149

6.3 HTML文档的解析151

下载HTMLParser组件151

网页编码问题153

网页解析的一般方法154

常见的解析要求162

6.4集成的数据解析器172

文本文件解析器172

集成解析器174

6.5改良的搜索引擎177

改良的索引器177

测试搜索器186

小结193

第7章 Lucene自身的数据解析方法195

7.1处理PDF文档——LucenePDFDocument195

7.2处理纯文本文件——TextDocument195

7.3综述199

小结199

第8章 Lius类库201

8.1初识Lius201

Lius简介201

Lius的功能202

下载Lius202

Lius的目录结构204

一个简单的例子208

8.2借助Lius解析普通数据209

取我所需,为我所用209

解析Word210

解析Excel211

解析PDF213

解析PowerPoint215

解析RTF217

解析TXT218

解析XML220

8.3借助Lius解析HTML数据221

Lius解析HTML的方式221

JTidyHtmllndexer的使用222

NekoHtmlIndexer的使用224

小结225

第3部分 索引的高级知识(第9~10章)229

第9章 索引的建立和优化229

9.1索引建立的过程229

Lucene的索引机制229

文本的分析230

9.2索引文件的生成244

生成索引文件的过程244

索引文件的格式247

9.3索引的优化248

索引优化的本质248

复合式索引格式248

调整索引优化参数259

内存缓冲器与索引合并264

限制每个Field的词条数量274

索引本身的优化276

查看索引的过程279

小结285

第10章 索引的管理287

10.1查看索引的信息287

使用IndexWriter类读取索引的相关信息287

使用IndexReader及其子类读取索引的相关信息289

10.2删除索引中的文档296

使用IndexReader从索引中删除文档296

使用IndexModifier从索引中删除文档304

10.3更新索引中的文档307

更新索引中的单个文档307

批量更新索引中的文档310

10.4索引的同步314

Lucene的并发访问规则314

线程安全性314

索引锁机制315

10.5使用Luke管理索引315

下载Luke315

使用Luke317

10.6使用Limo管理索引321

下载Limo322

使用Limo324

小结324

第4部分 搜索的高级知识(第11~12章)327

第11章 搜索请求的构建和解析327

11.1构建多种搜索请求327

词条搜索327

组合搜索330

范围搜索344

前缀搜索350

短语搜索353

多短语搜索360

模糊搜索364

通配符搜索370

正则表达式匹配搜索373

综述376

11.2解析搜索请求376

QueryParser的基本使用377

使用QueryParser解析多个关键词380

11.3高级搜索387

多字段搜索387

多索引搜索397

多线程搜索402

小结404

第12章 搜索结果的处理和显示405

12.1提取搜索结果405

Hits对象的方法405

对性能的说明410

12.2过滤搜索结果413

简单的结果过滤414

利用Filter类实现过滤421

QueryFilter的使用421

PrefixFilter的使用432

RangeFilter的使用439

ChainedFilter的使用446

Caching WrapperFilter的使用455

FilteredQuery的使用458

综述462

12.3搜索结果的排序462

按照文档得分排序462

自定义排序规则477

让系统决定如何排序479

按照索引中的文档编号排序483

按照文本字段排序487

指定字段的数据类型491

按多个字段排序496

综述504

12.4搜索结果的高亮显示504

关于高亮显示504

Lucene高亮处理的基本方式506

Lucene高亮处理的基本设置511

为高亮显示设置新的格式515

小结519

第5部分 lucene应用实例(第13~14章)523

第13章 桌面搜索引擎开发实例523

13.1桌面搜索引擎简介523

13.2桌面搜索引擎索引器524

索引器简介524

索引器设计524

解析器实现525

获取文件列表536

索引器实现538

实例效果545

13.3桌面搜索引擎搜索器547

搜索器简介547

搜索器设计548

搜索器实现548

实例效果556

小结557

第14章 Web搜索引擎开发实例559

14.1 Web搜索引擎简介559

14.2 Web搜索引擎索引器559

索引器简介559

索引器设计559

解析器实现561

获取文件列表572

索引器实现574

实例效果581

14.3 Web搜索引擎搜索器583

搜索器简介583

搜索器界面584

搜索器实现584

实例效果589

综述590

小结592

第6部分 Nutch搜索引擎框架(第15~16章)595

第15章 了解Nutch595

15.1搭建搜索引擎的方法595

搭建搜索引擎的一般方法595

搭建网络搜索引擎的方法595

15.2关于Nutch596

Nutch是什么596

Nutch和Lucene597

Nutch的架构597

Nutch的未来597

15.3获得Nutch599

下载Nutch599

Nutch的不同版本601

小结602

第16章 使用Nutch603

16.1安装Nutch的准备603

安装JDK603

安装Tomcat604

安装Cygwin607

配置环境变量611

16.2运行Nutch0.8.1612

安装Nutch0.8.1612

使用Nutch抓取网页613

使用Nutch执行搜索618

16.3运行Nutch0.9622

安装Nutch0.9622

使用Nutch抓取网页622

使用Nutch执行搜索626

Nutch的二次开发629

小结629

后记631

热门推荐