图书介绍

网络信息检索PDF|Epub|txt|kindle电子书版本网盘下载

董守斌，袁华编著著
出版社：西安：西安电子科技大学出版社
ISBN：9787560623788
出版时间：2010
标注页数：348页
文件大小：44MB
文件页数：358页
主题词：计算机网络－情报检索－高等学校－教材

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：43f37f58a0920a6131139182bd28f3f3

下载说明

网络信息检索PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章绪论1

1.1网络信息检索概述1

1.1.1网络信息1

1.1.2信息检索2

1.1.3网络信息检索3

1.2信息检索的发展4

1.2.1手工检索4

1.2.2脱机批处理检索4

1.2.3联机检索5

1.2.4网络信息检索6

1.3网络信息检索的应用6

1.3.1搜索引擎6

1.3.2多媒体信息检索8

1.3.3话题识别与跟踪10

1.3.4信息过滤11

1.3.5问题回答13

思考题15

参考文献15

第2章信息检索模型16

2.1检索模型定义17

2.2布尔模型18

2.3向量模型20

2.3.1索引项权重21

2.3.2相似度量22

2.3.3计算方法23

2.4概率模型26

2.5扩展的布尔模型31

2.5.1模糊集合模型31

2.5.2扩展布尔模型33

2.6扩展的向量模型35

2.6.1广义向量空间模型35

2.6.2潜语义标引模型38

2.6.3神经网络模型41

2.7扩展的概率模型43

2.7.1推理网络模型44

2.7.2信任度网络模型47

2.7.3语言模型49

2.8小结51

思考题52

习题52

参考文献55

第3章网络信息的自动搜集57

3.1网络信息的特点57

3.1.1 Web的组成57

3.1.2 Web的特点62

3.2网络信息搜集的原理64

3.2.1信息搜集的基本流程64

3.2.2遍历策略66

3.2.3页面解析68

3.3网络信息搜集的礼貌原则69

3.3.1机器人排斥协议69

3.3.2机器人元标签70

3.4高性能信息搜集71

3.4.1并行搜集71

3.4.2 DNS优化72

3.4.3优先搜集策略74

3.4.4网页更新74

3.4.5网页消重75

3.4.6避免蜘蛛陷阱76

3.5专题信息搜集77

3.5.1网页的主题特性77

3.5.2专题信息搜集算法78

3.6小结80

思考题80

习题80

参考文献83

第4章网页文本处理和索引85

4.1文本的特性86

4.1.1信息熵86

4.1.2统计定律87

4.2网页信息的特征89

4.2.1网页结构89

4.2.2网页类型91

4.3网页去噪93

4.3.1基于网页结构的方法93

4.3.2基于模板的方法96

4.4文本处理96

4.4.1词汇分析99

4.4.2排除停用词100

4.4.3词干提取101

4.4.4索引词选择101

4.5索引102

4.5.1 Trie树102

4.5.2后缀树103

4.5.3签名档105

4.5.4倒排文件106

4.6小结112

思考题113

习题113

参考文献114

第5章查询语言与查询处理116

5.1 Web查询语言116

5.1.1 WebSQL查询语言117

5.1.2 W3QL查询语言119

5.1.3 WebOQL查询语言119

5.2查询方式121

5.2.1基于关键字的查询121

5.2.2模式匹配124

5.3相关反馈125

5.3.1向量空间模型中的相关反馈126

5.3.2概率模型中的相关反馈128

5.4查询扩展129

5.4.1基于字典的简单查询扩展129

5.4.2自动局部分析132

5.4.3自动全局分析135

5.5小结139

思考题140

习题140

参考文献142

第6章信息检索性能评价144

6.1信息检索评价指标144

6.1.1查全率和查准率144

6.1.2其他评价指标148

6.2信息检索评价基准156

6.2.1基准测试156

6.2.2 TREC评测158

6.2.3 Web检索评价162

6.2.4 CWIRF评测164

6.3小结166

思考题166

习题167

参考文献168

第7章搜索引擎170

7.1概述171

7.1.1发展概况171

7.1.2术语与定义172

7.1.3工作原理174

7.2链接分析178

7.2.1 PageRank178

7.2.2 HITS186

7.2.3算法比较189

7.3相关排序190

7.3.1 Lucene检索模型190

7.3.2 Nutch排序算法193

7.4大规模搜索引擎198

7.4.1体系架构199

7.4.2数据结构200

7.4.3检索算法202

7.4.4相关排序202

7.5小结203

思考题204

习题204

参考文献207

第8章并行和分布式信息检索209

8.1并行信息检索209

8.1.1并行计算的概念209

8.1.2并行信息检索体系架构210

8.1.3并行编程212

8.1.4数据并行214

8.2分布式信息检索217

8.3元搜索引擎218

8.3.1系统架构220

8.3.2资源选择222

8.3.3文档选择227

8.3.4信息融合228

8.4 P2P网络信息检索234

8.4.1 P2P网络信息检索的原理235

8.4.2非结构化P2P网络信息检索236

8.4.3结构化P2P网络信息检索238

8.5小结241

思考题241

习题242

参考文献244

第9章中文和跨语言信息检索247

9.1中文预处理247

9.1.1中文编码及转换248

9.1.2中文分词250

9.2中文信息检索256

9.2.1中文检索模型256

9.2.2中文索引258

9.3跨语言信息检索260

9.3.1基本原理260

9.3.2基于GVSM的跨语言检索264

9.3.3基于LSI的跨语言检索268

9.4小结271

思考题271

习题271

参考文献273

第10章多媒体信息检索274

10.1基于内容的图像信息检索275

10.2图像特征提取277

10.2.1颜色特征277

10.2.2形状特征提取284

10.2.3纹理特征提取285

10.3图像相似量度290

10.4基于内容的视频信息检索291

10.4.1镜头分割292

10.4.2关键帧提取293

10.5基于内容的音频信息检索294

10.6小结295

思考题296

习题296

参考文献297

第11章信息分类与聚类299

11.1基本知识299

11.1.1类的概念299

11.1.2对象特征描述300

11.1.3文档相似性300

11.1.4类间距离302

11.2特征描述及提取303

11.2.1特征提取303

11.2.2特征选择304

11.3聚类方法305

11.3.1划分聚类法305

11.3.2层次聚类法308

11.3.3其他聚类方法309

11.4分类方法309

11.4.1 Naive Bayes算法310

11.4.2 kNN算法313

11.4.3 Rocchio算法315

11.4.4 SVM算法316

11.5方法评测320

11.5.1聚类方法评测320

11.5.2分类方法评测321

11.5.3显著性检验323

11.6小结325

思考题325

习题326

参考文献328

第12章Web信息抽取与问答系统329

12.1信息抽取概述329

12.1.1信息抽取的发展330

12.1.2信息抽取的评价指标331

12.2 Web信息抽取331

12.2.1基于关键字的Web信息抽取332

12.2.2基于模式的Web信息抽取333

12.2.3基于样本的Web信息抽取338

12.3问答系统341

12.3.1问题分析344

12.3.2信息检索345

12.3.3答案抽取345

12.6小结347

思考题347

参考文献348