图书介绍
网络信息检索PDF|Epub|txt|kindle电子书版本网盘下载
- 董守斌,袁华编著 著
- 出版社: 西安:西安电子科技大学出版社
- ISBN:9787560623788
- 出版时间:2010
- 标注页数:348页
- 文件大小:44MB
- 文件页数:358页
- 主题词:计算机网络-情报检索-高等学校-教材
PDF下载
下载说明
网络信息检索PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1网络信息检索概述1
1.1.1网络信息1
1.1.2信息检索2
1.1.3网络信息检索3
1.2信息检索的发展4
1.2.1手工检索4
1.2.2脱机批处理检索4
1.2.3联机检索5
1.2.4网络信息检索6
1.3网络信息检索的应用6
1.3.1搜索引擎6
1.3.2多媒体信息检索8
1.3.3话题识别与跟踪10
1.3.4信息过滤11
1.3.5问题回答13
思考题15
参考文献15
第2章 信息检索模型16
2.1检索模型定义17
2.2布尔模型18
2.3向量模型20
2.3.1索引项权重21
2.3.2相似度量22
2.3.3计算方法23
2.4概率模型26
2.5扩展的布尔模型31
2.5.1模糊集合模型31
2.5.2扩展布尔模型33
2.6扩展的向量模型35
2.6.1广义向量空间模型35
2.6.2潜语义标引模型38
2.6.3神经网络模型41
2.7扩展的概率模型43
2.7.1推理网络模型44
2.7.2信任度网络模型47
2.7.3语言模型49
2.8小结51
思考题52
习题52
参考文献55
第3章 网络信息的自动搜集57
3.1网络信息的特点57
3.1.1 Web的组成57
3.1.2 Web的特点62
3.2网络信息搜集的原理64
3.2.1信息搜集的基本流程64
3.2.2遍历策略66
3.2.3页面解析68
3.3网络信息搜集的礼貌原则69
3.3.1机器人排斥协议69
3.3.2机器人元标签70
3.4高性能信息搜集71
3.4.1并行搜集71
3.4.2 DNS优化72
3.4.3优先搜集策略74
3.4.4网页更新74
3.4.5网页消重75
3.4.6避免蜘蛛陷阱76
3.5专题信息搜集77
3.5.1网页的主题特性77
3.5.2专题信息搜集算法78
3.6小结80
思考题80
习题80
参考文献83
第4章 网页文本处理和索引85
4.1文本的特性86
4.1.1信息熵86
4.1.2统计定律87
4.2网页信息的特征89
4.2.1网页结构89
4.2.2网页类型91
4.3网页去噪93
4.3.1基于网页结构的方法93
4.3.2基于模板的方法96
4.4文本处理96
4.4.1词汇分析99
4.4.2排除停用词100
4.4.3词干提取101
4.4.4索引词选择101
4.5索引102
4.5.1 Trie树102
4.5.2后缀树103
4.5.3签名档105
4.5.4倒排文件106
4.6小结112
思考题113
习题113
参考文献114
第5章 查询语言与查询处理116
5.1 Web查询语言116
5.1.1 WebSQL查询语言117
5.1.2 W3QL查询语言119
5.1.3 WebOQL查询语言119
5.2查询方式121
5.2.1基于关键字的查询121
5.2.2模式匹配124
5.3相关反馈125
5.3.1向量空间模型中的相关反馈126
5.3.2概率模型中的相关反馈128
5.4查询扩展129
5.4.1基于字典的简单查询扩展129
5.4.2自动局部分析132
5.4.3自动全局分析135
5.5小结139
思考题140
习题140
参考文献142
第6章 信息检索性能评价144
6.1信息检索评价指标144
6.1.1查全率和查准率144
6.1.2其他评价指标148
6.2信息检索评价基准156
6.2.1基准测试156
6.2.2 TREC评测158
6.2.3 Web检索评价162
6.2.4 CWIRF评测164
6.3小结166
思考题166
习题167
参考文献168
第7章 搜索引擎170
7.1概述171
7.1.1发展概况171
7.1.2术语与定义172
7.1.3工作原理174
7.2链接分析178
7.2.1 PageRank178
7.2.2 HITS186
7.2.3算法比较189
7.3相关排序190
7.3.1 Lucene检索模型190
7.3.2 Nutch排序算法193
7.4大规模搜索引擎198
7.4.1体系架构199
7.4.2数据结构200
7.4.3检索算法202
7.4.4相关排序202
7.5小结203
思考题204
习题204
参考文献207
第8章 并行和分布式信息检索209
8.1并行信息检索209
8.1.1并行计算的概念209
8.1.2并行信息检索体系架构210
8.1.3并行编程212
8.1.4数据并行214
8.2分布式信息检索217
8.3元搜索引擎218
8.3.1系统架构220
8.3.2资源选择222
8.3.3文档选择227
8.3.4信息融合228
8.4 P2P网络信息检索234
8.4.1 P2P网络信息检索的原理235
8.4.2非结构化P2P网络信息检索236
8.4.3结构化P2P网络信息检索238
8.5小结241
思考题241
习题242
参考文献244
第9章 中文和跨语言信息检索247
9.1中文预处理247
9.1.1中文编码及转换248
9.1.2中文分词250
9.2中文信息检索256
9.2.1中文检索模型256
9.2.2中文索引258
9.3跨语言信息检索260
9.3.1基本原理260
9.3.2基于GVSM的跨语言检索264
9.3.3基于LSI的跨语言检索268
9.4小结271
思考题271
习题271
参考文献273
第10章 多媒体信息检索274
10.1基于内容的图像信息检索275
10.2图像特征提取277
10.2.1颜色特征277
10.2.2形状特征提取284
10.2.3纹理特征提取285
10.3图像相似量度290
10.4基于内容的视频信息检索291
10.4.1镜头分割292
10.4.2关键帧提取293
10.5基于内容的音频信息检索294
10.6小结295
思考题296
习题296
参考文献297
第11章 信息分类与聚类299
11.1基本知识299
11.1.1类的概念299
11.1.2对象特征描述300
11.1.3文档相似性300
11.1.4类间距离302
11.2特征描述及提取303
11.2.1特征提取303
11.2.2特征选择304
11.3聚类方法305
11.3.1划分聚类法305
11.3.2层次聚类法308
11.3.3其他聚类方法309
11.4分类方法309
11.4.1 Naive Bayes算法310
11.4.2 kNN算法313
11.4.3 Rocchio算法315
11.4.4 SVM算法316
11.5方法评测320
11.5.1聚类方法评测320
11.5.2分类方法评测321
11.5.3显著性检验323
11.6小结325
思考题325
习题326
参考文献328
第12章Web信息抽取与问答系统329
12.1信息抽取概述329
12.1.1信息抽取的发展330
12.1.2信息抽取的评价指标331
12.2 Web信息抽取331
12.2.1基于关键字的Web信息抽取332
12.2.2基于模式的Web信息抽取333
12.2.3基于样本的Web信息抽取338
12.3问答系统341
12.3.1问题分析344
12.3.2信息检索345
12.3.3答案抽取345
12.6小结347
思考题347
参考文献348