图书介绍

中文信息处理原理及应用 第2版PDF|Epub|txt|kindle电子书版本网盘下载

中文信息处理原理及应用 第2版
  • 苗夺谦,卫志华,张志飞编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302389507
  • 出版时间:2015
  • 标注页数:281页
  • 文件大小:43MB
  • 文件页数:293页
  • 主题词:汉字信息处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

中文信息处理原理及应用 第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1部分 预备知识3

第1章 概论3

1.1 自然语言处理与中文信息处理3

1.1.1 自然语言处理3

1.1.2 中文信息处理4

1.2 研究内容6

1.3 应用领域8

第2章 预备知识9

2.1 数学基础9

2.1.1 概率论9

2.1.2 随机过程11

2.1.3 信息论18

2.1.4 形式语言与自动机21

2.2 语言学基础24

2.2.1 计算语言学概述24

2.2.2 语素和词24

2.2.3 句法与篇章语法25

2.2.4 词义与句义27

第2部分 词法分析33

第3章 自动分词概述33

3.1 自动分词33

3.1.1 分词规范33

3.1.2 自动分词的研究内容及意义34

3.1.3 自动分词方法34

3.2 分词歧义问题35

3.3 未登录词问题37

3.4 自动分词评测39

第4章 基于词典的分词方法43

4.1 分词词典43

4.1.1 关于分词词典的构造43

4.1.2 基于词属性的分词词典44

4.1.3 基于逐字二分的分词词典45

4.2 机械分词方法46

4.2.1 正向最大匹配算法46

4.2.2 逆向最大匹配算法47

4.2.3 邻近匹配算法48

4.2.4 最短路径匹配算法49

4.3 基于规则的分词方法51

4.3.1 分词预处理中的规则51

4.3.2 分词规则52

4.4 中文姓名切分54

4.4.1 切分姓名中的当用资源54

4.4.2 同源对表、互斥对表及其操作57

4.4.3 姓名左右边界的确定57

4.4.4 屏蔽与恢复58

4.4.5 同源对表和互斥对表的校正规则58

4.4.6 概率再筛选59

4.4.7 中文姓名切分系统59

第5章 基于语料库的分词方法61

5.1 语料库61

5.1.1 语料库概述61

5.1.2 语料库加工规范65

5.1.3 现代汉语语料库构建实例71

5.2 基于统计的分词方法72

5.2.1 统计分词概述72

5.2.2 统计分词消歧73

5.2.3 统计未登录词获取76

5.2.4 统计分词模型83

5.3 基于机器学习的分词方法85

5.3.1 最大熵分词86

5.3.2 条件随机场分词88

第2部分习题91

第3部分 语法分析95

第6章 自动词性标注95

6.1 词性标注概述95

6.1.1 词性标注95

6.1.2 词性标记规范96

6.1.3 词性消歧97

6.1.4 词性标注评测98

6.2 基于统计的词性标注方法99

6.2.1 统计模型的训练99

6.2.2 马尔可夫模型标注方法100

6.2.3 隐马尔可夫模型标注方法103

6.3 基于规则的词性标注方法106

6.3.1 按兼类词搭配关系构造的规则106

6.3.2 按词语结构获取的规则107

6.4 其他标注方法108

6.4.1 基于规则和统计相结合的标注方法108

6.4.2 基于条件随机场的词性标注方法109

6.4.3 词性标注中的未登录词处理方法109

第7章 语法表示方法110

7.1 语法表示概述110

7.2 形式语法描述110

7.2.1 重写规则110

7.2.2 转移网络112

7.3 短语结构语法113

7.4 依存语法115

第8章 句法分析方法117

8.1 句法分析概述117

8.1.1 句法分析117

8.1.2 结构歧义118

8.1.3 句法分析评测119

8.2 基于规则的句法分析方法120

8.2.1 自顶向下句法分析121

8.2.2 自底向上句法分析122

8.2.3 线图句法分析124

8.2.4 转移网络句法分析126

8.3 基于统计的句法分析方法129

8.3.1 概率上下文无关文法分析129

8.3.2 依存句法分析137

第3部分习题142

第4部分 语义分析147

第9章 概念标注147

9.1 概念标注概述147

9.2 语言知识库148

9.3 概念标注方法150

第10章 语义表示154

10.1 语义表示概述154

10.2 语义逻辑表示法155

10.2.1 一阶谓词演算155

10.2.2 基本逻辑形式语言157

10.2.3 逻辑形式中的歧义表示159

10.2.4 论旨角色160

10.3 语义网络表示法161

10.4 语义框架表示法162

第11章 语义分析166

11.1 语义分析概述166

11.2 基于语义特征的语义分析167

11.2.1 组合理论167

11.2.2 λ表达式与语义解释168

11.2.3 带语义解释的简单语法和词典170

11.2.4 语义角色172

11.2.5 特征合一的语义解释173

11.3 基于语法关系的语义分析176

11.4 基于模板匹配的语义分析179

11.5 语义消歧183

11.5.1 语义消歧概述183

11.5.2 基于规则的语义消歧184

11.5.3 基于统计的语义消歧193

第4部分习题199

第5部分 应用与技术203

第12章 文本分类203

12.1 文本分类概述203

12.1.1 自动文本分类定义203

12.1.2 文本分类任务的特点204

12.1.3 文本分类基本实现途径204

12.1.4 文本分类的组成205

12.1.5 文本分类的应用领域206

12.1.6 国内外研究现状207

12.2 文本分类方法208

12.2.1 文本表示与文本特征选择208

12.2.2 分类器设计211

12.2.3 分类器的阈值选择215

12.3 文本分类评测216

12.3.1 单类赋值216

12.3.2 多类排序218

第13章 信息检索219

13.1 信息检索概述219

13.1.1 信息检索的对象和任务219

13.1.2 信息检索的评测220

13.1.3 信息检索模型220

13.1.4 中文信息检索的特点222

13.2 基于统计的信息检索模型222

13.2.1 布尔模型及其扩展222

13.2.2 向量空间模型224

13.2.3 概率模型232

13.3 基于语义的信息检索239

13.3.1 基于NLP的方法239

13.3.2 潜在语义索引241

13.3.3 基于神经网络的信息检索246

13.4 信息检索技术评测247

13.4.1 文本检索会议247

13.4.2 亚洲语言信息检索评测会议248

13.4.3 863信息检索评测项目248

13.5 Web信息检索249

13.5.1 Web信息检索的特点249

13.5.2 搜索引擎251

第14章 问答系统258

14.1 问答系统概述258

14.1.1 问答系统的发展258

14.1.2 问答系统的定义259

14.1.3 问答系统的研究趋势260

14.2 关键技术260

14.2.1 关键词抽取261

14.2.2 关键词扩展263

14.3 问答系统评测264

14.4 Watson问答系统265

第15章 自动文摘267

15.1 自动文摘概述267

15.1.1 文摘的定义267

15.1.2 文摘的分类268

15.1.3 自动文摘的意义269

15.2 自动文摘的方法269

15.2.1 基于统计的自动文摘269

15.2.2 基于理解的自动文摘270

15.2.3 基于信息抽取的自动文摘方法271

15.2.4 基于结构的自动文摘271

15.3 自动文摘系统评测272

15.3.1 内部评价272

15.3.2 外部评价273

15.4 自动文摘系统273

第5部分习题275

附录A 北京大学计算语言学研究所汉语词性标注标记集276

附录B 哈尔滨工业大学CDT依存句法标注体系278

参考文献279

热门推荐