图书介绍
Python文本分析PDF|Epub|txt|kindle电子书版本网盘下载
![Python文本分析](https://www.shukui.net/cover/3/31365486.jpg)
- (印)迪潘简·撒卡尔(Dipanjan Sarkar)著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111593249
- 出版时间:2018
- 标注页数:276页
- 文件大小:35MB
- 文件页数:283页
- 主题词:数据处理
PDF下载
下载说明
Python文本分析PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 自然语言基础1
1.1 自然语言2
1.1.1 什么是自然语言2
1.1.2 语言哲学2
1.1.3 语言习得和用法4
1.2 语言学6
1.3 语言句法和结构7
1.3.1 词8
1.3.2 短语9
1.3.3 从句10
1.3.4 语法11
1.3.5 语序类型学17
1.4 语言语义17
1.4.1 词汇语义关系18
1.4.2 语义网络和模型20
1.4.3 语义表示21
1.5 文本语料库27
1.5.1 文本语料库标注及使用27
1.5.2 热门的语料库28
1.5.3 访问文本语料库29
1.6 自然语言处理33
1.6.1 机器翻译33
1.6.2 语音识别系统34
1.6.3 问答系统34
1.6.4 语境识别与消解34
1.6.5 文本摘要35
1.6.6 文本分类35
1.7 文本分析35
1.8 小结36
第2章 Python语言回顾37
2.1 了解Python37
2.1.1 Python之禅39
2.1.2 应用:何时使用Python40
2.1.3 缺点:何时不用Python41
2.1.4 Python实现和版本42
2.2 安装和设置43
2.2.1 用哪个Python版本43
2.2.2 用哪个操作系统44
2.2.3 集成开发环境44
2.2.4 环境设置44
2.2.5 虚拟环境46
2.3 Python句法和结构48
2.4 数据结构和类型50
2.4.1 数值类型51
2.4.2 字符串52
2.4.3 列表53
2.4.4 集合54
2.4.5 字典55
2.4.6 元组56
2.4.7 文件56
2.4.8 杂项57
2.5 控制代码流57
2.5.1 条件结构57
2.5.2 循环结构58
2.5.3 处理异常60
2.6 函数编程61
2.6.1 函数61
2.6.2 递归函数62
2.6.3 匿名函数63
2.6.4 迭代器63
2.6.5 分析器64
2.6.6 生成器66
2.6.7 itertools和functools模块67
2.7 类67
2.8 使用文本69
2.8.1 字符串文字69
2.8.2 字符串操作和方法70
2.9 文本分析框架77
2.10 小结77
第3章 处理和理解文本79
3.1 文本切分80
3.1.1 句子切分80
3.1.2 词语切分83
3.2 文本规范化85
3.2.1 文本清洗85
3.2.2 文本切分86
3.2.3 删除特殊字符86
3.2.4 扩展缩写词87
3.2.5 大小写转换88
3.2.6 删除停用词89
3.2.7 词语校正89
3.2.8 词干提取95
3.2.9 词形还原97
3.3 理解文本句法和结构98
3.3.1 安装必要的依赖项99
3.3.2 机器学习重要概念100
3.3.3 词性标注100
3.3.4 浅层分析106
3.3.5 基于依存关系的分析114
3.3.6 基于成分结构的分析118
3.4 小结123
第4章 文本分类124
4.1 什么是文本分类125
4.2 自动文本分类126
4.3 文本分类的蓝图128
4.4 文本规范化处理129
4.5 特征提取132
4.5.1 词袋模型133
4.5.2 TF-IDF模型134
4.5.3 高级词向量模型139
4.6 分类算法143
4.6.1 多项式朴素贝叶斯144
4.6.2 支持向量机145
4.7 评估分类模型147
4.8 建立一个多类分类系统150
4.9 应用158
4.10 小结158
第5章 文本摘要159
5.1 文本摘要和信息提取160
5.2 重要概念161
5.2.1 文档161
5.2.2 文本规范化161
5.2.3 特征提取161
5.2.4 特征矩阵161
5.2.5 奇异值分解162
5.3 文本规范化163
5.4 特征提取164
5.5 关键短语提取165
5.5.1 搭配165
5.5.2 基于权重标签的短语提取168
5.6 主题建模171
5.6.1 隐含语义索引172
5.6.2 隐含Dirichlet分布176
5.6.3 非负矩阵分解179
5.6.4 从产品评论中提取主题180
5.7 自动文档摘要183
5.7.1 隐含语义分析185
5.7.2 TextRank算法187
5.7.3 生成产品说明摘要190
5.8 小结191
第6章 文本相似度和聚类193
6.1 重要概念194
6.1.1 信息检索194
6.1.2 特征工程194
6.1.3 相似度测量194
6.1.4 无监督的机器学习算法195
6.2 文本规范化195
6.3 特征提取196
6.4 文本相似度197
6.5 词项相似度分析198
6.5.1 汉明距离200
6.5.2 曼哈顿距离201
6.5.3 欧几里得距离202
6.5.4 莱文斯坦编辑距离202
6.5.5 余弦距离和相似度206
6.6 文档相似度分析207
6.6.1 余弦相似度209
6.6.2 海灵格-巴塔恰亚距离210
6.6.3 Okapi BM25排名212
6.7 文档聚类215
6.8 最佳影片聚类分析217
6.8.1 k-means聚类219
6.8.2 近邻传播聚类224
6.8.3 沃德凝聚层次聚类227
6.9 小结230
第7章 语义与情感分析232
7.1 语义分析233
7.2 探索WordNet233
7.2.1 理解同义词集234
7.2.2 分析词汇的语义关系235
7.3 词义消歧240
7.4 命名实体识别241
7.5 分析语义表征244
7.5.1 命题逻辑244
7.5.2 一阶逻辑245
7.6 情感分析249
7.7 IMDb电影评论的情感分析249
7.7.1 安装依赖程序包250
7.7.2 准备数据集252
7.7.3 有监督的机器学习技术253
7.7.4 无监督的词典技术256
7.7.5 模型性能比较271
7.8 小结272