图书介绍
大规模真实文本汉语字母词语考察研究PDF|Epub|txt|kindle电子书版本网盘下载
![大规模真实文本汉语字母词语考察研究](https://www.shukui.net/cover/70/33224294.jpg)
- 郑泽芝著 著
- 出版社: 厦门:厦门大学出版社
- ISBN:9787561534892
- 出版时间:2010
- 标注页数:295页
- 文件大小:11MB
- 文件页数:313页
- 主题词:汉字信息处理-研究
PDF下载
下载说明
大规模真实文本汉语字母词语考察研究PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 绪论1
1 字母词语的界定2
2 字母词语与真实文本7
3 本书的结构9
第二章 主流报纸媒体字母词语的使用状况11
1 语料的选择11
2 文本中使用的非汉字符13
3 外文字母在汉语文本中的使用情况14
4 媒体字母词语的量化概况17
5 各报纸媒体字母词语概况18
5.1 《人民日报》字母词语概况18
5.2 《北京青年报》字母词语概况19
5.3 《羊城晚报》字母词语概况30
6 媒体字母词语的一次性使用情况32
7 不同性质媒体中字母词语的使用情况33
8 媒体共有字母词语情况36
9 小结37
第三章 字母词语中的标点39
1 字母词语中的标点符号40
2 字母词语中标点符号出现情况及问题40
2.1 字母词语中标点的出现情况40
2.2 与标点相关问题的处理46
3 小结47
第四章 字母词语中的数字48
1 数字在字母前的情形49
2 数字在字母后的情形50
3 含数字字母词语之管见51
第五章 单字母、多字母、光杆字母词语与字母词语并列结构53
1 单字母字母词语53
2 多字母字母词语考察56
3 光杆字母词语与外语原文缩略语60
3.1 光杆字母词语使用状况60
3.2 字母词语原文缩略和汉语拼音成词问题63
4 字母词语的并列结构65
第六章 双语对释字母词语69
1 双语对释字母词语在文本中的使用情况概述69
2 对释汉字串的分布考察76
3 双语对释字母词语语形历时演化分析76
4 双语对释字母词语使用方式演化78
4.1 共有双语对释字母词语Ⅰ型、Ⅱ型分布78
4.2 双语对释全称简称形式的演化79
4.3 字母词语中的新词语80
5 小结81
第七章 字母词语领域分布特点83
1 媒体主题领域聚类83
2 字母词语在各主题领域的量化分布规律84
2.1 一般字母词语领域分布情况84
2.2 双语对释字母词语领域分布情况87
3 领域共有字母词语的情况分析90
4 各主题域独有字母词语情况分析92
5 小结93
第八章 字母词语有多少种用法94
1 字母词语的用法分类94
2 字母词语的用法分布情况97
3 字母词语领域和用法交叉分布情况100
4 小结103
第九章 字母词语的演化态势104
1 字母词语的使用数量的历时演化104
2 字母词语一次性使用的历时变化105
3 字母词语变化程度及变化趋势106
4 一般字母词语的演化情况分析108
4.1 数量变化108
4.2 字母词语搭配汉字的情况109
4.3 共有一般词语的分类考察111
5 字母词语稳定性112
第十章 字母词语的使用与规范114
1 字母词语的层次划分114
1.1 字母词语三圈划分114
1.2 外语原词、计算机相关词语在文本中的使用情况116
2 字母词语来源分析118
3 外文字母使用例析121
4 字母词语不规范情况分类124
5 字母词语的词性问题125
6 字母词语的归化125
7 关于字母词语的几点建议126
第十一章 字母词语对汉语文字系统的影响128
1 语言与文字128
2 从外来语到字母词语131
2.1 传统外来语的影响131
2.2 字母词语与汉语言系统134
3 汉语文字系统137
4 汉字系统可否发生变化140
5 小结142
第十二章 通用字母词语提取研究144
1 通用词语的各种量化属性144
2 字母词语量化属性观察分析145
3 通用字母词语提取算法146
3.1 绝对指标提取方法146
3.2 通用度方法149
3.3 散布均匀度方法154
3.4 小结155
4 低使用率词语的处理156
5 通用字母词语的一些特性157
6 小结158
第十三章 字母词语的自动识别159
1 字母词语与术语、专名的关系159
1.1 字母词语自身的特点160
1.2 字母词语与术语的关系160
1.3 字母词语与专有名词的关系161
2 字母词语识别的难点分析与字母词语统计特征162
2.1 字母词语和标点符号162
2.2 字母串与汉字串搭配的分合问题163
2.3 字母词语的一次性出现与语形不规范问题164
2.4 字母词语边界歧义165
2.5 字母串的合法性与字母词语之间的分割问题165
2.6 字母词语的统计特征166
3 字母词语的自动识别168
3.1 规则的获取168
3.2 字母词语数据稀疏问题的处理策略170
3.3 搭配概率矩阵的获取171
3.4 自动标注模型174
3.5 实验结果178
4 小结180
第十四章 字母词语的社会接受程度考察181
1 教育程度和字母词语的接受程度181
2 不同人群对字母词语的接受程度调查184
3 小结186
第十五章 结束语187
1 本书的主要结论和观点187
1.1 主流报纸媒体字母词语共时状况考察187
1.2 字母词语的专项考察188
1.3 字母词语的主题分布、用法分布情况考察189
1.4 字母词语的历时演化190
1.5 关于通用字母词语的提取190
1.6 关于字母词语的自动识别191
1.7 对字母词语社会接受情况的调查191
2 存在的问题192
3 几点思考194
附录1 《人民日报》历时5年一般字母词语196
附录2 《人民日报》双语对释字母词语199
附录3 2002年《人民日报》《北京青年报》《羊城晚报》共有字母词语225
附录4 《北京青年报》双语对释字母词语(2002)232
附录5 《羊城晚报》双语对释字母词语(2002)259
附录6 字母词语研究文献索引270
参考文献284
后记292