图书介绍

语音信号处理PDF|Epub|txt|kindle电子书版本网盘下载

语音信号处理
  • 赵力编著(东南大学信息与工程学院) 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111271901
  • 出版时间:2009
  • 标注页数:331页
  • 文件大小:24MB
  • 文件页数:343页
  • 主题词:语言信号处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

语音信号处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

第2章 语音信号处理基础知识5

2.1 语音和语言5

2.2 汉语语音学10

2.2.1 汉语语音的特点10

2.2.2 汉语的拼音方法10

2.2.3 汉语音节的一般结构11

2.2.4 汉语声母的结构12

2.2.5 汉语韵母的结构13

2.2.6 声母和韵母的相互作用——音征互载13

2.2.7 汉语的声调14

2.3 语音生成系统和语音感知系统14

2.3.1 语音发音系统14

2.3.2 语音听觉系统16

2.4 语音信号生成的数学模型21

2.4.1 激励模型21

2.4.2 声道模型22

2.4.3 辐射模型25

2.4.4 语音信号的数学模型26

2.5 语音信号的特性分析27

2.5.1 语音信号的时域波形和频谱特性27

2.5.2 语音信号的语谱图29

2.5.3 语音信号的统计特性30

2.6 思考与复习题31

第3章 语音信号分析32

3.1 概述32

3.2 语音信号的数字化和预处理32

3.2.1 预滤波、采样、A/D转换33

3.2.2 预处理34

3.3 语音信号的时域分析37

3.3.1 短时能量及短时平均幅度分析37

3.3.2 短时过零率分析38

3.3.3 短时相关分析39

3.3.4 短时平均幅度差函数43

3.4 语音信号的频域分析44

3.4.1 利用短时傅里叶变换求语音的短时谱44

3.4.2 语音的短时谱的临界带特征矢量46

3.5 语音信号的倒谱分析47

3.5.1 同态信号处理的基本原理47

3.5.2 复倒谱和倒谱48

3.5.3 语音信号倒谱分析实例50

3.6 语音信号的线性预测分析53

3.6.1 线性预测分析的基本原理53

3.6.2 线性预测方程组的求解55

3.6.3 LPC谱估计和LPC复倒谱59

3.6.4 线谱对分析61

3.7 语音信号的小波分析63

3.7.1 傅里叶变换64

3.7.2 短时傅里叶变换65

3.7.3 连续小波变换65

3.7.4 离散小波变换66

3.7.5 小波变换的几个实例68

3.8 基音周期估计70

3.8.1 自相关法70

3.8.2 平均幅度差函数法73

3.8.3 并行处理法74

3.8.4 倒谱法76

3.8.5 简化逆滤波法78

3.8.6 小波变换法78

3.8.7 基音检测的后处理79

3.9 共振峰估计81

3.9.1 带通滤波器组法81

3.9.2 倒谱法82

3.9.3 LPC法83

3.10 思考与复习题85

第4章 矢量量化技术86

4.1 概述86

4.2 矢量量化的基本原理86

4.3 矢量量化的失真测度89

4.3.1 欧氏距离测度89

4.3.2 线性预测失真测度90

4.3.3 识别失真测度91

4.4 矢量量化器的最佳码本设计92

4.4.1 LBG算法92

4.4.2 初始码本的生成93

4.5 矢量量化技术的优化设计94

4.6 思考与复习题96

第5章 隐马尔可夫模型97

5.1 隐马尔可夫模型的引入97

5.2 隐马尔可夫模型的定义99

5.2.1 离散Markov过程99

5.2.2 隐Markov模型100

5.2.3 HMM的基本元素100

5.3 隐马尔可夫模型的基本算法102

5.3.1 前向-后向算法103

5.3.2 维特比算法105

5.3.3 Baum-Welch算法106

5.4 隐马尔可夫模型的各种结构类型107

5.4.1 按照HMM的状态转移概率矩阵(A参数)分类107

5.4.2 按照HMM的输出概率分布(B参数)分类108

5.4.3 其他一些特殊的HMM的形式110

5.5 隐马尔可夫模型的一些实际问题111

5.5.1 下溢问题111

5.5.2 参数的初始化问题111

5.5.3 提高HMM描述语音动态特性的能力113

5.5.4 直接利用状态持续时间分布概率的HMM系统113

5.6 思考与复习题115

第6章 人工神经网络初步116

6.1 人工神经网络简介116

6.2 人工神经网络的构成117

6.2.1 神经元117

6.2.2 神经元的学习算法119

6.2.3 网络拓扑119

6.2.4 网络的学习算法119

6.3 几种用于模式识别的神经网络模型及其主要算法120

6.3.1 单层感知器120

6.3.2 双层感知器121

6.3.3 多层感知器122

6.3.4 径向基函数神经网络的分类特性123

6.3.5 自组织特征映射模型124

6.3.6 时延神经网络125

6.3.7 循环神经网络127

6.3.8 支持向量机128

6.4 用神经网络进行模式识别的典型做法129

6.4.1 多输出型130

6.4.2 单输出型130

6.5 思考与复习题130

第7章 语音编码132

7.1 概述132

7.2 语音信号压缩编码的原理和压缩系统评价134

7.2.1 语音压缩的基本原理134

7.2.2 语音编码的关键技术136

7.2.3 语音压缩系统的性能指标和评测方法138

7.3 语音信号的波形编码144

7.3.1 脉冲编码调制144

7.3.2 自适应预测编码148

7.3.3 自适应增量调制和自适应差分脉冲编码调制149

7.3.4 子带编码153

7.3.5 自适应变换编码158

7.4 语音信号的参数编码161

7.4.1 线性预测声码器161

7.4.2 LPC-10编码器163

7.5 语音信号的混合编码167

7.6 现代通信中的语音信号编码方法169

7.6.1 EVRC算法基本原理169

7.6.2 EVRC算法概述170

7.7 思考与复习题174

第8章 语音合成175

8.1 概述175

8.2 共振峰合成法177

8.3 线性预测合成法179

8.4 语音合成专用硬件简介182

8.5 PSOLA算法合成语音185

8.6 文语转换系统187

8.7 思考与复习题189

第9章 语音识别191

9.1 概述191

9.2 语音识别原理和识别系统的组成195

9.2.1 预处理和参数分析196

9.2.2 语音识别198

9.2.3 语音识别系统的基本数据库200

9.3 动态时间规整201

9.4 孤立字(词)识别系统202

9.4.1 基于MQDF的汉语塞音语音识别系统204

9.4.2 基于概率尺度DP识别方法的孤立字(词)识别系统206

9.5 连续语音识别系统207

9.6 连续语音识别系统的性能评测210

9.6.1 连续语音识别系统的评测方法以及系统复杂性和识别能力的测度210

9.6.2 综合评估连续语音识别系统时需要考虑的其他因素213

9.7 思考与复习题214

第10章 说话人识别与语种辨识215

10.1 概述215

10.2 说话人识别方法和系统结构216

10.2.1 预处理217

10.2.2 说话人识别特征的选取217

10.2.3 特征参量评价方法219

10.2.4 模式匹配方法220

10.2.5 说话人识别中判别方法和阈值的选择221

10.2.6 说话人识别系统的评价222

10.3 应用DTW的说话人确认系统222

10.4 应用VQ的说话人识别系统223

10.5 应用HMM的说话人识别系统225

10.5.1 基于HMM的与文本有关的说话人识别225

10.5.2 基于HMM的与文本无关的说话人识别226

10.5.3 基于HMM的指定文本型说话人识别226

10.5.4 说话人识别HMM的学习方法227

10.5.5 鲁棒的HMM说话人识别技术227

10.6 应用GMM的说话人识别系统228

10.6.1 GMM模型的基本概念228

10.6.2 GMM模型的参数估计228

10.6.3 训练数据不充分的问题230

10.6.4 GMM模型的识别问题230

10.7 说话人识别中尚需进一步探索的研究课题231

10.8 语种辨识的原理和应用232

10.8.1 语种辨识的基本原理和方法232

10.8.2 语种辨识的应用领域236

10.9 思考与复习题236

第11章 语音转换与语音隐藏238

11.1 语音转换的原理和应用238

11.2 常用语音转换的方法241

11.2.1 频谱特征参数转换242

11.2.2 基音周期转换244

11.2.3 韵律信息转换245

11.3 语音分析模型和语音库的选择245

11.3.1 语音分析模型245

11.3.2 语音库的设计248

11.4 应用GMM的语音转换250

11.5 语音转换的研究方向251

11.6 语音信息隐藏的原理及应用252

11.7 语音信息隐藏的常用方法254

11.8 语音信息隐藏系统的评价标准257

11.9 语音信息隐藏需要研究和解决的问题259

11.10 思考与复习题260

第12章 语音信号中的情感信息处理261

12.1 概述261

12.2 语音信号中的情感分类和情感特征分析261

12.2.1 情感的分类261

12.2.2 情感特征分析262

12.3 语音情感识别方法267

12.3.1 主元分析法267

12.3.2 神经网络方法268

12.3.3 混合高斯模型法269

12.4 情感语音的合成269

12.5 今后的研究方向271

12.6 思考与复习题272

第13章 耳语音信号处理273

13.1 耳语音的声学特征分析273

13.1.1 音长274

13.1.2 音高275

13.1.3 声调276

13.1.4 共振峰频率276

13.1.5 耳语音美尔频率倒谱特征参数分析277

13.2 耳语音增强278

13.3 耳语音转换正常音280

13.4 耳语音识别281

13.4.1 孤立字(词)的耳语音识别281

13.4.2 耳语音的说话人识别282

13.5 耳语音的研究方向282

13.6 思考与复习题283

第14章 语音增强285

14.1 概述285

14.2 语音特性、人耳感知特性及噪声特性286

14.2.1 语音特性286

14.2.2 人耳感知特性286

14.2.3 噪声特性287

14.3 滤波法语音增强技术287

14.3.1 陷波器法287

14.3.2 自适应滤波器288

14.4 利用相关特性的语音增强技术290

14.4.1 自相关处理抗噪法语音增强技术290

14.4.2 利用复数帧段主分量特征的降噪方法291

14.5 非线性处理法语音增强技术292

14.5.1 中心削波法292

14.5.2 同态滤波法293

14.6 减谱法语音增强技术294

14.6.1 基本原理294

14.6.2 基本减谱法的改进295

14.7 利用Weiner滤波法的语音增强技术296

14.7.1 基本原理296

14.7.2 Weiner滤波的改进形式297

14.8 思考与复习题297

附录A 语音信号LPC美尔倒谱系数(LPCMCC)分析程序299

附录B 利用HMM的孤立字(词)语音识别程序307

附录C 汉英名词术语对照321

参考文献329

热门推荐