
微信扫一扫,移动浏览光盘
简介
目录
第 1章绪论1
第 2章深度学习基础5
2.1有监督学习 5
2.2单层神经网络 6
2.2.1基本模型6
2.2.2激活函数7
2.3前馈深度神经网络.10
2.3.1反向传播算法11
2.3.2正则化15
2.4循环神经网络 17
2.4.1循环神经网络基础17
2.4.2长短时记忆网络20
2.4.3门控循环神经网络22
2.4.4深层 RNN结构23
2.4.5序列数据的 RNN建模框架 25
2.5卷积神经网络 26
2.5.1卷积神经网络基础27
2.5.2其他卷积形式31
2.5.3残差神经网络35
2.5.4时序卷积网络37
2.6神经网络中的归一化 39
2.6.1批归一化39
2.6.2层归一化41
2.7神经网络中的注意力机制.42
2.7.1编码器-解码器框架42
2.7.2 编码器
-注意力机制-解码器框架44
2.
7.3 单调注意力机制46
Transformer47
2.7.4
2.8生成对抗网络
48
2.8.1 基本结构
.49
2.8.2 模型训练
.51
2.9本章小结
52
第 3章语音检测53
3.1引言
.53
3.2基本知识
54
3.2.1 信号模型
.54
3.2.2 评价指标
.55
3.3语音检测模型
57
3.
3.1 语音检测模型的基本框架57
3.
3.2 基于深度置信网络的语音检测58
3.
3.3 基于降噪深度神经网络的语音检测61
3.
3.4 基于多分辨率堆栈的语音检测模型框架63
3.
4语音检测模型的损失函数.65
3.
4.1 小化交叉熵66
3.
4.2 小均方误差66
3.4.3 化
ROC曲线下面积66
3.
5语音检测的声学特征 69
3.
5.1 短时傅里叶变换的频带选择69
3.
5.2 多分辨率类耳蜗频谱特征70
3.
6模型的泛化能力.72
3.7本章小结
73
第 4章单通道语音增强75
4.1引言
.75
4.2基本知识
77
4.2.1 信号模型
.77
4.2.2 评价指标
.79
4.3频域语音增强
81
4.3.1算法框架
.81
4.3.2训练目标
.82
4.
3.3语音增强模型89
4.
3.4语音去混响模型93
4.4时域语音增强
100
4.4.1关键问题
.101
4.4.2卷积模型
.102
4.4.3损失函数
.104
4.5本章小结
106
第 5章多通道语音增强107
5.1引言
107
5.2信号模型
108
5.
3空间特征提取法 109
5.3.1空间特征
.109
5.3.2深度模型
.111
5.4波束形成方法
113
5.
4.1自适应波束形成器114
5.4.2噪声估计
.116
5.
4.3基于神经网络的波束形成方法117
5.
5自组织麦克风阵列方法 121
5.
5.1深度自组织波束形成123
5.
5.2通道权重估计124
5.
5.3通道选择算法125
5.6本章小结
131
第 6章多说话人语音分离 133
6.1引言
133
6.2信号模型
134
6.
3与说话人相关的语音分离方法 134
6.
3.1模型匹配法134
6.
3.2声纹特征法139
6.
4与说话人无关的语音分离142
6.
4.1深度聚类算法143
6.
4.2置换不变训练算法146
6.
4.3基于时域卷积的端到端语音分离算法148
6.5本章小结
151
第 7章声纹识别153
7.1引言
153
7.2说话人确认
155
7.
2.1说话人确认基础155
7.
2.2基于分类损失的深度嵌入说话人确认算法159
7.
2.3基于确认损失的端到端说话人确认算法168
7.
3说话人分割聚类 173
7.
3.1说话人分割聚类基础174
7.
3.2分阶段说话人分割聚类176
7.
3.3端到端说话人分割聚类算法180
7.4鲁棒声纹识别
183
7.
4.1结合增强前端的抗噪声纹识别183
7.
4.2基于无监督域自适应的鲁棒声纹识别185
7.5本章小结
188
第 8章语音识别191
8.1引言
191
8.2语音识别基础
193
8.2.1信号模型
.193
8.2.2评价指标
.193
8.
3端到端语音识别 194
8.
3.1连接时序分类模型194
8.
3.2注意力机制模型203
8.
4语音识别的噪声鲁棒方法206
8.5说话人自适应
210
8.
5.1说话人自适应训练210
8.
5.2测试阶段自适应214
8.6本章小结
220
参考文献 221
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
