基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构.但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进而无法获得理想的识别效果.在实际应用中,通常会使用一些技巧来缓解过拟合问题,例如在待优化的目标函数中加入L2正则项就是常用的方法之一.该文提出一种空间平滑的方法,把BLSTM模型激活值的向量重组成一个2维图,通过滤波变换得到它的空间信息,并将平滑该空间信息作为辅助优化目标,与传统的损失函数一起,作为优化神经网络参数的学习准则.实验表明,在电话交谈语音识别任务上,这种方法相比于基线模型取得了相对4%的词错误率(WER)下降.进一步探索了L2范数正则技术和空间平滑方法的互补性,实验结果表明,同时应用这2种算法,能够取得相对8.6%的WER下降.
推荐文章
基于卷积神经网络与双向长短时记忆网络组合模型的短时交通流预测
智能交通
短时交通流预测
深度学习
CNN
BiLSTM
长短时记忆网络的自由体操视频自动描述方法
长短时记忆网络
注意力机制
自由体操
自动描述
融合宽残差和长短时记忆网络的动态手势识别研究
手势识别
3D卷积神经网络
长短时记忆网络
宽残差网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 双向长短时记忆模型训练中的空间平滑正则化方法研究
来源期刊 电子与信息学报 学科 工学
关键词 语音信号处理 空间平滑 双向长短时记忆模型(LSTM) 正则化 过拟合
年,卷(期) 2019,(3) 所属期刊栏目 论文
研究方向 页码范围 544-550
页数 7页 分类号 TN912.34
字数 5648字 语种 中文
DOI 10.11999/JEIT180314
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张鹏远 中国科学院声学研究所语言声学与内容理解重点实验室 18 77 6.0 8.0
5 葛凤培 中国科学院声学研究所语言声学与内容理解重点实验室 8 40 3.0 6.0
9 李文洁 中国科学院声学研究所语言声学与内容理解重点实验室 4 16 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音信号处理
空间平滑
双向长短时记忆模型(LSTM)
正则化
过拟合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导