基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化,而连续语音识别是以序列级转录准确性为性能度量.针对这个不同,构建基于序列级转录的端到端语音识别系统.针对低资源语料条件下系统性能不佳的问题,其中模型使用卷积神经网络对输入特征进行处理,选取最佳的网络结构,在时域和频域进行二维卷积,从而改善输入空间中因不同环境和说话人产生的小扰动影响.同时神经网络使用批量归一化技术来减少泛化误差,加速训练.基于大型的语言模型,优化解码过程中的超参数,提高模型建模效果.实验结果表明系统性能提升约24%,优于主流语音识别系统.
推荐文章
基于改进混合CTC/attention架构的端到端普通话语音识别
语音识别
链接时序分类
注意力机制
混合CTC/attention
端到端系统
一种基于CNN/CTC的端到端普通话语音识别方法
卷积神经网络
中文语音识别
连接时序分类
端到端系统
普通话双模态情感语音数据库的设计与评价
数据库
情感语音
发音动作参数
汉语普通话
信号处理
普通话语音库
剖析广播电视节目主持人普通话语音失范现象
广播电视节目主持人
普通话
语音规范性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进卷积输入的端到端普通话语音识别
来源期刊 计算机工程与应用 学科 工学
关键词 序列级 低资源 端到端 卷积神经网络 批量归一化
年,卷(期) 2019,(17) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 143-149
页数 7页 分类号 TP391.4
字数 6494字 语种 中文
DOI 10.3778/j.issn.1002-8331.1805-0486
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张立民 海军航空大学信息融合研究所 163 596 11.0 15.0
2 王彦哲 海军航空大学信息融合研究所 6 5 1.0 2.0
3 张兵强 海军航空大学信息融合研究所 27 87 6.0 8.0
4 李振宇 海军航空大学信息融合研究所 5 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (28)
共引文献  (56)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (15)
二级引证文献  (15)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(7)
  • 参考文献(1)
  • 二级参考文献(6)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(3)
  • 参考文献(1)
  • 二级参考文献(2)
2017(5)
  • 参考文献(2)
  • 二级参考文献(3)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
2020(14)
  • 引证文献(0)
  • 二级引证文献(14)
研究主题发展历程
节点文献
序列级
低资源
端到端
卷积神经网络
批量归一化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导