基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标.针对这一差异,构建一种基于序列级转录的端到端语音识别系统.以音素为基本单元建模,并采用连接时序分类(CTC)的目标函数改进长短时记忆网络的结构.在解码过程中引入词典和语言模型,并在前端增加音调特征以丰富声学特征.利用序列区分度训练技术提升CTC模型的建模效果.实验结果表明,该系统的识别效率和识别准确率得到提高,词错误率最低可降至19.09% ±0.16%.
推荐文章
从普通话水平测试视角分析普通话朗读教学
普通话朗读教学
表达技巧
语感
壮族学生普通话学习的难点及应对策略
壮族
学生
普通话
难点
策略
中学普通话教学实践现状调查及对策浅析
中学教育
普通话教学实践
教学对策
基于改进混合CTC/attention架构的端到端普通话语音识别
语音识别
链接时序分类
注意力机制
混合CTC/attention
端到端系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CTC准则的普通话识别及改进
来源期刊 计算机工程 学科 工学
关键词 序列级 端到端 解码 声学特征 区分度训练
年,卷(期) 2019,(6) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 249-253,266
页数 6页 分类号 TP391
字数 5055字 语种 中文
DOI 10.19678/j.issn.1000-3428.0051065
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张立民 海军航空大学信息融合研究所 163 596 11.0 15.0
2 王彦哲 海军航空大学信息融合研究所 6 5 1.0 2.0
3 张兵强 海军航空大学信息融合研究所 27 87 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (16)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (7)
二级引证文献  (2)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2014(7)
  • 参考文献(0)
  • 二级参考文献(7)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(4)
  • 参考文献(2)
  • 二级参考文献(2)
2017(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
2020(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
序列级
端到端
解码
声学特征
区分度训练
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导