作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,基于混合的连续时间分类(CTC)和注意力编解码器模型的端到端语音识别取得了很好的效果.文章在实验的基础上,提出了一种新的基于译码性能与编码器深度关系的CTC译码器结构,并运用注意力平滑机制获取更多的上下文信息,实现基于子字的译码.该方法在语音识别数据集Voxforge中的测试结果为,在没有LM的情况下,词错误率降到了4.39%;在RNN-LM的情况下,词错误率降到了3.32%.
推荐文章
基于混合式注意力机制的语音识别研究
卷积
注意力机制
全局平均池化
长短期记忆网络
LAS模型
一种基于注意力机制的语音情感识别算法研究
语音情感识别
深度学习
注意力机制
语谱图
融合注意力机制和区域生长的裂缝识别算法研究
数字图像
裂缝识别
区域生长
注意力机制
基于混合式注意力机制的语音识别研究
卷积
注意力机制
全局平均池化
长短期记忆网络
LAS模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于混合注意力机制和CTC语音识别模型技术研究
来源期刊 电视技术 学科 工学
关键词 语音识别 注意力 CTC RNN-LM 序列到序列
年,卷(期) 2019,(22) 所属期刊栏目 广播与传输
研究方向 页码范围 1-4,15
页数 5页 分类号 TN391.41
字数 2915字 语种 中文
DOI 10.16280/j.videoe.2019.22.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱向前 中国电子科技集团公司第三研究所 4 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音识别
注意力
CTC
RNN-LM
序列到序列
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电视技术
月刊
1002-8692
11-2123/TN
大16开
北京市朝阳区酒仙桥北路乙7号(北京743信箱杂志社)
2-354
1977
chi
出版文献量(篇)
12294
总下载数(次)
21
论文1v1指导