基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对卷积神经网络(CNN)声学建模参数在低资源训练数据条件下的语音识别任务中存在训练不充分的问题,提出一种利用多流特征提升低资源卷积神经网络声学模型性能的方法.首先,为了在低资源声学建模过程中充分利用有限训练数据中更多数量的声学特征,先对训练数据提取几类不同的特征;其次,对每一类类特征分别构建卷积子网络,形成一个并行结构,使得多特征数据在概率分布上得以规整;然后通过在并行卷积子网络之上加入全连接层进行融合,从而得到一种新的卷积神经网络声学模型;最后,基于该声学模型搭建低资源语音识别系统.实验结果表明,并行卷积层子网络可以将不同特征空间规整得更为相似,且该方法相对传统多特征拼接方法和单特征CNN建模方法分别提升了3.27%和2.08%的识别率;当引入多语言训练时,该方法依然适用,且识别率分别相对提升了5.73%和4.57%.
推荐文章
语音识别中卷积神经网络的FPGA实现
语音识别
卷积神经网络
现场可编程门阵列
硬件加速
基于一维卷积神经网络的车载语音识别研究
卷积神经网络
语音识别
网络维度
卷积核
泛化性
多卷积神经网络模型融合的皮肤病识别方法
卷积神经网络
多模型融合
皮肤病识别
均方误差
最大相关熵准则
基于卷积神经网络的未知协议识别方法
深度学习
机器学习
卷积神经网络
未知协议识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 低资源语音识别中融合多流特征的卷积神经网络声学建模方法
来源期刊 计算机应用 学科 工学
关键词 低资源语音识别 卷积神经网络 特征规整 多流特征
年,卷(期) 2016,(9) 所属期刊栏目 虚拟现实与数字媒体
研究方向 页码范围 2609-2615
页数 7页 分类号 TN912.34
字数 9725字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.09.2609
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张连海 信息工程大学信息系统工程学院 35 152 7.0 11.0
2 秦楚雄 信息工程大学信息系统工程学院 2 26 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (6)
同被引文献  (6)
二级引证文献  (20)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(11)
  • 引证文献(2)
  • 二级引证文献(9)
2019(10)
  • 引证文献(3)
  • 二级引证文献(7)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
低资源语音识别
卷积神经网络
特征规整
多流特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导