原文服务方: 计算机应用研究       
摘要:
在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想.针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究了在特征空间中对说话人进行建模的技术,提取出能有效反映说话人和信道信息的身份认证矢量(i-vector);最后将上述研究结合构建了基于i-vector特征的LSTM递归神经网络系统.在Open KWS 2013标准数据集上进行实验,结果表明该技术相比于深度神经网络基线系统有相对10%的字节错误率降低.
推荐文章
基于i-vector说话人识别算法中训练时长研究
说话人识别
i-vector
Kaldi
训练时长
基于Elman神经网络的语音情感识别应用研究
语音清感识别
Elman网络
BP网络
MFCC
基于LSTM时间递归神经网络的短期电力负荷预测
短期电力负荷预测
LSTM
时间递归
神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统
来源期刊 计算机应用研究 学科
关键词 语音识别 长短时记忆神经网络 身份认证矢量
年,卷(期) 2017,(2) 所属期刊栏目 算法研究探讨
研究方向 页码范围 392-396
页数 5页 分类号 TP391.42
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.02.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 夏善红 中国科学院电子学研究所传感技术国家重点实验室 111 654 14.0 18.0
2 刘加 清华大学电子工程系清华信息科学与技术国家实验室 79 938 18.0 28.0
3 康健 清华大学电子工程系清华信息科学与技术国家实验室 6 61 4.0 6.0
4 黄光许 1 22 1.0 1.0
8 田垚 清华大学电子工程系清华信息科学与技术国家实验室 2 22 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (9)
节点文献
引证文献  (22)
同被引文献  (68)
二级引证文献  (46)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(12)
  • 引证文献(10)
  • 二级引证文献(2)
2019(33)
  • 引证文献(7)
  • 二级引证文献(26)
2020(23)
  • 引证文献(5)
  • 二级引证文献(18)
研究主题发展历程
节点文献
语音识别
长短时记忆神经网络
身份认证矢量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导