基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对声音效果变化引起的语音声学特性的改变,提出基于声学模型自适应的方法。分析了正常模式下训练的声学模型在识别其他声效模式下语音的表现;根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中,并利用自适应后的声学模型来识别对应的声效模式下的语音。在“863-test”测试集上进行的汉语连续语音识别实验显示,正常模式下训练的声学模型识别其他四种声效模式下的语音时,识别精度均有较大程度的下降;而自适应后的系统在识别对应的声效模式的语音时,识别精度有了明显的改观。表明了基于声学模型自适应的方法在解决语音识别中声音效果变化问题上的有效性。
推荐文章
语音识别中声效模式的分析及检测
语音识别
声效
多模型框架
高斯混合模型
孤立词
基于Gabor小波和模型自适应的鲁棒人脸识别方法
模型补偿
人脸识别
模型自适应
Gabor
联想记忆模型
噪声鲁棒语音识别研究综述
鲁棒语音识别
语音增强
特征补偿
模型补偿
自适应控制系统鲁棒性研究评述
自适应控制
鲁棒性
对偶性
H∞优化控制
广义预测控制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于模型自适应的声效鲁棒性语音识别算法
来源期刊 计算机工程与应用 学科 工学
关键词 语音识别 声音效果 自适应 最大似然线性回归
年,卷(期) 2016,(2) 所属期刊栏目 网络、通信与安全
研究方向 页码范围 156-160,204
页数 6页 分类号 TP391
字数 6268字 语种 中文
DOI 10.3778/j.issn.1002-8331.1403-0027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 薛霄 河南理工大学计算机科学与技术学院 46 224 9.0 11.0
2 刘志中 河南理工大学计算机科学与技术学院 38 169 7.0 10.0
3 晁浩 河南理工大学计算机科学与技术学院 16 26 3.0 4.0
4 宋成 河南理工大学计算机科学与技术学院 41 124 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (11)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(2)
  • 参考文献(1)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
语音识别
声音效果
自适应
最大似然线性回归
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导