基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文提出一种基于低秩约束的本征音子(Eigenphone)说话人自适应方法。原始的本征音子说话人自适应方法在自适应语料充分时具有很好的效果,然而当自适应语料不足时,出现严重的过拟合现象,导致自适应后的系统可能比自适应前的系统还要差。首先,对协方差矩阵为对角阵的隐马尔可夫-高斯混合模型语音识别系统,推导出一种简化的本征音子矩阵估计算法;然后,对本征音子矩阵引入低秩约束,采用矩阵的核范数作为矩阵秩的凸近似,通过调节核范数的权重因子以有效控制自适应模型的复杂度;最后,给出一种加速近点梯度算法以求解新算法中引入的带有核范数正则项的数学优化问题。汉语连续语音识别的说话人自适应实验表明,引入低秩约束后,本征音子说话人自适应方法的自适应效果得到了明显提高,在5~50 s的自适应数据条件下,均取得了比最大似然线性回归后接最大后验(MLLR+MAP)自适应更佳的识别效果。
推荐文章
基于稀疏组LASSO约束的本征音子说话人自适应
说话人自适应
本征音子
组稀疏约束
稀疏组LASSO约束
近点梯度法
干扰空间投影在本征音说话人自适应中的应用
本征音自适应
干扰空间投影
主成分分析
信道失配
深层神经网络语音识别自适应方法研究
语音识别
声学模型自适应
深层神经网络
基于本征音因子分析的短时说话人识别
本征音
本征信道
说话人确认
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 语音识别中基于低秩约束的本征音子说话人自适应方法
来源期刊 电子与信息学报 学科 工学
关键词 语音识别 说话人自适应 本征音子 低秩约束 近点梯度法
年,卷(期) 2014,(4) 所属期刊栏目 论文
研究方向 页码范围 981-987
页数 7页 分类号 TN912.3
字数 6870字 语种 中文
DOI 10.3724/SP.J.1146.2013.00848
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张连海 解放军信息工程大学信息系统工程学院 34 63 4.0 6.0
2 李弼程 解放军信息工程大学信息系统工程学院 77 636 13.0 22.0
3 张文林 解放军信息工程大学信息系统工程学院 13 68 5.0 8.0
4 陈琦 解放军信息工程大学信息系统工程学院 11 54 3.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (10)
二级引证文献  (9)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
语音识别
说话人自适应
本征音子
低秩约束
近点梯度法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
总被引数(次)
95911
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导