作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
语音识别GMM-HMM (Gaussian mixture modelhidden Markov model)在使用最大似然状态序列(most likely state sequence,MLSS)准则得到观测量的最佳状态序列时,只考虑了具有语音帧最大似然值的状态信息,而忽略了其他次优状态对当前帧的影响,造成信息的丢失,从而降低了系统识别率.为更好地利用声学状态的似然值信息,该文提出了声学状态似然值得分模型和监督状态模型,并基于以上模型得到了状态似然聚类特征(state likelihood cluster feature,SLCF)、监督状态特征(supervised state feature,SSF).这2种特征反映了MFCC (Mel frequency cepstrum coefficient)声学特征关于HMM状态的一种信息.实验表明,将SLCF、SSF分别与MFCC融合,新的特征可提高语音识别效果.融合了SLCF、SSF后,与GMM-HMM只使用MFCC相比,孤立字识别系统的总错误率分别相对下降了6.10%、9.66%,连续语音识别系统的总错误率分别相对下降了2.53%、11.05%.
推荐文章
基于清浊音状态空间模型语音增强算法
语音增强
语音清浊音状态空间模型
遗忘因子
粒子滤波
基于隐马尔可夫模型和聚类的英语语音识别混合算法
英语语音识别
隐马尔科夫模型
聚类
特征数据
基于极大似然目标状态估计的传感器管理
目标状态估计
极大似然
协方差矩阵
传感器管理
基于多任务深度特征提取及 MKPCA 特征融合的语音情感识别
语音情感识别
多任务学习
声学深度特征
语谱图特征
多核主成分分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于声学状态似然值得分模型及监督状态模型的语音识别特征融合算法
来源期刊 清华大学学报(自然科学版) 学科
关键词 监督状态特征 声学特征聚类 状态似然聚类特征
年,卷(期) 2019,(6) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 476-481
页数 6页 分类号
字数 语种 中文
DOI 10.16511/j.cnki.qhdxxb.2019.21.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 肖熙 22 146 4.0 12.0
2 徐晨 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (7)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1955(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
监督状态特征
声学特征聚类
状态似然聚类特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
清华大学学报(自然科学版)
月刊
1000-0054
11-2223/N
大16开
北京市海淀区清华园清华大学
2-90
1915
chi
出版文献量(篇)
7846
总下载数(次)
26
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导