基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征.其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题.实验结果显示,采用MAP+ CMLLR方法时,说话人识别系统等错误率(EER)明显降低,与基线系统、最大后验概率(MAP)自适应方法、最大似然线性回归(MLLR)模型投影方法和约束最大似然线性回归(CMLLR)特征空间投影方法相比,MAP+ CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%.实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒.
推荐文章
基于支持向量机的说话人识别研究
支持向量机
说话人识别
结构风险最小化
核函数
基于多特征有效组合的说话人识别
说话人识别
动态规整
MFCC
LPCC
基音周期
噪声环境中基于VQ说话人识别
说话人识别
矢量量化
掩蔽阚值
掩蔽效应
MFCC
改进的说话人聚类初始化和GMM的多说话人识别
多说话人识别
改进的聚类初始化
高斯混合模型
平均类纯度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MAP+CMLLR的说话人识别中发声力度问题
来源期刊 计算机应用 学科 工学
关键词 说话人识别 发声力度 最大后验概率 最大似然线性回归 约束最大似然线性回归
年,卷(期) 2017,(3) 所属期刊栏目 应用前沿、交叉与综合
研究方向 页码范围 906-910
页数 5页 分类号 TP391.4
字数 5649字 语种 中文
DOI 10.11772/j.issn.1001-9081.2017.03.906
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭亚雄 贵州大学大数据与信息工程学院 34 93 6.0 8.0
2 贺松 贵州大学大数据与信息工程学院 39 155 6.0 10.0
3 黄文娜 贵州大学大数据与信息工程学院 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (4)
参考文献  (11)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (0)
1969(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
说话人识别
发声力度
最大后验概率
最大似然线性回归
约束最大似然线性回归
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导