基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法.首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量.含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子.再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能.实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%.论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别.
推荐文章
噪声环境中基于VQ说话人识别
说话人识别
矢量量化
掩蔽阚值
掩蔽效应
MFCC
基于计算听觉场景分析的说话人转换检测
说话人转换检测
计算听觉场景分析
伽马通能量倒谱系数
音高
贝叶斯信息准则
基于鲁棒听觉特征的说话人识别
说话人识别
自适应压缩Gammachirp滤波器
核主成分分析
特征提取
改进的说话人聚类初始化和GMM的多说话人识别
多说话人识别
改进的聚类初始化
高斯混合模型
平均类纯度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 感知听觉场景分析的说话人识别
来源期刊 声学学报 学科
关键词
年,卷(期) 2016,(2) 所属期刊栏目
研究方向 页码范围 260-272
页数 13页 分类号
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陶智 80 587 13.0 21.0
2 赵鹤鸣 140 1024 17.0 23.0
3 周燕 18 33 4.0 4.0
4 吴迪 46 190 8.0 13.0
5 张晓俊 37 81 6.0 8.0
6 潘欣裕 11 55 5.0 7.0
7 肖仲喆 13 12 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (36)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1979(2)
  • 参考文献(0)
  • 二级参考文献(2)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
声学学报
双月刊
0371-0025
11-2065/O4
大16开
北京市北四环西路21号
2-181
1964
chi
出版文献量(篇)
2139
总下载数(次)
5
总被引数(次)
26571
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导