基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building)方法进行逐层分割,从而准确找出语音和静音的边界点.实验结果表明,用该方法改进ETSI-DSR-AFE标准后,信噪比在大于0 dB时,说话人辨认系统识别率相对改进了18.9%,相对原有的Mel频率倒谱系数(Mel-frequenly Ceptral coefficients,MFCC)系统识别率改进了60.7%.
推荐文章
基于GMM聚类的鲁棒性i向量说话人确认
说话人识别
高斯混合模型
巴氏距离
支持向量机
线性判别分析
噪声鲁棒语音识别研究综述
鲁棒语音识别
语音增强
特征补偿
模型补偿
噪声环境中基于VQ说话人识别
说话人识别
矢量量化
掩蔽阚值
掩蔽效应
MFCC
语音增强用于抗噪声的汉语说话人识别
语音增强
谱减法
听觉模拟
说话人识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分层增长语音活动检测的鲁棒性说话人识别
来源期刊 深圳大学学报(理工版) 学科 工学
关键词 语音信号处理 说话人识别 分布式语音识别 分层增长 语音活动检测 似然距离
年,卷(期) 2012,(4) 所属期刊栏目 电子与信息科学
研究方向 页码范围 328-334
页数 分类号 TN912.34|TP391.4
字数 5342字 语种 中文
DOI 10.3724/SP.J.1249.2012.04328
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄中伟 深圳大学语音实验室 41 167 8.0 10.0
2 刘明辉 深圳大学语音实验室 9 15 3.0 3.0
3 张劲松 北京语言大学信息科学学院 15 34 2.0 5.0
4 解焱陆 北京语言大学信息科学学院 10 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (6)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(2)
  • 参考文献(0)
  • 二级参考文献(2)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(1)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音信号处理
说话人识别
分布式语音识别
分层增长
语音活动检测
似然距离
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
深圳大学学报(理工版)
双月刊
1000-2618
44-1401/N
大16开
深圳市南山区深圳大学行政楼419室
46-206
1984
chi
出版文献量(篇)
1946
总下载数(次)
10
总被引数(次)
10984
论文1v1指导