基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决传统语音活动检测(VAD)技术分离出的语音段掺杂静音以及帧间频繁跳动产生短语音碎片的问题,提出在说话人日志中能够高效稳定地完成语音活动检测的方法.该方法利用可靠静音模型对语音的区分度高这个特性,通过循环迭代收敛得到稳定划分.建立静音和语音模型,通过帧间连续性原理进行不确定性解码得到帧类属信息,开展低能量短时间语音碎片后处理完成语音活动检测.在富标注说话人日志数据集上测试,实验结果表明,由于对静音模型的描述更加可靠,采用该方法可以减少帧间跳动,减少静音模型对语音的吸收误判,性能比基于子带熵顺序统计滤波(SE-OSF)方法提高明显.
推荐文章
基于分层增长语音活动检测的鲁棒性说话人识别
语音信号处理
说话人识别
分布式语音识别
分层增长
语音活动检测
似然距离
基于语音增强方法的语音端点检测
语音端点检测
深层置信网络
信噪比
语音处理
基于超声测量模型的镁合金弹壳自动检测方法?
超声
镁合金
弹壳
自动检测
缺陷定量
语音增强用于抗噪声的汉语说话人识别
语音增强
谱减法
听觉模拟
说话人识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 说话人日志中可靠静音模型语音活动检测方法
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 说话人日志 富标注 语音活动检测(VAD) 高斯模型 维特比解码
年,卷(期) 2016,(1) 所属期刊栏目 自动化技术、电信技术
研究方向 页码范围 151-157
页数 7页 分类号 TN912
字数 5945字 语种 中文
DOI 10.3785/j.issn.1008-973X.2016.01.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 夏善红 中国科学院电子学研究所 111 654 14.0 18.0
2 刘加 清华大学电子工程系 79 938 18.0 28.0
3 杨登舟 中国科学院电子学研究所 2 4 1.0 2.0
7 徐嘉明 中国科学院电子学研究所 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
说话人日志
富标注
语音活动检测(VAD)
高斯模型
维特比解码
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导