基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
语音增强技术作为语音数字信号处理前端的预处理技术,在提高语音的可懂度和总体感知质量等方面扮演着重要角色.而以短时傅里叶变换为基础的语音增强算法会产生窗大小加跳数的算法延时,通常在考虑窗口大小和频谱分辨率后,算法的固有时延会大于64ms.然而,这样的高时延对于包括助听器在内的一些实时性要求较高的应用是很难满足的.为解决上述问题,对传统汉宁窗进行了改进,提出一种非对称的窗函数,并将其与无监督GCC-NMF算法相结合得到了一种无监督的两通道低时延的GCC-NMF语音增强算法.通过从SiSEC获取的语音和现实噪声的两通道混合信号数据集上进行性能评估.使用PEASS和BSS Eval工具包分别使用基于感知、基于SNR进行度量,同时使用STOI和ESTOI对语音的清晰度进行评测.最后,将上述方法与对称窗方法以及其它无监督的语音增强方法进行比较.结果证明,所提出的方法不仅能够将算法时延降低至2ms,还能保持各项评估指标均优于其它无监督以及对称窗方法.
推荐文章
一种DCT域的语音增强改进算法
语音增强
DCT
语音分量
噪声分量
最大后验概率估计
一种新阈值函数的小波包语音增强算法
语音增强
小波包
阈值函数
Bark尺度小波包分解结构
信噪比
分段信噪比
一种基于LMS改进算法的语音增强方法
变步长
语音增强
LMS算法
自适应滤波器
一种引入延迟的语音增强算法
语音增强
延迟
噪声谱估计
先验信噪比
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进窗函数的低时延语音增强算法
来源期刊 计算机仿真 学科 工学
关键词 语音增强 非负矩阵分解 非对称窗 广义互相关 低时延
年,卷(期) 2022,(2) 所属期刊栏目 信息仿真
研究方向 页码范围 203-211
页数 9页 分类号 TN912.35
字数 语种 中文
DOI 10.3969/j.issn.1006-9348.2022.02.039
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音增强
非负矩阵分解
非对称窗
广义互相关
低时延
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机仿真
月刊
1006-9348
11-3724/TP
大16开
北京海淀阜成路14号
82-773
1984
chi
出版文献量(篇)
20896
总下载数(次)
43
总被引数(次)
127174
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导