基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法.在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声.解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音.跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征.对特征融合和特征拼接两种跳跃连接方式、L1和L2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性.
推荐文章
TETRA语音编解码的ACELP
线性预测
自相关
内插
杜宾算法
代数码书搜索
反射系数
Speex语音编解码的研究及实现
Speex
TMS320DM642
语音编码
优化
联合优化深度神经网络和约束维纳滤波的通道语音增强方法
深度神经网络
语音增强
约束维纳滤波
联合优化
基于模型的单通道语音分离综述
单通道语音分离
基于模型
说话人依赖
说话人选择
说话人独立
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用深度全卷积编解码网络的单通道语音增强
来源期刊 信号处理 学科 工学
关键词 语音增强 跳跃连接 编解码 卷积神经网络
年,卷(期) 2019,(4) 所属期刊栏目 应用
研究方向 页码范围 631-640
页数 10页 分类号 TN912.3
字数 6765字 语种 中文
DOI 10.16798/j.issn.1003-0530.2019.04.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张雄伟 10 7 2.0 2.0
2 邹霞 4 6 2.0 2.0
3 孙蒙 12 11 2.0 2.0
4 时文华 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (12)
参考文献  (11)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(6)
  • 参考文献(2)
  • 二级参考文献(4)
2015(9)
  • 参考文献(4)
  • 二级参考文献(5)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音增强
跳跃连接
编解码
卷积神经网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信号处理
月刊
1003-0530
11-2406/TN
大16开
北京鼓楼西大街41号
18-143
1985
chi
出版文献量(篇)
5053
总下载数(次)
13
论文1v1指导