基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
设计了一个适用于端到端语音增强的改进的U-Net (Attention Dilated Convolution U-Net,ADC-U-Net)网络模型.与基线U-Net网络相比,一方面通过加入空洞卷积减小由采样带来的信息损失;另一方面引入了注意力机制结构,结合了含噪语音更多的上下文信息,提取更深层次和更丰富的特征信息.与传统语音增强方法相比,所提模型无需提取特征、对特征去噪、重构语音3个步骤,避免了对显性特征的依赖,转而由网络模型通过多层次多尺度学习获得隐性特征.用多个主客观指标对增强语音的质量和可懂度进行了评价.实验数据显示所提算法在噪声抑制能力和对噪声的适应度方面均表现出良好的性能,与基线U-Net网络及其它模型相比,展示了良好的语音质量和可懂度.
推荐文章
基于残差双注意力U-Net模型的 CT图像囊肿肾脏自动分割
CT图像
囊肿肾脏分割
深度网络分割模型
注意力机制
基于注意力机制的全景分割网络
全景分割
背景类实例重叠
三重态注意力机制
语义增强注意力机制
基于混合式注意力机制的语音识别研究
卷积
注意力机制
全局平均池化
长短期记忆网络
LAS模型
基于U-Net卷积神经网络的轮毂缺陷分割
轮毂缺陷分割
自动分割
深度学习
神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合注意力机制的改进U-Net网络在端到端语音增强中的应用
来源期刊 声学学报 学科
关键词
年,卷(期) 2022,(2) 所属期刊栏目
研究方向 页码范围 266-275
页数 10页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
声学学报
双月刊
0371-0025
11-2065/O4
大16开
北京市北四环西路21号
2-181
1964
chi
出版文献量(篇)
2139
总下载数(次)
5
总被引数(次)
26571
论文1v1指导