基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大部分的语音分离系统仅仅增强混合的幅值谱(短时傅里叶变换的系数),但是对于相位谱却不做任何处理.然而,最近的研究表明相位信息对于语音分离的质量起着很重要的作用.为了同时利用幅值和相位信息,本文提出了一种有效的端到端分离方法.这种方法是直接利用原始语音波行点作为特征,是一种基于编解码器的卷积神经网络结构.跟其他的说话人独立的语音分离系统不同,本文提出的方法其神经网络只输出一个说话人的信号,其他的语音可以由混合语音与网络输出信号的差值获得.我们在TIMIT数据集上验证本文提出的方法.实验结果表明,本文提出的方法明显优于句子级别的排列不变性训练(utterance-level permutation invariant training,uPIT)基线方法,对于信号失真比(signal-to-distortion ratio,SDR)相对提高了16.06%.
推荐文章
一种基于卷积神经网络的结构损伤检测方法
卷积神经网络
损伤识别
加速度
抗噪性
一种基于端到端测量构造网络性能拓扑的方法
拓扑结构
性能测量
瓶颈带宽
一种移动卷积神经网络的FPGA实现
FPGA
卷积神经网络
硬件加速
MobileNet
移动端
基于一维卷积神经网络的车载语音识别研究
卷积神经网络
语音识别
网络维度
卷积核
泛化性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于卷积神经网络的端到端语音分离方法
来源期刊 信号处理 学科 工学
关键词 说话人独立语音分离 鸡尾酒会问题 端到端 卷积编解码器
年,卷(期) 2019,(4) 所属期刊栏目 论文与技术报告
研究方向 页码范围 542-548
页数 7页 分类号 TN912
字数 4766字 语种 中文
DOI 10.16798/j.issn.1003-0530.2019.04.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘斌 中国科学院自动化研究所模式识别国家重点实验室 230 3876 32.0 56.0
2 陶建华 中国科学院自动化研究所模式识别国家重点实验室 31 133 6.0 11.0
11 范存航 中国科学院自动化研究所模式识别国家重点实验室 1 2 1.0 1.0
15 温正棋 中国科学院自动化研究所模式识别国家重点实验室 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (7)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (4)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(4)
  • 参考文献(2)
  • 二级参考文献(2)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
说话人独立语音分离
鸡尾酒会问题
端到端
卷积编解码器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信号处理
月刊
1003-0530
11-2406/TN
大16开
北京鼓楼西大街41号
18-143
1985
chi
出版文献量(篇)
5053
总下载数(次)
13
总被引数(次)
32728
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导