基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
综合考虑语音帧间关系及后处理网络的效果,提出一种改进的基于深度信念网络(DBN)的语音转换方法.该方法利用线性预测分析-合成模型提取说话人线性预测谱的特征参数,构建基于区域融合谱特征参数的深度信念网络用以预训练模型,经过微调阶段后引入误差修正网络以实现细节谱特征的补偿.对比实验结果表明,随着训练语音帧数的增加,转换语音的谱失真呈下降趋势.同时,在训练语音帧数较少的情况下,改进方法在异性间转换的谱失真小于50%,在同性间转换的谱失真小于60%.实验结果表明,改进方法的谱失真度较传统方法降低约6.5%,且同性别间转换效果比异性间转换效果更为明显,转换后语音的自然度和可理解度明显提高.
推荐文章
基于改进深度信念网络的心血管疾病预测研究
心血管疾病
风险预测
深度信念网络
受限玻尔兹曼机
基于深度信念网络的语音情感识别
深度信念网络
极限学习机
语音情感识别
人机交互
改进深度信念网络在飞机下降段油耗估计中的应用
下降段油耗估计
油耗影响因素
改进深度信念网络
高斯-伯努利受限玻尔兹曼机
自适应步长
基于改进深度置信网络的故障诊断方法
故障诊断
深度置信网络
特征提取
自适应谐振
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进深度信念网络在语音转换中的应用
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 深度信念网络(DBN) 语音转换 区域融合谱特征 误差修正网络 谱失真度
年,卷(期) 2019,(12) 所属期刊栏目 计算机科学与人工智能
研究方向 页码范围 2372-2380
页数 9页 分类号 TP391
字数 5465字 语种 中文
DOI 10.3785/j.issn.1008-973X.2019.12.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 万永菁 华东理工大学信息科学与工程学院 30 60 5.0 5.0
2 张筱 华东理工大学信息科学与工程学院 2 0 0.0 0.0
3 王文浩 华东理工大学信息科学与工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (7)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(1)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(4)
  • 参考文献(2)
  • 二级参考文献(2)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度信念网络(DBN)
语音转换
区域融合谱特征
误差修正网络
谱失真度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导