基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用.本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(Vector Quantization Regularized Variational Autoencoder,VQ-REG-VAE).在训练时,矢量量化退化为正则化项,通过矢量量化的正则约束让编码器学习生成说话人无关的语义特征,同时让解码器学习将说话人特征融合到语义特征中.在转换时,可以去掉矢量量化这一正则化项,通过编码器和解码器就能实现语音转换.由于转换时没有进行矢量量化,语义特征信息得以更好保留.客观和主观实验都表明:基于VQ-REG-VAE模型的转换语音在不降低相似度的前提下,音质比VQVAE模型有显著的提升.
推荐文章
语音信号的矢量量化研究综述
矢量量化
语音信号
码书
语音质量
低速语音编码中的预测分类分裂矢量量化技术
语音编码
线谱对
多级矢量量化
预测分类分裂矢量量化
谱失真
图像矢量量化编码算法的回顾和比较
图像
矢量量化
码书
比特率
码字匹配
基于小波变换的多级矢量量化图像编码算法
图像编码
小波变换
多级矢量量化
压缩编码
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 矢量量化正则变分自编码器做非平行语料语音转换
来源期刊 信号处理 学科
关键词 语音转换 矢量量化 矢量量化正则变分自编码器
年,卷(期) 2021,(7) 所属期刊栏目 研究通讯|Research Communications
研究方向 页码范围 1339-1345
页数 7页 分类号 TN912.33
字数 语种 中文
DOI 10.16798/j.issn.1003-0530.2021.07.025
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (1)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音转换
矢量量化
矢量量化正则变分自编码器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信号处理
月刊
1003-0530
11-2406/TN
大16开
北京鼓楼西大街41号
18-143
1985
chi
出版文献量(篇)
5053
总下载数(次)
13
总被引数(次)
32728
论文1v1指导