基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
语音变声伪装会导致人耳感知和声纹识别出现错误,从而达到隐匿说话人真实身份的目的 .为削弱变声语音的影响,提出一种融合卷积神经网络(Convolutional Neural Networks,CNN)和Transformer编码器的模型,提取变声语音的局部特征和全局特征用于判别变声因子,并根据变声因子的数值实施变声语音还原.在中英文真实场景录音数据集上验证了所提方法的有效性,对变声因子判别实现了95%以上的准确率.利用所提出的方法,在黑箱条件下对某型商用硬件变声器输出的语音进行鉴别与还原,取得了较好的效果.
推荐文章
G.723.1语音编码器的研究
语音编解码器
线性预测编码
优化
CMMB编码器的应用和参数配置
CMMB
编码器
参数配置
融合降噪自编码器与BPSO的特征组合方法及其中医应用
降噪自编码器
二进制粒子群算法
非线性
中医药
基于ARM和光电编码器单键飞梭的设计
单键飞梭
LPC2214
光电编码器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合CNN和Transformer编码器的变声语音鉴别与还原
来源期刊 信息技术与网络安全 学科 工学
关键词 基频变声 语音鉴伪 变声还原 时频特征
年,卷(期) 2022,(1) 所属期刊栏目 网络与信息安全|Network and Information Security
研究方向 页码范围 47-54
页数 8页 分类号 TP391.9
字数 语种 中文
DOI 10.19358/j.issn.2096-5133.2022.01.008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
基频变声
语音鉴伪
变声还原
时频特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
总被引数(次)
35987
论文1v1指导