基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对使用话语级特征参数矩阵作为卷积神经网络输入而导致收敛速度慢及识别率低的问题,提出一种基于二维主成分分析(2DPCA)特征降维的卷积神经网络(CNN)说话人识别方法.首先将每段语音分帧成多个帧级语音并提取同等大小的帧级特征组成特征矩阵,然后利用2DPCA对特征矩阵进行降维处理,再将得到的主成分特征向量组合成新的特征矩阵作为CNN的输入,最后通过CNN的自适应特征学习创建说话人模型.基于Alexnet的CNN模型实验结果表明,采用该说话人识别方法使运行时间减少了57%,同时识别率也有所提高.
推荐文章
基于BP神经网络的2DPCA人脸识别算法
人脸识别
2DPCA
BP神经网络
图像预处理
一种基于2DPCA的人耳识别方法
人耳识别
主分量分析
二维主分量分析
BP神经网络
一种基于2DPCA和LDA的人脸表情识别算法
Gabor特征
2DPCA
LDA
C-Mean
KNN
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于2DPCA特征降维的CNN说话人识别
来源期刊 软件导刊 学科 工学
关键词 二维主成分分析 帧级特征 卷积神经网络 说话人识别
年,卷(期) 2022,(1) 所属期刊栏目 人工智能
研究方向 页码范围 131-135
页数 5页 分类号 TP301
字数 语种 中文
DOI 10.11907/rjdk.211315
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
二维主成分分析
帧级特征
卷积神经网络
说话人识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导