基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对文本无关非特定说话人年龄识别,本文提出了一种基于有效频带多分辨率特征的统计分析识别方法.输入语音,通过小波包变换进行有效频带分解,然后将各有效频带的小波包系数连接构成一个整体计算美尔频率倒谱系数,得到有效频带多分辨率特征参数WPMFC(Wavelet Packet Mel-Frequency Cepstrum),说话人按年龄划分为儿童、青年、中年和老年四个阶段,并进一步按性别训练各年龄段语音得到8个高斯混合模型.测试语音依据最大似然准则进行识别判决.实验对本文提出的方法与传统的短时谱统计分析方法进行了比较,结果显示本文提出的方法有较好的识别性能,集内平均识别率达到65.17%.同时,实验结果也说明相对语音文本变化的影响,不同说话人发音特征的变化对识别性能的影响更大.
推荐文章
基于DSP的低分辨率红外目标特征提取及识别
DSP
波形
目标识别
特征提取
灵巧弹药
基于多分辨率频带方向的图像融合
图像融合
多分辨率分析
频带方向
性能参数
DEM水平分辨率对流域特征提取的影响分析
DEM
小流域
分辨率
流域特征
地形指数
多分辨率视觉哈希方案
视觉Hash
认证安全性
多分辨率
树状结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 有效频带多分辨率特征提取及说话人年龄识别
来源期刊 信号处理 学科 工学
关键词 说话人年龄识别 有效频带 多分辨率特征 小波包变换
年,卷(期) 2016,(9) 所属期刊栏目 应用
研究方向 页码范围 1101-1107
页数 7页 分类号 TN912.34
字数 5524字 语种 中文
DOI 10.16798/j.issn.1003-0530.2016.09.13
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 俞一彪 苏州大学电子信息学院 69 404 11.0 16.0
2 杜先娜 苏州大学电子信息学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (10)
参考文献  (1)
节点文献
引证文献  (4)
同被引文献  (16)
二级引证文献  (4)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
说话人年龄识别
有效频带
多分辨率特征
小波包变换
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信号处理
月刊
1003-0530
11-2406/TN
大16开
北京鼓楼西大街41号
18-143
1985
chi
出版文献量(篇)
5053
总下载数(次)
13
总被引数(次)
32728
论文1v1指导