基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
音高估计和发声分类可以帮助快速检索目标语音,是语音检索中十分重要且困难的研究方向之一,对语音识别领域具有重要的意义.提出了一种新型音高估计和发声分类方法.利用梅尔频率倒谱系数(MFCC)进行频谱重构,并在对数下对重构的频谱进行压缩和过滤.通过高斯混合模型(GMM)对音高频率和滤波频率的联合密度建模来实现音高估计,实验结果在TIMIT数据库上的相对误差为6.62%.基于高斯混合模型的模型也可以完成发声分类任务,经试验测试表明发声分类的准确率超过99%,为音高估计和发声分类提供了一种新的模型.
推荐文章
基于功率谱与噪声估计的频谱感知算法及实现
功率谱
排序系数
频谱感知
USRP
基于信噪比估计的自适应频谱感知算法
信噪比
频谱感知
自适应算法
感知时间
自适应能量检测
循环特征检测
基于信噪比估计的无人机频谱感知算法
无人机
频谱感知
信噪比估计
性能检测
阈值调整
仿真分析
基于动态可重构处理器的信道估计算法实现
可重构处理器
信道估计
多输入多输出
正交频分复用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MFCC的频谱重构实现音高估计和发声分类
来源期刊 测控技术 学科 工学
关键词 语音识别 音高估计 梅尔频率倒谱系数 高斯混合模型
年,卷(期) 2019,(11) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 86-89,131
页数 5页 分类号 TP24
字数 3877字 语种 中文
DOI 10.19708/j.ckjs.2019.06.218
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 秦会斌 杭州电子科技大学新型电子器件与应用研究所 237 1329 17.0 25.0
2 张少华 杭州电子科技大学新型电子器件与应用研究所 2 13 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (7)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(9)
  • 参考文献(0)
  • 二级参考文献(9)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语音识别
音高估计
梅尔频率倒谱系数
高斯混合模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
测控技术
月刊
1000-8829
11-1764/TB
大16开
北京2351信箱《测控技术》杂志社
82-533
1980
chi
出版文献量(篇)
8430
总下载数(次)
24
总被引数(次)
55628
论文1v1指导