基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决单一语音、音乐音频及其两者的混合音频进行语音/音乐分类时分类结果不准确的问题,提出一种基于音频分割的音频分类算法.利用能熵比特征进行音频分割,分割出的音乐段较为准确,而利用幅度均方根特征进行音频分割,分割出的语音段较为准确,避免了对语音段的过度分割.将两种分割方法分割所得音频段的起点和终点升序排列并两两组合形成新的音频段作为音频分割结果,音频分割结果中的每一个音频段即一种类型的音频.对音频分割结果中的每一个音频段提取幅度的峰态系数和平均基频两个特征,并利用高斯混合模型作为后端分类器进行分类.最后为了消除过分割现象,将同类型的相邻音频段合并便得到最终分类结果.实验结果表明,所提出的算法对混合音频具有很高的分割准确率,达到98.24%,对单一音频和混合音频仅提取二维特征便得到较高的分类准确率,分别达到98%和98.61%,与同类算法相比较分类准确率平均提高3.80%.
推荐文章
一种有效的音频分割算法
音频分割
分层检测
熵检测
一种基于傅利叶域的音频水印嵌入算法
音频水印
快速傅立叶变换
鲁棒性
一种新的扩频音频水印算法
数字音频水印
扩频
瞬时平均频率
时频
一种基于SVD和DWT的音频水印算法
音频水印
离散小波变换
奇异值分解
鲁棒性
透明性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于音频分割的音频分类算法
来源期刊 通信技术 学科 工学
关键词 音频分类 音频特征 音频分割 幅度的峰态系数 平均基频
年,卷(期) 2021,(2) 所属期刊栏目 信息处理与传输
研究方向 页码范围 317-322
页数 6页 分类号 TP39
字数 语种 中文
DOI 10.3969/j.issn.1002-0802.2021.02.008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (38)
共引文献  (8)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(3)
  • 参考文献(1)
  • 二级参考文献(2)
2018(4)
  • 参考文献(1)
  • 二级参考文献(3)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
音频分类
音频特征
音频分割
幅度的峰态系数
平均基频
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
通信技术
月刊
1002-0802
51-1167/TN
大16开
四川省成都高新区永丰立交桥(南)创业路8号
62-153
1967
chi
出版文献量(篇)
10805
总下载数(次)
35
论文1v1指导