基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
声学场景中包含着很多长时特征和短时特征.本文提取环境声的能量信息,批量生成声音场景的三维语谱图,作为卷积神经网络的输入.神经网络采用卷积层和下采样层重复交叠,整体网络采用六层网络结构,最终经过softmax方法进行多分类.实验采用DCASE2017竞赛数据集作为素材,对15类6300段音频进行训练测试,结果表明,语谱图特征与卷积神经网络相结合的算法能够很好的提取长时特征和短时特征,使得最终分类准确率较高,优于网站基线系统的分类结果.
推荐文章
基于卷积神经网络的垃圾自动分类算法
卷积神经网络
MobileNetV2
ShuffleNetV1
垃圾分类
基于卷积神经网络的植物图像分类方法研究
卷积神经网络
图像特征
图像分类
全卷积网络
植物图像
数据集
基于卷积神经网络的军事图像分类
军事图像分类
深度学习
卷积神经网络
主成分分析白化
随机池化
基于深度卷积神经网络的车标分类
深度学习
神经网络
车标分类
图像识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于卷积神经网络的声学场景分类算法研究
来源期刊 中国传媒大学学报(自然科学版) 学科 工学
关键词 声学场景 语谱图 卷积神经网络
年,卷(期) 2019,(2) 所属期刊栏目
研究方向 页码范围 24-30
页数 7页 分类号 TP273+.21
字数 5845字 语种 中文
DOI 10.3969/j.issn.1673-4793.2019.02.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵薇 中国传媒大学信息与通信工程学院 14 18 2.0 3.0
2 靳聪 中国传媒大学信息与通信工程学院 11 14 2.0 3.0
3 黄敬雯 中国传媒大学信息与通信工程学院 2 3 1.0 1.0
4 徐陈缘 中国传媒大学信息与通信工程学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (1)
二级引证文献  (0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
声学场景
语谱图
卷积神经网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国传媒大学学报(自然科学版)
双月刊
1673-4793
11-5379/N
16开
北京市朝阳区定福庄东街1号(中国传媒大学30号信箱)
1994
chi
出版文献量(篇)
1230
总下载数(次)
8
总被引数(次)
4943
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导