基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前大多数声音识别检测的研究都是基于强标签数据集的,但在真实环境的声音识别与检测任务中,音频标签不完整并且含有大量噪声,使得获取强标签音频数据比较困难,进而影响对声音的准确识别与检测.为此,在卷积循环神经网络模型的基础上,提出了一种多尺度注意力融合机制.该机制使用注意力门控单元,在降低声音时频图特征中噪声影响的同时,能够更多地利用有效特征.同时,通过结合多个尺寸的卷积核进行特征融合,进一步提升对声音特征的有效提取.此外,采用一种结合帧检测结果的加权法对声音信号进行识别.最后,在弱标签环境下,从AudioSet数据库中选取一个包含17种城市交通工具声音的弱标签数据集进行检测识别,所提模型对测试集声音识别结果的F1值为58.9%,检测结果的F1值为43.7%.结果表明,在弱标签城市交通工具声数据集下,网络模型相比传统的声音识别检测模型具有更高的识别检测精度;同时,重要性加权识别方法、多尺度注意力融合方法均可提升模型对声音识别检测的精度.
推荐文章
基于多尺度融合注意力机制的人脸表情识别研究
计算机视觉
深度学习
人脸表情识别
特征提取
多尺度特征融合
注意力机制
多注意力机制下自愈人脸表情识别
人脸表情识别多
注意力机制
自愈
不确定性
基于空间注意力与图卷积的多标签图像分类算法
图卷积网络
多标签图像分类
空间注意力
特征融合
融合注意力机制和区域生长的裂缝识别算法研究
数字图像
裂缝识别
区域生长
注意力机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 弱标签环境下基于多尺度注意力融合的声音识别检测
来源期刊 计算机科学 学科
关键词 弱标签 多尺度 注意力 声音识别 声音检测
年,卷(期) 2020,(5) 所属期刊栏目 计算机图形学&多媒体
研究方向 页码范围 120-123
页数 4页 分类号
字数 2991字 语种 中文
DOI 10.11896/jsjkx.190900111
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑伟哲 西安电子科技大学电子工程学院 1 0 0.0 0.0
2 仇鹏 西安电子科技大学通信工程学院 2 5 1.0 2.0
3 韦娟 西安电子科技大学通信工程学院 39 126 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
弱标签
多尺度
注意力
声音识别
声音检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导