基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
视觉场景理解不仅可以孤立地识别单个物体,还可以得到不同物体之间的相互作用关系.场景图可以获取所有的(主语-谓词-宾语)信息来描述图像内部的对象关系,在场景理解任务中应用广泛.然而,大部分已有的场景图生成模型结构复杂、推理速度慢、准确率低,不能在现实情况下直接使用.因此,在Factorizable Net的基础上提出了一种结合注意力机制与特征融合的场景图生成模型.首先把整个图片分解为若干个子图,每个子图包含多个对象及对象间的关系;然后在物体特征中融合其位置和形状信息,并利用注意力机制实现物体特征和子图特征之间的消息传递;最后根据物体特征和子图特征分别进行物体分类和物体间关系推断.实验结果表明,在多个视觉关系检测数据集上,该模型视觉关系检测的准确率为22.78%~25.41%,场景图生成的准确率为16.39%~22.75%,比Factorizable Net分别提升了1.2%和1.8%;并且利用一块GTX1080Ti显卡可以在0.6 s之内实现对一幅图像的物体和物体间的关系进行检测.实验数据充分说明,采用子图结构明显减少了需要进行关系推断的图像区域数量,利用特征融合方法和基于注意力机制的消息传递机制提升了深度特征的表现能力,可以更快速准确地预测对象及其关系,从而有效解决了传统的场景图生成模型时效性差、准确度低的难题.
推荐文章
具有全局特征的空间注意力机制
卷积神经网络
空间注意力机制
全局特征
特征融合
目标分类
目标检测
基于多尺度融合注意力机制的人脸表情识别研究
计算机视觉
深度学习
人脸表情识别
特征提取
多尺度特征融合
注意力机制
基于表情符注意力机制的微博情感分析模型
表情符
微博
情感分析
注意力机制
融合注意力机制和区域生长的裂缝识别算法研究
数字图像
裂缝识别
区域生长
注意力机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合注意力机制与特征融合的场景图生成模型
来源期刊 计算机科学 学科 工学
关键词 场景图 视觉关系检测 注意力机制 消息传递 特征融合
年,卷(期) 2020,(6) 所属期刊栏目 计算机图形&多媒体
研究方向 页码范围 133-137
页数 5页 分类号 TP391.4
字数 4484字 语种 中文
DOI 10.11896/jsjkx.190600110
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 严华 四川大学电子信息学院 63 249 8.0 12.0
2 黄勇韬 四川大学电子信息学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
场景图
视觉关系检测
注意力机制
消息传递
特征融合
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导