基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决视觉问答(Visual Question Answering,VQA)算法中问题与图像缺乏推理关系的难题,提出了增强问题有用信息的问题引导图像注意力机制(Question Guide Image Attention,QGIA)视觉问答算法.该算法在问题特征提取过程中对关键词进行筛选,加强对问题有效信息的关注,实现对问题的注意,同时,该算法加强了对图像属性特征的关注,使图像信息更加丰富.通过问题强化和图像强化,引导图像特征根据有效问题特征更好地对问题作出回答,提高了视觉问答算法的有效性.将该算法在VQA V2.0数据集上实验验证,准确率达到67.89%.研究结论为视觉问答技术的实现提供了理论支持.
推荐文章
基于引导系数加权和自适应图像增强去雾算法
暗通道先验
图像去雾
导向滤波
引导系数加权
聚类
图像增强
基于深度学习的视觉问答技术研究
视觉问答技术
注意力机制
数据集
机器视觉中图像匹配问题研究
图像匹配
机器视觉
外极线校正
视差图
外极几何
增强现实中视觉图像抗遮挡运动目标跟踪算法研究
视觉图像
运动目标
跟踪算法
连通区域
特征值提取
集成分类器
评价指标
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于问题增强的问题引导图像视觉问答算法
来源期刊 通信技术 学科 工学
关键词 视觉问答 推理关系 问题引导图像 注意力机制
年,卷(期) 2022,(2) 所属期刊栏目 信息处理与传输|Information Processing & Transmission
研究方向 页码范围 166-173
页数 8页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1002-0802.2022.02.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视觉问答
推理关系
问题引导图像
注意力机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
通信技术
月刊
1002-0802
51-1167/TN
大16开
四川省成都高新区永丰立交桥(南)创业路8号
62-153
1967
chi
出版文献量(篇)
10805
总下载数(次)
35
论文1v1指导