基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,图像文本建模研究已经成为自然语言处理领域一个重要的研究方向.图像常被用于增强句子的语义理解与表示.然而也有研究人员对图像信息用于句子语义理解的必要性提出质疑,原因是文本本身就能够提供强有力的先验知识,帮助模型取得非常好的效果;甚至在不使用图像的条件下就能得出正确的答案.因此研究图像文本建模需要首先回答一个问题:图像是否有助于句子语义的理解与表示?为此,本文选择一个典型的不包含图像的自然语言语义理解任务:自然语言推理,并将图像信息引入到该任务中用于验证图像信息的有效性.由于自然语言推理任务是一个单一的自然语言任务,在数据标注过程中没有考虑图像信息,因此选择该任务能够更客观地分析出图像信息对句子语义理解与表示的影响.具体而言,本文提出一种通用的即插即用框架(general plug and play framework)用于图像信息的整合.基于该框架,本文选择目前最先进的五个自然语言推理模型,对比分析这些模型在使用图像信息前后的表现,以及使用不同图像处理模型与不同图像设置时的表现.最后,本文在一个大规模公开数据集上进行了大量实验,实验结果证实图像作为额外知识,确实有助于句子语义的理解与表示.此外,还证实了不同的图像处理模型和使用方法对整个模型的表现也会造成不同的影响.
推荐文章
基于语义信息的图像理解关键问题研究
图像理解
语义信息
图像层次模型
特征表示与提取
相似性度量
基于语义Web的股票信息表示模型
股票表示模型
语义Web
本体
资源描述框架
基于不完整语义理解的文本数字水印算法研究
自然语言理解
文本水印
'的'字结构
语法规则
基于不完整语义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 图像信息对句子语义理解与表示的有效性验证与分析
来源期刊 计算机学报 学科
关键词 图像文本建模 句子语义理解与表示 图像信息 即插即用框架 自然语言推理
年,卷(期) 2021,(3) 所属期刊栏目 人工智能
研究方向 页码范围 476-490
页数 15页 分类号
字数 语种 中文
DOI 10.11897/SP.J.1016.2021.00476
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像文本建模
句子语义理解与表示
图像信息
即插即用框架
自然语言推理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
论文1v1指导