基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本生成图像是结合计算机视觉和自然语言处理两个领域的综合性任务,从给定的文本描述生成图像有两个目标:视觉真实性和语义一致性.虽然在使用生成对抗网络(GAN)生成高质量和视觉逼真的图像方面取得了显著进展,但确保文本描述和视觉内容之间的语义一致性仍然是非常具有挑战性的.目前的方法由于文本和图像形式的多样性,仅在单词级别使用注意力并不能确保全局语义的一致性.因此,在MirrorGAN的基础上提出了一种改进的多维度的注意力协同模块(MCAM)和语义文本再生模块(STRM)来解决这些问题.MCAM使用了更为先进的BERT模型来进行文本处理,STRM用于从生成的图像中重新生成文本描述,该图像在语义上与给定的文本描述对齐,使生成的图像更加贴合语义.最后,形成了基于多维度注意力以及语义文本再生的生成对抗网络模型(MirrorGAN++).通过对两个公共基准数据集的深入实验,证明了MirrorGAN++优于其他方法.
推荐文章
结合引导解码和视觉注意力的图像语义描述模型
图像描述
多示例学习
引导解码
视觉注意力机制
融入视觉常识和注意力的图像描述
图像描述
注意力机制
视觉常识
注意偏差
分类重构堆栈生成对抗网络的文本生成图像模型
文本生成图像
堆栈生成对抗网络
分类
重构
跨模态学习
基于循环神经网络和注意力模型的文本情感分析
文本情感分析
深度学习
长短期记忆模型
注意力模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多维度注意力和语义再生的文本生成图像模型
来源期刊 计算机技术与发展 学科 工学
关键词 文本生成图像 生成对抗网络 语义一致 注意力 语义文本再生
年,卷(期) 2020,(12) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 27-33
页数 7页 分类号 TP391.41
字数 语种 中文
DOI 10.3969/j.issn.1673-629X.2020.12.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (20)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(4)
  • 参考文献(1)
  • 二级参考文献(3)
2018(7)
  • 参考文献(2)
  • 二级参考文献(5)
2019(6)
  • 参考文献(3)
  • 二级参考文献(3)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本生成图像
生成对抗网络
语义一致
注意力
语义文本再生
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导