基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文研究了利用自然语言文本描述对图像进行编辑的多模态问题。本文的目标是,输入一张原始图像以及一句自然语言文本描述,输出一张经过编辑的图像,并且图像在满足给定自然语言文本描述的同时,保留与文本描述无关的其他细节。在本文中,整体网络采用生成对抗网络结构。在生成器部分,通过引入重构损失,实现模型对于文本描述无关图像区域的保持。通过引入文本图像相关度损失,以一种半监督的方式,对生成器的训练进行指导,从而实现更精细化的利用文本描述对图像进行编辑。在判别器部分,结合判别损失以及条件判别损失,指导生成器生成更具真实效果以及符合自然语言文本描述的图像。通过生成器和判别器的对抗训练,最终实现利用自然语言文本描述实现精准编辑图像。
推荐文章
电视图像编辑的审美意识探讨
图像编辑
审美意识
电视节目
自然语言与机器学习
人工智能
机器学习
自然语言处理
基于Ontology的自然语言理解
KB-NLU
Ontology
世界知识型:词汇语义型
句法语义型
自然语言生成综述
自然语言生成
内容规划
微观规划
表层生成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用自然语言文本描述进行图像编辑
来源期刊 电子技术与软件工程 学科 工学
关键词 生成对抗网络 多模态 图像编辑
年,卷(期) 2020,(1) 所属期刊栏目
研究方向 页码范围 119-121
页数 3页 分类号 TP3
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 钱真真 北京交通大学计算机与信息技术学院、交通数据分析与挖掘北京市重点实验室 2 0 0.0 0.0
2 周作为 北京交通大学计算机与信息技术学院、交通数据分析与挖掘北京市重点实验室 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
生成对抗网络
多模态
图像编辑
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子技术与软件工程
半月刊
2095-5650
10-1108/TP
16开
北京市海淀区玉渊潭南路惠普南里13号楼
2012
chi
出版文献量(篇)
36183
总下载数(次)
321
总被引数(次)
56308
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导