基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
谷歌的人工智能系统(A1phaGo)在围棋领域取得了一系列成功,使得深度强化学习得到越来越多的关注.深度强化学习融合了深度学习对复杂环境的感知能力和强化学习对复杂情景的决策能力.而自然语言处理过程中有着数量巨大的词汇或者语句需要表征,并且在对话系统、机器翻译和图像描述等文本生成任务中存在大量难以建模的决策问题.这使得深度强化学习在自然语言处理的文本生成任务中能够发挥重要的作用,帮助改进现有的模型结构或者训练机制,并且已经取得了很多显著的成果.为此,本文系统阐述深度强化学习应用在不同的文本生成任务中的一些主要方法,梳理其发展的轨迹,分析算法特点.最后,展望深度强化学习与自然语言处理任务融合的前景和挑战.
推荐文章
加入目标指导的强化对抗文本生成方法研究
文本生成
强化学习
生成对抗网络
目标指导
分层强化学习研究进展
分层强化学习
半马尔可夫决策过程
抽象
分层强化学习研究进展
分层强化学习
多智能体系统
维数灾难
深度学习研究进展
深度学习
神经网络
模型
表示
堆栈
预训练
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文本生成领域的深度强化学习研究进展
来源期刊 工程科学学报 学科 工学
关键词 深度强化学习 自然语言处理 文本生成 对话系统 机器翻译 图像描述
年,卷(期) 2020,(4) 所属期刊栏目
研究方向 页码范围 399-411
页数 13页 分类号 TP183
字数 12503字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张德政 61 687 14.0 23.0
3 李擎 北京科技大学自动化学院 115 1522 21.0 36.0
4 崔家瑞 北京科技大学自动化学院 57 614 10.0 24.0
7 陈鹏 北京科技大学自动化学院 10 174 4.0 10.0
8 徐聪 北京科技大学自动化学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度强化学习
自然语言处理
文本生成
对话系统
机器翻译
图像描述
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
工程科学学报
月刊
2095-9389
10-1297/TF
大16开
北京海淀区学院路30号
1955
chi
出版文献量(篇)
4988
总下载数(次)
18
总被引数(次)
47371
论文1v1指导