基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对话生成是自然语言处理的重点研究方向,对抗生成网络GAN最近在对话生成领域得到了较好的应用.为了进一步改善对话生成的质量,并且解决GAN训练过程中判别模型返回奖励重复利用率低从而导致模型训练效率低的问题,提出一种基于近端策略优化PPO的对话生成算法PPO_GAN.该算法通过GAN模型生成对话,通过判别模型区分生成的对话与真实的对话.并采用近端策略优化的方法训练GAN,能处理GAN在对话生成时导致的反向传播不可微分的情况,在保证生成模型单调非减训练的同时,通过限制生成模型迭代的梯度使判别模型得到的奖励可以重复利用.实验结果表明,对比于极大似然估计与Adver-REGS等对话生成算法,PPO_GAN算法提高了对话训练的效率并且改善了对话生成的质量.
推荐文章
基于近端策略优化的空战决策算法研究
空战决策
智能决策
强化学习
近端策略优化
有/无人机协同
基于近端梯度的快速字典学习方法的研究
字典学习
稀疏表示
图像去噪
近端梯度
全局收敛
基于生成对抗网络的恶意域名训练数据生成
恶意域名
DGA
生成对抗网络
检测
分类
基于生成对抗文本的人脸图像翻译
人脸图像翻译
生成对抗文本
深度对称结构联合编码
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于近端策略优化与对抗学习的对话生成
来源期刊 计算机工程与科学 学科 工学
关键词 对话生成 近端策略优化 强化学习 对抗生成网络 序列到序列模型
年,卷(期) 2020,(9) 所属期刊栏目 人工智能与数据挖掘
研究方向 页码范围 1680-1689
页数 10页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1007-130X.2020.09.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 游进国 18 37 4.0 4.0
2 丁家满 39 61 4.0 5.0
3 蔡钺 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (2)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1950(1)
  • 参考文献(0)
  • 二级参考文献(1)
1966(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
对话生成
近端策略优化
强化学习
对抗生成网络
序列到序列模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导