基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
深度Q神经网络算法的值函数迭代算法大多为Q学习算法,这种算法使用贪婪值函数作逼近目标,不利于深度Q神经网络算法获得长期来看更好的策略.通过以期望思想求解的期望值函数取代贪婪值函数作为更新目标,提出了基于期望值函数的离策略深度Q神经网络算法,并结合DQN算法神经网络更新方法,给出期望值函数能够作用于DQN算法的解释.通过使用该算法能够快速获得长期回报较高的动作和稳定的策略.最后分别在CarPole-v1和Acrobot仿真环境中对期望值函数的离策略深度Q神经网络算法和深度Q神经网络算法进行获取策略的稳定性对比实验,结果表明,基于期望值函数的离策略深度Q神经网络算法能够快速获得长期回报较高的动作,并且该算法表现更为稳定.
推荐文章
基于改进sigmoid激活函数的深度神经网络训练算法研究
深度神经网络
残差衰减
sigmoid激活函数
基于深度卷积神经网络的图像检索算法研究
图像检索
卷积神经网络
特征提取
深度学习
基于样条插值函数的离散过程神经网络训练
过程神经网络
样条函数
网络训练
算法设计
基于改进型期望值选择的GA及程序实现
期望值
遗传算法
C++
函数优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于期望值函数的离策略深度Q神经网络算法
来源期刊 四川理工学院学报(自然科学版) 学科 工学
关键词 深度Q神经网络 期望值函数 离策略 策略表现
年,卷(期) 2019,(1) 所属期刊栏目 机械、电子及计算机科学
研究方向 页码范围 52-60
页数 9页 分类号 TP301.6
字数 6434字 语种 中文
DOI 10.11863/j.suse.2019.01.08
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蔡乐才 16 19 3.0 4.0
2 高祥 3 6 1.0 2.0
4 刘川莉 四川轻化工大学自动化与信息工程学院 2 0 0.0 0.0
8 居锦武 2 0 0.0 0.0
9 吴昊霖 四川大学计算机学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (66)
共引文献  (144)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(1)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(4)
  • 参考文献(1)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(6)
  • 参考文献(1)
  • 二级参考文献(5)
2014(8)
  • 参考文献(1)
  • 二级参考文献(7)
2015(17)
  • 参考文献(1)
  • 二级参考文献(16)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度Q神经网络
期望值函数
离策略
策略表现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
四川理工学院学报(自然科学版)
双月刊
1673-1549
51-1687/N
四川省自贡市汇兴路学苑街180号
chi
出版文献量(篇)
2774
总下载数(次)
3
总被引数(次)
12372
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导