基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对深度Q网络(DQN)应用中基于python数据结构直接实现的经验回放过程时常成为性能瓶颈,提出一种具有高性能及通用性的经验回放模块设计方案.该设计方案具有两层软件结构:底层的功能内核由C++语言实现,以提供较高的执行效率;上层则由python语言编写,以面向对象的方式封装模块功能并提供调用接口,使模块具有较高易用性.针对经验回放所涉及的关键操作,一些技术细节被充分研究和精心设计,例如,将优先级回放机制作为附属组件与模块的主体运行逻辑分离,将样本的可抽取性验证提前到样本记录操作中进行,使用高效的样本淘汰策略与算法等.这些措施使模块具有较高的通用性和可扩展性.实验结果表明,按照该模块实现的经验回放过程,整体执行效率得到了充分优化,两个关键操作——样本记录与样本抽取,皆可高效执行.与基于python数据结构的直接实现方式相比,所提模块在样本抽取操作上的性能提升了约100倍,从而避免了经验回放过程成为整个系统的性能瓶颈,满足了各类DQN相关应用项目的需要.
推荐文章
一种模块化高效电子商务推荐系统的设计
电子商务
推荐
关联规则
数据挖掘
一种基于中频回放的跟踪通道设计与实现
中频回放
跟踪通道
DFT
时分复用
一种高效网络接口的设计
片上网络
网络资源接口
核内路由
Verilog HDL
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种高效的经验回放模块设计
来源期刊 计算机应用 学科 工学
关键词 强化学习 深度学习 深度Q网络 经验回放 软件设计
年,卷(期) 2019,(11) 所属期刊栏目 人工智能
研究方向 页码范围 3242-3249
页数 8页 分类号 TP302
字数 10163字 语种 中文
DOI 10.11772/j.issn.1001-9081.2019050810
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈勃 福州大学数学与计算机科学学院 4 29 1.0 4.0
2 王锦艳 福州大学数学与计算机科学学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (49)
共引文献  (4)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(5)
  • 参考文献(2)
  • 二级参考文献(3)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(5)
  • 参考文献(1)
  • 二级参考文献(4)
2016(5)
  • 参考文献(1)
  • 二级参考文献(4)
2017(14)
  • 参考文献(0)
  • 二级参考文献(14)
2018(8)
  • 参考文献(4)
  • 二级参考文献(4)
2019(4)
  • 参考文献(4)
  • 二级参考文献(0)
2019(4)
  • 参考文献(4)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
深度学习
深度Q网络
经验回放
软件设计
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导