基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在使用反距离加权法(Inverse Distance Weighted method,IDW)对土壤重金属含量进行预测时,算法中的超参数一般由先验知识确定,一定程度上存在不确定性.针对这一问题,提出了一种状态值再利用的竞争深度Q学习网络算法以精确估计IDW的超参数.该算法在训练时,将每轮训练样本中的奖励值进行标准化后,与Dueling-DQN中Q网络的状态值结合形成新的总奖励值,然后将总奖励值输入到Q网络中进行学习,从而增强了状态与动作的内在联系,使算法更加稳定.最后使用该算法在IDW上进行超参数学习,并与几种常见强化学习算法进行对比实验.实验表明,提出的RSV-DuDQN算法可以使模型更快收敛,同时提升了模型的稳定性,还可以更准确地得到IDW的参数估计.
推荐文章
一种深度Q网络的改进算法
深度Q网络
过估计问题
更正函数
状态-动作值
焦化废水深度处理回用及新鲜水系统重复利用技改
生化出水
树脂吸附
脱盐
新鲜水
重复利用
低压蒸汽喷射
基于排序优先经验回放的竞争深度Q网络学习
强化学习
深度Q网络
竞争网络
排序优先经验回放
吉林油田可重复利用压裂液体系研究
压裂液
耐温
耐剪切
黏度
重复利用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 重复利用状态值的竞争深度Q网络算法
来源期刊 计算机工程与应用 学科 工学
关键词 状态值重利用 竞争深度Q学习网络 反距离加权法 超参数搜索
年,卷(期) 2021,(4) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 134-140
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.3778/j.issn.1002-8331.2007-0125
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (33)
共引文献  (3)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(9)
  • 参考文献(3)
  • 二级参考文献(6)
2016(6)
  • 参考文献(1)
  • 二级参考文献(5)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(8)
  • 参考文献(1)
  • 二级参考文献(7)
2019(3)
  • 参考文献(2)
  • 二级参考文献(1)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
状态值重利用
竞争深度Q学习网络
反距离加权法
超参数搜索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导