基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对虚拟维修环境中任务执行过程存在的不确定性和随机性问题,提出了一种基于Q学习算法的作业策略规划模型,该方法将虚拟维修过程转化为选取不同动作参与状态转移的过程.在该过程中,采用试错机制和逆向求解的方法求解动作策略规划问题,并将任务特征匹配机制和顺序约束机制作为启发机制,保证策略学习过程中持续进化可行策略;在进化过程中,将动作因子赋予概率值,并采用遗传算法(GA)进化动作因子的概率分布,避免了策略学习过程中强化早期Q值较高的动作,为求解虚拟维修的最佳作业流程提供了一种行之有效的解决方法.将该方法应用于轮式挖掘机虚拟维修训练系统中,仿真结果表明,正确的动作在作业策略迭代过程中均能够获得较高的Q值,验证了方法的可行性和实用性.
推荐文章
基于遗传算法的虚拟维修拆装序列规划
遗传算法
虚拟维修
拆装序列规划
改进的Q-Learning算法及其在路径规划中的应用
路径规划
人工智能
强化学习
Q-Learning
基于生成模型的Q-learning二分类算法
Q-learning
生成模型
二分类
最小二乘时序差分算法
半梯度下降法
结合神经网络和Q(λ)-learning的路径规划方法
路径规划
神经网络
强化学习
移动机器人
奖励函数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于GA-Q-learning算法的虚拟维修作业规划模型
来源期刊 兵工学报 学科 工学
关键词 人工智能 虚拟维修 Q学习 遗传算法 作业规划
年,卷(期) 2013,(5) 所属期刊栏目
研究方向 页码范围 627-633
页数 7页 分类号 TP391
字数 7001字 语种 中文
DOI 10.3969/j.issn.1000-1093.2013.05.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 焦玉民 解放军理工大学野战工程学院 12 78 6.0 8.0
5 王海涛 解放军理工大学野战工程学院 265 2291 25.0 40.0
6 王强 解放军理工大学野战工程学院 79 371 11.0 16.0
7 徐婷 解放军理工大学野战工程学院 38 207 9.0 12.0
8 谢庆华 解放军理工大学国防工程学院 30 319 10.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (78)
共引文献  (109)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(2)
  • 参考文献(1)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(5)
  • 参考文献(0)
  • 二级参考文献(5)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(7)
  • 参考文献(0)
  • 二级参考文献(7)
2003(17)
  • 参考文献(2)
  • 二级参考文献(15)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(11)
  • 参考文献(0)
  • 二级参考文献(11)
2006(13)
  • 参考文献(4)
  • 二级参考文献(9)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(9)
  • 参考文献(1)
  • 二级参考文献(8)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人工智能
虚拟维修
Q学习
遗传算法
作业规划
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
兵工学报
月刊
1000-1093
11-2176/TJ
大16开
北京2431信箱
82-144
1979
chi
出版文献量(篇)
5617
总下载数(次)
7
论文1v1指导