原文服务方: 太原理工大学学报       
摘要:
在传统的Q-学习算法上,提出了一种改进算法ε-Q-Learning,并应用到路径规划中.引入了动态搜索因子,其根据环境的反馈来动态调整贪婪因子ε,如果一次从起点到终点的探索失败,则通过增大ε来使下一次探索的随机性增大,以免陷入局部优化困境;反之,则通过减少ε来增加目的性.本实验利用算法损失函数、运行效率、步数、总回报来评估算法表现.实验表明,ε-Q-Learning算法相比于已有的Q-Learning算法,不仅可以找到更优的路径,而且可以有效地减少迭代搜索的代价.
推荐文章
煤矿井下基于Q-learning算法的移动机器人路径规划
移动机器人
不确定环境
强化学习
路径规划
改进Q-Learning算法在路径规划中的应用
路径规划
改进Q-Learning算法
强化学习
栅格法
机器人
结合神经网络和Q(λ)-learning的路径规划方法
路径规划
神经网络
强化学习
移动机器人
奖励函数
基于Q-learning的机会频谱接入信道选择算法
认知无线电
机会频谱接入
Q学习
信道选择
Boltzmann规则
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进的Q-Learning算法及其在路径规划中的应用
来源期刊 太原理工大学学报 学科
关键词 路径规划 人工智能 强化学习 Q-Learning
年,卷(期) 2021,(1) 所属期刊栏目 信息与计算机
研究方向 页码范围 91-97
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.16355/j.cnki.issn1007-9432tyut.2021.01.012
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (30)
共引文献  (49)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(0)
  • 二级参考文献(3)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(5)
  • 参考文献(2)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(4)
  • 参考文献(2)
  • 二级参考文献(2)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
路径规划
人工智能
强化学习
Q-Learning
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
太原理工大学学报
双月刊
1007-9432
14-1220/N
大16开
太原市迎泽西大街79号3337信箱
1957-01-01
汉语
出版文献量(篇)
4103
总下载数(次)
0
总被引数(次)
28999
论文1v1指导