作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为使多智能体系统更能适应复杂环境,将分层方法引入强化学习.把两层Q-Learning强化学习算法用于4个智能体协作推动圆盘物体,在未知环境中实现路径规划的计算机模拟中.仿真结果说明该方法的有效性和可行性.
推荐文章
基于Q-learning的机会频谱接入信道选择算法
认知无线电
机会频谱接入
Q学习
信道选择
Boltzmann规则
改进的Q-Learning算法及其在路径规划中的应用
路径规划
人工智能
强化学习
Q-Learning
基于生成模型的Q-learning二分类算法
Q-learning
生成模型
二分类
最小二乘时序差分算法
半梯度下降法
多智能体协作技术综述
多智能体协作
自协调模型
递归建模
Markov对策
强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于两层Q-Learning算法的多智能体协作方法研究
来源期刊 煤矿机电 学科 工学
关键词 强化学习 Q学习 多智能体协作 路径规划
年,卷(期) 2013,(5) 所属期刊栏目 问题探讨
研究方向 页码范围 74-76
页数 3页 分类号 TP18
字数 1762字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王帅 24 56 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (1)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
Q学习
多智能体协作
路径规划
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
煤矿机电
双月刊
1001-0874
31-1509/TD
大16开
上海市天钥桥路1号
1980
chi
出版文献量(篇)
4835
总下载数(次)
5
总被引数(次)
13796
论文1v1指导