原文服务方: 机器人       
摘要:
在多机器人系统中,评价一个机器人行为的好坏常常依赖于其它机器人的行为,此时必须采用组合动作以实现多机器人的协作,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢.本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数,并应用于多机器人协作任务之中.实验结果表明,基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略.
推荐文章
多智能体强化学习及其在足球机器人角色分配中的应用
多智能体系统
强化学习
朴素贝叶斯分类器
机器人足球
角色分配
动作预测在多机器人强化学习协作中的应用
动作预测
强化学习
多机器人协作
基于强化学习的未知环境多机器人协作搜集
多机器人系统
强化学习
协作
搜集任务
多机器人系统强化学习研究综述
多机器人系统
强化学习
马尔科夫决策过程
计算复杂度
不确定性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种新的多智能体强化学习算法及其在多机器人协作任务中的应用
来源期刊 机器人 学科
关键词 分布式强化学习 加速算法 多智能体系统
年,卷(期) 2003,(4) 所属期刊栏目 论文与报告
研究方向 页码范围 344-348,362
页数 6页 分类号 TP24
字数 语种 中文
DOI 10.3321/j.issn:1002-0446.2003.04.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 顾国昌 哈尔滨工程大学计算机科学与技术学院 138 2134 24.0 41.0
2 张汝波 哈尔滨工程大学计算机科学与技术学院 110 1870 20.0 39.0
6 仲宇 哈尔滨工程大学计算机科学与技术学院 6 129 5.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (71)
参考文献  (5)
节点文献
引证文献  (48)
同被引文献  (32)
二级引证文献  (5)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(1)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(8)
  • 参考文献(1)
  • 二级参考文献(7)
1993(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(6)
  • 参考文献(0)
  • 二级参考文献(6)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(7)
  • 参考文献(2)
  • 二级参考文献(5)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2003(1)
  • 引证文献(1)
  • 二级引证文献(0)
2004(3)
  • 引证文献(3)
  • 二级引证文献(0)
2006(3)
  • 引证文献(3)
  • 二级引证文献(0)
2007(7)
  • 引证文献(7)
  • 二级引证文献(0)
2008(5)
  • 引证文献(4)
  • 二级引证文献(1)
2009(4)
  • 引证文献(4)
  • 二级引证文献(0)
2010(5)
  • 引证文献(5)
  • 二级引证文献(0)
2011(5)
  • 引证文献(5)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(5)
  • 引证文献(4)
  • 二级引证文献(1)
2014(4)
  • 引证文献(3)
  • 二级引证文献(1)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分布式强化学习
加速算法
多智能体系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
机器人
双月刊
1002-0446
21-1137/TP
大16开
1979-01-01
chi
出版文献量(篇)
2337
总下载数(次)
0
总被引数(次)
57113
相关基金
武器装备预研基金
英文译名:
官方网址:
项目类型:武器装备预研基金重点基金项目和武器装备预研基金一般基金项目
学科类型:
论文1v1指导