原文服务方: 机器人       
摘要:
提出一种基于案例推理的多agent强化学习方法.构建了系统策略案例库,通过判断agent之间的协作关系选择相应案例库子集.利用模拟退火方法从中寻找最合适的可再用案例策略,agent按照案例指导执行动作选择.在没有可用案例的情况下,agent执行联合行为学习(JAL).在学习结果的基础上实时更新系统策略案例库.追捕问题的仿真结果表明所提方法明显提高了学习速度与收敛性.
推荐文章
利用聚类分析法改进的多Agent协作强化学习方法
多agent协作
强化学习
聚类分析
Friend-or-Foe
Q-学习
一种基于强化学习的多指手位置控制方法
多指手
非线性
强化学习
自适应评价算法
多Agent强化学习方法与应用
多Agent
强化学习
对策论
POMDP
一种用于CBR推理机的案例学习算法研究
案例学习
CBR推理机
seq2seq模型
智能机器人
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于案例推理的多agent强化学习方法研究
来源期刊 机器人 学科
关键词 多agent强化学习 Q学习 策略再用 基于案例的推理 追捕问题
年,卷(期) 2009,(4) 所属期刊栏目 论文与报告
研究方向 页码范围 320-326
页数 7页 分类号 TP18
字数 语种 中文
DOI 10.3321/j.issn:1002-0446.2009.04.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 潘启树 哈尔滨工业大学计算机科学与技术学院 32 624 13.0 24.0
2 洪炳殚 哈尔滨工业大学计算机科学与技术学院 6 81 5.0 6.0
3 李珺 哈尔滨工业大学计算机科学与技术学院 5 40 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (13)
同被引文献  (15)
二级引证文献  (134)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(8)
  • 引证文献(2)
  • 二级引证文献(6)
2012(4)
  • 引证文献(1)
  • 二级引证文献(3)
2013(13)
  • 引证文献(1)
  • 二级引证文献(12)
2014(10)
  • 引证文献(3)
  • 二级引证文献(7)
2015(11)
  • 引证文献(0)
  • 二级引证文献(11)
2016(11)
  • 引证文献(1)
  • 二级引证文献(10)
2017(18)
  • 引证文献(0)
  • 二级引证文献(18)
2018(32)
  • 引证文献(2)
  • 二级引证文献(30)
2019(23)
  • 引证文献(0)
  • 二级引证文献(23)
2020(14)
  • 引证文献(0)
  • 二级引证文献(14)
研究主题发展历程
节点文献
多agent强化学习
Q学习
策略再用
基于案例的推理
追捕问题
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
机器人
双月刊
1002-0446
21-1137/TP
大16开
1979-01-01
chi
出版文献量(篇)
2337
总下载数(次)
0
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导