基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高强化学习算法在多智能体系统中的性能表现,针对典型的多智能体系统一Keepaway平台总是以失败告终的特点,受与之有相同特点的单智能体系统杆平衡系统所采用强化函数的启发,重新设计一种新的惩罚式的强化函数.新的强化函数在系统成功状态时设零值奖赏,失败状态时给与负值惩罚.基于新设计的强化函数的Sarsa(A)算法成功应用在Keepaway平台上.仿真结果表明,新设计的强化函数在一定参数条件下有效提高了强化学习算法栽Keepaway平台的性能表现.其最终的学习效果更好.
推荐文章
基于强化学习的多智能体协作方法研究
多智能体
协作系统
强化学习
基于GAED-MADDPG多智能体强化学习的协作策略研究
强化学习
群体协作
深度学习
群体智慧
基于多智能体强化学习的多AGV路径规划方法
多智能体强化学习
AGV路径规划
独立强化学习
多智能体学习中基于知识的强化函数设计方法
智能体 强化学习 强化函数 Robot Soccer
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多智能体强化学习的新强化函数设计
来源期刊 控制工程 学科 工学
关键词 Keepaway 多智能体系统 强化学习 强化函数 Robocup
年,卷(期) 2009,(2) 所属期刊栏目 计算机控制系统及软件
研究方向 页码范围 239-242
页数 4页 分类号 TP181
字数 4665字 语种 中文
DOI 10.3969/j.issn.1671-7848.2009.02.032
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 左国玉 北京工业大学电子信息与控制工程学院 26 195 7.0 13.0
2 韩光胜 北京工业大学电子信息与控制工程学院 19 211 9.0 14.0
3 张红卫 北京工业大学电子信息与控制工程学院 1 9 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (9)
同被引文献  (12)
二级引证文献  (5)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(5)
  • 引证文献(3)
  • 二级引证文献(2)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Keepaway
多智能体系统
强化学习
强化函数
Robocup
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制工程
月刊
1671-7848
21-1476/TP
大16开
沈阳东北大学310信箱
8-216
1994
chi
出版文献量(篇)
5468
总下载数(次)
9
总被引数(次)
44239
论文1v1指导