作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Q学习状态空间非常大,导致收敛速度非常慢的问题,给出一种基于边界样本协调的多智能体在线合作学习方法,使得智能体在特定的子空间上进行特化并通过边界状态上的开关函数相互协调,从而能够较快地学习到局部最优.仿真实验表明该方法能够取得比全局学习更好的在线学习性能.
推荐文章
基于黑板模型的多智能体合作学习
多智能体系统
合作学习
黑板模型
基于网络的虚拟实验合作学习
基于网络的虚拟实验合作学习
学习环境设计
教学模式
基于网络的虚拟实验合作学习
基于网络的虚拟实验合作学习
学习环境设计
教学模式
基于多智能体强化学习的多AGV路径规划方法
多智能体强化学习
AGV路径规划
独立强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于边界样本协调的多智能体合作学习
来源期刊 模式识别与人工智能 学科
关键词 多智能体系统 强化学习 多智能体合作
年,卷(期) 2008,(1) 所属期刊栏目 研究与应用
研究方向 页码范围 111-115
页数 5页 分类号
字数 3671字 语种 中文
DOI 10.3969/j.issn.1003-6059.2008.01.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩伟 南京财经大学信息工程学院 27 143 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (27)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1953(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(6)
  • 参考文献(1)
  • 二级参考文献(5)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(3)
  • 参考文献(3)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多智能体系统
强化学习
多智能体合作
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
论文1v1指导