基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法.协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略.
推荐文章
一种基于案例推理的多agent强化学习方法研究
多agent强化学习
Q学习
策略再用
基于案例的推理
追捕问题
利用聚类分析法改进的多Agent协作强化学习方法
多agent协作
强化学习
聚类分析
Friend-or-Foe
Q-学习
多Agent强化学习方法与应用
多Agent
强化学习
对策论
POMDP
基于博弈强化学习的多智能体协作行为寻优
多Agent博弈
动态协作寻优
改进Pareto-Q
收益分配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于随机博弈的Agent协同强化学习方法
来源期刊 计算机工程与科学 学科 工学
关键词 强化学习 多agent系统 随机博弈 协作
年,卷(期) 2006,(2) 所属期刊栏目 研究与发现
研究方向 页码范围 107-110
页数 4页 分类号 TP18|TP391
字数 4875字 语种 中文
DOI 10.3969/j.issn.1007-130X.2006.02.035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姚莉 国防科技大学管理科学与工程系 43 421 11.0 18.0
2 王长缨 国防科技大学管理科学与工程系 12 174 8.0 12.0
3 尹晓虎 国防科技大学管理科学与工程系 6 20 3.0 4.0
4 鲍翊平 国防科技大学管理科学与工程系 1 11 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (11)
同被引文献  (10)
二级引证文献  (8)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(3)
  • 引证文献(2)
  • 二级引证文献(1)
2009(2)
  • 引证文献(1)
  • 二级引证文献(1)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(2)
  • 引证文献(1)
  • 二级引证文献(1)
2012(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
强化学习
多agent系统
随机博弈
协作
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导