基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
This paper studies a distributed policy evaluation in multi-agent reinforcement learning. Under cooperative settings, each agent only obtains a local reward, while all agents share a common environmental state. To optimize the global return as the sum of local return, the agents exchange information with their neighbors through a communication network. The mean squared projected Bellman error minimization problem is reformulated as a constrained convex optimization problem with a consensus constraint; then, a distributed alternating directions method of multipliers (ADMM) algorithm is proposed to solve it. Furthermore, an inexact step for ADMM is used to achieve efficient computation at each iteration. The convergence of the proposed algorithm is established.
推荐文章
Agent及Multi-Agent System的理论和应用
多Agent系统
Agent
人工智能
Multi-Agent在工控系统中的应用研究
Agent
Multi-Agent
现场总线
基于Multi-Agent 的主动式ESS设计
智能体
主管支持系统
主动式
基于Multi-Agent的图像理解
multi-agent
图像理解
色直方图
纹理直方图
区域抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Distributed policy evaluation via inexact ADMM in multi-agent reinforcement learning
来源期刊 控制理论与技术(英文版) 学科
关键词
年,卷(期) 2020,(4) 所属期刊栏目
研究方向 页码范围 362-378
页数 17页 分类号
字数 语种 英文
DOI 10.1007/s11768-020-00007-x
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(4)
  • 参考文献(4)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
控制理论与技术(英文版)
季刊
2095-6983
44-1706/TP
16开
广州市五山华南理工大学内
2003
eng
出版文献量(篇)
1113
总下载数(次)
0
论文1v1指导