基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
This paper presents a novel distributed multi-agent temporal-difference learning framework for value function approximation,which allows agents using all the neighbor information instead of the information from only one neighbor. With full neighbor information, the proposed framework (1) has a faster convergence rate, and (2) is more robust compared to the state-of-the-art approaches. Then we propose a distributed multi-agent discounted temporal difference algorithm and a distributed multi-agent average cost temporal difference learning algorithm based on the framework. Moreover, the two proposed algorithms'theoretical convergence proofs are provided. Numerical simulation results show that our proposed algorithms are superior to the gossip-based algorithm in convergence speed, robustness to noise and time-varying network topology.
推荐文章
Agent及Multi-Agent System的理论和应用
多Agent系统
Agent
人工智能
Multi-Agent在工控系统中的应用研究
Agent
Multi-Agent
现场总线
基于Multi-Agent 的主动式ESS设计
智能体
主管支持系统
主动式
基于Multi-Agent的图像理解
multi-agent
图像理解
色直方图
纹理直方图
区域抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Distributed multi-agent temporal-difference learning with full neighbor information
来源期刊 控制理论与技术(英文版) 学科
关键词
年,卷(期) 2020,(4) 所属期刊栏目
研究方向 页码范围 379-389
页数 11页 分类号
字数 语种 英文
DOI 10.1007/s11768-020-00016-w
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (19)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
引文网络交叉学科
相关学者/机构
期刊影响力
控制理论与技术(英文版)
季刊
2095-6983
44-1706/TP
16开
广州市五山华南理工大学内
2003
eng
出版文献量(篇)
1113
总下载数(次)
0
总被引数(次)
4188
论文1v1指导