基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在分布式的动态环境下,多智能体系统的协作是建立在规则集合上的动态过程,因此需要建立动态的协作规则.多智能体强化学习的平稳状态本质上即是智能体之间的协作规则,据此提出一种基于强化学习的协作规则提取的方法,并由此构成智能体决策的新结构,最后用实例进行分析和证明了所提出的方法与单纯的强化学习方法相比较,具有如下优点:1)提取的规则可以加快多智能体的协作决策过程;2)规则的动态变化可以适应环境的动态变化;3)规则可以避免多次重复的学习过程.
推荐文章
基于强化学习的多智能体协作方法研究
多智能体
协作系统
强化学习
基于GAED-MADDPG多智能体强化学习的协作策略研究
强化学习
群体协作
深度学习
群体智慧
基于博弈强化学习的多智能体协作行为寻优
多Agent博弈
动态协作寻优
改进Pareto-Q
收益分配
基于多智能体强化学习的多AGV路径规划方法
多智能体强化学习
AGV路径规划
独立强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强化学习的多智能体动态协作规则提取
来源期刊 模式识别与人工智能 学科 工学
关键词 多智能体 动态协作规则 强化学习 规则提取
年,卷(期) 2002,(4) 所属期刊栏目 研究与应用
研究方向 页码范围 463-467
页数 5页 分类号 TP18
字数 3782字 语种 中文
DOI 10.3969/j.issn.1003-6059.2002.04.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 许晓鸣 上海交通大学自动化研究所 132 2698 28.0 46.0
2 杨煜普 上海交通大学自动化研究所 125 1534 23.0 35.0
3 李晓萌 上海交通大学自动化研究所 8 201 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多智能体
动态协作规则
强化学习
规则提取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
论文1v1指导