基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
强化学习是一种有效的机器学习方法,是无监督学习,通过不断地和环境交互得到外部环境评价信号,选择合适的动作.Q学习是一种典型的强化学习,其学习效率较低,尤其是当状态空间和决策空间较大时.为提高Q学习学习效率和收敛速度,采用具有先验知识的Q学习算法,利用模糊综合决策方法处理专家经验和环境信息得到Q学习的先验知识,对Q学习的初始状态进行优化;针对Agent个体学习与群体学习各自的不足,提出了采用混合学习算法,将个体学习与群体学习有效结合起来,提高了Agent的个体性能及系统整体的智能水平;同时为满足复杂适应性需求,采用Agent混合结构模型,在该模型中构造了基于知识的协调控制器,通过它来协调慎思式过程和反应式过程.
推荐文章
多Agent系统的形式化开放混合体系结构模型研究
多Agent系统
体系结构
开放环境
形式描述
Z++
协作
交互
基于规范的 Agent 混合结构模型研究
计算实验
Agent
规范
混合结构模型
Agent 建模
混合结构车体及试验方法研究
客车
车体
混合结构
试验方法
浅析工业与民用建筑的混合结构设计
工业与民用建筑
混合结构设计
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Agent仿真中具有先验知识的混合学习算法与混合结构模型
来源期刊 海军航空工程学院学报 学科 工学
关键词 多智能体系统 混合学习算法 混合结构模型
年,卷(期) 2007,(2) 所属期刊栏目
研究方向 页码范围 247-251
页数 5页 分类号 TP391.9
字数 5091字 语种 中文
DOI 10.3969/j.issn.1673-1522.2007.02.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭晓军 海军航空工程学院控制工程系 12 43 3.0 6.0
2 李红卫 西安通讯工程学院研究生处 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (186)
参考文献  (7)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(11)
  • 参考文献(0)
  • 二级参考文献(11)
2001(20)
  • 参考文献(1)
  • 二级参考文献(19)
2002(8)
  • 参考文献(0)
  • 二级参考文献(8)
2003(7)
  • 参考文献(3)
  • 二级参考文献(4)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多智能体系统
混合学习算法
混合结构模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
海军航空工程学院学报
双月刊
1673-1522
37-1311/V
大16开
山东省烟台市二马路188号
1984
chi
出版文献量(篇)
2843
总下载数(次)
7
总被引数(次)
9538
论文1v1指导