基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对分层策略梯度强化学习算法(HPGRL)易陷入局部最优点等问题,提出一种分层策略搜索算法(PSO-HPS).首先由设计者按照经典分层强化学习MAXQ方法的思想构建子任务分层结构,通过与环境的直接交互,PSO-HPS利用具有较强全局搜索能力的粒子群对各复合子任务中的参数化策略进行进化,以获得优化的动作策略.最后以协商僵局消解的实验验证PSO-HPS是有效的,其性能明显优于HPGRL.
推荐文章
一种基于非贪婪策略的网络蜘蛛搜索算法
专业搜索引擎
网络蜘蛛
搜索策略
非贪婪策略
一种基于领导者策略的狼群搜索算法
领导者策略
狼群搜索算法
标准函数
全局优化
最优值
一种改进的和声搜索算法
和声搜索算法
蝙蝠算法
改进和声搜索算法
稳定性
精确度
一种基于自适应预测的菱形搜索算法
运动估计
起点预测
块匹配
相关性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于PSO的分层策略搜索算法
来源期刊 模式识别与人工智能 学科
关键词 分层强化学习 粒子群优化算法(PSO) 分层策略 协商僵局
年,卷(期) 2008,(1) 所属期刊栏目 研究与应用
研究方向 页码范围 98-103
页数 6页 分类号
字数 5680字 语种 中文
DOI 10.3969/j.issn.1003-6059.2008.01.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭志平 茂名学院计算机科学与技术系 34 224 9.0 14.0
2 李绍平 茂名学院计算机科学与技术系 16 123 5.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (165)
参考文献  (9)
节点文献
引证文献  (3)
同被引文献  (12)
二级引证文献  (5)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(4)
  • 参考文献(1)
  • 二级参考文献(3)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(2)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
分层强化学习
粒子群优化算法(PSO)
分层策略
协商僵局
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
相关基金
广东省自然科学基金
英文译名:Guangdong Natural Science Foundation
官方网址:http://gdsf.gdstc.gov.cn/
项目类型:研究团队
学科类型:
论文1v1指导