基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
强化学习是一种重要的机器学习方法,在机器人路径规划,智能控制等许多决策问题中取得了成功的应用,已经成为机器学习研究的一个重要分支.针对强化学习存在着的收敛慢,学习知识慢,探索与利用平衡等问题,论文对SARSA(λ)算法提出了一种改进,改进的方法借助经验知识从环境特征中提出一个用于策略择优和优化回报函数的启发函数,以此来加速算法的收敛速度.通过仿真对比,论文提出改进算法具有比SARSA(λ)更快的奖赏反馈,表明了该算法在知识学习方面的有效性.
推荐文章
基于值函数迁移的启发式Sarsa算法
强化学习
值函数迁移
自模拟度量
变分贝叶斯
基于启发函数的网格数据库查询算法
网络数据库
查询处理
启发函数
基于启发式机制的改进蚁群算法
蚁群算法
启发式机制
蚁群系统(ACS)算法
惩罚函数
反演启发函数的监督学习算法
反演
启发估计函数
有序线性消解
专家系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于启发函数改进的SARSA(λ)算法
来源期刊 计算机与数字工程 学科 工学
关键词 强化学习 SARSA(λ) 启发函数 评估学习
年,卷(期) 2016,(5) 所属期刊栏目 算法与分析
研究方向 页码范围 825-828
页数 4页 分类号 TP301.6
字数 2855字 语种 中文
DOI 10.3969/j.issn.1672-9722.2016.05.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 潘地林 安徽理工大学计算机科学与工程学院 80 364 10.0 15.0
2 马朋委 安徽理工大学计算机科学与工程学院 3 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (25)
二级引证文献  (38)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(6)
  • 引证文献(1)
  • 二级引证文献(5)
2019(22)
  • 引证文献(1)
  • 二级引证文献(21)
2020(12)
  • 引证文献(0)
  • 二级引证文献(12)
研究主题发展历程
节点文献
强化学习
SARSA(λ)
启发函数
评估学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与数字工程
月刊
1672-9722
42-1372/TP
大16开
武汉市东湖新技术开发区凤凰产业园藏龙北路1号
1973
chi
出版文献量(篇)
9945
总下载数(次)
28
总被引数(次)
47579
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导