原文服务方: 机器人       
摘要:
虽然基于行为控制的自主机器人具有较高的鲁棒性,但其对于动态环境缺乏必要的自适应能力.强化学习方法使机器人可以通过学习来完成任务,而无需设计者完全预先规定机器人的所有动作,它是将动态规划和监督学习结合的基础上发展起来的一种新颖的学习方法 ,它通过机器人与环境的试错交互,利用来自成功和失败经验的奖励和惩罚信号不断改进机器人的性能,从而达到目标,并容许滞后评价.由于其解决复杂问题的突出能力,强化学习已成为一种非常有前途的机器人学习方法.本文系统论述了强化学习方法在自主机器人中的研究现状,指出了存在的问题,分析了几种问题解决途径,展望了未来发展趋势.
推荐文章
仿真机器人足球中的强化学习
仿真机器人足球
强化学习
多主体系统
基于强化学习的智能机器人避碰方法研究
强化学习
智能机器人
避碰
强化学习在足球机器人基本动作学习中的应用
强化学习
机器人足球比赛
行为学习
T-S模糊神经网络
强化学习在机器人足球比赛中的应用
强化学习
机器人足球比赛
多智能体
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 自主机器人的强化学习研究进展
来源期刊 机器人 学科
关键词 强化学习 Markov决策过程 自主机器人 机器智能 基于行 为
年,卷(期) 2001,(4) 所属期刊栏目 综论与介绍
研究方向 页码范围 379-384
页数 6页 分类号 TP24
字数 语种 中文
DOI 10.3321/j.issn:1002-0446.2001.04.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 席裕庚 上海交通大学自动化系 217 6520 41.0 71.0
3 陈卫东 上海交通大学自动化系 95 2775 28.0 49.0
9 顾冬雷 上海交通大学自动化系 7 179 6.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (55)
同被引文献  (28)
二级引证文献  (200)
2001(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2002(1)
  • 引证文献(1)
  • 二级引证文献(0)
2003(4)
  • 引证文献(4)
  • 二级引证文献(0)
2004(9)
  • 引证文献(8)
  • 二级引证文献(1)
2005(16)
  • 引证文献(7)
  • 二级引证文献(9)
2006(22)
  • 引证文献(4)
  • 二级引证文献(18)
2007(22)
  • 引证文献(6)
  • 二级引证文献(16)
2008(18)
  • 引证文献(2)
  • 二级引证文献(16)
2009(32)
  • 引证文献(7)
  • 二级引证文献(25)
2010(24)
  • 引证文献(4)
  • 二级引证文献(20)
2011(14)
  • 引证文献(1)
  • 二级引证文献(13)
2012(16)
  • 引证文献(2)
  • 二级引证文献(14)
2013(19)
  • 引证文献(1)
  • 二级引证文献(18)
2014(11)
  • 引证文献(1)
  • 二级引证文献(10)
2015(10)
  • 引证文献(2)
  • 二级引证文献(8)
2016(5)
  • 引证文献(2)
  • 二级引证文献(3)
2017(8)
  • 引证文献(2)
  • 二级引证文献(6)
2018(12)
  • 引证文献(0)
  • 二级引证文献(12)
2019(7)
  • 引证文献(0)
  • 二级引证文献(7)
2020(5)
  • 引证文献(1)
  • 二级引证文献(4)
研究主题发展历程
节点文献
强化学习
Markov决策过程
自主机器人
机器智能
基于行 为
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
机器人
双月刊
1002-0446
21-1137/TP
大16开
1979-01-01
chi
出版文献量(篇)
2337
总下载数(次)
0
总被引数(次)
57113
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导