基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对局部可观测的非线性动态地震环境下,六足机器人采用传统算法进行动态避障时易出现算法不稳定的情况.运用了基于双重深度Q网络(DDQN)的决策方式,通过传感器数据输入卷积神经网络(CNN)并结合强化学习的策略,下达命令到六足机器人,控制输出决策动作,实现机器人动态避障.将系统的环境反馈与决策控制直接形成闭环,通过最大化机器人与避障环境交互产生的累计奖励回报,更新神经网络权重,形成最优决策策略.通过六足机器人平台实验结果证明:此方法能较好地减少传统深度强化学习算法容易导致过度估计状态动作值和损失函数难以收敛的风险;并且提高了六足机器人进行动态避障的效率和稳定性.
推荐文章
基于强化学习的智能机器人避碰方法研究
强化学习
智能机器人
避碰
基于改进比例导引法的机器人动态避障算法
机器人
避障
比例导引
机动约束
轮式移动教育机器人避障方法的研究
机器人
避障
红外传感器
机械式胡须
卡死
关于足球机器人避障控制的研究
足球机器人
避障
人工势场
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强化学习的六足机器人动态避障研究
来源期刊 传感器与微系统 学科 工学
关键词 双重深度Q网络 六足机器人 动态避障 传感器输入
年,卷(期) 2022,(1) 所属期刊栏目 研究与探讨|Research & Approach
研究方向 页码范围 19-23
页数 5页 分类号 TP242.6|TP212
字数 语种 中文
DOI 10.13873/J.1000-9787(2022)01-0019-05
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
双重深度Q网络
六足机器人
动态避障
传感器输入
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
传感器与微系统
月刊
1000-9787
23-1537/TN
大16开
哈尔滨市南岗区一曼街29号
14-203
1982
chi
出版文献量(篇)
9750
总下载数(次)
43
论文1v1指导