基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文中提出了一种基于模仿学习和强化学习的智能车辆换道行为决策方法.其中宏观决策模块通过模仿学习构建极端梯度提升模型,根据输入信息在车道保持、左换道和右换道中选择宏观决策指令,以此确定所需求解的换道行为决策子问题;各细化决策子模块通过深度确定性策略梯度强化学习方法得到优化策略,求解相应换道行为决策子问题,以确定车辆运动目标位置并下发执行.仿真结果表明:本文中提出方法的策略学习速度比单纯强化学习方法快,且其综合性能优于有限状态机、行为克隆模仿学习和单纯强化学习等方法.
推荐文章
基于深度强化学习的车辆多目标协同巡航决策控制系统设计
深度强化学习
车辆多目标
协同巡航
决策控制
轨迹跟踪器
多目标解耦
协同参数
量化分析
基于博弈强化学习的多智能体协作行为寻优
多Agent博弈
动态协作寻优
改进Pareto-Q
收益分配
基于强化学习的智能机器人避碰方法研究
强化学习
智能机器人
避碰
基于信息交互的元胞自动机换道行为模型研究
元胞自动机
换道行为
换道意图
信息交互
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于模仿学习和强化学习的智能车辆换道行为决策
来源期刊 汽车工程 学科
关键词 智能车辆 行为决策 强化学习 模仿学习
年,卷(期) 2021,(1) 所属期刊栏目
研究方向 页码范围 59-67
页数 9页 分类号
字数 语种 中文
DOI 10.19562/j.chinasae.qcgc.2021.01.008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (17)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(6)
  • 参考文献(2)
  • 二级参考文献(4)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(6)
  • 参考文献(1)
  • 二级参考文献(5)
2016(6)
  • 参考文献(1)
  • 二级参考文献(5)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(6)
  • 参考文献(2)
  • 二级参考文献(4)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
智能车辆
行为决策
强化学习
模仿学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
汽车工程
月刊
1000-680X
11-2221/U
大16开
北京市西城区莲花池东路102号天连大厦1003室
2-341
1979
chi
出版文献量(篇)
4728
总下载数(次)
23
总被引数(次)
66645
论文1v1指导