作者:
原文服务方: 控制理论与应用       
摘要:
当前广泛应用的基于车流动力学建模的交通信号优化模型精确度较高,但迁移能力稍弱,针对该问题,本文提出了一种基于深度强化学习的单智能体交通信号控制方法.该方法首次在考虑交叉口有行人穿越干扰的情况下定义了动作空间,从3个不同的角度定义了3种奖励函数,并提出了一种累积延迟近似方法.在算法方面,提出了一种基于动态权重的Soft Actor-Critic算法,该算法可以动态调整Actor网络和Critic网络的更新幅度,显著地提高了传统Soft Actor-Critic算法的收敛效率和收敛性能.仿真结果表明,本文提出的模型和算法在降低车辆延迟时间、减少车辆停车次数以及减少车辆队列长度等交通性能指标方面是有效的.
推荐文章
基于CAN总线的交通信号控制节点设计
CAN总线
交通
现场总线
基于Q学习的交通信号自学习控制方法的研究
Q学习
模糊推理
遗传算法
智能体
交通信号控制
结合Q学习和模糊逻辑的单路口交通信号自学习控制方法
交通信号控制
强化学习
BP神经网络
模糊评价
Paramics仿真
交通信号灯优化控制
模糊控制
CCD摄像
智能控制
交通信号灯
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的交通信号控制
来源期刊 控制理论与应用 学科 交通运输
关键词 交通信号;强化学习;动态权重;延迟时间
年,卷(期) 2025,(1) 所属期刊栏目
研究方向 页码范围 76-86
页数 11页 分类号
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2025(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
交通信号;强化学习;动态权重;延迟时间
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制理论与应用
月刊
1000-8152
44-1240/TP
大16开
1984-01-01
chi
出版文献量(篇)
4979
总下载数(次)
0
总被引数(次)
72515
论文1v1指导