基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对交通拥堵问题,利用深度强化学习与交通信号控制相结合的方法,构造一个单路口的道路模型,将交通信号控制问题转化为一个Agent在离散时间步长上与交叉口交互的强化学习问题,将交叉口的等待时间作为目标函数.利用强化学习的决策能力和深度学习的感知能力,使得智能体Agent在观测到环境状态后选择出当前状态下可能的最优控制策略并执行,并根据奖赏函数来更新下一时刻的状态.在仿真软件SUMO上进行仿真实验,与定时控制模式相比,所提出的方法在不同饱和度流量下的车辆等待时间均有不同程度的提升,验证了算法的有效性.
推荐文章
基于模糊自整定PID控制的支路口信号研究
模糊PID控制
自适应
支路口
Matlab
Simulink
基于深度强化学习的图像修复算法设计
图像修复
机器学习
深度强化学习
大数据
自相似
关联性
结合Q学习和模糊逻辑的单路口交通信号自学习控制方法
交通信号控制
强化学习
BP神经网络
模糊评价
Paramics仿真
基于深度强化学习的服务功能链映射算法
网络功能虚拟化
服务功能链
深度强化学习
网络时延
网络运维开销
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的单路口信号控制算法
来源期刊 电子测量技术 学科 工学
关键词 深度学习 交通信号控制 Deep Q-network SUMO
年,卷(期) 2019,(24) 所属期刊栏目 理论与算法
研究方向 页码范围 49-52
页数 4页 分类号 TP181
字数 语种 中文
DOI 10.19651/j.cnki.emt.1903223
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 任安虎 36 106 6.0 8.0
2 郭梦杰 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (14)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(1)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(5)
  • 参考文献(2)
  • 二级参考文献(3)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(6)
  • 参考文献(1)
  • 二级参考文献(5)
2016(7)
  • 参考文献(0)
  • 二级参考文献(7)
2017(4)
  • 参考文献(3)
  • 二级参考文献(1)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度学习
交通信号控制
Deep Q-network
SUMO
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子测量技术
半月刊
1002-7300
11-2175/TN
大16开
北京市东城区北河沿大街79号
2-336
1977
chi
出版文献量(篇)
9342
总下载数(次)
50
总被引数(次)
46785
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导