基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了降低交叉口信号控制的部分可观测马尔科夫特性对深度Q学习性能的影响,引入深度循环Q学习,将全连接网络层改为LSTM层,同时针对当前研究中动作空间较小的缺点,改进了动作空间.通过仿真实验,将所提算法与深度Q学习算法、传统的定时控制和Q学习算法的平均延误在三种不同饱和度流量下进行了对比.实验结果表明,改进动作空间的深度循环Q学习算法的性能要优于上述其他三种算法.
推荐文章
基于 TCPN 的交叉口信号控制模型与优化
智能交通系统
交通信号控制
时延赋色Petri网
通行能力
优化
城市道路交叉口信号配时多目标优化方法研究
交叉口
信号配时
多目标优化
环境变异免疫克隆算法
基于粒子群优化算法的多交叉口信号配时
交叉口信号配时
PSO算法
灾变PSO算法
二阶振荡PSO算法
单点交叉口信号配时优化与碳排放的案例
交通工程
碳排放
信号配时优化
十字信号交叉口
交通仿真
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 交叉口信号优化控制的深度循环Q学习方法
来源期刊 信息技术与网络安全 学科 工学
关键词 交通信号控制 Q学习 深度循环网络 深度Q学习 深度循环Q学习
年,卷(期) 2018,(6) 所属期刊栏目 人工智能
研究方向 页码范围 85-89
页数 5页 分类号 TP181
字数 3774字 语种 中文
DOI 10.19358/j.issn.2096-5133.2018.06.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈锋 中国科学技术大学信息科学技术学院 95 1887 22.0 41.0
2 施赛江 中国科学技术大学信息科学技术学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (24)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (8)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(8)
  • 参考文献(1)
  • 二级参考文献(7)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
交通信号控制
Q学习
深度循环网络
深度Q学习
深度循环Q学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导