基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现有的信号配时强化学习模型大多是风险中立的强化学习模型,其缺点是在线学习中稳定性和鲁棒性较差,需要的运行时间较长,且收敛效果不明显.为了解决存在的这些问题,建立了风险避免强化学习交通信号配时模型,用排队长度差作为模型的交通评价指标.在集成VISSIM-Excel VBA-Matlab的仿真平台上进行了仿真实验,分析了风险程度系数对配时方案优劣程度、收敛性的影响;与风险中立的强化学习模型进行对比分析,得出了新模型,它在稳定性方面有较大的改进,收敛速度较快,在交通评价指标上运行效果好.针对交通信号配时优化这类问题,应采用增量风险避免强化学习方法,即风险程度系数应采用小步距递增的方式.
推荐文章
基于乘客延误的信号交叉口配时优化模型
信号交叉口
配时优化
乘客人均延误
协调变换
城市道路交叉口仿真评价及优化配时
信号配时
交通流量
延误
VISSIM
基于改进元胞传输模型的交叉口信号配时优化
车道溢流
元胞传输模型
信号配时
蜜蜂算法
动态优化
基于Vissim的交叉口信号优化配时仿真评价
交通信号
丁字形交叉口
优化配时
Vissim
仿真评价
交通拥堵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于风险避免强化学习的单交叉口配时优化
来源期刊 交通科学与工程 学科 交通运输
关键词 增量风险避免 强化学习 信号配时 仿真
年,卷(期) 2014,(1) 所属期刊栏目 交通规划与智能交通
研究方向 页码范围 80-85
页数 6页 分类号 U491.5+4
字数 5992字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卢守峰 长沙理工大学交通运输工程学院 22 150 7.0 12.0
2 毛盈方 长沙理工大学交通运输工程学院 2 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (14)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(5)
  • 参考文献(1)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
增量风险避免
强化学习
信号配时
仿真
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
交通科学与工程
季刊
1674-599X
43-1494/U
大16开
湖南省长沙市雨花区万家丽路二段960号长沙理工大学1办公楼804房
1985
chi
出版文献量(篇)
1651
总下载数(次)
3
论文1v1指导