基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对以机场为代表的大型交通枢纽出租车调度困难的问题,从出租车司机利益的角度出发,提出一种基于改进深度强化学习的司机决策方法.该方法首先对机场环境和机场所在的城市环境进行模拟,定义了司机的状态、动作,与环境交互获得的奖励和状态转移.然后,以司机的状态参数作为DQN的输入,用DQN拟合状态-动作值函数(Q值函数).最后,通过不断地让司机根据ε-贪心策略做出决策,并根据奖励函数达到更新DQN参数的目的.实验结果表明:在模拟的大、中、小型城市等环境下,司机都可以通过模型定量地得到当前各种决策动作的期望收益并作出合理的决策,从而自动地完成出租车调度的过程.
推荐文章
基于出租车司机经验的约束深度强化学习算法路径挖掘
最快路径挖掘
路段经验数据库
经验学习
深度强化学习
男性出租车司机生命质量及其影响因素分析
男性出租车司机
SF-36健康调查量表
生命质量
基于增强学习的网格化出租车调度方法
城市交通
出租车调度
增强学习
网格化管理
自适应式控制
机场出租车司机决策模型的研究
决策问题
收益函数
乘车人数模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的机场出租车司机决策方法
来源期刊 计算机与现代化 学科 工学
关键词 出租车调度 深度强化学习 DQN Q值函数
年,卷(期) 2020,(8) 所属期刊栏目 人工智能
研究方向 页码范围 94-99,104
页数 7页 分类号 TP391.9
字数 7116字 语种 中文
DOI 10.3969/j.issn.1006-2475.2020.08.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王鹏勇 中国矿业大学数学学院 1 0 0.0 0.0
2 陈龚涛 中国矿业大学数学学院 1 0 0.0 0.0
3 赵江烁 中国矿业大学数学学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (176)
共引文献  (20)
参考文献  (17)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1952(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(0)
  • 二级参考文献(3)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(8)
  • 参考文献(0)
  • 二级参考文献(8)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(6)
  • 参考文献(2)
  • 二级参考文献(4)
2013(10)
  • 参考文献(0)
  • 二级参考文献(10)
2014(18)
  • 参考文献(1)
  • 二级参考文献(17)
2015(31)
  • 参考文献(1)
  • 二级参考文献(30)
2016(24)
  • 参考文献(1)
  • 二级参考文献(23)
2017(20)
  • 参考文献(3)
  • 二级参考文献(17)
2018(19)
  • 参考文献(1)
  • 二级参考文献(18)
2019(16)
  • 参考文献(6)
  • 二级参考文献(10)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
出租车调度
深度强化学习
DQN
Q值函数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导