基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积收益为优化目标,基于马尔科夫决策过程从单个众包工作者的角度建模,将任务分配问题转化为对状态动作价值Q的求解及工作者与任务的一对一分配.然后采用改进的深度强化学习算法对历史任务数据进行离线学习,构建关于Q值的预测模型.最后,动态在线分配过程中实时预测Q值,作为KM(Kuhn-Munkres)算法的边权,实现全局累积收益的最优分配.在出租车真实出行数据集上的实验表明,当工作者数量在一定规模内时,文中策略可提高长期累积收益.
推荐文章
基于改进粒子群算法的空间众包任务分配模型
空间众包
任务分配
MQTA问题
SCTAM_PSO
空间众包中基于位置预测的任务分配
空间众包
任务分配
任务预测
旅行成本
Kuhn-Munkres算法
结合粒子群算法与任务分配协调策略的仓储多机器人任务分配
粒子群算法(PSO)
仓储物流
分配半径
多机器人任务分配(MRTA)
分配协调策略
基于多Agent的汉字签名认证系统的任务分配策略研究
签名认证
任务分配
遗传算法
模拟退火算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度强化学习的空间众包任务分配策略
来源期刊 模式识别与人工智能 学科
关键词 空间众包 任务分配 多阶段序贯决策 深度强化学习
年,卷(期) 2021,(3) 所属期刊栏目 “强化学习研究”|Research on Reinforcement Learning
研究方向 页码范围 191-205
页数 15页 分类号 TP18
字数 语种 中文
DOI 10.16451/j.cnki.issn1003-6059.202103001
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (36)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(9)
  • 参考文献(2)
  • 二级参考文献(7)
2016(20)
  • 参考文献(2)
  • 二级参考文献(18)
2017(5)
  • 参考文献(2)
  • 二级参考文献(3)
2018(3)
  • 参考文献(1)
  • 二级参考文献(2)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
空间众包
任务分配
多阶段序贯决策
深度强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导