原文服务方: 计算机应用研究       
摘要:
为了在领域文本中实现数据定位,将文本视为环境,针对文本环境中存在的动态性以及不确定性等问题,提出了基于多agent分层强化学习的数据定位方法.该方法利用分层结构的特点,将系统任务分解为多个子任务,个体agent分别对对应子任务学习,以此将策略更新限制在规模较小的局部空间;同时利用多agent系统中单agent与系统远期目标的同一性,引入策略协调机制,通过agent之间交换信息来发现趋势性信息,并利用sha-ping技术,将在线获取的动态知识对各个agent进行趋势性启发,加快agent的收敛速度.实验将该方法应用于司法领域的判决文书上,实验结果表明:该方法能够在大规模复杂未知的文本环境中对目标数据进行高效准确定位,平均准确率与F值能够达到96.6%和98.2%,且具有较好的收敛速度.因此可以看出,该方法能够很好地在领域文本中实现数据定位,具有较大的理论以及实际意义.
推荐文章
多Agent强化学习方法与应用
多Agent
强化学习
对策论
POMDP
分层强化学习研究进展
分层强化学习
半马尔可夫决策过程
抽象
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
基于强化学习的多Agent路径规划方法研究
多智能体
强化学习
路径规划
Q学习算法
未知环境
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多agent分层强化学习在数据定位中的应用研究
来源期刊 计算机应用研究 学科
关键词 数据定位 文本环境 分层强化学习 多agent系统 策略协调 shaping技术
年,卷(期) 2020,(12) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3635-3639
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2019.09.0527
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄兆华 23 179 7.0 13.0
2 万仲保 24 194 6.0 13.0
3 张薇 6 10 2.0 3.0
4 洪壮壮 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (187)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(5)
  • 参考文献(1)
  • 二级参考文献(4)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(6)
  • 参考文献(2)
  • 二级参考文献(4)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据定位
文本环境
分层强化学习
多agent系统
策略协调
shaping技术
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导