基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
部分可观察马尔可夫决策过程在策略空间和状态空间上的计算复杂性,使求解其一个最优策略成为NP-hard难题.为此,提出一种动态影响图模型来建模不确定环境下的Agent动态决策问题.动态影响图模型以有向无环图表示系统变量之间的复杂关系.首先,动态影响图利用动态贝叶斯网络表示转移模型和观察模型以简化系统的状态空间;其次,效用函数以效用结点的形式清晰地表示出来,从而简化系统效用函数的表示;最后,通过决策结点表示系统的行为来简化系统的策略空间.通过实例从3个方面和POMDP模型进行了比较,研究的结果表明,动态影响图模型为大型的POMDP问题提供了一种简明的表示方式,最后在Robocup环境初步验证了该模型.
推荐文章
煤矿采掘工程平面图动态管理CAD系统模型构造
采掘工程
动态管理
CAD
属性化图素
基于数值模型的动态洪水风险图绘制系统研究
洪水风险图
动态
WebGIS
海曙区
基于LSTM的动态图模型异常检测算法研究
异常检测
图挖掘
时间序列
长短时记忆(LSTM)
基于多Agent的交互式动态影响图研究、应用与展望
交互式动态影响图
多Agent
动态决策
自动小车
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 动态影响图模型研究
来源期刊 智能系统学报 学科 工学
关键词 动态贝叶斯网络 影响图 马尔可夫决策过程 部分可观察马尔可夫决策过程 动态影响图
年,卷(期) 2008,(2) 所属期刊栏目
研究方向 页码范围 159-166
页数 8页 分类号 TP181
字数 6741字 语种 中文
DOI 10.3969/j.issn.1673-4785.2008.02.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王浩 合肥工业大学计算机与信息学院 193 1473 20.0 29.0
2 姚宏亮 合肥工业大学计算机与信息学院 95 488 11.0 16.0
3 俞奎 9 117 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (5)
同被引文献  (6)
二级引证文献  (6)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(3)
  • 引证文献(0)
  • 二级引证文献(3)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
动态贝叶斯网络
影响图
马尔可夫决策过程
部分可观察马尔可夫决策过程
动态影响图
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
安徽省自然科学基金
英文译名:Anhui Provincial Natural Science Foundation
官方网址:http://www.ahinfo.gov.cn/zrkxjj/index.htm
项目类型:安徽省优秀青年科技基金
学科类型:
论文1v1指导