基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在部分可观测马尔可夫决策过程(POMDP)的基础上,给出一阶部分可观测马尔科夫决策过程(FO-POMDP),用一阶逻辑的情景演算结构表达POMDP。对FO-POMDP模型中状态的抽象层次进行刻画,提出状态粒度、信念状态粒度的概念。采用粒度归结方法,将信念状态的粒度归结到某一确定粒度下,运用确定粒度下的信念点距离度量方法,将基于点的价值迭代(PBVI)扩展到逻辑抽象层面提出一阶PBVI(FO-PBVI)。实验结果证明,该算法的求解速度较快,求解质量较好。
推荐文章
POMDP基于点的值迭代算法中一种信念选择方法
POMDP
值迭代
基于点的算法
信念选择
不确定性
基于观测的POMDP优化算法及其仿真
部分可观测马尔可夫决策过程(POMDP)
灵敏度分析
优化
仿真
一种基于独立任务的 POMDP 问题的解决方法
POMDP
基于点的算法
相互独立的任务
多元 POMDP
受限制的 POMDPs
一种基于最优策略概率分布的 POMDP 值迭代算法
部分可观测马尔科夫决策过程
基于最优策略概率的值迭代算法
蒙特卡罗法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于点的FO-POMDP值迭代方法研究
来源期刊 计算机工程 学科 工学
关键词 部分可观测马尔科夫决策过程 状态空间 信念状态 粒度归结 基于点的值迭代
年,卷(期) 2013,(10) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 217-220
页数 4页 分类号 TP18
字数 4049字 语种 中文
DOI 10.3969/j.issn.1000-3428.2013.10.046
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邓苏 国防科学技术大学信息系统工程重点实验室 41 485 12.0 21.0
2 黄宏斌 国防科学技术大学信息系统工程重点实验室 23 204 7.0 14.0
3 陈丽娜 国防科学技术大学信息系统工程重点实验室 4 88 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (7)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (3)
二级引证文献  (0)
1978(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
部分可观测马尔科夫决策过程
状态空间
信念状态
粒度归结
基于点的值迭代
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导