基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
部分可观察马尔可夫决策过程(POMDP)是描述不确定环境下进行决策的数学模型.基于点的值迭代算法是求解POMDP问题的一类近似解法.针对基于点的算法中信念选择这一关键问题,提出了一种基于熵的信念选择方法(EBBS).EBBS算法通过计算可以转移到的信念点的不确定性,选择熵较小且到当前信念点集距离大于一定阈值的信念点扩充信念点集合.实验结果表明,通过熵选择信念点的值迭代算法只需要在较少数量的信念点上进行值迭代操作就能得到预期的折扣报酬.
推荐文章
基于点的FO-POMDP值迭代方法研究
部分可观测马尔科夫决策过程
状态空间
信念状态
粒度归结
基于点的值迭代
OFDM系统中一种降低峰均比的PTS迭代算法
正交频分复用
峰值平均功率比
选择性映射
部分发送序列
一种基于独立任务的 POMDP 问题的解决方法
POMDP
基于点的算法
相互独立的任务
多元 POMDP
受限制的 POMDPs
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 POMDP基于点的值迭代算法中一种信念选择方法
来源期刊 北京交通大学学报 学科 工学
关键词 POMDP 值迭代 基于点的算法 信念选择 不确定性
年,卷(期) 2009,(5) 所属期刊栏目 计算机工程与数据挖掘
研究方向 页码范围 77-80
页数 4页 分类号 TP181
字数 3814字 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (5)
同被引文献  (1)
二级引证文献  (6)
1978(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(4)
  • 引证文献(3)
  • 二级引证文献(1)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
POMDP
值迭代
基于点的算法
信念选择
不确定性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京交通大学学报
双月刊
1673-0291
11-5258/U
大16开
北京西直门外上园村3号
1975
chi
出版文献量(篇)
3626
总下载数(次)
7
总被引数(次)
38401
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导