原文服务方: 信息与控制       
摘要:
在分析马尔可夫决策过程(Markov Decision Process,MDP)性能灵敏度的基础上,讨论了部分可观测马尔可夫决策过程(Partially Observable Markov Decision Process,POMDP)的性能优化问题.给出了POMDP性能灵敏度分析公式,并以此为基础提出了两种基于观测的POMDP优化算法:策略梯度优化算法和策略迭代优化算法.最后以准许控制问题为仿真实例,验证了这两个算法的有效性.
推荐文章
基于POMDP的主动雷达制导弹干扰措施优化方法
主动雷达制导导弹
干扰资源优化
部分可观测马氏决策过程
最优策略可达空间的连续近似法
自适应梯度下降观测矩阵优化算法
压缩感知
观测矩阵
自适应梯度下降
互相关性
等角紧框架
基于 POMDP 的跨层机会频谱接入优化设计
机会频谱接入
部分可观测马尔可夫决策过程
Sarsa(λ)算法
跨层优化
功率受限
基于DEC_POMDP的Web服务组合优化算法
服务质量
DEC_POMDP
自组织
服务组合
Q学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于观测的POMDP优化算法及其仿真
来源期刊 信息与控制 学科
关键词 部分可观测马尔可夫决策过程(POMDP) 灵敏度分析 优化 仿真
年,卷(期) 2008,(3) 所属期刊栏目 论文与报告
研究方向 页码范围 346-351,376
页数 7页 分类号 O232
字数 语种 中文
DOI 10.3969/j.issn.1002-0411.2008.03.016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李俊 中国科学技术大学网络传播系统与控制联合实验室 242 2653 26.0 41.0
2 殷保群 中国科学技术大学网络传播系统与控制联合实验室 72 533 10.0 20.0
3 黄静 中国科学技术大学网络传播系统与控制联合实验室 20 214 8.0 14.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (8)
同被引文献  (2)
二级引证文献  (5)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2016(5)
  • 引证文献(2)
  • 二级引证文献(3)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
部分可观测马尔可夫决策过程(POMDP)
灵敏度分析
优化
仿真
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息与控制
双月刊
1002-0411
21-1138/TP
大16开
1972-01-01
chi
出版文献量(篇)
2891
总下载数(次)
0
总被引数(次)
41289
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
安徽省自然科学基金
英文译名:Anhui Provincial Natural Science Foundation
官方网址:http://www.ahinfo.gov.cn/zrkxjj/index.htm
项目类型:安徽省优秀青年科技基金
学科类型:
论文1v1指导