基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题.首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q学习算法;其次给出Q学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q学习算法的有效性.
推荐文章
约束随机线性二次最优控制的研究
随机LQ最优控制
线性约束
Lagrange multiplier定理
广义微分Riccati方程
带有随机跳跃干扰的线性二次随机最优控制问题
随机微分方程
泊松过程
随机最优控制
黎卡提方程
无穷时间多维不确定线性二次最优控制
无穷时间
线性二次最优控制
典范过程
最优性方程
乘性随机离散系统的最优控制
随机离散系统
最优控制
噪声
乘性摄动
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 模型自由的离散时间系统的随机线性二次最优控制
来源期刊 辽宁石油化工大学学报 学科 工学
关键词 Q学习算法 值函数 随机线性二次最优控制 随机代数方程
年,卷(期) 2016,(6) 所属期刊栏目 计算机与控制
研究方向 页码范围 64-68
页数 5页 分类号 TP273.1
字数 2560字 语种 中文
DOI 10.3969/j.issn.1672-6952.2016.06.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王涛 东北大学信息科学与工程学院 23 47 3.0 6.0
3 么彩莲 辽宁石油化工大学理学院 9 35 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (2)
参考文献  (12)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (0)
1968(1)
  • 参考文献(1)
  • 二级参考文献(0)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(3)
  • 参考文献(2)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Q学习算法
值函数
随机线性二次最优控制
随机代数方程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
辽宁石油化工大学学报
双月刊
1672-6952
21-1504/TE
大16开
辽宁省抚顺市望花区丹东路西段1号
8-257
1981
chi
出版文献量(篇)
2263
总下载数(次)
3
总被引数(次)
12790
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导