基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于拓扑序列更新的值迭代算法,利用状态之间的迁移关联信息,将任务模型的有向图分解为一系列规模较小的强连通分量,并依据拓扑序列对强连通分量进行更新.在经典规划问题Mountain Car和迷宫实验中的结果表明,算法的收敛速度更快,精度更高,且对状态空间的增长有较强的顽健性.
推荐文章
基于迭代观测更新滤波的单站无源定位算法
单站无源定位
迭代观测更新滤波
线性估计器
Sigma点方法
基于奇异值分解单步迭代滤波算法的应用
单步迭代滤波
推广卡尔曼滤波
奇异值分解
一种基于权值的序列模式更新算法
数据挖掘
序列模式
UWIUA
IUA
权值
业务迁移场景下利用信誉值的拓扑构造激励算法
无线泛在环境
业务迁移
信誉值
节点协作
节点激励
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于拓扑序列更新的值迭代算法
来源期刊 通信学报 学科 工学
关键词 强化学习 值迭代 拓扑序列 VI-TS
年,卷(期) 2014,(8) 所属期刊栏目 学术论文
研究方向 页码范围 56-62
页数 7页 分类号 TP181
字数 5342字 语种 中文
DOI 10.3969/j.issn.1000-436x.2014.08.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘全 苏州大学计算机科学与技术学院 99 1053 16.0 29.0
5 周小科 苏州大学计算机科学与技术学院 17 38 3.0 6.0
6 黄蔚 苏州大学计算机科学与技术学院 15 47 5.0 6.0
7 傅启明 苏州大学计算机科学与技术学院 23 360 10.0 18.0
8 孙洪坤 苏州大学计算机科学与技术学院 6 42 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (12)
参考文献  (3)
节点文献
引证文献  (3)
同被引文献  (1)
二级引证文献  (5)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
强化学习
值迭代
拓扑序列
VI-TS
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
通信学报
月刊
1000-436X
11-2102/TN
大16开
北京市丰台区成寿路11号邮电出版大厦8层
2-676
1980
chi
出版文献量(篇)
6235
总下载数(次)
17
总被引数(次)
85479
论文1v1指导