作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
学习自动机(Learning automation ,LA )是一种自适应决策器。其通过与一个随机环境不断交互学习从一个允许的动作集里选择最优的动作。在大多数传统的LA模型中,动作集总是被取作有限的。因此,对于连续参数学习问题,需要将动作空间离散化,并且学习的精度取决于离散化的粒度。本文提出一种新的连续动作集学习自动机(Continuous action‐set learning automaton ,CALA),其动作集为一个可变区间,同时按照均匀分布方式选择输出动作。学习算法利用来自环境的二值反馈信号对动作区间的端点进行自适应更新。通过一个多模态学习问题的仿真实验,演示了新算法相对于3种现有CALA算法的优越性。
推荐文章
一种用于随机优化的连续动作学习自动机
强化学习
在线学习
随机优化
学习自动机
连续动作学习自动机
一种基于学习自动机的推荐算法改进
学习自动机
奇异值分解
推荐算法
隐语义模型
梯度下降算法
一种基于时间自动机的域构造方法
模型检验
时间自动机
TCTL
一种导气式旋转药室自动机曲线槽设计
旋转药室
曲线槽
微积分
ADAMS
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种新的连续动作集学习自动机
来源期刊 数据采集与处理 学科 工学
关键词 机器学习 强化学习 在线学习 学习自动机 连续动作集学习自动机
年,卷(期) 2015,(6) 所属期刊栏目
研究方向 页码范围 1310-1317
页数 8页 分类号 TP181|TP202.7|O234
字数 6291字 语种 中文
DOI 10.16337/j.1004-9037.2015.06.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 毛宁 16 34 3.0 5.0
2 刘晓 6 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (3)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机器学习
强化学习
在线学习
学习自动机
连续动作集学习自动机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
论文1v1指导