作者:
原文服务方: 航空计算技术       
摘要:
研究了奖罚型学习自动机的一种非线性强化算法.与线性的奖罚模型(LRP)不同,新模型的行动选择概率的更新函数为二次的.这使得该模型的学习性能优于LRP,且对不同的环境,其具有不同的行为和特点.
推荐文章
精确学习模型下确定的有穷自动机的学习
多态自动机
有穷自动机
标识矩阵
EXACT模型
火炮自动机仿真优化平台开发技术研究
火炮
自动机
动力学
仿真平台
基于二维元胞自动机的网络模型
拥塞
元胞自动机
负载
延时
一种基于学习自动机的推荐算法改进
学习自动机
奇异值分解
推荐算法
隐语义模型
梯度下降算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 二次奖罚学习自动机
来源期刊 航空计算技术 学科
关键词 人工智能 强化学习 学习自动机
年,卷(期) 1999,(2) 所属期刊栏目 人工智能
研究方向 页码范围 47-49
页数 3页 分类号 TP2
字数 语种 中文
DOI 10.3969/j.issn.1671-654X.1999.02.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘晓 5 11 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人工智能
强化学习
学习自动机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
航空计算技术
双月刊
1671-654X
61-1276/TP
大16开
西安市太白北路156号
1971-01-01
中文
出版文献量(篇)
3986
总下载数(次)
0
总被引数(次)
18592
论文1v1指导