基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
根据小样本问题背景,将小样本场景分成两类,第一类场景追求更专业的性能,第二类场景追求更通用的性能.一般在知识泛化过程中,不同的场景对知识载体的需求有着明显的倾向性.针对小样本学习方法,以知识载体的角度,将其分为使用过程性知识的方法和使用陈述性知识的方法,再讨论该分类下的小样本强化学习算法.最后,从理论和应用等方面提出了可能的发展方向,以期为后续研究提供参考.
推荐文章
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
基于特征关系依赖网络的小样本学习方法
深度学习
小样本学习
度量学习
特征优化
原型调整
强化学习研究综述
强化学习
部分感知
函数估计
多agent强化学习
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 小样本场景下的强化学习研究综述
来源期刊 南京师范大学学报(工程技术版) 学科 工学
关键词 强化学习 小样本学习 元学习 迁移学习 终身学习 知识泛化
年,卷(期) 2022,(1) 所属期刊栏目 机器学习|Machine Learning
研究方向 页码范围 86-92
页数 7页 分类号 TP181
字数 语种 中文
DOI 10.3969/j.issn.1672-1292.2022.01.013
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
小样本学习
元学习
迁移学习
终身学习
知识泛化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京师范大学学报(工程技术版)
季刊
1672-1292
32-1684/T
大16开
南京市宁海路122号
2001
chi
出版文献量(篇)
1491
总下载数(次)
3
总被引数(次)
7734
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导