基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文研究具有人机交互能力的强化学习算法.通过人机交互给出操作者对学习结果的性能评价,智能体系统能获得当前状态与目标状态距离的度量,有效地结合操作者的先验知识和专业知识,从而使智能体在状态空间中能进行更有效的搜索,简化复杂任务的学习过程.以猜数字游戏为例,利用提出的学习框架训练智能体具有猜数字的能力.实验结果表明,结合人机交互的强化学习算法大大提高了学习效率.加快了学习过程的收敛速度.
推荐文章
人机交互的商业应用研究
人机交互
发展
客户需求
商业应用
基于视觉传达技术的人机交互系统色彩研究
人机交互系统
系统设计
视觉传达
色彩滤波器
信息收集
系统测试
基于人机交互的高精密磨具设计模型研究
人机交互
磨具设计
模型设计
通信协议
自动编程
信号传输
基于图像处理技术的人机交互系统设计与实现
图像处理
人机交互
系统设计
特征点坐标
数字信号
维纳滤波算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于人机交互的强化学习与实验研究
来源期刊 模式识别与人工智能 学科 工学
关键词 强化学习 人机交互 资格迹
年,卷(期) 2003,(3) 所属期刊栏目 研究与应用
研究方向 页码范围 363-369
页数 7页 分类号 TP18
字数 6130字 语种 中文
DOI 10.3969/j.issn.1003-6059.2003.03.019
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (94)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (3)
二级引证文献  (6)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(2)
  • 参考文献(0)
  • 二级参考文献(2)
1983(2)
  • 参考文献(0)
  • 二级参考文献(2)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(10)
  • 参考文献(1)
  • 二级参考文献(9)
1993(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(5)
  • 参考文献(0)
  • 二级参考文献(5)
1996(8)
  • 参考文献(2)
  • 二级参考文献(6)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(5)
  • 参考文献(2)
  • 二级参考文献(3)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(2)
  • 引证文献(0)
  • 二级引证文献(2)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
强化学习
人机交互
资格迹
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导