基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
探讨了在高度危险行业的游戏式专业救援培训系统中,视觉与听觉信号能否协同作用以提高人们的记忆和推理能力问题;运用半马尔科夫博弈模型(semi-Markov game,SMG)提出了合作型多agent分层强化学习框架和算法,构建了由视觉处理agent、听觉处理agent以及人类agent组成的异构异质多agent系统;指出分析和归纳视觉听觉相干反馈信号的性质和特点是非常具有挑战性的任务,其决定了强化学习中异构信号的集成方法和途径.在此基础上,提出了将异构反馈信号进行集成的偏信息学习算法,大大缩小了状态搜索空间,缓解了强化学习固有的“维数灾难”问题;根据心理治疗的“系统脱敏”原理,设计了“情绪-个性-刺激-调节”(mood-personality-stimulus-regulation,MPSR)模型和恐怖场景个性化呈现算法(personalized rendering algorithm for terrorist scene,PRATS),用于提升救援队员的心理承受能力,并通过实验验证了算法的有效性.
推荐文章
多智能体强化学习在城市交通网络信号控制方法中的应用综述
智能交通
交通控制
多智能体强化学习
闭环反馈
联动协调
数据驱动
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
信息集成中语义异构问题研究
语义信息集成
本体
语义异构
上下文仲裁
个体识别
基于强化学习的股票预测系统的研究与设计
股票预测
BP神经网络
强化学习
RBP模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 强化学习中异构反馈信号的分析与集成
来源期刊 计算机科学与探索 学科 工学
关键词 强化学习 异构 反馈信号 视觉听觉相干性
年,卷(期) 2012,(4) 所属期刊栏目 学术研究
研究方向 页码范围 366-376
页数 分类号 TP181
字数 8464字 语种 中文
DOI 10.3778/j.issn.1673-9418.2012.04.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 余雪丽 太原理工大学计算机科学与技术学院 106 793 15.0 23.0
3 李志 太原理工大学计算机科学与技术学院 6 16 2.0 4.0
4 周昌能 太原理工大学计算机科学与技术学院 4 36 2.0 4.0
5 胡坤 太原理工大学计算机科学与技术学院 4 24 1.0 4.0
8 崔倩 太原理工大学计算机科学与技术学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (0)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
强化学习
异构
反馈信号
视觉听觉相干性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导