基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于强化学习的半监督学习方法,将家庭服务相关的自然语言信息转化为服务规划.首先,构建与家庭服务相关的交互环境,并赋予环境中物体对应的状态属性;其次,针对稀疏激励问题,设计即时激励和延时激励,提高动作交互过程中的奖励值,引导动作选择向最优化发展;然后,构建物体状态向量并结合余弦相似度作为衡量服务执行的标准;最后,针对生成的服务规划设计对比实验.实验结果表明:该方法能够提升规划生成的准确率并加快收敛速度.
推荐文章
基于强化学习的爬壁机器人路径规划方法
爬壁机器人
路径规划
强化学习
收敛性
加入目标指导的强化对抗文本生成方法研究
文本生成
强化学习
生成对抗网络
目标指导
基于RPkNN-Sarsa(λ)强化学习的机器人路径规划方法
路径规划
强化学习
随机扰动
传感器探测信息不确定性
基于多智能体强化学习的多AGV路径规划方法
多智能体强化学习
AGV路径规划
独立强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强化学习的服务规划生成方法
来源期刊 华中科技大学学报(自然科学版) 学科 工学
关键词 半监督学习 自然语言 强化学习 家庭服务 状态属性 稀疏激励
年,卷(期) 2018,(9) 所属期刊栏目 控制与机械工程
研究方向 页码范围 59-63
页数 5页 分类号 TN92
字数 语种 中文
DOI 10.13245/j.hust.180911
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 田国会 山东大学深圳研究院 117 2087 22.0 41.0
2 袁媛 山东大学控制科学与工程学院 9 36 4.0 6.0
3 张梦洋 山东大学控制科学与工程学院 3 10 2.0 3.0
7 龚京 山东大学控制科学与工程学院 2 8 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (7)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
半监督学习
自然语言
强化学习
家庭服务
状态属性
稀疏激励
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华中科技大学学报(自然科学版)
月刊
1671-4512
42-1658/N
大16开
武汉市珞喻路1037号
38-9
1973
chi
出版文献量(篇)
9146
总下载数(次)
26
总被引数(次)
88536
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导