基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,基于深度学习思想发展起来的深度信念网络(Deep Belief Networks,DBN)在人工智能和大数据预测分析中得到了成功的应用.由于DBN的隐含层数较多,传统的DBN有监督精调(Fine-tuning)方法—BP算法很难得到令人满意的学习精度,甚至会因为梯度扩散(Gradient Diffusion)导致精度调节失败,且网络鲁棒性差.针对此问题,提出一种基于强化学习策略的DBN模型(RL-DBN)及其算法.首先利用自适应对比散度(Adaptive Contrastive Divergence,ACD)算法来快速预训练DBN的隐含层以获取较优的初始权值,然后用强化学习算法代替BP算法对DBN进行精调以提高有监督学习的精度和网络的鲁棒性.实验结果表明,相较于现有的类似模型,RL-DBN在学习速度、精度以及鲁棒性能等方面均有较大提高.
推荐文章
基于深度强化学习的图像修复算法设计
图像修复
机器学习
深度强化学习
大数据
自相似
关联性
一种基于强化学习的多指手位置控制方法
多指手
非线性
强化学习
自适应评价算法
一种强化学习行动策略ε-greedy的改进方法
强化学习
ε-greedy策略
探索与利用
一种新的基于蚁群优化的模糊强化学习算法
强化学习
模糊Sarsa学习
蚁群优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于强化学习的深度信念网络设计方法
来源期刊 控制工程 学科 工学
关键词 深度信念网络 强化学习 自适应对比散度 鲁棒性能
年,卷(期) 2019,(11) 所属期刊栏目 人工智能驱动的自动化
研究方向 页码范围 2115-2120
页数 6页 分类号 TP183
字数 4787字 语种 中文
DOI 10.14107/j.cnki.kzgc.20180783
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邢海霞 1 0 0.0 0.0
2 程乐 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (52)
共引文献  (18)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(9)
  • 参考文献(1)
  • 二级参考文献(8)
2015(7)
  • 参考文献(0)
  • 二级参考文献(7)
2016(10)
  • 参考文献(2)
  • 二级参考文献(8)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度信念网络
强化学习
自适应对比散度
鲁棒性能
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
控制工程
月刊
1671-7848
21-1476/TP
大16开
沈阳东北大学310信箱
8-216
1994
chi
出版文献量(篇)
5468
总下载数(次)
9
总被引数(次)
44239
论文1v1指导