原文服务方: 西安交通大学学报       
摘要:
为解决强化学习算法在干扰决策过程中收敛速度慢的问题,提出了一种采用双层强化学习的干扰决策算法(DRLJD).首先对等效通信参数进行建模,模型减少了待学习参数的个数,降低了搜索空间的维度;然后利用降维后的搜索空间指导干扰参数选择,避免随机选择导致干扰性能差的缺点;最后利用选择的干扰参数施加干扰,并根据环境反馈进一步降低搜索空间的维度,通过不断交互的方式加快算法的收敛速度.此外,将以往的干扰经验以先验信息的形式加入到系统的学习进程中,进一步缩短了系统的学习时间.针对构造的干扰问题实验表明,DRLJD算法经过200次交互便学习到优异的干扰策略,小于现有算法所需600次交互,且先验信息的利用进一步降低了对交互次数的要求.以提出的新的奖赏标准作为奖赏依据,算法能够在未知通信协议情况下以牺牲交互时间为代价学习到最佳干扰策略.
推荐文章
融合改进强化学习的认知无线电抗干扰决策算法
认知无线电
强化学习
功率分配
信道选择
抗干扰
基于个性的群体强化学习算法
个性
Agent
群体强化学习
RoboCup
基于核方法的强化学习算法
强化学习
核方法
马尔科夫决策过程
Q-learning
mountiain car
基于深度强化学习的服务功能链映射算法
网络功能虚拟化
服务功能链
深度强化学习
网络时延
网络运维开销
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 采用双层强化学习的干扰决策算法
来源期刊 西安交通大学学报 学科
关键词 强化学习 双层强化学习 干扰决策 先验信息 奖赏标准
年,卷(期) 2018,(2) 所属期刊栏目
研究方向 页码范围 63-69
页数 7页 分类号 TN975
字数 语种 中文
DOI 10.7652/xjtuxb201802010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨俊安 国防科技大学电子对抗学院 69 461 10.0 18.0
3 刘辉 国防科技大学电子对抗学院 31 126 7.0 9.0
5 颛孙少帅 国防科技大学电子对抗学院 4 13 2.0 3.0
11 黄科举 国防科技大学电子对抗学院 6 14 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (93)
共引文献  (40)
参考文献  (14)
节点文献
引证文献  (7)
同被引文献  (29)
二级引证文献  (2)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(8)
  • 参考文献(0)
  • 二级参考文献(8)
2011(11)
  • 参考文献(1)
  • 二级参考文献(10)
2012(10)
  • 参考文献(1)
  • 二级参考文献(9)
2013(13)
  • 参考文献(1)
  • 二级参考文献(12)
2014(13)
  • 参考文献(1)
  • 二级参考文献(12)
2015(6)
  • 参考文献(3)
  • 二级参考文献(3)
2016(8)
  • 参考文献(4)
  • 二级参考文献(4)
2017(6)
  • 参考文献(3)
  • 二级参考文献(3)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(6)
  • 引证文献(5)
  • 二级引证文献(1)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
强化学习
双层强化学习
干扰决策
先验信息
奖赏标准
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
论文1v1指导