作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针对这个方向最近几年的顶级会议和期刊论文,分析了其主要内容;通过最近几年的学术、会议论文中所述的研究现状及成果,说明强化学习的主要特点是能够准确、快速学习到最优策略,能够模拟真实环境,自适应性强,提高频谱感知、分配效率,从而最大化系统吞吐量,这些优势充分证明了强化学习将是认知领域里一种很有前景的技术.
推荐文章
基于不同需求等级改进的动态频谱分配算法
认知无线电
动态频谱分配
需求等级
t分布变异
强化学习研究综述
强化学习
多智能体
马尔可夫决策过程
基于强化学习的动态定价策略研究综述
动态定价
强化学习
机器学习
人工智能
基于信度分配函数的Agent强化学习算法
强化学习
Q-学习
信度分配强化学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强化学习的动态频谱分配研究
来源期刊 数字通信 学科 工学
关键词 认知无线电 动态频谱分配 强化学习 Q学习 部分感知 马尔科夫决策过程
年,卷(期) 2012,(4) 所属期刊栏目 学术研究
研究方向 页码范围 34-38
页数 分类号 TN92
字数 4900字 语种 中文
DOI 10.3969/j.issn.1005-3824.2012.04.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜江 重庆邮电大学信息安全技术工程研究中心 44 223 7.0 13.0
2 刘毅 重庆邮电大学信息安全技术工程研究中心 45 205 9.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (174)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (9)
二级引证文献  (0)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(1)
  • 二级参考文献(1)
1992(4)
  • 参考文献(1)
  • 二级参考文献(3)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
认知无线电
动态频谱分配
强化学习
Q学习
部分感知
马尔科夫决策过程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字通信
双月刊
1005-3824
50-1105/TN
大16开
重庆市南岸区重庆邮电大学
78-45
1974
chi
出版文献量(篇)
9629
总下载数(次)
3
总被引数(次)
5003
论文1v1指导