作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针对这个方向最近几年的顶级会议和期刊论文,分析了其主要内容;通过最近几年的学术、会议论文中所述的研究现状及成果,说明强化学习的主要特点是能够准确、快速学习到最优策略,能够模拟真实环境,自适应性强,提高频谱感知、分配效率,从而最大化系统吞吐量,这些优势充分证明了强化学习将是认知领域里一种很有前景的技术。
推荐文章
基于强化学习的在线订单配送时隙运能分配
时隙
运能配置
Logit模型
强化学习
基于不同需求等级改进的动态频谱分配算法
认知无线电
动态频谱分配
需求等级
t分布变异
多用户NC-OFDM动态频谱分配策略研究
频率捷变无线电
动态频谱分配
非连续正交频分复用
基于强化学习的动态定价策略研究综述
动态定价
强化学习
机器学习
人工智能
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强化学习的动态频谱分配研究
来源期刊 数字通信 学科 工学
关键词 认知无线电 动态频谱分配 强化学习 Q学习 部分感知 马尔科夫决策过程
年,卷(期) 2012,(4) 所属期刊栏目
研究方向 页码范围 34-38
页数 5页 分类号 TN92
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜江 重庆邮电大学信息安全技术工程研究中心 44 223 7.0 13.0
2 刘毅 重庆邮电大学信息安全技术工程研究中心 45 205 9.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (25)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1991(4)
  • 参考文献(4)
  • 二级参考文献(0)
1998(4)
  • 参考文献(4)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(4)
  • 参考文献(4)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
认知无线电
动态频谱分配
强化学习
Q学习
部分感知
马尔科夫决策过程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字通信与网络:英文版
季刊
2468-5925
50-1212/TN
重庆南岸区崇文路2号重庆邮电大学数字通信
78-45
出版文献量(篇)
11481
总下载数(次)
2
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导