原文服务方: 计算机应用研究       
摘要:
对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响.针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度.设计实验对比了BGQ-learning算法与三种经典分类器以及一种新颖的分类器的分类性能,在UCI数据库七个数据集上的测试结果表明,该算法有着优良的稳定性以及良好的分类精确度.
推荐文章
基于Q-learning的机会频谱接入信道选择算法
认知无线电
机会频谱接入
Q学习
信道选择
Boltzmann规则
改进的Q-Learning算法及其在路径规划中的应用
路径规划
人工智能
强化学习
Q-Learning
煤矿井下基于Q-learning算法的移动机器人路径规划
移动机器人
不确定环境
强化学习
路径规划
基于情感计算和Q-learning的agent自主追逐行为过程研究
情感计算
Q学习
博弈论
多智能体
自主追逐
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于生成模型的Q-learning二分类算法
来源期刊 计算机应用研究 学科
关键词 Q-learning 生成模型 二分类 最小二乘时序差分算法 半梯度下降法
年,卷(期) 2020,(11) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3326-3329,3333
页数 5页 分类号 TP301
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2019.08.0277
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 尚志刚 25 72 6.0 8.0
2 李蒙蒙 16 40 4.0 6.0
3 徐若灏 1 0 0.0 0.0
4 乔康加 1 0 0.0 0.0
5 杨莉芳 3 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (5)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(5)
  • 参考文献(1)
  • 二级参考文献(4)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Q-learning
生成模型
二分类
最小二乘时序差分算法
半梯度下降法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导