原文服务方: 计算机应用研究       
摘要:
为解决在大数据环境下,用于训练多分类逻辑回归模型的数据集可能会超过执行计算的客户端内存的问题,提出了块批量梯度下降算法,用于计算回归模型的系数.将训练数据集存入HBase后,通过设置表扫描对象的起始行键参数,可取出大小合适的含训练样本及结果值的数据块;同时为避免客户端到服务端频繁的RPC调用,取出的数据块可进行多次迭代计算,以加快系数的收敛.当取出的数据块达到指定的迭代次数后,再按行键次序取出下一个数据块.如此循环,直到系数收敛或达到指定的循环控制阈值.多分类的逻辑回归问题可转换为二分类来解决,因此需要为每一个分类在训练数据表中设定结果值列,结合训练样本列簇,按块批量梯度下降算法得到每个分类的回归系数.实验结果表明得到的回归系数能准确地对测试样本进行分类.
推荐文章
基于softmax回归的通信信号循环谱的多分类识别方法
softmax
多分类识别
循环谱
调制方式识别
神经网络
电子对抗
基于支持向量回归的单步多分类算法
回归
支持向量机
加权最小二乘支持向量机
多分类
混合多分类器结合算法在遥感影像分类中的应用研究
多分类器结合
抽象级
测量级
Bagging
精度评价
医疗风险影响因素的有序多分类Logistic回归分析
医疗风险
影响因素
Logistic回归分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于HBase的多分类逻辑回归算法研究
来源期刊 计算机应用研究 学科
关键词 块批量梯度下降 多分类 逻辑回归 大数据 HBase
年,卷(期) 2018,(10) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3007-3010
页数 4页 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2018.10.029
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴云韬 武汉工程大学智能机器人湖北省重点实验室 17 102 5.0 9.0
5 刘黎志 武汉工程大学智能机器人湖北省重点实验室 26 78 4.0 8.0
9 邓介一 武汉工程大学智能机器人湖北省重点实验室 3 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (111)
共引文献  (2272)
参考文献  (13)
节点文献
引证文献  (5)
同被引文献  (16)
二级引证文献  (0)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(12)
  • 参考文献(1)
  • 二级参考文献(11)
2011(14)
  • 参考文献(1)
  • 二级参考文献(13)
2012(18)
  • 参考文献(0)
  • 二级参考文献(18)
2013(13)
  • 参考文献(2)
  • 二级参考文献(11)
2014(14)
  • 参考文献(3)
  • 二级参考文献(11)
2015(9)
  • 参考文献(3)
  • 二级参考文献(6)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
块批量梯度下降
多分类
逻辑回归
大数据
HBase
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导