基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统支持向量机(SVM)算法难以处理大规模训练数据的困境,提出一种基于Hadoop的数据驱动的并行增量Adaboost-SVM算法(PIASVM).利用集成学习策略,局部分类器处理一个分区的数据,融合其分类结果得到组合分类器;增量学习中用权值刻画样本的空间分布特性,对样本进行迭代加权,利用遗忘因子实现新增样本的选择及历史样本的淘汰;采用基于HBase的控制器组件用以调度迭代过程,持久化中间结果并减小MapReduce原有框架迭代过程中的带宽压力.多组实验结果表明,所提算法具有优良的加速比、扩展率和数据伸缩度,在保证分类精度的基础上提高了SVM算法对大规模数据的处理能力.
推荐文章
一种基于Hadoop架构的并行挖掘算法研究
挖掘算法
Hadoop架构
SPRINT
并行化
决策树
MapReduce
基于MapReduce的并行增量迭代支持向量机算法
支持向量机
并行
增量
迭代
MapReduce
基于KKT条件的SVM增量学习算法
支持向量机
增量学习
KKT条件
基于驱动错误准则的SVM增量学习研究
机器学习
驱动错误准则
SVM
增量学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop架构的数据驱动的SVM并行增量学习算法
来源期刊 计算机应用 学科 工学
关键词 Hadoop HBase 支持向量机 增量学习 集成学习 遗忘因子 控制器组件
年,卷(期) 2016,(11) 所属期刊栏目 先进计算
研究方向 页码范围 3044-3049
页数 6页 分类号 TP311
字数 6983字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.11.3044
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (82)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (6)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Hadoop
HBase
支持向量机
增量学习
集成学习
遗忘因子
控制器组件
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导