基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据的变革带来了前所未有的发展,对丰富且复杂的结构化、半结构化或者是非结构化数据的监测、分析、采集、存储以及应用,已经成为了数据信息时代发展的主流,分类和处理海量数据包含的信息,需要有更好的解决方法。传统的数据挖掘分类方式显然已经不能满足需求,面对这些问题,这里对数据挖掘的一些分类算法进行分析和改进,对算法进行结合,提出了改进的SVM KNN分类算法。在这个基础上,利用Hadoop云计算平台,将研究后的分类算法在MapReduce模型中进行并行化应用,使改进后的算法能够适用于大数据的处理。最后用数据集对算法进行实验验证,通过对比传统的SVM分类算法,结果表明改进后的算法达到了高效、快速、准确、低成本的要求,可以有效地进行大数据分类工作。
推荐文章
基于 Hadoop平台的SVM_WNB分类算法的研究
大数据
数据挖掘
SVM_WNB算法
Hadoop云平台
并行化
一种新的基于SVM-KNN的Web文本分类算法
SVM
KNN
Web文本分类
机器学习
基于Hadoop平台的KNN分类器的优化和实现
MapReduce
K-Neaurest Neighbor
欧式距离
Hadoop集群
加速比
SVM-KNN分类算法研究
支持向量机
K近邻
样本相似性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop平台的SVM KNN分类算法的研究
来源期刊 计算机技术与发展 学科 工学
关键词 数据挖掘 Hadoop 并行化 SVM KNN
年,卷(期) 2016,(3) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 75-79,84
页数 6页 分类号 TP301.6
字数 5231字 语种 中文
DOI 10.3969/j.issn.1673-629X.2016.03
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄刚 南京邮电大学计算机学院 66 823 12.0 27.0
2 李正杰 南京邮电大学计算机学院 2 24 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (196)
参考文献  (13)
节点文献
引证文献  (13)
同被引文献  (35)
二级引证文献  (30)
1967(1)
  • 参考文献(1)
  • 二级参考文献(0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(6)
  • 参考文献(1)
  • 二级参考文献(5)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(6)
  • 参考文献(1)
  • 二级参考文献(5)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(15)
  • 引证文献(3)
  • 二级引证文献(12)
2019(15)
  • 引证文献(4)
  • 二级引证文献(11)
2020(8)
  • 引证文献(1)
  • 二级引证文献(7)
研究主题发展历程
节点文献
数据挖掘
Hadoop
并行化
SVM KNN
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导