基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
KNN算法是一种简单、有效且易于实现的分类算法,可用于类域较大的分类.近年来对KNN算法的研究偏向于静态大数据集,不过,在越来越多的情况下要用KNN算法在线实时处理流数据.考虑到流式数据流量大,连续且快速,不易存储和恢复等特性,以及流处理系统Storm对流数据处理具有实时性、可靠性的特点,提出了基于Storm的流数据KNN分类算法,该算法首先对整个样本集进行划分,形成多个片集,然后计算出待分类向量在各片集上的K近邻,最后再将所有片集K近邻归约得出整体K近邻,实现待分类向量的分类.实验结果表明,基于Storm的流数据KNN分类算法能够满足大数据背景下对流数据分类的高吞吐量、可扩展性、实时性和准确性的要求.
推荐文章
用于大数据分类的KNN算法研究
大数据
KNN
差分多层
KNN文本分类算法研究
文本分类
KNN
向量空间模型
大数据下的分布式精确模糊KNN分类算法
大数据
分布式Spark框架
类隶属度
模糊KNN算法
基于Hadoop平台的KNN分类器的优化和实现
MapReduce
K-Neaurest Neighbor
欧式距离
Hadoop集群
加速比
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Storm的流数据KNN分类算法的研究与实现
来源期刊 计算机工程与应用 学科 工学
关键词 Storm KNN算法 流数据 大数据 数据划分
年,卷(期) 2017,(19) 所属期刊栏目 大数据与云计算
研究方向 页码范围 71-75,97
页数 6页 分类号 TP301
字数 4592字 语种 中文
DOI 10.3778/j.issn.1002-8331.1611-0016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 冯百明 西北师范大学计算机科学与工程学院 41 177 8.0 10.0
2 周志阳 西北师范大学计算机科学与工程学院 4 19 2.0 4.0
3 杨朋霖 西北师范大学计算机科学与工程学院 3 12 2.0 3.0
4 温向慧 西北师范大学计算机科学与工程学院 4 17 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (236)
参考文献  (6)
节点文献
引证文献  (10)
同被引文献  (22)
二级引证文献  (21)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(9)
  • 参考文献(1)
  • 二级参考文献(8)
2013(18)
  • 参考文献(1)
  • 二级参考文献(17)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(5)
  • 引证文献(4)
  • 二级引证文献(1)
2019(16)
  • 引证文献(6)
  • 二级引证文献(10)
2020(10)
  • 引证文献(0)
  • 二级引证文献(10)
研究主题发展历程
节点文献
Storm
KNN算法
流数据
大数据
数据划分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导