作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在大数据时代,待分析数据的体量巨大,种类繁多,数据价值密度低并且有很多实时数据要求快速处理,使用人力来处理这些数据是不可能的,因此必须使用机器学习方法.然而,如果使用传统的机器学习算法对这些数据进行处理和分析,可能会导致速度慢,耗时长等许多弊端.对传统的机器学习算法进行并行化处理是大数据分析的必要手段.本文以kNN算法为例,基于Python语言和MapRedce框架,设计并实现基于Hadoop平台的kNN并行化算法,并且在数据集上测试了算法,从正确率和消耗时间角度对算法的串行化实现方式和并行化实现方式进行了分析.
推荐文章
基于机器学习的 MapReduce 资源调度算法
MapReduce
重叠阶段
自适应性
机器学习
贝叶斯分类器
基于MapReduce并行化计算的大数据聚类算法
大数据
MapReduce
并行计算
数据聚类
基于MapReduce的并行贝叶斯分类算法的设计与实现
MapReduce
文本分类
Hadoop
贝叶斯
基于MapReduce模型的并行科学计算
并行编程模型
科学计算
MapReduce
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MapReduce的机器学习并行化研究与实现
来源期刊 产业与科技论坛 学科
关键词 机器学习算法 kNN 并行化 Hadoop
年,卷(期) 2017,(9) 所属期刊栏目 科技创新
研究方向 页码范围 69-70
页数 2页 分类号
字数 1985字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈薇 2 44 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (16)
参考文献  (2)
节点文献
引证文献  (4)
同被引文献  (12)
二级引证文献  (12)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(11)
  • 引证文献(2)
  • 二级引证文献(9)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
机器学习算法
kNN
并行化
Hadoop
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
产业与科技论坛
半月刊
1673-5641
13-1371/F
大16开
河北省石家庄市
18-181
2006
chi
出版文献量(篇)
43551
总下载数(次)
161
总被引数(次)
66232
论文1v1指导