作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于大数据背景下海量数据人们无法理解,聚类效率低下等问题,采用MapReduce编程模型将Canopy聚类算法和K-means聚类算法在云环境中相结合,使之能够充分利用Hadoop集群的计算和存储能力.以淘宝网上海量的购买用户聚类作为应用背景,通过使用Hadoop平台的数据挖掘组件Mahout对用户聚类进行了实例研究,并给出了使用Mahout进行挖掘的一般步骤.结果表明,基于MapReduce的聚类算法在大规模数据集上具有较好的聚类质量和运行速度.
推荐文章
移动互联环境下基于改进模糊聚类理论的用户分群算法
移动互联环境
行为分析
用户分群
模糊聚类
云环境下基于群智能算法的大数据聚类挖掘技术
大数据聚类挖掘
云环境
群智能算法
数据挖掘
并行化聚类挖掘
数据密度计算
基于MapReduce的CTK加权聚类改进算法
大数据
聚类算法
Canopy算法
MapReduce
基于MapReduce并行化计算的大数据聚类算法
大数据
MapReduce
并行计算
数据聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 云环境下基于MapReduce的用户聚类研究与实现
来源期刊 电子设计工程 学科 工学
关键词 Hadoop MapReduce 聚类算法 Mahout
年,卷(期) 2016,(10) 所属期刊栏目 计算机技术与应用
研究方向 页码范围 35-37,41
页数 4页 分类号 TN911.7
字数 3293字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 樊同科 西安外事学院现代教育技术中心 36 60 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (83)
参考文献  (5)
节点文献
引证文献  (8)
同被引文献  (66)
二级引证文献  (28)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(6)
  • 引证文献(3)
  • 二级引证文献(3)
2019(15)
  • 引证文献(2)
  • 二级引证文献(13)
2020(13)
  • 引证文献(1)
  • 二级引证文献(12)
研究主题发展历程
节点文献
Hadoop
MapReduce
聚类算法
Mahout
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子设计工程
半月刊
1674-6236
61-1477/TN
大16开
西安市高新区高新路25号瑞欣大厦10A室
52-142
1994
chi
出版文献量(篇)
14564
总下载数(次)
54
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导