作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大数据带来的海量信息,传统的数据挖掘方法已经不再适用.近些年来很多学者提出新的数据挖掘方式,或者在传统的方法上进行改进,但是还远不足以处理这些海量信息.在总结已有方法的基础上,提出一种基于Canopy的K-Means并行化算法.与传统的K-Means算法相比,本文提出的改进方法会通过密度确定初始中心,然后在Hadoop分布式集群上运行K-Means算法.实验证明,该方法在保证精度的情况下,能降低运算复杂度从而提高计算效率.
推荐文章
基于Spark的并行K-means算法研究
Spark
K-means
PSO
迭代计算
个性化服务中的并行K-Means聚类算法
个性化服务
并行
聚类算法
基于Spark的改进K-means算法的并行实现
聚类算法
简化轮廓系数
形态学相似距离
相似性度量
基于Hadoop的Canopy-K-means并行算法的学生成绩与毕业流向关系分析
Hadoop
Canopy-K-means
最小最大原则
MapReduce
教务
毕业流向
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Canopy的K-Means并行化算法
来源期刊 电脑与电信 学科 工学
关键词 数据挖掘 Canopy 并行化 Hadoop
年,卷(期) 2019,(7) 所属期刊栏目 算法研究
研究方向 页码范围 30-33
页数 4页 分类号 TP311.13
字数 3004字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王颖 安徽理工大学计算机科学与工程系 8 12 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (28)
共引文献  (830)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
Canopy
并行化
Hadoop
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑与电信
月刊
1008-6609
44-1606/TN
大16开
广州市连新路171号国际科技中心B108室
1995
chi
出版文献量(篇)
8962
总下载数(次)
13
总被引数(次)
9565
论文1v1指导