基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的二分K均值算法在二分过程中采用随机选择的方式选择聚类质心,为了选择到理想的质心,需要重复选择多次,这种方式的时间代价比较大.为此,本文提出采用极大距离点作为质心的方式,有效的降低了时间复杂度,同时运用点抽样的方法避免离群点带来的影响.同时,考虑到随着时代的发展,我们面临的数据量会越来越大,本文提出了一种基于Hadoop分布式平台的并行二分K均值算法,实验表明,该并行算法能够获得较为理想的加速比.
推荐文章
改进的二分K均值聚类算法
K均值聚类
二分K均值聚类
Chameleon算法
层次聚类
基于二分K-均值的SVM决策树自适应分类方法
二分K-均值
支持向量机决策树
降维
自适应算法
基于差分演化的K-均值聚类算法
聚类
差分演化算法
K-均值
应用于数字电视用户浏览行为的二分K-medoids聚类算法
数字电视
用户浏览行为
聚类算法
云相似度
二分K-medoids
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的二分K均值改进算法
来源期刊 科技广场 学科 工学
关键词 二分K均值 优化 并行 Hadoop 加速比
年,卷(期) 2016,(9) 所属期刊栏目 研究与探讨
研究方向 页码范围 4-8
页数 5页 分类号 TP181
字数 3996字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 闫天伟 南昌大学信息工程学院 3 20 2.0 3.0
2 王嘉旸 江西农业大学软件学院 3 4 1.0 1.0
3 万青云 南昌大学信息工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (62)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
二分K均值
优化
并行
Hadoop
加速比
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技广场
月刊
1671-4792
36-1253/N
大16开
南昌市省府大院北二路53号
44-66
1988
chi
出版文献量(篇)
11613
总下载数(次)
26
总被引数(次)
31625
论文1v1指导