原文服务方: 计算机应用研究       
摘要:
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高.CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差.因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类.当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍.实验表明,改进算法具有较高的性能和可伸缩性.
推荐文章
一种基于差分演化的K-medoids聚类算法
差分演化
聚类质量
K-medoids算法
全局优化
一种高效的K-medoids聚类算法
聚类
K-medoids算法
中心微调
增量候选
Num-近邻方差优化的K-medoids聚类算法
局部方差
Num-近邻
邻域
初始聚类中心
聚类
基于全覆盖粒计算的K-medoids文本聚类算法
文本聚类
K.medoids
全覆盖粒计算
Single.Pass
聚类中心
最大最小距离
密度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于CF树的k-medoids聚类算法
来源期刊 计算机应用研究 学科
关键词 聚类 k-中心点 CF树 微簇
年,卷(期) 2011,(9) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3260-3263
页数 分类号 TP311.138|TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2011.09.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨炳儒 北京科技大学信息工程学院 319 4361 32.0 49.0
2 刘英华 北京科技大学信息工程学院 8 65 5.0 8.0
3 曹丹阳 北京科技大学信息工程学院 8 70 5.0 8.0
7 李广原 北京科技大学信息工程学院 9 81 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (71)
参考文献  (10)
节点文献
引证文献  (13)
同被引文献  (21)
二级引证文献  (2)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(5)
  • 参考文献(1)
  • 二级参考文献(4)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(8)
  • 参考文献(1)
  • 二级参考文献(7)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(4)
  • 参考文献(3)
  • 二级参考文献(1)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(4)
  • 引证文献(4)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
聚类
k-中心点
CF树
微簇
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导