基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对当前聚类算法应用于大规模多类别数据集中时,计算量较大,且算法性能严重依赖于K值的不足,提出一种改进的加速K均值聚类算法.算法主要由两种策略组成:一是基于质心下界(PLB)的跳跃过程,新引入称为质心的固定点来计算对象和矩心间距离的下界,避免了常见聚类算法在收敛早期过程中的距离计算过程;二是基于不变矩心对(ICP)的跳跃过程,如果矩心更新步骤完成后被分配及未被分配矩心的位置保持不变,则维持对象分配策略不变且无需计算与未被分配矩心之间的距离.此外,还给出了将本文算法与Hamerly算法相结合的拓展算法以进一步提升聚类加速效果.对大规模高维图像数据集进行了仿真实验,结果表明,与Hamerly算法相比,本文算法在获得相同聚类效果的同时,极大地压缩了距离计算量.当K值较大时,本文算法的平均压缩率更高,平均耗时更少.
推荐文章
一种改进的简化均值粒子群K-means聚类算法
粒子群优化算法
简化粒子群
邻域最优粒子
K-means聚类
聚类数
初始聚类中心
一种基于层次聚类的k均值算法研究
聚簇
k-means
层次方法
文本挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的加速K均值聚类算法
来源期刊 太赫兹科学与电子信息学报 学科 工学
关键词 聚类 距离计算 质心下界 Hamerly算法 拓展算法 压缩率 耗时
年,卷(期) 2019,(5) 所属期刊栏目 信号与信息处理、计算机与控制
研究方向 页码范围 885-891,897
页数 8页 分类号 TN302|TP391
字数 6721字 语种 中文
DOI 10.11805/TKYDA201905.0885
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 武丽芬 晋中学院计算机科学与技术学院 5 5 1.0 2.0
2 马俊宏 晋中学院计算机科学与技术学院 5 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (35)
共引文献  (16)
参考文献  (15)
节点文献
引证文献  (1)
同被引文献  (9)
二级引证文献  (0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(8)
  • 参考文献(2)
  • 二级参考文献(6)
2014(7)
  • 参考文献(0)
  • 二级参考文献(7)
2015(3)
  • 参考文献(2)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类
距离计算
质心下界
Hamerly算法
拓展算法
压缩率
耗时
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
太赫兹科学与电子信息学报
双月刊
2095-4980
51-1746/TN
大16开
四川绵阳919信箱532分箱
62-241
2003
chi
出版文献量(篇)
3051
总下载数(次)
7
总被引数(次)
11167
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导