原文服务方: 计算机应用研究       
摘要:
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法.该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类.UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能.基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法.
推荐文章
基于优化初始中心的加权K-均值彩色图像聚类算法分析
彩色图像
聚类算法
加权K-均值
优化初始中心
图像分割
试验分析
基于划分的K-均值初始聚类中心优化算法
K-均值算法
中心点划分
聚类分析
基于图的K-均值聚类法中初始聚类中心选择
数据聚类
簇类
无向图
连通分支
基于差分演化的K-均值聚类算法
聚类
差分演化算法
K-均值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于样本空间分布密度的初始聚类中心优化K-均值算法
来源期刊 计算机应用研究 学科
关键词 关键词 聚类 K-均值聚类 初始中心 邻域 样本分布密度
年,卷(期) 2012,(3) 所属期刊栏目 算法研究探讨
研究方向 页码范围 888-892
页数 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.03.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高新波 西安电子科技大学电子工程学院 176 3425 27.0 52.0
2 郭文娟 陕西师范大学计算机科学学院 11 156 6.0 11.0
3 谢娟英 陕西师范大学计算机科学学院 46 873 15.0 28.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (65)
共引文献  (1204)
参考文献  (12)
节点文献
引证文献  (65)
同被引文献  (186)
二级引证文献  (406)
1963(1)
  • 参考文献(0)
  • 二级参考文献(1)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(2)
  • 参考文献(0)
  • 二级参考文献(2)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(11)
  • 参考文献(1)
  • 二级参考文献(10)
2005(6)
  • 参考文献(1)
  • 二级参考文献(5)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(10)
  • 参考文献(2)
  • 二级参考文献(8)
2008(4)
  • 参考文献(3)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(16)
  • 引证文献(7)
  • 二级引证文献(9)
2015(23)
  • 引证文献(6)
  • 二级引证文献(17)
2016(60)
  • 引证文献(15)
  • 二级引证文献(45)
2017(90)
  • 引证文献(13)
  • 二级引证文献(77)
2018(105)
  • 引证文献(8)
  • 二级引证文献(97)
2019(125)
  • 引证文献(10)
  • 二级引证文献(115)
2020(47)
  • 引证文献(2)
  • 二级引证文献(45)
研究主题发展历程
节点文献
关键词
聚类
K-均值聚类
初始中心
邻域
样本分布密度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导