基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对因使用基于距离的相似性度量,传统聚类内部指标随着数据维数的增加而性能下降的问题,提出了一种基于共享近邻相似度的聚类内部指标.首先,利用共享近邻相似度和k最近邻(kNN)方法,估计数据点的密度,构建融合密度的共享近邻相似度图.然后,根据融合密度的共享近邻相似度图,利用最大流算法,计算出类内相似度和类间分离度,并结合两者计算出聚类内部指标.通过对人工数据集和真实数据集的测试表明,与9个基于距离的传统聚类内部指标相比,该指标能更准确评估数据集的最佳划分和预测数据集的最佳类数.因此,该指标处理复杂类结构和高维数据的能力优于所对比的其他聚类内部指标.
推荐文章
基于共享逆近邻与指数核的密度峰聚类算法
密度峰聚类算法
共享逆近邻
指数核
相似度
凝聚层次聚类算法
基于聚类选择k近邻的LLE算法及故障检测
局部线性嵌入
最近邻数
子流形
故障检测
聚类指标
高维数据聚类方法综述
高维数据
聚类
子空间
基于共享k-近邻与共享逆近邻的密度峰聚类
密度峰聚类
共享k-近邻与共享逆近邻
共享相似度
共享密度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向高维的共享近邻聚类内部指标
来源期刊 计算机应用 学科
关键词 聚类内部指标 聚类 共享近邻相似度 高维诅咒 有效性指标
年,卷(期) 2021,(z1) 所属期刊栏目 数据科学与技术|Data science and technology
研究方向 页码范围 93-100
页数 8页 分类号 TP391.4
字数 语种 中文
DOI 10.11772/j.issn.1001-9081.2020081315
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (3)
参考文献  (36)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1971(1)
  • 参考文献(1)
  • 二级参考文献(0)
1973(1)
  • 参考文献(1)
  • 二级参考文献(0)
1974(1)
  • 参考文献(1)
  • 二级参考文献(0)
1978(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1985(1)
  • 参考文献(1)
  • 二级参考文献(0)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(4)
  • 参考文献(4)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(4)
  • 参考文献(4)
  • 二级参考文献(0)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类内部指标
聚类
共享近邻相似度
高维诅咒
有效性指标
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导