基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现有聚类算法面向高维稀疏数据时多数未考虑类簇可重叠和离群点的存在,导致聚类效果不理想.为此,提出一种可重叠子空间K-Means聚类算法.设计类簇子空间计算策略,在聚类过程中动态更新每个类簇的属性子空间,并定义合理的约束函数指导聚类过程,从而实现类簇的可重叠性与离群点的控制.在此基础上定义合理的目标函数对传统K-Means算法进行修正,利用熵权约束分别计算每个类簇中各维度的权重,使用权重值标识不同类簇中维度的相对重要性,并加入控制重叠程度和离群值数量的参数.在人工数据集和真实数据集上的实验结果表明,该算法在NMI、F1指标上均优于EWKM、NEO-K-Means、OKM等子空间聚类算法,具有更好的聚类结果.
推荐文章
一种分裂式的k-means聚类算法
聚类
数据预处理
初始聚类中心
一种改进K-means聚类的FCMM算法
K-means聚类
萤火虫
最大最小距离
Tent映射
混沌搜索
一种基于密度的k-means聚类算法
聚类
k-means
信息熵
近邻密度
孤立点
一种改进的K-means聚类算法
聚类分析
K-means算法
离群点数据
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种可重叠子空间K-Means聚类算法
来源期刊 计算机工程 学科 工学
关键词 目标函数 子空间聚类 离群点 熵权约束 K-Means聚类算法
年,卷(期) 2020,(8) 所属期刊栏目 人工智能与模式识别
研究方向 页码范围 58-63,71
页数 7页 分类号 TP18
字数 5852字 语种 中文
DOI 10.19678/j.issn.1000-3428.0054555
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马慧芳 西北师范大学计算机科学与工程学院 59 520 12.0 21.0
5 刘宇航 西北师范大学计算机科学与工程学院 2 0 0.0 0.0
6 余丽 西北师范大学计算机科学与工程学院 5 3 1.0 1.0
7 刘海姣 西北师范大学计算机科学与工程学院 6 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (146)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
目标函数
子空间聚类
离群点
熵权约束
K-Means聚类算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导