原文服务方: 信息与控制       
摘要:
密度峰值聚类算法具有简单高效、无需迭代计算和提前设定类簇数的优势,但是在划分非类中心样本时容易产生“多米诺骨牌”效应,并且不能准确划分重叠区域的样本和噪声。为了解决以上问题,提出了不确定数据信任密度峰值聚类算法。首先,该算法在密度峰值聚类算法获取类中心样本的基础上,利用非类中心样本的K近邻求出样本属于不同类的信任值,将样本划分到信任值最大的类别,得到基于K近邻的初步聚类结果。然后,计算关于密度的上分位数得到密度阈值,在证据推理框架下进行信任划分,将密度小于该阈值的孤立样本划分到噪声类;处于重叠部分的样本划分到相关单类组成的复合类;信任值强烈支持属于某个类别的样本划分到相应的单类。该算法通过引入复合类和噪声类能够更加准确地展现样本在现有属性信息下的不确定性。实验结果表明,该算法在人工数据集和UCI数据集上相比于其他对比算法,能够取得更好的聚类性能。
推荐文章
基于网格密度和引力的不确定数据流聚类算法
不确定数据流
网格特征向量
网格密度
网格引力
零星网格
一种不确定数据流子空间聚类算法
不确定数据流
滑动窗口
聚类
子空间
缓冲区
离群点
不确定数据聚类算法研究
不确定数据
聚类
期望距离
UK均值算法
基于密度峰值优化的谱聚类算法
谱聚类
密度峰值
密度聚类
自适应
Nystr(o)m抽样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不确定数据信任密度峰值聚类算法
来源期刊 信息与控制 学科 工学
关键词 聚类 密度峰值 K近邻 证据推理 信任划分
年,卷(期) 2022,(3) 所属期刊栏目 论文与报告
研究方向 页码范围 349-360
页数 11页 分类号 TP301
字数 语种 中文
DOI 10.13976/j.cnki.xk.2022.1203
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类
密度峰值
K近邻
证据推理
信任划分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息与控制
双月刊
1002-0411
21-1138/TP
大16开
1972-01-01
chi
出版文献量(篇)
2891
总下载数(次)
0
总被引数(次)
41289
论文1v1指导