基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPts)敏感.针对以上问题,改进了传统算法,提出了一种基于最小生成树的密度聚类算法(MST-DBSCAN).由于对象之间的距离对聚类结果影响较大,为了更好地表示对象之间的距离特性,首先使用相互可达距离(mutual reachability distance)代替传统算法中的欧氏距离,表示数据集中对象与对象之间的距离,解决因密度分布不均匀导致效果不佳的问题;为了建立对象与对象之间的联系,同时保留对象之间的距离特性,引用Prim算法对数据集中的所有对象构建最小生成树;其次根据指定的簇的数目及最小簇对象数数目参数对得到的最小生成树进行剪枝;根据剪枝的结果,将剪枝后的各个部分进行聚类.在公开的UCI数据集上的实验结果表明,提出的MST-DBSCAN算法与现有DBSCAN、OPTICS、KANN-DBSCAN算法相比,在密度分布不均匀的数据集上聚类效果有所提升并且较原有传统算法有较高的聚类准确性.
推荐文章
基于最小生成树的并行分层聚类算法
分层聚类
并行算法
存储冲突
基于密度的最小生成树聚类算法研究
聚类
最小生成树
密度
数据挖掘
基于粒子群优化和最小生成树聚类的能耗均衡算法
无线传感网络
能耗均衡
粒子寻优
最小生成树聚类
基于降阶的最小生成树快速算法
最小生成树
算法
降阶
悬挂点
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最小生成树的密度聚类算法研究
来源期刊 计算机技术与发展 学科 工学
关键词 DBSCAN 相互可达距离 密度聚类 最小生成树 不平衡数据集
年,卷(期) 2022,(2) 所属期刊栏目 大数据分析与挖掘
研究方向 页码范围 45-50
页数 6页 分类号 TP399
字数 语种 中文
DOI 10.3969/j.issn.1673-629X.2022.02.007
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
DBSCAN
相互可达距离
密度聚类
最小生成树
不平衡数据集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
相关基金
江苏省自然科学基金
英文译名:Natural Science Foundation of Jiangsu Province
官方网址:http://www.jsnsf.gov.cn/News.aspx?a=37
项目类型:
学科类型:
论文1v1指导