作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
聚类趋势分析算法基于抽样原理导致聚类趋势指标不稳定和片面,而且不适应数据流的批量增量特性,因而需要重复进行聚类趋势指数计算.为此,基于全体数据进行整体分析,提出一种基于最小距离连通图(MDCG)的聚类趋势分析算法MDCG-CTI.首先,利用栈的深度优先遍历法更新增量数据的最邻近路径从而降低MDCG的建立复杂度;然后,计算聚类趋势指数并确定可聚类性的判定阈值;最后,将所提算法和批量增量的具有噪声的基于密度的聚类方法(DBSCAN)相结合.在自定义数据集上的实验表明,该算法比现有算法对单簇和含大量噪点的数据的可聚类性判断更为精确;而在大数据集pendigits和avila上,所提算法比基于谱方法的聚类趋势可视化分析(SpecVAT)累计耗时降低了38%和42%,且相较SpecVAT结合批量增量DBSCAN,该算法结合批量增量DBSCAN的聚类平均准确率分别提高了6%和11%,聚类累计耗时则分别降低了7%和8%.实验结果表明该算法可以准确无参地判断聚类趋势,并明显提高增量聚类的有效性和运行效率.
推荐文章
大数据下数据流聚类挖掘算法的优化分析
大数据
数据流
聚类
挖掘算法
时间衰减
F-Stream算法
基于滑动窗口的动态数据流聚类算法研究
数据流
滑动窗口
聚类
数据挖掘
基于混合差分进化的滑动窗口数据流聚类算法研究
混合差分进化
滑动窗口
数据流
聚类
一种实现混合属性数据流聚类的算法
混合属性数据
相似性
k - 近邻算法
k - 均值聚类
分类属性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于数据流的聚类趋势分析算法
来源期刊 计算机应用 学科 工学
关键词 聚类趋势 最小距离连通图 数据流聚类 批量增量聚类 具有噪声的基于密度的聚类方法
年,卷(期) 2020,(8) 所属期刊栏目 数据科学与技术
研究方向 页码范围 2248-2254
页数 7页 分类号 TP312
字数 8471字 语种 中文
DOI 10.11772/j.issn.1001-9081.2020010057
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (102)
共引文献  (16)
参考文献  (15)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1954(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(2)
  • 参考文献(0)
  • 二级参考文献(2)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(3)
  • 参考文献(0)
  • 二级参考文献(3)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(1)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(6)
  • 参考文献(1)
  • 二级参考文献(5)
2001(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(8)
  • 参考文献(2)
  • 二级参考文献(6)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(9)
  • 参考文献(2)
  • 二级参考文献(7)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(5)
  • 参考文献(2)
  • 二级参考文献(3)
2019(2)
  • 参考文献(0)
  • 二级参考文献(2)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类趋势
最小距离连通图
数据流聚类
批量增量聚类
具有噪声的基于密度的聚类方法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导