基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering Algorithm),算法由在线聚类/离线优化两部分组成,在线聚类快速完成距离计算与聚类,离线优化实现二次聚类提高聚类精度.针对现存混合型属性计算距离方式精度低的问题,本文设计属性占优分析预先确定混合属性数据流中分类或数值属性占优的,随即选择对应的相似度计算公式,从而保证了混合属性的相似度计算满足属性重要性平衡,降低非占优属性数据对整体数据聚类的影响,在线聚类最终通过给定参数ε和μ确定当前窗口到达的数据点中的核心数据点.离线部分从核心数据点出发将所有密度可达的数据点聚成一个自然类,并将未被聚类的数据点存入暂存区,若暂存区内数据点达到一定数量,将暂存区的数据再聚类优化整体的聚类效果,从而实现了离群点的二次聚类,保证了聚类的精度.最后HDSDen算法对真实数据集进行聚类实验,验证HDSDen算法比现有几种典型数据流聚类方法具有更高的聚类质量,并能给出任意时间的聚类结果,能够有效地处理混合属性数据流聚类问题.
推荐文章
一种实现混合属性数据流聚类的算法
混合属性数据
相似性
k - 近邻算法
k - 均值聚类
分类属性
一种面向分类属性数据的聚类融合算法研究
聚类融合
分类属性数据
数据挖掘
相似度
基于信息熵的混合属性数据谱聚类算法
混合属性数据
谱聚类
高斯核函数
影响因子
一种实现混合属性数据流聚类的算法
混合属性数据
相似性
k - 近邻算法
k - 均值聚类
分类属性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种面向混合属性数据流的基于密度的聚类算法研究
来源期刊 小型微型计算机系统 学科 工学
关键词 数据流 混合属性 属性占优 数据聚类 密度
年,卷(期) 2016,(1) 所属期刊栏目 计算机软件与数据库研究
研究方向 页码范围 43-47
页数 5页 分类号 TP311
字数 5728字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨东勇 浙江工业大学信息工程学院 69 521 11.0 19.0
2 陈晋音 浙江工业大学信息工程学院 45 217 9.0 13.0
3 何辉豪 浙江工业大学信息工程学院 4 32 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (72)
参考文献  (8)
节点文献
引证文献  (5)
同被引文献  (31)
二级引证文献  (11)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(4)
  • 参考文献(2)
  • 二级参考文献(2)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(6)
  • 引证文献(0)
  • 二级引证文献(6)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
数据流
混合属性
属性占优
数据聚类
密度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
小型微型计算机系统
月刊
1000-1220
21-1106/TP
大16开
辽宁省沈阳市东陵区南屏东路16号
8-108
1980
chi
出版文献量(篇)
11026
总下载数(次)
17
总被引数(次)
83133
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导