基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种用于复杂分布数据的二阶段聚类算法(two-phase clustering,简称TPC),TPC包含两个阶段:首先将数据划分为若干个球形分布的子类,每一个子类用其聚类中心代表该类内的所有样本;然后利用可以处理复杂分布教据的流形进化聚类(manifold evolutionary clustering,简称MEC)对第1阶段得到的聚类中心进行类别划分;最后综合两次聚类结果整理得到最终聚类结果.该算法基于改进的K-均值算法和MEC算法.在进化聚类算法的基础上引入流形距离,使得算法能够胜任复杂分布的数据聚类问题.同时,算法降低了引入流形距离所带来的计算量.在分布各异的7个人工数据集和7个UCI数据集测试了二阶段聚类算法,并将其效果与遗传聚类算法、K均值算法和流形进化聚类算法做了比较.实验结果表明,无论对于简单或复杂、凸或非凸的数据,TPC都表现出良好的聚类性能,并且计算时间与MEC相比明显减少.
推荐文章
基于Hadoop二阶段并行模糊c-Means数据聚类算法
二阶段
模糊c-Means
大数据
数据聚类
hadoop
基于分布估计算法的二阶段置换流水车间调度算法
分布估计算法
置换流水车间调度
完工时间
混合邻域搜索
复杂分布数据的半监督阶段聚类
元胞自动机
半监督聚类
K-means聚类算法
CA-K-means二阶段聚类
复杂分布
二阶段模糊聚类方法研究
模糊聚类
模拟退火
恒星光谱数据
全局最优
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 复杂分布数据的二阶段聚类算法
来源期刊 软件学报 学科 工学
关键词 数据挖掘 聚类K-均值算法 进化算法 流形
年,卷(期) 2011,(11) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 2760-2772
页数 分类号 TP181
字数 7937字 语种 中文
DOI 10.3724/SP.J.1001.2011.03903
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (51)
同被引文献  (105)
二级引证文献  (164)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(9)
  • 引证文献(8)
  • 二级引证文献(1)
2013(19)
  • 引证文献(9)
  • 二级引证文献(10)
2014(22)
  • 引证文献(3)
  • 二级引证文献(19)
2015(45)
  • 引证文献(9)
  • 二级引证文献(36)
2016(28)
  • 引证文献(9)
  • 二级引证文献(19)
2017(28)
  • 引证文献(4)
  • 二级引证文献(24)
2018(31)
  • 引证文献(4)
  • 二级引证文献(27)
2019(21)
  • 引证文献(3)
  • 二级引证文献(18)
2020(12)
  • 引证文献(2)
  • 二级引证文献(10)
研究主题发展历程
节点文献
数据挖掘
聚类K-均值算法
进化算法
流形
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
论文1v1指导