基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于树结构中结点覆盖关系的一类层次化聚类算法可以对海量数据生成有意义的摘要.然而,该算法已被证明是NP-完全问题,求解其精确解需要庞大的计算量.虽然它在单机计算环境中存在有效的剪枝方法,但在分布式计算环境中这种剪枝算法并不可行.相应地提出了该层次聚类算法在分布式环境中的剪枝新策略,通过绑定结点与其覆盖的基本事件构成的有序数组,使穷举查询转换为有序数组的求交集运算,并能够在合并过程中执行大量剪枝,从而在有限的额外空间消耗的基础上显著减少计算时间.在2组公开基准数据集上进行了测试,结果表明,相比朴素的分布式计算策略,新的层次化聚类算法在时间效率上平均有30 ~ 40倍左右的提升.
推荐文章
分布式环境中聚类问题算法研究综述
集中式聚类
分布式聚类
聚类精度
聚类时间
基于集群的并行分布式聚类及其应用
并行分布式聚类
RSOM
集群系统
增量聚类
分布式关联规则挖掘中的聚类分区算法
关联规则
数据挖掘
聚类
分布式关联规则挖掘中的聚类分区算法
关联规则
数据挖掘
聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 层次化聚类在分布式计算环境中的剪枝策略
来源期刊 计算机应用与软件 学科 工学
关键词 层次化聚类算法 分布式计算环境 剪枝操作
年,卷(期) 2017,(5) 所属期刊栏目 算法
研究方向 页码范围 261-267
页数 7页 分类号 TP3
字数 6150字 语种 中文
DOI 10.3969/j.issn.1000-386x.2017.05.045
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王建新 北京林业大学信息学院 35 165 8.0 11.0
2 丁晓阳 北京林业大学信息学院 2 3 1.0 1.0
3 罗阳 北京林业大学信息学院 3 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (222)
共引文献  (1066)
参考文献  (14)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(1)
  • 二级参考文献(0)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(6)
  • 参考文献(0)
  • 二级参考文献(6)
2000(7)
  • 参考文献(0)
  • 二级参考文献(7)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(10)
  • 参考文献(0)
  • 二级参考文献(10)
2003(15)
  • 参考文献(1)
  • 二级参考文献(14)
2004(11)
  • 参考文献(0)
  • 二级参考文献(11)
2005(15)
  • 参考文献(0)
  • 二级参考文献(15)
2006(15)
  • 参考文献(1)
  • 二级参考文献(14)
2007(22)
  • 参考文献(0)
  • 二级参考文献(22)
2008(26)
  • 参考文献(1)
  • 二级参考文献(25)
2009(26)
  • 参考文献(0)
  • 二级参考文献(26)
2010(11)
  • 参考文献(1)
  • 二级参考文献(10)
2011(17)
  • 参考文献(2)
  • 二级参考文献(15)
2012(17)
  • 参考文献(2)
  • 二级参考文献(15)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(6)
  • 参考文献(3)
  • 二级参考文献(3)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
层次化聚类算法
分布式计算环境
剪枝操作
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导