基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
谱聚类算法由于其可识别非凸数据分布、可有效避免局部最优解、不受数据点维数限制等优点,在许多领域得到广泛应用.然而,随着数据量的增大和数据维数的增多,在保证聚类准确性的前提下,尽可能降低计算时间将变得非常必要.此外,影响谱聚类算法聚类质量的因素除数据集本身外,还与所采用的求解距离矩阵的方法、相似性矩阵的尺度参数、Laplacian矩阵形式等多种因素相关.针对以上问题,首先对于大规模数据问题,将MPI并行编程模型应用于谱聚类算法;然后利用t-最近邻方法对谱聚类算法中较大维数的Laplacian矩阵进行近似转化,同时用局部尺度(Local Scaling)参数对算法中的尺度参数进行自动调节.基于上述分析,提出了一种谱聚类并行实现算法,即稀疏化局部尺度并行谱聚类算法SLSPSC,并在四个数据集上进行了测试,与现有的并行谱聚类算法PSC在运行时间和聚类质量两方面做了比较分析.实验结果显示,该算法降低了求解Laplacian矩阵的总时间,同时部分数据集聚类质量得到较大提高.
推荐文章
基于稀疏图的鲁棒谱聚类算法
谱聚类
稀疏表示
图拉普拉斯
L1正则化
内点法
一种基于流形距离核的谱聚类算法
谱图理论
谱聚类
流形距离核
自适应
基于SOM和PSO的云计算异构资源聚类MPI并行算法
云计算
并行算法
自组织映射
粒子群
一种初始化不敏感的谱聚类算法
谱聚类
初始化敏感
粒子群优化
最优粒子
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于MPI的稀疏化局部尺度并行谱聚类算法的研究与实现
来源期刊 计算机工程与科学 学科 数学
关键词 并行谱聚类 稀疏化 局部尺度 MPI
年,卷(期) 2016,(5) 所属期刊栏目 高性能计算
研究方向 页码范围 839-847
页数 9页 分类号 O246
字数 7632字 语种 中文
DOI 10.3969/j.issn.1007-130X.2016.05.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵永华 中国科学院计算机网络信息中心高性能计算部 28 182 6.0 13.0
2 李瑞琳 中国科学院计算机网络信息中心高性能计算部 3 8 2.0 2.0
6 黄小磊 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (1)
参考文献  (8)
节点文献
引证文献  (6)
同被引文献  (7)
二级引证文献  (0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
并行谱聚类
稀疏化
局部尺度
MPI
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导