基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
谱聚类将聚类问题转化成图划分问题,是一种基于代数图论的聚类方法.在求解图划分目标函数时,一般利用Rayleigh熵的性质,通过计算Laplacian矩阵的特征向量将原始数据点映射到一个低维的特征空间中,再进行聚类.然而在谱聚类过程中,存储相似矩阵的空间复杂度是O(n2),对Laplacian矩阵特征分解的时间复杂度一般为O(n3),这样的复杂度在处理大规模数据时是无法接受的.理论证明,Normalized Cut图聚类与加权核k-means都等价于矩阵迹的最大化问题.因此,可以用加权核k-means算法来优化Normalized Cut的目标函数,这就避免了对Laplacian矩阵特征分解.不过,加权核k-means算法需要计算核矩阵,其空间复杂度依然是O(n2).为了应对这一挑战,提出近似加权核k-means算法,仅使用核矩阵的一部分来求解大数据的谱聚类问题.理论分析和实验对比表明,近似加权核k-means的聚类表现与加权核k-means算法是相似的,但是极大地减小了时间和空间复杂性.
推荐文章
基于Fisher线性判别率的加权K-means聚类算法
K-均值
聚类
Fisher线性判别率
特征加权
调整随机指标
类内错误率均方和
基于k-means的(1+ε)近似算法求解
k-means
聚类
随机算法
取样
大规模多视图数据的自降维K-means算法
大规模数据
多视图
自降维
K-means
信息互补
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 求解大规模谱聚类的近似加权核k-means算法
来源期刊 软件学报 学科 工学
关键词 谱聚类 迹最大化 加权核k-means 近似核矩阵 大数据
年,卷(期) 2015,(11) 所属期刊栏目 大数据时代的机器学习研究专刊
研究方向 页码范围 2836-2846
页数 11页 分类号 TP181
字数 9889字 语种 中文
DOI 10.13328/j.cnki.jos.004888
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 史忠植 中国科学院计算技术研究所智能信息处理重点实验室 232 9166 52.0 89.0
2 丁世飞 中国矿业大学计算机科学与技术学院 83 2735 17.0 52.0
6 贾洪杰 中国矿业大学计算机科学与技术学院 3 64 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (757)
参考文献  (15)
节点文献
引证文献  (42)
同被引文献  (112)
二级引证文献  (67)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(5)
  • 参考文献(1)
  • 二级参考文献(4)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(6)
  • 参考文献(2)
  • 二级参考文献(4)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(4)
  • 参考文献(2)
  • 二级参考文献(2)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(7)
  • 引证文献(7)
  • 二级引证文献(0)
2017(9)
  • 引证文献(7)
  • 二级引证文献(2)
2018(23)
  • 引证文献(15)
  • 二级引证文献(8)
2019(48)
  • 引证文献(11)
  • 二级引证文献(37)
2020(22)
  • 引证文献(2)
  • 二级引证文献(20)
研究主题发展历程
节点文献
谱聚类
迹最大化
加权核k-means
近似核矩阵
大数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导