基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之处,而点对敏感聚类模型(pair-wise cluster)算法复杂度是NP难的问题而设计.核心聚类模型将数据集合中的点划分为若干不相交的核心点集和边界点集,同一核心点集内任意点对的相似度大于阈值σ,而不同核心点集的点对相似度小于阈值σ.核心聚类模型挖掘出的核心点集是紧密类簇,并且具备良好的分类性质.由于采用了局部优化算法,核心聚类模型的算法复杂度为O(n2),较点对敏感的最大相关成员簇聚类模型大大降低.同时,可以通过核心点集和边界点集构造最大相关成员簇的上界,这就在一定程度上保证了核心聚类模型结果的完备性.实验和分析对比说明核心聚类模型具有较高的算法效率,可扩展性强,结果表示合理,能够很好地解决现实应用问题.
推荐文章
基于侏儒立方体的保持语义的数据立方体结构
语义
数据立方体
侏儒立方体
冰山立方体
交叉立方体中嵌入超立方体的研究
超立方体
交叉立方体
同胚嵌入
同构嵌入
空间数据立方体的技术框架
空间数据仓库
GIS
空间数据立方体
基于数据立方体的关联规则挖掘方法研究
数据挖掘
数据立方体
关联规则
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 数据立方体切片的核心聚类分析方法
来源期刊 计算机研究与发展 学科 工学
关键词 数据挖掘 聚类 数据立方体 切片 相关分析
年,卷(期) 2006,(z3) 所属期刊栏目 数据挖掘和知识发现
研究方向 页码范围 359-365
页数 7页 分类号 TP391
字数 6373字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 唐世渭 北京大学信息科学技术学院 103 4937 32.0 70.0
2 杨冬青 北京大学信息科学技术学院 97 4962 32.0 70.0
3 马秀莉 北京大学信息科学技术学院 5 69 3.0 5.0
4 张德辉 北京大学信息科学技术学院 5 9 2.0 3.0
5 姜力争 北京大学信息科学技术学院 4 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (5)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
聚类
数据立方体
切片
相关分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导