基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.
推荐文章
一种可分类数据的聚类算法及其应用
加权支持度
聚类
可分类数据
入侵检测
一种面向分类属性数据的聚类融合算法研究
聚类融合
分类属性数据
数据挖掘
相似度
一种面向大数据的快速自动聚类算法
谱聚类
粒子群优化
区域进化
自动聚类
一种实现混合属性数据流聚类的算法
混合属性数据
相似性
k - 近邻算法
k - 均值聚类
分类属性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种分类数据的聚类算法
来源期刊 计算机研究与发展 学科 工学
关键词 数据开采 聚类算法 分类数据
年,卷(期) 2006,(z3) 所属期刊栏目 数据挖掘和知识发现
研究方向 页码范围 332-337
页数 6页 分类号 TP311
字数 6695字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈世强 湖北民族学院信息工程学院 39 105 6.0 8.0
2 谢坤武 湖北民族学院信息工程学院 38 276 8.0 15.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据开采
聚类算法
分类数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导