基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在数据挖掘研究领域,现有的大多数聚类算法都受到数据可伸缩性和结果可解释性的限制.为了解决这一难题,提出了一种基于概念的数据聚类模型.该模型从描述数据样本的数据本身出发,首先在预处理后的数据集上提取基本概念,再对这些概念进行概化,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个聚类过程.该模型能够在保证聚类准确性的基础上,很大程度地减少要处理的数据量,提高原算法的可伸缩性.另外,该模型基于概念进行知识的发现与分析,能够提高聚类结果的可解释性,便于与用户交互.实验结果表明,该模型对于聚类结果较好且复杂度较高的算法尤为有效.
推荐文章
一种基于双聚类的缺失数据填补方法
缺失数据填补
双聚类
双聚类数据填补
数据清洗
一种基于代表点的分布式数据流聚类算法
分布式数据流
数据挖掘
聚类
聚类演化
代表点
一种基于云计算的灰色聚类风险评估模型
灰色聚类
云计算
白化函数
风险评价
一种基于引力的聚类算法
聚类
聚类算法
引力
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于概念的数据聚类模型
来源期刊 软件学报 学科 工学
关键词 数据挖掘 聚类 概念 概念元组 模型
年,卷(期) 2009,(9) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 2387-2396
页数 10页 分类号 TP18
字数 8896字 语种 中文
DOI 10.3724/SP.J.1001.2009.03412
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘莹 东北大学软件学院 53 469 12.0 21.0
2 朱志良 东北大学软件学院 112 1344 20.0 32.0
3 张斌 东北大学信息科学与工程学院 203 1801 20.0 33.0
4 张明卫 东北大学信息科学与工程学院 18 294 9.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (16)
参考文献  (6)
节点文献
引证文献  (38)
同被引文献  (58)
二级引证文献  (339)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(2)
  • 参考文献(1)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(7)
  • 引证文献(5)
  • 二级引证文献(2)
2013(17)
  • 引证文献(3)
  • 二级引证文献(14)
2014(41)
  • 引证文献(6)
  • 二级引证文献(35)
2015(56)
  • 引证文献(2)
  • 二级引证文献(54)
2016(73)
  • 引证文献(5)
  • 二级引证文献(68)
2017(67)
  • 引证文献(7)
  • 二级引证文献(60)
2018(65)
  • 引证文献(4)
  • 二级引证文献(61)
2019(37)
  • 引证文献(1)
  • 二级引证文献(36)
2020(9)
  • 引证文献(0)
  • 二级引证文献(9)
研究主题发展历程
节点文献
数据挖掘
聚类
概念
概念元组
模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导