基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
聚类分析是数据挖掘领域中最重要的任务之一,目前许多聚类算法已经被成功应用到图像聚类、文本聚类、信息检索、社交网络等领域.但面对结构复杂,分布不均衡的数据集时,确定数据集的最佳聚类数目显得尤为困难.因此,本文针对结构复杂、分布不均衡的数据集提出了一种启发式最佳聚类数确定的方法.首先,构建随机游走模型对数据集中的点进行重要性排序,通过k-最近邻距离图谱确定重要数据点的个数,由此排除噪声点和不重要的点对类之间以及类内密度变化的影响.其次,通过设计的启发式规则(k-最近邻链间距和k-最近邻链最近邻间距)构建决策图确定最佳聚类数目并识别出聚类代表点.最后,通过最近距离传播算法进行聚类.实验表明该方法可以快速准确地找到最佳聚类个数,同时,本文提出的聚类算法与流行的聚类算法相比取得了比较好的聚类结果.
推荐文章
一种启发式属性约简算法
粗糙集
属性约简
复合属性重要度
启发式算法
一种机组优化启停的新型启发式方法
机组优化启停
启发式方法
动态规划
拉格朗日松弛法
基于启发式规则的网页主题信息精确定位方法
启发式规则
信息抽取
主题信息定位
模板化网页
粗集中属性约简的一种启发式遗传算法
粗集
约简
遗传算法
信息论
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种启发式确定聚类数方法
来源期刊 小型微型计算机系统 学科 工学
关键词 聚类分析 聚类数目 启发式规则 随机游走模型 k-最近邻链
年,卷(期) 2018,(7) 所属期刊栏目 人工智能与算法研究
研究方向 页码范围 1381-1385
页数 5页 分类号 TP18
字数 6632字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱庆生 重庆大学计算机学院 175 1952 22.0 33.0
5 卢建云 重庆大学计算机学院 4 58 4.0 4.0
9 吴全旺 重庆大学计算机学院 1 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (112)
共引文献  (905)
参考文献  (15)
节点文献
引证文献  (5)
同被引文献  (39)
二级引证文献  (3)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(4)
  • 参考文献(0)
  • 二级参考文献(4)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(4)
  • 参考文献(1)
  • 二级参考文献(3)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(9)
  • 参考文献(1)
  • 二级参考文献(8)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(8)
  • 参考文献(0)
  • 二级参考文献(8)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(11)
  • 参考文献(0)
  • 二级参考文献(11)
2008(8)
  • 参考文献(2)
  • 二级参考文献(6)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(13)
  • 参考文献(0)
  • 二级参考文献(13)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(10)
  • 参考文献(4)
  • 二级参考文献(6)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(5)
  • 引证文献(4)
  • 二级引证文献(1)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
聚类分析
聚类数目
启发式规则
随机游走模型
k-最近邻链
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
小型微型计算机系统
月刊
1000-1220
21-1106/TP
大16开
辽宁省沈阳市东陵区南屏东路16号
8-108
1980
chi
出版文献量(篇)
11026
总下载数(次)
17
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导