原文服务方: 计算机应用研究       
摘要:
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的K-means文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-m
推荐文章
K-means聚类算法初始中心选择研究
K-means聚类算法
K个聚类中心
密度参数
K-means算法改进
K-means聚类算法的研究
数据挖掘
K-means算法
初始聚类中心
聚类分析
一种有效的K-means聚类中心初始化方法
K-均值算法
基于密度
初始聚类中心
最大最小距离
最大距离积
基于密度的K-means聚类中心选取的优化算法
K-均值
数据挖掘
聚类中心
垂直中点
密度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 最大距离法选取初始簇中心的K-means文本聚类算法的研究
来源期刊 计算机应用研究 学科
关键词 K-means聚类算法 最大距离 文本聚类 文本距离 测度函数 ◢F◣度量值
年,卷(期) 2014,(3) 所属期刊栏目 算法研究探讨
研究方向 页码范围 713-715,719
页数 4页 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2014.03.017
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (68)
共引文献  (473)
参考文献  (12)
节点文献
引证文献  (160)
同被引文献  (374)
二级引证文献  (415)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(6)
  • 参考文献(0)
  • 二级参考文献(6)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(6)
  • 参考文献(1)
  • 二级参考文献(5)
2004(9)
  • 参考文献(0)
  • 二级参考文献(9)
2005(9)
  • 参考文献(0)
  • 二级参考文献(9)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(9)
  • 参考文献(1)
  • 二级参考文献(8)
2008(10)
  • 参考文献(3)
  • 二级参考文献(7)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(6)
  • 参考文献(6)
  • 二级参考文献(0)
2014(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2014(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(22)
  • 引证文献(21)
  • 二级引证文献(1)
2016(48)
  • 引证文献(32)
  • 二级引证文献(16)
2017(87)
  • 引证文献(35)
  • 二级引证文献(52)
2018(172)
  • 引证文献(44)
  • 二级引证文献(128)
2019(171)
  • 引证文献(17)
  • 二级引证文献(154)
2020(70)
  • 引证文献(7)
  • 二级引证文献(63)
研究主题发展历程
节点文献
K-means聚类算法
最大距离
文本聚类
文本距离
测度函数
◢F◣度量值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导