基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
鉴于线性文本内容组织形式的有序性,将有序的主题内容进行正确的划分,用于挖掘文本中隐藏的信息、知识,是一个值得研究的问题.同时,传统的K-means聚类算法在对线性文本进行聚类时,会造成计算复杂度增加以及无穷迭代或聚类结果混乱等一系列问题.针对以上问题,对传统的K-means算法进行研究,将随机初始化中心点的算法进行改进,提出一种随机均匀初始化中心点算法.该算法充分考虑线性文本的组织结构特性,随机化第一个中心点后,均匀地确定其他中心点,保证了文本子主题的完整划分;与此同时,又采用了设定约束规则的等距点归类法,实现文本迭代次数限制下的自动归类.实验结果表明,该算法在对线性文本进行聚类时,可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果.
推荐文章
K-means聚类算法的研究
数据挖掘
K-means算法
初始聚类中心
聚类分析
基于增强蜂群优化与 K-means 的文本聚类算法
蜂群算法
公平操作
克隆操作
多样性
局部提炼
文本聚类
基于变异的k-means聚类算法
聚类
mk-means算法
变异
基于Fisher线性判别率的加权K-means聚类算法
K-均值
聚类
Fisher线性判别率
特征加权
调整随机指标
类内错误率均方和
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向线性文本的K-means聚类算法研究
来源期刊 计算机技术与发展 学科 工学
关键词 线性文本 组织结构 随机均匀取点 等距点归类 K-means算法
年,卷(期) 2018,(9) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 53-58
页数 6页 分类号 TP301.6
字数 4677字 语种 中文
DOI 10.3969/j.issn.1673-629X.2018.09.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 文必龙 东北石油大学计算机与信息技术学院 37 124 7.0 8.0
2 马强 东北石油大学计算机与信息技术学院 8 8 2.0 2.0
3 李菲 东北石油大学计算机与信息技术学院 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (147)
共引文献  (662)
参考文献  (23)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1953(1)
  • 参考文献(0)
  • 二级参考文献(1)
1957(2)
  • 参考文献(0)
  • 二级参考文献(2)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(3)
  • 参考文献(0)
  • 二级参考文献(3)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(3)
  • 参考文献(1)
  • 二级参考文献(2)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(1)
  • 二级参考文献(3)
1999(4)
  • 参考文献(1)
  • 二级参考文献(3)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(7)
  • 参考文献(1)
  • 二级参考文献(6)
2004(8)
  • 参考文献(2)
  • 二级参考文献(6)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(11)
  • 参考文献(2)
  • 二级参考文献(9)
2007(11)
  • 参考文献(2)
  • 二级参考文献(9)
2008(14)
  • 参考文献(4)
  • 二级参考文献(10)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(20)
  • 参考文献(2)
  • 二级参考文献(18)
2012(10)
  • 参考文献(0)
  • 二级参考文献(10)
2013(13)
  • 参考文献(1)
  • 二级参考文献(12)
2014(11)
  • 参考文献(2)
  • 二级参考文献(9)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
线性文本
组织结构
随机均匀取点
等距点归类
K-means算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导