基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了k-means聚类算法中选取初始聚类中心及处理孤立点的新方法,改进了 k-means算法对初始聚类中心和孤立点文本很敏感的不足之处,并将改进后的算法应用于中文文本聚类中.实验结果表明,改进的算法较原算法在准确率上有较大提高,并且具有更好的稳定性.
推荐文章
一种结合GAAC和K-means的维吾尔文文本聚类算法
维吾尔文
文本聚类
K-means
GAAC
结合算法
基于改进k-means算法的文本聚类
k-means算法
共现词
词向量
相似性
基于改进TextRank算法的中文文本摘要提取
Doc2Vec模型
K-means算法
TextRank算法
摘要提取
权重影响因子
基于句法结构分析的中文文本聚类方法研究
文本聚类
K-means
句法结构分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的k-means中文文本聚类算法
来源期刊 湖南工业大学学报 学科 工学
关键词 k-means算法 文本聚类 中文文本 层次聚类
年,卷(期) 2008,(2) 所属期刊栏目 计算机技术
研究方向 页码范围 52-54
页数 3页 分类号 TP301
字数 3455字 语种 中文
DOI 10.3969/j.issn.1673-9833.2008.02.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李安民 湖南环境生物职业技术学院信息技术系 12 39 3.0 6.0
2 龚静 湖南环境生物职业技术学院信息技术系 61 321 10.0 15.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (8)
参考文献  (2)
节点文献
引证文献  (24)
同被引文献  (61)
二级引证文献  (221)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(7)
  • 引证文献(5)
  • 二级引证文献(2)
2011(8)
  • 引证文献(3)
  • 二级引证文献(5)
2012(8)
  • 引证文献(3)
  • 二级引证文献(5)
2013(5)
  • 引证文献(2)
  • 二级引证文献(3)
2014(11)
  • 引证文献(1)
  • 二级引证文献(10)
2015(25)
  • 引证文献(2)
  • 二级引证文献(23)
2016(38)
  • 引证文献(1)
  • 二级引证文献(37)
2017(51)
  • 引证文献(1)
  • 二级引证文献(50)
2018(53)
  • 引证文献(3)
  • 二级引证文献(50)
2019(27)
  • 引证文献(1)
  • 二级引证文献(26)
2020(10)
  • 引证文献(0)
  • 二级引证文献(10)
研究主题发展历程
节点文献
k-means算法
文本聚类
中文文本
层次聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
湖南工业大学学报
双月刊
1673-9833
43-1468/T
大16开
湖南省株洲市天元区泰山路88号
1987
chi
出版文献量(篇)
3955
总下载数(次)
6
总被引数(次)
15502
相关基金
湖南省社会科学基金
英文译名:
官方网址:http://www.hnjykxgh.com/zcfg/show.asp?articleID=910
项目类型:
学科类型:
论文1v1指导