基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统文本聚类方法只适合处理静态样本,且时间复杂度较高.针对该问题,提出一种基于簇相合性的文本增量聚类算法.采用基于词项语义相似度的文本表示模型,利用词项之间的语义信息,通过计算新增文本与已有簇之间的相合性实现对文本的增量聚类.增量处理完部分文本后,对其中错分可能性较大的文本重新指派类别,以进一步提高聚类性能.该算法可在对象数据不断增长或更新的情况下,避免大量重复计算,提高聚类性能.在20 Newsgroups数据集上进行实验,结果表明,与k-means算法和SHC算法相比,该算法可减少聚类时间,提高聚类性能.
推荐文章
一种增量式文本软聚类算法
语义序列
增量式聚类
软聚类
文本聚类
一种基于代表点的增量聚类算法
代表点
节点属性
增量聚类
一种基于网格的增量聚类算法
增量
聚类
网格
数据挖掘
一种面向网络话题发现的增量文本聚类算法
话题发现
文本聚类
增量聚类
准确度
ICIT算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于簇相合性的文本增量聚类算法
来源期刊 计算机工程 学科 工学
关键词 文本聚类 增量聚类 语义相似度 簇相合性 文本再分配
年,卷(期) 2014,(6) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 195-200
页数 6页 分类号 TP18
字数 5552字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.06.042
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 万剑怡 江西师范大学计算机信息工程学院 33 207 8.0 12.0
2 王明文 江西师范大学计算机信息工程学院 115 1470 19.0 34.0
3 左家莉 江西师范大学初等教育学院 21 93 5.0 9.0
4 罗远胜 江西财经大学网络信息管理中心 8 42 4.0 6.0
5 陶舒怡 江西师范大学计算机信息工程学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (4)
同被引文献  (6)
二级引证文献  (1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本聚类
增量聚类
语义相似度
簇相合性
文本再分配
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导