作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用.现有的聚类算法大多数都是基于向量空间模型,文档集合中出现的单词词频作为特征项.这些算法都存在数据维数过高、聚簇难以描述的问题,而且忽略了单词间的语义联系.本文提出了一种基于语义相似度的文本聚类算法--TCUSS(Text clustering using semantic similarity)算法.TCUSS算法将文档表示成概念列表,有效地解决了数据维数高和聚簇描述难的问题,并给出如何利用概念列表进行聚簇描述的方法.TCUSS算法利用两个概念列表中单词间的语义相似度作为文档间相近程度的度量,并以图为基础进行聚类分析,避免有些聚类算法对聚簇形状的限制.实验证明,TCUSS算法提高了聚类质量.
推荐文章
一种基于语义相似度的群智能文本聚类的新方法
文本聚类
语义相似度
K-均值算法
蚁群算法
模拟退火算法
一种增量式文本软聚类算法
语义序列
增量式聚类
软聚类
文本聚类
基于本体及相似度的文本聚类研究
本体
相似度
文本聚类
语义
基于语义列表的中文文本聚类算法
文本聚类
文本表示
语义列表
相似度计算
聚簇表示
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于语义相似度的文本聚类算法
来源期刊 南京航空航天大学学报 学科 工学
关键词 文本聚类 语义相似度 文本表示 语义相似度的文本聚类算法
年,卷(期) 2006,(6) 所属期刊栏目
研究方向 页码范围 712-716
页数 5页 分类号 TP311
字数 4570字 语种 中文
DOI 10.3969/j.issn.1005-2615.2006.06.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 章勇 南京航空航天大学信息科学与技术学院 40 208 7.0 12.0
2 孙爽 南京航空航天大学信息科学与技术学院 1 50 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (50)
同被引文献  (49)
二级引证文献  (142)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(4)
  • 引证文献(4)
  • 二级引证文献(0)
2008(6)
  • 引证文献(6)
  • 二级引证文献(0)
2009(6)
  • 引证文献(5)
  • 二级引证文献(1)
2010(12)
  • 引证文献(7)
  • 二级引证文献(5)
2011(17)
  • 引证文献(3)
  • 二级引证文献(14)
2012(22)
  • 引证文献(9)
  • 二级引证文献(13)
2013(15)
  • 引证文献(3)
  • 二级引证文献(12)
2014(21)
  • 引证文献(4)
  • 二级引证文献(17)
2015(9)
  • 引证文献(0)
  • 二级引证文献(9)
2016(17)
  • 引证文献(2)
  • 二级引证文献(15)
2017(18)
  • 引证文献(3)
  • 二级引证文献(15)
2018(21)
  • 引证文献(3)
  • 二级引证文献(18)
2019(19)
  • 引证文献(1)
  • 二级引证文献(18)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
文本聚类
语义相似度
文本表示
语义相似度的文本聚类算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京航空航天大学学报
双月刊
1005-2615
32-1429/V
大16开
南京市御道街29号1016信箱
28-140
1956
chi
出版文献量(篇)
3509
总下载数(次)
9
总被引数(次)
36115
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导