基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对谱聚类算法相似度函数设置困难问题,提出了一种使用证据累积的文本聚类谱算法.该算法使用超球K均值算法对文本集进行多次聚类,并将每次得到的划分结果作为判断2个文本是否应该放在一个簇中的证据,由此构建文本的相似度矩阵和正则化拉普拉斯矩阵.在TREC和Reuters文本集上进行了实验,验证了本文算法的有效性,它比层次聚类算法和CLUTO提供的K均值算法更加优越.
推荐文章
基于EM算法的文本聚类优化研究
硬聚类
软聚类
EM算法
文本聚类优化模型(TCOM)
基于LPCA的谱聚类算法
局部主成分分析
谱聚类
连通图分解
交叉点
使用谱聚类算法解决文本聚类集成问题
聚类集成
文本聚类
谱聚类
矩阵扰动理论
图上的随机游动
基于文本挖掘的聚类算法研究
文本挖掘
K-means
K-medoids
准确率
召回率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 使用证据累积的文本聚类谱算法
来源期刊 哈尔滨工程大学学报 学科 工学
关键词 聚类分析 文本聚类 聚类谱 证据累积 超球K均值
年,卷(期) 2010,(8) 所属期刊栏目
研究方向 页码范围 1043-1047
页数 分类号 TP391
字数 4977字 语种 中文
DOI 10.3969/j.issn.1006-7043.2010.08.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐森 盐城工学院信息工程学院 33 233 7.0 14.0
3 张春祥 哈尔滨理工大学计算机科学与技术学院 33 80 6.0 7.0
6 卢志茂 盐城工学院信息工程学院 1 3 1.0 1.0
7 顾国昌 盐城工学院信息工程学院 1 3 1.0 1.0
8 张琦 盐城工学院信息工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (55)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
聚类分析
文本聚类
聚类谱
证据累积
超球K均值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
哈尔滨工程大学学报
月刊
1006-7043
23-1390/U
大16开
哈尔滨市南岗区南通大街145号1号楼
14-111
1980
chi
出版文献量(篇)
5623
总下载数(次)
16
总被引数(次)
45433
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导