原文服务方: 科技与创新       
摘要:
文本聚类作为一种无监督的机器学习方法,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注.本文以网络论坛的话题发现和追踪为背景,通过对论坛中的帖子进行聚类分析而获取话题.本文以层次聚类算法为基础,进行改进,提出高权重词集的概念,基于此设计并实现了增量聚类算法,通过实验验证了该算法适应动态数据以及时间、空间复杂性上的优越性,证明了系统在设计的时候采用的系统架构的合理性及必要性.
推荐文章
基于高权重词集的增量聚类算法研究
文本聚类
高权重词集
层次聚类
增量聚类
一种基于网格的增量聚类算法
增量
聚类
网格
数据挖掘
基于方差权重矩阵模型的高维数据子空间聚类算法
子空间聚类
方差权重矩阵
模糊C-均值聚类
高维数据
基于自适应权重的RFC M聚类算法
聚类
自适应
权重
粗糙集
模糊集
均衡因子
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于高权重词集的增量聚类算法研究
来源期刊 科技与创新 学科
关键词 文本聚类 高权重词集 层次聚类 增量聚类
年,卷(期) 2011,(5) 所属期刊栏目 软件时空
研究方向 页码范围 170-172
页数 分类号 TP301
字数 语种 中文
DOI 10.3969/j.issn.2095-6835.2011.05.068
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张兆心 哈尔滨工业大学网络与信息安全技术研究中心 44 270 9.0 14.0
2 王丹 哈尔滨工业大学网络与信息安全技术研究中心 65 841 11.0 28.0
3 宋颖慧 哈尔滨工业大学网络与信息安全技术研究中心 24 186 8.0 13.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (61)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(3)
  • 二级参考文献(0)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本聚类
高权重词集
层次聚类
增量聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
论文1v1指导