基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技术进行了深入的研究,讨论了分词、特征表示、特征选择和K-means算法等相关技术。最后,实现了该文本聚类系统,对采集到的Web文本进行聚类,实验证明此算法具有很好的聚类结果。
推荐文章
一种基于Web文本聚类的用户兴趣发现模型的研究
文本聚类
用户兴趣
Web
用户行为
VSM
一种基于主题的Web文本聚类算法
HTBC算法
Web文本聚类
主题
搜索引擎
互信息
基于LDA的英汉维文本聚类系统的设计与实现
文本聚类
LDA模型
多语言
文本特征提取
相似度聚类
权重
Web文本聚类算法WTCA的研究与实现
Web文本挖掘
文本聚类
非结构化数据挖掘结构模型
自组织特征映射
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Web文本聚类的研究与实现
来源期刊 长春师范学院学报:自然科学版 学科 工学
关键词 WEB文本聚类 分词 特征表示 特征选择 K-MEANS算法
年,卷(期) 2011,(3) 所属期刊栏目
研究方向 页码范围 26-29
页数 4页 分类号 TP31
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴长勤 安徽科技学院理学院 11 15 2.0 3.0
2 葛华 安徽科技学院理学院 11 19 3.0 4.0
3 贾丙静 安徽科技学院理学院 6 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
WEB文本聚类
分词
特征表示
特征选择
K-MEANS算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
长春师范学院学报:自然科学版
双月刊
1008-178X
22-1276/G4
吉林省长春市长吉北路677号
出版文献量(篇)
3286
总下载数(次)
0
总被引数(次)
0
论文1v1指导