基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章提出基于语义相似度的Web文档聚类算法--WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阚值,并对最小树中进行切割,同时对较小的子类进行划分合并.实验表明,WECSS不仅能为具有各种不同聚类形状的数据集准确地分析出数据中存在的合理聚类和例外样本,而且避免了用户参数选择所造成聚类质最降低问题.
推荐文章
基于遗传算法的Web文档聚类算法
Web文档聚类
遗传算法
自适应对偶种群
目标策略
面向Web日志的语义聚类算法
Web日志
挖掘
语义
本体
基于相似度的词聚类算法
词相似度
词聚类
统计语言模型
基于综合语义的XML文档相似度计算方法
可扩展标记语言
相似度计算
构件向量
综合语义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于语义相似度的Web文档聚类算法
来源期刊 合肥工业大学学报(自然科学版) 学科 工学
关键词 Web文档聚类 语义相似度 聚类算法 最小树
年,卷(期) 2009,(12) 所属期刊栏目 计算机与信息工程
研究方向 页码范围 1846-1850
页数 5页 分类号 TP301.6
字数 4447字 语种 中文
DOI 10.3969/j.issn.1003-5060.2009.12.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王浩 合肥工业大学计算机与信息学院 193 1473 20.0 29.0
2 杨静 合肥工业大学计算机与信息学院 26 163 7.0 11.0
3 李毅 合肥工业大学计算机与信息学院 5 243 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (6)
同被引文献  (25)
二级引证文献  (7)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(4)
  • 引证文献(3)
  • 二级引证文献(1)
2014(2)
  • 引证文献(1)
  • 二级引证文献(1)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Web文档聚类
语义相似度
聚类算法
最小树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
合肥工业大学学报(自然科学版)
月刊
1003-5060
34-1083/N
大16开
合肥市屯溪路193号
26-61
1956
chi
出版文献量(篇)
7881
总下载数(次)
18
总被引数(次)
57827
相关基金
安徽省自然科学基金
英文译名:Anhui Provincial Natural Science Foundation
官方网址:http://www.ahinfo.gov.cn/zrkxjj/index.htm
项目类型:安徽省优秀青年科技基金
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导