基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度.
推荐文章
一种快速有效的Web文档聚类方法
Web挖掘
文档聚类
矢量空间模型VSM
关联规则
一种基于关系的XML文档模型映射方法
关系数据库
模型映射
XML数据模型
文档重组
查询效率
一种基于路径的划分聚类算法
划分聚类
距离度量
目标准则函数
一种基于扩展XQuery的XML文档更新方法
XML查询语言
XML更新操作
XQuery
XML Schema
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 PBC:一种基于路径的XML文档聚类方法
来源期刊 应用科学学报 学科 工学
关键词 XML 信息检索 文档聚类
年,卷(期) 2005,(4) 所属期刊栏目
研究方向 页码范围 399-403
页数 5页 分类号 TP311
字数 3441字 语种 中文
DOI 10.3969/j.issn.0255-8297.2005.04.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 董逸生 东南大学计算机科学与工程系 118 3003 29.0 49.0
2 业宁 东南大学计算机科学与工程系 14 296 9.0 14.0
3 梁作鹏 东南大学计算机科学与工程系 8 215 7.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (8)
同被引文献  (6)
二级引证文献  (9)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(3)
  • 引证文献(3)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(4)
  • 引证文献(1)
  • 二级引证文献(3)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
XML
信息检索
文档聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
应用科学学报
双月刊
0255-8297
31-1404/N
大16开
上海市上大路99号123信箱
1983
chi
出版文献量(篇)
2210
总下载数(次)
5
总被引数(次)
16489
论文1v1指导