基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
XML文档聚类是高效管理XML文档的重要手段,XML文档相似度计算正是其中的关键步骤。 pq-gram算法是解决XML文档相似度计算问题的有效手段,但忽略了XML文档结点的有序性。带权重的pq-gram算法是在此基础上,依据XML文档的结构性,首先为结点赋予相应权重,然后基于结点的权重对pq-gram赋予权重,最后将设定的权重应用到XML文档相似度计算中。实验结果表明,带权重的pq-gram算法更好地描述结点在XML文档相似度计算中的贡献度,提高了XML文档相似度计算的精度。
推荐文章
综合结构和内容的 XML文档相似度计算方法
内容相似度
结构相似度
XML相似度
向量空间模型
路径频率
基于TreeMiner算法的XML文档结构相似度量方法
频繁结构向量模型
嵌入子树
频繁子树
结构挖掘
基于综合语义的XML文档相似度计算方法
可扩展标记语言
相似度计算
构件向量
综合语义
基于路径权重的XML文档相似度仿真研究
相似度
路径权重
查询树
文档树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 用带权重的pq-gram算法计算XML文档相似度
来源期刊 计算机与现代化 学科 工学
关键词 XML文档 计算相似度 pq-gram 权重
年,卷(期) 2015,(3) 所属期刊栏目 算法设计与分析
研究方向 页码范围 20-25
页数 6页 分类号 TP391
字数 5576字 语种 中文
DOI 10.3969/j.issn.1006-2475.2015.03.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜庆伟 南京航空航天大学计算机科学与技术学院 18 105 8.0 9.0
2 孙静 南京航空航天大学计算机科学与技术学院 16 37 3.0 6.0
3 王成勇 南京航空航天大学计算机科学与技术学院 2 0 0.0 0.0
4 孙振 南京航空航天大学计算机科学与技术学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
XML文档
计算相似度
pq-gram
权重
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导