基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
XML文档作为一种新的数据形式,成为当前的研究热点.XML文档间相似度的计算是XML文档分析、管理及文本挖掘的基础.结构链接向量模型(structuredlink vector model,简称SLVM)是一种综合考虑XML文档结构信息与内容信息进行XML文档相似度量的方法.体现XML文档结构单元关系的核矩阵在结构链接向量模型中扮演着重要角色.为自动捕获XML文档结构单元关系,提出了两种核矩阵的学习算法,分别是基于支持向量机(support vector machine,简称SVM)的回归学习算法和基于矩阵迭代的学习算法.相似搜索实验对比结果表明,基于核矩阵学习方法的XML文档相似度量方法的准确性明显优于其他方法.进一步实验表明,基于矩阵迭代学习的核矩阵学习算法与基于支持向量机的回归学习算法相比,不仅具有更高的准确性,而且所需训练文档更少、计算代价更小.
推荐文章
XML文档相似性度量方法研究
XML文档
相似性
约束
编辑距离
基于TreeMiner算法的XML文档结构相似度量方法
频繁结构向量模型
嵌入子树
频繁子树
结构挖掘
基于矩阵存储的XML相似度检测算法
XML管理
相似度
矩阵存储
分类
XML文档结构相似测度研究
可扩展标记语言
结构相似测度
编辑距离
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于核矩阵学习的XML文档相似度量方法
来源期刊 软件学报 学科 工学
关键词 XML文档 相似度量 核矩阵学习 文本挖掘
年,卷(期) 2006,(5) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 991-1000
页数 10页 分类号 TP181
字数 6132字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨建武 北京大学计算机研究所 17 449 12.0 17.0
5 陈晓鸥 北京大学计算机研究所 16 718 12.0 16.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (8)
参考文献  (3)
节点文献
引证文献  (26)
同被引文献  (19)
二级引证文献  (47)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(3)
  • 引证文献(3)
  • 二级引证文献(0)
2008(8)
  • 引证文献(7)
  • 二级引证文献(1)
2009(6)
  • 引证文献(3)
  • 二级引证文献(3)
2010(9)
  • 引证文献(3)
  • 二级引证文献(6)
2011(11)
  • 引证文献(3)
  • 二级引证文献(8)
2012(10)
  • 引证文献(3)
  • 二级引证文献(7)
2013(7)
  • 引证文献(0)
  • 二级引证文献(7)
2014(5)
  • 引证文献(2)
  • 二级引证文献(3)
2015(6)
  • 引证文献(0)
  • 二级引证文献(6)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
XML文档
相似度量
核矩阵学习
文本挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
论文1v1指导