基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.
推荐文章
半结构化数据OEM图应用
对象交换模型(OEM)
TSL
查询重写
算法
半结构化数据
基于证券行业半结构化数据的抽取技术
数据抽取
半结构化
数据挖掘
证券投资
结构化数据的隐私与数据效用度量模型
隐私保护
隐私度量
度量空间
隐私量
数据效用
一种基于权重矩阵的协同过滤算法的相似度度量方法
协同过滤算法
相似度度量
权重矩阵
参数融合
权重计算
仿真实验
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于标签序列的半结构化数据相似度度量
来源期刊 华中科技大学学报:自然科学版 学科 工学
关键词 数据挖掘 数据管理 半结构化数据 结构相似度 频繁关联标签序列
年,卷(期) 2012,(8) 所属期刊栏目 计算机与控制工程
研究方向 页码范围 77-81
页数 分类号 TP311
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李战怀 西北工业大学计算机学院 254 2139 21.0 35.0
2 李霞 西北工业大学计算机学院 19 99 6.0 9.0
3 张利军 西北工业大学计算机学院 28 317 11.0 17.0
4 李宁 西北工业大学计算机学院 46 504 9.0 21.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (5)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
数据管理
半结构化数据
结构相似度
频繁关联标签序列
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华中科技大学学报(自然科学版)
月刊
1671-4512
42-1658/N
大16开
武汉市珞喻路1037号
38-9
1973
chi
出版文献量(篇)
9146
总下载数(次)
26
总被引数(次)
88536
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导