基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
半结构化数据的模式抽取对于半结构化数据查询、优化及异构数据的集成具有重要的意义.结合标签路径及标签路径的目标集概念,提出了基于OEM(Object Exchange Model)模型的半结构化数据最小化模式抽取新方法,并给出了与标签路径目标集、支持度计算相关的两个定理.算法的基本思路:依据文中的两个定理,采用宽度优先自顶向下的遍历策略依次求出各标签路径的最后一个标签的目标集及支持度,标签支持度大的目标集优先映射为对应的模式节点.对同一半结构数据实例,算法抽取的模式与其他算法得到的模式相比规模小、算法执行时间短.算法适用于层次型及包含环路的OEM半结构化数据模式抽取.
推荐文章
半结构化数据OEM图应用
对象交换模型(OEM)
TSL
查询重写
算法
半结构化数据
基于证券行业半结构化数据的抽取技术
数据抽取
半结构化
数据挖掘
证券投资
半结构化数据的模式发现
半结构化数据
知识发现
模式发现
数据模型
信息抽取
基于OEM模型的半结构化数据的模式发现
半结构化层次数据
OEM模型
分层事务数据库
SHDP-tre结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 半结构化数据的最小化模式发现
来源期刊 计算机应用与软件 学科 工学
关键词 半结构化数据 模式抽取 OEM模型 标签路径 标签路径的支持度 标签路径的目标集
年,卷(期) 2009,(4) 所属期刊栏目 基金项目论文
研究方向 页码范围 51-54
页数 4页 分类号 TP3
字数 4416字 语种 中文
DOI 10.3969/j.issn.1000-386X.2009.04.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 沈轶 华中科技大学控制科学与工程系 75 730 14.0 23.0
2 李久仲 广东轻工职业技术学院计算机系 16 39 3.0 5.0
3 石硕 广东轻工职业技术学院计算机系 14 26 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (98)
参考文献  (7)
节点文献
引证文献  (4)
同被引文献  (2)
二级引证文献  (1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(7)
  • 参考文献(4)
  • 二级参考文献(3)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
半结构化数据
模式抽取
OEM模型
标签路径
标签路径的支持度
标签路径的目标集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导