基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了对WEB上不规则的、动态的信息按照数据库的方式集成和查询,采用对象交换模型(object exchange model,简称OEM)建立了WEB信息模型.为了将页面中各个部分表示为对应的OEM对象,设计了半结构化信息的抽取算法,并给出测试结果.该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强.
推荐文章
WEB文档信息抽取方法研究
信息抽取
web
db2
SQL/XML
基于约束的半结构化信息的抽取方法
数据抽取格式
OEM模型
数据抽取格式约束
Web页面中结构化数据抽取的实现与应用
Web页面
结构化数据抽取
实现
应用
Web信息抽取中基于神经网络的规则学习方法
Web信息抽取
包装器
神经网络
规则抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 从WEB文档中构造半结构化信息的抽取器
来源期刊 软件学报 学科 工学
关键词 启发式规则 数据抽取格式 对象交换模型
年,卷(期) 2000,(1) 所属期刊栏目
研究方向 页码范围 73-78
页数 6页 分类号 TP311
字数 4080字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张福炎 南京大学多媒体计算机研究所 111 3898 30.0 61.0
2 黄豫清 南京大学多媒体计算机研究所 2 155 2.0 2.0
3 戚广志 南京大学多媒体计算机研究所 1 149 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (149)
同被引文献  (80)
二级引证文献  (678)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2000(2)
  • 引证文献(2)
  • 二级引证文献(0)
2001(12)
  • 引证文献(10)
  • 二级引证文献(2)
2002(10)
  • 引证文献(8)
  • 二级引证文献(2)
2003(22)
  • 引证文献(13)
  • 二级引证文献(9)
2004(46)
  • 引证文献(19)
  • 二级引证文献(27)
2005(58)
  • 引证文献(17)
  • 二级引证文献(41)
2006(76)
  • 引证文献(10)
  • 二级引证文献(66)
2007(101)
  • 引证文献(16)
  • 二级引证文献(85)
2008(79)
  • 引证文献(7)
  • 二级引证文献(72)
2009(84)
  • 引证文献(12)
  • 二级引证文献(72)
2010(60)
  • 引证文献(8)
  • 二级引证文献(52)
2011(51)
  • 引证文献(8)
  • 二级引证文献(43)
2012(40)
  • 引证文献(5)
  • 二级引证文献(35)
2013(43)
  • 引证文献(7)
  • 二级引证文献(36)
2014(36)
  • 引证文献(1)
  • 二级引证文献(35)
2015(33)
  • 引证文献(0)
  • 二级引证文献(33)
2016(22)
  • 引证文献(2)
  • 二级引证文献(20)
2017(22)
  • 引证文献(0)
  • 二级引证文献(22)
2018(11)
  • 引证文献(2)
  • 二级引证文献(9)
2019(14)
  • 引证文献(2)
  • 二级引证文献(12)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
启发式规则
数据抽取格式
对象交换模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
论文1v1指导