基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前标准的搜索引擎能够检索的仅仅是World Wide Web提供的小部分称为可索引的Web信息.大量的Hidden Web信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的.这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中.该文提出了一套检索Hidden Web信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术.系统采用新的基于标记树的对象抽取(Tag-Tree-based Object Extraction)方法自动地从Web页面中抽取Hidden Web信息,然后在此基础上给出了结构化的Hidden Web信息查询算法.文章最后对实验结果进行了讨论.
推荐文章
Web信息抽取技术综述
Web信息抽取
网页噪声
URL聚类
DSE算法
RoadRunner系统
MDR
视觉特征
模板
基于DOM的Web信息抽取
DOM
包装器
抽取规则
信息抽取
基于Web Services数据抽取的研究与实践
Web Services
并行数据抽取
增量数据
服务安全
基于Web Service的数据抽取研究与设计
Web Service数据抽取
抽取线程
数据库
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于标记树对象抽取技术的Hidden Web获取研究
来源期刊 计算机工程与应用 学科 工学
关键词 Hidden Web 信息检索 对象抽取 结构化查询 标记树
年,卷(期) 2002,(23) 所属期刊栏目 博士论坛
研究方向 页码范围 9-12,24
页数 5页 分类号 TP391|TP393
字数 6077字 语种 中文
DOI 10.3321/j.issn:1002-8331.2002.23.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马范援 上海交通大学计算机系 64 1043 18.0 31.0
2 宋晖 上海交通大学计算机系 4 172 4.0 4.0
3 张岭 上海交通大学计算机系 6 274 6.0 6.0
4 叶允明 上海交通大学计算机系 3 164 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (27)
参考文献  (4)
节点文献
引证文献  (52)
同被引文献  (13)
二级引证文献  (155)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(5)
  • 参考文献(3)
  • 二级参考文献(2)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2004(2)
  • 引证文献(2)
  • 二级引证文献(0)
2005(5)
  • 引证文献(2)
  • 二级引证文献(3)
2006(4)
  • 引证文献(1)
  • 二级引证文献(3)
2007(13)
  • 引证文献(8)
  • 二级引证文献(5)
2008(18)
  • 引证文献(11)
  • 二级引证文献(7)
2009(16)
  • 引证文献(8)
  • 二级引证文献(8)
2010(20)
  • 引证文献(7)
  • 二级引证文献(13)
2011(18)
  • 引证文献(3)
  • 二级引证文献(15)
2012(20)
  • 引证文献(7)
  • 二级引证文献(13)
2013(15)
  • 引证文献(1)
  • 二级引证文献(14)
2014(12)
  • 引证文献(0)
  • 二级引证文献(12)
2015(17)
  • 引证文献(1)
  • 二级引证文献(16)
2016(14)
  • 引证文献(0)
  • 二级引证文献(14)
2017(13)
  • 引证文献(0)
  • 二级引证文献(13)
2018(7)
  • 引证文献(0)
  • 二级引证文献(7)
2019(9)
  • 引证文献(1)
  • 二级引证文献(8)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
Hidden Web 信息检索 对象抽取 结构化查询 标记树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导