原文服务方: 计算机应用研究       
摘要:
Deep Web信息通过在网页搜索接口提交查询词获得.通用搜索引擎使用超链接爬取网页,无法索引deep Web数据.为解决此问题,介绍一种基于最优查询的deep Web爬虫,通过从聚类网页中生成最优查询,自动提交查询,最后索引查询结果.实验表明系统能自动、高效地完成多领域deep Web数据爬取.
推荐文章
面向旅游领域的Deep Web接口查询研究
Deep Web
接口查询
领域实例
一种Deep Web聚焦爬虫爬行策略
结构化Deep Web数据源
聚焦爬虫
决策树分类器
基于领域样本查询的Deep Web数据库分类
Deep Web
Web数据库
数据库分类
简单查询接口
基于演化版本的 Deep Web 查询接口维护方法
Deep Web
查询接口
演化版本
接口维护
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于最优查询的多领域deep Web爬虫
来源期刊 计算机应用研究 学科
关键词 deep Web deep Web爬虫 最优查询 页面聚类
年,卷(期) 2009,(9) 所属期刊栏目 软件技术研究
研究方向 页码范围 3375-3377
页数 3页 分类号 TP393
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2009.09.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林怀忠 浙江大学计算机科学与技术学院 22 317 9.0 17.0
2 冯明远 浙江大学计算机科学与技术学院 1 10 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (10)
同被引文献  (4)
二级引证文献  (2)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
deep Web
deep Web爬虫
最优查询
页面聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导