原文服务方: 微电子学与计算机       
摘要:
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径,Deep Web爬虫是Deep Web数据源集成的关键组成部分,提出一种针对结构化Deep Web的聚焦爬虫爬行策略,通过对查询接口的特征分析来判断Deep Web数据源的主题相关性,同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息,实验证明该方法是有效的.
推荐文章
一种Deep Web爬虫爬行策略
Deep Web页面
反馈机制
爬行策略
聚焦爬虫
网络数据库
分类器
基于最优查询的多领域deep Web爬虫
deep Web
deep Web爬虫
最优查询
页面聚类
一种新的网络爬虫带宽控制策略
网络爬虫
限定带宽
礼貌爬行
一种Deep Web数据源质量评估模型
DeepWeb
Web数据库
Web服务器
质量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种Deep Web聚焦爬虫爬行策略
来源期刊 微电子学与计算机 学科
关键词 结构化Deep Web数据源 聚焦爬虫 决策树分类器
年,卷(期) 2009,(8) 所属期刊栏目
研究方向 页码范围 117-120
页数 4页 分类号 TP311
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔志明 苏州大学智能信息处理及应用研究所 169 2304 25.0 38.0
3 赵朋朋 苏州大学智能信息处理及应用研究所 39 426 11.0 19.0
9 蔡欣宝 苏州大学智能信息处理及应用研究所 6 42 3.0 6.0
10 陈洪平 苏州大学智能信息处理及应用研究所 3 6 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (10)
参考文献  (2)
节点文献
引证文献  (6)
同被引文献  (2)
二级引证文献  (9)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
结构化Deep Web数据源
聚焦爬虫
决策树分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导