原文服务方: 微电子学与计算机       
摘要:
实现大规模Deep Web数据源集成是方便用户使用Deep Web信息的一种有效途径,Deep Web爬虫是Deep Web数据源集成的关键组成部分,提出一种针对结构化Deep Web的聚焦爬虫爬行策略,通过对查询接口的特征分析来判断Deep Web数据源的主题相关性,同时,在评价链接重要性时,综合考虑了页面内容的主题相关性和链接的相关信息,实验证明该方法是有效的.
推荐文章
一种Deep Web爬虫爬行策略
Deep Web页面
反馈机制
爬行策略
聚焦爬虫
网络数据库
分类器
基于关键词相关度的Deep Web爬虫爬行策略
Deep Web页面
爬行策略
关键词选择
相关度权重
覆盖率
Deep Web数据源聚焦爬虫
Deep Web数据源
聚焦爬虫
贝叶斯分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种Deep Web聚焦爬虫爬行策略
来源期刊 微电子学与计算机 学科
关键词 结构化Deep Web数据源 聚焦爬虫 决策树分类器
年,卷(期) 2009,(8) 所属期刊栏目
研究方向 页码范围 117-120
页数 4页 分类号 TP311
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 崔志明 苏州大学智能信息处理及应用研究所 169 2304 25.0 38.0
3 赵朋朋 苏州大学智能信息处理及应用研究所 39 426 11.0 19.0
9 蔡欣宝 苏州大学智能信息处理及应用研究所 6 42 3.0 6.0
10 陈洪平 苏州大学智能信息处理及应用研究所 3 6 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (10)
参考文献  (2)
节点文献
引证文献  (6)
同被引文献  (2)
二级引证文献  (9)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(3)
  • 引证文献(1)
  • 二级引证文献(2)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
结构化Deep Web数据源
聚焦爬虫
决策树分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
总被引数(次)
59060
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导