基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络资源信息的爆炸式增长、用户越来越个性化的需求,使得针对特定主题的搜索引擎越来越受到青睐.聚焦网络爬虫是主题搜索引擎的重要组成部分,它从Web上下栽针对某一主题的文档.可定制的聚焦网络爬虫是具有主题的可选择性、可定制性的主题爬虫.文中介绍了一套更加有效的爬虫算法,它具有高效(优先下栽主题相关度高的资源)、资源占用少(减少URL队列长度)、主题易移植(主题的可定制性)等特点.
推荐文章
面向P2P搜索的可定制聚焦网络爬虫
P2P搜索
聚焦网络爬虫
链接导航
增量更新
批量更新
基于量子行为进化算法的聚焦爬虫搜索策略
聚焦爬虫
主题相关度
立即价值
未来价值
量子进化算法
一种Deep Web聚焦爬虫爬行策略
结构化Deep Web数据源
聚焦爬虫
决策树分类器
基于WebKit的网络爬虫
网络爬虫
浏览器引擎
WebKit
JavaScript
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 可定制的聚焦网络爬虫
来源期刊 电子科技 学科 工学
关键词 信息收集 搜索引擎 网络爬虫
年,卷(期) 2009,(1) 所属期刊栏目 协议·算法及仿真
研究方向 页码范围 47-50
页数 4页 分类号 TP274+.2
字数 3165字 语种 中文
DOI 10.3969/j.issn.1007-7820.2009.01.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙莉 东华大学计算机科学与技术学院 56 452 12.0 17.0
2 邹海亮 东华大学计算机科学与技术学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (6)
参考文献  (1)
节点文献
引证文献  (7)
同被引文献  (14)
二级引证文献  (30)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(6)
  • 引证文献(2)
  • 二级引证文献(4)
2013(7)
  • 引证文献(1)
  • 二级引证文献(6)
2014(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(5)
  • 引证文献(0)
  • 二级引证文献(5)
2016(7)
  • 引证文献(2)
  • 二级引证文献(5)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(3)
  • 引证文献(0)
  • 二级引证文献(3)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
信息收集
搜索引擎
网络爬虫
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子科技
月刊
1007-7820
61-1291/TN
大16开
西安电子科技大学
1987
chi
出版文献量(篇)
9344
总下载数(次)
32
总被引数(次)
31437
论文1v1指导