基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络爬虫是搜索引擎的重要组成部分,其性能直接影响搜索引擎的准确性和及时性。Larbin是一个高效、简单、功能比较完善的开源爬虫框架,基于此,介绍了几种典型的开源爬虫框架,并对其进行多维度比较;对Larbin体系结构进行详细的介绍;然后指出Larbin在程序结构和流程方面存在的不足,提出对应的优化方案;测试结果表明,改进后的方案在速度和性能方面都有所提高。
推荐文章
软件体系结构的研究
软件体系结构
软件开发过程
重用
构件
软件体系结构失配研究
体系结构失配
面向方面编程
体系结构描述语言
多层客户/服务器体系结构下索引优化的研究
索引优化
客户/服务器
数据查询
联机事务处理
特定领域软件体系结构研究
特定领域
软件
体系结构
域分析
动态域
模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Larbin体系结构的研究与优化
来源期刊 网络与信息安全学报 学科 工学
关键词 搜索引擎 网络爬虫 Larbin 开源 优化
年,卷(期) 2016,(8) 所属期刊栏目 学术论文
研究方向 页码范围 74-80
页数 7页 分类号 TP393
字数 3879字 语种 中文
DOI 10.11959/j.issn.2096-109x.2016.00076
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李莉 北京电子科技学院信息安全系 54 135 5.0 9.0
3 史国振 北京电子科技学院信息安全系 46 444 7.0 20.0
4 慈云飞 北京电子科技学院信息安全系 6 17 3.0 4.0
7 王璇 北京电子科技学院信息安全系 4 5 1.0 2.0
11 霍义霞 北京电子科技学院信息安全系 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (12)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(2)
  • 二级参考文献(1)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
搜索引擎
网络爬虫
Larbin
开源
优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络与信息安全学报
双月刊
2096-109X
10-1366/TP
16开
北京市丰台区成寿路11号邮电出版大厦8层
2015
chi
出版文献量(篇)
525
总下载数(次)
6
总被引数(次)
1380
论文1v1指导