基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文献计量学是一种把握学科发展态势的定量分析方法.传统基于文献计量学的研究步骤需手动操作且流程繁琐,针对这一问题,设计并实现了一种基于scrapy-redis分布式爬虫的学科发展态势分析系统.该系统包含了1.负责爬取并解析web of science文献数据的数据预处理层.解决了由于网速不稳定造成的爬虫丢失网页问题,保障数据完整性.设计了一种动态计算参考文献所属学科分布情况的算法2.基于Django搭建的结果展示层,通过web服务向用户展示学科态势分析结果.用户只需输入初始待爬取页面的URL即可通过web服务获得学科态势分析结果.该系统为文献计量学提供了一种更便捷、更快速、扩展性高的分析手段.
推荐文章
一种分布式编译系统的设计与实现
分布式编译
集群
MSBuild
一种基于Web Service的分布式应用系统的设计
分布式应用系统
组件
WebService
Web应用
一种协同的分布式本体管理系统设计与实现
本体管理系统
协同
分布式
非结构化信息
一种分布式入侵检测系统的设计
分布式入侵检测
误用检测
异常检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种分布式爬虫系统的设计与应用
来源期刊 科研信息化技术与应用 学科
关键词 scrapy-redis 分布式爬虫 文献计量学 学科发展态势 Django
年,卷(期) 2019,(1) 所属期刊栏目 应用
研究方向 页码范围 79-87
页数 9页 分类号
字数 4684字 语种 中文
DOI 10.11871/j.issn.1674-9480.2019.01.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李新 中国科学院计算机网络信息中心 222 7440 44.0 79.0
2 陈远平 中国科学院计算机网络信息中心 11 40 4.0 6.0
3 周逸 中国科学院计算机网络信息中心 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (76)
共引文献  (326)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1926(1)
  • 参考文献(0)
  • 二级参考文献(1)
1927(1)
  • 参考文献(0)
  • 二级参考文献(1)
1955(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(3)
  • 参考文献(0)
  • 二级参考文献(3)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(9)
  • 参考文献(0)
  • 二级参考文献(9)
2015(5)
  • 参考文献(1)
  • 二级参考文献(4)
2016(7)
  • 参考文献(0)
  • 二级参考文献(7)
2017(4)
  • 参考文献(2)
  • 二级参考文献(2)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
scrapy-redis
分布式爬虫
文献计量学
学科发展态势
Django
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科研信息化技术与应用
双月刊
1674-9480
11-5943/TP
北京市海淀区中关村南四街4号
chi
出版文献量(篇)
501
总下载数(次)
5
总被引数(次)
1249
论文1v1指导