基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的:从行为规范角度对网页抓爬信息采集行为进行分析,为相关行为提供相应的指导与参照,促进网页抓爬信息采集活动的规范化.方法:通过梳理国内外相关研究论文、报告与行业规范,对网页抓爬信息采集行为的目的、行为主体、采集内容与技术规范、潜在影响等方面进行总结.结果:分析网页抓爬信息采集中存在的问题,从法律法规、伦理道德等层面对网页抓爬行为的规范进行说明,并提出规范相应行为的建议.结论:在当前开放科学的环境下,在积极倡导开放获取与开放数据运动的同时,应通过法律法规、利益相关方和教育宣传等方面规范网页抓爬信息采集行为.
推荐文章
Web网页并行爬行研究
并行爬行
模式
策略
一种新的面向主题的爬行算法
爬行器
主题
面向主题
海外石油项目环境合规性规范体系研究
海外石油项目
环境合规性
规范体系
硬法规范
软法规范
基于维基百科和网页相似度分析的主题爬行策略
维基百科
文本相关性
链接分析
相似度计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向科学数据的网页抓爬行为合规性研究
来源期刊 中华医学图书情报杂志 学科
关键词 网页抓爬 信息采集 行为分析 著作权 转换性使用 伦理规范
年,卷(期) 2021,(3) 所属期刊栏目 专题:开放获取
研究方向 页码范围 38-48
页数 11页 分类号 B82-052
字数 语种 中文
DOI 10.3969/j.issn.1671-3982.2021.03.006
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (256)
参考文献  (18)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1926(1)
  • 参考文献(0)
  • 二级参考文献(1)
1927(1)
  • 参考文献(0)
  • 二级参考文献(1)
1955(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(13)
  • 参考文献(2)
  • 二级参考文献(11)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(6)
  • 参考文献(0)
  • 二级参考文献(6)
2015(9)
  • 参考文献(2)
  • 二级参考文献(7)
2016(13)
  • 参考文献(0)
  • 二级参考文献(13)
2017(7)
  • 参考文献(6)
  • 二级参考文献(1)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(5)
  • 参考文献(0)
  • 二级参考文献(5)
2020(5)
  • 参考文献(0)
  • 二级参考文献(5)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网页抓爬
信息采集
行为分析
著作权
转换性使用
伦理规范
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中华医学图书情报杂志
月刊
1671-3982
11-4745/R
大16开
北京市海淀区西四环中路59号
2-714
1991
chi
出版文献量(篇)
5113
总下载数(次)
5
论文1v1指导