基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在开展长白山生态数据智能分析时,需要爬取大量的网络数据,这些数据大概率会出现缺失、重复、异常、噪声等情况,因此需要对爬取到的数据进行必要的清洗的功能.设计了一种爬虫,并实现了数据清洗的功能,实验证明,100万条数据的爬取用时<30 min.
推荐文章
长白山红松林干扰节律研究
释压
早期快速生长
进入林冠时间
干扰强度
长白山旅游发展现状分析及对策研究
长白山
旅游发展
制约因素
模式创新
长白山森林生态系统主要功能的经济价值及恢复措施
长白山
森林生态系统
功能
经济价值
措施
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 长白山生态数据爬取及清洗研究
来源期刊 长春工程学院学报(自然科学版) 学科 工学
关键词 长白山生态数据 爬虫 缺失值 数据清洗
年,卷(期) 2021,(4) 所属期刊栏目 信息技术
研究方向 页码范围 82-86,124
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1009-8984.2021.04.017
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
长白山生态数据
爬虫
缺失值
数据清洗
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
长春工程学院学报(自然科学版)
季刊
1009-8984
22-1323/N
大16开
长春市红旗街2494号
2000
chi
出版文献量(篇)
2446
总下载数(次)
14
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导