基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网的快速发展,大数据时代的来临,网络上的数据和信息呈爆炸性增长,网络爬虫技术越来越受欢迎.本文通过以抓取二手房出售数据为例,探索R语言爬虫技术的网页信息抓取方法,发现基于R语言的rvest函数包与SelectorGadget工具实现的网页信息爬取方法比传统方法更加简单快捷.
推荐文章
我国新房、二手房互动信息传递研究
新房价格指数
二手房价格指数
VAR模型
EGARCH模型
基于多元线性回归的合肥市二手房房价影响因素研究
二手房
单位面积房价
多元线性回归
买二手房要小心中介的陷阱
中介
陷阱
房屋产权
北京东城区
公司介绍
合同关系
供暖费
过户
基于多阶段博弈模型的二手房市场逆向选择研究
二手房市场
房产中介
逆向选择
博弈分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于R语言爬虫技术的网页信息抓取方法研究——以抓取二手房数据为例
来源期刊 科技风 学科
关键词 R语言 网络爬虫 网页信息抓取 二手房
年,卷(期) 2019,(6) 所属期刊栏目 电子信息
研究方向 页码范围 54,56
页数 2页 分类号
字数 2696字 语种 中文
DOI 10.19392/j.cnki.1671-7341.201906047
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 庄旭东 广东财经大学统计与数学学院 6 8 2.0 2.0
5 王志坚 广东财经大学统计与数学学院 19 37 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (109)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
R语言
网络爬虫
网页信息抓取
二手房
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技风
旬刊
1671-7341
13-1322/N
16开
河北省石家庄市
1988
chi
出版文献量(篇)
77375
总下载数(次)
264
论文1v1指导