基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大数据、云计算、移动互联网等新兴信息技术地快速兴起,人们工作生活对互联网的依赖逐步加强,越来越多用户行为数据、发表意见评论数据分散在互联网上.如何有效地采集这些数据,是分析、挖掘数据的前提.传统爬虫方式通常是从一个节点开始,盲目地、发散式地扩张遍历网页来获取数据,这种方式一方面近年来受到反爬虫技术的限制,另一方面获取数据的效率和质量偏低.在深入研究天猫平台网站结构的基础上,采用自动化测试技术模拟人浏览网页的方式,结合电商平台的搜索引擎有效地避开反爬虫技术地限制,采集到的数据准确率达到96%以上,能够满足实际科研、工业中数据采集分析的要求.
推荐文章
软件结构测试自动化关键技术研究
结构测试
白盒
静态测试
代码插装
测试用例
基于Jenkins的移动通信业务自动化测试平台的设计与测试
Jenkins
移动通信
通信业务
自动化测试平台
智能移动终端软件自动化测试平台研究
软件测试
自动化测试
脚本技术
移动终端
基于硬件在环的EMS自动化测试研究与应用
硬件在环
发动机控制模块
自动化测试
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自动化测试的反爬虫技术研究——以天猫平台为例
来源期刊 现代计算机 学科
关键词 反爬虫 自动化测试 评论 Selenium
年,卷(期) 2018,(11) 所属期刊栏目 实践与经验
研究方向 页码范围 64-67
页数 4页 分类号
字数 3446字 语种 中文
DOI 10.3969/j.issn.1007-1423.2018.11.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张科静 东华大学旭日工商管理学院 26 223 8.0 14.0
2 曹文斌 东华大学旭日工商管理学院 3 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (28)
共引文献  (75)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
反爬虫
自动化测试
评论
Selenium
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代计算机
旬刊
1007-1423
44-1415/TP
16开
广东省广州市
46-121
1984
chi
出版文献量(篇)
11312
总下载数(次)
39
总被引数(次)
33178
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导