基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着大数据、云计算、移动互联网等新兴信息技术地快速兴起,人们工作生活对互联网的依赖逐步加强,越来越多用户行为数据、发表意见评论数据分散在互联网上。如何有效地采集这些数据,是分析、挖掘数据的前提。传统爬虫方式通常是从一个节点开始,盲目地、发散式地扩张遍历网页来获取数据,这种方式一方面近年来受到反爬虫技术的限制,另一方面获取数据的效率和质量偏低。在深入研究天猫平台网站结构的基础上,采用自动化测试技术模拟人浏览网页的方式,结合电商平台的搜索引擎有效地避开反爬虫技术地限制,采集到的数据准确率达到96%以上,能够满足实际科研、工业中数据采集分析的要求。
推荐文章
基于Python语言的GUI自动化测试脚本技术研究
测试脚本
图像用户界面
自动化测试
脚本生成
Python语言
Android应用并行自动化测试技术研究与实现
Android
并行
自动化
Appium
TestNG
软件结构测试自动化关键技术研究
结构测试
白盒
静态测试
代码插装
测试用例
嵌入式软件GUI自动化测试平台研究
嵌入式
图形用户界面
自动化测试
脚本
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自动化测试的反爬虫技术研究——以天猫平台为例
来源期刊 现代计算机:中旬刊 学科 工学
关键词 反爬虫 自动化测试 评论 SELENIUM
年,卷(期) 2018,(4) 所属期刊栏目
研究方向 页码范围 64-67
页数 4页 分类号 TP274.5
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张科静 东华大学旭日工商管理学院 26 223 8.0 14.0
2 曹文斌 东华大学旭日工商管理学院 3 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
反爬虫
自动化测试
评论
SELENIUM
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代计算机:中旬刊
月刊
1007-1423
44-1415/TP
广州市海珠区新港西路135号中山大学园B
46-205
出版文献量(篇)
9067
总下载数(次)
3
论文1v1指导