基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
自Jesse James Garrett提出了AJAX概念以来,由于AJAX在提升用户交互体验的同时,又不需要在客户端安装插件.因此,一经提出就引起了互联网领域的广泛关注.但目前的网络爬虫技术在AJAX框架的URL解析过程中存在着不能够识别事件触发顺序等问题,导致大量数据不能被搜索引擎有效检索.本文针对此问题,通过研究基于对象的程序切片算法,以及脚本执行引擎与切片模块的互操作,最终解决AJAX框架中URL提取以及异步JavaScript网络爬虫系统的关键技术问题.
推荐文章
基于WebKit的网络爬虫
网络爬虫
浏览器引擎
WebKit
JavaScript
主题爬虫技术研究综述
网络爬虫
主题爬虫
相似度
网页内容
链接分析
Ajax技术研究与应用
Ajax
XMLHttpRequest
Javascript
异步交互
扩展超媒体标记语言(XML)
基于协程模型的分布式爬虫框架
协程
分布式
高性能
爬虫
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于JavaScript切片的AJAX框架网络爬虫技术研究
来源期刊 计算机系统应用 学科 工学
关键词 JavaScript 程序切片 网络爬虫 有限状态机 AJAX
年,卷(期) 2009,(7) 所属期刊栏目 应用技术
研究方向 页码范围 169-171,137
页数 4页 分类号 TP3
字数 3343字 语种 中文
DOI 10.3969/j.issn.1003-3254.2009.07.041
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (29)
参考文献  (4)
节点文献
引证文献  (30)
同被引文献  (22)
二级引证文献  (64)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(3)
  • 引证文献(3)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(11)
  • 引证文献(8)
  • 二级引证文献(3)
2014(18)
  • 引证文献(4)
  • 二级引证文献(14)
2015(9)
  • 引证文献(2)
  • 二级引证文献(7)
2016(12)
  • 引证文献(3)
  • 二级引证文献(9)
2017(18)
  • 引证文献(6)
  • 二级引证文献(12)
2018(12)
  • 引证文献(1)
  • 二级引证文献(11)
2019(6)
  • 引证文献(0)
  • 二级引证文献(6)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
JavaScript
程序切片
网络爬虫
有限状态机
AJAX
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导