基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文介绍一个Web抓取器的实现。Web抓取器能够根据用户输入的URL和一定的约束条件自动地搜索Web上的超文本文档,建立URL索引,根据该索引有选择的下载Web资源,同时保持了原有的链接关系。本文实现了一种Web遍历过程,并根据遍历结果抓取文档,从而完成对指定URL抓取文本。
推荐文章
一个Web服务器的设计
基于Web 的网络管理
Rabbit 2000TMTCP/IP集成开发工具
Dynamic C语言
CGI
一个Web社区搜索引擎系统
Web社区
搜索引擎
信息获取
ChinalabSearch
一个基于Web的工作流监控器的设计与实现
工作流
监控工具
XML模型
Flash
J2EE
AsyP_Web:一个异步WEB服务器开发工具
异步I/O
WEB服务器框架
生产者
数据流
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一个Web抓取器的实现
来源期刊 微机发展 学科 工学
关键词 Web抓取器 超文本文档 URL
年,卷(期) 2001,(1) 所属期刊栏目 计算机网络
研究方向 页码范围 32-35
页数 4页 分类号 TP393.07
字数 3142字 语种 中文
DOI 10.3969/j.issn.1673-629X.2001.01.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吕强 134 1011 15.0 26.0
2 杨季文 125 1056 16.0 25.0
3 贡正仙 28 152 6.0 11.0
4 郭蕾 9 18 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2001(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2002(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Web抓取器
超文本文档
URL
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
论文1v1指导