基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
应用IoC和策略模式设计Spider,将Spider的功能模块抽象为解析器、匹配器和写入器等5个接口:抽象解析器负责接收由IHtmlGetter传递来的网页,并使用IMatcher解析.抽象写入器将解析结果进行保存,形成数据库或文件.类似ResultSet的行列式数据集,在IParser与IParser间、IParser与IWriter间传递.抽象匹配器可由正则表达式实现.由此减少各部分间的耦合,增强可扩展性.
推荐文章
可扩展Spider负载均衡策略的研究与实现
负载均衡
Spider
网络蜘蛛
分布式
面向地学信息领域垂直搜索引擎设计与实现
地学信息领域
垂直搜索引擎
Nutch
中文分词
页面排序
主题词管理
基于Hadoop的搜索引擎用户行为分析
Hadoop
分布式计算
用户行为分析
海量数据
一种分布协作式WWW搜索引擎模型
分布协作式
搜索引擎
信息收集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 搜索引擎中Spider的可扩展性设计
来源期刊 兵工自动化 学科 工学
关键词 Spider Spring IoC
年,卷(期) 2008,(2) 所属期刊栏目 软件开发与应用
研究方向 页码范围 92-93
页数 2页 分类号 TP311.52
字数 944字 语种 中文
DOI 10.3969/j.issn.1006-1576.2008.02.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张浩 九江学院信息技术中心 29 51 3.0 4.0
2 刘红军 九江学院信息技术中心 4 16 3.0 4.0
3 汪庆华 九江市人民政府信息化工作办公室 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spider
Spring
IoC
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
兵工自动化
月刊
1006-1576
51-1419/TP
大16开
四川省绵阳市207信箱
1982
chi
出版文献量(篇)
6566
总下载数(次)
20
总被引数(次)
28636
论文1v1指导