基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文主要研究了WEB搜索引擎中的数据采集技术和WEB搜索引擎数据采集机器人的关键技术和设计时应考虑的问题及相应的解决方法,并结合专题型搜索引擎的特点提出了一些搜索引擎的数据采集策略.
推荐文章
基于WWW的图像搜索引擎
图像检索
搜索引擎
CBIR
关键字
一种WWW搜索引擎的设计与实现
搜索引擎
网页
索引
关键词
专题搜索引擎的构建
专题搜索引擎
元搜索
关键词
搜索引擎及其性能改进方法研究
搜索引擎
日志分析
目录式
位置相关性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 WWW搜索引擎的数据采集技术
来源期刊 计算机工程与应用 学科 工学
关键词 搜索引擎 数据采集 Web Robot
年,卷(期) 2002,(7) 所属期刊栏目 网络、通信与安全
研究方向 页码范围 145-147,161
页数 4页 分类号 TP393
字数 3222字 语种 中文
DOI 10.3321/j.issn:1002-8331.2002.07.050
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张世永 复旦大学网络与信息工程中心 130 2402 24.0 46.0
2 吴杰 复旦大学网络与信息工程中心 49 624 12.0 24.0
3 钟涛 复旦大学网络与信息工程中心 7 162 5.0 7.0
4 万钧 复旦大学网络与信息工程中心 6 135 3.0 6.0
5 陈新明 复旦大学网络与信息工程中心 3 153 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (51)
同被引文献  (21)
二级引证文献  (80)
2002(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2003(5)
  • 引证文献(5)
  • 二级引证文献(0)
2004(8)
  • 引证文献(8)
  • 二级引证文献(0)
2005(9)
  • 引证文献(2)
  • 二级引证文献(7)
2006(14)
  • 引证文献(10)
  • 二级引证文献(4)
2007(23)
  • 引证文献(7)
  • 二级引证文献(16)
2008(9)
  • 引证文献(3)
  • 二级引证文献(6)
2009(16)
  • 引证文献(4)
  • 二级引证文献(12)
2010(10)
  • 引证文献(2)
  • 二级引证文献(8)
2011(6)
  • 引证文献(1)
  • 二级引证文献(5)
2012(8)
  • 引证文献(2)
  • 二级引证文献(6)
2013(7)
  • 引证文献(3)
  • 二级引证文献(4)
2014(4)
  • 引证文献(1)
  • 二级引证文献(3)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
搜索引擎 数据采集 Web Robot
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导