基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对集中式搜索引擎的瓶颈问题,提出一种既具有集中式搜索引擎优点又解决了其瓶颈问题的分布协作式搜索引擎系统.系统的设计思想是使地理上分散在不同地方的搜索引擎在信息收集与更新上进行协作.讨论了信息收集程序(Crawler)的3种工作方式:封闭式、交叉式和交换式.提出了成组传送和复制热门URL两种方法来降低在交换式工作方式下传送的URL信息频率和信息量.讨论了Web的3种划分方法:URL散列法、站点散列法和分类法.通过模拟实验验证了在封闭式工作方式下当Crawler数量较少时可以得到较好的收集率.验证了站点散列法比URL散列法能显著减少外部链接的数量.验证了成组传送对降低在交换式工作方式下传送URL信息量所起的作用.
推荐文章
元搜索引擎研究
搜索引擎
信息检索
元搜索引擎
基于Intranet的搜索引擎
Intranet
搜索引擎
Robot
搜索引擎系统的研究与实现
搜索引擎
信息采集
信息检索
基于Hadoop的海运业分布式搜索引擎的应用研究
海运业
Hadoop
Map/Reduce
分布式文件系统
搜索引擎
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布协作式搜索引擎系统的初步探索
来源期刊 抚顺石油学院学报 学科 工学
关键词 分布协作式 搜索引擎 信息收集
年,卷(期) 2003,(4) 所属期刊栏目 计算机与自动化
研究方向 页码范围 57-60
页数 4页 分类号 TP393
字数 2571字 语种 中文
DOI 10.3969/j.issn.1672-6952.2003.04.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵新慧 辽宁石油化工大学信息工程学院 18 45 3.0 5.0
2 朱伟 辽宁石油化工大学信息工程学院 17 70 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (19)
参考文献  (4)
节点文献
引证文献  (3)
同被引文献  (5)
二级引证文献  (22)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(3)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(3)
  • 引证文献(2)
  • 二级引证文献(1)
2007(2)
  • 引证文献(0)
  • 二级引证文献(2)
2008(4)
  • 引证文献(0)
  • 二级引证文献(4)
2009(2)
  • 引证文献(0)
  • 二级引证文献(2)
2010(4)
  • 引证文献(0)
  • 二级引证文献(4)
2011(2)
  • 引证文献(1)
  • 二级引证文献(1)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(2)
  • 引证文献(0)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(3)
  • 引证文献(0)
  • 二级引证文献(3)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
分布协作式
搜索引擎
信息收集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
辽宁石油化工大学学报
双月刊
1672-6952
21-1504/TE
大16开
辽宁省抚顺市望花区丹东路西段1号
8-257
1981
chi
出版文献量(篇)
2263
总下载数(次)
3
总被引数(次)
12790
论文1v1指导