基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在分析、评价常用主题搜索ROBOT爬行策略的基础上,将三重过滤技术与改进的Shark启发式搜索算法相结合,设计了自动主题搜索引擎ROBOT的综合爬行策略.由于综合爬行策略在爬行中兼顾了网页的相关性、主题精度和网页质量,因此应用综合爬行策略在Web上下载主题相关网页时,既可利用链接分析扩大某个主题的资源覆盖度,又可保证搜索结果与主题高度相关.
推荐文章
基于信息增益的自适应主题爬行策略
主题爬行
维基百科
主题描述
自适应方法
信息增益
基于维基百科和网页相似度分析的主题爬行策略
维基百科
文本相关性
链接分析
相似度计算
一种新的主题爬行算法
主题爬行
Web分析
超链分析
搜索引擎
基于链接和内容的BLCT主题爬行算法研究
垂直搜索引擎
PageRank算法
主题爬行
链接相似度
内容相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 主题搜索ROBOT综合爬行策略的研究
来源期刊 武汉理工大学学报 学科 工学
关键词 主题搜索引擎 网络爬虫 综合爬行策略
年,卷(期) 2006,(2) 所属期刊栏目 计算机与信息
研究方向 页码范围 74-76
页数 3页 分类号 TP311
字数 2937字 语种 中文
DOI 10.3321/j.issn:1671-4431.2006.02.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 涂军 湖北工业大学计算机学院 8 53 3.0 7.0
2 吴安清 湖北工业大学计算机学院 7 46 3.0 6.0
3 张颖江 湖北工业大学计算机学院 45 285 9.0 14.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (135)
参考文献  (4)
节点文献
引证文献  (22)
同被引文献  (8)
二级引证文献  (87)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(2)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(4)
  • 引证文献(4)
  • 二级引证文献(0)
2008(7)
  • 引证文献(5)
  • 二级引证文献(2)
2009(11)
  • 引证文献(2)
  • 二级引证文献(9)
2010(12)
  • 引证文献(3)
  • 二级引证文献(9)
2011(16)
  • 引证文献(6)
  • 二级引证文献(10)
2012(14)
  • 引证文献(2)
  • 二级引证文献(12)
2013(12)
  • 引证文献(0)
  • 二级引证文献(12)
2014(5)
  • 引证文献(0)
  • 二级引证文献(5)
2015(12)
  • 引证文献(0)
  • 二级引证文献(12)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2017(6)
  • 引证文献(0)
  • 二级引证文献(6)
2018(4)
  • 引证文献(0)
  • 二级引证文献(4)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
主题搜索引擎
网络爬虫
综合爬行策略
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
武汉理工大学学报
月刊
1671-4431
42-1657/N
大16开
武昌珞狮路122号武汉理工大学(西院)
38-41
1979
chi
出版文献量(篇)
8296
总下载数(次)
17
相关基金
湖北省自然科学基金
英文译名:Natural Science Foundation of Hubei Province
官方网址:http://www.shiyanhospital.com/my/art/viewarticle.asp?id=79
项目类型:重点项目
学科类型:
论文1v1指导