基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网络中信息量的快速增长使得增量搜集技术成为网上信息获取的一种有效手段,它可以避免因重复搜集未曾变化的网页而带来的时间和资源上的浪费.网页变化规律的发现和利用是增量搜集技术的一个关键.它用来预测网页的下次变化时间甚至变化程度;在此基础上,增量搜集系统还需要考虑网页的变化频率、变化程度和重要性,选择一种最优的任务调度算法来决定不同网页的搜集频率和相对搜集次序.针对网页变化和增量搜集技术这一主题,对最近几年的研究成果作总结,并介绍最新的研究进展.首先论述对网页变化规律的建模、模型参数估计和估计效率等问题;然后介绍几个著名的增量搜集系统,着重分析它们的任务调度算法;最后,从理论上分析和总结增量搜集系统的最佳任务调度算法及其一个基于启发式策略的近似解,并预测其将来的研究趋势.该工作对增量搜集系统的设计和Web演化规律的研究具有参考意义.
推荐文章
专题型网页搜集系统的设计与实现
URL排序
集中式搜集器
多层分类
主题过滤
资料的搜集与处理
资料
搜集
归纳
整理
搜索引擎增量式搜集的实现与评测
增量式搜集
网页变化预测
搜索引擎
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页变化与增量搜集技术
来源期刊 软件学报 学科 工学
关键词 网页变化 增量搜集 调度策略 研究进展
年,卷(期) 2006,(5) 所属期刊栏目 计算机网络与信息安全
研究方向 页码范围 1051-1067
页数 17页 分类号 TP393
字数 14124字 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (63)
参考文献  (29)
节点文献
引证文献  (63)
同被引文献  (32)
二级引证文献  (167)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(3)
  • 参考文献(3)
  • 二级参考文献(0)
1999(6)
  • 参考文献(2)
  • 二级参考文献(4)
2000(4)
  • 参考文献(3)
  • 二级参考文献(1)
2001(3)
  • 参考文献(2)
  • 二级参考文献(1)
2002(5)
  • 参考文献(2)
  • 二级参考文献(3)
2003(4)
  • 参考文献(3)
  • 二级参考文献(1)
2004(9)
  • 参考文献(8)
  • 二级参考文献(1)
2005(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(12)
  • 引证文献(10)
  • 二级引证文献(2)
2008(16)
  • 引证文献(10)
  • 二级引证文献(6)
2009(16)
  • 引证文献(9)
  • 二级引证文献(7)
2010(27)
  • 引证文献(11)
  • 二级引证文献(16)
2011(20)
  • 引证文献(6)
  • 二级引证文献(14)
2012(22)
  • 引证文献(6)
  • 二级引证文献(16)
2013(12)
  • 引证文献(2)
  • 二级引证文献(10)
2014(21)
  • 引证文献(3)
  • 二级引证文献(18)
2015(19)
  • 引证文献(2)
  • 二级引证文献(17)
2016(21)
  • 引证文献(0)
  • 二级引证文献(21)
2017(14)
  • 引证文献(1)
  • 二级引证文献(13)
2018(15)
  • 引证文献(0)
  • 二级引证文献(15)
2019(8)
  • 引证文献(1)
  • 二级引证文献(7)
2020(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
网页变化
增量搜集
调度策略
研究进展
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
论文1v1指导