基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在研究传统FTP文件搜索引擎的检索时效性问题的基础上,认为数据采集更新策略是提高其检索结果可访问性的关键影响因素,为此提出了一种有针对性的数据采集更新模型.该模型研究了数据采集更新频率与队列排序两个因子对检索时效性的影响,其中更新频率被设计用于解决在怎样尽可能降低服务器负载压力的前提下保证较高的平均有效下载比率的问题,而队列排序用于解决在一次数据采集更新中怎样确定FTP站点队列采集对象顺序的策略优化.实验结果表明,该策略可以有效地提高检索结果的平均有效链接比率.
推荐文章
搜索引擎技术及其优化策略
搜索引擎
搜索引擎优化
PageRank算法
安全优化
基于数据挖掘的搜索引擎技术
数据挖掘
搜索引擎
用户负反馈
元搜索引擎研究
搜索引擎
信息检索
元搜索引擎
智能化元搜索引擎的调度策略设计
元搜索引擎
调度策略
信息类别
智能化
成员搜索引擎
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文件搜索引擎数据采集策略的优化
来源期刊 计算机工程与设计 学科 工学
关键词 文件传输协议 搜索引擎 时效性 更新频率 队列排序
年,卷(期) 2009,(3) 所属期刊栏目 计算机应用
研究方向 页码范围 703-704,708
页数 3页 分类号 TP393
字数 2969字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡亮 清华大学计算机与信息管理中心 2 10 1.0 2.0
2 袁芳 清华大学计算机与信息管理中心 30 664 12.0 25.0
3 齐芸芸 清华大学计算机与信息管理中心 3 15 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (42)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(7)
  • 参考文献(0)
  • 二级参考文献(7)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(4)
  • 参考文献(2)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文件传输协议
搜索引擎
时效性
更新频率
队列排序
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导