基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为提高搜索引擎文档索引库有效性验证的效率,本文提出了一种综合考虑网页更新频度、用户兴趣度及其内容重要程度诸因素相结合以确定文档索引库更新队列的算法.算法将用户的检索率、点击率、网页的Page Rank值和更新频度作为一个特征向量,与不同种类的网页的特征权值组成的矩阵相乘,求得网页的类型向量,依据类型向量实现对文档索引库更新队列的优化,算法改进了统一更新策略周期长、单一更新策略可能产生改变频繁而非常重要的网站长期又得不到更新的问题.
推荐文章
一种快速有效的Web文档聚类方法
Web挖掘
文档聚类
矢量空间模型VSM
关联规则
一种基于公路网络的高效更新索引结构
时空数据
索引结构
公路网络
缓冲更新
一种基于扩展XQuery的XML文档更新方法
XML查询语言
XML更新操作
XQuery
XML Schema
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于RPUC的Web文档索引库的更新算法
来源期刊 计算机科学 学科
关键词 搜索引擎,索引数据库,检索率,Page Rank,更新频度,点击率
年,卷(期) 2004,(8) 所属期刊栏目 计算机网络与信息技术
研究方向 页码范围 95-96,200
页数 3页 分类号
字数 3326字 语种 中文
DOI 10.3969/j.issn.1002-137X.2004.08.029
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 余建桥 西南农业大学信息学院 24 225 9.0 14.0
2 李航 西南农业大学信息学院 11 164 7.0 11.0
3 熊海灵 西南农业大学信息学院 6 86 4.0 6.0
4 伍胜 西南农业大学信息学院 3 20 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (95)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (3)
二级引证文献  (21)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1998(6)
  • 参考文献(0)
  • 二级参考文献(6)
1999(7)
  • 参考文献(0)
  • 二级参考文献(7)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(4)
  • 参考文献(4)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(2)
  • 引证文献(0)
  • 二级引证文献(2)
2012(7)
  • 引证文献(0)
  • 二级引证文献(7)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2014(3)
  • 引证文献(0)
  • 二级引证文献(3)
2015(4)
  • 引证文献(0)
  • 二级引证文献(4)
2016(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
搜索引擎,索引数据库,检索率,Page Rank,更新频度,点击率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导