原文服务方: 科技与创新       
摘要:
pagerank算法仅根据网页的pagerank值对搜索结果进行排序,一个网页的pagerank值越高,其位置越靠前,这使得pagerank算法无法区分搜索结果中与主题相关的权威网页和与主题无关的权威网页.也正因此在使用pagerank算法时往往会发生主题漂移现象.产生这一问题的原因有两个,一是pagerank对网页权值平均分配,二是pagerank与查询主题的无关性.本文从这二方面入手,采用tf-idf算法计算主题的相关权重,提出了与查询主题相关的query-based pagerank算法,有效地解决了原算法中的主题漂移问题.
推荐文章
基于主题相关性和时间因素的改进 PageRank算法
网页
发布时间
PageRank
主题相关性
基于主题聚焦模型的PageRank改进算法
PageRank
TSPR
MP-PageRank
主题聚焦
主题漂移
PageRank算法研究
信息检索
PageRank算法
时效性
主题漂移
潜在语义模型(LSM)
基于MapReduce的PageRank算法的研究
云计算
MapReduce模型
PageRank算法
Hadoop
并行计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 PageRank算法中主题漂移的研究
来源期刊 科技与创新 学科
关键词 pagerank 主题漂移 主题敏感 页面排序 搜索引擎
年,卷(期) 2010,(9) 所属期刊栏目
研究方向 页码范围 117-119,89
页数 分类号 TP393
字数 语种 中文
DOI 10.3969/j.issn.2095-6835.2010.09.046
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张永平 中国矿业大学计算机科学与技术学院 75 740 12.0 25.0
2 高琪 中国矿业大学计算机科学与技术学院 2 40 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (25)
参考文献  (2)
节点文献
引证文献  (31)
同被引文献  (41)
二级引证文献  (59)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(6)
  • 引证文献(5)
  • 二级引证文献(1)
2013(18)
  • 引证文献(7)
  • 二级引证文献(11)
2014(13)
  • 引证文献(2)
  • 二级引证文献(11)
2015(12)
  • 引证文献(7)
  • 二级引证文献(5)
2016(12)
  • 引证文献(3)
  • 二级引证文献(9)
2017(9)
  • 引证文献(1)
  • 二级引证文献(8)
2018(7)
  • 引证文献(0)
  • 二级引证文献(7)
2019(11)
  • 引证文献(4)
  • 二级引证文献(7)
研究主题发展历程
节点文献
pagerank
主题漂移
主题敏感
页面排序
搜索引擎
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导