基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网规模的日益增长,搜索引擎已经成为互联网上有效的信息获取工具.而在众多搜索引擎的背后,是信息检索技术,也即网页排序算法在起作用.网页排序包括重要性排序和相关性排序.通过我们研究发现,尽管这两类排序所依据的准则不同,但是都可以通过建立适当的随机过程模型来研究.对于网页重要性排序,我们通过分析用户浏览网页的行为建立了Markov骨架过程的框架.基于该框架我们分析了三种不同的随机过程模型对用户行为模拟的合理程度,并设计了名为BrowseRank的一组新算法,该算法可以根据用户上网行为来计算网页的重要性.在网页相关性排序中,我们主要针对排序结果联合问题建立了一个基于Markov链的监督学习框架.通过将传统方法的监督化,使原来难于解决的问题变的易于学习,将原来的NP-难问题转化为一个半正定规划问题,提高了效率.
推荐文章
基于文本分类的网页排序算法
网页排序算法
网页类型
网页年龄
网页点击率
一种自动分类的网页搜索排序算法
领域向量
BM25
softmax回归分类
网页排序
一种改进型的网页排序算法
链接分析
网页排序
改进型
综合考虑
时间因子
一种基于主题相关度的网页排序算法
网页排序
主题相关度
链接分析
向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页排序中的随机模型及算法
来源期刊 中国科学(数学) 学科
关键词 信息检索 排序联合问题 Markov骨架过程 BrowseRank算法
年,卷(期) 2011,(12) 所属期刊栏目 论文
研究方向 页码范围 1095-1103
页数 9页 分类号
字数 语种 中文
DOI 10.1360/012011-956
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 马志明 中国科学院数学与系统科学研究院 9 23 3.0 4.0
2 刘玉婷 2 6 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (1)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息检索
排序联合问题
Markov骨架过程
BrowseRank算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科学(数学)
月刊
1674-7216
11-5836/O1
北京东黄城根北街16号
chi
出版文献量(篇)
2806
总下载数(次)
4
总被引数(次)
12059
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导