基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不同的权重.针对这一问题,把现有时空查询和针对多版本文档查询的方法进行扩展,使其支持加权持久性top-k检索问题,并分析总结了该方法的缺点,进而又提出了一种新的基于时间区间窗口的算法.基于时间区间窗口的算法能够支持多种经典top-k算法并有效地解决加权持久性top-k检索问题.最后使用Wikipedia多版本数据进行了一系列性能试验,对比测试了基于区间窗口的算法和扩展算法.结果表明区间窗口算法在各个测试下的效率和可扩展性明显优于扩展算法.
推荐文章
情境相关的室内空间群组Top-k查询
情境
室内空间
移动对象
群组查询
Top-k查询
一种处理Top-k逆向查询的分支界定算法
Top-k逆向查询
分支界定算法
逆向Top-k算法
基于MapReduce的top-k高效用模式挖掘算法
数据挖掘
top-k
高效用模式
MapReduce
并行算法
空间资源索引与top-k查询研究
空间资源索引
能力指标
道路网络
top-k算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 海量多版本文档的加权持久性top-k检索
来源期刊 计算机研究与发展 学科 工学
关键词 多版本文档 top-k查询 时态查询 文书类档案 多版本查询
年,卷(期) 2013,(z2) 所属期刊栏目 大数据处理、查询与检索
研究方向 页码范围 121-131
页数 11页 分类号 TP311
字数 9666字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张勇 清华大学信息技术研究院 121 1865 23.0 40.0
2 邢春晓 清华大学信息技术研究院 84 2349 18.0 47.0
3 兰超 清华大学计算机科学与技术系 3 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (14)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多版本文档
top-k查询
时态查询
文书类档案
多版本查询
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导