基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着数据规模的日益庞大,在大规模数据集中帮助用户定位出数据量可控的代表性信息显得越发重要。虽然Top-k Skyline查询能够找到数据集中前k个最具代表性的信息,在获取代表性信息的同时又控制了结果规模,满足了上述要求,但是现有的Top-k Skyline查询在面对大规模数据集时效率较低,并不适用于大规模数据集。为了解决这个问题,将Top-k Skyline查询与并行化处理相结合,提出了一种面向大规模数据集的并行化Top-k Skyline查询算法PTKS(parallel Top-k Skyline),通过充分利用分布式资源,将原有查询进行有效的并行化处理,同时设计了基于用户偏好的用于缩减结果数据量的筛选规则,满足用户需求。在真实数据集上进行了相关实验,并与现有方法进行了对比,结果表明PTKS在大规模数据集上的查询效率更具有优势,能很好地适用于大规模数据集。
推荐文章
多维数据流下的top-k支配查询算法研究
数据流
滑动窗口
top-k
Skyline
网格
一种处理Top-k逆向查询的分支界定算法
Top-k逆向查询
分支界定算法
逆向Top-k算法
情境相关的室内空间群组Top-k查询
情境
室内空间
移动对象
群组查询
Top-k查询
MapReduce框架下一种负载均衡的Top-k连接查询算法
Top-k连接查询
MapReduce框架
数据过滤
负载均衡
执行时间
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向大规模数据集的并行化Top-k Skyline查询算法
来源期刊 计算机科学与探索 学科 工学
关键词 大规模数据集 Top-k Skyline 代表性信息 并行化处理 筛选规则
年,卷(期) 2015,(8) 所属期刊栏目 数据库技术
研究方向 页码范围 897-905
页数 9页 分类号 TP311.13
字数 6667字 语种 中文
DOI 10.3778/j.issn.1673-9418.1412008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (40)
参考文献  (4)
节点文献
引证文献  (11)
同被引文献  (48)
二级引证文献  (8)
1978(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(6)
  • 引证文献(2)
  • 二级引证文献(4)
2020(5)
  • 引证文献(3)
  • 二级引证文献(2)
研究主题发展历程
节点文献
大规模数据集
Top-k Skyline
代表性信息
并行化处理
筛选规则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导