基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着基于位置服务应用的不断推广,空间文本数据查询的应用价值(例如结合地理位置和用户标签的社交推荐)也在不断提高.但是,随着数据规模的迅速增长,传统的基于单机环境实现的技术难以为用户提供低延时和高吞吐量的服务.为此,本文基于Spark平台对分布式环境下的空间文本查询算法进行了探究.采用了面向海量空间文本数据的两层索引框架(包括全局索引和局部索引),该框架利用了分阶段过滤的策略来处理分布式下的布尔范围查询问题.同时,针对空间文本相似连接提出了Prefix-RI结构并提出了相应的分布式算法.基于Spark平台实现了所提出的分布式算法,并通过大量的实验对比验证了所提出方法的优越性.
推荐文章
基于Spark的分布式交通流数据预测系统
交通流预测
分布式计算
Spark平台
梯度优化决策树模型
Spark平台上的分布式SNESIM算法实现及其地质建模应用
多点地质统计
分布式计算
单正态方程模拟
Spark平台
Spark框架下利用分布式NBC的大数据文本分类方法
文本分类
MapReduce
Spark框架
分布式
朴素贝叶斯分类器
机器学习
基于Agent的分布式查询优化研究
分布式数据库系统
Agent与多Agent系统
查询优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分布式平台Spark的空间文本查询分析
来源期刊 华东师范大学学报(自然科学版) 学科 工学
关键词 分布式计算 空间文本分析 相似连接
年,卷(期) 2018,(5) 所属期刊栏目 新型互联网应用技术
研究方向 页码范围 120-134,153
页数 16页 分类号 TP311
字数 11929字 语种 中文
DOI 10.3969/j.issn.1000-5641.2018.05.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐阳 上海交通大学计算机科学与工程系 7 16 3.0 4.0
2 王志杰 中山大学数据科学与计算机学院 2 3 1.0 1.0
3 钱诗友 上海交通大学计算机科学与工程系 4 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分布式计算
空间文本分析
相似连接
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华东师范大学学报(自然科学版)
双月刊
1000-5641
31-1298/N
16开
上海市中山北路3663号
4-359
1955
chi
出版文献量(篇)
2430
总下载数(次)
5
总被引数(次)
17499
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导