基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大规模网络环境和大数据相关技术的发展对传统数据融合分析技术提出了新的挑战.针对目前多源数据融合分析过程灵活性差、处理效率低的问题,提出了一种基于相似连接的多源数据并行预处理方法,该方法采用了分治和并行的思想.首先,通过对多源数据中的相似语义进行统一、对个性语义进行保留的预处理方法提高了灵活性;其次,提出了一种改进的并行MapReduce框架,提高了相似连接的效率.实验结果表明,所提方法在保证数据完整性的基础上,使总的数据量减小了32%.与传统的MapReduce框架相比,改进后的框架在耗费时间方面减小了43.91%,因此该方法可以有效提高多源数据融合分析的效率.
推荐文章
基于数据预处理的并行分层聚类算法
分层聚类
并行算法
预处理数据
基于分层聚类的并行数据预处理算法
分层聚类
并行算法
预处理
基于证据异常度的水下多源信息预处理方法
证据理论
证据异常度
证据预处理
数据融合
多源定量遥感产品并行处理系统设计及实现
并行处理系统
并行文件系统
定量遥感产品
处理模式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于相似连接的多源数据并行预处理方法
来源期刊 计算机应用 学科 工学
关键词 网络安全 多源数据 数据预处理 相似连接 MapReduce
年,卷(期) 2019,(1) 所属期刊栏目 2018年全国开放式分布与并行计算学术年会(DPCS 2018)论文
研究方向 页码范围 57-60
页数 4页 分类号 TP274
字数 4068字 语种 中文
DOI 10.11772/j.issn.1001-9081.2018071869
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭方方 哈尔滨工程大学计算机科学与技术学院 23 129 7.0 10.0
2 潮洛蒙 哈尔滨工程大学计算机科学与技术学院 1 6 1.0 1.0
3 朱建文 哈尔滨工程大学计算机科学与技术学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (12)
参考文献  (6)
节点文献
引证文献  (6)
同被引文献  (33)
二级引证文献  (1)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(5)
  • 参考文献(2)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2019(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2019(4)
  • 引证文献(4)
  • 二级引证文献(0)
2020(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
网络安全
多源数据
数据预处理
相似连接
MapReduce
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导