基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了提高数据挖掘中异常检测算法在数据量增大时的准确度、灵敏度和执行效率,本文提出了一种基于MapReduce框架和Local Outlier Factor(LOF)算法的并行异常检测算法(MR-DLOF).首先,将存放在Hadoop分布式文件系统(HDFS)上的数据集逻辑地切分为多个数据块.然后,利用MapReduce原理将各个数据块中的数据并行处理,使得每个数据点的k-邻近距离和LOF值的计算仅在单个块中执行,从而提高了算法的执行效率;同时重新定义了k-邻近距离的概念,避免了数据集中存在大于或等于k个重复点而导致局部密度为无穷大的情况.最后,将LOF值较大的数据点合并重新计算其LOF值,从而提高算法准确度和灵敏度.通过真实数据集验证了MR-DLOF算法的有效性、高效性和可扩展性.
推荐文章
基于演化计算的异常轨迹并行检测算法
异常轨迹检测
演化计算
并行异常轨迹检测
时空轨迹挖掘
异常检测算法分析
数据挖掘
聚类
异常检测
基于MapReduce模型的并行量子进化算法
量子进化算法
MapReduce模型
云计算平台
Hadoop平台
基于MapReduce的并行模糊C均值算法
模糊C均值
并行计算
MapReduce编程模型
数据挖掘
云计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MapReduce的并行异常检测算法
来源期刊 智能系统学报 学科 工学
关键词 数据挖掘 异常检测 局部离群因子 Hadoop MapReduce 分布式文件系统 并行计算 局部密度
年,卷(期) 2019,(2) 所属期刊栏目
研究方向 页码范围 224-230
页数 7页 分类号 TP311
字数 4416字 语种 中文
DOI 10.11992/tis.201809007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 齐小刚 西安电子科技大学数学与统计学院 68 388 10.0 17.0
2 刘立芳 西安电子科技大学计算机学院 32 133 6.0 10.0
3 胡秋秋 西安电子科技大学数学与统计学院 2 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (74)
共引文献  (97)
参考文献  (13)
节点文献
引证文献  (5)
同被引文献  (18)
二级引证文献  (0)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(5)
  • 参考文献(0)
  • 二级参考文献(5)
2013(14)
  • 参考文献(1)
  • 二级参考文献(13)
2014(10)
  • 参考文献(0)
  • 二级参考文献(10)
2015(12)
  • 参考文献(3)
  • 二级参考文献(9)
2016(7)
  • 参考文献(1)
  • 二级参考文献(6)
2017(5)
  • 参考文献(5)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(3)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(3)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
异常检测
局部离群因子
Hadoop
MapReduce
分布式文件系统
并行计算
局部密度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导