基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题.
推荐文章
基于分化距离的离群点检测算法
离群点检测
分化距离
分化度
友邻点
基于网格上近似的大规模数据集离群点检测算法GROUT
离群点检测
网格化近似
GROUT算法
一种基于多标记的局部离群点检测算法
机器学习
局部离群点
多标记
类别权重
NLOF:基于网格过滤的两阶段离群点检测算法
异常检测
网格过滤
局部密度
NLOF算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于nested-loop的大数据集快速离群点检测算法
来源期刊 东南大学学报(自然科学版) 学科 工学
关键词 大数据集 模信息表 向量内积不等式 离群点检测
年,卷(期) 2006,(3) 所属期刊栏目
研究方向 页码范围 463-466
页数 4页 分类号 TP311
字数 3476字 语种 中文
DOI 10.3321/j.issn:1001-0505.2006.03.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙志挥 东南大学计算机科学与工程学院 148 3968 33.0 58.0
2 倪巍伟 东南大学计算机科学与工程学院 48 851 19.0 27.0
3 陈耿 南京审计学院审计信息工程重点实验室 81 565 13.0 20.0
4 陆介平 东南大学计算机科学与工程学院 12 407 10.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (14)
参考文献  (1)
节点文献
引证文献  (5)
同被引文献  (3)
二级引证文献  (22)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(3)
  • 引证文献(2)
  • 二级引证文献(1)
2008(1)
  • 引证文献(0)
  • 二级引证文献(1)
2009(2)
  • 引证文献(0)
  • 二级引证文献(2)
2010(5)
  • 引证文献(0)
  • 二级引证文献(5)
2011(9)
  • 引证文献(2)
  • 二级引证文献(7)
2012(2)
  • 引证文献(0)
  • 二级引证文献(2)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
大数据集
模信息表
向量内积不等式
离群点检测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(自然科学版)
双月刊
1001-0505
32-1178/N
大16开
南京四牌楼2号
28-15
1955
chi
出版文献量(篇)
5216
总下载数(次)
12
总被引数(次)
71314
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导