基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于数据集规模、维数,以及复杂程度的不断提高,导致对其离群点的挖掘难度越来越大,提出了基于邻域密度的局部离群点挖掘算法.首先依据节点计算性能对高维数据进行区域分割,通过各个维度的数据分布来评价区域分割的效果.然后采取核密度来描述局部密度,根据高斯分布得到数据出现次数,进一步计算出数据邻域密度.再由邻域及密度关系计算得到各数据离群度,从而判断异构数据中的离群点.最后针对可能存在的离群误判情况,采取离群分数计算,为增强此过程的检测性能,利用权重进行剪枝处理.人工与UCI数据集上的仿真结果表明,当数据量和数据维数改变时,算法对离群点挖掘的准确度几乎不受影响,挖掘时间和覆盖率指标也显著优于其它方法;同时对于不同类型和复杂度的异构数据,算法仍然保持良好的挖掘准确度和效率.
推荐文章
基于密度的局部离群数据挖掘方法的改进
离群数据挖掘
影响空间
链式距离
相似k距离邻居序列
离群因子
基于属性权重的局部离群点挖掘算法研究
高维
离群点检测
高维局部偏离系数
加权属性距离
高维平均偏离系数
数据密集型计算环境下的离群点挖掘算法
离群点检测
网格
MapReduce
MR_DBScan
基于全息熵的空间离群点挖掘算法研究
全息熵
R*-树
空间离群点
离群点检测
混合属性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于邻域密度的异构数据局部离群点挖掘算法
来源期刊 计算机仿真 学科
关键词 离群点挖掘 区域分割 邻域密度 异构数据 离群分数
年,卷(期) 2021,(7) 所属期刊栏目 仿真方法与算法
研究方向 页码范围 281-285
页数 5页 分类号 TP311
字数 语种 中文
DOI 10.3969/j.issn.1006-9348.2021.07.060
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (1)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(6)
  • 参考文献(0)
  • 二级参考文献(6)
2016(5)
  • 参考文献(0)
  • 二级参考文献(5)
2017(5)
  • 参考文献(1)
  • 二级参考文献(4)
2018(7)
  • 参考文献(1)
  • 二级参考文献(6)
2019(2)
  • 参考文献(1)
  • 二级参考文献(1)
2020(3)
  • 参考文献(3)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
离群点挖掘
区域分割
邻域密度
异构数据
离群分数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机仿真
月刊
1006-9348
11-3724/TP
大16开
北京海淀阜成路14号
82-773
1984
chi
出版文献量(篇)
20896
总下载数(次)
43
论文1v1指导