基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据集存在多样性,导致样本点的密度难以有效度量且效率低下,多数基于密度的异常检测方法局限于局部密度的计算,使其无法适应复杂数据库的发展需求,因此提出一种基于核密度估计的离群数据挖掘方法OMDE.首先,为估计并度量样本点的密度,提出一种特定核函数,该函数更适合于估计样本的局部密度;然后提出了一种基于均值的邻域密度估计方法来度量样本点邻域的密度,同传统的邻域密度估计方法相比,它对邻域大小具有更强的鲁棒性.在此基础上,提出一种基于离群因子估计的离群数据挖掘算法,结合多尺度邻域的信息,对样本的异常因子进行局部和全局的细化,实现了复杂数据集上的离群检测.最后,采用人工合成数据集分析验证了参数对算法性能的影响,并通过3组不同的真实数据集,将OMDE与相关算法进行了比较,实验结果显示,OMDE算法在效率和准确性两个方面具有较大的优势.
推荐文章
基于非参数核密度估计的密度峰值聚类算法
聚类
密度峰值
非参数核密度估计
截断距离
基于核密度估计的电网电压质量分析系统研究
电力系统
电压质量
核密度估计
小提琴分布
统计分析
R语言
基于LBP核密度估计的动态目标分割模型研究
局部二值模式
动态目标阴影
RGB颜色空间
核密度估计
阴影抑制
误分割率
基于核密度估计的软实时任务QoS控制
核密度估计
软实时任务
服务质量
预测控制
资源分配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于核密度估计的离群数据挖掘
来源期刊 太原科技大学学报 学科 工学
关键词 密度 邻域 离群检测 核函数
年,卷(期) 2020,(6) 所属期刊栏目 大数据分析与并行计算
研究方向 页码范围 456-462,469
页数 8页 分类号 TP311
字数 语种 中文
DOI 10.3969/j.issn.1673-2057.2020.06.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵旭俊 26 42 4.0 5.0
2 马洋 9 15 3.0 3.0
3 苏建花 1 0 0.0 0.0
4 席婷婷 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (2)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(3)
  • 参考文献(0)
  • 二级参考文献(3)
2016(9)
  • 参考文献(1)
  • 二级参考文献(8)
2017(4)
  • 参考文献(0)
  • 二级参考文献(4)
2018(3)
  • 参考文献(0)
  • 二级参考文献(3)
2019(4)
  • 参考文献(3)
  • 二级参考文献(1)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
密度
邻域
离群检测
核函数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
太原科技大学学报
双月刊
1673-2057
14-1330/N
大16开
山西省太原市万柏林区窊流路66号
22-34
1980
chi
出版文献量(篇)
2179
总下载数(次)
6
总被引数(次)
8489
论文1v1指导