基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统KNN算法是在基于距离的离群检测算法的基础上提出的一种在大数据集下进行离群点挖掘的算法,然而KNN算法只以最近的第k个邻居的距离作为判断是否是离群点的标准有时也失准确性.给出了一种在大数据集下基于KNN的离群点检测算法,即在传统KNN方法的基础上为每个数据点增加了权重,权重值为与最近的k个邻居的平均距离,离群点为那些与第k个邻居的距离最大且相同条件下权重最大的点.算法能提高离群点检测的准确性,通过实验验证了算法的可行性,并与传统KNN算法的性能进行了对比.
推荐文章
一种基于改进KNN的大数据离群点检测算法
大数据
KNN
降维
属性重叠率
剪枝
基于nested-loop的大数据集快速离群点检测算法
大数据集
模信息表
向量内积不等式
离群点检测
基于加权自然邻域属性和熵的离群检测算法
离群检测
信息熵
熵增
熵权
自然最近邻
基于K-近邻树的离群检测算法
离群检测
离群簇
最小生成树
不相似性
K-近邻
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于加权KNN的大数据集下离群检测算法
来源期刊 计算机科学与探索 学科 工学
关键词 离群点 数据挖掘 权重 划分
年,卷(期) 2011,(10) 所属期刊栏目 数据库与数据挖掘
研究方向 页码范围 177-180
页数 分类号 TP391
字数 5498字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王茜 重庆大学计算机学院 68 682 14.0 23.0
2 杨正宽 重庆大学计算机学院 2 18 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (1)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
离群点
数据挖掘
权重
划分
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导