基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
经典KNN算法在处理高维数据或样本数繁多的样本集时需要巨大的计算量,这使其在实际应用的过程中存在着一定的局限性;提出一种基于聚类和密度裁剪的改进KNN算法.在训练阶段,首先根据样本密度对整个训练集进行裁剪,然后将裁剪好的训练集进行聚类处理,得到若干个密度比较均匀的类簇并将其转化为超球.在测试阶段,采用两种方法,第一种是找出距离待测样本最近的k个超球,然后将这个k个超球内的训练样本作为新的训练样本集,在这个新的训练样本集上使用经典KNN算法得到待测样本的类别;第二种则是找出距离待测样本最近的1个超球,然后根据该超球的类别得出待测样本的类别.实验采用8个UCI样本集进行测试,实验结果表明,该算法同经典KNN相比具有良好的性能,是一种有效的分类方法.
推荐文章
基于加权K近邻的改进密度峰值聚类算法
数据挖掘
加权K近邻
密度峰值
聚类
基于改进果蝇优化的密度峰值聚类算法
密度峰值聚类
截断距离
果蝇优化算法
Tent混沌
柯西变异
收敛性
基于聚类降维的改进KNN文本分类
特征降维
聚类
文本分类
K平均
K近邻
一种基于密度的分布式聚类改进算法
聚类
分布式
数据挖掘
代表点
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于聚类和密度裁剪的改进KNN算法
来源期刊 青岛大学学报(自然科学版) 学科 工学
关键词 聚类 密度 样本裁剪 KNN算法
年,卷(期) 2017,(2) 所属期刊栏目 信息工程
研究方向 页码范围 62-68
页数 7页 分类号 TP301.6
字数 5747字 语种 中文
DOI 10.3969/j.issn.1006-1037.2017.05.14
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张公敬 青岛大学计算机科学技术学院 15 44 4.0 5.0
2 王艳飞 青岛大学数据科学与软件工程学院 3 8 2.0 2.0
3 郝卫杰 青岛大学计算机科学技术学院 3 8 2.0 2.0
4 范支菊 青岛大学计算机科学技术学院 3 6 1.0 2.0
5 张三顺 青岛大学计算机科学技术学院 4 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (26)
共引文献  (299)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (10)
二级引证文献  (1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(6)
  • 参考文献(0)
  • 二级参考文献(6)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
聚类
密度
样本裁剪
KNN算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
青岛大学学报(自然科学版)
季刊
1006-1037
37-1245/N
16开
青岛市宁夏路308号
1988
chi
出版文献量(篇)
1805
总下载数(次)
12
总被引数(次)
6176
论文1v1指导