基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对k近邻(kNN)方法不能很好地解决非平衡类问题,提出一种新的面向非平衡类问题的k近邻分类算法.与传统k近邻方法不同,在学习阶段,该算法首先使用划分算法(如K-Means)将多数类数据集划分为多个簇,然后将每个簇与少数类数据集合并成一个新的训练集用于训练一个k近邻模型,即该算法构建了一个包含多个k近邻模型的分类器库.在预测阶段,使用划分算法(如K-Means)从分类器库中选择一个模型用于预测样本类别.通过这种方法,提出的算法有效地保证了k近邻模型既能有效发现数据局部特征,又能充分考虑数据的非平衡性对分类器性能的影响.另外,该算法也有效地提升了k近邻的预测效率.为了进一步提高该算法的性能,将合成少数类过抽样技术(SMOTE)应用到该算法中.KEEL数据集上的实验结果表明,即使对采用随机划分策略划分的多数类数据集,所提算法也能有效地提高k近邻方法在评价指标recall、g-mean、f-measure和AUC上的泛化性能;另外,过抽样技术能进一步提高该算法在非平衡类问题上的性能,并明显优于其他高级非平衡类处理方法.
推荐文章
面向非平衡混合数据的改进计数最近邻分类算法
计数最近邻分类算法
非平衡数据
全局密度
K-密度
基于Hubness与类加权的k最近邻分类算法
Hubness现象
高维不平衡数据
维数灾难
数据分类
k发生
k最近邻分类
基于K均值和k近邻的半监督流量分类算法
流量分类
非均衡
半监督
K均值
k近邻
结合样本局部密度的非平衡数据集成分类算法
非平衡数据
近邻计算策略
集成学习
过采样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向非平衡类问题的k近邻分类算法
来源期刊 计算机应用 学科 工学
关键词 非平衡类技术 k近邻 划分 过抽样
年,卷(期) 2018,(4) 所属期刊栏目 人工智能
研究方向 页码范围 955-959,977
页数 6页 分类号 TP181
字数 5387字 语种 中文
DOI 10.11772/j.issn.1001-9081.2017092181
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 范明 郑州大学信息工程学院 55 376 11.0 16.0
2 邬长安 信阳师范学院计算机与信息技术学院 36 223 9.0 12.0
3 郭华平 信阳师范学院计算机与信息技术学院 18 92 6.0 9.0
4 周俊 信阳师范学院计算机与信息技术学院 1 15 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (13)
参考文献  (13)
节点文献
引证文献  (15)
同被引文献  (73)
二级引证文献  (10)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(3)
  • 参考文献(2)
  • 二级参考文献(1)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(3)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(3)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(15)
  • 引证文献(9)
  • 二级引证文献(6)
2020(7)
  • 引证文献(3)
  • 二级引证文献(4)
研究主题发展历程
节点文献
非平衡类技术
k近邻
划分
过抽样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导