基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习", 研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响. 在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明: 不同准则对分类器性能的影响有显著差异; 即便是对于先进的学习方法支持向量机(SVM)而言, 若以精度准则最大化选择分类器, 那么得到的SVM分类器也容易偏向预测多类; 通过在其他准则上优化, 能输出纠偏了的SVM分类器, 它们的整体性能更好, 尤其是在预测少类能力方面; 在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.
推荐文章
极限学习机类不平衡数据学习算法研究
极限学习机
类不平衡数据学习
支持向量机
AdaBoost
不平衡数据分类的研究现状
不平衡数据
机器学习
模式分类
不平衡数据集的分类方法研究
机器学习
不平衡数据
数据分类
不平衡数据的集成分类算法综述
不平衡数据
集成学习
分类
代价敏感
数据采样
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 若干评价准则对不平衡数据学习的影响
来源期刊 华南理工大学学报(自然科学版) 学科 工学
关键词 评价准则 不平衡数据学习 支持向量机 GAF准则 GBF准则
年,卷(期) 2010,(4) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 147-155
页数 分类号 TP181
字数 8017字 语种 中文
DOI 10.3969/j.issn.1000-565X.2010.04.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郝志峰 广东工业大学应用数学学院 166 940 14.0 20.0
2 杨晓伟 华南理工大学理学院 38 588 12.0 24.0
3 林智勇 华南理工大学计算机科学与工程学院 5 179 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (19)
参考文献  (3)
节点文献
引证文献  (39)
同被引文献  (59)
二级引证文献  (118)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(4)
  • 引证文献(3)
  • 二级引证文献(1)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(10)
  • 引证文献(5)
  • 二级引证文献(5)
2014(9)
  • 引证文献(2)
  • 二级引证文献(7)
2015(13)
  • 引证文献(6)
  • 二级引证文献(7)
2016(25)
  • 引证文献(9)
  • 二级引证文献(16)
2017(24)
  • 引证文献(6)
  • 二级引证文献(18)
2018(40)
  • 引证文献(7)
  • 二级引证文献(33)
2019(21)
  • 引证文献(0)
  • 二级引证文献(21)
2020(10)
  • 引证文献(0)
  • 二级引证文献(10)
研究主题发展历程
节点文献
评价准则
不平衡数据学习
支持向量机
GAF准则
GBF准则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华南理工大学学报(自然科学版)
月刊
1000-565X
44-1251/T
大16开
广州市天河区五山路华南理工大学内
46-174
1957
chi
出版文献量(篇)
6648
总下载数(次)
17
总被引数(次)
75046
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导