基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对不均衡数据分类决策面偏移导致少数类识别率较低的问题,提出一种混合取样算法。首先计算类样本数的比值 K;然后分别在多数类和少数类中随机选取一个样本,计算该样本的 K-1近邻,以 K 个样本的中心作为新样本;再对剩余的样本重复上面操作,直到所有样本都被处理;最后所得新样本与原少数类样本共同构成新的训练集。该算法在改变样本密度的同时保持了原样本的空间分布,实验结果表明该算法能够提高SVM 在不均衡数据下的分类性能,尤其是少数类的分类性能。
推荐文章
基于BSMOTE和逆转欠抽样的不均衡数据分类算法
不均衡数据集
边界少数类样本合成过抽样技术
逆转欠抽样技术
多分类器集成
基于支持向量机的不均衡文本分类方法
混合算法
支持向量机
不均衡数据集
插值样本
文本分类
迭代进化
不均衡数据在股票研报分类中的应用
不均衡数据
股票研报
CHI统计
SVM算法
层次欠采样
密度不均衡数据分类算法
支持向量机
不均衡数据集
样本密度
欠取样
K-近邻
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不均衡数据混合取样分类算法
来源期刊 燕山大学学报 学科 工学
关键词 支持向量机 过取样 不均衡数据集 欠取样 K 近邻
年,卷(期) 2015,(2) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 158-164
页数 7页 分类号 TP301.6
字数 5415字 语种 中文
DOI 10.3969/j.issn.1007-791X.2015.02.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜红乐 商洛学院数学与计算机应用学院 32 111 7.0 9.0
2 张燕 商洛学院数学与计算机应用学院 33 104 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (9)
同被引文献  (38)
二级引证文献  (7)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(7)
  • 引证文献(5)
  • 二级引证文献(2)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
支持向量机
过取样
不均衡数据集
欠取样
K 近邻
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
燕山大学学报
双月刊
1007-791X
13-1219/N
大16开
河北省秦皇岛市河北大街西段438号
18-73
1963
chi
出版文献量(篇)
2254
总下载数(次)
2
总被引数(次)
12529
论文1v1指导