基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在许多业务应用中,非平衡数据分类问题都会频繁出现,然而这个问题仍未得到很好的解决.除了直接预测数据对应的分类标签,许多应用还可能关心这个预测的准确性有多少.然而,已有的许多研究都主要集中在分类准确度上而忽略分类概率预测值的准确度.为了解决这个问题,提出了一种新的线性回归算法,该算法在广义线性模型的框架下,结合广义极值(generalized extreme value,GEV)分布作为链接函数以及校准损失函数作为目标优化函数,形成凸优化问题,利用广义极值分布的非对称性解决非平衡数据分类问题.另外,由于广义极值分布的形状参数对建模精度有较大影响,还提出了2种参数寻优方法.在实验部分,人工数据集和真实数据集均表明所提算法有着优异的分类性能以及准确的分类概率预测.
推荐文章
一种处理非平衡数据集的优化随机森林分类方法
随机森林
最大投票熵
广义欧几里得距离
不平衡数据集
基于广义极值分布的设计波高推算
广义极值分布
参数估计
设计波高
拟合优度检验
间隔最大积估计
基于样本投影分布的平衡不平衡数据集分类
平衡不平衡数据集
样本投影分布
支持向量机
支持向量数据描述
一种改进的降噪自编码神经网络不平衡数据分类算法
神经网络
过采样
不平衡数据
分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于广义极值分布的非平衡数据分类算法
来源期刊 计算机研究与发展 学科 工学
关键词 线性模型 极值分布 非平衡数据 分类 概率预测
年,卷(期) 2018,(11) 所属期刊栏目 人工智能
研究方向 页码范围 2361-2371
页数 11页 分类号 TP181
字数 7034字 语种 中文
DOI 10.7544/issn1000-1239.2018.20170514
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘功申 上海交通大学电子信息与电气工程学院 97 848 14.0 25.0
2 付俊杰 上海交通大学电子信息与电气工程学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (24)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1984(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
线性模型
极值分布
非平衡数据
分类
概率预测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导