作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在实际生活中,不平衡数据往往是常态,比如医疗领域.在机器学习分类问题中,如果不考虑类别不平衡,直接构建机器学习模型往往会得出过于乐观甚至无用的分类结果.针对不平衡数据分类问题,从数据分布、模型算法和评估指标三方面提出处理方法.选取pima印第安人糖尿病数据集,应用SMOTE过采样技术处理数据,并构建随机森林模型和GBDT模型.然后选取查准率(precision)、召回率(recall)、f-度量(fl-score)和AUC(ROC曲线下面积)作为重要评估指标.最后通过实验结果的对比和分析,选取综合表现最好的GBDT模型,将其应用于疾病诊断系统,以期助力推动医疗领域的进步.
推荐文章
不平衡数据集的分类方法研究
机器学习
不平衡数据
数据分类
不平衡数据分类的研究现状
不平衡数据
机器学习
模式分类
不平衡数据的集成分类算法综述
不平衡数据
集成学习
分类
代价敏感
数据采样
RBQENN算法在不平衡数据分类问题中的应用
kNN
象限壳近邻
分类
不平衡数据
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不平衡数据分类研究及在疾病诊断中的应用
来源期刊 黄河科技学院学报 学科 工学
关键词 不平衡数据 疾病诊断 随机森林 梯度提升机
年,卷(期) 2019,(5) 所属期刊栏目 医药科学研究
研究方向 页码范围 15-22
页数 8页 分类号 TP311
字数 6064字 语种 中文
DOI 10.19576/j.issn.1008-5424.2019.05.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张涛 兰州财经大学统计学院 3 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (47)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不平衡数据
疾病诊断
随机森林
梯度提升机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
黄河科技学院学报
双月刊
1008-5424
41-1279/N
大16开
河南省郑州市紫荆山南路666号
1999
chi
出版文献量(篇)
497
总下载数(次)
4
总被引数(次)
68
论文1v1指导