基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
机器学习在当今诸多领域已经取得了巨大的成功,但是机器学习的预测效果往往依赖于具体问题.集成学习通过综合多个基分类器来预测结果,因此,其适应各种场景的能力较强,分类准确率较高.基于斯隆数字巡天(Sloan Digital Sky Survey,SDSS)计划恒星/星系中最暗源星等集分类正确率低的问题,提出一种基于Stacking集成学习的恒星/星系分类算法.从SDSS-DR7(SDSS Data Release 7)中获取完整的测光数据集,并根据星等值划分为亮源星等集、暗源星等集和最暗源星等集.仅针对分类较为复杂且困难的最暗源星等集展开分类研究.首先,对最暗源星等集使用10折嵌套交叉验证,然后使用支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、XGBoost(eXtreme Gradient Boosting)等算法建立基分类器模型;使用梯度提升树(Gradient Boosting Decision Tree,GBDT)作为元分类器模型.最后,使用基于星系的分类正确率等指标,与功能树(Function Tree,FT)、SVM、RF、GBDT、XGBoost、堆叠降噪自编码(Stacked Denoising AutoEncoders,SDAE)、深度置信网络(Deep Belief Network,DBN)、深度感知决策树(Deep Perception Decision Tree,DPDT)等模型进行分类结果对比分析.实验结果表明,Stacking集成学习模型在最暗源星等集分类中要比FT算法的星系分类正确率提高了将近10%.同其他传统的机器学习算法、较强的提升算法、深度学习算法相比,Stacking集成学习模型也有较大的提升.
推荐文章
基于Spark深度感知决策树的恒星/星系分类应用研究
Spark
深度学习
决策树
并行化
恒星/星系
分类
基于Spark深度感知决策树的恒星/星系分类应用研究
Spark
深度学习
决策树
并行化
恒星/星系
分类
集成学习在短文本分类中的应用研究
短文本分类
机器学习
深度学习
集成学习
Bagging
Stacking
基于Stacking集成学习的水稻表型组学实体分类研究
水稻表型组学
实体分类
堆叠式集成学习
知识图谱
潜在语义模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Stacking集成学习的恒星/星系分类研究
来源期刊 天文学报 学科 地球科学
关键词 恒星:基本参数 星系:基本参数 技术:测光 方法:数据分析
年,卷(期) 2020,(2) 所属期刊栏目
研究方向 页码范围 102-111
页数 10页 分类号 P152
字数 4158字 语种 中文
DOI 10.15940/j.cnki.0001-5245.2020.02.010
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (8)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
恒星:基本参数
星系:基本参数
技术:测光
方法:数据分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
天文学报
双月刊
0001-5245
32-1113/P
16开
南京北京西路2号
2-818
1953
chi
出版文献量(篇)
1295
总下载数(次)
1
论文1v1指导