Ensemble‐SISPLS近红外光谱变量选择方法

李四海; 赵磊

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
基础科学期刊 \
物理学期刊 \
光谱学与光谱分析期刊 \
Ensemble‐SISPLS近红外光谱变量选择方法

Ensemble‐SISPLS近红外光谱变量选择方法

作者：

李四海赵磊

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

近红外光谱

变量选择

确定独立筛选

偏最小二乘

集成学习

摘要：

近红外光谱具有高维小样本的特点,变量选择是提高定量分析模型稳健性和可解释性的一种有效方法.确定独立筛选(SIS)是一种基于边际相关性的超高维数据变量选择方法,广泛用于基因微阵列数据的变量选择.SIS具有将数据维度降低至样本大小规模的能力,其降维能力与LASSO相当,在相当宽泛的近似条件下,由于具有安全筛选性质,所有重要变量被保留的概率趋于1 .基于确定独立筛选偏最小二乘(SIS‐SPLS)的变量选择是一种迭代式的SIS变量选择方法,首先利用SIS方法完成光谱重要变量的初选;然后根据重要变量的边际相关性大小进行逐步前向选择:建立偏最小二乘回归模型,依据贝叶斯信息准则(BIC )确定最终的变量选择结果.SIS‐SPLS以逐步前向选择的方式实现对重要变量的增量式筛选,随着潜变量个数的增加及因变量残差的逐步减小,SIS‐SPLS方法选择的变量个数将趋于稳定.然而仅以边际相关性对变量重要性进行评价,当光谱变量个数远大于样本数时,该方法也存在选择的变量过多、变量选择结果不够稳健等问题.为进一步提高小样本情况下变量选择的稳健性,将集成学习引入SIS‐SPLS方法之中,提出了一种集成SIS‐SPLS变量选择方法(Ensemble‐SISPLS ) .该方法首先对校正集样本进行自助重采样,对采样得到的每一个校正子集分别使用SIS‐SPLS方法进行变量筛选,通过投票机制并设置频次阈值对所有校正子集的变量选择结果进行集成,选择出现频次大于给定阈值的变量并建立偏最小二乘回归模型,计算5折交叉验证均方根误差.对频次阈值和潜变量个数两个关键参数使用网格搜索法进行优选,根据子模型的交叉验证均方根误差和变量个数对子模型性能进行综合评价,以最优子模型包含的变量作为最终的变量选择结果.分别在Corn数据集和当归数据集上进行变量选择实验,比较Ensemble‐SISPLS ,SIS‐SPLS和UVE‐PLS三种变量选择方法的性能.其中当归数据集共77个样本,样本采自甘肃岷县和渭源县,使用Nicolet‐6700型近红外光谱仪扫描得到所有样本的近红外光谱并对当归中的阿魏酸含量进行预测. Ensemble‐SISPLS方法在Corn数据集上选择的变量个数、 RM SEP和决定系数分别为22 ,0. 000 8和0.999 8 ;SIS‐SPLS 方法在Corn数据集上选择的变量个数、 RM SEP和决定系数分别为97 ,0.007 3和0.998 8 . Ensemble‐SISPLS方法在当归数据集上选择的变量个数、RM SEP和决定系数分别为24 ,0. 018 1和0.996 3 ;SIS‐SPLS方法在当归数据集上选择的变量个数、 RMSEP和决定系数分别为38 ,0. 022 6和0. 994 3 .结果表明,该方法进一步提高了变量选择结果的稳健性和预测能力.Ensemble‐SISPLS变量选择方法有效结合了SIS‐SPLS较强的变量选择能力和集成学习良好的泛化能力,提高了变量选择的稳健性.此外,由于在子模型的预测能力和变量个数之间进行了折中,一定程度上减少了选择变量的个数,提高了模型的可解释性.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

力学化学地球物理学地质学基础科学综合大学学报天文学天文学、地球科学数学气象学海洋学物理学生物学生物科学自然地理学和测绘学自然科学总论自然科学理论与方法资源科学非线性科学与系统科学

光谱学与光谱分析2019年第9期光谱学与光谱分析2019年第8期光谱学与光谱分析2019年第7期光谱学与光谱分析2019年第6期光谱学与光谱分析2019年第5期光谱学与光谱分析2019年第4期光谱学与光谱分析2019年第3期光谱学与光谱分析2019年第2期光谱学与光谱分析2019年第12期光谱学与光谱分析2019年第11期光谱学与光谱分析2019年第10期光谱学与光谱分析2019年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	Ensemble‐SISPLS近红外光谱变量选择方法
来源期刊	光谱学与光谱分析	学科	工学
关键词	近红外光谱变量选择确定独立筛选偏最小二乘集成学习
年，卷（期）	2019,（4）	所属期刊栏目
研究方向		页码范围	1047-1052
页数	6页	分类号	TP391.4
字数	3460字	语种	中文
DOI	10.3964/j.issn.1000‐0593(2019)04‐1047‐06