红外光谱定量分析中的一种变量聚类偏最小二乘算法_毕一鸣
SDY | -> | 430| 0| 0.785904MB |化学计量学;偏最小二乘;定量分析;光谱分析;模型集成
量之间的相关性,能够有效地解决近红外、中红外及拉曼等光谱分析中的多变量和共线性问题,因而成
为光谱分析和化学计量学中最常用的多元校正方法[D -al。然而,偏最小二乘方法仍存在诸多不足之处,
例如有效地挖掘光谱中的有效信息以及排除光谱噪声的干扰等。
针对偏最小二乘方法的改进主要有两种思路,一种是通过变量选择(波数选择)的方式去除光谱中
与目标物质相关度不高的变量[Cs.}7。变量选择通过剔除部分噪声变量来提高模型精度,然而,很多变量
选择方法需要增加额外的参数来控制剔除变量的数量,这不仅增加了模型的复杂度,而且使模型过拟合
的风险增大[Ll。另一种改进则是使用全谱模型,通过对样本进行聚类或重采样生成若干子模型,利用
子模型集成的方式保证整体模型具有更好的预测能力和鲁棒性Cs-iol。然而,这种方式不能提高单一子
模型的模型精度,仅在建模样本数目中进行了调整。Ni等Di」提出一种堆叠偏最小二乘(Stacked PLS)
算法,以邻域为单位建立子模型并叠加为全谱模型。与样本空间集成模型不同,SPLS在变量空间进行
集成,可以改善单一PLS模型的预测精度。SPLS的一个不足之处在于采用等分邻域的方式划分光谱区
域,使得相关性很高的波数会赋予不同的权重,从而降低了模型的合理性。
本研究提出一种基于变量聚类的集成偏最小二乘算法,以聚类的方式,使相似的变量(波数)划归
同一子类。通过赋予各子类不同的权重,提高光谱中与待分析物质相关性较高变量的重要性,降低较低
相关性变量和噪声的干扰,从而提高建模精度与模型的解释能力。利用汽油中的辛烷值预测和烟草中
的烟碱预测两组近红外数据对所提算法有效性进行了验证。
-
关键词: 电解水;制氢;酸性离子液体;催化活性;活化能 发表时间: 2017-02-07 16:50:18
-
关键词: 双脉冲激光诱导击穿光谱;最小二乘支持向量机;植物油;铬 发表时间: 2017-02-07 16:48:32
-
关键词: 超高效合相色谱;蒸发光散射检测;蜂蜜;单糖;双糖 发表时间: 2017-02-07 16:45:27
-
关键词: 头抱氨节;水解;电化学传感器;金属纳米粒子;伏安法 发表时间: 2017-02-07 16:44:36
-
关键词: 化学发光;超灵敏检测;生化分析;综述 发表时间: 2017-02-07 16:43:33
-
关键词: 微流控技术;药物筛选;细胞分析;综述 发表时间: 2017-02-07 16:30:49