小程序
微信小程序
人工客服
回顶部

近红外光谱定量分析的新方法_半监督最小二乘支持向量回归机

张军 | -> | 909| 3| 1794.089MB |近红外光谱,化学计量学,半监督LS-SVR( S2LS-SVR)

张军 张军 | 文档量 |浏览量14837

摘􀀁 要􀀁 在近红外光谱定量分析中, 样品化学值测定的准确度是运用数学模型进行定量分析精确度的理论极限。但能够准确获取化学值的样品数量比较少, 许多模型在建模时只考虑这部分样品数据, 而不考虑大量的无化学值的样品数据。针对该问题, 本文在LS- SVR 的基础上, 提出了可以同时利用有化学值( 标签) 和无化学值样品数据的半监督LS- SVR( S2 LS- SVR) 模型。类似于LS- SVR, 该模型也只需求解一个线性方程组。最后, 以烤烟样品数据集为实验材料, 建立了四种样品成分( 总糖、还原糖、总氮和烟碱) 的定量分析模型。四种样品成分的预测值与实际值的平均误差分别为6􀀁 62%, 7􀀁 56% , 6􀀁 11%和8􀀁 20%, 相关系数分别为0􀀁 974 1, 0􀀁 973 3, 0􀀁 923 0 和0􀀁948 6。经分析比较发现S2 LS- SVR 模型优于PLS 和LS- SVR, 从而验证了S2 LS- SVR 模型的可行性和有效性。
    利用有机物在近红外光谱区的振动吸收, 近红外光谱技术[1] 几乎可以用于所有与含氢基团有关的化学性质与物理性质分析。它具有操作简单、分析速度快以及测定一次光谱可同时获得样品多种成分含量的独特优点, 使其在作物品质分析上得到了广泛应用。对于近红外光谱定量分析, 准确测定样品的化学值极其重要, 因为它们是运用数学模型进行定量分析精确度的理论极限[1] 。但与获取样品的近红外光谱数据相比, 样品化学值的准确测定代价高、效率低, 比如根据
GB/ T5009􀀁 9 􀀁 2003􀀁食品中淀粉的测定􀀁 中酸水解法测定玉米总淀粉的含量, 需要大量的化学试剂, 操作复杂。换句话说, 可以获取近红外光谱数据的样品是大量的, 而准确测定化学值的样品却是少量的。
    在机器学习中, 通常将化学值称为标签。传统的监督学习方法, 比如偏最小二乘( PLS) 回归[2] 、支持向量回归机( SVR) [ 3] 及最小二乘SVR( LS- SVR) [4] 等, 虽然能够解决一定的实际问题, 但它们只能利用有标签样品的信息, 而不能利用无标签样品的信息。为了解决这类问题, Blum 和M itchell[ 5] 于1998 年提出了互训练( co- tra ining ) 算法, 自此以后大量的半监督学习方法[6, 7] 被提出, 比如半监督支持向量分类机( S3VC) [ 8] 等。但绝大部分方法是针对分类问题提出的, 有关半监督回归模型的研究非常少, 从文献中能够找到的只有半监督岭回归[ 9, 10] 和互训练kNN[ 11] , 而且半监督分类模型难以直接推广到对应的回归模型[9] 。
    LS- SVR 用等式约束代替了SVR 中的不等式约束, 这样只需求解一个线性方程组而不是二次规划问题, 大大加快了训练速度, 而且大量的实验研究表明性能与SVR 的性能相当[ 12] , 受到了人们越来越多的重视。本文在LS- SVR 的基础上, 提出了半监督LS- SVR( S2 LS- SVR) 模型, 类似于LSSVR,该模型也只需求解一个线性方程组。最后建模分析了烤烟样品的四种样品成分含量, 平均误差和相关系数指标均优于PLS 和LS- SVR。
张军发布的其他共享资料
    0 色谱币 下载

近红外光谱定量分析的新方法_半监督最小二乘支持向量回归机

(1794.089K)

所需色谱币: 0

您持有: $userGold色谱币,完成任务赚取色谱币

立即下载

友情链接(联系QQ:47140047)
关于我们  经营理念  业务合作  联系我们  法律声明  网站建议  网站导航  帮助中心
Copyright © 色谱世界 版权所有 陇ICP备2024006362号-2