多信号源近红外光谱数据标准化算法设计及应用研究的文献综述
摘要:近红外数学模型包含了样品状态、装样条件、仪器性能和分析时间等的信息,每一种近红外数学模型只能适应一定的样品、时间与空间范围[1],在实际应用中,因不同类型仪器性能的差异,不能直接运用原来的数学模型预测分析未知样品,否则,可能产生错误的预测结果,即同一模型难以实现在不同仪器间的通用,模型传递问题已经成为影响NIRS技术发展的主要问题之一[2]。要实现模型转移,首先要使两组光谱数据匹配[1],采用插值算法,利用Matlab编程平台进行算法设计,可以达到近红外光谱数据标准化效果。目前,学术界对近红外光谱技术及其模型转移相关问题进行了大量的研究和实践,取得了一批有启发性、建设性的成果,为本课题提供了大量的理论参考。本文对国内外部分学者的有关文献进行了梳理和总结。
关键词:近红外光谱,数据匹配,模型传递,通用化设计
一、前言
近红外光是指波长介于可见区与中红外区之间的电磁波,其波长范围约为0.8~2.5㎛,波数范围约为12500~4000cm-1。近红外光谱分析兼备了可见区光谱分析信号容易获取与红外区光谱分析信息量丰富两方面的优点,加上该谱区自身具有的谱带重叠、吸收强度较低、需要依靠化学计量学方法提取信息等特点,使近红外光谱分析成为一类新型的分析技术[1]。近红外光谱作为一种适合过程分析和快速检测的的技术,被广泛应用于定性鉴别和定量分析,可达到对检测对象种类进行自动判别和对象成分进行相关分析的效果,并且具有快速无损、简便、无化学试剂污染等优点。虽然各种近红外光谱仪器信号采集的光谱数据波段范围重叠,但其波长和波数间隔不一致,对于不同类型的近红外光谱仪,无法进行统一的数据分析,因此,需要在两类仪器间进行模型转移,先实现两组光谱数据匹配,再实现仪器间的标准化问题。通过模型转移实现同一模型在不同仪器间的通用,对近红外快速分析软件通用化的研发具有重要意义,实现更加便捷、精准地实现对检测对象种类的自动判别和分析模型的自动匹配,达到更好的定性分析效果。
- 国内外相关研究
- 、插值算法相关应用
对不同类型的近红外光谱仪器,尤其是连续型光谱仪与离散型光谱仪之间,模型转移因为涉及到数据量的多少以及波长对齐的问题,需要单独考虑。为了在两类仪器间进行模型转移,首先要使两组光谱数据匹配,就是使它们的波段范围、波长位置及数据间隔一一对应,再实现仪器间的标准化问题。匹配的方法一般是将含信息量高的仪器以含信息量低的仪器的波段范围、波长位置及数据间隔为准[1]。对于低信息量仪器有而高信息量仪器没有的点,高信息量仪器需要向低信息量仪器对齐,即利用已知数据点构建一个插值函数来近似高信息量仪器数据间原本的函数关系,进而求得低信息量仪器所需要的点来实现光谱数据匹配。方彦军、易凤飞等人[3]利用一种分段插值同步算法(PISA),通过插值算法得到了同步的采样值,实现了数字化变电站的过程层同步采样,降低了系统对硬件的要求,提高了系统的可靠性;陆峰、章永进等人[4]提出利用Catmull-Rom样条插值方法对获得的关键点进行插值,该插值方法使插值曲线经过关键点,且插值算法不受坐标分布的影响,并对提供的点坐标的排列没有严格要求,能够满足无人车路径选择的需要。
(二)、近红外光谱模型传递问题
就模型而言,近红外光谱分析技术是通过模型进行识别定量,间接分析的技术,所建立的模型质量直接会影响到其分析检测结果[5]。近红外光谱模型传递是解决分析仪器或分析方法通用性的关键技术。近红外光谱受测量仪器或测量条件的影响较大,模型转移对近红外光谱技术的实际应用尤为重要[6]。杨浩、熊智新等人[7]研究了苹果可溶性固形物含量(SSC)的近红外模型传递问题。分别采用一元线性回归直接标准化(SLRDS)算法、斜率/截距(S/B)法和专利算法(Shenkrsquo;s)进行主机和从机间的模型传递,讨论了3种算法的传递效果和转换集标样数对传递效果的影响。结果表明,经过3种方法传递后预测集的预测效果比传递前均有不同程度提高,其中SLRDS算法传递效果最佳,可见利用SLRDS算法实现两台便携式光谱仪之间的模型传递是可行的。因此对于多台同型号便携式光谱仪在实际应用中遇到的模型不能共享的问题,SLRDS算法是一种简单、有效的解决方法,这对NIRS技术在水果无损检测方面的推广应用具有重要意义。张进、蔡文生等人[6]对比了近年来近红外光谱分析中被广泛应用和新提出的模型转移算法,从计算原理角度梳理了有标样和无标样算法的联系和区别。有标样算法具有结构统一、计算效率高的特点,比较适用于光谱线性差异的校正,重点介绍了基于多元校正、因子分析、人工神经网络、多任务学习的模型转移方法,无标样算法重点介绍了基于光谱校正、模型参数校正和稳健建模的模型转移方法,并从算法的角度分析了各种模型转移方法的特点和转移效果。在众多方法中分段直接标准化及其变体仍是模型转移的黄金标准,但是,基于因子分析的算法正变得受欢迎且基于神经网络和多任务学习的方法近年来也吸引了越来越多的注意。PDS作为一种经典的模型转移方案,无论是在理论参照和实际应用中都仍然是首选对象。然而PDS在稳健性、抗干扰能力、转移后光谱的异常噪声消除等方面依然还有提升空间。模型转移算法发展中依然有很多问题需要注意:标准样品需求量大、转移参数过多、不稳健、计算复杂度高等问题。信晓伟、宫会丽等人[8]在传统S/B算法进行线性拟合、偏最小二乘法求参数的基础上加以改进,提出了引入变量的高次幂、使用Lagrange插值法与Newton插值法求待定系数和插值多项式来解决两组数据的非线性问题。实验结果表明:直接用主机原模型对子机预测的值与真实值差距较大,利用改进的S/B算法(H‐S/B)比传统的S/B算法预测值更接近真实值。改进的S/B算法提高了预测值的准确性,解决了传统S/B算法的非线性问题,实现了更好的模型转移效果,增强了网络化模型应用的通用性。Nawar,Buddenbaum等人[9]研究比较了偏最小二乘回归(PLSR)、支持向量回归(SVR)和多元自适应回归样条(MARS)三种回归技术的性能,以确定评估有机质(OM)和粘土含量的最佳方法。交叉验证结果表明,在大多数情况下,MARS模型的性能优于PLSR和SVR模型,使用带有CR制备处理的MARS校准方法获得最佳预测。吴丽君、张磊等人[10]基于改进的直接标准化(DS)算法构建烟丝和粉末近红外光谱转移模型,使得烟气指标近红外定量模型的预测性能显著提高,有效降低烟叶物理形态对近红外光谱造成的影响,有效实现了不同类型光谱间的模型共享。
三、结论
近红外光谱(NIRS)分析技术具有分析速度快、无污染、对样品无损伤等优点,近年来已在无损检测中得到广泛的应用[11~12],但由于应用场景的复杂化以及近红外光谱受测量仪器或测量条件的影响较大,采集的光谱会发生吸光度差异和波长漂移[13],造成预测结果偏差,要解决这类问题并且实现模型在各个仪器间的通用化,模型转移对近红外光谱技术的实际应用尤为重要。在如何进行合理有效的模型转移方式上,该领域学者做了大量研究,并提出了很多改良的模型转移算法。同时,由于各种近红外光谱仪器信号采集的光谱数据波段范围虽重叠,但其波长和波数间隔不一致,使之无法进行统一的数据分析,如何通过插值算法以及Matlab平台程序设计将不同来源的近红外光谱数据标准化,对近红外快速分析软件通用化的研发将具有重要意义,实现更加便捷、精准地实现对检测对象种类的自动判别和分析模型的自动匹配,达到更好的定性分析效果。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。