-
近红外光谱结合人工神经网络分析蔗汁的锤度和旋光度
摘要应川中波近红外(N I R)光谱结合误差反传人工神经网络(B P—A N N)方法,建立蔗汁锤度、旋光度的定量分析模。光谱范围为1 O O¨0~1 8 0 0 n n l,采H J 2 m m光程透射方式获得蔗汁吸光度光谱。对蔗汁的吸光度光谱进行S a v i t z k y-G o l a y求导和均值中心化处理,然后通过相关系数法结合样品特征吸收优化建模波长范,阿采j f J P L S降维获取主成分并输入B P-A N N建立校正模型,用验证样品对校正模型进行验证。结果显示,B P A N N法建赢的锤度和旋光度的预测相关系数(R)分别为0.9 8 2,0.9 7 9,预测标准偏差(S E P)分别为0.1 5 9和0.1 3 7,均优于偏最小二乘(P L S)建模方法结果,可较好地用于蔗汁锤度、旋光度的快速测定。
关键词人-I 2#0经网络;近红外光谱;蔗汁;锤度;旋光度
引言
我国是糖业大困,较大规模的蔗糖厂达数百家。蔗汁的品质分析埘甘蔗收购的品质评价、制糖的生产管理具有十分重要的意义。锤度、旋光度是衡量}_f‘蔗品质的重要指标,测定锤度的常规方法有折光锤度法、比重锤度法,测定旋光度的常规办法是一次旋光法。常规方法虽准确度较高,但操作繁琐费时,每个指标郁需用各自特定的分析方法,尢法实现生产过程中大量样品的多指标快速分析。
近红外光潜分析技术利用物质含氢基团振动的合频和倍频吸收信息,进行物质的定性和定嚣分析l 1。该技术具有分析速度快、不破坏样出、无化学污染、多组分同时测定等优点,被誉为“多怏好省的绿色分析技术”I I,在行化、农业、食品、制药等领域得到J,广泛的应川一J。根据A S T M的规定,近红外光的波长范围为7 8 0~2 5 2 6 n m。根据近红外吸收倍频区间的同,以及埘腑的近红外探测器的不同,习惯上将7 8 O~1 1 0 0 n m,l 1 0 0~l 8 0 0,l 8[)()~2 5 2 6 n m分别称为短波、中波和长波近红外Ⅸ问。小同区间具有不同的透射和漫反射性质,适合小闻的样品分析。
蔗汁及其制品的主要成分如水分、蔗糖、还原糖、氨基酸、果胶等都含有近红外区域具有特征吸收的含氢团,因此可用近红外光谱法进行蔗汁及其制品的成分及性质分析。国内外已开展了相关研究],并成功应用于甘蔗收购的按质论价等方面。这些研究主要基于7 8 0-2 5 2 6 n m的全波段近红外仪器进行透射或漫反射测量,在数据建模上采用偏最小二乘(P L S)方法。
与昂贵的全波段近红外仪器相比较,r f 1波近红外分析仪具有优秀的性价比。在蔗汁分析中,还未见基于中波近红外的研究报道。同时,由于温度、背景变化等因素影响,样品性质与光谱之间的关系也存在一定的非线性,采用非线性校正方法在理论上有望建立更好的预测模型。人工神经网络(A N N)足被广泛使用的同归分析方法,可有效映射非线性数据依赖关系。
基于以上分析,本文探讨将中波近红外光谱结合误差反传人T神经网络方法(B P—A N N)应用于蔗汁分析的可行性,并P I S建模方法进行比较。
1材料与方法
1.1仪器设备与材料
S u p N I R 2 6 0 0近红外光谱分析仪(聚光科技(杭州)股份有限公司),该仪器采用致冷的E~I n G a A s检测器,光谱范同1 0 0 0 1 8 0 0 n I T l,分辨率6 n m,波长问隔1 n m,全谱扫描时间小于0.2 S。石英比色皿的光程为2 I T I 1 T I。软件采用C M2 0 0 0化学计量学软件(聚光科技(杭州)股份有限公司)。
1.2样品来源及参考值的测定
甘蔗清汁样品由广西某糖厂提供,共7 2个样品。蔗汁锤度、旋光度的测定参照G B/T 1 0 4 9 9—8 9,锤度采用比重锤度测定法测定,旋光度采用一次旋光法测定。样品的锤度和旋光度的统计结果如表1所示。
1.3近红外光谱采集
1.4 B P-ANN原理
B P-A N N是应用研究最多的一种神经网络方法l 7。,它具有良好的非线性映射能力。典型的B P-A N N由输入层、隐含层、输出层组成。数据由输入层输入,经标准化处理,乘以权重再传输到隐含层;隐含层经过权值、阈值和传递函数运算后,传输到输出层;输出层给出神经网络的预测值,并与期望值进行比较,如果存在误差,则从输出反向传播该误差,调整权值、阈值,使A N N输出与期望输出一致。为减小网络规模以缩短训练时间,去除噪音并保留有效信息,在应用A N N的过程中,常使用主成分分析或偏最小二乘法对光谱数据降维,获得的主成分得分作为网络的输入变量。在建立B P-A N N的过程中,需要确定一系列参数,如隐含层的节点数,输入层到隐含层、隐含层到输出层的初始权重,隐含层、输出层的传递函数,学习速率、动量等。
2结果与讨论
2.1近红外光谱预处理
所测的样品近红外光谱数据依次应用S a v i t z k y-G o l a y平滑(窗口参数1 3,拟合次数2)、S a v i t z k y-G o l a y求导(窗口参数2 1,拟合次数3,求导次数1)和均值中心化运算,实现光谱预处理。
2.2建模波段选择
由于蔗汁的近红外吸光度光谱存在较强的水吸收干扰,建模时应避开水的吸收区间。本文首先排除吸光度大于1的波长区间,并进一步采用相关系数法结合样品的特征吸收选择波段范围,最终选择1 1 2 2~1 3 8 9 n m,1 5 3 6~1 5 8 1 n m,1 6 2 8~1 7 3 8 n m作为建模波长区域。
2.3神经网络参数选择
在B P神经网络的建立过程中,选择合适的P L S主成分作为神经网络的输入变量,可以减小神经网络规模,降低训练时问,并可充分利用原始光谱中的有用信息,剔除噪声。通过交互验证,利用预测残差平方和(P R E S S值)比因子选择数法㈣确定P L S降维的最佳主成分数为5。因此,设置A N N输入层节点数为5,即取5个主成分得分作为输入变量。设置A N N隐含层的节点数目为1 0,输入层到隐含层的初始权重、隐含层到输出层的初始权重为一O.5~0.5之间的随机数,隐含层、输出层的传递函数选择S型非线性函数,初始学习速率为0.1,动量项为0.9。
2.4 B P-A N N模型
从全部7 2个蔗汁样品中,随机取5 4个作为校正样品,剩余1 8个作为预测样品;采用异常样品判别方法(对学生残差进行t分布检验,如果大于阈值则判别为异常)剔除了2个异常校正集样品。采用B P-A N N与P L S方法建立的蔗汁锤度和旋光度模型统计指标如表2所示。图2(a)和2(b)分别是使用B P-A N N方法获得的蔗汁校正集样品的锤度和旋光度化学值(参考值)与相应预测值的相关曲线,横轴为化学值,纵轴为预测值。图3(a)和3(b)分别是蔗汁预测集样品的锤度和旋光度化学值与相应预测值的相关曲线。
从图2和图3可见,采用近红外光谱结合B P—A N N方法获得的蔗汁锤度和旋光度的预测值与化学值之间均具有良好的相关性。从表2可见,采用B P—A N N方法建立的模型指标均优于P L S法;也优于国内同类文献(基于全波段F T-N I R光谱仪)所报道的统计指标l 5]。相对分析误差(R P D)大于3,说明模型效果良好,预测精度高,所建立的B P—A N N校正模型可用于实际检测。
3结论
本文采用中波近红外光谱结合B P A N N建模的方法,建立了蔗汁锤度和旋光度的定量分析模型。对未知样品的预测结果显示,该方法可满足糖业生产管理的分析要求。与全波段近红外仪器相比,中波近红外光谱仪具有较佳的性价比,可以快速分析蔗汁的多个指标,操作简便,分析结果准确,可用于甘蔗收购的按质论价、糖厂生产过程的分析与控制。