-
葡萄是我国五大水果之一,2017年的总产量高达1308.0万吨[1]。红提葡萄果肉坚实、颗粒饱满、香甜可口受到人们的广泛喜爱。可溶性固形物含量(Soluble solids content,SSC),一般也称为糖度,是评价水果内部品质的关键参数,也是集可溶性糖、酸、纤维素等成分在内的综合指标[2],是消费者进行购买时的重要参考,也是反映水果成熟度的重要指标[3]。葡萄果粒含有较高的水分,使葡萄果粒呈现出新鲜饱满和脆嫩的状态,具有较好的口感。葡萄容易出现腐烂、软化、干梗等现象,导致葡萄的品质降低[4]。含水率作为果蔬中重要的衡量指标,对果蔬的品质、质构及风味产生较大的影响,且含水率也是葡萄腐败变质的重要原因,及时的检测葡萄果粒的含水率,根据含水率挑选出将要腐烂的果实,对保护周边好的果粒,延长贮藏时间至关重要。含水率可以在一定程度上反映葡萄的贮藏时间,同样可以判断出葡萄是否新鲜。
传统糖度检测方法为进行破坏试验,挤出汁液利用折射法进行测定,含水率的测定通过烘干法进行测定,繁琐费时,且只能进行抽样检测,检测范围较小,检测完的实验样本损坏后无法销售。近红外光谱技术具有检测时间短、操作简单等优点,被广泛应用在苹果、哈密瓜、梨、柑橘等食品内部品质的无损检测[5-12]。国内对果蔬含水率的检测相对较少[5],朱丹实等[4]研究了湿度条件对巨峰葡萄贮藏过程中水分及质构变化的影响,并建立不同湿度下的贮藏时的水分变化规律。韩东海等[13]利用近红外技术实现了对小型西瓜生长过程中可溶性固形物和水分的快速无损检测,并确定了最佳光谱采集区域。孙海霞等[14]利用光谱和含水率补偿方法建立了稳定可靠地鲜枣品质(含水率含量、可溶性固形物含量、维生素C含量、蛋白质含量、硬度值)模型。目前,大多数的研究大都集中在对水果的糖度研究,刘燕德等[15]搭建了以STS光谱仪和自制样品杯作为光谱检测装置的苹果可溶性固形物便携式检测平台,结合偏最小二乘法建立苹果的可溶性固形物定量检测模型精度最高,模型的预测集相关系数Rp为0.924。许峰等[16]利用可见/近红外技术检测红提糖度和酸度含量,糖度和酸度预测集的相关系数分别为0.9568、0.9405,实现了红提糖度和酸度的快速无损检测。已有研究中鲜有针对红提含水率含量进行研究,同时对红提糖度和含水率的综合检测研究还未见报道。
本文通过可见/近红外光谱技术,分析红提的放置模式对模型的影响,寻找到最好的光谱采集方式;对光谱数据进行预处理,确定最佳预处理方式,并在最佳预处理方式下,分别建立红提糖度和含水率含量的PLSR和LSSVM模型,比较模型的稳定性和精度,对比分析不同模型的优劣,并确定了不同模型的应用场景,通过一次光谱采集,实现同时无损测定红提糖度和含水率的含量。
-
实验材料为晚红品种的新鲜红提,购买于中百超市,分别在每穗红提的外部、中部、顶部、尖部挑选大小相近,颜色差异明显、表面无损伤的红提果粒作为实验样本,建模样本总数为360粒。将样本编号并放入恒温恒湿箱中保存12小时[17],恒温箱温度设置为(22±1)℃,相对湿度为65%。
-
Maya2000Pro+微型光纤光谱仪(波长范围为200 nm~1100 nm,信噪比为450:1),因光谱两端噪声较大,选取550 nm~1050 nm的波段作为原始光谱进行建模分析 美国Oceanoptics公司;恒温恒湿箱,上海新苗医疗器械制造有限公司;申光WAY(2WAJ) 阿贝尔折射仪,上海仪电物理光学仪器有限公司;JA2002 电子天平,上海浦春计量仪器有限公司;电热鼓风干燥箱,余姚市星辰仪表厂。
-
搭建的近红外采集实验平台如图1所示,实验时,将红提果粒放到中间带有圆孔的隔板上,分别采用果柄朝上的竖放和垂直于果柄的横放方式进行光谱的采集,84UV准直透镜与中间隔板的距离为4.5 cm,聚光透镜离中间隔板的距离为3.0 cm。如图1所示。
采用Maya2000Pro微型光纤光谱仪,将恒温后的样本进行光谱采集。采集前,先打开光谱及光谱仪采集软件,将系统预热30 min。光谱仪采集软件的参数设置为:积分时间100 ms,平均次数10次,平滑宽度5 nm,将红提果粒放到中间隔板的圆孔中,采集果粒的光谱数据。
-
样本制备:将采集完光谱的红提样本,首先用小刀在红提头部(果柄相对的部位)切下大约5 g的红提剪切样本,进行含水率的测定;然后将剩余的红提果粒试样,按照国家鲜葡萄行业标准GH/T 1022-2000,分别对红提果粒压成汁,并用玻璃棒搅拌均匀[18],立即测定糖度。
糖度测定:参照NY/T 2637-2014《水果、蔬菜制品可溶性固形物含量的测定——折射仪法》[19]。
含水率测定:含水率的测定采用国标 GB 5009.3—2016《食品中含水率的测定》[20]。取洁净铝盒,根据国标,加热、干燥后称量铝盒的质量为m3,加入红提剪切样本后,样本加铝盒的质量为m1,然后放入温度为105 ℃的电热鼓风干燥箱内烘干,得到烘干后样本加铝盒的质量m2,试样中红提的含水率含量X,按式(1)进行计算:
$$ X=\frac{{m}_{1}-{m}_{2}}{{m}_{1}-{m}_{3}}\times 100\%$$ (1) 式中 X——红提试样中含水率的含量(%);
m1——铝盒和红提试样的质量,(g/100 g);
m2——铝盒和红提试样干燥后的质量,(g/100 g);
m3——铝盒的质量,(g)。
-
本文分别建立基于原始光谱和进行特征波长提取后的光谱信息建立红提糖度和含水率的PLSR、LSSVM模型。
运用原始光谱及光谱预处理后的可见/近红外光谱数据,分别采用一次降维(GA、SPA、CARS、UVE)和二次降维组合(CARS-SPA、UVE-SPA、GA-SPA)七种数据降维方法对光谱进行特征变量提取;分别结合偏最小二乘回归算法((Partial Least Squares Regression,PLSR))与最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)进行模型的建立,对比分析模型的优劣。
PLSR是一种经典的通过最小化偏差平方和对曲线进行线性拟合,结合了多元线性回归、相关分析和主成分的优点,广泛应用于近红外光谱模型的建立[21]。最小二乘支持向量机[22-23](LSSVM)有效的简化模型的同时提高了模型的运算速度,采用求解一次线性组来代替支持向量机中复杂二次优化问题。
模型的准确性和稳定性由校正集相关系数(correlation coefficient of Calibration,Rc)及均方根误差(Root Mean Square Error of Calibration set,RMSEC)、预测集相关系数(Root Mean Square Error of Prediction set,Rp)及均方根误差(Residual predictive deviation,RMSEP)、残差预测偏差(Residual predictive deviation,RPD)进行模型性能的评价[24]。相关系数越接近1,均方根误差越接近0,模型的预测性能及稳定性越好。RPD的评价指标:RPD的值小于1.5表示预测性能较差;1.5到2.0之间表示模型可以预测低值和高值;2.0到2.5之间表示可以进行粗略的定量预测;2.5到3.0或更高的值表示具有良好的预测精度。
$$ {R}_{C}=\sqrt{{\displaystyle \sum _{i=1}^{{n}_{c}}{({y}_{pi}-{y}_{mi})}^{2}}}\Bigg/\sqrt{{\displaystyle \sum _{i=1}^{{n}_{c}}{({y}_{pi}-{y}_{mean})}^{2}}}$$ (2) $$ {R}_{p}=\sqrt{{\displaystyle \sum _{i=1}^{{n}_{p}}{({y}_{pi}-{y}_{mi})}^{2}}}\Bigg/\sqrt{{\displaystyle \sum _{i=1}^{{n}_{c}}{({y}_{pi}-{y}_{mean})}^{2}}}$$ (3) $$ RMSEC=\sqrt{\frac{1}{{n}_{c}}{\displaystyle \sum _{i=1}^{{n}_{c}}{({y}_{pi}-{y}_{mi})}^{2}}}$$ (4) $$ RMSEP=\sqrt{\frac{1}{{n}_{p}}{\displaystyle \sum _{i=1}^{{n}_{p}}{({y}_{pi}-{y}_{mi})}^{2}}}$$ (5) $$ RPD=st{d}_{prediction}/RMSEP$$ (6) 式中 ypi——预测集中的第i个样本的预测值;
ymi——校正集中的第i个样本的实际测量值;
ymean——对应所有nc个校正集样本或np个预测集样本实际测量值的平均值;
stdprediction——预测集的标准差。
-
因外界环境(光线、噪声等)影响,使得采集的光谱在550 nm之前和1050 nm之后的光谱包含较多的噪声。参考现有学者的研究,光谱波长在550 nm~1100 nm时,包含较多的关于糖度和含水率的信息[13、16]。本文选择的波长范围为550 nm~1050 nm进行研究。红提样本采集的原始光谱如图2所示,可以看出,所有红提样本的光谱都呈现出相同的变化趋势,在波长为550 nm之后透过率显著升高,725 nm~920 nm波长光强度较高但变化较小,光谱的透过率较平稳,其中波峰为635 nm,波谷为675 nm和980 nm。
光谱预处理能有效的消除仪器噪声、暗电流等因素的影响。在进行建模前,采用标准正态变量变换(Standard Normal Variable transformation,SNV)、SavitZky-Golay卷积平滑处理法(SavitZky-Golay,S_G)、归一化(Normalized,Nor)等预处理方法[25、27],确定较好的预处理方式。
由表1可知,红提糖度和含水率的光谱数据进行预处理后所建PLSR模型的相关系数和均方根误差都有所降低,模型变得更加不稳定,因此直接利用原始光谱建模。
表 1 采用不同预处理方法的全波长PLSR检测模型
Table 1. Full-wavelength PLSR detection model using different pre-processing methods
指标 预处理 LVs主因子数 校正集 预测集 Rc RMSEC Rp RMSEP 糖度 原始光谱 15 0.927 0.498 0.933 0.493 SNV 19 0.954 0.412 0.907 0.468 S_G 14 0.793 0.809 0.808 0.759 Nor 20 0.957 0.401 0.878 0.516 含水率 原始光谱 15 0.901 0.549 0.868 0.780 SNV 15 0.892 0.583 0.842 0.731 Nor 15 0.893 0.603 0.832 0.719 -
KS(Kennard-Stone,KS)法[28]优点是能够有效的选取光谱数据差异较大的样本作为校正集,剩余的样本划分为预测集,提高模型的适应性和预测的精度。试验中共采集了360个红提样本,利用KS法将360红提样本,以3:1的比例分别划分为校正集270个和预测集90个。样本统计结果如表2所示。
表 2 利用KS算法划分样本集的数据统计
Table 2. Data Statistics of Partitioning Sample Sets using the KS Algorithm
样本数量 指标 最小值 最大值 平均值 标准差S.D 变异系数C.V 校正集(270个) 糖度/(°Brix) 16.8 24.0 20.2 1.334 6.595% 含水率/(%) 76.689 84.327 80.746 1.268 1.570% 预测集(90个) 糖度/(°Brix) 17.8 22.7 20.2 1.275 6.293% 含水率/(%) 76.635 83.621 80.582 1.450 1.780% 从表2中可以看出,糖度分布范围为(16.8~24.0)°Brix,校正集和预测集的标准差分别为1.334、1.275;含水率的分布范围为(76.635~84.327)%,校正集和预测集的标准差分别为1.268、1.450。通过KS法所划分的糖度和含水率校正集的分布范围比预测集的分布范围更广,证明所挑选出来的校正集样本具有代表性。
-
分别对横放、竖放(果柄侧朝上)、整个果粒平均得到的光谱数据建立偏最小二乘回归模型,根据PLSR模型的准确性和稳定性,确定最优的光谱采集方式。表3为不同放置模式的全波长PLSR预测模型。
表 3 不同放置模式的全波长PLSR检测模型
Table 3. Full-wavelength PLSR detection model with different placement modes
放置模式 指标 LVs主因子数 校正集 预测集 Rc RMSEC Rp RMSEP 竖放 糖度 16 0.922 0.503 0.907 0.589 含水率 15 0.897 0.567 0.861 0.812 横放 糖度 15 0.908 0.576 0.890 0.614 含水率 15 0.884 0.629 0.811 0.921 平均光谱 糖度 15 0.927 0.498 0.933 0.493 含水率 15 0.901 0.549 0.868 0.780 由表3可知,竖放模式优于横放模式建立的红提糖度和含水率的PLSR模型,竖放模型下进行光谱采集所建PLSR模型的检测性能和稳定性比横放模式更好。利用整个果粒的平均光谱建立的糖度和含水率模型效果最优,糖度和含水率的校正集的相关系数分别为0.927、0901;预测集的相关系数分别为0.933、0.868,模型的稳定性和精度最好;在三种模式下糖度和含水率的相关系数都大于0.850,表明可见/近红外光谱能够有效的预测红提糖度和含水率,糖度建立模型的相关系数明显高于含水率的相关系数,表明相较于红提的含水率,可见/近红外光谱更能较好的预测红提的糖度。
-
根据上文分析的结论,采用整个果粒的平均光谱作为原始光谱进行研究分析。因原始光谱包含较多的波长点、数据较多,所建模型的运算时间较长、相关系数不高、均方根误差较大、模型精度和稳定性较低,故研究在特征波长提取下建立不同模型,得到最好的红提糖度和含水率检测模型。下文以糖度为例进行特征波长的提取。
-
利用遗传算法(Genetic Algorithm,GA)算法提取特征波长,建立红提糖度模型为例,在GA运算过程中,设定初始群体为30,交叉率为50%,变异率为1%,最大迭代次数为100,最大循环次数为20次,以最小的RMSECV值为标准,挑选出在迭代过程中出现频次较多的波长点;最终选定特征波长点为85个,如图3B所示,占原始光谱信息的7.39%,GA所选特征波长如图3A所示。
-
利用连续投影算法(Successive Projection Algorithm,SPA)算法提取特征波长,建立红提糖度模型为例,设定波长选择变量数范围为5~40,选择步长为1;如图4A所示,当变量个数为17时,RMSEC最小为0.527;占原始光谱信息的3.88%,在原始光谱中所选特征波长位置如图中4B所示。
-
利用竞争性自适应重加权(Competitive Adaptive Reweighted Sampling,CARS)算法提取特征波长,以建立红提糖度模型为例,本研究设定蒙特卡罗采样为50次,采用5折交叉验证法。由图5可知,当RMSECV值达到最小值时,各变量的回归系数位于图5C中竖直线位置,采样运行30次。
-
利用无信息消除法(Uninformative Variable Elimination,UVE)算法提取特征波长,以建立红提糖度模型为例,设定噪声矩阵处最大稳定性绝对值的99%作为剔除阈值,图6中黄色曲线代表光谱变量的稳定性值,红色曲线代表噪声变量的稳定性值,两水平蓝色虚线为变量的选择阈值(+-17.78),蓝色虚线内部的为无用信息被剔除,外部的为通过UVE选取的特征波长,选取结果如图8所示,通过UVE共选取437个特征波长,占原始光谱的38.00%。
-
将各算法提取的特征波长作为模型的输入量,以通过实验方法获得的红提糖度和含水率作为模型的结果,分别建立PLSR和LSSVM模型。
-
红提糖度PLSR预测模型的最优特征波点所建方程:
$$ \begin{aligned} Y =\; & 0.590{\lambda _{722.35}} - 3.475{\lambda _{774.15}} + 9.305{\lambda _{802.39}} - 10.549\\ &{\lambda _{813.39}} + 13.208{\lambda _{867.92}} + 13.818{\lambda _{882.13}} - 16.263\\ & {\lambda_{904.45}} - 13.001{\lambda _{910.44}} - 8.856{\lambda _{929.67}} + 8.390\\ & {\lambda _{943.31}} + 17.024{\lambda _{950.11}} + 11.629{\lambda _{954.36}} - 18.622\\ & {\lambda_{968.36}} - 18.906\\ &{\lambda _{975.57}} + 12.063{\lambda _{1002.59}} + 20.222 \end{aligned} $$ 红提含水率PLSR检测模型的最优特征波点所建方程:
$$ \begin{aligned} Y =\; & 1.643{\lambda _{750.06}} - 9.844{\lambda _{799.03}} + 12.596{\lambda _{825.98}} + 11.115\\ &{\lambda _{835.52}} - 4.719{\lambda _{859.73}} - 7.552{\lambda _{863.61}} - 11.261 \\ &{\lambda_{869.64}} - 16.016{\lambda _{878.26}} + 10.238{\lambda _{904.02}} + 12.682 \\ &{\lambda_{909.58}} + 11.502{\lambda _{913.01}} - 21.728{\lambda _{947.56}} + 12.463 \\ &{\lambda_{967.09}} + 80.476 \end{aligned} $$ 由表4、表5可知,相较于其他的特征波长提取方法,UVE和GA所提取的特征波长数量较多。在一次特征波长提取中,通过GA算法提取的特征波长建立的PLSR模型的相关系数较大,均方根误差较小,模型比较稳定,GA算法可以有效的提取红提糖度和含水率的有效特征信息,但GA提取的特征信息较多,可通过二次特征波长提取,简化模型。在二次特征波长的提取中,红提糖度和含水率的最优组合波长提取方法为GA-SPA-PLSR,最优模型的预测集相关系数分别为0.958、0.938,均方根误差分别为0.375、0.512,可以有效的预测红提的糖度和含水率。
表 4 基于特征波长建立的红提糖度和含水率PLSR检测模型
Table 4. Red globe grape sugar and moisture content PLSR detection model based on wavelength characteristics
指标 特征波长提取方法 波点个数 LVs主因子数 校正集 预测集 RPD Rc RMSEC Rp RMSEP 糖度 原始光谱 1150 15 0.927 0.498 0.933 0.493 2.586 GA 85 13 0.941 0.450 0.929 0.499 2.555 SPA 17 15 0.889 0.610 0.921 0.527 2.419 CARS 27 15 0.915 0.537 0.926 0.502 2.540 UVE 437 13 0.912 0.547 0.925 0.510 2.500 CARS-SPA 9 5 0.896 0.592 0.919 0.529 2.410 UVE-SPA 15 10 0.898 0.585 0.917 0.531 2.401 GA-SPA 15 10 0.957 0.390 0.958 0.375 3.400 含水率 原始光谱 1150 15 0.901 0.549 0.868 0.780 1.860 GA 78 10 0.900 0.551 0.892 0.728 1.992 SPA 12 11 0.840 0.687 0.838 0.833 1.741 CARS 27 15 0.901 0.549 0.868 0.780 1.859 UVE 615 13 0.891 0.574 0.874 0.758 1.913 CARS-SPA 11 11 0.819 0.726 0.848 0.858 1.690 UVE-SPA 19 14 0.882 0.597 0.867 0.770 1.884 GA-SPA 13 7 0.934 0.454 0.938 0.512 2.832 表 5 红提糖度和含水率PLSR检测模型的最优特征波点列表
Table 5. List of optimal wave point characteristics of the PLSR sugar and moister content detection model for red globe grapes
指标 建模方法 波长/nm 糖度(15个) GA-SPA-PLSR 722.35、774.15、802.39、813.39、867.92、882.13、904.45、910.44、929.67、943.31、950.11、954.36、968.36、975.57、1002.59 含水率(13个) GA-SPA-PLSR 750.06、799.03、825.98、835.52、859.73、863.61、869.64、878.26、904.02、909.58、913.01、947.56、967.09 -
由表6、表7可知,相较于其他的特征波长提取方法,UVE和GA所提取的特征波长数量较多。在一次特征波长提取中,通过GA和UVE算法提取的特征波长建立的PLSR模型的相关系数较大,均方根误差较小,模型比较稳定,可以有效的提取红提糖度和含水率的有效特征信息,但提取的特征信息较多,可通过二次特征波长提取,简化模型。在二次特征波长的提取中,红提糖度和含水率的最优模型波长提取方法分别为CARS-SPA-LSSVM、UVE-SPA-LSSVM,最优模型的预测集相关系数分别为0.969、0.942,提取的特征波长数量分别9、19个,占原始光谱数据的0.78%、1.65%。LSSVM所建模型的效果好于PLSR所建模型,但模型的运算时间较长。
表 6 基于特征波长建立的红提糖度和含水率LSSVM检测模型
Table 6. LSSVM sugar and moisture content detection model for red globe grapes using on wavelength characteristics
指标 特征波长提取方法 波点个数 γ σ2 校正集 预测集 RPD Rc RMSEC Rp RMSEP 糖度 原始光谱 1150 606877.813 27698.587 0.976 0.296 0.937 0.451 2.827 GA 85 486007.978 1715.475 0.964 0.354 0.940 0.441 2.891 SPA 17 255631.106 269.184 0.946 0.436 0.905 0.544 2.344 CARS 27 352524.566 442.091 0.944 0.442 0.941 0.434 2.938 UVE 437 709628.506 8410.785 0.968 0.338 0.942 0.431 2.958 CARS-SPA 9 493958.299 187.240 0.967 0.340 0.969 0.322 3.960 UVE-SPA 15 394145.82 282.089 0.935 0.472 0.925 0.485 2.629 GA-SPA 15 347263.829 384.322 0.935 0.473 0.937 0.449 2.839 含水率 原始光谱 1150 54302.715 46313.338 0.949 0.405 0.888 0.711 2.040 GA 78 351395.906 2351.707 0.931 0.465 0.899 0.683 2.124 SPA 12 224241.827 258.227 0.873 0.620 0.844 0.806 1.800 CARS 27 454665.452 23000.299 0.962 0.350 0.891 0.686 2.114 UVE 615 647436.819 22685.185 0.947 0.412 0.896 0.684 2.120 CARS-SPA 11 751032.167 865.070 0.883 0.595 0.843 0.820 1.769 UVE-SPA 19 606836.672 365.462 0.945 0.451 0.942 0.475 3.053 GA-SPA 13 3888528.517 496.001 0.908 0.531 0.889 0.728 1.992 表 7 红提糖度和含水率LSSVM检测模型的最优特征波点列表
Table 7. List of optimal wave point characteristics of the LSSVM sugar and moisture content detection model for red globe grape
指标 建模方法 波长/nm 糖度(9个) CARS-SPA-LSSVM 826.41、874.38、880.84、904.45、910.44、915.15、944.16、950.96、974.30 含水率(19个) UVE-SPA-LSSVM 644.83、647.94、711.77、726.76、768.90、781.14、803.82、815.56、825.98、863.61、876.53、888.14、909.16、914.72、959.03、965.40、995.85、997.96、1032.01 -
分别利用最优特征波长组合建立红提糖度和含水率的PLSR及LSSVM模型,校正集和预测集样本的预测值和化学测量值之间的散点图如图7-10所示。
图 7 基于GA-SPA-PLSR红提糖度最优PLSR模型
Figure 7. Optimal PLSR model based on GA-SPA-PLSR for red globe grape sugar content
图 8 基于GA-SPA-PLSR红提含水率最优PLSR模型
Figure 8. Optimal PLSR model based on GA-SPA-PLSR red globe grape moisture content
图 9 基于CARS-SPA-LSSVM红提糖度最优LSSVM模型
Figure 9. Optimal LSSVM model based on CARS-SPA-LSSVM for red globe grape sugar content
图 10 基于CARS-SPA-LSSVM红提含水率最优LSSVM模型
Figure 10. Optimal LSSVM model based on CARS-SPA-LSSVM for red globe grape moisture content
由图7、8可知,所建立的红提糖度和含水率的最优PLSR模型的校正集相关系数Rc分别为0.957、0.934,RMSEC为0.390、0.454;预测集相关系数Rp分别为0.958、0.938,RMSEP为0.375、0.512,模型的RPD分别为3.400、2.832,均大于2.5,表明模型的检测精度较高,模型的稳定性和准确性较好。
由图9、10可知,模型的检测效果较好;所建立的红提糖度和含水率的最优LSSVM模型的校正集相关系数Rc分别为0.967、0.945,RMSEC为0.340、0.451;预测集相关系数Rp分别为0.969、0.942,RMSEP为0.322、0.475,模型的RPD分别为3.960、3.053,均大于2.5,表明具有较高的检测精度。LSSVM模型与PLSR模型相比:模型的相关系数较大,均方根误差较小,模型的稳定性和检测可靠性有所提高。在红提糖度和含水率的检测中,在两种模型下,红提糖度的检测效果明显好于含水率的检测效果。
-
(1)红提的放置模式对糖度和含水率的PLSR检测模型的影响较大,利用整个果粒的平均光谱建立的模型效果最好,竖放模式好于横放模式所建模型。
(2)在一次特征波长提取中,UVE和GA所提取的特征波长数量较多,模型比较稳定,但提取的特征信息较多,可通过二次特征波长提取,简化模型。在二次特征波长的提取中,红提糖度和含水率的最优PLSR模型波长提取方法为GA-SPA-PLSR,最优模型的预测集相关系数分别为0.958、0.938;红提糖度和含水率的最优LSSVM模型波长提取方法分别为CARS-SPA-LSSVM、UVE-SPA-LSSVM,最优模型的预测集相关系数分别为0.969、0.942,LSSVM所建模型的效果好于PLSR所建模型,但模型的运算时间较长。
(3)基于可见/近红外技术检测红提糖度和含水率是可行的,且两种最优检测模型检测的精度较高,都能满足检测的要求。在不同的应用下,可选择不同的模型,PLSR所建最优模型的运算时间较短,可以实现在线快速检测;LSSVM的检测性能最佳,可更加准确检测红提糖度和含水率的含量。
Non-destructive Testing of Red Globe Grape Sugar Content and Moisture Content Based on Visible/Near Infrared Spectroscopy Transmission Technology
-
摘要:
目的 红提糖度和含水率是重要的内部品质衡量指标,传统的检测方法均为破坏性生化检测。 方法 本文研究基于可见/近红外透射光谱技术的红提糖度和含水率的无损检测方法。采集360个红提样本并分别利用标准正态变量变换(Standard Normal Variable transformation,SNV)、SavitZky-Golay卷积平滑处理法(SavitZky-Golay,S_G)等光谱预处理方法建立PLSR模型,确定最好的光谱预处理方法,分别采用一次降维(GA、SPA、CARS、UVE)和二次降维组合(CARS-SPA、UVE-SPA、GA-SPA)七种数据降维方法对光谱进行特征变量提取,分别建立红提糖度和含水率的偏最小二乘回归算法(Partial Least Squares Regression,PLSR)和最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)含量检测模型并对比分析模型的优劣。 结果 结果表明,红提糖度和含水率的最优PLSR模型波长提取方法为GA-SPA-PLSR,最优模型的预测集相关系数分别为0.958、0.938;红提糖度和含水率的最优LSSVM模型波长提取方法分别为CARS-SPA-LSSVM、UVE-SPA-LSSVM,最优模型的预测集相关系数分别为0.969、0.942;LSSVM所建模型的效果好于PLSR所建模型,但模型的运算时间较长。 结论 研究结果表明:基于可见/近红外技术无损检测红提糖度和含水率的方法可行,且两种最优检测模型预测的精度较高,都能满足检测要求。在不同应用下,可选择不同模型,PLSR所建最优模型的运算时间较短,适合在线快速检测;LSSVM的检测性能最佳,可更加准确地检测红提糖度和含水率。 Abstract:Objective The sugar content and moisture of red globe grapes are important internal quality measurement indices. However, traditional detection methods use destructive biochemical detection. Method In this paper, a non-destructive detection method for the sugar and moisture content of red globe grapes based on visible/near-infrared spectroscopy transmission technology is studied. 360 red globe grape extract samples were collected and PLSR models were established by Standard Normal Variable transformation (SNV), SavitZky-Golay(S_G) and other spectral preprocessing methods to determine the one. Seven data dimensionality reduction methods of primary dimensionality reduction (GA, SPA, CARS, UVE) and secondary dimensionality reduction combinations (CARS-SPA, UVE-SPA, GA-SPA) were used to identify characteristic variables of spectra. PLSR and LSSVM content detection models of red globe grape extract sugar content and moisture content were established respectively, and the advantages and disadvantages of each model were compared and analyzed. Result The results show that the optimal PLSR model wavelength extraction method for red globe grape sugar content and moisture content is GA-SPA-PLSR, and the correlation coefficients of the optimal model were 0.958 and 0.938, respectively. The optimal LSSVM model wavelength extraction methods for red globe grape sugar and moisture content are CARS-SPA-LSSVM and UVE-SPA-LSSVM, respectively. The correlation coefficients of the optimal model are 0.969 and 0.942, respectively. The model built using LSSVM is better than that built using PLSR, but its operation time is longer. Conclusion The results show that: The non-destructive detection method of red globe grape sugar and moisture content based on visible/near-infrared technology is feasible, and that the detection accuracy of the two optimal detection models is high, which can meet detection requirements. Different models can be selected for different applications. The optimal model built by PLSR has shorter computation time and is suitable for online rapid detection. LSSVM has the best detection performance and can accurately predict red globe grape sugar and moisture content. -
表 1 采用不同预处理方法的全波长PLSR检测模型
Table 1. Full-wavelength PLSR detection model using different pre-processing methods
指标 预处理 LVs主因子数 校正集 预测集 Rc RMSEC Rp RMSEP 糖度 原始光谱 15 0.927 0.498 0.933 0.493 SNV 19 0.954 0.412 0.907 0.468 S_G 14 0.793 0.809 0.808 0.759 Nor 20 0.957 0.401 0.878 0.516 含水率 原始光谱 15 0.901 0.549 0.868 0.780 SNV 15 0.892 0.583 0.842 0.731 Nor 15 0.893 0.603 0.832 0.719 表 2 利用KS算法划分样本集的数据统计
Table 2. Data Statistics of Partitioning Sample Sets using the KS Algorithm
样本数量 指标 最小值 最大值 平均值 标准差S.D 变异系数C.V 校正集(270个) 糖度/(°Brix) 16.8 24.0 20.2 1.334 6.595% 含水率/(%) 76.689 84.327 80.746 1.268 1.570% 预测集(90个) 糖度/(°Brix) 17.8 22.7 20.2 1.275 6.293% 含水率/(%) 76.635 83.621 80.582 1.450 1.780% 表 3 不同放置模式的全波长PLSR检测模型
Table 3. Full-wavelength PLSR detection model with different placement modes
放置模式 指标 LVs主因子数 校正集 预测集 Rc RMSEC Rp RMSEP 竖放 糖度 16 0.922 0.503 0.907 0.589 含水率 15 0.897 0.567 0.861 0.812 横放 糖度 15 0.908 0.576 0.890 0.614 含水率 15 0.884 0.629 0.811 0.921 平均光谱 糖度 15 0.927 0.498 0.933 0.493 含水率 15 0.901 0.549 0.868 0.780 表 4 基于特征波长建立的红提糖度和含水率PLSR检测模型
Table 4. Red globe grape sugar and moisture content PLSR detection model based on wavelength characteristics
指标 特征波长提取方法 波点个数 LVs主因子数 校正集 预测集 RPD Rc RMSEC Rp RMSEP 糖度 原始光谱 1150 15 0.927 0.498 0.933 0.493 2.586 GA 85 13 0.941 0.450 0.929 0.499 2.555 SPA 17 15 0.889 0.610 0.921 0.527 2.419 CARS 27 15 0.915 0.537 0.926 0.502 2.540 UVE 437 13 0.912 0.547 0.925 0.510 2.500 CARS-SPA 9 5 0.896 0.592 0.919 0.529 2.410 UVE-SPA 15 10 0.898 0.585 0.917 0.531 2.401 GA-SPA 15 10 0.957 0.390 0.958 0.375 3.400 含水率 原始光谱 1150 15 0.901 0.549 0.868 0.780 1.860 GA 78 10 0.900 0.551 0.892 0.728 1.992 SPA 12 11 0.840 0.687 0.838 0.833 1.741 CARS 27 15 0.901 0.549 0.868 0.780 1.859 UVE 615 13 0.891 0.574 0.874 0.758 1.913 CARS-SPA 11 11 0.819 0.726 0.848 0.858 1.690 UVE-SPA 19 14 0.882 0.597 0.867 0.770 1.884 GA-SPA 13 7 0.934 0.454 0.938 0.512 2.832 表 5 红提糖度和含水率PLSR检测模型的最优特征波点列表
Table 5. List of optimal wave point characteristics of the PLSR sugar and moister content detection model for red globe grapes
指标 建模方法 波长/nm 糖度(15个) GA-SPA-PLSR 722.35、774.15、802.39、813.39、867.92、882.13、904.45、910.44、929.67、943.31、950.11、954.36、968.36、975.57、1002.59 含水率(13个) GA-SPA-PLSR 750.06、799.03、825.98、835.52、859.73、863.61、869.64、878.26、904.02、909.58、913.01、947.56、967.09 表 6 基于特征波长建立的红提糖度和含水率LSSVM检测模型
Table 6. LSSVM sugar and moisture content detection model for red globe grapes using on wavelength characteristics
指标 特征波长提取方法 波点个数 γ σ2 校正集 预测集 RPD Rc RMSEC Rp RMSEP 糖度 原始光谱 1150 606877.813 27698.587 0.976 0.296 0.937 0.451 2.827 GA 85 486007.978 1715.475 0.964 0.354 0.940 0.441 2.891 SPA 17 255631.106 269.184 0.946 0.436 0.905 0.544 2.344 CARS 27 352524.566 442.091 0.944 0.442 0.941 0.434 2.938 UVE 437 709628.506 8410.785 0.968 0.338 0.942 0.431 2.958 CARS-SPA 9 493958.299 187.240 0.967 0.340 0.969 0.322 3.960 UVE-SPA 15 394145.82 282.089 0.935 0.472 0.925 0.485 2.629 GA-SPA 15 347263.829 384.322 0.935 0.473 0.937 0.449 2.839 含水率 原始光谱 1150 54302.715 46313.338 0.949 0.405 0.888 0.711 2.040 GA 78 351395.906 2351.707 0.931 0.465 0.899 0.683 2.124 SPA 12 224241.827 258.227 0.873 0.620 0.844 0.806 1.800 CARS 27 454665.452 23000.299 0.962 0.350 0.891 0.686 2.114 UVE 615 647436.819 22685.185 0.947 0.412 0.896 0.684 2.120 CARS-SPA 11 751032.167 865.070 0.883 0.595 0.843 0.820 1.769 UVE-SPA 19 606836.672 365.462 0.945 0.451 0.942 0.475 3.053 GA-SPA 13 3888528.517 496.001 0.908 0.531 0.889 0.728 1.992 表 7 红提糖度和含水率LSSVM检测模型的最优特征波点列表
Table 7. List of optimal wave point characteristics of the LSSVM sugar and moisture content detection model for red globe grape
指标 建模方法 波长/nm 糖度(9个) CARS-SPA-LSSVM 826.41、874.38、880.84、904.45、910.44、915.15、944.16、950.96、974.30 含水率(19个) UVE-SPA-LSSVM 644.83、647.94、711.77、726.76、768.90、781.14、803.82、815.56、825.98、863.61、876.53、888.14、909.16、914.72、959.03、965.40、995.85、997.96、1032.01 -
[1] 国家统计局. 中国统计年鉴[M]. 北京: 中国统计出版社, 2018. National Bureau of Statistics. China Statistical Yearbook[M]. Beijing: China Statistics Press, 2018. (in Chinese). [2] 刘燕德, 徐海, 孙旭东, 等. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学,2020,13(3):482-491. LIU Y D, XU H, SUN X D, et al. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics, 2020, 13(3): 482-491. (in Chinese) [3] ZHANG D Y, XU L, WANG Q Y, et al. The optimal local model selection for robust and fast evaluation of soluble solid content in melon with thick peel and large size by vis-NIR spectroscopy[J]. Food Analytical Methods, 2019, 12(1): 136-147. doi: 10.1007/s12161-018-1346-3 [4] 朱丹实, 张巧曼, 曹雪慧, 等. 湿度条件对巨峰葡萄贮藏过程中水分及质构变化的影响[J]. 食品科学,2014,35(22):340-345. doi: 10.7506/spkx1002-6630-201422066 ZHU D SH, ZHANG Q M, CAO X H, et al. Effect of relative humidity on the changes in water and texture of Kyoho grape during storage[J]. Food Science, 2014, 35(22): 340-345. (in Chinese) doi: 10.7506/spkx1002-6630-201422066 [5] 王转卫, 迟茜, 郭文川, 等. 基于近红外光谱技术的发育后期苹果内部品质检测[J]. 农业机械学报,2018,49(5):348-354. doi: 10.6041/j.issn.1000-1298.2018.05.041 WANG ZH W, CHI Q, GUO W CH, et al. Internal quality detection of apples during late developmental period based on near-infrared spectral technology[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(5): 348-354. (in Chinese) doi: 10.6041/j.issn.1000-1298.2018.05.041 [6] 孙静涛, 马本学, 董娟, 等. 高光谱技术结合特征波长筛选和支持向量机的哈密瓜成熟度判别研究[J]. 光谱学与光谱分析,2017,37(7):2184-2191. SUN J T, MA B X, DONG J, et al. Study on maturity discrimination of Hami melon with hyperspectral imaging technology combined with characteristic wavelengths selection methods and SVM[J]. Spectroscopy and Spectral Analysis, 2017, 37(7): 2184-2191. (in Chinese) [7] 陈欣欣, 郭辰彤, 张初, 等. 高光谱成像技术的库尔勒梨早期损伤可视化检测研究[J]. 光谱学与光谱分析,2017,37(1):150-155. CHEN X X, GUO CH T, ZHANG CH, et al. Visual detection study on early bruises of Korla pear based on hyperspectral imaging technology[J]. Spectroscopy and Spectral Analysis, 2017, 37(1): 150-155. (in Chinese) [8] 王转卫, 迟茜, 郭文川, 等. 基于近红外光谱技术的发育后期苹果内部品质检测[J]. 农业机械学报,2018,49(5):348-354. doi: 10.6041/j.issn.1000-1298.2018.05.041 WANG ZH W, CHI Q, GUO W CH, et al. Internal quality detection of apples during late developmental period based on near-infrared spectral technology[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(5): 348-354. (in Chinese) doi: 10.6041/j.issn.1000-1298.2018.05.041 [9] 彭彦昆, 赵芳, 白京, 等. 基于图谱特征的番茄种子活力检测与分级[J]. 农业机械学报,2018,49(2):327-333. doi: 10.6041/j.issn.1000-1298.2018.02.042 PENG Y K, ZHAO F, BAI J, et al. Detection and classification of tomato seed vitality based on image processing[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(2): 327-333. (in Chinese) doi: 10.6041/j.issn.1000-1298.2018.02.042 [10] 高升, 王巧华, 李庆旭, 等. 基于近红外光谱的红提维生素C含量、糖度及总酸含量无损检测方法[J]. 分析化学,2019,47(6):941-949. GAO SH, WANG Q H, LI Q X, et al. Non-destructive detection of vitamin c, sugar content and total acidity of red globe grape based on near-infrared spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2019, 47(6): 941-949. (in Chinese) [11] 路皓翔, 徐明昌, 张卫东, 等. 基于压缩自编码融合极限学习机的柑橘黄龙病鉴别方法[J]. 分析化学,2019,47(5):652-660. LU H X, XU M CH, ZHANG W D, et al. Identification of citrus Huanglongbing based on contractive auto-encoder combined extreme learning machine[J]. Chinese Journal of Analytical Chemistry, 2019, 47(5): 652-660. (in Chinese) [12] 付丹丹, 王巧华, 高升, 等. 不同品种鸡蛋贮期S-卵白蛋白含量分析及其可见/近红外光谱无损检测模型研究[J]. 分析化学,2020,48(2):289-297. FU D D, WANG Q H, GAO SH, et al. Analysis of S-ovalbumin content of different varieties of eggs during storage and its nondestructive testing model by visible-near infrared spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2020, 48(2): 289-297. (in Chinese) [13] 韩东海, 常冬, 宋曙辉, 等. 小型西瓜品质近红外无损检测的光谱信息采集[J]. 农业机械学报,2013,44(7):174-178. doi: 10.6041/j.issn.1000-1298.2013.07.030 HAN D H, CHANG D, SONG SH H, et al. Information collection of mini watermelon quality using near-infrared non-destructive detection[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(7): 174-178. (in Chinese) doi: 10.6041/j.issn.1000-1298.2013.07.030 [14] 孙海霞, 薛建新, 张淑娟, 等. 基于光谱和水分补偿方法的鲜枣内部品质检测[J]. 光谱学与光谱分析,2017,37(8):2513-2518. SUN H X, XUE J X, ZHANG SH J, et al. Detection of internal quality in fresh jujube based on moisture compensation and visible/near infrared spectra[J]. Spectroscopy and Spectral Analysis, 2017, 37(8): 2513-2518. (in Chinese) [15] 刘燕德, 朱丹宁, 孙旭东, 等. 苹果可溶性固形物便携式检测实验研究[J]. 光谱学与光谱分析,2017,37(10):3260-3265. LIU Y D, ZHU D N, SUN X D, et al. Study on detecting soluble solids in fruits based on portable near infrared spectrometer[J]. Spectroscopy and Spectral Analysis, 2017, 37(10): 3260-3265. (in Chinese) [16] 许锋, 付丹丹, 王巧华, 等. 基于MCCV-CARS-RF建立红提糖度和酸度的可见-近红外光谱无损检测方法[J]. 食品科学,2018,39(8):149-154. doi: 10.7506/spkx1002-6630-201808024 XU F, FU D D, WANG Q H, et al. Nondestructive detection of sugar content and acidity in red globe table grapes using visible near infrared spectroscopy based on monte-carlo cross validation-competitive adaptive reweighted sampling-random forest (MCCV-CARS-RF)[J]. Food Science, 2018, 39(8): 149-154. (in Chinese) doi: 10.7506/spkx1002-6630-201808024 [17] 樊书祥, 黄文倩, 郭志明, 等. 苹果产地差异对可溶性固形物近红外光谱检测模型影响的研究[J]. 分析化学,2015,43(2):239-244. FAN SH X, HUANG W Q, GUO ZH M, et al. Assessment of influence of origin variability on robustness of near infrared models for soluble solid content of apples[J]. Chinese Journal of Analytical Chemistry, 2015, 43(2): 239-244. (in Chinese) [18] 中华全国供销合作总社. GH/T 1022-2000 鲜葡萄[S]. 2000. (查阅所有网上资料, 未找到出版信息, 请联系作者补充). All China Federation of Supply and Marketing Cooperatives. GH/T 1022-2000 Table grapes[S]. 2000. (in Chinese). [19] 中华人民共和国农业部. NY/T 2637-2014 水果和蔬菜可溶性固形物含量的测定 折射仪法[S]. 北京: 中国农业出版社, 2015. The Ministry of Agriculture of the People's Republic of China. NY/T 2637-2014 Refractometric method for determination of total soluble solids in fruits and vegetables[S]. Beijing: China Agriculture Press, 2015. (in Chinese). [20] 中华人民共和国国家卫生和计划生育委员会. GB 5009.3-2016 食品安全国家标准 食品中水分的测定[S]. 北京: 中国标准出版社, 2017. State Health and Family Planning Commission of the People's Republic of China. GB 5009.3-2016 Determination of moisture in food[S]. Beijing: Standards Press of China, 2017. (in Chinese)(查阅所有网上资料, 未找到对应的英文翻译, 请联系作者确认). [21] 王拓, 戴连奎, 马万武. 拉曼光谱结合后向间隔偏最小二乘法用于调和汽油辛烷值定量分析[J]. 分析化学,2018,46(4):623-629. doi: 10.11895/j.issn.0253-3820.170278 WANG T, DAI L K, MA W W. Quantitative analysis of blended gasoline octane number using raman spectroscopy with backward interval partial least squares method[J]. Chinese Journal of Analytical Chemistry, 2018, 46(4): 623-629. (in Chinese) doi: 10.11895/j.issn.0253-3820.170278 [22] 孙海霞, 张淑娟, 薛建新, 等. 变量优选补正算法的鲜枣可溶性固形物检测模型传递方法研究[J]. 光谱学与光谱分析,2019,39(4):1041-1046. SUN H X, ZHANG SH J, XUE J X, et al. Model transfer method of fresh jujube soluble solids detection using variables optimization and correction algorithms[J]. Spectroscopy and Spectral Analysis, 2019, 39(4): 1041-1046. (in Chinese) [23] DOGN J L, GUO W CH, WANG ZH W, et al. Nondestructive determination of soluble solids content of ‘Fuji’ apples produced in different areas and bagged with different materials during ripening[J]. Food Analytical Methods, 2016, 9(5): 1087-1095. doi: 10.1007/s12161-015-0278-4 [24] DONG J L, GUO W CH. Nondestructive determination of apple internal qualities using near-infrared hyperspectral reflectance imaging[J]. Food Analytical Methods, 2015, 8(10): 2635-2646. doi: 10.1007/s12161-015-0169-8 [25] 王浩云, 宋进, 潘磊庆, 等. 优化BP神经网络提高高光谱检测调理鸡肉菌落总数精度[J]. 农业工程学报,2020,36(5):302-309. doi: 10.11975/j.issn.1002-6819.2020.05.035 WANG H Y, SONG J, PAN L Q, et al. Improving hyperspectral detection accuracy of total bacteria in prepared chicken using optimized BP neural network[J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(5): 302-309. (in Chinese) doi: 10.11975/j.issn.1002-6819.2020.05.035 [26] 王凡, 彭彦昆, 汤修映, 等. 樱桃番茄可溶性固形物含量的可见/近红外透射光谱无损检测[J]. 中国食品学报,2018,18(10):235-240. WANG F, PENG Y K, TANG X Y, et al. Near infrared nondestructive testing of soluble solids content of cherry tomato[J]. Journal of Chinese Institute of Food Science and Technology, 2018, 18(10): 235-240. (in Chinese) [27] 史云颖, 李敬岩, 褚小立. 多元校正模型传递方法的进展与应用[J]. 分析化学,2019,47(4):479-487. doi: 10.1016/S1872-2040(19)61152-7 SHI Y Y, LI J Y, CHU X L. Progress and applications of multivariate calibration model transfer methods[J]. Chinese Journal of Analytical Chemistry, 2019, 47(4): 479-487. (in Chinese) doi: 10.1016/S1872-2040(19)61152-7 [28] 王键, 汪六三, 王儒敬, 等. 基于优选波长的复合肥总氮含量可见/近红外光谱分析[J]. 发光学报,2018,39(12):1785-1791. doi: 10.3788/fgxb20183912.1785 WANG J, WANG L S, WANG R J, et al. Analysis of total nitrogen in compound fertilizers by VIS-NIR spectroscopy[J]. Chinese Journal of Luminescence, 2018, 39(12): 1785-1791. (in Chinese) doi: 10.3788/fgxb20183912.1785 -