留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

不同产地苹果糖度可见近红外光谱在线检测

刘燕德 徐海 孙旭东 姜小刚 饶宇 徐佳 王军政

刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学. doi: 10.3788/CO.2019-0128
引用本文: 刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学. doi: 10.3788/CO.2019-0128
LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics. doi: 10.3788/CO.2019-0128
Citation: LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics. doi: 10.3788/CO.2019-0128

不同产地苹果糖度可见近红外光谱在线检测

doi: 10.3788/CO.2019-0128
基金项目: 国家自然科学基金(No.31760344);江西省创新能力建设项目(No.S2016-90)
详细信息
    作者简介:

    刘燕德(1967−),女,江西泰和人,博士,教授,博士生导师,主要从事光电检测技术与装备方面的研究。E-mail:jxliuyd@163.com通信地址:江西省南昌市青山湖区双港东大街808号华东交通大学南区

  • 中图分类号: O657.33

On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy

Funds: National Natural Science Foundation of China(No.31760344); the Jiangxi Provincial Project for Innovation Capacity Construction(No.S2016-90)
  • 摘要: 为了实现对不同产地苹果糖度的快速在线无损检测,减少产地变异性对近红外光谱检测模型的影响,建立了不同产地苹果糖度的在线检测通用模型。首先,采用水果动态在线检测设备采集了包括栖霞、洛川与会宁三个产地的红富士苹果的漫透射光谱。其次,采用偏最小二乘算法(PLS),结合无信息变量消除(UVE),筛选出58个特征变量,建立了苹果糖度的UVE-PLS通用模型,对个体产地预测集及总预测集的均方根误差分别为0.50~0.74°Brix与0.63°Brix,较原始个体模型分别提高了23.2~44.4%与35.7%。最后,提出了一个新的外部验证样本集对模型性能进行评价,其残留预测偏差为2.33,预测值在±1.0°Brix和在±1.5°Brix的误差范围内的占比分别为85%与100%。实验结果表明:建立多个产地苹果糖度的在线检测通用模型,能够提高预测其他产地样本糖度的稳健性,并且采用合适的波长筛选方法能够简化模型。开发不同产地水果内部品质通用模型在波长有限的光谱设备中具有良好的潜在应用。
  • 图  1  漫透射检测机构

    Figure  1.  Mechanism of diffuse transmission detection

    图  2  光谱采集触发装置

    Figure  2.  Trigger of spectral acquisition

    图  3  样品原始光谱

    Figure  3.  Original spectra of the samples

    图  4  经过MSC的苹果光谱的前3个主成分得分图

    Figure  4.  The first three PC score plot of apple spectra with MSC processing

    图  5  UVE选择变量结果

    Figure  5.  Results of variables selected by UVE

    图  6  UVE-PLS通用模型糖度测量值与预测值的散点图

    Figure  6.  Scatter plots of measured values versus predicted values for SSC by using UVE-PLS universal model

    图  7  糖度测量值与预测值的散点图

    Figure  7.  Scatter plot of measured value versus predicted value for the SSC

    表  1  样本集糖度含量统计

    Table  1.   Statistical values of the SSC(°Brix)of data sets

    产地校正集预测集
    数量范围平均值标准差数量范围平均值标准差
    11298.8~16.612.931.43439.3~15.512.471.24
    21358.5~16.4131.28418.9~15.112.931.23
    312710.1~18.214.971.214011.7~17.615.031.17
    3918.5~18.213.621.611248.9~17.613.451.64
    下载: 导出CSV

    表  2  单个产地的PLS建模结果

    Table  2.   Results of PLS modeling for single origin

    产地LVs校正集预测集RPD
    RC2RMSEC(°Brix)RP2RMSEP(°Brix)
    190.920.400.900.413.02
    2100.890.420.850.472.62
    3110.860.460.800.512.29
    下载: 导出CSV

    表  3  不同产地红富士苹果的预测结果

    Table  3.   Results of prediction models for different origins of Fuji apples

    校正集预测集
    123
    RP2RMSEP(°Brix)RP2RMSEP(°Brix)RP2RMSEP(°Brix)RP2RMSEP(°Brix)
    1//0.540.820.731.240.421.30
    20.540.90//0.671.340.670.98
    30.731.440.721.25//0.681.27
    下载: 导出CSV

    表  4  苹果糖度通用模型预测结果

    Table  4.   Results of universal modeling for the SSC of apples

    模型变量数LVsRC2RMSEC(°Brix)RP2RMSEP(°Brix)RPD
    Ori-PLS400120.840.640.850.632.60
    UVE-PLS5880.820.680.850.632.60
    下载: 导出CSV

    表  5  UVE-PLS糖度通用模型的实际性能

    Table  5.   The practical performance of UVE-PLS universal model for SSC

    RMSEP(°Brix)RPD
    栖霞洛川会宁
    0.670.510.720.642.33
    下载: 导出CSV
  • [1] GIOVANELLI G, SINELLI N, BEGHI R, et al. NIR spectroscopy for the optimization of postharvest apple management[J]. Postharvest Biology and Technology, 2014, 87: 13-20. doi:  10.1016/j.postharvbio.2013.07.041
    [2] FAN SH X, ZHANG B H, LI J B, et al. Effect of spectrum measurement position variation on the robustness of NIR spectroscopy models for soluble solids content of apple[J]. Biosystems Engineering, 2016, 143: 9-19. doi:  10.1016/j.biosystemseng.2015.12.012
    [3] MENDOZA F, LU R F, ARIANA D, et al. Integrated spectral and image analysis of hyperspectral scattering data for prediction of apple fruit firmness and soluble solids content[J]. Postharvest Biology and Technology, 2011, 62(2): 149-160.
    [4] HUANG Y P, LU R F, CHEN K J. Assessment of tomato soluble solids content and pH by spatially-resolved and conventional Vis/NIR spectroscopy[J]. Journal of Food Engineering, 2018, 236: 19-28. doi:  10.1016/j.jfoodeng.2018.05.008
    [5] LUO X, YE Z ZH, XU H R, et al. Robustness improvement of NIR-based determination of soluble solids in apple fruit by local calibration[J]. Postharvest Biology and Technology, 2018, 139: 82-90. doi:  10.1016/j.postharvbio.2018.01.019
    [6] ARENDSE E, FAWOLE O A, MAGWAZA L S, et al. Development of calibration models for the evaluation of pomegranate aril quality by Fourier-transform near infrared spectroscopy combined with chemometrics[J]. Biosystems Engineering, 2017, 159: 22-32. doi:  10.1016/j.biosystemseng.2017.04.004
    [7] 刘燕德, 周延睿, 潘圆媛. 基于最小二乘支持向量机的辣椒可溶性固形物和维生素C含量近红外光谱检测[J]. 光学 精密工程,2014,22(2):281-288. doi:  10.3788/OPE.20142202.0281

    LIU Y D, ZHOU Y R, PAN Y Y. Determination of soluble solid contents and vitamin C of fresh peppers based on NIR spectrometry and least square support vector machines[J]. Optics and Precision Engineering, 2014, 22(2): 281-288. (in Chinese) doi:  10.3788/OPE.20142202.0281
    [8] 郭文川, 王铭海, 谷静思, 等. 近红外光谱结合极限学习机识别贮藏期的损伤猕猴桃[J]. 光学 精密工程,2013,21(10):2720-2727. doi:  10.3788/OPE.20132110.2720

    GUO W CH, WANG M H, GU J S, et al. Identification of bruised kiwifruits during storage by near infrared spectroscopy and extreme learning machine[J]. Optics and Precision Engineering, 2013, 21(10): 2720-2727. (in Chinese) doi:  10.3788/OPE.20132110.2720
    [9] 郭志明, 黄文倩, 彭彦昆, 等. 自适应蚁群优化算法的近红外光谱特征波长选择方法[J]. 分析化学,2014,42(4):513-518.

    GUO ZH M, HUANG W Q, PENG Y K, et al. Adaptive ant colony optimization approach to characteristic wavelength selection of NIR spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2014, 42(4): 513-518. (in Chinese)
    [10] ZHANG B H, HUANG W Q, GONG L, et al. Computer vision detection of defective apples using automatic lightness correction and weighted RVM classifier[J]. Journal of Food Engineering, 2015, 146: 143-151. doi:  10.1016/j.jfoodeng.2014.08.024
    [11] ZHANG B H, DAI D J, HUANG J CH, et al. Influence of physical and biological variability and solution methods in fruit and vegetable quality nondestructive inspection by using imaging and near-infrared spectroscopy techniques: a review[J]. Critical Reviews in Food Science and Nutrition, 2018, 58(12): 2099-2118. doi:  10.1080/10408398.2017.1300789
    [12] 樊书祥, 黄文倩, 郭志明, 等. 苹果产地差异对可溶性固形物近红外光谱检测模型影响的研究[J]. 分析化学,2015,43(2):239-244.

    FAN SH X, HUANG W Q, GUO ZH M, et al. Assessment of influence of origin variability on robustness of near infrared models for soluble solid content of apples[J]. Chinese Journal of Analytical Chemistry, 2015, 43(2): 239-244. (in Chinese)
    [13] LI X N, HUANG J CH, XIONG Y J, et al. Determination of soluble solid content in multi-origin ‘Fuji’ apples by using FT-NIR spectroscopy and an origin discriminant strategy[J]. Computers and Electronics in Agriculture, 2018, 155: 23-31. doi:  10.1016/j.compag.2018.10.003
    [14] JANNOK P, KAMITANI Y, HIRONAKA K, et al. Development of a near infrared calibration model with temperature compensation using common temperature-difference spectra for determining the Brix value of intact fruits[J]. Journal of Near Infrared Spectroscopy, 2017, 25(1): 26-35. doi:  10.1177/0967033516678516
    [15] ZHANG B H, HUANG W Q, LI J B, et al. Principles, developments and applications of computer vision for external quality inspection of fruits and vegetables: a review[J]. Food Research International, 2014, 62: 326-343. doi:  10.1016/j.foodres.2014.03.012
    [16] 刘翠玲, 吴静珠, 孙晓荣. 近红外光谱技术在食品品质检测方法中的研究[M]. 北京: 机械工业出版社, 2016.

    LIU C L, WU J ZH, SUN X R. Study on Near Infrared Spectroscopy in Food Quality Testing Methods[M]. Beijing: China Machine Press, 2016. (in Chinese)(未找到本条文献英文信息, 请核对)
    [17] CHANG CH W, LAIRD D A, MAUSBACH M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J]. Soil Science Society of America Journal, 2001, 65(2): 480-490. doi:  10.2136/sssaj2001.652480x
    [18] ZHANG D Y, XU L, WANG Q Y, et al. The optimal local model selection for robust and fast evaluation of soluble solid content in melon with thick peel and large size by Vis-NIR spectroscopy[J]. Food Analytical Methods, 2019, 12(1): 136-147. doi:  10.1007/s12161-018-1346-3
    [19] YUAN L M, CAI J R, SUN L, et al. Nondestructive measurement of soluble solids content in apples by a portable fruit analyzer[J]. Food Analytical Methods, 2016, 9(3): 785-794. doi:  10.1007/s12161-015-0251-2
    [20] YUN Y H, LI H D, DENG B CH, et al. An overview of variable selection methods in multivariate analysis of near-infrared spectra[J]. TrAC Trends in Analytical Chemistry, 2019, 113: 102-115. doi:  10.1016/j.trac.2019.01.018
  • [1] 刘燕德, 饶宇, 孙旭东, 肖怀春, 姜小刚, 徐海, 李雄, 徐佳, 王观田.  基于光源发射接收一体化探头的糖度分选线改造研究 . 中国光学, doi: 10.3788/CO.2019-0165
    [2] 孙桂芳, 王雅丽, 孟现柱, 史强, 杨冰.  Na5[B2P3O13]晶体的紫外-远红外光谱分析 . 中国光学, doi: 10.3788/CO.20191205.1118
    [3] 邢笑雪, 王宪伟, 秦宏伍, 商微微, 马玉静.  PbSe量子点近红外光源的CH4气体检测 . 中国光学, doi: 10.3788/CO.20181104.0662
    [4] 李欣远, 纪穆为, 王虹智, 涂国鹏, 万晓冬, 刘佳佳, 刘佳, 徐萌, 张加涛.  近红外光热转换纳米晶研究进展 . 中国光学, doi: 10.3788/CO.20171005.0541
    [5] 欧阳爱国, 张宇, 程梦杰, 王海阳, 刘燕德.  中红外光谱技术对乙醇汽油乙醇含量的检测 . 中国光学, doi: 10.3788/CO.20171006.0752
    [6] 欧阳爱国, 唐天义, 王海阳, 刘燕德.  近红外光谱法检测乙醇柴油主要性能指标 . 中国光学, doi: 10.3788/CO.20171003.0363
    [7] 李充, 谢冀江, 潘其坤, 陈飞, 何洋, 张阔.  中红外光学参量振荡器技术进展 . 中国光学, doi: 10.3788/CO.20160906.0615
    [8] 穆治亚, 艾华, 樊孝贺, 何昕, 何丁龙, 韩冬松, 于国栋.  采用整体最小二乘法的条纹图配准方法 . 中国光学, doi: 10.3788/CO.20160906.0625
    [9] 梁静秋, 梁中翥, 吕金光, 秦余欣, 田超, 王维彪.  空间调制微型傅里叶变换红外光谱仪研究 . 中国光学, doi: 10.3788/CO.20150802.0277
    [10] 毕研盟, 王倩, 杨忠东, 谷松岩, 吴荣华, 刘成保.  星载近红外高光谱CO2遥感进展 . 中国光学, doi: 10.3788/CO.20150805.0725
    [11] 陶小平.  大口径反射镜加工机床在线检测高精度对准方法 . 中国光学, doi: 10.3788/CO.20150806.1027
    [12] 刘怡轩, 颜昌翔.  在线式分光测色仪发展现状 . 中国光学, doi: 10.3788/CO.20140705.0712
    [13] 杜小平, 刘明, 夏鲁瑞, 陈杭.  基于光谱角累加的高光谱图像异常检测算法 . 中国光学, doi: 10.3788/CO.20130603.0325
    [14] 杨道奇, 付秀华, 耿似玉, 杨永亮, 潘永刚.  0.6~1.55 μm可见/近红外超宽带增透膜的研制 . 中国光学, doi: 10.3788/CO.20120503.0270
    [15] 陈星旦, 高静, 丁海泉.  论无创血糖监测的红外光谱方法(特邀) . 中国光学, doi: 10.3788/CO.20120504.0317
    [16] 张军强, 吴清文, 颜昌翔.  星载成像光谱仪杂散光检测技术 . 中国光学,
    [17] 陈万英, 唐玉国, 巴音贺希格, 崔继承, 冯树龙.  微型平像场近红外光谱仪的消杂散光设计 . 中国光学,
    [18] 于杰.  用于相移点衍射干涉仪的加权最小二乘相位提取算法 . 中国光学,
    [19] 王德俊, 王建立, 阴玉梅, 王鸣浩.  基于FPGA的近红外实时透雾成像方法 . 中国光学,
    [20] 陈少杰, 唐玉国, 巴音贺希格, 李延超, 于宏柱, 崔继承.  高速便携式近红外光栅光谱仪光电系统设计 . 中国光学,
  • 加载中
计量
  • 文章访问数:  412
  • HTML全文浏览量:  163
  • 被引次数: 0
出版历程
  • 网络出版日期:  2020-04-03

不同产地苹果糖度可见近红外光谱在线检测

doi: 10.3788/CO.2019-0128
    基金项目:  国家自然科学基金(No.31760344);江西省创新能力建设项目(No.S2016-90)
    作者简介:

    刘燕德(1967−),女,江西泰和人,博士,教授,博士生导师,主要从事光电检测技术与装备方面的研究。E-mail:jxliuyd@163.com通信地址:江西省南昌市青山湖区双港东大街808号华东交通大学南区

  • 中图分类号: O657.33

摘要: 为了实现对不同产地苹果糖度的快速在线无损检测,减少产地变异性对近红外光谱检测模型的影响,建立了不同产地苹果糖度的在线检测通用模型。首先,采用水果动态在线检测设备采集了包括栖霞、洛川与会宁三个产地的红富士苹果的漫透射光谱。其次,采用偏最小二乘算法(PLS),结合无信息变量消除(UVE),筛选出58个特征变量,建立了苹果糖度的UVE-PLS通用模型,对个体产地预测集及总预测集的均方根误差分别为0.50~0.74°Brix与0.63°Brix,较原始个体模型分别提高了23.2~44.4%与35.7%。最后,提出了一个新的外部验证样本集对模型性能进行评价,其残留预测偏差为2.33,预测值在±1.0°Brix和在±1.5°Brix的误差范围内的占比分别为85%与100%。实验结果表明:建立多个产地苹果糖度的在线检测通用模型,能够提高预测其他产地样本糖度的稳健性,并且采用合适的波长筛选方法能够简化模型。开发不同产地水果内部品质通用模型在波长有限的光谱设备中具有良好的潜在应用。

English Abstract

刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学. doi: 10.3788/CO.2019-0128
引用本文: 刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学. doi: 10.3788/CO.2019-0128
LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics. doi: 10.3788/CO.2019-0128
Citation: LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics. doi: 10.3788/CO.2019-0128
    • 苹果是一种被广泛生产及消费的水果品类,其富含抗氧化成分,如抗坏血酸和多酚类化合物,可以对各种退化性疾病起到保护作用[1-2]。苹果的外观和内部品质是直接影响消费者对苹果购买决策的关键因素。而可溶性固形物含量(Soluble solids content,SSC),一般也称为糖度,是评价苹果内部品质的关键参数,也是集可溶性糖、酸、纤维素等成分在内的综合指标[3]。因此,开发一种快速可靠的SSC检测方法至关重要。相比传统的破坏性测试方法,近年来,由于快速、准确、易于实现等优点,近红外(Near Infrared,NIR)光谱无损检测技术在测量水果的品质参数方面,特别是SSC,得到了广泛应用[4-8]

      但是由于土壤养分、光照条件、气候以及果园生产管理方式等各不相同,导致水果的成分和品质也不同[9-10]。并且,这种生物变异性也会影响光学传播特性及其相互作用,从而降低水果内、外部品质检测的准确性[11]。尽管如此,关于消除产地差异对SSC检测模型准确性的影响的报道很少。Fan[12]等通过混合四个产地苹果的校正集建立了混合模型,结果表明,混合产地模型在降低苹果SSC预测模型稳健性方面表现出较好的效果。Li等[13]建立了富士苹果SSC含量的多产地回归测量模型,结果表明,与单一产地模型相比,结合产地判别法和模型搜索方法建立的多产地模型对苹果SSC的预测具有更好的预测结果及鲁棒性。然而,这些研究都是基于傅里叶变换近红外光谱仪,光谱采集都为静态采集。但是对于水果实际分选环节,研究建立基于动态在线检测设备的SSC检测模型尤为关键。因此,本研究以产自山东栖霞、陕西洛川与甘肃会宁的红富士苹果为实验对象,利用团队自主研发的水果动态在线检测设备采集样品光谱,建立与比较单一产地及混合产地苹果糖度的在线检测模型,并采用合适的波长筛选方法筛选出特征波长变量,尝试在保持模型预测精度及稳定性的基础上简化模型,研究结果将对苹果SSC的准确检测具有实际应用价值。

    • 实验样品于2018年11月购自三个不同的富士苹果商业果园,经过手工分拣后总共选出132个无明显缺陷与损伤的苹果样品。其中44个来自山东栖霞,45个来自陕西洛川,43个来自甘肃会宁。将所有样品单独洗涤,干燥,编号,然后在赤道周围标记取样点,各点相距90°并垂直于茎轴,且每个观测点均作为一个独立样本。在光谱采集前,将苹果置于实验室环境(温度:22°C;相对湿度:60%)下储存24小时以使样品达到室温并降低样品温度对预测精度的影响[14]。每个批次使用15~20个果实,并定期评估。

    • 水果动态在线检测设备采用漫透射检测方式(图1),考虑光源穿透性及水果糖度的光谱范围以保证光谱仪接收到足够的光谱信息,并考虑光照强度以确保光源不会对果皮造成灼伤,故设备采用10盏12 V,100 W 的卤素灯,以圆弧状配置方式对称排列在待测样品两侧,每盏灯与样品垂直方向呈45°,发出的光均匀照射样品表面,透过样品内部的光由果杯下方光纤探头收集后传回光谱仪,从而使得到的样品果肉信息更多,避免了果实表面反射光及外部光干扰,同时能有效消除由果实不同部位造成的糖,酸等成分的测定误差。设备采用QE65Pro光纤光谱仪(Ocean optics, INC., USA),波长范围为350~1 100 nm。

      图  1  漫透射检测机构

      Figure 1.  Mechanism of diffuse transmission detection

      实验前,设备预热30分钟,设置运行速度为5个/秒以保证样品平稳运行,以聚四氟乙烯球作为参比,校正参比后采集光谱。采用配套的SpectraSuite软件采集样品光谱,在光谱采集时设置积分时间为100 ms,并采用硬件触发方式采集光谱,其实物图如图2所示,齿轮每4个齿对应安装一个果杯,果杯和分度盘齿一一对应。分度盘下方2 mm处安装有光电开关,每转一齿,即传动一个果杯的行程,触发传感器,使后续电路发出信号,从而触发光谱仪采集并保存一条光谱。

      图  2  光谱采集触发装置

      Figure 2.  Trigger of spectral acquisition

    • 光谱采集完成后,使用温度补偿糖度计(型号PAL-1; Atago Co., Tokyo, Japan)测定样品的SSC。每个样品从对应测量位置切取出一个圆形楔形物(最大直径50 mm),通过粗棉布压制挤汁滴于糖度计镜面,并记录读数。对于同一测量部位,重复测量三次,取其中最接近的两次的平均值作为SSC参考值。

    • 偏最小二乘(PLS)回归是一种被广泛使用的无监督统计方法,用于在NIR分析中建立校正模型[15]。PLS分析的目的是通过将光谱矩阵X与浓度矩阵Y投影到新的潜在空间,使其中的潜在变量(latent variables,LVs)之间的协方差最大化,并最终执行潜变量线性回归模型,其基本公式如下:

      $$Y = bX + e$$ (1)

      式(1)中,b表示回归系数的向量,e表示模型残差。

      在校正与验证过程中,将LVs用作新的特征向量来解释方差和降低原始光谱的维数[3]。在PLS算法中,留一法交叉验证通常用于分别避免由于使用太小或太大的LVs而导致的欠拟合或过拟合。在本研究中,PLS回归用于建立光谱数据和苹果SSC属性之间的定量关系,其中,LVs的最佳数量由基于校正样本的10倍交叉验证的最低均方根误差确定。

      PLS在建立近红外光谱检测模型上应用广泛,具有其独特的优越性[16]

      (1)可灵活使用光谱矩阵,根据需要使用全部或者部分数据而达到很好的建模效果;

      (2)同时进行数据的分解与回归,使特征矢量与被测成分有效融合;

      (3)适用于处理样品数量少,但变量相对多的问题;

      (4)PLS是多元线性回归与主成分分析的完美结合,显著提高了校正模型的预测能力。

      通过校正集的决定系数(RC2)与均方根误差(RMSEC)来评价SSC与光谱数据之间的校正方程。通过预测集的决定系数(RP2)与均方根误差(RMSEP)来评价校正模型的预测精度。残留预测偏差(Residual Prediction Deviation,RPD),用来判断模型的质量。这些统计指标公式如下:

      $${R_C}^2,{R_P}^2 = 1 - \frac{{\displaystyle\sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{\displaystyle\sum\limits_{i = 1}^n {{{\left( {{y_i} - {y_m}} \right)}^2}} }}$$ (2)
      $$RMSEC,RMSEP = \sqrt {\frac{1}{n}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} } $$ (3)
      $$RPD = \frac{{SD}}{{RMSEP}} = \frac{{\sqrt {\tfrac{1}{{n - 1}}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - {y_m})}^2}} } }}{{\sqrt {\tfrac{1}{n}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} } }}$$ (4)

      式(2)~(4)中,n表示校正集或预测集中的样本数,yi${\hat y_i}$分别表示校正集和预测集中第i个样本的测量值和预测值,ym表示样本集所有测量值的平均值。

      RPD值的增加表明模型质量的提高,Chang等[17]定义了三个质量类别以考虑模型的可靠性:优秀模型,RPD大于2;可靠模型,RPD为1.4至2;不可靠模型,RPD小于1.4。

    • 校正建模之前,对样本进行肖维勒准则测试。其中,栖霞,洛川与会宁各剔除异常样本4、4与5个,共计13个。将栖霞、洛川与会宁依次定义为产地1,2与3,每个产地的剩余样本通过Kennard-Stone(K-S)法按约3∶1的比例分成2组,校正集与预测集。

      全部剩余样本的校正与预测集分别由各个产地的校正和预测子集组成。校正集仅用于构建校正模型,预测集仅用于决定模型的参数以评估校正模型。如下表1所示,校正集与预测集的SSC范围分别为8.5~18.2°Brix与8.9~17.6°Brix,标准差分别为1.61°Brix与1.64°Brix,样本集覆盖了足够大的范围,且校正集范围大于每个产地的预测集,这些特征有利于建立稳健的近红外模型。

      表 1  样本集糖度含量统计

      Table 1.  Statistical values of the SSC(°Brix)of data sets

      产地校正集预测集
      数量范围平均值标准差数量范围平均值标准差
      11298.8~16.612.931.43439.3~15.512.471.24
      21358.5~16.4131.28418.9~15.112.931.23
      312710.1~18.214.971.214011.7~17.615.031.17
      3918.5~18.213.621.611248.9~17.613.451.64
    • 由于光谱下部(350~594 nm)与上部(900~1 100 nm)的光谱能量值较低,主要包含了无效信息,故将有效波长范围定义为594~900 nm(400个数据点)。由图3可知,三个产地的平均原始光谱曲线走势相似但也存在一定的差异:在600~700 nm波段,光谱连续上升至波峰645 nm附近,接着下降至波谷678 nm附近,这可能与叶绿素吸收[18]有关;在700~900 nm波段,光谱急剧上升至波峰705 nm附近,接着又下降至740~780 nm的宽阔区域,该区域光谱的吸收变化主要受O-H的三倍频伸缩振动与C-H的四倍频伸缩振动影响[19],其中会宁样本光谱能量值较高,其原因可能与其果型较小有关,曲线最终从810 nm附近继续下降直至结束。经过比较分析,使用多元散射校正(MSC)的光谱预处理方法,其作用主要是减小因颗粒分布不均及颗粒大小产生的散射影响。MSC主要是通过一组样本的光谱,基于统计的方法来修正光谱因散射所产生的线性变化。该方法假定散射系数在所有波长处均相同,将化学物质的吸收信息和光谱中的散射光信号进行有效分离,其校正过程[16]如下:

      图  3  样品原始光谱

      Figure 3.  Original spectra of the samples

      首先计算所需校正光谱的平均光谱,如式(5)所示:

      $${\bar X_{i,j}} = \frac{{\displaystyle\sum\limits_{i = 1}^n {{X_{i,j}}} }}{n}$$ (5)

      对平均光谱进行回归,如式(6)所示:

      $${X_i} = {m_i}\bar X + {b_i}$$ (6)

      最后对每条光谱作多元散射校正,如式(7)所示:

      $${X_{i(MSC)}} = \frac{{\left( {{X_i} - {b_i}} \right)}}{{{m_i}}}$$ (7)

      式(5)~(7)中,Xn×p维光谱矩阵,n表示样本数,p表示波长点数,$\bar X$表示所有样品的原始近红外光谱在各个波长点处求平均所得的平均光谱,Xi为1×p维向量,表示单个样品光谱矢量,mi表示一元线性回归得到的相对偏移系数,bi表示偏移量。

      对处理后的光谱进行主成分分析(PCA)以判断三个产地光谱的差异性,通过光谱的前3个主成分得分计算样本的空间距离(前3个主成分已表征了95%的原始信息),最终的三维得分分布图如图4所示。由图4可知,三个产地样本的主成分空间分布具有较大的重合,光谱相似性较高,进而可以进一步研究不同产地模型的通用性。

      图  4  经过MSC的苹果光谱的前3个主成分得分图

      Figure 4.  The first three PC score plot of apple spectra with MSC processing

    • 对三个产地分别进行PLS建模,并对其进行交互预测,即用单个产地的校正集去预测其余产地的预测集。以栖霞为例,将栖霞的校正集作为校正模型,分别去预测洛川,会宁以及包含所有产地的预测集,其他产地预测方式类似,最终结果如表23所示。

      表 2  单个产地的PLS建模结果

      Table 2.  Results of PLS modeling for single origin

      产地LVs校正集预测集RPD
      RC2RMSEC(°Brix)RP2RMSEP(°Brix)
      190.920.400.900.413.02
      2100.890.420.850.472.62
      3110.860.460.800.512.29

      表 3  不同产地红富士苹果的预测结果

      Table 3.  Results of prediction models for different origins of Fuji apples

      校正集预测集
      123
      RP2RMSEP(°Brix)RP2RMSEP(°Brix)RP2RMSEP(°Brix)RP2RMSEP(°Brix)
      1//0.540.820.731.240.421.30
      20.540.90//0.671.340.670.98
      30.731.440.721.25//0.681.27

      表2显示了单个产地校正模型预测相同产地果实SSC的结果。在校正集与预测集的产地相同时,RP2及RMSEP的范围分别为0.80~0.90与0.41~0.51°Brix,且RPD范围为2.29~3.02,结果表明使用原始个体模型在预测同一产地果实糖度时表现出优秀的预测质量。而由表3可知,当使用原始单个产地校正模型预测其他个体产地果实糖度时,其结果并不理想,其RMSEP较高(0.82~1.44°Brix)。而对于预测包含三个产地的总预测集,个体校正模型预测结果同样不佳,RMSEP为0.98~1.30°Brix。这可能是由于当个体模型学习校正集数据中的细节和噪声时,模型对其他产地数据的预测性能产生了负面影响,从而导致过度拟合。显然,只用原始个体产地建立的模型并不能很好地预测其他产地的SSC值。

    • 为了提升对其他产地的预测效果,采用PLS回归算法建立混合三个产地通用模型,用于预测所有产地的SSC值。为了消除不提供信息的变量,采用基于PLS回归系数的无信息变量消除法(Uninformative Variable Elimination,UVE)筛选出特征变量,其基本思想是把变量对应的回归系数平均值与其标准差的比值作为变量选择的衡量依据[20],其表达式如下:

      $${C_i} = \frac{{mean({b_i})}}{{Std({b_i})}}$$ (8)

      式(8)中,C为回归系数的平均值与标准差之比,表示变量的稳定性,i为光谱矩阵中第i列向量。

      最终的判断方法是将一定数量的随机变量矩阵加入光谱矩阵中,然后通过交叉验证建立PLS模型,得到回归系数矩阵,由绝对值$\left| {{C_i}} \right|$的大小确定是否将第i列变量用于PLS建模,且当$\left| {{C_i}} \right|$低于随机变量稳定性的99%时,该列变量被剔除。

      采用UVE对经过预处理的全谱变量(400个数据点)进行筛选,控制随机变量的大小为原变量的10−10,使得扩展矩阵的特征值基本保持不变以最大程度地降低随机矩阵对原变量回归系数的影响,随机变量个数设为200,最终的处理结果如图5所示。

      图  5  UVE选择变量结果

      Figure 5.  Results of variables selected by UVE

      图5(a)所示,绿色竖线为光谱变量与随机变量分界线,其左侧黑色曲线表示光谱变量的稳定性分布情况,右侧红色曲线表示随机变量的稳定性分布情况,2条蓝色水平虚线表示算法所得的阈值上下限。虚线之间的变量为被剔除的变量,而虚线外的变量即为选中的光谱变量。最终经过UVE筛选出的剩余光谱变量个数为58,图5(b)显示了经过UVE 处理后选中变量在全谱变量中的位置分布,不难看出,选中变量主要集中在由含氢基团伸缩振动从而引起吸收的光谱区间,模型的预测结果如下表4所示。

      表 4  苹果糖度通用模型预测结果

      Table 4.  Results of universal modeling for the SSC of apples

      模型变量数LVsRC2RMSEC(°Brix)RP2RMSEP(°Brix)RPD
      Ori-PLS400120.840.640.850.632.60
      UVE-PLS5880.820.680.850.632.60

      表4所示,将仅经过预处理的原始混合产地模型及经过UVE筛选变量后的通用模型分别记为Ori-PLS与UVE-PLS。其中,Ori-PLS模型的RMSEC与RMSEP差值不大且分别为0.64与0.63°Brix,但是建模所用变量数及LVs数分别高达400与12。而UVE-PLS通用模型所用建模变量数及LVs数仅为58与8,这极大提升了模型的运算速率,降低了模型的复杂程度。但是UVE-PLS模型的RC2及RMSEP均略差于Ori-PLS模型,这可能与算法在计算过程中遗漏了某些关键变量有关。

      UVE-PLS通用模型能够预测包含三个产地预测集的SSC值(图6(a)),其中RMSEP为0.63°Brix,且偏差为0.03°Brix。而图6(b~d)显示了模型预测每个产地果实的SSC值的散点图。对于每个产地的预测集,模型的糖度预测值位于目标线附近,且偏差较小。

      图  6  UVE-PLS通用模型糖度测量值与预测值的散点图

      Figure 6.  Scatter plots of measured values versus predicted values for SSC by using UVE-PLS universal model

      并对比表3相关数据可知,UVE-PLS通用模型相较于原始单个产地1、2、3校正模型在预测其他产地预测集样本时,RMSEP均有所降低,并对比交互预测中的较好结果(0.90,0.82,1.24与0.98°Brix),预测精度分别提高了44.4%,23.2%,40.3%与35.7%。

    • 提出了一个新的样本集用来确定利用UVE-PLS方法所获得的SSC模型的实际性能。在零售阶段,从当地超市购买了30个苹果,每个产地各10个。每个苹果的两个测量点在样品的赤道处随机标记,间隔约180°。对新样本采集光谱及测得SSC真值后,放入模型中进行验证,每个产地与总样本的预测误差列于表5

      表 5  UVE-PLS糖度通用模型的实际性能

      Table 5.  The practical performance of UVE-PLS universal model for SSC

      RMSEP(°Brix)RPD
      栖霞洛川会宁
      0.670.510.720.642.33

      表5可知,对于新样本集中每个产地的SSC预测,其RMSEP值为0.51~0.72°Brix,对于总样本组的SSC预测,其RP2和RMSEP分别为0.81和0.64°Brix。而图7显示了SSC预测值与测量值之间的绝对误差值的分布。如图7所示,中间的黑色实线为目标线,即y=x,两条黑色虚线表示预测偏差为±1.0°Brix的分界线,而两条品红色实线表示预测偏差为±1.5°Brix的分界线。经过计算,在±1.0°Brix和在±1.5°Brix的偏差范围内的预测值占比分别为85%与100%,而RPD为2.33,因此,使用UVE-PLS方法建立的通用模型适用于SSC的定量检测。

      图  7  糖度测量值与预测值的散点图

      Figure 7.  Scatter plot of measured value versus predicted value for the SSC

    • 本研究采用多元散射校正,有效减小了由产地变异性引起的光谱差异。单个产地糖度校正模型在预测同一产地时显示出较好的预测结果,RMSEP为0.41~0.51°Brix,但当预测集包含其他产地时,相关性不显著,RMSEP较高,为0.98~1.30°Brix。采用PLS回归算法建立了不同产地苹果的糖度通用模型,结合UVE方法筛选出58个特征波长变量,在保证预测精度的基础上,模型得到了简化,其RMSEP为0.63°Brix。对比单一产地校正模型,UVE-PLS通用模型在预测每个产地糖度时,预测精度大大提升,表明随着更多的生物变异性被考虑进来,预测准确性对外部因素的未知变化变得不那么敏感,使得校正模型对未来的变化更加稳健。外部验证结果表明,UVE-PLS通用模型的实际性能表现出对三种产地苹果糖度出色的预测能力。实验结果表明,水果动态在线检测设备可以用于开发不同产地苹果的糖度模型,研究简化了水果商品化加工的过程,降低了建立糖度分选模型的维护成本,对水果采后商品化处理具有指导意义。

WeChat 关注分享

返回顶部

目录

    /

    返回文章
    返回