留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多尺度小波变换的光谱数据预处理算法

钱方 许永博

钱方, 许永博. 基于多尺度小波变换的光谱数据预处理算法[J]. 中国光学(中英文). doi: 10.37188/CO.2024-0230
引用本文: 钱方, 许永博. 基于多尺度小波变换的光谱数据预处理算法[J]. 中国光学(中英文). doi: 10.37188/CO.2024-0230
QIAN Fang, XU Yong-bo. A spectrum signal pre-processing algorithm based on multi-scale wavelet transform[J]. Chinese Optics. doi: 10.37188/CO.2024-0230
Citation: QIAN Fang, XU Yong-bo. A spectrum signal pre-processing algorithm based on multi-scale wavelet transform[J]. Chinese Optics. doi: 10.37188/CO.2024-0230

基于多尺度小波变换的光谱数据预处理算法

cstr: 32171.14.CO.2024-0230
基金项目: 吉林省自然科学基金
详细信息
    作者简介:

    钱 方(1987—),女,吉林长春人,博士,高工,2015年于长春光机所获得博士学位,主要从事激光辐照效应研究。E-mail:qfmail@sina.cn

    许永博(1998—),男,山东临沂人,硕士,工程师,2024年于长春光机所获得硕士学位,主要从事激光辐照效应研究。E-mail:xyb12172022@163.com

  • 中图分类号: Tb96

A spectrum signal pre-processing algorithm based on multi-scale wavelet transform

Funds: Supported by Natural Science Foundation of Jilin Province
More Information
  • 摘要:

    光谱技术可以从大量的原始信号中提取有用的特征信息,直接用来分析和识别被观测样品的物质成分,在生物医药、食品安全、军事侦察中具有极高的应用价值。由于预处理目的与效果的不同,目前存在多种光谱预处理方法。根据目前方法使用时存在的问题,本文提出了一种基于多尺度小波变换的光谱数据预处理方法,并通过仿真光谱和实测光谱对提出算法和设计软件的性能进行了测试。仿真信号信噪比为0.5 dB,经本文算法处理后,信噪比可达8.978 dB;仿真中加入5种不同类型的基线,包括线型、高斯型、多项式型、e指数型、sigmoidal函数型,使用本文算法进行基线估计,估计值的均方根误差RMSE分别为0.37590.28830.66310.34890.4520;使用共聚焦显微拉曼光谱仪测量了聚四氟乙烯光谱,并用本文算法进行了预处理,结果表明证明该算法具有良好的可操作性,能够有效去除噪声和校正基线,并完整的保留谱峰信息,该算法为光谱数据预处理方法提供了新思路。

     

  • 图 1  小波去噪方法原理图

    Figure 1.  Principle diagram of Wavelet de-noising

    图 2  小波阈值去噪算法流程图

    Figure 2.  Flow chart of Wavelet de-noising

    图 3  去尖峰算法流程图

    Figure 3.  Flow chart of spike removal

    图 4  去基线算法流程图

    Figure 4.  Flow chart of baseline correction

    图 5  光谱信号与小波信号对比图

    Figure 5.  Contrast map of spectral signal and wavelet signal

    图 6  仿真光谱图

    Figure 6.  Map of spectral signal

    图 7  仿真数据去噪效果对比图 (a)原始信号;(b)加噪声信号;(c)硬阈值去噪;(d)软阈值去噪;(e)Savitzky-Golay去噪;(f)本文算法去噪

    Figure 7.  Contrast map of simulated de-noising spectral signal(a)Initial signal (b)signal with noise (c)Hard thresholding(d)Soft thresholding (e)Savitzky-Golay(f)DTD

    图 8  加入基线的光谱图 (a)原始信号;(b)加入线型基线;(c)加入高斯型基线;(d)加入多项式型基线;(e)加入e指数型基线;(f)加入sigmoidal函数型基线

    Figure 8.  Map of spectral signal with baseline (a) Initial signal (b) signal with linear baseline; (c) signal with Gaussian baseline; (d) signal with polynomial baseline; (e) signal with exponential baseline; (f) signal with sigmoidal baseline

    图 9  inVia型共聚焦显微拉曼光谱仪

    Figure 9.  inVia confocal micro Raman spectromete

    图 10  光谱成像原理图

    Figure 10.  Principle diagram of spectral imaging

    图 11  测试样品载玻片

    Figure 11.  Sample slide

    图 12  实测数据去噪对比图 (a)原始信号;(b)硬阈值去噪;(c)软阈值去噪;(d)Savitzky-Golay去噪; (e)本文算法去噪

    Figure 12.  Contrast map of measured de-noising spectral signal (a)Initial signal (b)signal with noise (c) Hard thresholding (d)Soft thresholding (e)Savitzky-Golay(f)DTD

    图 13  实验结果图(a)原始信号;(b) WFPSI算法基线校正信号

    Figure 13.  Result chart of measured spectral signal (a)Initial signal(b)WFPSI

    表  1  光谱特征点属性

    Table  1.   Attribute of spectral characteristic

    谱峰类型 单峰 多峰 光谱值 小波变换值 一阶导数是否
    通过零点
    起始点 A1 A2 最小值 最小值 ×
    左拐点 B1 B2,F2 上升沿 最大值 ×
    谱峰 C1 C2,G2 最大值 最小值
    右拐点 D1 D2,H2 下降沿 最大值 ×
    波谷 -- E2 最小值 最小值
    结束点 E1 I2 最小值 最小值 ×
    下载: 导出CSV

    表  2  仿真光谱信号

    Table  2.   Simulation of spectral signal

    谱峰位置(cm−1)64510901535213022002270
    谱峰高度369666
    半峰全宽253035404550
    下载: 导出CSV

    表  3  不同方法去噪后信号的信噪比

    Table  3.   Contrast of different algorithm

    原始
    信号
    硬阈值
    算法
    软阈值
    算法
    Savitzky-Golay
    滤波算法
    本文算法
    DTD
    SNR(dB) 0.5 8.0621 8.3231 8.4106 8.9775
    下载: 导出CSV

    表  4  不同算法的去基线性能比较

    Table  4.   Contrast of different algorithm

    基线类型PF算法AIRPLS算法SWMA算法本文算法
    WFPSI
    线型1.26290.31410.47510.3759
    高斯函数型1.07330.32900.48810.2883
    多项式型1.29860.65010.70760.6631
    e指数型1.27550.39530.47290.3489
    sigmoidal函数型1.25621.21781.23300.4520
    下载: 导出CSV

    表  5  光谱数据基线校正后凸包面积减小百分比

    Table  5.   Percentage reduction in area of convex hull

    算法凸包面积减小百分比
    PF算法54.69%
    AIRPLS算法64.76%
    SWMA算法58.51%
    WFPSI算法66.21%
    下载: 导出CSV
  • [1] 孙嘉豪, 张伟, 施鉴芩, 等. 光谱数据预处理策略选择及应用[J]. 计量学报,2023,44(8):1284-1292. doi: 10.3969/j.issn.1000-1158.2023.08.20

    SUN J H, ZHANG W, SHI J Q, et al. Selection and application of spectral data preprocessing strategy[J]. Acta Metrologica Sinica, 2023, 44(8): 1284-1292. (in Chinese). doi: 10.3969/j.issn.1000-1158.2023.08.20
    [2] 周粲入, 王哲涛, 杨思危, 等. 化学计量学和深度学习方法在拉曼光谱处理方面的应用研究进展[J]. 分析化学,2023,51(8):1232-1242.

    ZHOU C R, WANG ZH T, YANG S W, et al. Application progress of chemometrics and deep learning methods in Raman spectroscopy signal processing[J]. Chinese Journal of Analytical Chemistry, 2023, 51(8): 1232-1242. (in Chinese).
    [3] 张雪容, 梁维新, 杨玉敏, 等. 顶空固相萃取-纸基表面增强拉曼光谱法快速测定水中痕量汞[J]. 分析化学,2023,51(9):1536-1544.

    ZHANG X R, LIANG W X, YANG Y M, et al. Determination of trace mercury in water by headspace solid phase extraction combining paper-based surface enhanced Raman spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2023, 51(9): 1536-1544. (in Chinese).
    [4] 刘成员, 于江玉, 李奉翠, 等. 拉曼光谱测试技术在可充电铝离子电池储能机理的研究进展[J]. 应用化学,2023,40(10):1347-1358.

    LIU CH Y, YU J Y, LI F C, et al. Research progress of Raman spectroscopy technique in energy storage mechanism of rechargeable aluminum-ion batteries[J]. Chinese Journal of Applied Chemistry, 2023, 40(10): 1347-1358. (in Chinese).
    [5] 李艳坤, 董汝南, 张进, 等. 光谱数据解析中的变量筛选方法[J]. 光谱学与光谱分析,2021,41(11):3331-3338.

    LI Y K, DONG R N, ZHANG J, et al. Variable selection methods in spectral data analysis[J]. Spectroscopy and Spectral Analysis, 2021, 41(11): 3331-3338. (in Chinese).
    [6] ESTEVES C S M, DE REDROJO E M M, MANJÓN J L G, et al. Combining FTIR-ATR and OPLS-DA methods for magic mushrooms discrimination[J]. Forensic Chemistry, 2022, 29: 100421. doi: 10.1016/j.forc.2022.100421
    [7] CAMPOS M P, REIS M S. Data preprocessing for multiblock modelling-a systematization with new methods[J]. Chemometrics and Intelligent Laboratory Systems, 2020, 199: 103959. doi: 10.1016/j.chemolab.2020.103959
    [8] YANG W Y, XIONG Y R, XU ZH ZH, et al. Piecewise preprocessing of near-infrared spectra for improving prediction ability of a PLS model[J]. Infrared Physics & Technology, 2022, 126: 104359.
    [9] SCHULZE H G, FOIST R B, IVANOV A, et al. Fully automated high-performance signal-to-noise ratio enhancement based on an iterative three-point zero-order Savitzky–Golay filter[J]. Applied Spectroscopy, 2008, 62(10): 1160-1166. doi: 10.1366/000370208786049079
    [10] DONOHO D L. De-noising by soft-thresholding[J]. IEEE Transactions on Information Theory, 1995, 41(3): 613-627. doi: 10.1109/18.382009
    [11] ZHAO R ZH, LIU X Y, LI C C, et al. Wavelet denoising via sparse representation[J]. Science in China Series F: Information Sciences, 2009, 52(8): 1371-1377. doi: 10.1007/s11432-009-0116-7
    [12] 刘帅奇, 胡绍海, 肖扬. 基于小波-Contourlet变换与Cycle Spinning相结合的SAR图像去噪[J]. 信号处理,2011,27(6):837-842. doi: 10.3969/j.issn.1003-0530.2011.06.006

    LIU SH Q, HU SH H, XIAO Y. SAR image de-noised based on wavelet-Contourlet transform with Cycle Spinning[J]. Signal Processing, 2011, 27(6): 837-842. (in Chinese). doi: 10.3969/j.issn.1003-0530.2011.06.006
    [13] PHILLIPS G R, HARRIS J M. Polynomial filters for data sets with outlying or missing observations: application to charge-coupled-device-detected Raman spectra contaminated by cosmic rays[J]. Analytical Chemistry, 1990, 62(21): 2351-2357. doi: 10.1021/ac00220a017
    [14] LIU H C, SHAH S, Jiang W. On-line outlier detection and data cleaning[J]. Computers & Chemical Engineering, 2004, 28(9): 1635-1647.
    [15] GAN F, RUAN G H, MO J Y. Baseline correction by improved iterative polynomial fitting with automatic threshold[J]. Chemometrics and Intelligent Laboratory Systems, 2006, 82(1-2): 59-65. doi: 10.1016/j.chemolab.2005.08.009
    [16] SCHULZE H G, FOIST R B, OKUDA K, et al. A small-window moving average-based fully automated baseline estimation method for Raman spectra[J]. Applied Spectroscopy, 2012, 66(7): 757-764. doi: 10.1366/11-06550
    [17] ZHANG ZH M, CHEN SH, LIANG Y Z. Baseline correction using adaptive iteratively reweighted penalized least squares[J]. Analyst, 2010, 135(5): 1138-1146. doi: 10.1039/b922045c
    [18] ALI F, KABIR M, ARIF M. DBPPred-PDSD: Machine learning approach for prediction of DNA-binding proteins using discrete wavelet transform and optimized integrated features space[J]. Chemometrics and Intelligent Laboratory Systems, 2018, 182: 21-30. doi: 10.1016/j.chemolab.2018.08.013
  • 加载中
图(13) / 表(5)
计量
  • 文章访问数:  140
  • HTML全文浏览量:  45
  • PDF下载量:  7
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-12-26
  • 录用日期:  2025-03-28
  • 网络出版日期:  2025-04-19

目录

    /

    返回文章
    返回