CN115326783A - 拉曼光谱预处理模型生成方法、***、终端及存储介质 - Google Patents

拉曼光谱预处理模型生成方法、***、终端及存储介质 Download PDF

Info

Publication number
CN115326783A
CN115326783A CN202211256339.9A CN202211256339A CN115326783A CN 115326783 A CN115326783 A CN 115326783A CN 202211256339 A CN202211256339 A CN 202211256339A CN 115326783 A CN115326783 A CN 115326783A
Authority
CN
China
Prior art keywords
spectrum
raman spectrum
raman
library
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211256339.9A
Other languages
English (en)
Other versions
CN115326783B (zh
Inventor
沈平
胡嘉祺
陈金娜
薛陈龙
党竑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern University of Science and Technology
Original Assignee
Southern University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern University of Science and Technology filed Critical Southern University of Science and Technology
Priority to CN202211256339.9A priority Critical patent/CN115326783B/zh
Publication of CN115326783A publication Critical patent/CN115326783A/zh
Application granted granted Critical
Publication of CN115326783B publication Critical patent/CN115326783B/zh
Priority to PCT/CN2023/121358 priority patent/WO2024078321A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • G01N21/658Raman scattering enhancement Raman, e.g. surface plasmons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

本发明涉及拉曼光谱预处理模型生成方法、***、终端及存储介质,通过:提取真实拉曼光谱库中的噪声、基线背景信号和拉曼峰并建库,将拉曼峰库中的拉曼特征峰自由组合生成不带噪声和基线背景信号的理想光谱库,再在此数据库上叠加提取的噪声和基线背景信号生成参考光谱库,理想光谱库和随机高斯噪声输入生成器生成仿真光谱库,通过鉴别器与上述生成器形成对抗训练,在训练结束后生成符合真实拉曼光谱特征的高仿真拉曼光谱库;使用该库对基于自监督算法的光谱预处理模型进行训练从而完成参数自动设置;理想光谱库作为模型训练的标签,训练结束后模型可直接用于处理真实采集的光谱,使用简单、快速,去噪去基线背景效果好,光谱高保真。

Description

拉曼光谱预处理模型生成方法、***、终端及存储介质
技术领域
本发明涉及拉曼光谱预处理技术领域,更具体地说,涉及一种拉曼光谱预处理模型生成方法、***、终端及存储介质。
背景技术
拉曼光谱是一种基于光与物质相互作用后产生拉曼散射的光谱技术,拉曼散射是由于散射光与入射光的频差与散射介质分子的振动或纯转动能级间隔对应所产生的;作为一种分子振动谱,拉曼光谱的无标记性被广泛应用于化学,生物等检测;然而,由于仪器本身的噪声、样品荧光效应和环境噪声,定量精度和定性准确度受到干扰,特别是对于生物样品的检测,这种干扰会更加明显,使特征峰无法被有效识别;虽然通过仪器的升级改进、检测环境的优化、样品的预处理可以减弱噪声的影响,但会受到时间成本和经济成本的限制,并且目前的技术水平无法从硬件上完全消除这些噪声的影响。
拉曼光谱预处理是对采集到的光谱去除基线背景信号和噪声信号,现有技术中,拉曼光谱预处理方法分为数学分析方法和机器学习方法:基于数学分析方法光谱预处理的原理是使用光谱物理数学方程进行解析,由于实际采样的拉曼光谱不完全满足数学方程,并且背景和噪声信号多样化,导致数学分析方法需要针对不同光谱人工调参数,不能实现全自动化,而且难以处理低信噪比或复杂背景信号的拉曼光谱;使用机器学习方法,可以处理复杂背景信号拉曼光谱,并且对低信噪比光谱有更好的处理效果,现阶段基于机器学习方法的拉曼光谱预处理模型多数使用全监督机器学习,但是由于拉曼光谱无法通过真实光谱采集得到无噪声及基线背景信号的标准光谱作为标签,一般是采用模拟的高斯峰或洛伦兹峰生成仿真光谱作为全监督机器学习标签,噪声采用随机高斯噪声,基线使用随机荧光信号,这种处理方法虽然在一定程度上可以拟合出模拟拉曼光谱数据集,但是在使用过程中极易出现噪声峰形过拟合,导致预处理后的光谱信号失真,仍然有一定局限性。
现有方法示例:
1.基于多项式或最小二乘法拟合去除背景信号的方法:需要根据不同信号和不同信噪比的拉曼光谱进行相应参数的人工设计,导致该方法有一定主观性,并且几乎无法处理低信噪比光谱。
2.基于小波变换的去除基线背景信号和噪声的方法:小波变换是根据光谱时域上的分布特征进行拟合,通过设计自动化的迭代可以在一定程度上实现自动化,但是需要根据不同信噪比的拉曼光谱选择不同算法,此外,该方法对低信噪比拉曼光谱处理的噪声抑制、基线背景去除和信号保真效果依然不理想。
3.基于深度学习的全监督去除噪声和基线背景信号的方法:利用深度学习可以实现自动化无人为干扰的光谱预处理,并且噪声和基线背景去除效果较好,但是对于低信噪比拉曼光谱,全监督算法会过拟合高斯峰和洛伦兹峰,得到的拉曼光谱会产生一定的变形,导致处理后的光谱失真。
需要一种更加低成本、更加高效自动化、高保真的方式方法解决上述问题。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种拉曼光谱预处理模型生成方法,还提供了一种拉曼光谱预处理模型生成***、一种拉曼光谱预处理终端及一种计算机可读存储介质。
本发明解决其技术问题所采用的技术方案是:
构造一种拉曼光谱预处理模型生成方法,其中,包括以下步骤:
第一步:将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库:
第二步:将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库包括方法:
准备训练数据集,生成理想光谱库和参考光谱库;
训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述准备训练数据集,生成理想光谱库和参考光谱库包括方法:
收集真实的拉曼光谱/表面增强拉曼光谱数据;
提取拉曼光谱/表面增强拉曼光谱数据中拉曼光谱的噪声信息、基线背景信号和拉曼特征峰,并分别生成噪声信息库、基线背景信号库和拉曼峰库;
将拉曼峰库中的特征峰随机组合生成不带噪声和基线背景信号的理想光谱,并建库;
在理想光谱数据上叠加提取的噪声和基线背景信号生成参考光谱,并建库。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库包括方法:
拉曼光谱生成对抗网络包含生成器和鉴别器,其中
生成器:以理想光谱库和随机高斯噪声为输入,生成仿真拉曼光谱;
鉴别器:以仿真拉曼光谱库和参考光谱库为输入,将仿真拉曼光谱判别为假或真,并将参考光谱判别为真或假;
在训练生成器时,生成器损失函数以鉴别器将仿真光谱判别为真或假的误差最小化为目标;
在训练鉴别器时,鉴别器损失函数以鉴别器分类准确率最大化为目标;
交替训练生成器与鉴别器,生成器最终生成接近参考光谱的高仿真拉曼光谱库。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述生成高仿真拉曼光谱采用公式:
Figure 285208DEST_PATH_IMAGE002
其中
Figure 225351DEST_PATH_IMAGE003
表示生成器(G)利用输入的随机高斯噪声(z)和理想光谱(
Figure 903457DEST_PATH_IMAGE004
)生成的仿真拉曼光谱;
Figure 587248DEST_PATH_IMAGE005
Figure 156114DEST_PATH_IMAGE006
分别表示鉴别器(D)将输入光谱判断为仿真拉曼光谱
Figure 611366DEST_PATH_IMAGE007
为假或真和参考光谱
Figure 166981DEST_PATH_IMAGE008
为真或假的概率;
该公式包括
Figure 123305DEST_PATH_IMAGE009
Figure 956132DEST_PATH_IMAGE010
两个过程:
Figure 975428DEST_PATH_IMAGE009
表示训练鉴别器时,仿真拉曼光谱
Figure 628126DEST_PATH_IMAGE007
被判断为假,参考光谱
Figure 388140DEST_PATH_IMAGE008
被判断为真,使
Figure 668949DEST_PATH_IMAGE011
的值接近于0,进而
Figure 853287DEST_PATH_IMAGE012
接近于0,实现了鉴别器准确率最大化;
Figure 727702DEST_PATH_IMAGE013
表示在训练生成器时,仿真拉曼光谱
Figure 291408DEST_PATH_IMAGE014
被判断为真,使
Figure 957881DEST_PATH_IMAGE015
的值接近于1,进而
Figure 191416DEST_PATH_IMAGE016
接近于1;
通过以上两个过程交替,生成器实现高仿真光谱的生成。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,同时采用拉曼光谱背景信号评估模块,初步拟合所需去除的噪声和基线背景信号;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
采用拉曼光谱背景信号评估模块,初步拟合所需去除的噪声和基线背景信号;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述拉曼光谱位置编码器模块采用方法为滑动窗口法、正/余弦编码法或类批次编码法;
采用滑动窗口法,对拉曼光谱的不同拉曼位移依次进行分割后得到多通道数据;
采用正/余弦编码法,对光谱强度相对位置进行编码,具有周期性特征;
采用类批次编码法,对多条光谱进行相关性分析,利用相关系数对光谱进行编码。
本发明所述的拉曼光谱预处理模型生成方法,其中,所述损失函数采用公式:
Figure 680691DEST_PATH_IMAGE017
Figure 48087DEST_PATH_IMAGE018
其中
Figure 178854DEST_PATH_IMAGE019
用于训练背景信号评估模块,
Figure 707925DEST_PATH_IMAGE020
用于训练整个预处理模型;
Figure 947145DEST_PATH_IMAGE021
Figure 459510DEST_PATH_IMAGE022
分别指的是理想参考光谱和预处理之后的光谱;
Figure 834997DEST_PATH_IMAGE023
Figure 800548DEST_PATH_IMAGE024
对应于背景信号评估模块和预处理模型输出;
包括训练背景信号评估模块和拉曼光谱预处理模型两个过程:
第一步,使用
Figure 136851DEST_PATH_IMAGE025
对背景信号评估模块进行训练;
第二步,使用
Figure 580471DEST_PATH_IMAGE026
对拉曼光谱预处理模型进行训练;
Figure 78973DEST_PATH_IMAGE027
计算可选均方根误差、或平均绝对误差方法进行计算,同时在第二步中加入权重系数
Figure 825212DEST_PATH_IMAGE028
对二者反馈进行平衡;
所述均方根误差RMSE采用公式:
Figure 773445DEST_PATH_IMAGE029
所述平均绝对误差MAE采用公式:
Figure 161701DEST_PATH_IMAGE030
一种拉曼光谱预处理模型,其中,所述拉曼光谱预处理模型由如上述拉曼光谱预处理模型生成方法生成。
一种拉曼光谱预处理模型应用方法,应用如上述的拉曼光谱预处理模型,其实现方法如下:
将待处理的原始拉曼/表面增强拉曼光谱输入所述拉曼光谱预处理模型进行处理,输出去除了噪声和基线背景信号的处理后拉曼/表面增强拉曼光谱。
一种拉曼光谱预处理模型生成***,其中,应用于如上述的拉曼光谱预处理模型生成方法,包括:执行所述第一步的参数设置训练集单元和执行所述第二步的模型训练单元。
一种拉曼光谱预处理设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上述方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述方法的步骤。
本发明的有益效果在于:本发明是首次将自监督算法用于拉曼光谱的预处理,解决了拉曼光谱没有标签数据用于训练的问题;这种方法的优点是训练完成后模型使用简单、快速,并且得到的结果在有效去除噪声和背景基线信号的同时,具有更高的保真度;此方法可用于实时光谱分析,提高应用的准确率。应用范围包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像信噪比和分辨率提升等图像领域的应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图:
图1是本发明实施例一的拉曼光谱预处理模型生成方法流程图;
图2是本发明实施例一的拉曼光谱预处理模型生成方法噪声信息、基线背景信号以及拉曼峰提取示意图;
图3是本发明实施例一的拉曼光谱预处理模型生成方法高仿真拉曼光谱库和理想光谱库生成流程图;
图4是本发明实施例一的拉曼光谱预处理模型生成方法拉曼光谱位置编码模块(滑动窗口法)示意图;
图5是本发明实施例一的拉曼光谱预处理模型生成方法拉曼光谱预处理算法训练流程图;
图6是本发明实施例一的拉曼光谱预处理模型生成方法验证1的光谱处理结果比对图;
图7是本发明实施例一的拉曼光谱预处理模型生成方法验证2的不同预处理算法对基于血清表面增强拉曼光谱的癌症诊断准确率的影响示意图;
图8是本发明实施例一的拉曼光谱预处理模型生成方法验证3的预处理算法对拉曼高光谱细胞成像质量的提升效果比对示意图;
图9是本发明实施例二的拉曼光谱预处理模型生成方法拉曼光谱预处理算法训练流程图;
图10是本发明实施例三的拉曼光谱预处理模型生成方法拉曼光谱预处理算法训练流程图;
图11是本发明实施例五的拉曼光谱预处理模型应用方法原理框图;
图12是本发明实施例六的拉曼光谱预处理模型生成***原理框图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
实施例一
一种拉曼光谱预处理模型生成方法,如图1所示,同时参阅图2-8,其包括以下步骤:
S01:将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库:
准备训练数据集,生成理想光谱库和参考光谱库;
训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库;
如图3所示,包括步骤如下:
a1.收集真实的拉曼光谱/表面增强拉曼光谱数据;
a2.提取拉曼光谱/表面增强拉曼光谱数据中拉曼光谱的噪声信息、基线背景信号和拉曼特征峰,并分别生成噪声信息库、基线背景信号库和拉曼峰库;
a3.将拉曼峰库中的特征峰随机组合生成不带噪声和基线背景信号的理想光谱,并建库;
a4.在理想光谱数据上叠加提取的噪声和基线背景信号生成参考光谱,并建库;
a5.生成器以理想光谱库和随机高斯噪声为输入,其功能是生成仿真拉曼光谱;
a6.鉴别器以仿真拉曼光谱库和参考光谱库为输入,其功能是将仿真拉曼光谱判别为假(或真),并将参考光谱判别为真(或假);
a7.在训练生成器时,生成器损失函数以鉴别器将仿真光谱判别为真(或假)的误差最小化为目标,在训练鉴别器时,鉴别器损失函数以鉴别器分类准确率最大化为目标,该过程将导致生成器损失函数值增加,而训练生成器时会对抗该过程,通过交替训练生成器与鉴别器,生成器将生成更加接近参考光谱的高仿真拉曼光谱库;
a8.训练生成器和鉴别器过程中,采用损失函数:
Figure 511780DEST_PATH_IMAGE032
其中
Figure 574062DEST_PATH_IMAGE003
表示生成器(G)利用输入的随机高斯噪声(z)和理想光谱(
Figure 150537DEST_PATH_IMAGE004
)生成的仿真拉曼光谱;
Figure 935959DEST_PATH_IMAGE005
Figure 874965DEST_PATH_IMAGE006
分别表示鉴别器(D)将输入光谱判断为仿真拉曼光谱
Figure 494165DEST_PATH_IMAGE007
为假或真和参考光谱
Figure 154341DEST_PATH_IMAGE008
为真或假的概率;
该公式包括
Figure 884400DEST_PATH_IMAGE009
Figure 677912DEST_PATH_IMAGE033
两个过程:
Figure 592648DEST_PATH_IMAGE009
表示训练鉴别器时,仿真拉曼光谱
Figure 878136DEST_PATH_IMAGE007
被判断为假,参考光谱
Figure 2431DEST_PATH_IMAGE008
被判断为真,使
Figure 916029DEST_PATH_IMAGE011
的值接近于0,进而
Figure 877032DEST_PATH_IMAGE034
接近于0,实现了鉴别器准确率最大化
同理,
Figure 243291DEST_PATH_IMAGE035
表示在训练生成器时,仿真拉曼光谱
Figure 315152DEST_PATH_IMAGE007
被判断为真,使
Figure 351766DEST_PATH_IMAGE036
的值接近于1,进而
Figure 77145DEST_PATH_IMAGE037
接近于1。通过以上步骤交替,生成器实现了生成高仿真光谱的功能。
S02:将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化;
基线背景信号:拉曼光谱基线背景信号是指在光谱采集过程中不可避免引入一个缓慢变化的信号,通常来源于荧光信号。在激光照射过程中,光与物质相互作用除了发生拉曼光子跃迁之外,还有很大部分同频荧光发生跃迁,产生缓慢变化的信号,当该信号半高宽大于拉曼峰,有效拉曼谱峰与荧光背景信号叠加在一起会难以被识别,这种现象被称为基线漂移,即产生基线背景信号;
生成器主要由神经网络构成,生成器以理想光谱库和随机高斯噪声为输入,其功能是生成仿真拉曼光谱。随机高斯噪声作为一个随机变量,为理想参考光谱提供不同的背景信号。主要可选用卷积神经网络、注意力神经网络、图神网络、或感知机神经网络等;
鉴别器主要由神经网络构成,以仿真拉曼光谱库和参考光谱库为输入,其功能是将仿真拉曼光谱判别为假(或真),并将参考光谱判别为真(或假)。主要可选用卷积神经网络、注意力神经网络、图神网络、或感知机神经网络等;
具体的,第二步采用方法:
b1.使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,使模型训练时更容易自动关联每一个强度对应的拉曼位移,加强模型的拟合和泛化能力;同时采用拉曼光谱背景信号评估模块,初步拟合所需去除的信号;
b2.采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;主要利用神经网络对光谱进行分类训练,在分类训练过程中,模型会学习得到光谱中的关键的特征(拉曼峰)。编码器采用的方法包括卷积神经网络、注意力网络、或感知机网络等;
b3.采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;将来自编码器的高度压缩的特征还原成去除基线和噪声的光谱,使用神经网络自动学习模型训练过程的解码器能力。解码器采用的方法包括卷积神经网络、注意力网络、或感知机网络等;
b4.理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并计算损失函数:
Figure 337225DEST_PATH_IMAGE038
Figure 806253DEST_PATH_IMAGE039
其中
Figure 691513DEST_PATH_IMAGE040
用于训练背景信号评估模块,
Figure 728740DEST_PATH_IMAGE020
用于训练整个预处理模型。
Figure 335170DEST_PATH_IMAGE021
Figure 607889DEST_PATH_IMAGE022
分别指的是理想参考光谱和预处理之后的光谱。
Figure 350586DEST_PATH_IMAGE023
Figure 827222DEST_PATH_IMAGE024
对应于背景信号评估模块和预处理模型输出。整个训练过程第一步使用
Figure 920949DEST_PATH_IMAGE040
只对背景信号评估进行训练。第二步,
Figure 607145DEST_PATH_IMAGE041
对整个预处理模型进行训练。
Figure 469928DEST_PATH_IMAGE027
计算可选均方根误差、或平均绝对误差方法进行计算。同时在第二步中加入权重系数
Figure 973590DEST_PATH_IMAGE042
对二者反馈进行平衡。
所述均方根误差RMSE采用公式:
Figure 161470DEST_PATH_IMAGE029
所述均方平均绝对误差MAE采用公式:
Figure 775991DEST_PATH_IMAGE030
b5.将损失值反馈回拉曼光谱预处理模型,通过导数链式法则进行模型参数的更新;
具体的,第一步中:
提取噪声信号可使用小波变换方法、傅里叶变换方法或者窗口滑动方法等实现;说明如下:
小波变换是一种时频局部化的信号处理方法,适合于在低频变化缓慢和在高频变化较快的信号,它非常适合于局部瞬时事件。对于拉曼光谱而言,噪声等价于高频信号,基线和拉曼峰等价于较低频的信号,因此使用小波变换可以有效提取拉曼光谱中的噪声信号。具体来说,对光谱信号进行小波变换系数分解,保留主要由噪声信号控制的小波系数,利用保留的小波系数重构可以得到其中的噪声信号;
傅里叶变换的目的是可将时域(即时间域)上的信号转变为频域(即频率域)上的信号。利用傅里叶变换同样也可以认为噪声是高频信号。具体来说,对光谱进行离散傅里叶变化,根据傅里叶域提取高频分量,最终可以获得其中的噪声信号;
滑动窗口算法是在给定窗口大小的数组上执行要求的操作。去噪就是用窗口内数据的统计值(如均值、中值等)来代替当前值,获取噪声的时候就是利用原始光谱减去滑动后的光谱即可获得噪声;
提取拉曼光谱拉曼特征峰使用梯度下降法或微分寻峰拟合方法等实现;说明如下:
梯度下降是一种常用的求解无约束最优化问题的方法。简单来说就是利用求导的矢量方向和大小求解函数的极值,对于拉曼特征峰提取,利用极值(一个拉曼峰,两个峰边沿)即可分离出拉曼峰;
微分法对光谱进行局域微分求解。对于光谱而言,在变化速率小的区域微分值小,拉曼峰附近微分值大。因此根据微分值大小对峰进行分离,可以得到一个个分离得到的拉曼峰;
提取基线背景信号使用小波变换方法、傅里叶变换方法或者最小二乘法等实现;说明如下:
小波变换是一种时频局部化的信号处理方法,适合于在低频变化缓慢和在高频变化较快的信号,它非常适合于局部瞬时事件。对于拉曼光谱而言,噪声等价于高频信号,基线等价于低频信号,拉曼峰等价于中频的信号,因此使用小波变换可以去有效提取其中的基线信号。具体来说,对光谱信号进行小波变换系数分解,保留主要由基线信号控制的小波系数,利用保留的小波系数重构可以得到其中的基线背景信号;
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差(真实目标对象与拟合目标对象的差)的平方和寻找数据的最佳函数匹配。对于拉曼光谱而言,总体趋势线属于基线信号,因此利用最小二乘法拟合光谱趋势可获得基线背景信号;
傅里叶变换的目的是可将时域(即时间域)上的信号转变为频域(即频率域)上的信号。利用傅里叶变换同样也可以认为基线是中频信号。具体来说,对光谱进行离散傅里叶变换,根据傅里叶域提取中频分量,最终可以获得其中的基线背景信号;
第二步中:拉曼光谱位置编码器模块对光谱峰分割采用方法为滑动窗口法、正/余弦编码法或类批次编码法等方法;
具体的,“拉曼光谱位置编码器模块”对拉曼位移进行编码可以采用不同的具体方法,包括但不限于滑动窗口法、正/余弦编码法、或类批次编码法等,不同的编码侧重性有所不同。
“滑动窗口法”将光谱进行多通道分段,分段后每部分光谱分属不同的特征提取,在共同计算中可以保持权重。“滑动窗口法”编码器侧重于对光谱不同拉曼位移段弱特征峰的信号保留。
可选方案采用的“正/余弦编码法”,正/余弦编码法对光谱的拉曼位移进行编码,对每个拉曼位移给出一个编码值,可以获得位移和强度的强对应关系,该方法侧重于光谱的周期性特征。
可选方案采用的“类批次编码法”使用分析批次间的关系给出编码关系式,例如对同一个拉曼位移的所有光谱强度给出一个固定的编码值,这种编码方法反应了同一个拉曼位移间的强对应关系,侧重分析光谱间的差异。这些编码器的作用都是在模型输入时可以更容易自动匹配每一个强度所对应的拉曼位移,加强模型的拟合和泛化能力;
本发明是首次将自监督算法用于拉曼光谱的预处理,解决了拉曼光谱没有标签数据用于训练的问题;这种方法的优点是训练完成后模型使用简单,快速,并且得到的结果在有效去除噪声和基线背景信号的同时,具有更高的保真度;此方法可用于实时光谱分析,提高应用的准确率。应用范围包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像信噪比和分辨率提升等图像领域的应用。
图2是拉曼光谱生成对抗网络算法中噪声信息库、基线背景信号库和拉曼峰库提取示意图;
具体实施:辅助任务拉曼光谱生成对抗网络算法部分对输入的(a)真实拉曼光谱库进行特征峰寻峰和窗口分割,对相应特征进行提取。特征提取方法包括但不限于最小二乘法,小波变换,维纳变换等。进而建立(b)噪声信息库、(c)基线背景信号库和(d)拉曼峰库;
图4是拉曼光谱预处理模型RSBPDL算法中拉曼光谱位置编码模块(滑动窗口)示意图;
具体实施:使用滑动窗口策略将光谱分成多个区域送入拉曼光谱预处理模型RSBPDL模型进行处理。该滑动窗口策略的关键参数是步长(stride)和大小(Size)两个参数,这两个参数在模型训练中会根据输出反馈自动选择最合适的数值。该模块的主要作用是对光谱进行切分,从而在光谱预处理过程中实现不同波数段的光谱特征峰提取;在预处理后,可以更好的还原微弱信号的拉曼峰;
以下是本发明在对光谱预处理的效果技术参数与现有方法的比较:
表1各种预处理算法处理后的光谱与理想光谱的均方根误差(RMSE)值比较
Figure 493281DEST_PATH_IMAGE044
表2各种预处理算法处理后的光谱与理想光谱的无穷范数(Infinitenorm,
Figure 167844DEST_PATH_IMAGE045
)值比较
Figure 111530DEST_PATH_IMAGE047
表1和表2分别展示了本发明与现有方法相比,对不同信噪比的原始拉曼光谱的噪声去除和背景抑制能力(表1RMSE),以及信号保真程度(表2无穷范数)。其中均方根误差(RMSE)用于计算图中两条光谱的差异,该值越小说明噪声去除和背景抑制能力越强,
Figure 532671DEST_PATH_IMAGE048
,其中
Figure 979833DEST_PATH_IMAGE049
表示光谱总点数,
Figure 825298DEST_PATH_IMAGE050
为光谱第
Figure 115334DEST_PATH_IMAGE050
个点,
Figure 212603DEST_PATH_IMAGE051
理想参考光谱,
Figure 659413DEST_PATH_IMAGE052
预处理之后的光谱。无穷范数(
Figure 675779DEST_PATH_IMAGE045
)于计算光谱中峰的最大差异,该数值越小,说明光谱的保真度越高,
Figure 453111DEST_PATH_IMAGE053
,其中
Figure 822913DEST_PATH_IMAGE049
表示光谱总点数,
Figure 637810DEST_PATH_IMAGE050
为光谱第
Figure 825077DEST_PATH_IMAGE050
个点,
Figure 699493DEST_PATH_IMAGE051
表示理想参考光谱,
Figure 263198DEST_PATH_IMAGE052
表示预处理之后的光谱。从结果看,本发明RSBPDL处理后的光谱对比原始光谱的均方根误差(RMSE)和无穷范数(
Figure 929671DEST_PATH_IMAGE045
)相比其他现有方法小,说明本发明对拉曼光谱预处理效果优于现有方法;
图6是不同算法预处理后的单光谱与理想光谱重合度比较示意图(表1和表2中的光谱4);
(a)展示了由拉曼光谱生成对抗网络算法生成的光谱数据,其中原始光谱是含噪声和基线的处理前原始光谱,理想光谱是对应的去除噪声和基线背景信号后的理想光谱。(b-f)展示了五种不同的预处理算法(Polynomialfitting,Wavelettransform,ResidualCNN,Unet-1D和RSBPDL)对原始光谱进行处理后的光谱与理想光谱的比较。其中RSBPDL为本发明模型。预处理后的光谱与理想光谱越相似,说明该算法对光谱的噪声去除和背景抑制能力更高,对光谱的保真程度更高。从结果看,RSBPDL处理后的光谱与理想光谱重合度最高,并且均方根误差(RMSE)和无穷范数(
Figure 160277DEST_PATH_IMAGE054
)值最小,说明本发明对拉曼光谱预处理效果优于现有方法;
图7是本发明预处理拉曼光谱对疾病诊断准确率有提升作用;
诊断试验纳入28例癌症患者和27例正常人,数据集划分为训练集各22/21例,验证集各6例,交叉验证100次。诊断模型采用残差神经网络诊断,使用的数据为受试者血清采集表面增强拉曼光谱。为了提高诊断准确率,需要对采集到的拉曼光谱进行去除噪声和基线背景信号的预处理。
分别利用本发明的拉曼光谱预处理模型(RSBPDL)以及现有的四种预处理算法(Polynomialfitting,Wavelettransform,ResidualCNN,和Unet-1D)对采集到的拉曼光谱进行预处理后,再将得到光谱输入疾病诊断模型中训练,并通过验证集评估的诊断准确率。其中受试者工作特征曲线(ROC)是临床诊断用于综合评价诊断方法的特异性和灵敏度的工具。AUC是ROC曲线下的面积,AUC数值越高说明诊断准确率越高。由左图可见,经过本发明RSBPDL预处理拉曼光谱的诊断准确率相关ROC曲线位于最上方,代表ROC曲线下面积最大;右图为误差棒图,其中上下横线表示误差的上下限,棱形表示误差均值。每条线表示一种预处理方法;右图显示,在所有预处理算法中,本发明拉曼光谱预处理算法RSBPDL预处理后进行分类诊断的AUC值最大,对诊断准确率的提升效果最佳,本发明拉曼光谱预处理算法RSBPDL通过对噪声和基线背景信号的有效去除,可以明显提高光谱应用于疾病诊断的准确率。
图8是本发明对拉曼光谱细胞成像的分辨率提升效果展示;
左图是通过拉曼共聚焦显微镜直接采集的原始拉曼光谱图,选择像素点拉曼光谱中2930cm-1的拉曼峰进行成像,可以看到图像信噪比和分辨率较低。右图对采集到的拉曼光谱使用本发明RSBPDL算法进行预处理后再成图像。
通过比较可以看到成像后的图像质量得到较大提升,并且图像中可以看到细胞更多细节,具有更高的信噪比和分辨率。
图像质量评价可以通过计算两个图像的熵值实现,熵值越大表明图像所包含信息越多。
熵值(Entropy)计算公式:
Figure 646622DEST_PATH_IMAGE055
,其中Pi代表为每个像素点的值。左图熵值为2.43,右图熵值为3.09,结果表明经过RSBPDL预处理光谱后的拉曼图像包含更多的细节信息。因此RSBPDL预处理后可以有效提升拉曼图像质量;
实施例二
本实施例与实施例一基本相同,相同之处不再赘述,不同之处在于,如图9所示:第二步采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,使模型训练时更容易自动关联每一个强度对应的拉曼位移,加强模型的拟合和泛化能力;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
采用拉曼光谱背景信号评估模块,初步拟合所需去除的信号,降低后续拟合难度;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新;
如图9所示,与实施例一的方案的区别在于:在第二步中将“拉曼光谱背景信号评估模块”后移,同样可以实现光谱的预处理,只是后置容易降低“拉曼光谱背景信号评估模块”输出结果的作用,效果会有所下降,原因是:当“拉曼光谱背景信号评估模块”被后置后,其特征不能被编码器所提取,只能依靠解码器对背景评估模型输出进行处理。因此,在“拉曼光谱背景信号评估模块”被后置后其可训练性被降低,相比于实施例一中的效果,其预处理后噪声会偏大。
实施例三
本实施例与实施例一基本相同,相同之处不再赘述,不同之处在于,如图10所示:第二步采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,使模型训练时更容易自动关联每一个强度对应的拉曼位移,加强模型的拟合和泛化能力;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并计算损失函数;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新;
如图10所示,与实施例一的方案的区别在于:在第二步中仅利用“编码器模块”和“解码器模块”对光谱特征进行提取,并去除基线和噪声。由于移除了“光谱的背景信号评估模块”,虽然同样可以实现光谱预处理,但是效果会有所下降。
实施例四
一种拉曼光谱预处理模型,其中,所述拉曼光谱预处理模型由如上述拉曼光谱预处理模型生成方法生成。
实施例五
一种拉曼光谱预处理模型应用方法,如图11所示,应用如上述的拉曼光谱预处理模型,其实现方法如下:
将待处理的原始拉曼/表面增强拉曼光谱输入所述拉曼光谱预处理模型进行处理,输出去除了噪声信号和基线背景信号的处理后拉曼/表面增强拉曼光谱;
本方法可以直接用于任意待处理拉曼光谱的噪声、基线背景信号去除。输出的处理后光谱,可以直接用于下游应用,并提升该应用的性能。应用包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像分辨率提升等图像领域的应用。
实施例六
一种拉曼光谱预处理模型生成***,如图12所示,用于实施如上述的拉曼光谱预处理模型生成方法,包括执行第一步以生成高仿真拉曼光谱库和理想光谱库的参数设置训练集单元1和执行第二步以训练生成参数优化后的自监督拉曼光谱预处理模型的模型训练单元2;
本发明是首次将自监督算法用于拉曼光谱的预处理,解决了拉曼光谱没有标签数据用于训练的问题;这种方法的优点是训练完成后模型使用简单,快速,并且得到的结果在有效去除噪声和基线背景信号的同时,具有更高的保真度;此方法可用于实时光谱分析,提高应用的准确率。应用范围包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像信噪比和分辨率提升等图像领域的应用。
实施例七
一种拉曼光谱预处理设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现如上述方法的步骤。
实施例八
一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其中,计算机程序被处理器执行时实现如上述方法的步骤。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种拉曼光谱预处理模型生成方法,其特征在于,包括以下步骤:
第一步:将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库:
第二步:将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化。
2.根据权利要求1所述的拉曼光谱预处理模型生成方法,其特征在于,所述将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库包括方法:
准备训练数据集,生成理想光谱库和参考光谱库;
训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库。
3.根据权利要求2所述的拉曼光谱预处理模型生成方法,其特征在于,所述准备训练数据集,生成理想光谱库和参考光谱库包括方法:
收集真实的拉曼光谱/表面增强拉曼光谱数据;
提取拉曼光谱/表面增强拉曼光谱数据中拉曼光谱的噪声信息、基线背景信号和拉曼特征峰,并分别生成噪声信息库、基线背景信号库和拉曼峰库;
将拉曼峰库中的特征峰随机组合生成不带噪声和基线背景信号的理想光谱,并建库;
在理想光谱数据上叠加提取的噪声和基线背景信号生成参考光谱,并建库。
4.根据权利要求2所述的拉曼光谱预处理模型生成方法,其特征在于,所述训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库包括方法:
拉曼光谱生成对抗网络包含生成器和鉴别器,其中
生成器:以理想光谱库和随机高斯噪声为输入,生成仿真拉曼光谱;
鉴别器:以仿真拉曼光谱库和参考光谱库为输入,将仿真拉曼光谱判别为假或真,并将参考光谱判别为真或假;
在训练生成器时,生成器损失函数以鉴别器将仿真光谱判别为真或假的误差最小化为目标;
在训练鉴别器时,鉴别器损失函数以鉴别器分类准确率最大化为目标;
交替训练生成器与鉴别器,生成器最终生成接近参考光谱的高仿真拉曼光谱库。
5.根据权利要求4所述的拉曼光谱预处理模型生成方法,其特征在于,所述生成高仿真拉曼光谱采用公式:
Figure 201412DEST_PATH_IMAGE002
其中
Figure 774345DEST_PATH_IMAGE003
表示生成器(G)利用输入的随机高斯噪声(z)和理想光谱(
Figure 819661DEST_PATH_IMAGE004
)生成的仿真拉曼光谱;
Figure 870663DEST_PATH_IMAGE005
Figure 216194DEST_PATH_IMAGE006
分别表示鉴别器(D)将输入光谱判断为仿真拉曼光谱
Figure 691519DEST_PATH_IMAGE007
为假或真和参考光谱
Figure 489710DEST_PATH_IMAGE008
为真或假的概率;
该公式包括
Figure 344403DEST_PATH_IMAGE009
Figure 403495DEST_PATH_IMAGE010
两个过程:
Figure 928017DEST_PATH_IMAGE009
表示训练鉴别器时,仿真拉曼光谱
Figure 75489DEST_PATH_IMAGE011
被判断为假,参考光谱
Figure 202714DEST_PATH_IMAGE008
被判断为真,使
Figure 257257DEST_PATH_IMAGE012
的值接近于0,进而
Figure 77315DEST_PATH_IMAGE013
接近于0,实现了鉴别器准确率最大化;
Figure 850099DEST_PATH_IMAGE014
表示在训练生成器时,仿真拉曼光谱
Figure 512506DEST_PATH_IMAGE007
被判断为真,使
Figure 811769DEST_PATH_IMAGE015
的值接近于1,进而
Figure 678094DEST_PATH_IMAGE016
接近于1;
通过以上两个过程交替,生成器实现高仿真光谱的生成。
6.根据权利要求1所述的拉曼光谱预处理模型生成方法,其特征在于,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,同时采用拉曼光谱背景信号评估模块,初步拟合所需去除的噪声和基线背景信号;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
7.根据权利要求1所述的拉曼光谱预处理模型生成方法,其特征在于,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
采用拉曼光谱背景信号评估模块,初步拟合所需去除的噪声和基线背景信号;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
8.根据权利要求1所述的拉曼光谱预处理模型生成方法,其特征在于,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:
使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码;
采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;
采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;
理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;
将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
9.根据权利要求6-8任一所述的拉曼光谱预处理模型生成方法,其特征在于,所述拉曼光谱位置编码器模块采用方法为滑动窗口法、正/余弦编码法或类批次编码法;
采用滑动窗口法,对拉曼光谱的不同拉曼位移依次进行分割后得到多通道数据;
采用正/余弦编码法,对光谱强度相对位置进行编码,具有周期性特征;
采用类批次编码法,对多条光谱进行相关性分析,利用相关系数对光谱进行编码。
10.根据权利要求6-8任一所述的拉曼光谱预处理模型生成方法,其特征在于,所述损失函数采用公式:
Figure 797228DEST_PATH_IMAGE017
Figure 407201DEST_PATH_IMAGE018
其中
Figure 298321DEST_PATH_IMAGE019
用于训练背景信号评估模块,
Figure 725760DEST_PATH_IMAGE020
用于训练整个预处理模型;
Figure 801033DEST_PATH_IMAGE021
Figure 214696DEST_PATH_IMAGE022
分别指的是理想参考光谱和预处理之后的光谱;
Figure 954464DEST_PATH_IMAGE023
Figure 428170DEST_PATH_IMAGE024
对应于背景信号评估模块和预处理模型输出;
包括训练背景信号评估模块和拉曼光谱预处理模型两个过程:
第一步,使用
Figure 256318DEST_PATH_IMAGE025
对背景信号评估模块进行训练;
第二步,使用
Figure 332727DEST_PATH_IMAGE026
对拉曼光谱预处理模型进行训练;
Figure 70876DEST_PATH_IMAGE027
计算可选均方根误差、或平均绝对误差方法进行计算,同时在第二步中加入权重系数
Figure 577468DEST_PATH_IMAGE028
对二者反馈进行平衡;
所述均方根误差RMSE采用公式:
Figure 158491DEST_PATH_IMAGE029
所述平均绝对误差MAE采用公式:
Figure 648378DEST_PATH_IMAGE030
11.一种拉曼光谱预处理模型,其特征在于,所述拉曼光谱预处理模型由如权利要求1-10任一所述拉曼光谱预处理模型生成方法生成。
12.一种拉曼光谱预处理模型应用方法,应用如权利要求11所述的拉曼光谱预处理模型,其特征在于,实现方法如下:
将待处理的原始拉曼/表面增强拉曼光谱输入所述拉曼光谱预处理模型进行处理,输出去除了噪声和基线背景信号的处理后拉曼/表面增强拉曼光谱。
13.一种拉曼光谱预处理模型生成***,其特征在于,应用于如权利要求1-10任一所述的拉曼光谱预处理模型生成方法,包括:执行所述第一步的参数设置训练集单元和执行所述第二步的模型训练单元。
14.一种拉曼光谱预处理设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至10任一项所述方法的步骤。
15.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10任一项所述方法的步骤。
CN202211256339.9A 2022-10-13 2022-10-13 拉曼光谱预处理模型生成方法、***、终端及存储介质 Active CN115326783B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211256339.9A CN115326783B (zh) 2022-10-13 2022-10-13 拉曼光谱预处理模型生成方法、***、终端及存储介质
PCT/CN2023/121358 WO2024078321A1 (zh) 2022-10-13 2023-09-26 拉曼光谱预处理模型生成方法、***、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211256339.9A CN115326783B (zh) 2022-10-13 2022-10-13 拉曼光谱预处理模型生成方法、***、终端及存储介质

Publications (2)

Publication Number Publication Date
CN115326783A true CN115326783A (zh) 2022-11-11
CN115326783B CN115326783B (zh) 2023-01-17

Family

ID=83913179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211256339.9A Active CN115326783B (zh) 2022-10-13 2022-10-13 拉曼光谱预处理模型生成方法、***、终端及存储介质

Country Status (2)

Country Link
CN (1) CN115326783B (zh)
WO (1) WO2024078321A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116152578A (zh) * 2023-04-25 2023-05-23 深圳湾实验室 一种降噪生成式模型的训练方法、装置、降噪方法及介质
CN117783088A (zh) * 2024-02-23 2024-03-29 广州贝拓科学技术有限公司 激光显微拉曼光谱仪的控制模型训练方法及装置、设备
WO2024078321A1 (zh) * 2022-10-13 2024-04-18 南方科技大学 拉曼光谱预处理模型生成方法、***、终端及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102022133962B4 (de) 2022-12-19 2024-07-25 Friedrich-Schiller-Universität Jena Körperschaft des öffentlichen Rechts Aufbereitung gemessener raman-spektren mit neuronalen netzwerken
CN118172627A (zh) * 2024-05-11 2024-06-11 华东交通大学 近红外光谱生成方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210270742A1 (en) * 2020-02-28 2021-09-02 Virginia Tech Intellectual Properties, Inc. Peak-preserving and enhancing baseline correction methods for raman spectroscopy
CN113378680A (zh) * 2021-06-01 2021-09-10 厦门大学 一种拉曼光谱数据的智能建库方法
CN113390848A (zh) * 2020-03-13 2021-09-14 桂林电子科技大学 一种dcgan光谱数据扩充方法
CN113791037A (zh) * 2021-08-19 2021-12-14 南京航空航天大学 一种基于生成对抗网络的硅基傅里叶变换光谱测量方法
CN114417937A (zh) * 2022-01-26 2022-04-29 山东捷讯通信技术有限公司 一种基于深度学习的拉曼光谱去噪方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103217409B (zh) * 2013-03-22 2015-02-18 中国科学院重庆绿色智能技术研究院 一种拉曼光谱预处理方法
WO2020005770A1 (en) * 2018-06-28 2020-01-02 Applied Materials, Inc. Training spectrum generation for machine learning system for spectrographic monitoring
CN115997219A (zh) * 2020-06-23 2023-04-21 株式会社岛津制作所 数据生成方法及装置、以及识别器的生成方法及装置
KR102238300B1 (ko) * 2020-09-24 2021-04-12 국방과학연구소 적외선 스펙트럼 생성 방법 및 장치
CN112712857A (zh) * 2020-12-08 2021-04-27 北京信息科技大学 一种基于wgan对抗生成网络生成生物拉曼光谱数据的方法
CN115326783B (zh) * 2022-10-13 2023-01-17 南方科技大学 拉曼光谱预处理模型生成方法、***、终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210270742A1 (en) * 2020-02-28 2021-09-02 Virginia Tech Intellectual Properties, Inc. Peak-preserving and enhancing baseline correction methods for raman spectroscopy
CN113390848A (zh) * 2020-03-13 2021-09-14 桂林电子科技大学 一种dcgan光谱数据扩充方法
CN113378680A (zh) * 2021-06-01 2021-09-10 厦门大学 一种拉曼光谱数据的智能建库方法
CN113791037A (zh) * 2021-08-19 2021-12-14 南京航空航天大学 一种基于生成对抗网络的硅基傅里叶变换光谱测量方法
CN114417937A (zh) * 2022-01-26 2022-04-29 山东捷讯通信技术有限公司 一种基于深度学习的拉曼光谱去噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李灵巧 等: "基于DCGAN的拉曼光谱样本扩充及应用研究", 《光谱学与光谱分析》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024078321A1 (zh) * 2022-10-13 2024-04-18 南方科技大学 拉曼光谱预处理模型生成方法、***、终端及存储介质
CN116152578A (zh) * 2023-04-25 2023-05-23 深圳湾实验室 一种降噪生成式模型的训练方法、装置、降噪方法及介质
CN116152578B (zh) * 2023-04-25 2023-07-18 深圳湾实验室 一种降噪生成式模型的训练方法、装置、降噪方法及介质
CN117783088A (zh) * 2024-02-23 2024-03-29 广州贝拓科学技术有限公司 激光显微拉曼光谱仪的控制模型训练方法及装置、设备
CN117783088B (zh) * 2024-02-23 2024-05-14 广州贝拓科学技术有限公司 激光显微拉曼光谱仪的控制模型训练方法及装置、设备

Also Published As

Publication number Publication date
CN115326783B (zh) 2023-01-17
WO2024078321A1 (zh) 2024-04-18

Similar Documents

Publication Publication Date Title
CN115326783B (zh) 拉曼光谱预处理模型生成方法、***、终端及存储介质
US20190056297A1 (en) Multi-Spectral Imaging Including At Least One Common Stain
US7953264B2 (en) Classifying image features
CN110879980B (zh) 基于神经网络算法的核磁共振波谱去噪方法
CN113780056A (zh) 基于振动信号的滚动轴承故障诊断方法
CN115640506B (zh) 基于时频谱信号增强的磁粒子分布模型重建方法和***
CN110503060B (zh) 一种光谱信号去噪方法及其***
CN112200770A (zh) 一种基于拉曼光谱和卷积神经网络的肿瘤检测方法
Abdolmaleki et al. Selecting optimum base wavelet for extracting spectral alteration features associated with porphyry copper mineralization using hyperspectral images
CN112951342A (zh) 数据解析***以及数据解析方法
Tripathi Facial image noise classification and denoising using neural network
CN115661069A (zh) 一种高光谱异常检测方法及计算机装置
CN115770044A (zh) 基于脑电相位幅值耦合网络的情绪识别方法及装置
CN116380869A (zh) 一种基于自适应稀疏分解的拉曼光谱去噪方法
Foucher et al. Deep speckle noise filtering
Darıcı et al. A comparative study on denoising from facial images using convolutional autoencoder
Yoon Statistical denoising scheme for single molecule fluorescence microscopic images
CN117313001B (zh) 用于分布式光纤声波传感***的混合事件分解及识别方法
Mohammed et al. A Comprehensive Study on Medical Image Denoising using Convolutional Neural Networks
Nagaraja et al. A fully automatic approach for enhancement of microarray images
CN117852612A (zh) 一种基于无监督式学习的拉曼光谱去噪方法
EP3318932B1 (en) System and method for the removal of twin-image artifact in lens free imaging
Chamunorwa Work in Progress: Noise Reduction Through Artificial Intelligence Techniques: An Introductory Study
CN117036821A (zh) 一种基于激光拉曼光谱的单细胞快速检测鉴定方法
Agarwal et al. Refinement of Cryo-EM 3D Maps with Self-Supervised Denoising Model: crefDenoiser

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant