CN108241846B - 用于识别拉曼谱图的方法 - Google Patents

用于识别拉曼谱图的方法 Download PDF

Info

Publication number
CN108241846B
CN108241846B CN201611222588.0A CN201611222588A CN108241846B CN 108241846 B CN108241846 B CN 108241846B CN 201611222588 A CN201611222588 A CN 201611222588A CN 108241846 B CN108241846 B CN 108241846B
Authority
CN
China
Prior art keywords
spectrogram
peak
measured
standard
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611222588.0A
Other languages
English (en)
Other versions
CN108241846A (zh
Inventor
苟巍
左佳倩
范锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuctech Co Ltd
Original Assignee
Nuctech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuctech Co Ltd filed Critical Nuctech Co Ltd
Priority to CN201611222588.0A priority Critical patent/CN108241846B/zh
Priority to US16/473,505 priority patent/US10948417B2/en
Priority to EP17888822.8A priority patent/EP3561718A4/en
Priority to PCT/CN2017/112915 priority patent/WO2018121151A1/zh
Publication of CN108241846A publication Critical patent/CN108241846A/zh
Application granted granted Critical
Publication of CN108241846B publication Critical patent/CN108241846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/02Details
    • G01J3/0205Optical elements not provided otherwise, e.g. optical manifolds, diffusers, windows
    • G01J3/0208Optical elements not provided otherwise, e.g. optical manifolds, diffusers, windows using focussing or collimating elements, e.g. lenses or mirrors; performing aberration correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J3/44Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种用于识别拉曼谱图的方法,包括以下步骤:对待测物质的拉曼光谱进行测量,以获得被测谱图,该被测谱图包括一系列数据;提取出被测谱图的峰信息,该峰信息包括峰强、峰位和峰区;比较被测谱图的峰信息和预存的标准谱图的峰信息,以识别被测谱图与标准谱图的峰信息是否匹配;和在第一识别步骤中识别出被测谱图与标准谱图的峰信息匹配的情况下,比较被测谱图的数据和预存的标准谱图的数据,以进一步识别被测谱图与标准谱图是否匹配。

Description

用于识别拉曼谱图的方法
技术领域
本发明涉及谱图分析处理技术领域,尤其涉及一种用于识别拉曼谱图的方法。
背景技术
拉曼光谱是一种分子振动光谱,它可以反映分子的指纹特征,可用于对物质的检测。拉曼光谱检测通过检测待测物对于激发光的拉曼散射效应所产生的拉曼光谱来检测和识别物质。拉曼光谱检测方法已经广泛应用于液体安检、珠宝检测、***物检测、毒品检测、药品检测、农药残留检测等领域。
在对拉曼光谱的谱图进行分析处理时,经常面临的一个问题是如何有效且快速地识别被测物质的拉曼谱图与标准谱图是否匹配。
现有的拉曼谱图建模方法通常直接选择谱图的数据信息用于建模,然后,将被测物质的拉曼谱图与标准库中的标准拉曼谱图进行匹配,不仅识别率不高,而且运算时间较长,不能体现出拉曼识别的优点。
发明内容
本发明的目的是提供一种用于识别拉曼谱图的方法,其能够有效且快速地匹配拉曼谱图与标准谱图。
为了实现上述发明目的,本发明的技术方案通过以下方式来实现:
根据本发明的一个方面,提供一种用于识别拉曼谱图的方法,包括以下步骤:
被测谱图获得步骤:对待测物质的拉曼光谱进行测量,以获得被测谱图,该被测谱图包括一系列数据;
峰信息提取步骤:提取出被测谱图的峰信息,该峰信息包括峰强、峰位和峰区;
第一识别步骤:比较被测谱图的峰信息和预存的标准谱图的峰信息,以识别被测谱图与标准谱图的峰信息是否匹配;和
第二识别步骤:在第一识别步骤中识别出被测谱图与标准谱图的峰信息匹配的情况下,比较被测谱图的数据和预存的标准谱图的数据,以进一步识别被测谱图与标准谱图是否匹配。
根据一些实施例,所述第一识别步骤包括:
排序步骤:按照峰强从大到小的顺序,对被测谱图的峰和标准谱图的峰分别进行排序,以选择出被测谱图和标准谱图的排序在前N名的峰;
比较步骤:比较被测谱图和标准谱图的排序在前N名的峰的峰位信息;和
第一匹配步骤:根据比较步骤得到的比较结果,确定被测谱图与标准谱图的峰信息是否匹配。
根据一些实施例,所述比较步骤中比较被测谱图和标准谱图的排序在前N名的峰的峰位信息的步骤具体包括:
按照下述公式(1)依次计算被测谱图和标准谱图的排序在前N名的各个峰的峰位的绝对差,
其中:
公式(1)为:pD=|p2[j].fPos-p1[i].fPos|,
其中,N为预定的比较峰数,N为大于等于3的自然数;
i,j分别表示标准谱图和被测谱图中的排序后的峰的序号,i和j均为大于等于0且小于等于N的整数;
p1[i].fPos表示标准谱图中排序后的第i个峰的峰位;
p2[j].fPos表示被测谱图中排序后的第j个峰的峰位;
pD表示峰位的绝对差。
根据一些实施例,所述第一匹配步骤中根据比较步骤得到的比较结果确定被测谱图与标准谱图的峰信息是否匹配的步骤具体包括:
当计算出的峰位的绝对差满足下述条件(1)时,确定被测谱图与标准谱图的峰信息匹配;当计算出的峰位的绝对差不满足下述条件(1)时,确定被测谱图与标准谱图的峰信息不匹配,
其中:
条件(1)为:pD<p2[j].fWidth/3且pD<p1[i].fWidth/3,
其中,p1[i].fWidth表示标准谱图中排序后的第i个峰的峰宽;p2[j].fWidth表示被测谱图中排序后的第j个峰的峰宽。
根据一些实施例,所述第一识别步骤还包括:
峰匹配权重计算步骤:根据下述公式(2)建立惩罚性函数,以计算峰匹配权重;和
第二匹配步骤:当峰匹配权重大于等于预设的权重阈值时,确定被测谱图与标准谱图的峰信息匹配;当峰匹配权重小于所述权重阈值时,确定被测谱图与标准谱图的峰信息不匹配,
其中,公式(2)为:
h=(1-2*|j-i|/10)*(0.5/(i+1))*exp(-pD*2/min(p1[i].fWidth,p2[j].fWidth)),
其中:
h表示峰匹配权重;
i,j分别表示标准谱图和被测谱图中的排序后的峰的序号,i和j均为大于等于0且小于等于N的整数;
N为预定的比较峰数,N为大于等于3的自然数;
pD表示峰位的绝对差;
p1[i].fWidth表示标准谱图中排序后的第i个峰的峰宽;
p2[j].fWidth表示被测谱图中排序后的第j个峰的峰宽。
根据一些实施例,在所述第一匹配步骤中确定被测谱图与标准谱图的峰信息匹配的情况下,执行所述峰匹配权重计算步骤和所述第二匹配步骤。
根据一些实施例,N为大于等于3且小于等于5的自然数。
根据一些实施例,所述第二识别步骤中比较被测谱图的数据和预存的标准谱图的数据的步骤包括:
对被测谱图的数据和预存的标准谱图的数据进行相关性比较。
根据一些实施例,所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤包括:
计算被测谱图的数据和预存的标准谱图的数据的相关系数,当计算出的相关系数大于等于预设的相关性阈值时,确定被测谱图与标准谱图匹配;当计算出的相关系数小于所述相关性阈值时,确定被测谱图与标准谱图不匹配。
根据一些实施例,在被测谱图和标准谱图的所有峰的峰区的并集区间内,执行所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤。
根据一些实施例,所述方法还包括如下步骤:
归一化步骤:归一化所述被测谱图和所述标准谱图;
其中,所述归一化步骤在所述峰信息提取步骤之前执行。
根据本发明的又一方面,还提供一种电子设备,包括:
存储器,用于存储可执行指令;以及
处理器,用于执行存储器中存储的可执行指令,以执行上述方面或实施例中任一项所述的方法。
本发明的上述技术方案中的任何一个通过利用谱图的峰信息首先进行“峰”这个局部特征的比较,对被测谱图和标准谱图进行初步筛选,在初步筛选通过之后,才进行谱图数据的全局比较,不仅能够大大的缩短匹配识别时间,而且能够提高匹配识别的准确率。
附图说明
图1示意性地示出根据本发明的实施例的用于识别拉曼谱图的方法的流程图;
图2示意性示出了一种物质的拉曼谱图的一个峰;
图3示出了使用根据本发明实施例的用于识别拉曼谱图的方法识别匹配被测谱图与标准谱图的流程图;和
图4是示出了用于执行根据本发明的实施例的方法的电子设备的示例硬件布置的框图。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。在说明书中,相同或相似的附图标号表示相同或相似的部件。下述参照附图对本发明实施方式的说明旨在对本发明的总体发明构思进行解释,而不应当理解为对本发明的一种限制。
在本文中,为了描述方便,使用“第一、第二”、“A、B、C”或“S1/S10、S2/S20”等表述描述方法的步骤,但是,除非有特别说明,这样的表述不应理解为对步骤执行顺序的限制。
如图1所示,根据本发明实施例的一种用于识别拉曼谱图的方法可以包括以下步骤:
被测谱图获得步骤:对待测物质的拉曼光谱进行测量,以获得被测谱图,该被测谱图包括一系列数据;
峰信息提取步骤:提取出被测谱图的峰信息,该峰信息包括峰强、峰位和峰区;
第一识别步骤:比较被测谱图的峰信息和预存的标准谱图的峰信息,以识别被测谱图与标准谱图的峰信息是否匹配;和
第二识别步骤:在第一识别步骤中识别出被测谱图与标准谱图的峰信息匹配的情况下,比较被测谱图的数据和预存的标准谱图的数据,以进一步识别被测谱图与标准谱图是否匹配。
在本发明的实施例中,在比较被测谱图的数据和预存的标准谱图的数据之前,即在第二识别步骤之前,还执行第一识别步骤,即比较被测谱图的峰信息和预存的标准谱图的峰信息。只有在第一识别步骤中识别出被测谱图与标准谱图的峰信息匹配的情况下,才执行第二识别步骤;如果在第一识别步骤中识别出被测谱图与标准谱图的峰信息不匹配,那么可以直接确定被测谱图与标准谱图不匹配,而无需再执行第二识别步骤。这样,通过峰信息的比较,可以起到初步筛选的作用。而且,由于与拉曼谱图的全区间的数据相比,峰信息的数据量小得多,相应地,比较峰信息的计算量也会小得多。因此,通过设置第一识别步骤,可以大大减少计算量,从而提高识别速度,并且提高识别准确率。
进一步地,上述方法还可以包括:归一化步骤:归一化被测谱图和标准谱图。在一个实施例中,该归一化步骤在上述峰信息提取步骤之前执行。
具体地,如果被测谱图与标准谱图的横坐标不对应,即被测谱图与标准谱图包括不处于相同拉曼频移位置处的强度数据,那么首先可以根据被测谱图、标准谱图的原始数据,通过插值计算,计算出其它拉曼频移位置处的强度数据,从而将被测谱图、标准谱图转换到相同的拉曼频移位置处。例如,在一个示例中,可以设定拉曼频移位置为[350:2:2800]cm-1,其中,350cm-1、2800cm-1分别表示最小、最大拉曼频移位置,2表示间隔步长,即各个拉曼频移位置为350、352、354、356cm-1,以此类推,直至2800cm-1,然后,如果被测谱图、标准谱图的原始数据中不包括这些拉曼频移位置处的强度数据,那么可以根据被测谱图、标准谱图的原始数据,通过插值计算,计算出这些拉曼频移位置处的强度数据,从而将被测谱图、标准谱图转换到相同的拉曼频移位置[350:2:2800]cm-1处,将转换后的被测谱图、标准谱图分别计为被测谱图A’、B’。并且,如果被测谱图与标准谱图的纵坐标不对应,即被测谱图与标准谱图的强度数据不位于同一参考系中或以不同的量程测量,可以将被测谱图A’转换到标准谱图B’中。例如,在一个示例中,可以分别选取被测谱图A’、B’的纵坐标的最大值max(A’)、max(B’),然后将max(A’)与max(B’)的比值作为纵坐标的归一化系数,使被测谱图A’的离散数据分别乘以该归一化系数,以将被测谱图A’转换到标准谱图B’中。在其它实施例中,也可以保持标准谱图不变,直接将被测谱图归一化到标准谱图中。
下面,在进一步描述根据本发明实施例的用于识别拉曼谱图的方法之前,结合附图详细地说明拉曼谱图的峰信息。
图2示意性示出了一种物质的拉曼谱图的一个峰。拉曼谱图的峰信息可以包括峰区、峰位、峰的起点和终点、峰宽w、峰强等。通常,拉曼谱图的横坐标表示拉曼频移或波数(单位为cm-1),纵坐标表示拉曼光谱的强度(无量纲或以a.u.表示)。在进行数学计算时,拉曼谱图可以看作是一组离散的数据点,如图2中的黑圆点所示,该数据点的横坐标可以称作波数,纵坐标可以称作强度值,即,拉曼谱图包括一系列数据,每一个数据可以包括波数和与该波数对应的强度值。这样,如图2所示,峰位可以为该峰的最高点P的位置,即P对应的波数;峰的起点和终点可以分别为峰的起点S和终点E对应的波数;峰宽w可以为峰的起点S和终点E限定的宽度,即峰的终点E的波数与峰的起点S的波数之差;峰区包括由峰的起点S和终点E限定的区间;峰强可以由峰的最高点P的强度值表示。
下面,结合附图3更详细描述根据本发明实施例的用于识别拉曼谱图的方法。
根据本发明实施例的一种用于识别拉曼谱图的方法可以包括以下步骤:
被测谱图获得步骤:对待测物质的拉曼光谱进行测量,以获得被测谱图,该被测谱图包括一系列数据;
峰信息提取步骤:提取出被测谱图的峰信息,该峰信息包括峰强、峰位和峰区;
第一识别步骤:比较被测谱图的峰信息和预存的标准谱图的峰信息,以识别被测谱图与标准谱图的峰信息是否匹配;和
第二识别步骤:在第一识别步骤中识别出被测谱图与标准谱图的峰信息匹配的情况下,比较被测谱图的数据和预存的标准谱图的数据,以进一步识别被测谱图与标准谱图是否匹配。
如图3所示,标准谱图库中预存有多个标准谱图,例如,标准谱图1、标准谱图2、……标准谱图n,相应地,各个标准谱图包括各自的峰信息1、峰信息2、……峰信息n。
根据本发明的一个实施例,如图3所示,所述第一识别步骤可以进一步包括“峰位匹配”步骤,该“峰位匹配”步骤可以包括如下步骤:
排序步骤:按照峰强从大到小的顺序,对被测谱图的峰和标准谱图的峰分别进行排序,以选择出被测谱图和标准谱图的排序在前N名的峰;
比较步骤:比较被测谱图和标准谱图的排序在前N名的峰的峰位信息;和
第一匹配步骤:根据比较步骤得到的比较结果,确定被测谱图与标准谱图的峰信息是否匹配。
根据一些实施例,所述比较步骤中的比较被测谱图和标准谱图的排序在前N名的峰的峰位信息步骤具体可以包括:
按照下述公式(1)依次计算被测谱图和标准谱图的排序在前N名的各个峰的峰位的绝对差(即,峰位之差的绝对值),
公式(1)为:pD=|p2[j].fPos-p1[i].fPos|,
其中,N为预定的比较峰数,N为大于等于3的自然数;
i,j分别表示标准谱图和被测谱图中的排序后的峰的序号,i和j均为大于等于0且小于等于N的整数,即,峰的序号从0开始,标示为0的峰表示该谱图的最高峰,表示为1的峰表示该谱图的次高峰,以此类推;
p1[i].fPos表示标准谱图中排序后的第i个峰的峰位;
p2[j].fPos表示被测谱图中排序后的第j个峰的峰位;
pD表示峰位的绝对差。
根据一些实施例,所述第一匹配步骤中根据比较步骤得到的比较结果确定被测谱图与标准谱图的峰信息是否匹配的步骤具体可以包括:
当计算出的峰位的绝对差满足下述条件(1)时,确定被测谱图与标准谱图的峰信息匹配;当计算出的峰位的绝对差不满足下述条件(1)时,确定被测谱图与标准谱图的峰信息不匹配,
条件(1)为:pD<p2[j].fWidth/3且pD<p1[i].fWidth/3,
其中,p1[i].fWidth表示标准谱图中排序后的第i个峰的峰宽;p2[j].fWidth表示被测谱图中排序后的第j个峰的峰宽。
在一个实施例中,N为大于等于3且小于等于5的自然数。当N的取值较小,例如,小于3时,被比较的峰的数量过少,不利于筛选出与被测谱图的峰信息匹配的标准谱图,即,不利于识别的有效性;当N的取值过大时,会增加比较峰信息的计算量,从而可能会影响峰信息比较的计算速度。在N取值大于等于3且小于等于5的自然数的情况下,可以兼顾利用峰信息识别的有效性和计算速度。
进一步地,如图3所示,所述第一识别步骤还可以包括“筛选器”步骤,该“筛选器”步骤具体可以包括:
峰匹配权重计算步骤:根据下述公式(2)建立惩罚性函数,以计算峰匹配权重;和
第二匹配步骤:当峰匹配权重大于等于预设的权重阈值时,确定被测谱图与标准谱图匹配;当峰匹配权重小于所述权重阈值时,确定被测谱图与标准谱图不匹配,
其中,公式(2)为:
h=(1-2*|j-i|/10)*(0.5/(i+1))*exp(-pD*2/min(p1[i].fWidth,p2[j].fWidth)),
其中,h表示峰匹配权重;
“min(p1[i].fWidth,p2[j].fWidth)”表示取p1[i].fWidth和
p2[j].fWidth中的较小值;
“exp”表示以自然对数e为底的幂函数。
在本发明的实施例中,在所述第一匹配步骤中确定被测谱图与标准谱图的峰信息匹配的情况下,执行所述峰匹配权重计算步骤和所述第二匹配步骤。也就是说,在本发明的实施例中,只有在第一匹配步骤中判断峰的绝对差满足要求时,才进行惩罚性函数的计算和峰匹配权重的比较。同样地,由于计算峰的绝对差的计算量比计算惩罚性函数的计算量小,所以,在计算惩罚性函数之前,通过计算峰的绝对差进行初步筛选,可以大大减少计算量,从而提高识别速度,并且提高识别准确率。
根据本发明的实施例,所述第二识别步骤中比较被测谱图的数据和预存的标准谱图的数据的步骤可以包括:对被测谱图的数据和预存的标准谱图的数据进行相关性比较,即,如图3所示的“相关性计算”步骤。
在一个实施例中,所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤包括:
计算被测谱图的数据和预存的标准谱图的数据的相关系数,当计算出的相关系数大于等于预设的相关性阈值时,确定被测谱图与标准谱图匹配;当计算出的相关系数小于所述相关性阈值时,确定被测谱图与标准谱图不匹配。
具体地,相关系数是研究变量间线性相关程度的量,是一种衡量向量间相互关系的方法。例如,设有特征向量X(x1,x2,…,xn),Y(y1,y2,…,yn),二者的相关系数r可以定义如下:
Figure BDA0001192643790000101
其中,
Figure BDA0001192643790000102
分别表示向量X、Y的均值,i表示向量的第i个数据。
根据本发明的实施例,在被测谱图和标准谱图的所有峰的峰区的并集区间内,执行所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤。也就是说,并不是在谱图的全区间内,而仅在被测谱图和标准谱图的所有峰的峰区的并集区间内,执行所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤。此处的“被测谱图和标准谱图的所有峰的峰区的并集区间”表示由被测谱图和标准谱图的所有峰的峰区组成的区间。这样,可以进一步减少需要进行相关性比较的数据量,从而进一步提高运算速度,并且保证计算的准确性。
在本发明的实施例中,通过利用谱图的峰信息首先进行“峰”这个局部特征的比较,对被测谱图和标准谱图进行初步筛选,在初步筛选通过之后,才进行谱图数据的全局比较,不仅能够大大的缩短匹配识别时间,而且能够提高匹配识别的准确率。而且,在图3所示的“峰位匹配”和“筛选器”步骤中,如果识别出被测谱图与标准谱图不匹配,可以立即终止匹配过程,而无需进行后续的识别匹配过程,可以大大提高确定二者不匹配时的计算速度。试验证明,匹配识别时间缩短为原来的约5%,并且匹配识别的准确率提高了约10%。
根据本发明的又一实施例,还提供一种电子设备,图4是示出了该电子设备的示例硬件布置400的框图。硬件布置400包括处理器406(例如,微处理器(μP)、数字信号处理器(DSP)等)。处理器406可以是用于执行本文描述的方法步骤的不同动作的单一处理单元或者是多个处理单元。布置400还可以包括用于从其他实体接收信号的输入单元402、以及用于向其他实体提供信号的输出单元404。输入单元402和输出单元404可以被布置为单一实体或者是分离的实体。
此外,布置400可以包括具有非易失性或易失性存储器形式的至少一个可读存储介质404,例如是电可擦除可编程只读存储器(EEPROM)、闪存、和/或硬盘驱动器。可读存储介质404包括计算机程序410,该计算机程序410包括代码/计算机可读指令,其在由布置400中的处理器406执行时使得硬件布置400和/或包括硬件布置400在内的设备可以执行例如上面结合上述实施例所描述的流程及其任何变形。
计算机程序410可被配置为具有例如计算机程序模块410A~410C架构的计算机程序代码。因此,在例如设备中使用硬件布置400时的示例实施例中,布置400的计算机程序中的代码包括:模块410A,用于…。计算机程序中的代码还包括:模块410B,用于…。计算机程序中的代码还包括:模块410C,用于…。
计算机程序模块实质上可以执行上述实施例中所描述的流程中的各个动作,以模拟设备。换言之,当在处理器406中执行不同计算机程序模块时,它们可以对应于设备中的上述不同单元。
尽管上面结合图4所公开的实施例中的代码手段被实现为计算机程序模块,其在处理器406中执行时使得硬件布置400执行上面结合上述实施例所描述的动作,然而在备选实施例中,该代码手段中的至少一项可以至少被部分地实现为硬件电路。
处理器可以是单个CPU(中央处理单元),但也可以包括两个或更多个处理单元。例如,处理器可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))。处理器还可以包括用于缓存用途的板载存储器。计算机程序可以由连接到处理器的计算机程序产品来承载。计算机程序产品可以包括其上存储有计算机程序的计算机可读介质。例如,计算机程序产品可以是闪存、随机存取存储器(RAM)、只读存储器(ROM)、EEPROM,且上述计算机程序模块在备选实施例中可以用UE内的存储器的形式被分布到不同计算机程序产品中。
虽然结合附图对本发明进行了说明,但是附图中公开的实施例旨在对本发明优选实施方式进行示例性说明,而不能理解为对本发明的一种限制。
虽然本发明总体构思的一些实施例已被显示和说明,本领域普通技术人员将理解,在不背离本总体发明构思的原则和精神的情况下,可对这些实施例做出改变,本发明的范围以权利要求和它们的等同物限定。

Claims (10)

1.一种用于识别拉曼谱图的方法,包括以下步骤:
被测谱图获得步骤:对待测物质的拉曼光谱进行测量,以获得被测谱图,该被测谱图包括一系列数据;
峰信息提取步骤:提取出被测谱图的峰信息,该峰信息包括峰强、峰位和峰区;
第一识别步骤:比较被测谱图的峰信息和预存的标准谱图的峰信息,以识别被测谱图与标准谱图的峰信息是否匹配;和
第二识别步骤:在第一识别步骤中识别出被测谱图与标准谱图的峰信息匹配的情况下,比较被测谱图的数据和预存的标准谱图的数据,以进一步识别被测谱图与标准谱图是否匹配,
其特征在于,所述第一识别步骤包括:
排序步骤:按照峰强从大到小的顺序,对被测谱图的峰和标准谱图的峰分别进行排序,以选择出被测谱图和标准谱图的排序在前N名的峰;
比较步骤:比较被测谱图和标准谱图的排序在前N名的峰的峰位信息;和
第一匹配步骤:根据比较步骤得到的比较结果,确定被测谱图与标准谱图的峰信息是否匹配,
所述第一识别步骤还包括:
峰匹配权重计算步骤:根据下述公式(2)建立惩罚性函数,以计算峰匹配权重;和
第二匹配步骤:当峰匹配权重大于等于预设的权重阈值时,确定被测谱图与标准谱图的峰信息匹配;当峰匹配权重小于所述权重阈值时,确定被测谱图与标准谱图的峰信息不匹配,
其中,公式(2)为:
h=(1-2*|j-i|/10)*(0.5/(i+1))*exp(-pD*2/min(p1[i].fWidth,p2[j].fWidth)),
其中:
h表示峰匹配权重;
i,j分别表示标准谱图和被测谱图中的排序后的峰的序号,i和j均为大于等于0且小于等于N的整数;
N为预定的比较峰数,N为大于等于3的自然数;
pD表示峰位的绝对差;
p1[i].fWidth表示标准谱图中排序后的第i个峰的峰宽;
p2[j].fWidth表示被测谱图中排序后的第j个峰的峰宽。
2.根据权利要求1所述的方法,其特征在于,所述比较步骤中比较被测谱图和标准谱图的排序在前N名的峰的峰位信息的步骤具体包括:
按照下述公式(1)依次计算被测谱图和标准谱图的排序在前N名的各个峰的峰位的绝对差,
其中:
公式(1)为:pD=|p2[j].fPos-p1[i].fPos|,
其中,N为预定的比较峰数,N为大于等于3的自然数;
i,j分别表示标准谱图和被测谱图中的排序后的峰的序号,i和j均为大于等于0且小于等于N的整数;
p1[i].fPos表示标准谱图中排序后的第i个峰的峰位;
p2[j].fPos表示被测谱图中排序后的第j个峰的峰位;
pD表示峰位的绝对差。
3.根据权利要求2所述的方法,其特征在于,所述第一匹配步骤中根据比较步骤得到的比较结果确定被测谱图与标准谱图的峰信息是否匹配的步骤具体包括:
当计算出的峰位的绝对差满足下述条件(1)时,确定被测谱图与标准谱图的峰信息匹配;当计算出的峰位的绝对差不满足下述条件(1)时,确定被测谱图与标准谱图的峰信息不匹配,
其中:
条件(1)为:pD<p2[j].fWidth/3且pD<p1[i].fWidth/3,
其中,p1[i].fWidth表示标准谱图中排序后的第i个峰的峰宽;p2[j].fWidth表示被测谱图中排序后的第j个峰的峰宽。
4.根据权利要求1所述的方法,其特征在于,在所述第一匹配步骤中确定被测谱图与标准谱图的峰信息匹配的情况下,执行所述峰匹配权重计算步骤和所述第二匹配步骤。
5.根据权利要求1-3和4中任一项所述的方法,其特征在于,N为大于等于3且小于等于5的自然数。
6.根据权利要求1-3和4中任一项所述的方法,其特征在于,所述第二识别步骤中比较被测谱图的数据和预存的标准谱图的数据的步骤包括:
对被测谱图的数据和预存的标准谱图的数据进行相关性比较。
7.根据权利要求6所述的方法,其特征在于,所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤包括:
计算被测谱图的数据和预存的标准谱图的数据的相关系数,当计算出的相关系数大于等于预设的相关性阈值时,确定被测谱图与标准谱图匹配;当计算出的相关系数小于所述相关性阈值时,确定被测谱图与标准谱图不匹配。
8.根据权利要求7所述的方法,其特征在于,在被测谱图和标准谱图的所有峰的峰区的并集区间内,执行所述对被测谱图的数据和预存的标准谱图的数据进行相关性比较的步骤。
9.根据权利要求1所述的方法,还包括如下步骤:
归一化步骤:归一化所述被测谱图和所述标准谱图;
其中,所述归一化步骤在所述峰信息提取步骤之前执行。
10.一种电子设备,包括:
存储器,用于存储可执行指令;以及
处理器,用于执行存储器中存储的可执行指令,以执行如权利要求1-9中任一项所述的方法。
CN201611222588.0A 2016-12-26 2016-12-26 用于识别拉曼谱图的方法 Active CN108241846B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201611222588.0A CN108241846B (zh) 2016-12-26 2016-12-26 用于识别拉曼谱图的方法
US16/473,505 US10948417B2 (en) 2016-12-26 2017-11-24 Method for identifying Raman spectrogram and electronic apparatus
EP17888822.8A EP3561718A4 (en) 2016-12-26 2017-11-24 METHOD OF IDENTIFYING A RAMAN SPECTROGRAM AND ELECTRONIC DEVICE
PCT/CN2017/112915 WO2018121151A1 (zh) 2016-12-26 2017-11-24 用于识别拉曼谱图的方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611222588.0A CN108241846B (zh) 2016-12-26 2016-12-26 用于识别拉曼谱图的方法

Publications (2)

Publication Number Publication Date
CN108241846A CN108241846A (zh) 2018-07-03
CN108241846B true CN108241846B (zh) 2021-03-05

Family

ID=62702451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611222588.0A Active CN108241846B (zh) 2016-12-26 2016-12-26 用于识别拉曼谱图的方法

Country Status (4)

Country Link
US (1) US10948417B2 (zh)
EP (1) EP3561718A4 (zh)
CN (1) CN108241846B (zh)
WO (1) WO2018121151A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532308B (zh) * 2019-07-11 2024-01-02 北京嘉元文博科技有限公司 文物物质鉴别方法和装置及计算机可读存储介质
TWI783215B (zh) * 2020-03-05 2022-11-11 緯創資通股份有限公司 信號處理系統及其信號降噪的判定方法與信號補償方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103512877A (zh) * 2013-10-16 2014-01-15 长春新产业光电技术有限公司 一种拉曼光谱物质检测快速样本查找方法
CN103955518A (zh) * 2014-05-06 2014-07-30 北京华泰诺安科技有限公司 一种检测物谱图与数据库谱图的匹配方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101285773B (zh) * 2008-05-23 2010-04-14 浙江大学 混纺织物组分的拉曼光谱定性检测方法
CN101303305B (zh) * 2008-07-04 2010-11-03 中国检验检疫科学研究院 便携式拉曼光谱橄榄油鉴别数据处理***
US7983852B2 (en) * 2008-10-21 2011-07-19 Thermo Finnigan Llc Methods of automated spectral peak detection and quantification without user input
US8000541B2 (en) * 2008-10-28 2011-08-16 Gregory James Gosian Quantization differencing compression algorithm
WO2014111997A1 (ja) * 2013-01-21 2014-07-24 日本電気株式会社 ピーク抑圧装置及びピーク抑圧方法
CN104215623B (zh) * 2013-05-31 2018-09-25 欧普图斯(苏州)光学纳米科技有限公司 面向多行业检测的激光拉曼光谱智能化辨识方法及***
KR20160041622A (ko) * 2014-10-08 2016-04-18 삼성전자주식회사 라만 분광 신호 다중 분석 방법
CN106198482B (zh) * 2015-05-04 2019-07-05 清华大学 基于拉曼光谱的检测保健品中是否添加有西药的方法
CN105300954B (zh) * 2015-09-02 2018-04-13 中南大学 一种锑矿浮选非均质泡沫层矿物的拉曼光谱表征方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103512877A (zh) * 2013-10-16 2014-01-15 长春新产业光电技术有限公司 一种拉曼光谱物质检测快速样本查找方法
CN103955518A (zh) * 2014-05-06 2014-07-30 北京华泰诺安科技有限公司 一种检测物谱图与数据库谱图的匹配方法

Also Published As

Publication number Publication date
US20190331604A1 (en) 2019-10-31
WO2018121151A1 (zh) 2018-07-05
CN108241846A (zh) 2018-07-03
EP3561718A4 (en) 2020-08-26
US10948417B2 (en) 2021-03-16
EP3561718A1 (en) 2019-10-30

Similar Documents

Publication Publication Date Title
CN108241845B (zh) 用于扣除谱图本底的方法和通过拉曼谱图识别物质的方法
CN108254351B (zh) 用于物品查验的拉曼光谱检测方法
MX2007000064A (es) Eliminacion automatica del fondo para los datos de entrada.
EP2525213A1 (en) Spectroscopic apparatus and methods for determining components present in a sample
CN108169201B (zh) 用于扣除包装干扰的拉曼光谱检测方法
CN108240978B (zh) 基于拉曼光谱的自学习式定性分析方法
WO2015096779A1 (zh) 拉曼光谱检测方法
CN108195817B (zh) 用于去除溶剂干扰的拉曼光谱检测方法
CN104034690A (zh) 一种宽带太赫兹时域光谱的分析方法及便携式分析装置
CN108398416A (zh) 一种基于激光拉曼光谱的混合物成分测定方法
US10718713B2 (en) Unknown sample determining method, unknown sample determining instrument, and unknown sample determining program
CN115389439B (zh) 基于大数据的河流污染物监测方法及***
CN108241846B (zh) 用于识别拉曼谱图的方法
CN112129741A (zh) 绝缘油老化分析方法、装置、计算机设备和存储介质
CN108780047B (zh) 物质成分的检测方法及相关装置和计算机可读存储介质
US8078420B2 (en) Raman spectrometry authentication
CN114611582A (zh) 一种基于近红外光谱技术分析物质浓度的方法及***
CN106936561B (zh) 一种侧信道攻击防护能力评估方法和***
CN107340284B (zh) 一种元素定量分析方法及装置
CN110632024B (zh) 一种基于红外光谱的定量分析方法、装置、设备以及存储介质
CN113836784A (zh) 一种基于信息融合技术的苹果鉴别***及方法
Wirsz et al. Automatic matrix dependent wavelength selection in inductively coupled plasma atomic emission spectrometry with multi-line detection
NZ766350A (en) Sequencing data-based itd mutation ratio detecting apparatus and method
CN117093841B (zh) 小麦透射光谱的异常光谱筛选模型确定方法、装置及介质
Monakhova et al. Methodology of chemometric modeling of spectrometric signals in the analysis of complex samples

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant