CN113917057B - 用于确定已知标准样品的重要特征峰的方法和装置 - Google Patents

用于确定已知标准样品的重要特征峰的方法和装置 Download PDF

Info

Publication number
CN113917057B
CN113917057B CN202010648819.4A CN202010648819A CN113917057B CN 113917057 B CN113917057 B CN 113917057B CN 202010648819 A CN202010648819 A CN 202010648819A CN 113917057 B CN113917057 B CN 113917057B
Authority
CN
China
Prior art keywords
peak
sample
candidate
characteristic
retention time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010648819.4A
Other languages
English (en)
Other versions
CN113917057A (zh
Inventor
张吉雄
张清军
李元景
李荐民
魏来
杨内
马秋峰
赵玉平
赵艳琴
王岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Nuctech Co Ltd
Original Assignee
Tsinghua University
Nuctech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Nuctech Co Ltd filed Critical Tsinghua University
Priority to CN202010648819.4A priority Critical patent/CN113917057B/zh
Publication of CN113917057A publication Critical patent/CN113917057A/zh
Application granted granted Critical
Publication of CN113917057B publication Critical patent/CN113917057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8651Recording, data aquisition, archiving and storage
    • G01N30/8655Details of data formats
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本公开的实施例公开了用于确定已知样品的重要特征峰的方法,包括:对已知样品进行采样和检测,获取气相色谱‑离子迁移谱数据;根据该数据中的特征峰的变化情况确定当前样品的第一批样品气体和最后一批样品气体的保留时间的采样序号分别作为起始进样编号和结束进样编号;从起始进样编号到结束进样编号在气相色谱‑离子迁移谱数据中寻峰以确定样品气体的产物离子的候选特征峰,并形成特征峰索引表;确定候选特征峰的峰值强度;根据特征峰索引表来确定候选特征峰的峰位置重要性值;根据特征峰索引表来确定候选特征峰的稳定性值;以及根据候选特征峰的峰值强度、候选特征峰的峰位置重要性值和候选特征峰的稳定性值来确定候选特征峰的重要性值。

Description

用于确定已知标准样品的重要特征峰的方法和装置
技术领域
本公开涉及识别领域,具体地,涉及一种用于确定已知标准样品的重要特征峰的方法和装置。
背景技术
气相色谱-离子迁移谱仪具有体积小、功耗低、便携性强、检测速度快、灵敏度高及可产业化等诸多优点而被广泛应用于军事、国防、工业、环境和临床诊断等领域。通常,气相色谱-离子迁移谱的数据处理流程包括:预处理、寻峰、峰位选择(特征选择)、峰位匹配识别等,其中峰位选择是非常重要的一步,其可以剔除无用信息,保留有用信息,进而提高识别的准确度。目前,气相色谱-离子迁移谱数据的特征峰位选择大多采用峰值强度度作为选择指标,或根据专业知识和经验人工选择特征峰。如果只根据特征峰的强度进行特征选择,则会造成一些峰值强度较弱但稳定存在的物质的峰信息漏选,丢失重要特征进而影响分类的准确度;而利用人工进行特征峰的提取需要专业的知识和经验,耗时、耗力且效率较低。
因此,需要一种提高物质识别的准确率同时还可以解决人工建库成本大、效率低等问题的用于待测物的气相色谱-离子迁移谱的自动特征峰选择方法和装置。
发明内容
根据本公开的第一方面,提供了一种用于确定已知样品的重要特征峰的方法,包括:
使用气相色谱-离子迁移谱联用装置对所述已知样品进行采样和检测,获取气相色谱-离子迁移谱数据;
根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号和当前样品的最后一批样品气体的保留时间的采样序号,将当前样品的第一批样品气体的保留时间的采样序号作为起始进样编号,将当前样品的最后一批样品气体的保留时间的采样序号作为结束进样编号;
从所述起始进样编号到所述结束进样编号在所述气相色谱-离子迁移谱数据中寻峰以确定样品气体的产物离子的候选特征峰,并形成特征峰索引表,其中所述特征峰索引表包括与所述产物离子中的每一批产物离子的保留时间的采样序号和所述每一批产物离子的迁移时间的采样序号相对应的索引值,所述索引值表示在不同的保留时间的采样序号和不同的迁移时间的采样序号下是否存在相应的产物离子的特征峰;
确定所述候选特征峰的峰值强度;
根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值;
根据所述特征峰索引表来确定所述候选特征峰的稳定性值;以及
根据所述候选特征峰的峰值强度、所述候选特征峰的峰位置重要性值和所述候选特征峰的稳定性值来确定所述候选特征峰的重要性值。
在实施例中,所述峰值强度是最大最小值归一化后的峰值强度。
在实施例中,所述方法还包括:
对所述候选特征峰的重要性值进行排序,并且选择重要性值靠前的预定数量的候选特征峰以形成违禁品重要特征峰库,其中,所述违禁品重要特征峰库包括多种已知样品名称和分别与所述多种已知样品相对应的重要性值靠前的预定数量的特征峰的位置坐标,所述特征峰的位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
在实施例中,根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值包括:
当对多种已知样品分别进行测量时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在所述中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
在实施例中,所述函数被表示为:
Figure BDA0002572518680000031
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在实施例中,根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值包括:
当将多种已知样品混合在一起进行一次测量时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号的候选特征峰赋予第一峰位置重要性值,针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间除了所述起始进样编号以外的采样序号的候选特征峰赋予大于第一峰位置重要性值的第二峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的采样序号的特征峰赋予等于0的第三峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
在实施例中,所述函数被表示为以下函数(2)-(4)中的任一种:
Figure BDA0002572518680000041
Figure BDA0002572518680000042
Figure BDA0002572518680000043
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在实施例中,根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值包括:
当多种已知样品之间不存在离子迁移时间相同的特征峰时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在所述中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
在实施例中,所述函数被表示为:
Figure BDA0002572518680000051
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在实施例中,根据所述特征峰索引表来确定所述候选特征峰的稳定性值包括:
根据下式来确定所述候选特征峰的稳定性值:
Figure BDA0002572518680000052
其中,peak.stabilityy表示迁移时间的采样序号等于y的候选特征峰的稳定性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号,y表示迁移时间的采样序号,并且iy,x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值,取值为0或1,取值为1时表示在保留时间的采样序号x和迁移时间的采样序号y的位置存在相应的产物离子的特征峰。
在实施例中,根据所述候选特征峰的峰值强度、所述候选特征峰的峰位置重要性值和所述候选特征峰的稳定性值来确定所述候选特征峰的重要性值包括:
对所述候选特征峰的峰位置重要性值进行最大最小值归一化以得到归一化的峰位置重要性值;以及
根据下式来确定所述候选特征峰的重要性值:
peak.weighty,x=a×peak.intensityy,x+(1-a)×iy,x×peak.position_importantx-norm×peak.stability
其中peak.weighty,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的重要性值,peak.intensityy,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的峰值强度,peak.position_importantx-norm表示该候选特征峰的归一化的峰位置重要性值,peak.stabilityy表示该候选特征峰的稳定性值,x表示保留时间的采样序号,y表示迁移时间的采样序号,a是预设的超参数,并且是范围[0,1]内的值,iy,x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值。
在实施例中,通过数据及交互验证方法确定a的最优值。
在实施例中,所述离子迁移谱仪中的法拉第盘的采样时间小于或等于所述离子迁移谱仪中的离子门的关闭时间。
在实施例中,所述气相色谱-离子迁移谱数据是通过在特定长度的时间段内对所述离子迁移谱仪测量的数据执行叠加平均得到的,所述特定长度是离子门关闭打开周期的整数倍,并且是相邻的保留时间的采样序号之间的时间长度。
在实施例中,根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号包括:
根据反应离子峰的峰强的下降比例来确定当前样品的第一批样品气体的保留时间的采样序号;或者
根据产物离子峰的出现情况来确定当前样品的第一批样品气体的保留时间的采样序号。
在实施例中,在使用不同的气相色谱-离子迁移谱联用装置或者***状态已经发生一定程度的改变的同一气相色谱-离子迁移谱联用装置时,重新对所述已知样品进行采样和检测,然后重新确定所述候选特征峰的重要性值,以形成与当前气相色谱-离子迁移谱联用装置的状态匹配的新的违禁品重要特征峰库。
在实施例中,a的最优值采用0.5,并且当反应离子峰的峰强的下降了20%之后,确定当前样品的第一批样品气体的产物离子峰已经出现。
根据本公开的第二方面,提供了一种用于检测未知的待测物的方法,包括:
使用气相色谱-离子迁移谱联用装置对所述未知的待测物进行采样和检测,获取所述未知的待测物的气相色谱-离子迁移谱数据;
根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定所述待测物的产物离子的特征峰以及相应的位置坐标,所述位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号;
将所述待测物的产物离子的位置坐标与利用根据第一方面所述的方法确定的违禁品重要特征峰库中的特征峰的位置坐标进行比较,以确定保留时间和迁移时间的相似度,并且选择相似度靠前的预定数量的已知样品的重要特征峰作为与所述未知的待测物对应的候选违禁品的特征峰。
在实施例中,所述方法还包括:
按照所述违禁品重要特征峰库中的相似的特征峰的重要性值从大到小的顺序依次向用户呈现对应的违禁品名称和相应的位置坐标。
根据本公开的第三方面,提供了一种用于确定已知样品的重要特征峰的装置,包括:
数据获取模块,被配置为:获取气相色谱-离子迁移谱联用装置检测所述已知样品得到的气相色谱-离子迁移谱数据;
进样编号确定模块,被配置为:根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号和当前样品的最后一批样品气体的保留时间的采样序号,将当前样品的第一批样品气体的保留时间的采样序号作为起始进样编号,将当前样品的最后一批样品气体的保留时间的采样序号作为结束进样编号;
特征峰索引表形成模块,被配置为:从所述起始进样编号到所述结束进样编号在所述气相色谱-离子迁移谱数据中寻峰以确定样品气体的产物离子的候选特征峰,并形成特征峰索引表,其中所述特征峰索引表包括与所述产物离子中的每一批产物离子的保留时间的采样序号和所述每一批产物离子的迁移时间的采样序号相对应的索引值,所述索引值表示在不同的保留时间的采样序号和不同的迁移时间的采样序号下是否存在相应的产物离子的特征峰;
峰值强度确定模块,被配置为:确定所述候选特征峰的峰值强度;
峰位置重要性值确定模块,被配置为:根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值;
稳定性值确定模块,被配置为:根据所述特征峰索引表来确定所述候选特征峰的稳定性值;以及
候选特征峰重要性值确定模块,被配置为:根据所述候选特征峰的峰值强度、所述候选特征峰的峰位置重要性值和所述候选特征峰的稳定性值来确定所述候选特征峰的重要性值。
在实施例中,所述峰值强度是最大最小值归一化后的峰值强度。
在实施例中,所述装置还包括:
违禁品重要特征峰库生成模块,被配置为:对所述候选特征峰的重要性值进行排序,并且选择重要性值靠前的预定数量的候选特征峰以形成违禁品重要特征峰库,其中,所述违禁品重要特征峰库包括多种已知样品名称和分别与所述多种已知样品相对应的重要性值靠前的预定数量的特征峰的位置坐标,所述特征峰的位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
在实施例中,所述峰位置重要性值确定模块被进一步配置为:
当对多种已知样品分别进行测量时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在所述中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
在实施例中,所述函数被表示为:
Figure BDA0002572518680000091
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在实施例中,所述峰位置重要性值确定模块被进一步配置为:
当将多种已知样品混合在一起进行一次测量时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号的候选特征峰赋予第一峰位置重要性值,针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间除了所述起始进样编号以外的采样序号的候选特征峰赋予大于第一峰位置重要性值的第二峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的采样序号的特征峰赋予等于0的第三峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
在实施例中,所述函数被表示为以下函数(2)-(4)中的任一种:
Figure BDA0002572518680000092
Figure BDA0002572518680000093
Figure BDA0002572518680000094
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在实施例中,所述峰位置重要性值确定模块被进一步配置为:
当多种已知样品之间不存在离子迁移时间相同的特征峰时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在所述中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
在实施例中,所述函数被表示为:
Figure BDA0002572518680000101
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在实施例中,所述稳定性值确定模块被进一步配置为:
根据下式来确定所述候选特征峰的稳定性值:
Figure BDA0002572518680000102
其中,peak.stabilityy表示迁移时间的采样序号等于y的候选特征峰的稳定性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号,y表示迁移时间的采样序号,并且iy,x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值,取值为0或1,取值为1时表示在保留时间的采样序号x和迁移时间的采样序号y的位置存在相应的产物离子的特征峰。
在实施例中,所述候选特征峰重要性值确定模块被进一步配置为:
对所述候选特征峰的峰位置重要性值进行最大最小值归一化以得到归一化的峰位置重要性值;以及
根据下式来确定所述候选特征峰的重要性值:
peak.weighty,x=a×peak.intensity,x+(1-a)×iy,x×peak.position_importantx-norm×peak.stabilityy
其中peak.weighty,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的重要性值,peak.intensityy,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的峰值强度,peak.position_importantx-norm表示该候选特征峰的归一化的峰位置重要性值,peak.stabilityy表示该候选特征峰的稳定性值,x表示保留时间的采样序号,y表示迁移时间的采样序号,a是预设的超参数,并且是范围[0,1]内的值,iy,x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值。
在实施例中,通过数据及交互验证方法确定a的最优值。
在实施例中,所述离子迁移谱仪中的法拉第盘的采样时间小于或等于所述离子迁移谱仪中的离子门的关闭时间。
在实施例中,所述气相色谱-离子迁移谱数据是通过在特定长度的时间段内对所述离子迁移谱仪测量的数据执行叠加平均得到的,所述特定长度是离子门关闭打开周期的整数倍,并且是相邻的保留时间的采样序号之间的时间长度。
在实施例中,所述进样编号确定模块被进一步配置为:
根据当前样品的第一批样品气体的产物离子峰的出现时间来确定当前样品的第一批样品气体的保留时间的采样序号。
在实施例中,所述违禁品重要特征峰库生成模块被进一步配置为:在使用不同的气相色谱-离子迁移谱联用装置或者***状态已经发生一定程度的改变的同一气相色谱-离子迁移谱联用装置时,重新对所述已知样品进行采样和检测,然后重新确定所述候选特征峰的重要性值,以形成与当前气相色谱-离子迁移谱联用装置的状态匹配的新的违禁品重要特征峰库。
在实施例中,当前样品的第一批样品气体的产物离子峰的出现时间是根据反应离子峰的峰强的下降比例来确定的。
在实施例中,a的最优值采用0.5,并且所述下降比例是20%。
根据本公开的第四方面,提供了一种用于检测未知的待测物的装置,包括:
数据获取模块,被配置为:获取气相色谱-离子迁移谱联用装置检测所述未知的待测物得到的气相色谱-离子迁移谱数据;
确定模块,被配置为根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定待测物的产物离子的特征峰以及相应的位置坐标,所述位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号;以及
比较模块,被配置为:将所述待测物的产物离子的特征峰的位置坐标与利用根据第一方面所述的方法确定的违禁品重要特征峰库中的特征峰的位置坐标进行比较,以确定保留时间和迁移时间的相似度,并且选择相似度靠前的预定数量的已知样品的重要特征峰作为与所述未知的待测物对应的候选违禁品的特征峰。
在实施例中,所述装置还包括:
识别结果呈现模块,被配置为:按照所述违禁品重要特征峰库中的相似的特征峰的重要性值从大到小的顺序依次向用户呈现对应的违禁品名称和相应的位置坐标。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1A和图1B示出了根据本公开的实施例的气相色谱-离子迁移谱的联用装置的采样周期,图1C示出了根据本公开的实施例的离子迁移谱的示意图;
图2示出了根据本公开的实施例的气相色谱-离子迁移谱联用装置的示意性三维谱图;
图3示出了根据现有技术的气相色谱-离子迁移谱的数据处理流程图;
图4示出了根据本公开的实施例的用于确定已知标准样品的重要特征峰的方法的流程图;
图5示出了根据本公开的实施例的特征峰索引表的示意图;
图6示出了根据本公开的实施例的用于检测未知的待测物的方法的流程图;
图7示出了根据本公开的实施例的用于确定已知标准样品的重要特征峰的装置的示意图;
图8示出了根据本公开的实施例的用于确定未知的待测物的装置的示意图;以及
图9示出了根据本公开的实施例的用于确定已知标准样品的重要特征峰的***的示意图。
附图没有对实施例的所有电路或结构进行显示。贯穿所有附图相同的附图标记表示相同或相似的部件或特征。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在气相色谱-离子迁移谱联用装置中,联用装置在收到用户发出的采样指令(包括用户点击用户界面上的采样按钮或者用户打开采样头上的采样开关)后,采样头对被检物体或擦拭试纸开始采样,样品气体通过气路进入色谱柱,由于色谱柱对不同的样品气体的吸附力不同,不同样品气体穿过色谱柱所耗费的时间不一样;另外,即便是同一种样品,由于其也是顺序被采样进入联用装置,因此同一种样品也是分成多批流出色谱柱。离子迁移管的电离区设置有离子门,在样品分子还未进入离子迁移管时,载气、吹扫气或漂移气进入离子迁移管的电离区(离化区),与β源发射的电子碰撞后,发生级联反应会生成反应离子。反应离子在离子门打开时会进入迁移区,然后在电场作用下向法拉第盘运动,从而形成反应离子峰(RIP)。一段时间以后,最先离开色谱柱的第一批样品气体进入离子迁移管的电离区(离化区),样品分子通过与反应离子的反应生成第一批产物离子。离子门打开然后迅速关闭(通常打开大概100us后关闭),第一批产物离子和剩余的反应离子可以在这段很短的时间内释放到迁移区,进行迁移时间的测量,同时离子门保持关闭一段时间(例如几十毫秒左右),测得的离子迁移谱中会出现反应离子峰(RIP)和产物离子峰,由于反应离子有一部分与样品分子反应了,因此反应离子峰(RIP)的峰强会降低,本申请依据反应离子峰(RIP)下降了预定比例(例如20%)的时间确定第一批样品进入电离区的时间点。之后从色谱柱离开的第二批样品气体在电离区产生的第二批产物离子暂时被阻挡在离子门的上游侧。在这个周期的离子迁移谱测量完成并记录了对应的保留时间(将在下面介绍)后,离子门再次打开并迅速关闭,之前被阻挡在离子门的上游侧的第二批产物离子和反应离子被释放到迁移区,然后进行离子迁移谱的测量和对应保留时间的记录。
在一个实施例中,离子迁移时间的时间零点是每次离子门关闭的时间点。由于离子门都是先打开,然后将上游的产物离子释放到迁移区,在很短的时间后立即关闭,而产物离子在迁移区进行迁移的时间通常为几毫秒到十几毫秒的量级,因此离子门一次打开维持的时间段与离子迁移时间相比可以忽略不计,因此如果以每次离子门打开的时间点或者打开与关闭之间的任一时间作为离子迁移时间的起算时间零点也并没有关系。如果将离子门关闭的时间点作为离子迁移的时间零点,则离子迁移管的一个最小测量周期的开始到中间的绝大部分时间段为离子门关闭的时间段,仅在最后的很小的时间段为离子门打开的时间段。在离子门关闭的时间段内,法拉第盘测量电信号并进行多次采样。如图1A所示,在后续处理电路和***计算力性能优异的情况下,法拉第盘的采样时间可以与离子门关闭的时间段相等。否则,如图1B所示,可以在离子门关闭的时间段内留一段时间不采样,以为后续处理留出时间。
本申请中的保留时间是指从预设的保留时间零点开始计时到各个离子迁移时间零点(各批产物离子刚刚释放到迁移区或即将释放到迁移区的时刻)所经历的时间,即从保留时间零点开始样品分子及其对应的产物离子保留在离子门上游侧的时间。在一个实施例中,可将保留时间零点设置为整个联用装置开始采样的时间点,此时样品气体刚进入联用装置。当然,在其他实施例中,也可以将保留时间的零点设置为采样的第一批样品气体在电离区产生的产物离子进入迁移区之前的任一时间点。
在本申请的实施例中,首先利用气相色谱-离子迁移谱联用装置对所关注的多种违禁品的已知标准样品进行测量,测量特征峰(峰强超过一定阈值或比例的才当成特征峰)并记录特征峰对应的保留时间和离子迁移时间(下文简称为“迁移时间”)的二维坐标,然后利用本申请各个实施例中的算法确定各个特征峰的重要性(也可称为权重),依据重要性对特征峰进行排序,选择前N个重要特征峰,记录对应的二维坐标(保留时间和离子迁移时间)与样品的物质名称。将标准样品的选择出的重要特征峰对应的二维坐标和对应物质名称整合之后,形成当前联用装置的违禁品重要特征峰库。在以后真正使用所述联用装置检测未知的待测物品时,获取被测物的特征峰,***将对应于被测物的特征峰的二维峰位坐标(保留时间和迁移时间)与该联用装置的违禁品重要特征峰库里的特征峰二维坐标比较,寻找相似的候选特征峰,并根据候选特征峰的重要性(权重)进行排序,按顺序向用户呈现可能的物质名称等信息。这里所谓的重要特征峰是样品的真实可靠的产物离子峰,排除了***噪声或环境噪声的干扰。
图1C示出了根据本公开的实施例的离子迁移谱的示意图,其中横坐标代表迁移时间,并且纵坐标代表信号强度。图1C中的横轴的数值实际上是离子迁移管的迁移时间的采样序号,由于法拉第盘按恒定时间间隔高频率地采样,因此这些采样序号的数值可以表征时间。
图2示出了根据本公开的实施例的气相色谱-离子迁移谱联用装置的示意性三维谱图,其中X轴代表保留时间,Y轴代表迁移时间,并且Z轴代表信号强度。图2示出了离子迁移谱随保留时间的变化情况。不同的样品的反应离子峰具有自己特有的保留时间和离子迁移时间。
其中,X轴的数值代表在保留时间维度内的采样序号。在一个实施例中,本申请的发明人研究发现,由于法拉第盘一个周期内的离子迁移谱可能有噪声,而相邻几个周期的总时间较短(例如:图1A和图1B中的500ms),可以认为相邻几个周期内到达电离区的样品离子相同,通常会将几个周期(例如,离子门关闭打开周期的整数倍)的离子迁移谱图叠加求平均,以此达到滤波降噪的目的,而这几个周期的时间长度就等于图2中的保留时间坐标轴中的每两个相邻采样序号(例如刻度4与刻度5)之间的时间长度。
起初迁移区内只有载气(通常为纯净空气)的反应离子,因此在前7个保留时间的采样序号内显示的均是载气的产物离子的信号,此后待测物到达迁移管,经离化反应形成产物离子,进而显示样品的产物离子的信号。图1C实际上是空气载气的正模式离子迁移谱的一个示例。
图3示出了根据现有技术的气相色谱-离子迁移谱的数据处理流程图。根据现有技术的气相色谱-离子迁移谱的数据处理流程可以包括预处理、寻峰、峰位选择(特征选择)、峰位匹配识别、待测物识别以及参数调整,其中峰位选择是非常重要的一步,其可以剔除无用信息,保留有用信息,进而提高识别的准确度。目前,气相色谱-离子迁移谱数据的特征峰位选择大多采用峰值强度度作为选择指标,或根据专业知识和经验人工选择特征峰。如果只根据特征峰的强度进行特征选择,则会造成一些峰值强度较弱但稳定存在的物质的峰信息漏选,丢失重要特征进而影响分类的准确度;而利用人工进行特征峰的提取需要专业的知识和经验,耗时、耗力且效率较低。
鉴于此,本公开的实施例提出了用于确定已知标准样品的重要特征峰的方法,如图4所示,方法400可以包括以下步骤S410至S470。
在步骤S410中,可以使用气相色谱-离子迁移谱联用装置对已知标准样品进行采样和检测,获取气相色谱-离子迁移谱数据。
在步骤S420中,可以根据气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前标准样品的第一批标准样品气体的保留时间的采样序号和当前样品的最后一批标准样品气体的保留时间的采样序号,将当前标准样品的第一批标准样品气体的保留时间的采样序号作为起始进样编号,将当前标准样品的最后一批标准样品气体的保留时间的采样序号作为结束进样编号。具体地说,如图2和图5所示,在保留时间为2-7的期间,图2的离子迁移谱显示为载气或漂移气(例如空气)的反应离子峰,在保留时间为8时,开始出现与空气载气的反应离子峰不同的产物离子峰(例如,1206、1521、1691、2237),则将保留时间的采样序号8作为起始进样编号,而最后一批标准样品气体的结束进样编号则为15。以上数值仅仅是举例,并不限制本申请的保护范围。根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前标准样品的第一批标准样品气体的保留时间的采样序号可以包括:根据反应离子峰的峰强的下降比例来确定当前标准样品的第一批标准样品气体的保留时间的采样序号。例如,当反应离子峰的峰强的下降了20%之后,可以确定当前标准样品的第一批标准样品气体的产物离子峰已经出现,从而确定当前标准样品的第一批标准样品气体的保留时间的采样序号。备选地,根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前标准样品的第一批标准样品气体的保留时间的采样序号可以包括:根据产物离子峰的出现情况来确定当前标准样品的第一批标准样品气体的保留时间的采样序号。
在步骤S430中,可以从起始进样编号到结束进样编号在气相色谱-离子迁移谱数据中寻峰以确定标准样品气体的产物离子的候选特征峰,并形成特征峰索引表,其中特征峰索引表包括与产物离子中的每一批产物离子的保留时间的采样序号和该每一批产物离子的迁移时间的采样序号相对应的索引值,索引值表示在不同的保留时间的采样序号和不同的迁移时间的采样序号下是否存在相应的产物离子的特征峰。图5示出了根据本公开的实施例的特征峰索引表的示意图。如图5所示,保留时间的采样序号从起始进样编号8持续到结束进样编号15,迁移时间的采样序号的取值分别为1206、1313、1521、1691、2237和2935,并且索引值的取值可以为0和1,其中,0表示在特定的保留时间和迁移时间的采样序号的情况下不存在相应的候选特征峰,并且1表示在特定的保留时间和迁移时间的采样序号的情况下存在相应的候选特征峰。
在步骤S440中,可以确定候选特征峰的峰值强度。该峰值强度可以是最大最小值归一化后的峰值强度。
在步骤S450中,可以根据特征峰索引表来确定候选特征峰的峰位置重要性值。在一个实施例中,如果在建立违禁品重要特征峰库时对多种已知标准样品进行测量,每次只测量一种已知标准样品的特征峰峰强和对应的二维坐标(保留时间和迁移时间),则步骤S450可以包括:构建特征峰的峰位置重要性值相对于保留时间的采样序号的第一函数,其中,第一函数针对保留时间的采样序号等于起始进样编号与结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为起始进样编号至结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及根据第一函数来确定候选特征峰的峰位置重要性值。例如,该函数可以被表示为公式(1):
Figure BDA0002572518680000191
其中,peak,position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在本实施例的一个示例中,如图5所示,由于起始进样编号为8并且结束进样编号为15,因此所有候选特征峰的峰位置重要性值在起始进样编号8至结束进样编号15之内分别为为
Figure BDA0002572518680000192
Figure BDA0002572518680000193
与其余保留时间的采样序号相对应的候选特征峰的峰位置重要性值为0,从而得到相对应的候选特征峰的峰位置重要性值集合[0 0 0 0 0 00 1 7 21 35 35 21 7 1]。这种重要性分布主要是为了减弱保留时间漂移产生的不良影响(主要因为在不同日甚至不同次的测量中,同一样品分子流出色谱柱的流出时间也会有波动,此外还有其他因素的波动),另外也为了减弱离子迁移管的初始不稳定带来的不良影响。
在另一个实施例中,如果在建立违禁品重要特征峰库时将多种已知标准样品混合在一起一次测量,由于是混合测量多种已知标准样品,各种标准样品的保留时间不一致,需要全面考虑各个保留时间,因此步骤S450可以包括:构建特征峰的峰位置重要性值相对于保留时间的采样序号的第二函数,其中,第二函数针对保留时间的采样序号等于起始进样编号的候选特征峰赋予第一峰位置重要性值,针对保留时间的采样序号等于起始进样编号与结束进样编号之间除了起始进样编号以外的采样序号的候选特征峰赋予大于第一峰位置重要性值的第二峰位置重要性值,并且针对保留时间的采样序号为起始进样编号至结束进样编号的范围以外的采样序号的特征峰赋予等于0的第三峰位置重要性值;以及根据第二函数来确定候选特征峰的峰位置重要性值。例如,该函数可以被表示为公式(2)-(4)中的任一种:
Figure BDA0002572518680000201
Figure BDA0002572518680000202
Figure BDA0002572518680000203
其中,peak,position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
在又一个实施例中,如果多种已知标准样品之间不存在离子迁移时间相同的特征峰,则无论在建立违禁品重要特征峰库时将多个已知标准样品混合在一起一次测量还是不混合分多次测量,步骤S450都可以根据上述第一函数(例如,公式(1))来确定候选特征峰的峰位置重要性值。
在步骤S460中,可以根据特征峰索引表来确定候选特征峰的稳定性值。在一个示例中,步骤S460可以包括:根据下式来确定候选特征峰的稳定性值:
Figure BDA0002572518680000204
其中,peak.stabilityy表示迁移时间的采样序号等于y的候选特征峰的稳定性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号,y表示迁移时间的采样序号,并且iy,x表示所述特征峰索引表中在保留时间的采样序号x和迁移时间的采样序号y下相对应的索引值,取值为0或1,取值为1时表示在保留时间的采样序号x和迁移时间的采样序号y的位置存在相应的产物离子的特征峰。
在一个示例中,如图5所示,从保留时间的采样序号1至保留时间的采样序号15,针对迁移时间的采样序号1206的特征峰一共出现了8次,因此该特征峰的稳定性为peak.stability1206=8/(15-8+1)=1。
在步骤S470中,可以根据候选特征峰的峰值强度、候选特征峰的峰位置重要性值和候选特征峰的稳定性值来确定候选特征峰的重要性值。在一个示例中,步骤S470可以包括:对候选特征峰的峰位置重要性值进行最大最小值归一化以得到归一化的峰位置重要性值,并且根据下式来确定候选特征峰的重要性值(权重):
peak.weighty,x=a×peak.intensityy,x+(1-a)×iy,x×peak.position_importantx-norm×peak.stabilityy (6)
其中peak.weighty,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的重要性值,peak.intensityy,x表示迁移时间的采样序号为少且保留时间的采样序号为x的候选特征峰的峰值强度,peak.position_importantx-norm表示该候选特征峰的归一化的峰位置重要性值,peak.stabilityy表示该候选特征峰的稳定性值,x表示保留时间的采样序号,y表示迁移时间的采样序号,a是预设的超参数,并且是范围[0,1]内的值,iy,x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值。这里,a被预设以用于在候选特征峰的峰值强度、候选特征峰的峰位置重要性值以及候选特征峰的稳定性值之间寻找一个平衡,并且可以通过数据及交互验证方法而得到a的最优值,例如,a的最优值可以为0.5。
在一个示例中,继续参照图5,如上所述,根据图5所得的候选特征峰的峰位置重要性值集合[0 0 0 0 0 0 0 1 7 21 35 35 21 7 1],将该峰位置重要性值集合进行最大最小值归一化可以得到归一化的峰位置重要性值集合[0 0 0 0 0 0 0 0.0286 0.2 0.6 1 10.6 0.2 0.0286]。
在步骤S470之后,方法400还可以包括:对候选特征峰的重要性值进行排序,并且选择重要性值靠前的预定数量的候选特征峰以形成违禁品重要特征峰库,其中,该违禁品重要特征峰库包括多种已知标准样品名称和分别与多种已知标准样品相对应的重要性值靠前的预定数量的特征峰的位置坐标,特征峰的位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。在使用不同的气相色谱-离子迁移谱联用装置或者***状态已经发生一定程度的改变的同一气相色谱-离子迁移谱联用装置时,需要重新对所述已知标准样品进行采样和检测,然后重新确定候选特征峰的重要性值,以形成与当前气相色谱-离子迁移谱联用装置的状态匹配的新的违禁品重要特征峰库。
图6示出了根据本公开的实施例的用于对未知的待测物进行检测的方法600。方法600可以包括以下步骤。
在步骤S610中,可以使用气相色谱-离子迁移谱联用装置对未知的待测物进行采样和检测,获取未知的待测物的气相色谱-离子迁移谱数据。
在步骤620中,可以根据气相色谱-离子迁移谱数据中的特征峰的变化情况确定待测物的产物离子的特征峰以及相应的位置坐标,该位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
在步骤S630中,可以将待测物的产物离子的位置坐标与利用上述方法400确定的违禁品重要特征峰库中的特征峰的位置坐标进行比较,以确定保留时间和迁移时间的相似度,并且选择相似度靠前的预定数量的已知标准样品的重要特征峰作为与未知的待测物对应的候选违禁品的特征峰。
此外,方法600还可以包括:按照违禁品重要特征峰库中的相似的特征峰的重要性值从大到小的顺序依次向用户呈现对应的违禁品名称和相应的位置坐标。
图7示出了根据本公开的实施例的用于确定已知标准样品的重要特征峰的装置700的示意图。装置700可以包括数据获取模块710、进样编号确定模块720、特征峰索引表形成模块730、峰值强度确定模块740、峰位置重要性值确定模块750、稳定性值确定模块760和候选特征峰重要性值确定模块770。
数据获取模块710可以被配置为:获取气相色谱-离子迁移谱联用装置检测已知标准样品得到的气相色谱-离子迁移谱数据。
进样编号确定模块720可以被配置为:根据气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前标准样品的第一批标准样品气体的保留时间的采样序号和当前标准样品的最后一批标准样品气体的保留时间的采样序号,将当前标准样品的第一批标准样品气体的保留时间的采样序号作为起始进样编号,将当前标准样品的最后一批标准样品气体的保留时间的采样序号作为结束进样编号。
特征峰索引表形成模块730可以被配置为:从起始进样编号到结束进样编号在气相色谱-离子迁移谱数据中寻峰以确定标准样品气体的产物离子的候选特征峰,并形成特征峰索引表,其中该特征峰索引表包括与产物离子中的每一批产物离子的保留时间的采样序号和该每一批产物离子的迁移时间的采样序号相对应的索引值,索引值表示在不同的保留时间的采样序号和不同的迁移时间的采样序号下是否存在相应的产物离子的特征峰。
峰值强度确定模块740可以被配置为:确定候选特征峰的峰值强度。峰值强度可以是最大最小值归一化后的峰值强度。
峰位置重要性值确定模块750可以被配置为:根据特征峰索引表来确定候选特征峰的峰位置重要性值。在一个实施例中,根据特征峰索引表以及关注的多种已知标准样品的测量方法(例如,如上所述的将多个已知标准样品混合在一起一次测量还是不混合分多次测量)来确定候选特征峰的峰位置重要性值。在又一个实施例中,根据特征峰索引表、关注的多种已知标准样品的测量方法、以及关注的多种已知标准样品的离子迁移时间来确定候选特征峰的峰位置重要性值。
稳定性值确定模块760可以被配置为:根据特征峰索引表来确定候选特征峰的稳定性值。
候选特征峰重要性值确定模块770可以被配置为:根据候选特征峰的峰值强度、候选特征峰的峰位置重要性值和候选特征峰的稳定性值来确定候选特征峰的重要性值。
装置700还可以包括违禁品重要特征峰库生成模块780,被配置为:对候选特征峰的重要性值进行排序,并且选择重要性值靠前的预定数量的候选特征峰以形成违禁品重要特征峰库,其中,该违禁品重要特征峰库包括多种已知标准样品名称和分别与多种已知标准样品相对应的重要性值靠前的预定数量的特征峰的位置坐标,特征峰的位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
峰位置重要性值确定模块750可以被进一步配置为:根据式(1)-(4)中的任一种来确定候选特征峰的峰位置重要性值。
稳定性值确定模块760可以被进一步配置为:根据式(5)来确定候选特征峰的稳定性值。
候选特征峰重要性值确定模块770可以被进一步配置为:对候选特征峰的峰位置重要性值进行最大最小值归一化以得到归一化的峰位置重要性值;以及根据式(6)来确定候选特征峰的重要性值。
图8示出了根据本公开的实施例的用于对未知的待测物进行检测的装置800。装置800可以包括数据获取模块810、确定模块820和比较模块830。
数据获取模块810可以被配置为:获取气相色谱-离子迁移谱联用装置检测未知的待测物得到的气相色谱-离子迁移谱数据。
确定模块820可以被配置为根据气相色谱-离子迁移谱数据中的特征峰的变化情况确定待测物的产物离子的特征峰以及相应的位置坐标,位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
比较模块830可以被配置为:将待测物的产物离子的特征峰的位置坐标与利用上述方法400确定的违禁品重要特征峰库中的特征峰的位置坐标进行比较,以确定保留时间和迁移时间的相似度,并且选择相似度靠前的预定数量的已知标准样品的重要特征峰作为与未知的待测物对应的候选违禁品的特征峰。
装置800还可以包括识别结果呈现模块840,被配置为:按照违禁品重要特征峰库中的相似的特征峰的重要性值从大到小的顺序依次向用户呈现对应的违禁品名称和相应的位置坐标。
图9示出了根据本公开的实施例的用于确定已知标准样品的重要特征峰的***900的示意图。***900可以包括处理器910,例如,数字信号处理器(DSP)。处理器910可以是用于执行本文所描述的过程的不同动作的单个装置或多个装置。***900还可以包括输入/输出(I/O)装置930,用于从其他实体接收信号或者向其他实体发送信号。
此外,***900可以包括存储器920,该存储器920可以具有以下形式:非易失性或易失性存储器,例如,电可擦除可编程只读存储器(EEPROM)、闪存等。存储器920可以存储计算机可读指令,当处理器910执行该计算机可读指令时,该计算机可读指令可以使处理器执行本文所述的动作。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***(例如,一个或多个处理器)使用或者结合指令执行***使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体***、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
以上的详细描述通过使用示意图、流程图和/或示例,已经阐述了用于确定已知标准样品的重要特征峰的方法的方法、装置和***、用于对未知的待测物进行检测的方法、装置和***的众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下,本领域技术人员应理解,这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。在一个实施例中,本公开的实施例所述主题的若干部分可以通过专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、或其他集成格式来实现。然而,本领域技术人员应认识到,这里所公开的实施例的一些方面在整体上或部分地可以等同地实现在集成电路中,实现为在一台或多台计算机上运行的一个或多个计算机程序(例如,实现为在一台或多台计算机***上运行的一个或多个程序),实现为在一个或多个处理器上运行的一个或多个程序(例如,实现为在一个或多个微处理器上运行的一个或多个程序),实现为同件,或者实质上实现为上述方式的任意组合,并且本领域技术人员根据本公开,将具备设计电路和/或写入软件和/或固件代码的能力。此外,本领域技术人员将认识到,本公开所述主题的机制能够作为多种形式的程序产品进行分发,并且无论实际用来执行分发的信号承载介质的具体类型如何,本公开所述主题的示例性实施例均适用。信号承载介质的示例包括但不限于:可记录型介质,如软盘、硬盘驱动器、紧致盘(CD)、数字通用盘(DVD)、数字磁带、计算机存储器等;以及传输型介质,如数字和/或模拟通信介质(例如,光纤光缆、波导、有线通信链路、无线通信链路等)。

Claims (23)

1.一种用于确定已知样品的重要特征峰的方法,包括:
使用气相色谱-离子迁移谱联用装置对所述已知样品进行采样和检测,获取气相色谱-离子迁移谱数据;
根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号和当前样品的最后一批样品气体的保留时间的采样序号,将当前样品的第一批样品气体的保留时间的采样序号作为起始进样编号,将当前样品的最后一批样品气体的保留时间的采样序号作为结束进样编号,其中,根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号包括:根据反应离子峰的峰强的下降比例来确定当前样品的第一批样品气体的保留时间的采样序号;或者根据产物离子峰的出现情况来确定当前样品的第一批样品气体的保留时间的采样序号;
从所述起始进样编号到所述结束进样编号在所述气相色谱-离子迁移谱数据中寻峰以确定样品气体的产物离子的候选特征峰,并形成特征峰索引表,其中所述特征峰索引表包括与所述产物离子中的每一批产物离子的保留时间的采样序号和所述每一批产物离子的迁移时间的采样序号相对应的索引值,所述索引值表示在不同的保留时间的采样序号和不同的迁移时间的采样序号下是否存在相应的产物离子的特征峰;
确定所述候选特征峰的峰值强度;
根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值;
根据所述特征峰索引表来确定所述候选特征峰的稳定性值;以及
根据所述候选特征峰的峰值强度、所述候选特征峰的峰位置重要性值和所述候选特征峰的稳定性值来确定所述候选特征峰的重要性值。
2.根据权利要求1所述的方法,其中,所述峰值强度是最大最小值归一化后的峰值强度。
3.根据权利要求1所述的方法,还包括:
对所述候选特征峰的重要性值进行排序,并且选择重要性值靠前的预定数量的候选特征峰以形成违禁品重要特征峰库,其中,所述违禁品重要特征峰库包括多种已知样品名称和分别与所述多种已知样品相对应的重要性值靠前的预定数量的特征峰的位置坐标,所述特征峰的位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
4.根据权利要求1所述的方法,其中,根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值包括:
当对多种已知样品分别进行测量时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在所述中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
5.根据权利要求4所述的方法,其中,所述函数被表示为:
Figure FDA0003657055520000021
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
6.根据权利要求1所述的方法,其中,根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值包括:
当将多种已知样品混合在一起进行一次测量时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号的候选特征峰赋予第一峰位置重要性值,针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间除了所述起始进样编号以外的采样序号的候选特征峰赋予大于第一峰位置重要性值的第二峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的采样序号的特征峰赋予等于0的第三峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
7.根据权利要求6所述的方法,其中,所述函数被表示为以下函数(2)-(4)中的任一种:
Figure FDA0003657055520000031
Figure FDA0003657055520000032
Figure FDA0003657055520000033
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
8.根据权利要求1所述的方法,其中,根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值包括:
当多种已知样品之间不存在离子迁移时间相同的特征峰时,构建所述特征峰的峰位置重要性值相对于保留时间的采样序号的函数,其中,所述函数针对保留时间的采样序号等于所述起始进样编号与所述结束进样编号之间的中间进样编号的候选特征峰赋予最大的峰位置重要性值,针对保留时间的采样序号在所述中间进样编号两侧的候选特征峰赋予逐渐递减的峰位置重要性值,并且针对保留时间的采样序号为所述起始进样编号至所述结束进样编号的范围以外的特征峰赋予等于0的峰位置重要性值;以及
根据所述函数来确定所述候选特征峰的峰位置重要性值。
9.根据权利要求8所述的方法,其中,所述函数被表示为:
Figure FDA0003657055520000041
其中,peak.position_importantx表示保留时间的采样序号等于x的候选特征峰的峰位置重要性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号。
10.根据权利要求1所述的方法,其中,根据所述特征峰索引表来确定所述候选特征峰的稳定性值包括:
根据下式来确定所述候选特征峰的稳定性值:
Figure FDA0003657055520000042
其中,peak.stabilityy表示迁移时间的采样序号等于y的候选特征峰的稳定性值,x表示保留时间的采样序号,xstart表示起始进样编号,xend表示结束进样编号,y表示迁移时间的采样序号,并且iy,x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值,取值为0或1,取值为1时表示在保留时间的采样序号x和迁移时间的采样序号y的位置存在相应的产物离子的特征峰。
11.根据权利要求10所述的方法,其中,根据所述候选特征峰的峰值强度、所述候选特征峰的峰位置重要性值和所述候选特征峰的稳定性值来确定所述候选特征峰的重要性值包括:
对所述候选特征峰的峰位置重要性值进行最大最小值归一化以得到归一化的峰位置重要性值;以及
根据下式来确定所述候选特征峰的重要性值:
peak.weighty,x=a×peak.intensityy,x+(1-a)×iy,x×peak.position_importantx-norm×peak.stabilityy
其中peak.weighty,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的重要性值,peak.intensityy,x表示迁移时间的采样序号为y且保留时间的采样序号为x的候选特征峰的峰值强度,peak.position_importantx-norm表示该候选特征峰的归一化的峰位置重要性值,peak.stabilityy表示该候选特征峰的稳定性值,x表示保留时间的采样序号,y表示迁移时间的采样序号,a是预设的超参数,并且是范围[0,1]内的值,iy.x表示所述特征峰索引表中在所述保留时间的采样序号x和所述迁移时间的采样序号y下相对应的索引值。
12.根据权利要求11所述的方法,其中,通过数据及交互验证方法确定a的最优值。
13.根据权利要求1所述的方法,其中,所述离子迁移谱仪中的法拉第盘的采样时间小于或等于所述离子迁移谱仪中的离子门的关闭时间。
14.根据权利要求13所述的方法,其中,所述气相色谱-离子迁移谱数据是通过在特定长度的时间段内对所述离子迁移谱仪测量的数据执行叠加平均得到的,所述特定长度是离子门关闭打开周期的整数倍,并且是相邻的保留时间的采样序号之间的时间长度。
15.根据权利要求3所述的方法,还包括:
在使用不同的气相色谱-离子迁移谱联用装置或者***状态已经发生一定程度的改变的同一气相色谱-离子迁移谱联用装置时,重新对所述已知样品进行采样和检测,然后重新确定所述候选特征峰的重要性值,以形成与当前气相色谱-离子迁移谱联用装置的状态匹配的新的违禁品重要特征峰库。
16.根据权利要求11所述的方法,其中,
a的最优值采用0.5,
当反应离子峰的峰强的下降了20%之后,确定当前样品的第一批样品气体的产物离子峰已经出现。
17.一种用于检测未知的待测物的方法,包括:
使用气相色谱-离子迁移谱联用装置对所述未知的待测物进行采样和检测,获取所述未知的待测物的气相色谱-离子迁移谱数据;
根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定所述待测物的产物离子的特征峰以及相应的位置坐标,所述位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号;
将所述待测物的产物离子的位置坐标与利用根据权利要求3或15所述的方法确定的违禁品重要特征峰库中的特征峰的位置坐标进行比较,以确定保留时间和迁移时间的相似度,并且选择相似度靠前的预定数量的已知样品的重要特征峰作为与所述未知的待测物对应的候选违禁品的特征峰。
18.根据权利要求17所述的方法,还包括:
按照所述违禁品重要特征峰库中的相似的特征峰的重要性值从大到小的顺序依次向用户呈现对应的违禁品名称和相应的位置坐标。
19.一种用于确定已知样品的重要特征峰的装置,包括:
数据获取模块,被配置为:获取气相色谱-离子迁移谱联用装置检测所述已知样品得到的气相色谱-离子迁移谱数据;
进样编号确定模块,被配置为:根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号和当前样品的最后一批样品气体的保留时间的采样序号,将当前样品的第一批样品气体的保留时间的采样序号作为起始进样编号,将当前样品的最后一批样品气体的保留时间的采样序号作为结束进样编号,其中,根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定当前样品的第一批样品气体的保留时间的采样序号包括:根据反应离子峰的峰强的下降比例来确定当前样品的第一批样品气体的保留时间的采样序号;或者根据产物离子峰的出现情况来确定当前样品的第一批样品气体的保留时间的采样序号;
特征峰索引表形成模块,被配置为:从所述起始进样编号到所述结束进样编号在所述气相色谱-离子迁移谱数据中寻峰以确定样品气体的产物离子的候选特征峰,并形成特征峰索引表,其中所述特征峰索引表包括与所述产物离子中的每一批产物离子的保留时间的采样序号和所述每一批产物离子的迁移时间的采样序号相对应的索引值,所述索引值表示在不同的保留时间的采样序号和不同的迁移时间的采样序号下是否存在相应的产物离子的特征峰;
峰值强度确定模块,被配置为:确定所述候选特征峰的峰值强度;
峰位置重要性值确定模块,被配置为:根据所述特征峰索引表来确定所述候选特征峰的峰位置重要性值;
稳定性值确定模块,被配置为:根据所述特征峰索引表来确定所述候选特征峰的稳定性值;以及
候选特征峰重要性值确定模块,被配置为:根据所述候选特征峰的峰值强度、所述候选特征峰的峰位置重要性值和所述候选特征峰的稳定性值来确定所述候选特征峰的重要性值。
20.根据权利要求19所述的装置,其中,所述峰值强度是最大最小值归一化后的峰值强度。
21.根据权利要求19所述的装置,还包括:
违禁品重要特征峰库生成模块,被配置为:对所述候选特征峰的重要性值进行排序,并且选择重要性值靠前的预定数量的候选特征峰以形成违禁品重要特征峰库,其中,所述违禁品重要特征峰库包括多种已知样品名称和分别与所述多种已知样品相对应的重要性值靠前的预定数量的特征峰的位置坐标,所述特征峰的位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号。
22.一种用于检测未知的待测物的装置,包括:
数据获取模块,被配置为:获取气相色谱-离子迁移谱联用装置检测所述未知的待测物得到的气相色谱-离子迁移谱数据;
确定模块,被配置为根据所述气相色谱-离子迁移谱数据中的特征峰的变化情况确定待测物的产物离子的特征峰以及相应的位置坐标,所述位置坐标包括该特征峰的保留时间的采样序号和迁移时间的采样序号;以及
比较模块,被配置为:将所述待测物的产物离子的特征峰的位置坐标与利用根据权利要求3或15所述的方法确定的违禁品重要特征峰库中的特征峰的位置坐标进行比较,以确定保留时间和迁移时间的相似度,并且选择相似度靠前的预定数量的已知样品的重要特征峰作为与所述未知的待测物对应的候选违禁品的特征峰。
23.根据权利要求22所述的装置,还包括:
识别结果呈现模块,被配置为:按照所述违禁品重要特征峰库中的相似的特征峰的重要性值从大到小的顺序依次向用户呈现对应的违禁品名称和相应的位置坐标。
CN202010648819.4A 2020-07-07 2020-07-07 用于确定已知标准样品的重要特征峰的方法和装置 Active CN113917057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010648819.4A CN113917057B (zh) 2020-07-07 2020-07-07 用于确定已知标准样品的重要特征峰的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010648819.4A CN113917057B (zh) 2020-07-07 2020-07-07 用于确定已知标准样品的重要特征峰的方法和装置

Publications (2)

Publication Number Publication Date
CN113917057A CN113917057A (zh) 2022-01-11
CN113917057B true CN113917057B (zh) 2022-07-12

Family

ID=79231541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010648819.4A Active CN113917057B (zh) 2020-07-07 2020-07-07 用于确定已知标准样品的重要特征峰的方法和装置

Country Status (1)

Country Link
CN (1) CN113917057B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2501003C (en) * 2004-04-23 2009-05-19 F. Hoffmann-La Roche Ag Sample analysis to provide characterization data
CN101413919A (zh) * 2007-08-01 2009-04-22 中国科学院大连化学物理研究所 一种对样品进行识别与解析的方法及离子迁移谱仪
DE102007059461A1 (de) * 2007-12-03 2009-06-04 Gesellschaft zur Förderung der Analytischen Wissenschaften e.V. Verfahren zur Auswertung analytbezogener Signale aus einem mittels der Ionenbeweglichkeitsspektrometrie aufgenommenen IMS-Chromatogramm
CN101576531A (zh) * 2008-05-09 2009-11-11 同方威视技术股份有限公司 离子迁移谱检测方法及使用该方法的离子迁移谱仪
DE102010013548B4 (de) * 2010-03-31 2012-12-06 Bruker Daltonik Gmbh Mobilitätsspektrometrische Substanz-Identifizierung
US20130080073A1 (en) * 2010-06-11 2013-03-28 Waters Technologies Corporation Techniques for mass spectrometry peak list computation using parallel processing
JP6209511B2 (ja) * 2012-04-25 2017-10-04 アトナープ株式会社 コンテンツを提供するシステム
CN103884767B (zh) * 2012-12-21 2016-05-18 中国科学院大连化学物理研究所 一种提高离子迁移谱仪识别检测性能的方法

Also Published As

Publication number Publication date
CN113917057A (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
JP7026148B2 (ja) 生成イオンスペクトルのデータ独立取得および参照スペクトルライブラリ照合
Zhu et al. Mass spectrometry‐based label‐free quantitative proteomics
US4353242A (en) Multichannel detection and resolution of chromatographic peaks
US20070164212A1 (en) Mass spectrometer and method of analyzing isomers
US7949476B2 (en) Method for estimating molecule concentrations in a sampling and equipment therefor
US20060125826A1 (en) Method and system for mass spectrometry and gas chromatographic data analysis
Zhang et al. A novel approach for simple statistical analysis of high-resolution mass spectra
JPWO2012104956A1 (ja) 質量分析方法及び装置
JP4857000B2 (ja) 質量分析システム
CN109643635A (zh) 用于在扫描swath数据中识别前体及产物离子对的***及方法
US9625470B2 (en) Identification of related peptides for mass spectrometry processing
CN103217404A (zh) 一种激光诱导击穿光谱元素谱线归属识别方法
CN107209151B (zh) 干扰检测及所关注峰值解卷积
JP4317083B2 (ja) 質量分析方法及び質量分析システム
Cai et al. Orbitool: a software tool for analyzing online Orbitrap mass spectrometry data
JP2011220773A (ja) 質量分析方法及び質量分析装置
CN113917057B (zh) 用于确定已知标准样品的重要特征峰的方法和装置
US20200011769A1 (en) Indentification of chemicals in a sample using gc/saw and raman spectroscopy
He et al. Serum peptidome variations in a healthy population: reference to identify cancer-specific peptides
CN115236165A (zh) 基于直接电离质谱的***物检测方法
JP2007248467A (ja) イオンモニタリング期間の動的調整方法およびシステム
EP4102509A1 (en) Method and apparatus for identifying molecular species in a mass spectrum
CN117517240B (zh) 基于红外光的轻烃组分在线检测方法及***
Gupta et al. Automated Workflow For Peptide-level Quantitation From DIA/SWATH-MS Data
CN114267413B (zh) 一种基于一级谱图与深度学习的色谱保留时间对齐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant