CN116519861A - 解析装置及解析方法 - Google Patents
解析装置及解析方法 Download PDFInfo
- Publication number
- CN116519861A CN116519861A CN202310012285.XA CN202310012285A CN116519861A CN 116519861 A CN116519861 A CN 116519861A CN 202310012285 A CN202310012285 A CN 202310012285A CN 116519861 A CN116519861 A CN 116519861A
- Authority
- CN
- China
- Prior art keywords
- peak
- waveform
- certainty
- determination result
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 claims description 44
- 238000013178 mathematical model Methods 0.000 claims description 17
- 238000002372 labelling Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 abstract description 18
- 238000012986 modification Methods 0.000 description 26
- 230000004048 modification Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 13
- 238000005259 measurement Methods 0.000 description 11
- 239000007788 liquid Substances 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 238000004949 mass spectrometry Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000002552 multiple reaction monitoring Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000002098 selective ion monitoring Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000002025 liquid chromatography-photodiode array detection Methods 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000002705 metabolomic analysis Methods 0.000 description 1
- 230000001431 metabolomic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 229930010796 primary metabolite Natural products 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8624—Detection of slopes or peaks; baseline correction
- G01N30/8631—Peaks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8696—Details of Software
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8693—Models, e.g. prediction of retention times, method development and validation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明在进行使用语义分割技术的采峰的情况下,能够计算采峰的确信度。解析装置(1)将对象波形分割成多个部分波形(S12),使用学成模型,判定被分割的多个部分波形中成为峰部分的峰波形(S14),并使用在使用学成模型判定对象波形的峰部分时从学成模型输出的数据,计算峰波形的判定结果的确信度(S17)。
Description
技术领域
本公开涉及一种对色谱图及光谱的波形进行解析的解析装置及解析方法。
背景技术
以往为了对试样所含的成分进行鉴定或定量,使用色谱仪。在色谱仪中,利用管柱分离试样中的成分,并依序检测从管柱流出的成分。其后,制作将横轴设为时间且将纵轴设为检测强度的色谱图。
为了根据色谱图求出峰的高度及面积,需要确定从色谱图的基线上升的峰开始点及结束点。确定色谱图的峰开始点及结束点的作业被称为采峰(peak picking)。通过确定峰开始点及结束点,而确定峰的高度及面积。根据峰的高度及面积,可计算与峰相对应的化合物的浓度等。
近年来,尝试推进使用深度学习将采峰自动化。作为使用深度学习的采峰的方法,已知有利用物体侦测的技术的方法、及利用语义分割的技术的方法。
国际公开第2020/225864号中公开了如下一种方法:通过将采峰的问题作为图像识别领域的物体侦测进行定式化,来显示使用单步多框检测器(Single Shot MultiboxDetector,SSD)的采峰结果的确信度。SSD将采峰的结果与对所述结果的确信度一起输出。与此相对,Kanazawa S、其他10人、Fake metabolomics chromatogram generation forfacilitating deep learning of peak-picking neural networks.J BiosciBioeng.2021Feb;131(2):207-212.doi:10.1016/j.jbiosc.2020.09.013.Epub 2020Oct10.PMID:33051155.公开如下一种方法:通过将采峰作为语义分割的问题进行定式化,而使用U-Net执行采峰。
发明内容
然而,目前为止不存在使用语义分割技术的采峰中计算确信度的方法。因此,在使用语义分割技术的现有的采峰的方法中,虽然输出采峰的结果,但不输出输出结果的确信度。
本公开的目的在于在进行使用语义分割技术的采峰的情况下,能够计算采峰的确信度。
本公开的某一方面的解析装置对作为色谱图或光谱的对象波形进行解析,其包括:处理器;及存储器,储存有通过机械学习所制作的学成模型,所述机械学习使用多组包括通过将峰部分的位置已知的参照波形分割所制作的多个部分波形的组,处理器将对象波形分割成多个部分波形,使用学成模型判定对象波形的峰部分,基于对象波形的峰部分的判定结果,将对象波形分类为峰部分连续的峰区域与峰区域以外的非峰区域,使用在使用学成模型判定对象波形的峰部分时从学成模型输出的数据,计算峰部分的判定结果的确信度。
本公开的某一方面的解析方法是对作为色谱图或光谱的对象波形进行解析,其包括:制作学成模型的步骤,所述学成模型通过机械学习确定所输入的波形所包含的峰部分,所述机械学习使用多组包括通过将峰部分的位置已知的参照波形分割所制作的多个部分波形的组;将对象波形分割成多个部分波形的步骤;使用学成模型判定对象波形的峰部分的步骤;基于对象波形的峰部分的判定结果,将对象波形分类为峰部分连续的峰区域与峰区域以外的非峰区域的步骤;及使用在使用学成模型判定对象波形的峰部分时从学成模型输出的数据,计算判定结果的确信度的步骤。
本发明的所述及其他目的、特征、方面及优点将由与附图关联地理解的与本发明有关的下述详细说明来表明。
附图说明
图1是表示解析装置的整体结构的框图。
图2是表示色谱图的一例的图。
图3是用来对制作学成模型的顺序进行说明的框图。
图4是用来对制作学成模型的顺序进行说明的流程图。
图5是用来对使用学成模型判定色谱图数据的顺序进行说明的流程图。
图6是表示学成模型的判定结果的一例的图。
图7是表示基于判定结果进行标签标注处理的曲线图的一例的图。
图8是表示将确信度与判定结果一起显示的图像的一例的图。
图9是表示接受对判定结果进行修正的操作的图像的一例的图。
图10是表示峰的确信度与正解率的关系的图。
图11是表示计算峰的确信度的方法的各种变形例1~变形例7的图。
图12是用来对变形例7进行说明的图。
具体实施方式
以下,参照图式对本公开的实施方式进行详细说明。此外,对图中相同或相当部分标注相同的符号,不再重复其说明。
图1是表示解析装置1的整体结构的框图。解析装置1包括作为控制部发挥功能的处理器10、作为存储部发挥功能的存储器20、及输入输出端口30。在输入输出端口30连接鼠标40、键盘50、及显示装置60。也可以在输入输出端口30连接质谱仪等。也可以经由互联网或内部网络等在输入输出端口30连接一个或多个终端装置。
解析装置1例如以个人计算机作为基础而构成。解析装置1可包括能够经由互联网等网络从一个或多个终端装置访问的服务器。
对输入输出端口30输入解析对象的测定数据(色谱图数据)、及机械学习所使用的学习用数据。也可以构成为经由连接于输入输出端口30的质谱仪输入解析对象的测定数据。也可通过质谱仪、连接于质谱仪的液相色谱仪、及解析装置1构成液相色谱质谱***。
在存储器20中至少储存对输入输出端口30输入的学习用数据210、对输入输出端口30输入的测定数据213、机械学习所使用的推定模型300、以及用来执行解析处理及机械学习的处理的解析用程序200。
学习用数据210被分类为训练用数据211及验证用数据212。训练用数据211及验证用数据212是通过利用色谱质谱装置测定含有各种成分的试样所获得的色谱图的波形的数据。色谱图例如为总离子色谱图,其利用质谱仪对经液相色谱仪分离的成分进行质谱(massspectrometry,MS)扫描测定,并表示所检测到的全部质量电荷比的离子的合计强度的时间变化。色谱图也可以为进行选择离子监测(selected ion monitoring,SIM)测定或多反应监测(multiple reaction monitoring,MRM)测定并表示特定的质量电荷比的离子的强度的时间变化的质量色谱图。
这些训练用数据211及验证用数据212包括预先通过采峰所确定的峰的位置的数据。这些波形的数据以成为强度值的规定的范围内(例如±1.0)的方式预先被标准化。通过标准化将强度标不同的多个色谱图统一成共通的强度标,由此能够提高学成模型的精度。此处,作为训练用数据211及验证用数据212,使用通过实际试样的测定所获得的色谱图,但也可以使用通过模拟所制作的色谱图。
色谱图的波形沿着时间轴方向被分割成规定数量的部分波形。规定数量例如为512或1024等,各部分波形的宽度(时间轴方向的长度)被设定为至少小于峰宽。规定数量例如基于峰宽的大小与构成一个峰所需的数据件数而确定。
各部分波形数据对应有与部分波形的特性相关的信息(特性信息)。与部分波形对应的特性信息至少包括表示所述部分波形是属于峰区域还是属于非峰区域的信息。
由解析用程序200构成分割部201、模型制作部202、判定部203、计算部204、图像处理部205、及输出部206。
分割部201将色谱图的波形分割为预先决定的数量的部分波形。模型制作部202使用学习用数据210进行推定模型300的机械学习,而制作学成的推定模型300。判定部203使用学成的推定模型300进行色谱图的采峰。以下,有时将学成的推定模型300称为“学成模型”。
计算部204计算判定部203的判定结果的确信度。图像处理部205制作包括判定结果及确信度的图像数据。输出部206将包括图像数据的显示信号从输入输出端口30向显示装置60输出。此外,解析装置1也可以包括显示装置60。
图2是表示色谱图的一例的图。此处,简单地对根据色谱图所确定的各部的名称进行说明。色谱图可分类为基线的部分与峰区域。从基线起的上升部分被称为峰开始点及峰结束点。峰开始点与峰结束点之间的区域被称为峰区域。峰区域中检测强度非常强的部分(最强的部分)被称为峰顶。
如图2所例示,峰区域包括单独峰。在色谱仪的波形出现未分离峰的情况下,峰区域包括单独峰及未分离峰。例如,将两个以峰顶作为顶点的山状波形相连且相当于两个山状波形之间的谷的部分的检测强度未落至与基线相对应的强度的部分称为未分离峰。
接着,参照流程图对制作学成模型的顺序进行说明。图3是用来对制作学成模型的顺序进行说明的框图。如图3所示,解析装置1的模型制作部202作为学习装置发挥功能。模型制作部202基于所输入的学习用数据210来使推定模型300进行学习。推定模型300通过使用神经网络进行深度学习。推定模型300包括利用神经网络的计算所使用的加权系数等参数。
为了使推定模型300进行学习,例如使用监督式学习的算法。模型制作部202通过使用学习用数据210的监督式学习来使推定模型300进行学习。
推定模型300的学习使用语义分割(Semantic Segmentation)的技术。语义分割通常用于对包含二维分布的像素数据的图像进行解析。在本实施方式中,包含沿着时间轴一维排列的数据的色谱图的波形的解析应用语义分割。作为能够执行语义分割的学习模型,例如可使用U-Net、SeGNet、PSPNet等。在本实施方式中,使用U-Net。
模型制作部202被输入色谱图的部分波形、及与其相对应的正解数据。正解数据例如为已确定的采峰的结果。采峰的结果也可以包括峰顶。
模型制作部202基于所输入的学习用数据210与推定模型300判定采峰的结果,并基于判定结果与正解数据使推定模型300进行学习。具体而言,模型制作部202通过以利用推定模型300所获得的结果接近正解数据的方式调整推定模型300内的参数来使推定模型300进行学习。
图4是用来对制作学成模型的顺序进行说明的流程图。通过解析装置1的处理器10执行解析用程序200的一部分来实现本流程图的处理。
首先,处理器10检测开始推定模型300的学习的操作(步骤S1)。例如,在使用者使用鼠标40及键盘50进行开始推定模型300的学习的操作的情况下,在步骤S1中检测所述操作。
其次,处理器10从存储器20中读取学习用数据210(训练用数据211及验证用数据212)(步骤S2)。接着,处理器10将训练用数据211输入推定模型300(步骤S3)。接着,在推定模型300中,执行利用深度学习进行的学习处理(步骤S4)。在本实施方式中推定模型300的学习所使用的U-Net中,调整神经网络的加权,以根据部分波形获得正确的特性信息。
更具体而言,基于训练用数据211的部分波形及对应于部分波形的特性信息,调整推定模型300的参数。在调整参数的过程中,执行推定单独峰、未分离峰、峰开始点、峰结束点、及基线等的处理以及对照推定结果与正解数据的处理。
接着,处理器10将根据步骤S4的学习处理的结果所制作的推定模型300储存于存储器20中(步骤S5)。接着,处理器10确认推定模型300解析验证用数据212的部分波形并赋予的特性信息的正答率(步骤S6)。
接着,处理器10判定预先确定的结束条件是否成立(步骤S7)。例如,在使用训练用数据211重复实施的学习处理的次数达到预先决定的次数的情况下,处理器10判定结束条件成立。在结束条件不成立的情况下,处理器10重复进行步骤S3至步骤S6的处理直至结束条件成立为止。
在结束条件成立的情况下,处理器10从保存于存储器20中的多个推定模型300中选择合适的推定模型300,并将所选择的推定模型300作为学成模型保存于存储器20中(步骤S8)。
由此,处理器10结束图4的一系列处理。学成模型例如以针对验证用数据212的正答率最高、或未发生过度学习等为基准进行选择。此外,此处示出每学习一次就将推定模型300储存于存储器20中的例子。然而,也可以在学习次数达到预先确定的次数之前重复更新相同的推定模型300,在学习次数达到预先确定的次数时将推定模型300储存于存储器20中。
接着,参照流程图来说明对未解析的色谱图的波形进行解析的顺序。图5是用来对使用学成模型(学成的推定模型300)判定色谱图数据的顺序进行说明的流程图。通过解析装置1的处理器10执行解析用程序200的一部分来实现本流程图的处理。
首先,处理器10获得色谱图数据(测定数据)(步骤S11)。色谱图数据经由连接于输入输出端口30的质谱仪等计测机器、或连接于输入输出端口30的终端装置等而被输入解析装置1。
其次,处理器10将所获得的色谱图的波形分割为预先决定的数量的部分波形(步骤S12)。色谱图波形的分割数量可为与训练用数据211及验证用数据212相同的数量,也可以为与之不同的数量。
其中,以各部分波形的宽度(时间轴方向的长度)至少小于被预测包含于色谱图中的峰的宽度的方式,根据波形的长度(色谱质谱的执行时间的长度)决定分割数量。例如考虑将分割数量设定为512或1024等。
接着,处理器10将部分波形输入学成的推定模型300(学成模型)(步骤S13)。接着,利用学成模型判定部分波形是否属于峰区域,并执行标签标注处理(步骤S14)。更具体而言,根据部分波形判定峰开始点及结束点、基线、单独峰、未分离峰、峰顶等。而且,算出各判定结果的权重。而且,在步骤S14中,对各部分波形标注特性信息(是否属于峰区域的信息)。
接着,处理器10计算峰的确信度(步骤S17)。峰的确信度是根据由学成模型所判定的峰开始点所对应的权重与由学成模型所判定的峰结束点所对应的权重的平均值来计算。
接着,处理器10制作表示判定结果及确信度的曲线图(步骤S18)。在本实施方式中,利用处理器10制作多种曲线图。处理器10将用来显示所制作的曲线图的显示信号向显示装置60输出(步骤S19)。由此,显示装置60显示判定结果及确信度。例如,在显示装置60的画面中,在色谱图的波形上显示峰开始点、峰结束点、及确信度。
接着,处理器10判定是否检测到峰开始点及结束点的修正指示(步骤S20)。在本实施方式中,在显示装置60的画面上,使用者能够进行修正峰开始点及结束点的操作。在未检测到修正指示的情况下,处理器10将处理推进至步骤S22。
在使用者通过鼠标40及键盘50进行修正峰开始点及结束点的操作的情况下,处理器10根据修正指示修正画面上的数据(步骤S21)。如上所述,处理器10接受使用者的修正指示,而修正峰开始点及结束点。
处理器10在修正数据后,判定是否检测到确定数据的操作(步骤S22)。在未检测到确定数据的操作的情况下,处理器10将处理返回步骤S20。处理器10在检测到确定数据的操作的情况下,将判定结果(在修正了数据的情况下为修正后的判定结果)储存于存储器20中(步骤S23),结束基于本流程图的处理。
图6是表示学成模型的判定结果的一例的图。图6的上方的曲线图表示所输入的色谱图的波形W0。图6的下方的曲线图表示学成模型对所输入的色谱图的判定结果。两个曲线图的横轴(指数)对应于时间轴。图6的上方的曲线图的纵轴表示强度。图6的下方的曲线图的纵轴表示由学成模型输出的权重。权重被正态化为0~1的范围。
作为学成模型的判定结果所示出的波形W1~波形W5分别对应于基线、单独峰、未分离峰、峰开始点、及峰结束点。通过将色谱图的波形W0与波形W1~波形W5加以对比可知,例如在色谱图的波形W0中,指数Is的位置处峰开始点所对应的权重最高。同样地,可知在色谱图的波形W0中,指数Ie的位置处峰结束点所对应的权重最高。在所述情况下,例如解析装置1将色谱图的波形W0中的指数Is的位置判定为峰开始点,将指数Ie的位置判定为峰结束点。
此处,作为判定对象,列举了峰开始点、峰结束点、单独峰、未分离峰、及基线为例,但也可以将峰顶等其他要素添加至判定对象中。
如图6所示,处理器10通过计算由学成模型所判定的峰开始点Is所对应的权重Ws与由学成模型所判定的峰结束点Ie所对应的权重We的平均值,而确定峰的确信度。
图7是表示基于判定结果进行标签标注处理的曲线图的一例的图。图7的上方的曲线图与图6的下方所示的曲线图相同。图7的下方的曲线图是基于波形W1~波形W5对所输入的色谱图的波形W0(参照图6)进行标签标注而成的曲线图。标签0~标签4分别对应于基线、单独峰、未分离峰、峰开始点、及峰结束点。
例如,标签标注处理可按照以下顺序进行。即,在波形W1~波形W5中,选择某一指数Ix的位置处权重最大的波形,在所述选择的波形中标签标注指数Ix的值。使x从指数的初始值变化至最终值并重复进行相同的处理,由此结束标签标注处理。例如,图7示出指数0~Is为止的区间被标签标注(标签=0)为基线的曲线图。
图8是表示将确信度与判定结果一起显示的图像61的一例的图。图像61是由显示装置60来显示。图像61中示出作为测定对象的色谱图的波形以及与判定结果相对应的峰开始点Is及峰结束点Ie。进一步地,图像61中显示对于所判定的峰开始点Is及峰结束点Ie而言的确信度。使用者通过观察图像61可识别判定结果的准确程度。
此外,除了图像61以外,处理器10还能够将包括图6所示的形态的两个曲线图的图像、包括图7所示的形态的两个曲线图的图像、以及将图6及图7所包括的三个曲线图沿着纵方向排列而成的图像选择性地显示于显示装置60中。任一图像中均以图8所示的形态一起显示确信度。使用者可使用鼠标40及键盘50对解析装置1输入表示是否显示某一图像的指示。
图9是表示接受对判定结果进行修正的操作的图像62的一例的图。图像62是由显示装置60来显示。图像62中除了图8所示的内容以外,还显示用来修正峰开始点Is及峰结束点Ie的位置的图标65、图标66。
图标65对应于峰开始点Is。通过使用者使用鼠标40及键盘50来操作图标65,峰开始点Is的位置发生变化。通过使用者使用鼠标40及键盘50来操作图标66,峰结束点Ie的位置发生变化。与峰开始点Is及峰结束点Ie的位置发生变化连动,曲线图下方所显示的指数位置及确信度也发生变化。
使用者在将峰开始点Is及峰结束点Ie的位置修正为合适的位置后,进行确定数据的操作。若通过处理器10检测到确定数据的操作,则将修正后的结果储存于存储器20中。
此外,此处示出以图8所示的图像61为基础来显示图标65、图标66的例子。然而,也可以针对包括图6所示的形态的两个曲线图的图像、包括图7所示的形态的两个曲线图的图像、以及将图6及图7所包括的三个曲线图沿着纵方向排列而成的图像,显示用来对判定结果进行修正的图标65、图标66。
如上所述,在本实施方式中,将学成模型的判定结果及确信度显示于显示装置60。因此,使用者可通过目视识别准确的峰信息与可靠性比其低的峰信息。其结果为,使用者通过目视的确认或修正的指示变得更简单,而能够减轻这种作业中的使用者的负担。而且,在对观测多个峰的波形进行解析时,使用者应确认的峰的数量减少,由此也能够防止确认作业的失误或漏看等。
接着,对使用实际的色谱图数据制作学成模型并进行色谱图的波形解析的例子进行说明。在制作学成模型时,准备30组一次代谢物的色谱图。此外,每组包括475个色谱图。以所准备的各色谱图为对象,手动进行采峰。其后,将色谱图的波形分类为基线、峰开始点、峰结束点、单独峰、及未分离峰这五类,并分别赋予标签。由此,制作学习用数据。使用所准备的学习用数据,进行交叉验证评估。在交叉验证评估中,进行30次以30组中的一组作为验证数据的交叉验证评估。
将从学成模型输出的峰开始点的权重与从学成模型输出的峰开始点的权重相加并除以2,由此算出所述权重的平均值,将其设为峰的确信度。然后,验证确信度与正解率的关系。图10中示出了验证结果。
图10是表示峰的确信度与正解率的关系的图。在图10中,TP表示正解数,FP表示非正解数。如图10所示,确信度(confidence)越高,正解率越提高。由此可知,本实施方式中所公开的确信度的计算方法有效。
接着,参照图11对与峰的确信度的计算方法相关的变形例进行说明。图11是表示计算峰的确信度的方法的变形例1~变形例7的图。此外,以下变形例的说明所使用的波形W1~波形W5示于图6及图7中。
如图11所示,能够单独使用基线(变形例1)、单独峰(变形例2)、峰开始点(变形例3)、峰结束点(变形例4)、及峰顶(变形例5)的任一者来计算峰的确信度。
变形例1是使用基线计算峰的确信度的例子。如图11所示,确信度可通过“1-(基线的波形W1中属于峰区域的指数部分的权重的平均值)”进行计算。此处,属于峰区域的指数部分例如意指图6中指数Is~指数Ie的范围。
变形例2是使用单独峰计算峰的确信度的例子。如图11所示,确信度可通过“单独峰的波形W2中属于峰区域的指数部分的权重的平均值”进行计算。
变形例3是使用峰开始点计算峰的确信度的例子。如图11所示,确信度可通过“峰开始点的波形W4所对应的指数部分的权重的平均值”进行计算。例如,在图6中,以指数的初始值至终端值的范围的各指数为对象,确定出波形W4所对应的权重,并计算所确定的全部权重的平均值,由此导出确信度。
变形例4是使用峰结束点计算峰的确信度的例子。如图11所示,确信度可通过“峰结束点的波形W5所对应的指数部分的权重的平均值”进行计算。
变形例5是使用峰顶计算峰的确信度的例子。如图11所示,确信度可通过“峰顶所对应的指数部分的权重的平均值”进行计算。
变形例6是将单独峰、未分离峰、及基线加以组合而计算峰的确信度的例子。如图11所示,确信度可通过“(B+C)/(A+B+C)”进行计算。此处,A、B、及C分别如以下所述。
A:基线的波形W1中属于峰区域的指数部分的权重的总和
B:单独峰的波形W2中属于峰区域的指数部分的权重的总和
C:未分离峰的波形W3中属于峰区域的指数部分的权重的总和
变形例7是将基线、未分离峰、峰开始点、及峰结束点加以组合而计算峰的确信度的例子。如图11所示,确信度可通过“X/(X+Y)”进行计算。此处,X及Y分别如以下所述。
X:峰区域中标签2~标签4的任一者所对应的指数数
Y:峰区域中标签0所对应的指数数
参照图12进一步对变形例7进行详细说明。图12是用来对变形例7进行说明的图。图12是对将判定结果进行标签标注处理所得的曲线图赋予用来对变形例7进行说明的各种区域Xa、区域Xb、及区域Ya的图式。在图12所示的曲线图中,峰区域的一部分包括基线。有时可根据学成模型与测定对象的关系获得制作如图12所示的曲线图的判定结果。
在与变形例7相关的确信度的计算式中,X是峰区域中标签2~标签4的任一者所对应的指数数。其相当于将区域Xa的指数数与区域Xb的指数数相加而得的数。
在与变形例7相关的确信度的计算式中,Y是峰区域中标签0所对应的指数数。其相当于区域Ya的指数数。
以上,如已说明那样,本实施方式所涉及的解析装置1能够计算判定结果的确信度。尤其是本实施方式所涉及的解析装置1在实施使用语义分割的技术的采峰并且计算判定结果的确信度的方面具有特征。
在使用深度学习的采峰中,已知有应用图像识别领域的物体侦测的技术的方法、及应用语义分割的技术的方法。在非专利文献1中,记述了与利用物体侦测将采峰的问题定式化相比,通过利用语义分割进行定式化,性能会提高。然而,以往在使用语义分割技术的采峰中不存在计算确信度的方法。
本实施方式所涉及的解析装置1可实施使用语义分割的技术的采峰,并且计算所述判定结果的确信度,同时将判定结果及确信度显示于显示装置60。进一步地,解析装置1提供使用者能够对判定结果进行修正的接口。由此,使用者能够简便且高效地确认通过采峰所检测到的峰开始点及结束点等峰信息,并且视需要进行修正。其结果为,根据本实施方式,可提供一种能够输出精度高的峰检测结果的解析装置1。
本实施方式均为一例,可依据本公开的主旨适当变更。此处,以对通过色谱质谱所获得的色谱图的波形进行处理的情况为例进行了说明。然而,通过包括质谱仪以外的检测器(分光光度计)的色谱仪、及气相色谱仪所获得的色谱图也同样可通过解析装置1进行解析。进一步地,解析的对象不限定于色谱图。例如,也可以通过分光光度计的测定所获得的分光光谱(表示检测强度相对于波长或波数轴的变化的波形)作为解析对象。也可以通过液相色谱仪(liquid chromatograph,LC)、气相色谱仪(gas chromatograph,GC)、液相色谱-光电二极管阵列检测器(liquid chromatography with photodiode array detector,LC-PDA)、液相色谱-质谱仪(liquid chromatography-mass spectrometry,LC/MS)、气相色谱-质谱仪(gas chromatography-mass spectrometry,GC/MS)、液相色谱仪-串联式质谱仪(liquid chromatography-tandem mass spectrometry,LC/MS/MS)、气相色谱仪-串联式质谱仪(gas chromatography-tandem mass spectrometry,GC/MS/MS)、液相色谱-离子阱-飞行时间质谱联用仪(liquid chromatography-mass spectrometry-ion trap-time offlight,LC/MS-IT-TOF)等所获得的任一波形作为解析对象。
[形态]
本领域技术人员可理解,所述实施方式及其变形例为以下形态的具体例。
(第一项)一形态的解析装置是对作为色谱图或光谱的对象波形进行解析的解析装置,包括:处理器;及存储器,储存有通过机械学习所制作的学成模型,所述机械学习使用多组包括通过将峰部分的位置已知的参照波形分割所制作的多个部分波形的组,处理器将对象波形分割成多个部分波形,使用学成模型,判定被分割的多个部分波形中成为峰部分的峰波形,使用在使用学成模型判定对象波形的峰部分时从学成模型输出的数据,计算峰波形的判定结果的确信度。
根据第一项所记载的解析装置,在进行使用语义分割技术的采峰的情况下,能够计算采峰的确信度。
(第二项)在第一项所记载的解析装置中,处理器使用根据从学成模型输出的数据所确定的值、或执行用来对从学成模型输出的数据标注标签的标签标注处理后的数据,计算确信度。
根据第二项所记载的解析装置,可使用根据从学成模型输出的数据所确定的值、或执行用来对从学成模型输出的数据标注标签的标签标注处理后的数据来恰当地计算确信度。
(第三项)在第一项所记载的解析装置中,处理器对峰波形进行标签标注,并计算确信度。
根据第三项所记载的解析装置,可对峰波形进行标签标注,并计算确信度。
(第四项)在第二项或第三项所记载的解析装置中,标签包括单独峰、未分离峰、峰开始点、峰结束点、峰顶、及基线中的至少一者。
根据第四项所记载的解析装置,可利用单独峰、未分离峰、峰开始点、峰结束点、峰顶、及基线中的至少一个标签。
(第五项)在第一项所记载的解析装置中,处理器计算对象波形的峰开始点所对应的权重的值与对象波形的峰结束点所对应的权重的值的平均值作为确信度。
根据第五项所记载的解析装置,可通过对象波形的峰开始点所对应的权重的值与对象波形的峰结束点所对应的权重的值的平均值,利用相对简单的运算式算出确信度。
(第六项)在第一项至第五项中任一项所记载的解析装置中,还包括输出端口,所述输出端口输出用来显示判定结果及确信度的显示信号。
根据第六项所记载的解析装置,通过将显示信号输入显示装置,使用者能够识别判定结果与确信度的关系。
(第七项)在第六项所记载的解析装置中,还包括显示装置,所述显示装置基于显示信号显示判定结果及确信度,处理器在将判定结果及确信度显示于显示装置时,接受对判定结果进行修正的操作。
根据第七项所记载的解析装置,使用者可考虑确信度,并且将判定结果修正为被认为更合适的结果。
(第八项)其他形态的解析方法是对作为色谱图或光谱的对象波形进行解析的解析方法,包括:制作学成模型的步骤,所述学成模型通过机械学习确定所输入的波形所包含的峰部分,所述机械学习使用多组包括通过将峰部分的位置已知的参照波形分割所制作的多个部分波形的组;将对象波形分割成多个部分波形的步骤;使用学成模型,判定被分割的多个部分波形中成为峰部分的峰波形的步骤;及使用在使用学成模型判定对象波形的峰部分时从学成模型输出的数据,计算峰波形的判定结果的确信度的步骤。
根据第八项所记载的解析方法,在进行使用语义分割技术的采峰的情况下,能够计算采峰的确信度。
此外,处理器也可以在将基线的推定结果中属于峰区域的部分的权重的总和设为第一总和,将单独峰的推定结果中属于峰区域的部分的权重的总和设为第二总和,将未分离峰的推定结果中属于峰区域的部分的权重的总和设为第三总和时,处理器通过计算(第二总和+第三总和)/(第一总和+第二总和+第三总和),来计算确信度(变形例6)。
而且,处理器能够对从学成模型输出的数据进行标签标注处理,在将属于峰区域的标签中未分离峰、峰开始点、及峰结束点的任一者所对应的标签的总数设为第一总数,将属于峰区域的标签中基线所对应的标签的总数设为第二总数时,处理器可通过计算(第一总数)/(第一总数+第二总数),来计算确信度(变形例7)。
已对本发明的实施方式进行了说明,但应认为,本次所公开的实施方式在全部方面为例示,而非进行限制。本发明的范围由权利要求书表示,意指包含与权利要求书均等的含义及范围内的所有变更。
Claims (8)
1.一种解析装置,对作为色谱图或光谱的对象波形进行解析,其特征在于,且包括:
处理器;及
存储器,储存有通过机械学习所制作的学成模型,所述机械学习使用多组包括通过将峰部分的位置已知的参照波形分割所制作的多个部分波形的组,
所述处理器
将所述对象波形分割成多个部分波形,
使用所述学成模型,判定被分割的所述多个部分波形中成为峰部分的峰波形,
使用在使用所述学成模型判定所述对象波形的峰部分时从所述学成模型输出的数据,计算所述峰波形的判定结果的确信度。
2.根据权利要求1所述的解析装置,其中
所述处理器使用根据从所述学成模型输出的数据所确定的值、或执行用来对从所述学成模型输出的数据标注标签的标签标注处理后的数据,计算所述确信度。
3.根据权利要求1或2所述的解析装置,其中
所述处理器对所述峰波形进行标签标注,计算所述确信度。
4.根据权利要求2所述的解析装置,其中
所述标签包括单独峰、未分离峰、峰开始点、峰结束点、峰顶、及基线中的至少一者。
5.根据权利要求1所述的解析装置,其中
所述处理器计算所述对象波形的峰开始点所对应的权重的值与所述对象波形的峰结束点所对应的权重的值的平均值,作为所述确信度。
6.根据权利要求1或2所述的解析装置,其中,还包括:
输出端口,输出用来显示所述判定结果及所述确信度的显示信号。
7.根据权利要求6所述的解析装置,其中,还包括:
显示装置,基于所述显示信号来显示所述判定结果及所述确信度,
所述处理器在将所述判定结果及所述确信度显示于显示装置时,接受对所述判定结果进行修正的操作。
8.一种解析方法,对作为色谱图或光谱的对象波形进行解析,其特征在于,且包括:
制作学成模型的步骤,所述学成模型通过机械学习确定所输入的波形所包含的峰部分,所述机械学习使用多组包括通过将峰部分的位置已知的参照波形分割所制作的多个部分波形的组;
将所述对象波形分割成多个部分波形的步骤;
使用所述学成模型,判定被分割的所述多个部分波形中成为峰部分的峰波形的步骤;及
使用在使用所述学成模型判定所述对象波形的峰部分时从所述学成模型输出的数据,计算所述峰波形的判定结果的确信度的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022011415A JP2023110159A (ja) | 2022-01-28 | 2022-01-28 | 解析装置および解析方法 |
JP2022-011415 | 2022-01-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116519861A true CN116519861A (zh) | 2023-08-01 |
Family
ID=87405301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310012285.XA Pending CN116519861A (zh) | 2022-01-28 | 2023-01-05 | 解析装置及解析方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230243789A1 (zh) |
JP (1) | JP2023110159A (zh) |
CN (1) | CN116519861A (zh) |
-
2022
- 2022-01-28 JP JP2022011415A patent/JP2023110159A/ja active Pending
-
2023
- 2023-01-05 CN CN202310012285.XA patent/CN116519861A/zh active Pending
- 2023-01-13 US US18/096,857 patent/US20230243789A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230243789A1 (en) | 2023-08-03 |
JP2023110159A (ja) | 2023-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11486866B2 (en) | Waveform analyzer | |
US11302039B2 (en) | Waveform analyzer | |
JP4594154B2 (ja) | 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム | |
CN110214271B (zh) | 分析数据解析方法以及分析数据解析装置 | |
JPWO2017077618A1 (ja) | クロマトグラフ質量分析データ処理方法及び処理装置 | |
JP6245387B2 (ja) | 3次元スペクトルデータ処理装置及び処理方法 | |
CN106574914B (zh) | 全二维色谱用数据处理装置 | |
EP2399123B1 (en) | A method, a system and a computer program for a simultaneous data processing for an automatic extraction of respective peaks in multiple chromatographic spectra | |
JP7108136B2 (ja) | 分析装置 | |
EP2580772B1 (en) | A method computer program and system to analyze mass spectra | |
CN116519861A (zh) | 解析装置及解析方法 | |
EP3971567A1 (en) | Apparatus and method for processing mass spectrum | |
JPWO2020044435A1 (ja) | データ解析方法、データ解析装置、及びデータ解析用の学習モデル作成方法 | |
JP7414125B2 (ja) | 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置 | |
JP7334788B2 (ja) | 波形解析方法及び波形解析装置 | |
US20230280316A1 (en) | Learning data producing method, waveform analysis device, waveform analysis method, and recording medium | |
US20230280318A1 (en) | Learning data producing method, waveform analysis device, waveform analysis method, and recording medium | |
EP3982393A1 (en) | Mass spectrum processing apparatus and method | |
US20230296572A1 (en) | Training Method | |
EP4345826A1 (en) | Polymer analysis apparatus and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |