WO2020225864A1 - 分析装置 - Google Patents

分析装置 Download PDF

Info

Publication number
WO2020225864A1
WO2020225864A1 PCT/JP2019/018338 JP2019018338W WO2020225864A1 WO 2020225864 A1 WO2020225864 A1 WO 2020225864A1 JP 2019018338 W JP2019018338 W JP 2019018338W WO 2020225864 A1 WO2020225864 A1 WO 2020225864A1
Authority
WO
WIPO (PCT)
Prior art keywords
peak
information
peak detection
accuracy
target component
Prior art date
Application number
PCT/JP2019/018338
Other languages
English (en)
French (fr)
Inventor
山田 洋平
慎司 金澤
弘之 安田
研大 國澤
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to JP2021518242A priority Critical patent/JP7108136B2/ja
Priority to US17/600,892 priority patent/US20220196615A1/en
Priority to EP19928242.7A priority patent/EP3968016A4/en
Priority to CN201980095563.4A priority patent/CN113711031B/zh
Priority to PCT/JP2019/018338 priority patent/WO2020225864A1/ja
Publication of WO2020225864A1 publication Critical patent/WO2020225864A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8634Peak quality criteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8637Peak shape
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/74Optical detectors

Definitions

  • the present invention relates to an analyzer that performs qualitative analysis and quantitative analysis of a sample by analyzing a chromatogram waveform or a spectral waveform obtained by analysis of the sample.
  • the analyzer according to the present invention is, for example, a gas chromatograph (GC) apparatus including a gas chromatograph mass spectrometer, a liquid chromatograph (LC) apparatus including a liquid chromatograph mass spectrometer, a mass spectrometer, and a spectrophotometer (infrared absorption).
  • GC gas chromatograph
  • LC liquid chromatograph
  • spectrophotometer infrared absorption
  • spectrophotometer a visible infrared spectrophotometer, a fluorescence spectrophotometer, etc.
  • X-ray analyzer fluorescence X-ray analyzer, X-ray diffraction analyzer, etc.
  • a sample containing various components is introduced into a column, and various components are separated in the time direction in the process of the sample passing through the column, and detection provided at the outlet of the column is provided. Detect with a device.
  • peaks corresponding to the components in the sample appear. Since the time (retention time) at which the peak is observed corresponds to the type of component, the component can be specified from the retention time of this peak, that is, qualitative analysis can be performed. Further, since the height and area of the peak correspond to the concentration or content of the component, the concentration and content of the component can be obtained from the height value and area value of the peak, that is, quantitative analysis can be performed. ..
  • the present invention has been made to solve these problems, and an object of the present invention is to burden the operator on determining the accuracy of the peak detected by the automatic peak detection process and correcting the peak. It is an object of the present invention to provide an analyzer capable of efficiently performing highly accurate qualitative analysis and quantitative analysis.
  • One aspect of the present invention made to solve the above problems is to perform qualitative analysis or quantification of a target component contained in a sample by using a chromatogram or a spectrum obtained by performing a predetermined analysis on the sample. It ’s an analyzer, Peak detection corresponding to the target component is performed on the chromatogram or spectrum obtained by a predetermined analysis of the sample, peak information of each peak is acquired, and accuracy is an index value indicating the certainty of the peak detection.
  • a peak detector that seeks information and A list of at least a part of the target component is displayed on the display unit, and the peak accuracy information detected in the peak detection unit corresponding to the target component included in the list, or obtained from the accuracy information.
  • a display processing unit that displays a list in which other information is associated with the target component, Is provided.
  • the predetermined analysis includes, for example, chromatographic analysis such as liquid chromatography and gas chromatography, mass spectrometry, ion mobility analysis, spectroscopic analysis such as absorption spectroscopic analysis and fluorescence spectroscopic analysis, and X-ray analysis.
  • chromatographic analysis such as liquid chromatography and gas chromatography
  • mass spectrometry ion mobility analysis
  • spectroscopic analysis such as absorption spectroscopic analysis and fluorescence spectroscopic analysis
  • X-ray analysis X-ray analysis.
  • the component contained in the sample is a compound, a molecule, an element, or the like.
  • the peak detection unit is, for example, information on the retention time of a plurality of predetermined target components. Is used to detect peaks corresponding to each target component on the chromatogram.
  • the peak detection unit obtains peak information including a start point and an end point based on, for example, the waveform shape of the detected peak, and also obtains accuracy information indicating the accuracy of estimation of such information.
  • the display processing unit describes all or a part of the target component in association with the peak accuracy information corresponding to the target component or other information obtained from the accuracy information. Create a component list and display it on the display.
  • the other information obtained from the peak accuracy information corresponds to, for example, a binary information, an index value, or a range of values including the index value, which is the result of determining the index value itself with a predetermined threshold value. It can include attached graphical information (icons, etc.).
  • the peak accuracy information When displaying the peak accuracy information numerically, either the accuracy is high when the numerical value is large, or the accuracy is high when the numerical value is low. Further, when the peak accuracy information is displayed graphically, the form of the information indicating that the accuracy is high does not matter. In any case, it is only necessary to display the display in a mode or form that allows the operator, that is, a human being, to judge the quality when viewed.
  • the one with a low index value has a higher peak than the one with a high index value.
  • peak information such as the start point and end point is not appropriate. Therefore, the operator sequentially checks the peak accuracy information or other information obtained from the accuracy information in the displayed component list, and selects, for example, only the component whose accuracy index value is significantly lower than the others, and then selects the component. It is possible to confirm the waveform shape of the peak detected corresponding to the component.
  • the operator efficiently confirms the automatically detected peaks whose information is unreliable, and obtains the peak information as needed. It can be fixed. As a result, it is possible to reduce the workload of the operator in qualitative analysis and quantitative analysis in the case of simultaneous analysis of multiple components, and to realize efficient analysis. Further, for example, when analyzing a chromatogram or a spectrum in which a large number of peaks are observed, the number of peaks to be confirmed by the operator is reduced, so that mistakes or oversights in the confirmation work can be prevented.
  • FIG. 6 is a schematic configuration diagram of an LC system according to an embodiment of the present invention and a system for creating a trained model used in the system.
  • the flowchart which shows the flow of processing at the time of making the trained model used in the LC system of this embodiment.
  • the flowchart which shows the flow of the peak detection processing in the LC system of this embodiment.
  • Schematic diagram showing a trained model by a neural network used in the LC system of this embodiment.
  • FIG. 1 is a schematic configuration diagram of the LC system of the present embodiment and a system for creating a trained model used in the system.
  • This LC system 1 includes an LC measurement unit 10, a data analysis unit 11, an operation unit 12, and a display unit 13.
  • the LC measuring unit 10 includes a liquid feed pump, an injector, a column, a column oven, a detector, etc., performs an LC analysis on a given sample, and changes in signal intensity obtained by the detector over time. Acquire chromatogram data indicating.
  • the type and method of the detector are not particularly limited, and for example, a mass spectrometer, a photodiode array (PDA) detector, or the like can be used.
  • the data analysis unit 11 includes functional blocks such as a data collection unit 110, a peak detection processing unit 120, a qualitative / quantitative analysis unit 130, a result display processing unit 140, and a peak detection result correction processing unit 150.
  • the peak detection processing unit 120 further includes functional blocks such as an image generation unit 121, a peak position estimation unit 122, a learned model storage unit 123, and a peak determination unit 124.
  • the data collection unit 110 collects the chromatogram data obtained by the LC measurement unit 10 and stores it.
  • the peak detection processing unit 120 automatically detects peaks in the chromatogram waveform based on the collected chromatogram data, and the positions (holding time) of the start point and end point of the detected peak and the index value of the certainty of peak detection. Outputs peak information including detection accuracy.
  • the qualitative / quantitative analysis unit 130 identifies the component (compound) corresponding to each peak based on the peak information given from the peak detection processing unit 120, calculates the peak height value and the peak area value, and obtains the same. A quantitative value that is the concentration or content of each component is calculated from the value.
  • the result display processing unit 140 receives the calculated quantitative value and the information on the detection accuracy of each peak, and displays them on the display unit 13 in a predetermined format.
  • the peak detection result correction processing unit 150 corrects the peak information detected by the peak detection processing unit 120 according to the operation of the operator via the operation unit 12.
  • the model creation unit 2 provided separately from the LC system 1 includes a learning data input unit 20, an image generation unit 21, a learning execution unit 22, and a model construction unit 23 as functional blocks.
  • the trained model created by the model creation unit 2 is stored in the trained model storage unit 123 of the data analysis unit 11 of the LC system 1.
  • the substance of the data analysis unit 11 is a computer system including a personal computer on which predetermined software is installed, a workstation having higher performance, or a high-performance computer connected to such a computer via a communication line.
  • the function of each block included in the data analysis unit 11 is stored in the computer or computer system, which is executed by executing software installed in a computer system including a single computer or a plurality of computers. It can be embodied by processing using various data.
  • this peak detection processing unit 120 converts a chromatogram waveform (chromatogram curve) into a two-dimensional image, and then machine learning to detect the category and position of an object existing on the image.
  • machine learning By using a method of deep learning, which is one of the methods, the positions of the start point and the end point of the peak are detected.
  • FIG. 2 is a flowchart showing a flow of processing at the time of creating a trained model performed by the model creation unit 2.
  • the various chromatogram waveform data referred to here are various noises, baseline fluctuations (drifts), and overlap of multiple peaks that may appear in the chromatogram waveform when actually performing peak detection. Alternatively, it is a chromatogram waveform including elements such as deformation of the peak shape.
  • the learning data input unit 20 reads a set of the large number of chromatogram waveform data and accurate peak information including the peak start point / end point as training data (step S1).
  • the image generation unit 21 creates a chromatogram based on the chromatogram waveform data which is a time-series signal, and creates a chromatogram waveform (chromatogram curve) showing a change in signal intensity with the passage of time in two dimensions with a predetermined number of pixels. Convert to an image (step S2).
  • the number of pixels is 512 ⁇ 512.
  • the size of the waveform in the y direction is standardized so that the peak top of the peak with the highest signal intensity among the peaks on the chromatogram waveform coincides with the upper side of the rectangular image. ..
  • the entire measurement time range or a part of the measurement time range of the chromatogram waveform (for example, the measurement time range specified by the user) is aligned with the length in the x direction (horizontal direction) of the rectangular image.
  • the size of the waveform in the x direction is standardized (step S3). When standardizing the size in the x direction, if the number of data points is less than 512 pixels, upsampling may be performed as appropriate and converted into a high-resolution waveform according to the original data.
  • the image generation unit 21 similarly converts all the chromatogram waveform data read in step S1 into an image.
  • the intensity information and time information of the original chromatogram waveform are lost by the imaging process accompanied by the normalization of the chromatogram waveform, and an image showing the waveform shape is generated.
  • the already read data is imaged by steps S2 to S3. It is natural that it may be done.
  • the image generation unit 21 standardizes the peak information set with the chromatogram waveform data in the x-direction and the y-direction at the time of the above-mentioned imaging, that is, on the image according to the expansion and contraction of the chromatogram waveform. It is converted into position information, that is, information on pixel positions in the x-direction and the y-direction (step S4).
  • the learning execution unit 22 performs machine learning using a large number of images generated from the chromatogram waveform which is the learning data as described above, and the model construction unit 23 performs the chromatogram based on the learning result.
  • deep learning which is one of the general object detection algorithms in image recognition
  • the SSD method which is particularly excellent in image recognition
  • the SSD method is one of the most widely used methods using convolutional neural networks (CNN) in deep learning, and is an algorithm that can realize the fastest and highest recognition accuracy at present.
  • the SSD method was proposed by Liu Wei et al. In Non-Patent Document 1, and the details of the algorithm are described in detail in Non-Patent Document 1 and the like. Therefore, the features of the present embodiment are described here. Only the points will be mentioned.
  • an image feature map extracted by CNN is used to infer the part where an object exists in a two-dimensional image, but the image feature map is folded little by little.
  • Image feature maps of various sizes are used by incorporating them. This makes it possible to detect object region candidates of various sizes.
  • what we want to detect here is the position of the start point and end point of the peak in the x direction. Therefore, the algorithm is changed so as to detect the start point and the end point of the peak existing in the interval of various sizes in the x direction.
  • FIG. 4 is a schematic diagram showing a trained model by the neural network used in this embodiment.
  • FIG. 5 is a schematic diagram for explaining a process when creating a trained model.
  • a segment Sg1 having a window having the width of the entire length in the x direction of the image generated in the processes of steps S2 to S3 is set, and then the window of the segment Sg1 is set.
  • the operation of dividing the windows of segments Sg2 and Sg3 into halves and setting four segments Sg4, Sg5, Sg6, and Sg7 whose window width is 1/4 of the original is repeated, for a total of 120.
  • Segments Sg1 to Sg120 are defined.
  • Each of these segments is a unit for extracting an image feature map by CNN, and the peak range determined by the start point and the end point of the peak is learned for each unit based on the image as training data.
  • the pixel value of each pixel in the 512 ⁇ 512 pixel image is input to each of the 262144 nodes provided in the input layer.
  • pxn indicates the nth pixel in one image.
  • the image is a color or a plurality of colors, for example, the pixel values of each of the three primary colors are input for each pixel, so that the number of nodes in the input layer is, for example, tripled.
  • a layered network consisting of a large number of intermediate layers is learned by deep learning for the above inputs based on a large number of images, and each of the 600 nodes provided in the final output layer is trained. Numerical information is output. The information output from these 600 nodes is the peak detection accuracy (confidence) confn calculated for each of the 120 segments Sg1 to Sg120, and the offset in the x direction from the left edge of the window of that segment to the peak start point.
  • quantity yen It is a five-dimensional information called quantity yen.
  • the above-mentioned five-dimensional information for the first segment Sg1 is shown as ⁇ conf1, xs1, ys1, xe1, ye1 ⁇ .
  • the accuracy of peak detection is defined by the length of the overlap between the peak range and the window, and the range of the values is 0 to 1.
  • conf is a calculated value according to the overlap between the width of the window of Sg1 and the peak range A. As described above, since the pixel positions and peak ranges of the peak start and end points in the training data are known, learning is performed on a large number of training data so as to match the correct answer as much as possible, and the network weight in each intermediate layer is calculated. Build a model.
  • the model building unit 23 temporarily saves the learning model obtained by performing deep learning using a large amount of learning data (step S6).
  • the learning model created as described above in the model creation unit 2 is transmitted and stored, for example, via a communication line.
  • FIG. 3 is a flowchart showing the flow of peak detection processing performed by the peak detection processing unit 120.
  • the image generation unit 121 reads the chromatogram waveform data to be processed from the data acquisition unit 110 (step S11). Then, the read data is subjected to the same processing of steps S12 to S13 as the imaging of the chromatogram waveform data by steps S2 to S3 executed by the image generation unit 21 of the model creation unit 2, thereby performing the chromatogram. An image of 512 ⁇ 512 pixels including a curve is generated.
  • the standard retention time of the target component is known in advance. Therefore, a chromatogram waveform may be cut out in a predetermined time range near the standard holding time of each target component, and an image including the chromatogram curve may be generated from the cut out chromatogram waveform. As a result, the peak corresponding to the target component can be detected on the chromatogram.
  • the chromatogram waveform of the entire measurement time range is not limited. The peak detection may be executed for.
  • the detector of the LC measuring unit 10 is a mass spectrometer, usually, for a known component whose mass-to-charge ratio to be detected is known in advance, selective ion monitoring (SIM) measurement or multiple reaction monitoring (MRM) measurement is performed. It is detected, and unknown components are detected by scan measurement.
  • SIM selective ion monitoring
  • MRM multiple reaction monitoring
  • the peak position estimation unit 122 applies the trained model stored in the trained model storage unit 123 to the pixel value of each pixel of the generated image to acquire the above-mentioned five-dimensional information for each of the 120 segments. To do. That is, the information on the pixel positions estimated to be the start point and the end point of the peak in the image is acquired together with the peak detection accuracy (step S14).
  • FIG. 6 is a diagram showing an example of peak detection results.
  • ⁇ confn, xsn, ysn, xen, yen ⁇ (where n is 1 to 120) can be obtained for each segment, in many cases, the probability of peak detection is not 0 in multiple segments for one peak.
  • ⁇ Confn, xsn, ysn, xen, yen ⁇ is obtained.
  • those with low peak detection accuracy confn have poor reliability. Therefore, in this example, when the calculated confn is equal to or less than a predetermined value (0.5 in this case), the five-dimensional peak information is regarded as not useful and is set to ⁇ 0, 0, 0, 0, 0 ⁇ . However, all the results may be used without making a selection based on such accuracy.
  • the peak determination unit 124 estimates that the correct answer is the one with the highest peak detection probability among the plurality of peak start points / end points corresponding to the component, and provides information on the start point / end point of the peak. It is selected and output as a peak detection result (step S15).
  • the peak determination unit 124 may perform the following processing instead of simply selecting the peak information presumed to be the correct answer based on the magnitude of the peak detection probability.
  • the change in the peak detection probability on the time axis is captured as an accuracy distribution for each start point and end point and graphed.
  • This graph may be a line graph, a heat map, or the like.
  • the accuracy distribution curve when the accuracy distribution curve is obtained by performing appropriate fitting on a plurality of points, the accuracy distribution curve does not always take the maximum value at the point where the peak detection accuracy is the maximum among the points, and the peak detection is performed.
  • the accuracy distribution curve may reach a maximum near the point where the accuracy is maximum.
  • the position (time) at which the maximum value is taken is considered to be more appropriate as the peak start point or end point. Therefore, the position where the accuracy distribution curve takes the maximum value may be set as the peak start point or end point. Further, the maximum value at that time may be used as the peak detection probability.
  • the qualitative / quantitative analysis unit 130 receives the above peak detection result, and for each peak corresponding to each component, the time at which the signal strength is maximum (that is, corresponding to the peak top) within the time range between the peak start point and the peak end point.
  • the time corresponding to the center of gravity of the peak is obtained, and this is set as the typical holding time (detection RT) of the peak.
  • the peak area value (or height value) is calculated for each peak. Further, the calculated peak area value is compared with the calibration curve obtained in advance to calculate the quantitative value which is the concentration or content of the target component (step S16).
  • the detection RT obtained for each peak corresponding to each component may be displayed in the compound list shown in FIGS. 9 to 13 described later.
  • the result display processing unit 140 creates a compound list based on the peak detection result for each component and the quantitative value calculation result for each component, and displays the compound list on the screen of the display unit 13 (step S17).
  • FIG. 9 is an example of the compound list displayed at this time.
  • “compound name” is the name of each compound
  • “RT” is the standard holding time or the measured holding time.
  • the compound list is a list of such known components. In this case, peak detection on the chromatogram obtained by actual measurement for the target sample is performed for the compounds listed in this compound list. On the other hand, when qualitative analysis or quantification of unknown components is also performed (or when all components are unknown), peak detection is performed for the entire measurement time range as described above, and the components are identified for the detected peaks. If so, a compound name is given, and if the component is not identified, a compound list is created as an "Unknown" component.
  • "Unknown” When the component is "Unknown", "Unknown” may be displayed in the "Compound name” field in the compound list, or may be left blank or "*” or the like may be displayed. Further, the column of "RT” may be left blank or "*” or the like may be displayed, or the detection RT obtained by the qualitative / quantitative analysis unit 130 may be displayed.
  • the column of "quantitative value" in the compound list shown in FIG. 9 is the quantitative value calculated by the qualitative / quantitative analysis unit 130. Even if the peak waveform is the same, the peak area value changes when the positions of the start point and the end point obtained by the peak detection processing unit 120 change, so naturally the quantitative value also changes. Therefore, if the positions of the start and end points of the peak are not appropriate, the quantitative values will be inaccurate. In order to obtain an accurate quantitative value, it is necessary to appropriately correct the start point and end point of the peak obtained by the peak detection processing unit 120. In a conventional LC system, the operator needs to check the peak waveforms on the chromatogram one by one on the display screen in order for the operator to understand which compound the peak start point and end point correspond to are inappropriate. was there. Therefore, when the number of compounds is large, the work is very complicated and time-consuming.
  • the value of the peak detection accuracy confn calculated in the process of the peak detection process is listed in the "Peak detection accuracy" column corresponding to each compound in the compound list. ing.
  • the peak detection probability of the compound having the name "Comp C” is as high as 0.90, but the peak detection probability of the compound having the name "Comp B” is relatively low as 0.64.
  • the lower the value of the peak detection probability the lower the reliability of the quantitative value. Therefore, the operator confirms the displayed compound list and determines that the reliability of the quantitative value corresponding to the component whose peak detection probability value is significantly lower than the others is low.
  • FIG. 9 the compounds in the compound list are arranged in the order of retention time, but the compounds are sorted in descending or ascending order of peak detection probability by clicking the operation on the header of the peak detection probability column. can do.
  • FIG. 10 is a diagram showing the results of sorting in ascending order of peak detection probability. By sorting in this way, compounds having low reliability can be easily extracted.
  • the operator selects a compound with low reliability of the quantitative value from the numerical value of the peak detection probability in the compound list, confirms the peak waveform detected for the compound, and displays the peak information as necessary. Or fix it.
  • the operation unit 12 clicks the column of the compound name or the quantitative value to be confirmed in the compound list
  • the peak detection result correction processing unit 150 displays the peak waveform on the chromatogram detected for the compound. Display in a separate window.
  • FIG. 8 is an example of displaying the peak waveform for one compound.
  • the position of the start point of the peak estimated by the peak position estimation unit 122 is indicated by a circle
  • the position of the end point is indicated by a triangle mark
  • the peak is selected by the peak determination unit 124
  • the start point and end point (which has the maximum peak detection accuracy) are filled in black, and the others are shown in white.
  • the numerical value at the beginning of the parentheses () in the balloon display is the peak detection probability (range of 0 to 1), and the numerical value following it is the information on the time and intensity of the peak start point.
  • the value of peak detection probability which is the most important for comparison, is shown in bold so that it stands out more than other values.
  • the operator visually confirms such a peak waveform and the positions of the start and end points of the detected peak on the screen of the display unit 13. Then, the operator performs an operation of appropriately changing the start point and the end point of the peak by the operation unit 12, and instructs the reanalysis.
  • the peak detection result correction processing unit 150 recalculates the peak area value based on the changed start point / end point positions, and further calculates the quantitative value.
  • the operator does not check the peak waveforms on the chromatogram one by one on the display screen, and the peak waveform corresponding to the compound whose quantitative value can be estimated to be unreliable. You can check only and modify the peak start and end points as needed.
  • the holding time may display both the standard holding time and the actually measured holding time.
  • the compound list displayed at this time does not list all the target compounds that are the targets of confirmation or quantification of the presence or absence, but it is necessary to correct or confirm the peaks. Only compounds whose numerical values are below a predetermined threshold may be listed.
  • FIG. 12 is a display example of a compound list having such a narrowing function.
  • the threshold value is not specified as the narrowing condition
  • all the target compounds are listed as in FIG.
  • the compounds having the peak detection probability equal to or higher than the threshold value are excluded from the list, and the compound list showing only the remaining compounds, that is, the compounds having the peak detection probability lower than the threshold value is displayed. .. This allows the operator to see the corresponding peak waveforms only for the compounds on this list.
  • the operator can grasp that the peak detection accuracy is low, but does not understand the reason why the peak detection accuracy is low. Therefore, items estimated as a factor that the peak detection probability is lower than others may be displayed by a balloon display or the like. Specifically, factor candidates such as large variations in the positions of the start and end points of the peaks associated with one compound, the possibility of overlapping with adjacent peaks, and a large slope of the baseline are selected. It may be shown. These factors can be estimated in the process of peak detection described above.
  • the detector is a PDA detector or a mass spectrometer (especially a tandem mass spectrometer such as a triple quadrupole mass spectrometer or a quadrupole-time-of-flight mass spectrometer), one It is common to obtain multiple chromatograms for a compound at different wavelengths or at different mass-to-charge ratios (MRM transitions). Therefore, for each of a plurality of chromatograms for one compound, peak information including peak start points and end points and peak detection accuracy can be obtained.
  • MRM transitions mass-to-charge ratios
  • extracted ion chromatograms can be obtained for each of a quantitative ion and one or a plurality of confirmed ions. At least two or more peak information can be obtained for one compound. Therefore, in that case, as shown in FIG. 11, all of the plurality of peak detection probabilities obtained for different chromatograms may be displayed. Of course, as shown in FIG. 11, instead of displaying a plurality of peak detection probabilities from the beginning, only the peak detection probabilities related to the peak used for calculating the quantitative value are displayed, and for example, the display column is clicked. The peak detection accuracy for other peaks may be displayed by operating or mouse over.
  • a representative value obtained from the peak detection probability for the plurality of peaks for example, the maximum value and the minimum value.
  • Statistical values such as values, mean values, and median values may be used.
  • an appropriate icon corresponding to the numerical value or the numerical range may be displayed.
  • a so-called binary value is displayed in which the peak detection probability is " ⁇ " or "1” when the peak detection probability is equal to or higher than the threshold value and "x" or "0” is indicated when the peak detection probability is lower than the threshold value. Good.
  • a balloon display, a pop-up screen, or the like may be displayed together with the numerical value of the peak detection probability and the approximate peak waveform corresponding to the peak detection probability. This allows the operator to more easily confirm the approximate peak waveform.
  • the above embodiment is an example of performing peak detection on a chromatogram obtained by chromatographic analysis of a sample, but the present invention is applied to various analyzers other than a gas chromatograph device and a liquid chromatograph device. Can be done.
  • the mass spectrum obtained by a mass spectrometer the optical spectrum obtained by various spectrophotometers such as an absorption spectrophotometer and a fluorescence spectrophotometer, the ion mobility spectrum obtained by an ion mobility analyzer, and further.
  • the present invention is also used when peak detection is performed on various spectral waveforms such as an X-ray spectrum obtained by an X-ray analyzer, and compounds, molecules, and elements are identified and quantified based on the detected peaks. It is clear that can be applied.
  • the first aspect of the present invention is an analyzer that qualitatively or quantifies a target component contained in a sample by using a chromatogram or a spectrum obtained by performing a predetermined analysis on the sample.
  • Peak detection corresponding to the target component is performed on the chromatogram or spectrum obtained by a predetermined analysis of the sample, peak information of each peak is acquired, and accuracy is an index value indicating the certainty of the peak detection.
  • a peak detector that seeks information and A list of at least a part of the target component is displayed on the display unit, and the peak accuracy information detected in the peak detection unit corresponding to the target component included in the list, or obtained from the accuracy information.
  • a display processing unit that displays a list in which other information is associated with the target component, Is provided.
  • the operator efficiently confirms the peaks whose information is unreliable, and peak information is obtained as necessary. It can be fixed. As a result, it is possible to reduce the workload of the operator in qualitative analysis and quantitative analysis in the case of simultaneous analysis of multiple components, and to realize efficient analysis. Further, for example, when analyzing a chromatogram or a spectrum in which a large number of peaks are observed, the number of peaks to be confirmed by the operator is reduced, so that mistakes or oversights in the confirmation work can be prevented.
  • the peak detection unit can perform peak detection by utilizing the prior information of the target component. If the given analysis is a chromatographic analysis, the prior information of the component of interest can include standard retention times.
  • the range for peak detection (for example, the time range) can be limited, so that the accuracy of peak detection is improved.
  • a third aspect of the present invention further includes, in the first or second aspect, a quantitative analysis unit for obtaining a quantitative value of a target component corresponding to the peak based on the peak information obtained by the peak detection unit.
  • the display processing unit may describe the quantitative value obtained by the quantitative analysis unit in the list.
  • the operator can confirm the quantitative value for each component and the information of the peak detection accuracy together.
  • the display processing unit compares the accuracy information of the peak with a predetermined threshold value, and visually distinguishes the magnitude of the threshold value.
  • the accuracy information can be displayed in a way that is possible.
  • the operator determines at a glance whether the peak information is unreliable or highly reliable, and for example, easily selects and confirms only the waveform of the unreliable peak. be able to.
  • a fifth aspect of the present invention is that, in the fourth aspect, the visually recognizable aspect is to display a list narrowed down to those having low accuracy with respect to the threshold value. Can be done.
  • the data to be reconfirmed can be efficiently extracted, so that the work efficiency of the operator is further improved.
  • the display processing unit can sort the accuracy in the list.
  • the data to be reconfirmed can be efficiently extracted, so that the work efficiency of the operator is further improved.
  • a plurality of chromatograms are obtained for one target component in the predetermined analysis, and the peak detection unit has one purpose.
  • a peak is detected for each of a plurality of chromatograms for a component, and the display processing unit can display a plurality of peak accuracy information for each of the plurality of chromatograms for one target component. ..
  • a plurality of chromatograms are obtained for one target component in the predetermined analysis, and the peak detection unit is one.
  • a peak is detected for each of a plurality of chromatograms for a target component, and the display processing unit displays a representative value obtained from a plurality of peak accuracy information for each of the plurality of chromatograms for one target component.
  • the predetermined analysis is typically a chromatographic analysis using a photodiode array detector or the like capable of simultaneous detection of multiple wavelengths as a detector, or a tandem mass spectrometer. Chromatographic analysis used as a detector. Since multiple chromatograms can be obtained for one component (compound) with such an analyzer, the component that shows the highest peak detection accuracy, that is, the highly reliable peak, is used to quantify the component. It can be carried out.
  • the peak detection unit is machine learning using a plurality of chromatograms or spectra in which the start point and the end point of the peak are known.
  • a pre-built trained model is used to estimate peak information, including at least one of the start and end positions of one or more peaks appearing in a chromatogram or spectrum for the sample.
  • the accuracy information can be an index value indicating the accuracy of estimation of the peak information.
  • the ninth aspect of the present invention it is possible to efficiently confirm the reliability of the start point and the end point of the peak estimated by using the trained model.

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本発明の一態様である分析装置は、試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる成分の定性又は定量を行う分析装置であり、含有の有無を確認したい又は定量したい複数の目的成分の情報を利用して、目的試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部(120)と、目的成分の少なくとも一部のリストを表示部(13)に表示するものであって、ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部(140)、を備える。

Description

分析装置
 本発明は、試料に対する分析によって得られるクロマトグラム波形又はスペクトル波形を解析することで、該試料についての定性分析や定量分析を行う分析装置に関する。本発明に係る分析装置は例えば、ガスクロマトグラフ質量分析装置を含むガスクロマトグラフ(GC)装置、液体クロマトグラフ質量分析装置を含む液体クロマトグラフ(LC)装置、質量分析装置、分光分析装置(赤外吸光分光光度計、可視紫外分光光度計、蛍光分光光度計など)、X線分析装置(蛍光X線分析装置、X線回折分析装置など)、を含むものとする。
 ガスクロマトグラフ装置や液体クロマトグラフ装置では、各種の成分が含まれる試料をカラムに導入し、該試料がカラムを通過する過程で各種の成分を時間方向に分離して、カラムの出口に設けた検出器により検出する。検出器により得られた検出信号に基づいて作成されるクロマトグラムには、試料中の成分に対応するピークが現れる。そのピークが観測される時間(保持時間)は成分の種類に対応しているため、このピークの保持時間から成分を特定する、つまりは定性分析を行うことができる。また、ピークの高さや面積はその成分の濃度又は含有量に対応しているため、ピークの高さ値や面積値からその成分の濃度や含有量を求める、つまりは定量分析を行うことができる。
 定性分析や定量分析を行うには、クロマトグラム波形上でピークを的確に検出し、ピークの始点、終点の位置(時間)を確定する必要がある。実際のクロマトグラム波形では様々なノイズが重畳していたり、ベースラインが変動していたり、或いは複数の成分由来のピークが重なっていたりする。そのため、クロマトグラム波形からピークを的確に検出するのは必ずしも容易ではない。そのため、クロマトグラム波形からピークを検出するために、従来、様々なアルゴリズムが提案され、実用に供されている(特許文献1、2など参照)。また、最近では、クロマトグラム波形上のピーク検出に、ディープラーニングなどのAI(人工知能)を利用する試みも行われている。
特開2009-8582号公報 国際公開第2017/094170号パンフレット 特開2015-59782号公報
ウェイ・リウ(Wei Liu)、ほか6名、「SSD:シングル・ショット・マルチボックス・デテクタ(SSD: Single Shot Multibox Detector)」、[online]、[2019年4月18日検索]、arXiv.org、インターネット<URL: https://arxiv.org/pdf/1512.02325.pdf>
 上述したようにピーク検出には様々な手法があるものの、いずれのアルゴリズムを用いるにしても、様々な形状のクロマトグラムに対して常に的確なピーク検出が行えるとは限らない。そのため、一般に、自動的に検出されたピークの波形形状やその始点・終点をオペレータが表示画面上で確認し、必要に応じて、それをオペレータがマニュアル操作で修正するという作業が行われる(特許文献3等参照)。
 しかしながら、多成分一斉分析においては、百を超える数の化合物を同時に測定する場合もあり、その場合、クロマトグラム波形にはそれぞれ各化合物に対応する多数のピークが観測される。また、測定対象である試料の数が多く、得られるクロマトグラム波形の数が膨大になる場合もある。こうした場合、個々のクロマトグラム波形上の全てのピークをそれぞれオペレータが目視で確認しながら、的確なピーク検出が行われていないピークを見つけマニュアル操作で始点・終点を修正するという作業を行うと、膨大な時間を要してしまう。また、オペレータに対する作業負担も重く、不適切なピークを見逃す等の作業ミスを生じる大きな要因となる。
 なお、ガスクロマトグラフ装置や液体クロマトグラフ装置で得られるクロマトグラム上のピーク検出のみならず、質量分析装置で得られるマススペクトル上のピーク検出、分光分析装置で得られる吸光又は蛍光スペクトル上のピーク検出、X線分析装置で得られるX線強度スペクトル上のピーク検出などにおいても同様の問題が生じる。
 本発明はこうした課題を解決するために成されたものであり、その目的とするところは、オペレータによる、自動的なピーク検出処理によって検出されたピークの的確性の判断及びピークの修正作業の負担を軽減し、精度の高い定性分析や定量分析を効率的に行うことができる分析装置を提供することである。
 上記課題を解決するために成された本発明の一態様は、試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる目的成分の定性又は定量を行う分析装置であって、
 前記試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で前記目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部と、
 前記目的成分の少なくとも一部のリストを表示部に表示するものであって、前記ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部と、
 を備えるものである。
 本発明において、所定の分析とは例えば、液体クロマトグラフィやガスクロマトグラフィなどのクロマトグラフ分析、質量分析、イオン移動度分析、吸光分光分析や蛍光分光分析などの分光分析、X線分析などである。また、試料に含まれる成分とは、化合物、分子、又は元素などである。
 所定の分析がクロマトグラフ分析であって該分析によりクロマトグラムが得られる場合、本発明の一態様である分析装置において、ピーク検出部は例えば、予め定められた複数の目的成分の保持時間の情報を用い、クロマトグラム上で各目的成分に対応するピーク検出を行う。ピーク検出部は、例えば検出されたピークの波形形状に基づいて始点及び終点を含むピーク情報を求めるが、併せて、それら情報の推定の正確性を示す確度情報を求める。表示処理部は、各ピークの確度情報を受けて、目的成分の全て又は一部と、その目的成分に対応するピークの確度情報又は該確度情報から求まる他の情報とを、対応付けて記載した成分リストを作成して表示部に表示する。
 ここで、ピークの確度情報から求まる他の情報とは、例えば、指標値そのものを所定の閾値で以て判定した結果である二値の情報、指標値又は指標値が含まれる値の範囲に対応付けられているグラフィカルな情報(アイコンなど)などを含むものとすることができる。
 ピークの確度情報を数値で表示する場合、その数値が大きいときに確度が高い、数値が低いときに確度が高い、のいずれでもよい。また、ピーク確度情報をグラフィカルに表示する場合、確度が高いことを示す情報の形態は問わない。いずれの場合でも、オペレータつまりは人間が見たときに、良否を判断できるような態様や形態で表示しさえすればよい。
 例えばピークの確度情報である指標値が大きいときに確度が高いと定めた場合、表示処理部により表示部に表示される成分リストにおいて、上記指標値が低いものは高いものに比べて、ピークの始点や終点などのピーク情報が適切でない可能性が高い。そこで、オペレータは、表示された成分リストにおいてピークの確度情報又は該確度情報から求まる他の情報を順番に確認し、例えば確度の指標値が他よりも顕著に低い成分のみを選択して、その成分に対応して検出されているピークの波形形状を確認することができる。
 このように本発明に係る分析装置の一態様によれば、自動的に検出されたピークの中でその情報の信頼性が低いものを、オペレータが効率良く確認し、必要に応じてピーク情報を修正することができる。それにより、多成分一斉分析の際の定性分析や定量分析におけるオペレータの作業負担を軽減し、効率的な分析を実現することができる。また、例えば多数のピークが観測されるクロマトグラムやスペクトルを解析する際に、オペレータが確認すべきピークの数が減ることで確認作業のミスや見落としなどを防止することができる。
本発明の一実施形態であるLCシステム及び該システムに用いられる学習済みモデルを作成するシステムの概略構成図。 本実施形態のLCシステムにおいて使用される学習済みモデルを作成する際の処理の流れを示すフローチャート。 本実施形態のLCシステムにおけるピーク検出処理の流れを示すフローチャート。 本実施形態のLCシステムにおいて用いられる、ニューラルネットワークによる学習済みモデルを示す模式図 本実施形態のLCシステムにおいて用いられる学習済みモデルを作成する際の処理を説明するための模式図。 本実施形態のLCシステムにおいて学習済みモデルを用いたピーク検出処理を説明するための模式図。 本実施形態のLCシステムにおけるピーク自動検出処理によって求まるピークの始点・終点の候補の表示の一例を示す図。 本実施形態のLCシステムにおけるピーク自動検出処理によって求まるピークの始点・終点の候補の一例を示す図。 本実施形態のLCシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの一例を示す図。 図9に示した化合物リストをピーク検出確度の小さい順にソートしたときの一例を示す図。 本実施形態のLCシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの他の例を示す図。 本実施形態のLCシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの他の例を示す図。 本実施形態のLCシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの他の例を示す図。
 以下、本発明に係る分析装置の一実施形態であるLCシステムについて、添付の図面を参照して詳細に説明する。
 図1は、本実施形態のLCシステム及び該システムに用いられる学習済みモデルを作成するシステムの概略構成図である。
 このLCシステム1は、LC測定部10、データ解析部11、操作部12、及び表示部13を備える。LC測定部10は図示しないが、送液ポンプ、インジェクタ、カラム、カラムオーブン、検出器などを含み、与えられた試料についてのLC分析を実行し、検出器で得られる信号強度の時間的な変化を示すクロマトグラムデータを取得する。検出器の種類や方式は特に問わないが、例えば質量分析装置、フォトダイオードアレイ(PDA)検出器などを用いることができる。
 データ解析部11は、データ収集部110、ピーク検出処理部120、定性・定量解析部130、結果表示処理部140、ピーク検出結果修正処理部150などの機能ブロックを含む。ピーク検出処理部120はさらに、画像生成部121、ピーク位置推定部122、学習済みモデル記憶部123、ピーク決定部124などの機能ブロックを含む。
 データ解析部11において、データ収集部110はLC測定部10で得られたクロマトグラムデータを収集しこれを記憶する。ピーク検出処理部120は、収集されたクロマトグラムデータに基づくクロマトグラム波形においてピークを自動的に検出し、検出したピークの始点及び終点の位置(保持時間)、及びピーク検出の確からしさの指標値である検出確度を含むピーク情報を出力する。定性・定量解析部130は、ピーク検出処理部120から与えられたピーク情報に基づいて、各ピークに対応する成分(化合物)を同定したり、ピーク高さ値やピーク面積値を計算し、その値から各成分の濃度又は含有量である定量値を算出したりする。結果表示処理部140は、算出された定量値や各ピークの検出確度の情報を受けて、それらを所定の形式で表示部13に表示する。ピーク検出結果修正処理部150は、操作部12を介したオペレータの操作に応じて、ピーク検出処理部120で検出されたピークの情報を修正する。
 図1において、LCシステム1とは別に設けられているモデル作成部2は、学習データ入力部20、画像生成部21、学習実行部22、及びモデル構築部23を機能ブロックとして含む。このモデル作成部2において作成される学習済みモデルが、LCシステム1のデータ解析部11における学習済みモデル記憶部123に格納される。
 なお、通常、データ解析部11の実体は、所定のソフトウェアがインストールされたパーソナルコンピュータやより性能の高いワークステーション、或いは、そうしたコンピュータと通信回線を介して接続された高性能なコンピュータを含むコンピュータシステムである。即ち、データ解析部11に含まれる各ブロックの機能は、コンピュータ単体又は複数のコンピュータを含むコンピュータシステムに搭載されているソフトウェアを実行することで実施される、該コンピュータ又はコンピュータシステムに記憶されている各種データを用いた処理によって具現化されるものとすることができる。
 次に、ピーク検出処理部120において実施されるピーク検出処理について詳細に説明する。
 ごく概略的にいうと、このピーク検出処理部120では、クロマトグラム波形(クロマトグラムカーブ)を2次元画像に変換したうえで、その画像上に存在する物体のカテゴリーと位置とを検出する機械学習の一手法であるディープラーニング(Deep Learning)の手法を用いることによって、ピークの始点及び終点の位置を検出している。
 [学習済みモデルの作成]
 よく知られているように、機械学習法では、多数の学習データを用いて学習済みモデルを予め構築しておく必要がある。上述したように、この学習済みモデルの構築の作業は、LCシステム1の一部であるデータ解析部11において行われるのではなく、別のコンピュータシステムにより構成されるモデル作成部2で実施され、その結果が学習済みモデル記憶部123に格納される。それは、一般に学習済みモデルの構築作業は多量のデータを処理するために計算量が膨大であり、かなり高性能で且つ画像処理に対応したコンピュータが必要であるためである。図2は、モデル作成部2において行われる学習済みモデル作成時の処理の流れを示すフローチャートである。
 学習済みモデルを作成する際には、多数の多様なクロマトグラム波形データを用意すると共に、その各クロマトグラム波形に現れている一又は複数のピークの始点及び終点の保持時間を正確に求めておく。ここでいう多様なクロマトグラム波形データとは、実際にピーク検出を実施する際のクロマトグラム波形に現れる可能性がある、様々なノイズの混入、ベースラインの変動(ドリフト)、複数のピークの重なり、或いは、ピーク形状の変形、などの要素を含むクロマトグラム波形である。学習データ入力部20は、この多数のクロマトグラム波形データとピーク始点・終点を含む正確なピーク情報とのセットを学習データとして読み込む(ステップS1)。
 画像生成部21は、時系列信号であるクロマトグラム波形データに基づいてクロマトグラムを作成し、時間経過に伴う信号強度の変化を示すクロマトグラム波形(クロマトグラムカーブ)を所定の画素数の2次元画像に変換する(ステップS2)。ここでは一例として、画素数は512×512であるものとする。この画像変換の際に、クロマトグラム波形上のピークの中で信号強度が最大であるピークのピークトップが矩形状の画像の上辺に一致するように、その波形のy方向のサイズを規格化する。また、クロマトグラム波形の全測定時間範囲又は一部の測定時間範囲(例えばユーザにより指示された測定時間範囲)が矩形状の画像のx方向(横方向)の長さに一致するように、その波形のx方向のサイズを規格化する(ステップS3)。なお、x方向のサイズを規格化する際に、データ点数が512画素に満たない場合には適宜アップサンプリングし、元データに沿う高解像度波形に変換してもよい。
 画像生成部21は、ステップS1で読み込まれた全てのクロマトグラム波形データについて同様に画像に変換する。クロマトグラム波形の規格化を伴う画像化の処理によって元のクロマトグラム波形の強度情報や時間情報は失われ、波形形状を表す画像が生成されることになる。なお、ステップS1において全てのデータを読み込んでからステップS2~S3の処理を実行するのではなく、ステップS1におけるデータの読み込みを行いながら、すでに読み込まれたデータについてステップS2~S3による画像化を行ってもよいことは当然である。
 また画像生成部21は、クロマトグラム波形データとセットになっているピーク情報を、上述した画像化に際してのx方向、y方向の規格化、つまりはクロマトグラム波形の伸縮に応じて、画像上の位置情報つまりはx方向及びy方向の画素位置の情報に変換する(ステップS4)。
 次に、学習実行部22は、上記のようにして学習データであるクロマトグラム波形から生成された多数の画像を用いた機械学習を実施し、モデル構築部23はその学習結果に基づき、クロマトグラム波形上のピークの始点及び終点を推定するための学習モデルを構築する。周知のように機械学習には様々なアルゴリズムがあるが、ここでは画像認識における一般物体検知アルゴリズムの一つであるディープラーニングを用い、その中でも特に画像認識に優れているSSD法を用いる(ステップS5)。
 SSD法は、ディープラーニングの中では最も広く利用されている畳み込みニューラルネットワーク(CNN)を用いた手法の一つであり、現時点では最も高速で且つ高い認識精度を実現可能なアルゴリズムである。SSD法は、リウ(Liu Wei)らにより非特許文献1で提案されたものであり、そのアルゴリズムの詳細については非特許文献1等に詳細に説明されているので、ここでは本実施形態における特徴点についてのみ述べる。
 一般的なSSD法では、2次元的な画像内で物体が存在している部分を推測するためにCNNにより抽出した画像特徴マップ(feature map)を使用するが、その画像特徴マップを少しずつ畳み込んでいくことにより様々なサイズ(画素数)の画像特徴マップを利用している。これによって様々な大きさの物体領域候補を検出することができる。これに対し、ここで検出したいのはピークの始点及び終点のx方向の位置である。そこで、x方向の様々な大きさの区間内に存在するピークの始点及び終点を検出するようにアルゴリズムを変更している。
 図4は、本実施例で用いられるニューラルネットワークによる学習済みモデルを示す模式図である。また図5は学習済みモデルを作成する際の処理を説明するための模式図である。図5に示しているように、ここでは、上記ステップS2~S3の処理で生成された画像のx方向の長さ全体の幅のウインドウを持つセグメントSg1を設定し、次に、セグメントSg1のウインドウを半分に分割したウインドウ幅が1/2であるセグメントSg2、Sg3を設定する。同様にして、セグメントSg2、Sg3のウインドウをそれぞれ半分に分割したウインドウ幅が元の1/4である4個のセグメントSg4、Sg5、Sg6、Sg7を設定する、という操作を繰り返し、全部で120個のセグメントSg1~Sg120を定める。この各セグメントがCNNにより画像特徴マップを抽出する単位であり、学習データとしての画像に基づいてこの単位毎にピークの始点及び終点で決まるピーク範囲を学習する。
 この学習モデルにおけるニューラルネットワークでは、図4に示すように、入力層に設けられた262144個のノードのそれぞれに512×512画素の画像における各画素の画素値が入力される。図4においてpxnは1枚の画像におけるn番目の画素を示す。なお、画像がカラー又は複数色である場合には、画素毎に例えば三原色の各色の画素値が入力されるため、入力層のノード数は例えば3倍になる。
 学習実行部22では、多数の画像に基づく上記のような入力に対しディープラーニングによって多数の中間層から成る層構造のネットワークが学習され、最終的な出力層に設けられた600個のノードからそれぞれ数値情報が出力される。この600個のノードから出力される情報は、120個のセグメントSg1~Sg120のそれぞれについて算出される、ピーク検出の確度(confidence)confn、そのセグメントのウインドウの左端からピーク始点までのx方向のオフセット量xsn、入力画像の下端からピーク始点までのy方向のオフセット量ysn、そのセグメントのウインドウの右端からピーク終点までのx方向のオフセット量xen、入力画像の下端からピーク終点までのy方向のオフセット量yen、という5次元の情報である。図5中では1番目のセグメントSg1に対する上記5次元の情報を{conf1, xs1, ys1, xe1, ye1}として示している。ここでは、ピーク検出の確度はピーク範囲とウインドウとの重なりの長さで定義し、その値の範囲は0~1である。
 図5の例ではクロマトグラム波形に二つのピークが存在する。前半のピークの始点の画素位置は(xs_a, ys_a)、終点の画素位置は(xe_a, ye_a)であり、そのピーク範囲はAである。一方、後半のピークの始点の画素位置は(xs_b, ys_b)、終点の画素位置は(xe_b, ye_b)であり、ピーク範囲はBである。この場合、セグメントSg1におけるxs1、ys1、xe1、及びye1は図6中に示すようになる。また、confはSg1のウインドウの幅とピーク範囲Aとの重なりに応じた計算値である。上述したように学習データにおけるピークの始点・終点の画素位置やピーク範囲は既知であるから、多数の学習データについて正解にできるだけ一致するように学習を行って各中間層におけるネットワーク重みを算出しつつモデルを構築する。
 モデル構築部23はこうして多数の学習データを用いてディープラーニングを行うことで求めた学習モデルを一旦保存する(ステップS6)。LCシステム1において学習済みモデル記憶部123には、モデル作成部2において上述したように作成された学習モデルが例えば通信回線を介して伝送され格納される。
 [目的試料に対するピーク検出処理]
 次に、LCシステム1のデータ解析部11で実行される、目的試料に対して得られたクロマトグラム波形上のピークの検出処理を説明する。図3はピーク検出処理部120において行われるピーク検出処理の流れを示すフローチャートである。
 まず、画像生成部121は処理対象であるクロマトグラム波形データをデータ収集部110から読み込む(ステップS11)。そして、読み込んだデータに対し、モデル作成部2の画像生成部21で実行されたステップS2~S3によるクロマトグラム波形データの画像化と同様のステップS12~S13の処理を実行することにより、クロマトグラムカーブを含む512×512画素の画像を生成する。
 目的試料中に含まれるかどうかを確認したい成分や、含まれている場合にはその量を知りたい成分が予め決められている場合、それら目的成分の標準的な保持時間は予め分かっている。そこで、各目的成分の標準的な保持時間の付近の所定の時間範囲でクロマトグラム波形を切り出し、その切り出されたクロマトグラム波形からクロマトグラムカーブを含む画像を生成すればよい。これにより、クロマトグラム上で、目的成分に対応するピークを検出することができる。一方、標準的な保持時間が不明である、未知成分を検出したい或いは、既知の目的成分と未知成分と併せて検出したい場合には、時間範囲を限定せず、全測定時間範囲のクロマトグラム波形に対してピーク検出を実行すればよい。
 なお、LC測定部10の検出器が質量分析装置である場合、通常、検出対象の質量電荷比が予め分かっている既知成分については選択イオンモニタリング(SIM)測定又は多重反応モニタリング(MRM)測定で検出し、未知成分についてはスキャン測定で検出される。
 ピーク位置推定部122は、生成された画像の各画素の画素値に、学習済みモデル記憶部123に格納されている学習済みモデルを適用して120個のセグメント毎の上記5次元の情報を取得する。即ち、画像内でピークの始点及び終点と推測される画素位置の情報をピーク検出確度と共に取得する(ステップS14)。
 図6はピーク検出結果の一例を示す図である。ここでは、セグメント毎に{confn, xsn, ysn, xen, yen}(ただしnは1~120)が求まるため、多くの場合、一つのピークに対し複数のセグメントで、ピーク検出の確度が0でない{confn, xsn, ysn, xen, yen}が得られる。なお、一般にピーク検出の確度confnが低いものは信頼性に乏しい。そこで、この例では算出されたconfnが所定値(ここでは0.5)以下である場合に、その5次元のピーク情報は有用でないとみなして{0, 0, 0, 0, 0}としているが、そうした確度による取捨選択を行わずに全ての結果を利用するようにしてもよい。
 上述したように一般的に、一つのピークに対し始点・終点の位置がピーク検出確度と共に複数得られる。つまり、一つの成分に対しピークの候補が複数存在する。そこで、ピーク決定部124は、成分毎に、その成分に対応する複数のピーク始点・終点の中でピーク検出確度が最も高いものが正解であると推定し、そのピークの始点・終点の情報を選択してピーク検出結果として出力する(ステップS15)。
 また、単にピーク検出確度の大きさに基づいて、正解であると推定されるピーク情報を選択するのではなく、ピーク決定部124は次のような処理を実施してもよい。
 いま、一つのピークに対してピーク始点・終点の候補が複数ある場合、始点、終点毎に、時間軸上でのピーク検出確度の変化を確度分布として捉えグラフ化する。このグラフは線グラフでもよいしヒートマップ等でもよい。例えば複数の点に対して適宜のフィッティングを行って確度分布曲線を求めると、その点の中でピーク検出確度が最大である点で確度分布曲線が極大値をとるとは限らず、そのピーク検出確度が最大である点の近傍で確度分布曲線が極大値をとることがある。その場合、その極大値をとる位置(時間)のほうがピーク始点又は終点として妥当であると考えられる。そこで、確度分布曲線が極大値をとる位置をピーク始点又は終点とすればよい。またそのときの極大値をピーク検出確度とすればよい。
 定性・定量解析部130は上記ピーク検出結果を受け、各成分に対応するピーク毎に、ピーク始点及び終点の間の時間範囲内で信号強度が最大である(つまりはピークトップに対応する)時間又はピーク重心に対応する時間を求め、これを当該ピークの代表的な保持時間(検出RT)とする。また、そのピーク毎にピーク面積値(又は高さ値)を計算する。さらに、算出されたピーク面積値を予め取得しておいた検量線に照らして、目的成分の濃度や含有量である定量値を算出する(ステップS16)。各成分に対応するピーク毎に求めた上記検出RTを、後述する図9~図13に示した化合物リスト中に表示するようにしてもよい。
 [化合物リストの表示]
 結果表示処理部140は、成分毎のピーク検出結果、及び成分毎の定量値算出結果に基づいて、化合物リストを作成して表示部13の画面上に表示する(ステップS17)。
 図9はこのときに表示される化合物リストの一例である。図9において、「化合物名」は各化合物の名称であり、「R.T.」は標準的な保持時間又は実測の保持時間である。
 目的試料中に既知の成分が含まれるかどうかを確認したい場合や、既知の成分の含有量を知りたい場合には、化合物リストはそうした既知の成分のリストである。この場合、目的試料に対する実測で得られたクロマトグラム上のピーク検出は、この化合物リストに掲載されている化合物に対して実行される。一方、未知成分についての定性や定量も行う場合(又は全ての成分が未知である場合)には、上述したように全測定時間範囲についてピーク検出が実施され、検出されたピークについて成分が同定されれば化合物名が付与され、成分が同定されなければ「Unknown」の成分として、化合物リストが作成される。成分が「Unknown」である場合、化合物リスト中の「化合物名」の欄には「Unknown」と表示するほか、空欄としたり「*」等を表示したりしてもよい。また、「R.T.」の欄は空欄としたり「*」等を表示したりしてもよいし、定性・定量解析部130で求まった検出RTを表示してもよい。
 図9に示した化合物リスト中の「定量値」の列は、定性・定量解析部130により算出された定量値である。ピーク波形は同じであってもピーク検出処理部120で求められた始点・終点の位置が変わるとピーク面積値が変わるから、当然、定量値も変わることになる。そのため、ピークの始点・終点の位置が適切でないと定量値も不正確である。正確な定量値を得るには、ピーク検出処理部120で得られたピークの始点・終点を適切に修正する必要がある。従来のLCシステムでは、どの化合物に対応するピークの始点・終点が不適切であるのかをオペレータが把握するために、そのオペレータはクロマトグラム上のピーク波形を一つずつ表示画面上で確認する必要があった。そのため、化合物の数が多いとその作業は非常に煩雑で時間を要していた。
 これに対し、本実施形態のLCシステムでは、ピーク検出処理の過程で算出されたピーク検出の確度confnの値を、化合物リスト中の各化合物に対応して「ピーク検出確度」の列に掲載している。図9の例では、名称が「Comp C」である化合物のピーク検出確度は0.90と高いが、名称が「Comp B」である化合物のピーク検出確度は0.64と相対的に低くなっている。ここでは、このピーク検出確度の数値が低いほど、定量値の信頼性は低いと推測できる。そこで、オペレータは表示された化合物リストを確認し、ピーク検出確度の数値が他よりも顕著に低い成分に対応する定量値の信頼性が低いと判断する。
 図9では、化合物リスト中の化合物の並びが保持時間の順序になっているが、ピーク検出確度の列のヘッダの操作子をクリック操作することで、化合物をピーク検出確度の降順又は昇順にソートすることができる。図10は、ピーク検出確度の小さい順にソートした結果を示す図である。このようにソートすることで、信頼性が低い化合物を容易に抽出することができる。
 上述したようにオペレータは化合物リスト中のピーク検出確度の数値から、定量値の信頼性が低い化合物を選択し、その化合物について検出されているピーク波形を確認したり必要に応じてそのピーク情報を修正したりする。具体的には、化合物リストにおいて確認したい化合物名又は定量値の欄等を操作部12によりクリック操作すると、ピーク検出結果修正処理部150は、該化合物について検出されているクロマトグラム上のピーク波形を別のウインドウに表示する。図8は一つの化合物に対するピーク波形の表示の一例である。
 この例では、一つの化合物に対応するピークについて、ピーク位置推定部122で推定されたピークの始点の位置を丸印、終点の位置を三角印で示すとともに、ピーク決定部124で選択された(ピーク検出確度が最大である)始点・終点を黒色の塗りつぶしで、それ以外を白抜きで示している。また、吹き出し表示中の括弧()内の先頭の数値がピーク検出確度(0~1の範囲)であり、それに続く数値はピーク始点の時間及び強度の情報である。ここでは、比較の際に最も重要であるピーク検出確度の数値を、他の数値よりも目立つように太字で示している。
 オペレータは表示部13の画面上で、こうしたピーク波形と検出されたピークの始点・終点の位置とを目視で確認する。そして、オペレータは、操作部12によりピークの始点・終点を適宜変更する操作を行い、再解析を指示する。ピーク検出結果修正処理部150はこの指示を受けて、変更後の始点・終点の位置に基づきピーク面積値を再計算し、さらに定量値を算出する。
 このようにして、本実施形態のLCシステムでは、オペレータはクロマトグラム上のピーク波形を一つずつ表示画面上で確認することなく、定量値の信頼性が乏しいと推測できる化合物に対応するピーク波形のみを確認し、必要に応じてピーク始点・終点を修正することができる。
 なお、化合物リストには、各化合物に対応するさらに別の情報を加えてもよい。例えば、LC測定部10の検出器が質量分析装置である場合には対応するm/zを加えてもよいし、検出器がPDA検出器である場合には対応する波長を加えてもよい。また、保持時間は標準的な保持時間と実測の保持時間との両方を表示してもよい。
 [化合物リストの表示の変形例]
 上記ステップS17で表示部13に表示される化合物リストは、以下に述べるように様々な形態に変更することができる。
 例えば図9に示したような化合物リストにおいて、ピーク検出確度が高いものと低いものとの視覚的な識別性を向上させるために、ピーク検出確度の数値に応じて、又はその数値範囲に応じて、文字のフォント、文字の色、文字の明度、文字の大きさ、文字の太さなどを変えるようにしてもよい。また、ピーク検出確度の数値が予め決めた閾値を下回るものに対し、吹き出し表示でピークの修正を促すテキスト(例えば「要修正」、「要確認」)情報を表示するようにしてもよいし、逆に、ピーク検出確度の数値が予め決めた閾値以上であるものに対し、吹き出し表示でピークが適切であることを示すテキスト(例えば「適正」、「確認不要」)情報を表示するようにしてもよい。
 また、このときに表示する化合物リストには、存在の有無の確認対象である又は定量の対象である目的化合物全てを掲載するのではなく、ピークの修正や確認が必要である、ピーク検出確度の数値が所定の閾値を下回る化合物のみに絞って掲載するようにしてもよい。図12は、こうした絞り込み機能を持たせた化合物リストの表示例である。
 この場合、絞り込み条件として閾値が指定されないときには、図9と同様に、全ての目的化合物を掲載しておく。そして、オペレータが閾値の数値を入力すると、ピーク検出確度がその閾値以上である化合物をリストから除外し、残りの、つまりはピーク検出確度が閾値を下回る化合物のみが掲載された化合物リストを表示する。これにより、オペレータはこのリストにある化合物についてのみ、対応するピーク波形を確認すればよい。
 また、図9及び図12の例では、オペレータはピーク検出確度が低いことを把握できるものの、ピーク検出確度が低い理由については分からない。そこで、ピーク検出確度が他よりも低くなっている要因として推定される事項を、吹き出し表示等で表示するようにしてもよい。具体的には、一つの化合物に対応付けられているピークの始点や終点の位置のばらつきが大きい、隣接するピークと重なっている可能性がある、ベースラインの傾きが大きい、等の要因候補を表示すればよい。これらの要因は、上述したピーク検出の過程で推定することが可能なものである。
 また、上記実施形態のLCシステムでは、一つのクロマトグラム波形上でピークを検出しているので、一つの成分に対してピーク波形は一つであることを前提としていたが、LC測定部10の検出器がPDA検出器である場合や質量分析装置(特にトリプル四重極型質量分析装置や四重極-飛行時間型質量分析装置などのタンデム型質量分析装置)である場合には、一つの化合物に対して、互いに異なる波長における、又は互いに異なる質量電荷比(MRMトランジション)における複数のクロマトグラムが得られるのが一般的である。そのため、一つの化合物に対する複数のクロマトグラムそれぞれについて、ピーク始点・終点を含むピーク情報とピーク検出確度とが得られる。
 例えば、LC測定部10の検出器がタンデム型質量分析装置である場合、定量イオンと一又は複数の確認イオンとについてそれぞれ抽出イオンクロマトグラム(慣用的にマスクロマトグラムという)が得られるから、一つの化合物に対して少なくとも二以上のピーク情報が得られる。そこで、その場合には、図11に示すように、異なるクロマトグラムに対して得られた複数のピーク検出確度を全て表示するようにしてもよい。もちろん、図11に示したように、始めから複数のピーク検出確度を表示するのではなく、定量値の算出に使用されたピークに関するピーク検出確度のみを表示しておき、例えばその表示欄をクリック操作したりマウスオーバーしたりすることで、それ以外のピークに関するピーク検出確度が表示されるようにしてもよい。
 また、一つの化合物に対して二以上のピーク情報が得られる場合に、化合物リスト中のピーク検出確度の数値として、その複数のピークに関するピーク検出確度から求めた代表値、例えば、最大値、最小値、平均値、中央値等の統計値を用いてもよい。また、例えばオペレータが化合物リスト中のピーク検出確度の欄やその横に付加されているアイコンなどをクリック操作する毎に、表示する数値を順番に変更するようにしてもよい。
 また、ピーク検出確度の数値を表示する代わりに、数値や数値範囲に対応した適宜のアイコンなどを表示してもよい。また、より簡略化して、ピーク検出確度が閾値以上であるものを「○」又は「1」、閾値を下回るものを「×」又は「0」とした、いわゆる二値で表示するようにしてもよい。
 さらにまた、図13に示すように、ピーク検出確度の数値とともに、そのピーク検出確度に対応する概略のピーク波形を、吹き出し表示やポップアップ画面などで表示するようにしてもよい。これによって、オペレータは、より簡便に概略のピーク波形を確認することができる。
 [そのほかの変形例]
 また、上記実施形態のLCシステムでは、化合物リストの表示の態様のほかに、様々な変形が可能である。
 具体的には、上記実施形態では、ピーク検出の手法としてディープラーニングを用いていたが、それ以外の機械学習の手法を用いてもよいし、機械学習以外の方法でもよい。例えば、機械学習以外の方法としては、検出したピークの左右対称性を評価したシンメトリ係数をピーク確度の情報として付与することが考えられる。重要であるのは、ピーク検出の過程で、そのピーク検出の信頼性を示す情報が得られることである。
 また、上記実施形態は、試料に対するクロマトグラフィ分析により得られたクロマトグラム上でピーク検出を行う例であるが、本発明は、ガスクロマトグラフ装置や液体クロマトグラフ装置以外の様々な分析装置に適用することができる。
 例えば、質量分析装置で得られるマススペクトル、吸光分光光度計や蛍光分光光度計などの各種の分光分析装置で得られる光学的なスペクトル、イオン移動度分析装置で得られるイオン移動度スペクトル、さらにはX線分析装置で得られるX線スペクトルなどの、各種のスペクトル波形上でピーク検出を行い、検出されたピークに基づいて化合物、分子、元素を同定したり定量したりする場合にも、本発明を適用できることは明らかである。
 さらにまた、上記実施形態や各種の変形例に限らず、本発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは明らかである。
 [種々の態様]
 以上、図面を参照して本発明における実施形態を説明したが、最後に、本発明の種々の態様について説明する。
 本発明の第1の態様は、試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる目的成分の定性又は定量を行う分析装置であって、
 前記試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で前記目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部と、
 前記目的成分の少なくとも一部のリストを表示部に表示するものであって、前記ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部と、
 を備えるものである。
 本発明の第1の態様によれば、ピーク検出部において自動的に検出されたピークの中で、その情報の信頼性が低いものを、オペレータが効率良く確認し、必要に応じてピーク情報を修正することができる。それにより、多成分一斉分析の際の定性分析や定量分析におけるオペレータの作業負担を軽減し、効率的な分析を実現することができる。また、例えば多数のピークが観測されるクロマトグラムやスペクトルを解析する際に、オペレータが確認すべきピークの数が減ることで確認作業のミスや見落としなどを防止することができる。
 本発明の第2の態様は、第1の態様において、前記ピーク検出部は、前記目的成分の事前情報を利用してピーク検出を行うものとすることができる。所定の分析がクロマトグラフ分析である場合、目的成分の事前情報は標準保持時間を含むものとすることができる。
 本発明の第2の態様によれば、ピーク検出を行う範囲(例えば時間範囲)を限定することができるので、ピーク検出の精度が向上する。
 本発明の第3の態様は、第1又は第2の態様において、前記ピーク検出部で得られたピーク情報に基づいて該ピークに対応する目的成分の定量値を求める定量分析部、をさらに備え、前記表示処理部は、前記定量分析部で得られた定量値を前記リスト中に記載するものとすることができる。
 本発明の第3の態様によれば、オペレータは、成分毎の定量値とピーク検出確度の情報とを併せて確認することができる。
 本発明の第4の態様は、第1~第3の態様のいずれか一つにおいて、前記表示処理部は、前記ピークの確度情報を所定の閾値と比較し、該閾値に対する大小の識別が視覚的に可能な態様で該確度情報を表示するものとすることができる。
 本発明の第4の態様によれば、オペレータは、ピーク情報の信頼性が低いものと高いものとを一目で判断し、例えば、信頼性が低いピークの波形のみを容易に選択して確認することができる。
 本発明の第5の態様は、第4の態様において、前記識別が視覚的に可能な態様とは、前記閾値に対して確度が低いものを絞り込んだリストを表示することであるものとすることができる。
 本発明の第5の態様によれば、再確認すべきデータを効率よく抽出することができるので、オペレータの作業効率が一層向上する。
 本発明の第6の態様は、第1~第5の態様のいずれか一つにおいて、前記表示処理部は、前記リストにおいて確度に関するソートが可能であるものとすることができる。
 本発明の第6の態様によれば、第5の態様と同様に、再確認すべきデータを効率よく抽出することができるので、オペレータの作業効率が一層向上する。
 本発明の第7の態様は、第1~第6の態様のいずれか一つにおいて、前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報を表示するものとすることができる。
 また本発明の第8の態様は、第1~第7の態様のいずれか一つにおいて、前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報から求まる代表値を表示するものとすることができる。
 第7及び第8の態様において、所定の分析は、典型的には、多波長同時検出が可能であるフォトダイオードアレイ検出器などを検出器として用いたクロマトグラフィ分析、又は、タンデム型質量分析装置を検出器として用いたクロマトグラフィ分析である。こうした分析装置では、一つの成分(化合物)に対して複数のクロマトグラムが得られるから、その中で最も高いピーク検出確度を示す、つまりは信頼性が高いピークを用いて、該成分の定量を行うことができる。
 また本発明の第9の態様は、第1~第8の態様のいずれか一つにおいて、前記ピーク検出部は、ピークの始点及び終点が既知である複数のクロマトグラム又はスペクトルを用いた機械学習によって予め構築された学習済みモデルを使用して、前記試料についてのクロマトグラム又はスペクトルに現れる一又は複数のピークの始点の位置又は終点の位置の少なくとも一方を含むピーク情報を推定するものであり、前記確度情報は、該ピーク情報の推定の確からしさを示す指標値であるものとすることができる。
 本発明の第9の態様によれば、学習済みモデルを使用して推定されたピークの始点と終点の信頼性を効率よく確認することができる。
1…LCシステム
10…LC測定部
11…データ解析部
110…データ収集部
120…ピーク検出処理部
121…画像生成部
122…ピーク位置推定部
123…学習済みモデル記憶部
124…ピーク決定部
130…定性・定量解析部
140…結果表示処理部
150…ピーク検出結果修正処理部
12…操作部
13…表示部
2…モデル作成部
20…学習データ入力部
21…画像生成部
22…学習実行部
23…モデル構築部

Claims (9)

  1.  試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる目的成分の定性又は定量を行う分析装置であって、
     前記試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で前記目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部と、
     前記目的成分の少なくとも一部のリストを表示部に表示するものであって、前記ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部と、
     を備える、分析装置。
  2.  前記ピーク検出部は、前記目的成分の事前情報を利用してピーク検出を行う、請求項1に記載の分析装置。
  3.  前記ピーク検出部で得られたピーク情報に基づいて該ピークに対応する目的成分の定量値を求める定量分析部、をさらに備え、前記表示処理部は、前記定量分析部で得られた定量値を前記リスト中に記載する、請求項1に記載の分析装置。
  4.  前記表示処理部は、前記ピークの確度情報を所定の閾値と比較し、該閾値に対する大小の識別が視覚的に可能な態様で該確度情報を表示する、請求項1に記載の分析装置。
  5.  前記識別が視覚的に可能な態様とは、前記閾値に対して確度が低いものを絞り込んだリストを表示することである、請求項4に記載の分析装置。
  6.  前記表示処理部は、前記リストにおいて確度に関するソートが可能である、請求項1に記載の分析装置。
  7.  前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報を表示する、請求項1に記載の分析装置。
  8.  前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報から求まる代表値を表示する、請求項1に記載の分析装置。
  9.  前記ピーク検出部は、ピークの始点及び終点が既知である複数のクロマトグラム又はスペクトルを用いた機械 学習によって予め構築された学習済みモデルを使用して、前記試料についてのクロマトグラム又はスペクトルに現れる一又は複数のピークの始点の位置又は終点 の位置の少なくとも一方を含むピーク情報を推定するものであり、前記確度情報は該ピーク情報の推定の確からしさを示す指標値である、請求項1に記載の分析装置。
PCT/JP2019/018338 2019-05-08 2019-05-08 分析装置 WO2020225864A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2021518242A JP7108136B2 (ja) 2019-05-08 2019-05-08 分析装置
US17/600,892 US20220196615A1 (en) 2019-05-08 2019-05-08 Analyzer
EP19928242.7A EP3968016A4 (en) 2019-05-08 2019-05-08 ANALYSIS DEVICE
CN201980095563.4A CN113711031B (zh) 2019-05-08 2019-05-08 分析装置
PCT/JP2019/018338 WO2020225864A1 (ja) 2019-05-08 2019-05-08 分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/018338 WO2020225864A1 (ja) 2019-05-08 2019-05-08 分析装置

Publications (1)

Publication Number Publication Date
WO2020225864A1 true WO2020225864A1 (ja) 2020-11-12

Family

ID=73051458

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/018338 WO2020225864A1 (ja) 2019-05-08 2019-05-08 分析装置

Country Status (5)

Country Link
US (1) US20220196615A1 (ja)
EP (1) EP3968016A4 (ja)
JP (1) JP7108136B2 (ja)
CN (1) CN113711031B (ja)
WO (1) WO2020225864A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021240993A1 (ja) * 2020-05-28 2021-12-02 株式会社島津製作所 ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230137741A1 (en) * 2021-11-01 2023-05-04 Matterworks Inc Methods and compositions for analyte quantification

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0694696A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd クロマトグラム解析方法及びクロマトグラフ装置
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
JP2004085356A (ja) * 2002-08-27 2004-03-18 Shimadzu Corp 分析装置及び分析システム
JP2009008582A (ja) 2007-06-29 2009-01-15 Shimadzu Corp クロマトグラムデータ処理装置
US20120116689A1 (en) * 2010-11-04 2012-05-10 Agilent Technologies, Inc. Peak correlation and clustering in fluidic sample separation
US20140158879A1 (en) * 2010-04-15 2014-06-12 Micromass Uk Limited Method And System Of Identifying A Sample By Analysing A Mass Spectrum By The Use Of A Bayesian Inference Technique
JP2015059782A (ja) 2013-09-18 2015-03-30 株式会社島津製作所 波形処理支援方法および波形処理支援装置
WO2017002156A1 (ja) * 2015-06-29 2017-01-05 株式会社島津製作所 分析結果出力処理装置及び分析結果出力処理用プログラム
WO2017094170A1 (ja) 2015-12-03 2017-06-08 株式会社島津製作所 ピーク検出方法及びデータ処理装置
WO2019092837A1 (ja) * 2017-11-09 2019-05-16 富士通株式会社 波形解析装置
JP2019086475A (ja) * 2017-11-09 2019-06-06 富士通株式会社 学習プログラム、検出プログラム、学習方法、検出方法、学習装置および検出装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0486030B1 (en) * 1990-11-16 1997-01-15 Shimadzu Corporation Fraction purity measuring apparatus for chromatogram peak
JP6324029B2 (ja) 2013-11-14 2018-05-16 株式会社ハーマン 加熱調理器用の温度検出装置
JP6226823B2 (ja) * 2014-06-12 2017-11-08 株式会社日立ハイテクノロジーズ クロマトグラフ質量分析装置及びその制御方法
WO2018207228A1 (ja) * 2017-05-08 2018-11-15 株式会社島津製作所 クロマトグラフ質量分析データ処理装置及びクロマトグラフ質量分析データ処理用プログラム
CN111373256B (zh) * 2017-11-09 2022-07-22 株式会社岛津制作所 波形分析装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0694696A (ja) * 1992-09-17 1994-04-08 Hitachi Ltd クロマトグラム解析方法及びクロマトグラフ装置
JPH06324029A (ja) * 1993-03-15 1994-11-25 Hitachi Ltd クロマトグラム解析表示方法及びその装置
JP2004085356A (ja) * 2002-08-27 2004-03-18 Shimadzu Corp 分析装置及び分析システム
JP2009008582A (ja) 2007-06-29 2009-01-15 Shimadzu Corp クロマトグラムデータ処理装置
US20140158879A1 (en) * 2010-04-15 2014-06-12 Micromass Uk Limited Method And System Of Identifying A Sample By Analysing A Mass Spectrum By The Use Of A Bayesian Inference Technique
US20120116689A1 (en) * 2010-11-04 2012-05-10 Agilent Technologies, Inc. Peak correlation and clustering in fluidic sample separation
JP2015059782A (ja) 2013-09-18 2015-03-30 株式会社島津製作所 波形処理支援方法および波形処理支援装置
WO2017002156A1 (ja) * 2015-06-29 2017-01-05 株式会社島津製作所 分析結果出力処理装置及び分析結果出力処理用プログラム
WO2017094170A1 (ja) 2015-12-03 2017-06-08 株式会社島津製作所 ピーク検出方法及びデータ処理装置
WO2019092837A1 (ja) * 2017-11-09 2019-05-16 富士通株式会社 波形解析装置
JP2019086475A (ja) * 2017-11-09 2019-06-06 富士通株式会社 学習プログラム、検出プログラム、学習方法、検出方法、学習装置および検出装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "MS Quant Manager", REIFYCS, June 2014 (2014-06-01), pages 1 - 2, XP055846905, Retrieved from the Internet <URL:https://ja.reifycs.com/files/BrochureMsQuantManager.pdf> [retrieved on 20190724] *
KANAZAWA, MITSUHIRO ET AL.: "Automatic MS Chromatographic Peak Detection using Al", THE 65TH ANNUAL CONFERENCE ON MASS SPECTROMETRY , JAPAN, 1 May 2017 (2017-05-01), JP, XP009521444 *
KEN KOSOEGAWA, YUSUKE HIDA, YUJI KANAZAWA, YUZURU YAMAKAGE, SHINJI KANAZAWA, KUNIZAWA KENDAI, HIDETOSHI TERADA, HIROYUKI YASUDA, Y: "Automatic Peak Picking Methods by Deep Learning for High-Volume Chromatogram Processing (1) - Algorithm Development", THE 11TH METABOLOME SYMPOSIUM; NOVEMBER 13TH TO 14TH, 2017, 24 July 2019 (2019-07-24) - 14 November 2017 (2017-11-14), XP009530396 *
SHINJI KANAZAWA, KUNIZAWA KENDAI, HIDETOSHI TERADA, HIROYUKI YASUDA, YOHEI YAMADA, SHIGEKI KAJIWARA, NORIO MUKAI, JUNKO IIDA, KEN : "Automatic Peak Picking Methods by Deep Learning for High-Volume Chromatogram Processing (2) - Performance Evaluation", THE 11TH METABOLOME SYMPOSIUM; NOVEMBER 13TH TO 14TH, 2017, 22 July 2019 (2019-07-22) - 14 November 2017 (2017-11-14), XP009530398 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021240993A1 (ja) * 2020-05-28 2021-12-02 株式会社島津製作所 ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム

Also Published As

Publication number Publication date
EP3968016A4 (en) 2022-04-27
JPWO2020225864A1 (ja) 2021-10-21
US20220196615A1 (en) 2022-06-23
CN113711031A (zh) 2021-11-26
EP3968016A1 (en) 2022-03-16
JP7108136B2 (ja) 2022-07-27
CN113711031B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
JP6872034B2 (ja) 波形解析装置
JP6992817B2 (ja) 波形解析装置
JP6245387B2 (ja) 3次元スペクトルデータ処理装置及び処理方法
JP2011191222A (ja) 質量分析データ処理方法及び装置
WO2020225864A1 (ja) 分析装置
JP6132073B2 (ja) 包括的2次元クロマトグラフ用データ処理装置
WO2018008149A1 (ja) クロマトグラフ質量分析用データ処理装置
JP6439878B2 (ja) 分析データ解析装置及び分析データ解析用プログラム
JP5315025B2 (ja) スペクトル解析および表示
JP2016095253A (ja) クロマトグラフ質量分析データ処理装置
JP7334788B2 (ja) 波形解析方法及び波形解析装置
JP2018040655A (ja) 質量分析用データ処理装置
WO2020194827A1 (ja) 試料測定装置および測定パラメータ解析方法
WO2018158801A1 (ja) スペクトルデータの特徴抽出装置および方法
US20230280316A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
JP5206544B2 (ja) クロマトグラフ用データ処理装置
CN116519861A (zh) 解析装置及解析方法
JP7414125B2 (ja) 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置
US20230195279A1 (en) Viewer for analysis, display system, display method, and display program
JP2023128342A (ja) 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム
JP4839248B2 (ja) 質量分析システム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19928242

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021518242

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019928242

Country of ref document: EP

Effective date: 20211208