KR102407112B1 - System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling - Google Patents

System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling Download PDF

Info

Publication number
KR102407112B1
KR102407112B1 KR1020200080530A KR20200080530A KR102407112B1 KR 102407112 B1 KR102407112 B1 KR 102407112B1 KR 1020200080530 A KR1020200080530 A KR 1020200080530A KR 20200080530 A KR20200080530 A KR 20200080530A KR 102407112 B1 KR102407112 B1 KR 102407112B1
Authority
KR
South Korea
Prior art keywords
trace
analysis
deep learning
data
pollutants
Prior art date
Application number
KR1020200080530A
Other languages
Korean (ko)
Other versions
KR20220001972A (en
Inventor
조경화
전준호
박종관
백상수
장지이
Original Assignee
울산과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산과학기술원 filed Critical 울산과학기술원
Priority to KR1020200080530A priority Critical patent/KR102407112B1/en
Publication of KR20220001972A publication Critical patent/KR20220001972A/en
Application granted granted Critical
Publication of KR102407112B1 publication Critical patent/KR102407112B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

본 발명은 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시킬 수 있도록 한 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법에 관한 것으로, 고해상도 질량분석기에서 산출된 High resolution mass spectrum을 기반으로 하여 데이터를 수집, 구축하고 2차원, 3차원으로 시각화하여 미량 오염 물질 DB를 구축하는 데이터 수집 및 분석부;상기 데이터 수집 및 분석부에서 분석된 경향을 기초로 내부표준물질과 유사한 변화를 보이는 특성 인자를 추출하는 변화 인자 추출부;상기 변화 인자 추출부에서 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 딥러닝 기반 측정 모델 구축부;상기 딥러닝 기반 측정 모델 구축부에서 구축된 측정 모델을 적용하여 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 측정 모델 검증부;를 포함하는 것이다.The present invention relates to an apparatus and method for precise detection of trace pollutants through deep learning-based modeling that can improve the accuracy of measuring the concentration of trace pollutants in environmental samples without an internal standard, and a high resolution mass spectrum calculated by a high-resolution mass spectrometer. Data collection and analysis unit that collects and builds data based on the two-dimensional and three-dimensional visualization to build a trace pollutant DB; Changes similar to internal standards based on the trends analyzed in the data collection and analysis unit A change factor extracting unit for extracting a characteristic factor showing It includes; a measurement model verification unit that predicts and verifies the concentration of trace pollutants in an environmental sample without an internal standard by applying the model.

Description

딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법{System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling}System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modeling}

본 발명은 오염물질 검출에 관한 것으로, 구체적으로 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시킬 수 있도록 한 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법에 관한 것이다.The present invention relates to the detection of contaminants, and more particularly, to an apparatus and method for precise detection of trace contaminants through deep learning-based modeling that can improve the accuracy of measuring the concentration of trace contaminants in environmental samples without an internal standard material.

산업의 고도화로 유해화학물질의 종류와 사용량이 날로 증가하고 있는 반면, 현행 모니터링 시스템은 사고예방을 목적으로 설치되어 유해 화학물질에 대한 감시 체계 및 발생원에 대한 추적시스템의 기능은 실제 어려운 상황이다.While the types and usage of hazardous chemicals are increasing day by day due to the advancement of the industry, the current monitoring system is installed for the purpose of preventing accidents, so the functions of the monitoring system and the tracking system for the source of hazardous chemicals are actually difficult.

전 세계적으로 246,000종 이상의 화학물질이 사용되는 것으로 알려져 있고, 국내에서 사용되는 화학물질도 4만종 이상에 이르며, 매년 400여종의 새로운 화학물질이 수입되거나 국내에서 유통되고 있다.It is known that more than 246,000 chemical substances are used worldwide, and there are more than 40,000 chemical substances used in Korea, and about 400 new chemical substances are imported or distributed in Korea every year.

이들 화학물질 중 중금속류, VOCs, 농약류 등은 수계로 배출되는 경우, 각종 질환과 발암, 내분비계 장애(Endocrine Disrupters, EDs)등 사람 건강은 물론 수생태 환경에 직,간접적으로 커다란 위해를 줄 우려가 있기 때문에 우리나라에서는 하천, 호소 및 해역에 대한 수질환경기준을 설정하고 있으며, 이와 같은 수질기준을 달성하기 위한 수질규제기준을 설정하고 있다.Heavy metals, VOCs, pesticides, etc. of these chemicals may cause serious direct or indirect harm to human health as well as the aquatic environment, such as various diseases, carcinogenesis, and endocrine disorders (EDs), when discharged into the water system. Therefore, in Korea, water quality environmental standards are set for rivers, lakes and sea areas, and water quality regulation standards are established to achieve such water quality standards.

특히, 산업폐수의 경우에는 수질오염물질 항목 및 특정수질유해물질 항목으로 산업폐수로부터 배출될 수 있는 오염물질을 규정하고 각 항목에 대한 폐수배출허용기준을 설정하여 산업폐수에 의해 배출가능성이 있는 각종 오염물질을 관리하고 있다.In particular, in the case of industrial wastewater, pollutants that can be discharged from industrial wastewater are stipulated as water pollutants and specific water quality hazardous substances, and wastewater discharge standards are established for each item, and various types of wastewater that may be discharged by industrial wastewater are set. contaminants are managed.

한편, 미량오염물질이란 ng/L에서 μg/L 또는 이보다 더 낮은 농도로 수중에 존재하는 오염물질들을 말하며, 미량오염물질 제어기술이란 인체 또는 생태계에 악영향을 미칠 수 있는 이와 같은 오염물질들을 무해화 시키는 기술이라고 할 수 있다.On the other hand, trace pollutants refer to pollutants present in water at concentrations ranging from ng/L to μg/L or lower. It can be said that it is a technique that makes

최근에는 기기분석의 발달로 극미량의 농도까지 검출이 가능하게 되어 새로운 미량의 환경오염물질들의 존재가 확인되고 있다. 인체에도 심각한 영향을 미치는 것으로 알려진 과불화합물(Perfluorinated compounds)외에도, 내분비계 장애물질의 작용과 유래가 유사한 미량오염물질로 인체용 및 동물용 의약품(Pharmaceuticals), 화장품 등의 일용품(Personal Care Products) 등이 거론되고 있으며, 이들은 하천이나 하수처리장 방류수 등에서 검출되고 있어 새로운 환경오염물질로 주목을 받고 있다.Recently, with the development of device analysis, it is possible to detect even trace concentrations, and the existence of new trace amounts of environmental pollutants is confirmed. In addition to perfluorinated compounds, which are known to have a serious impact on the human body, they are trace contaminants similar in origin to the action of endocrine system obstruction substances. etc. are being discussed, and they are being detected as new environmental pollutants in rivers and sewage treatment plant effluent.

의약품류를 포함한 대부분의 이러한 오염물질들은 주로 하폐수처리장으로부터 환경중으로 배출되고 있으며, 이들은 저농도에서 특이적으로 작용하기 때문에 매우 광범위한 수생태계에 악영향을 미칠 가능성이 있다.Most of these pollutants, including pharmaceuticals, are mainly discharged into the environment from wastewater treatment plants, and since they specifically act at low concentrations, they have the potential to adversely affect a very wide range of aquatic ecosystems.

이와 같은 미량오염물질의 정밀 분석을 위해서는 측정된 농도가 정확한지에 대한 검증이 필요하다.For precise analysis of such trace pollutants, it is necessary to verify whether the measured concentration is accurate.

현재까지 분석 기술에서 미량오염물질을 정밀 분석할 수 있는 가장 신뢰성 있는 방법은 측정되는 물질에 대한 기준이 될 수 있는 내부표준물질(internal standard: IS)를 넣어서 확인하는 방법이다.Until now, the most reliable method for precise analysis of trace pollutants in analysis technology is to check by inserting an internal standard (IS) that can be a standard for the material to be measured.

그러나 IS는 주로 동위원소를 이용하고 고가 (e.g., 수십에서 수백만원 가량)이며, 많은 물질을 분석하려면 그만큼의 비용이 증가하게 된다.However, IS mainly uses isotopes and is expensive (e.g., about tens to millions of won), and the cost increases to analyze many substances.

또한, 중요 생물 대사체 및 환경변환물질 등 표준물질을 상업적으로 구할 수 없는 경우도 많아 미량오염물질을 정밀 분석할 수 있는 신뢰성 높은 새로운 기술의 개발이 요구되고 있다.In addition, there are many cases where standard substances such as important biological metabolites and environmental change substances cannot be obtained commercially, so the development of a new reliable technology capable of precisely analyzing trace pollutants is required.

대한민국 공개특허 제10-2016-0101238호Republic of Korea Patent Publication No. 10-2016-0101238 대한민국 공개특허 제10-2020-0014048호Republic of Korea Patent Publication No. 10-2020-0014048

본 발명은 종래 기술의 오염물질 검출 및 분석 기술의 문제점을 해결하기 위한 것으로, 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시킬 수 있도록 한 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법을 제공하는데 그 목적이 있다.The present invention is to solve the problems of the contaminant detection and analysis technology of the prior art, and precise detection of trace contaminants through deep learning-based modeling to improve the accuracy of measuring the concentration of trace contaminants in environmental samples without an internal standard material It is an object to provide an apparatus and method.

본 발명은 수질 정보 및 물질 자료를 기반으로 분석 값을 보정해 주는 모델을 만들어 신뢰성 및 경제성을 높일 수 있도록 한 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법을 제공하는데 그 목적이 있다.An object of the present invention is to provide an apparatus and method for precise detection of trace pollutants through deep learning-based modeling that can increase reliability and economic efficiency by creating a model that corrects analysis values based on water quality information and material data.

본 발명은 정밀분석 시간을 단축시켜 화학사고 발생 시 즉각적으로 대응이 가능하도록 할 뿐만 아니라, 오염물질의 지속적인 모니터링을 가능하게 하여 지능적이고 강화된 정수처리 공정 개발에 기여할 수 있도록 한 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법을 제공하는데 그 목적이 있다.The present invention is a deep learning-based modeling that not only shortens the precise analysis time to enable immediate response in the event of a chemical accident, but also enables continuous monitoring of contaminants, thereby contributing to the development of an intelligent and enhanced water treatment process. An object of the present invention is to provide an apparatus and method for precise detection of trace pollutants through

본 발명은 고가의 내부표준물질을 대체하여 비용을 절감할 수 있으며, 시료 분석 및 결과 해석에 소요되는 노동시간 단축에 기여할 수 있도록 한 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법을 제공하는데 그 목적이 있다.The present invention provides an apparatus and method for precise detection of trace contaminants through deep learning-based modeling, which can reduce costs by replacing expensive internal standard materials and contribute to reduction of labor time required for sample analysis and result interpretation but it has a purpose.

본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.Other objects of the present invention are not limited to the above-mentioned objects, and other objects not mentioned will be clearly understood by those skilled in the art from the following description.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치는 고해상도 질량분석기에서 산출된 High resolution mass spectrum을 기반으로 하여 데이터를 수집, 구축하고 2차원, 3차원으로 시각화하여 미량 오염 물질 DB를 구축하는 데이터 수집 및 분석부;상기 데이터 수집 및 분석부에서 분석된 경향을 기초로 내부표준물질의 변화와 유사한 특징을 보이는 특성 인자를 추출하는 변화 인자 추출부;상기 변화 인자 추출부에서 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 딥러닝 기반 측정 모델 구축부;상기 딥러닝 기반 측정 모델 구축부에서 구축된 측정 모델을 적용하여 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 측정 모델 검증부;를 포함하는 것을 특징으로 한다.In order to achieve the above object, the device for precise detection of trace pollutants through deep learning-based modeling according to the present invention collects and builds data based on the high resolution mass spectrum calculated by the high-resolution mass spectrometer, and performs two-dimensional, three-dimensional A data collection and analysis unit that visualizes and builds a trace pollutant DB; A change factor extractor that extracts a characteristic factor showing characteristics similar to the change of an internal standard material based on the trend analyzed by the data collection and analysis unit; The A deep learning-based measurement model construction unit that builds a measurement model based on the characteristic factors investigated by the change factor extraction unit; Micro contamination of environmental samples without internal standard materials by applying the measurement model built in the deep learning-based measurement model construction unit It characterized in that it comprises a; measurement model verification unit for predicting and verifying the concentration of the substance.

여기서, 상기 데이터 수집 및 분석부는 미량 오염 물질 DB를 구축하기 위하여, 기존 유해물질 모니터링을 하여 DB를 구축하는 기존 유해물질 모니터링 DB 구축부와,신종 유해물질 모니터링을 하여 DB를 구축하는 신종 유해물질 모니터링 DB 구축부와,미지 물질 모니터링을 하여 미지 물질 DB를 구축하는 미지 물질 DB 구축부를 포함하는 것을 특징으로 한다.Here, the data collection and analysis unit monitors the existing hazardous substances to build the DB in order to establish the trace pollutant DB, and the new hazardous substances monitoring DB constructs the DB by monitoring the new hazardous substances It is characterized in that it includes a DB construction unit, and an unknown substance DB construction unit that constructs an unknown substance DB by monitoring the unknown substance.

그리고 상기 데이터 수집 및 분석부에서 구해진 High resolution mass spectrum 데이터로부터 미량 오염물질 측정에 필요한 내부물질을 대신할 후보 영역(candidate subset)을 산출하고 미량오염물질 농도와 후보 영역(candidate subset)의 3차원 Peak를 정량화 하여 비교하여 mass spectrum에서 IS 대체 후보 영역(candidate subset)을 선정하는 것을 특징으로 한다.And, from the high resolution mass spectrum data obtained by the data collection and analysis unit, a candidate subset is calculated to replace the internal material required for the measurement of trace pollutants, and a three-dimensional peak of the trace pollutant concentration and candidate region is calculated. It is characterized by selecting a candidate subset of IS from the mass spectrum by quantifying and comparing them.

그리고 상기 딥러닝 기반 측정 모델 구축부는, 상기 데이터 수집 및 분석부에서 선정된 IS 대체 후보 영역(candidate subset)과 High resolution mass spectrum, 미량오염물질 모니터링 농도 데이터를 기반으로 Convolutional Neural Network를 이용하여 미량오염물질 측정 모델 구축을 위한 모델 학습을 진행하여 IS를 사용하지 않고 Mass spectrum 만으로 미량 오염물질을 측정이 가능하도록 하는 것을 특징으로 한다.In addition, the deep learning-based measurement model building unit uses a convolutional neural network based on the IS candidate subset selected by the data collection and analysis unit, high resolution mass spectrum, and trace pollutant monitoring concentration data. It is characterized in that it is possible to measure trace pollutants only by mass spectrum without using IS by learning the model for building the material measurement model.

그리고 상기 딥러닝 기반 측정 모델 구축부는, 수질 정보 및 물질 자료를 기반으로 분석 값을 보정해 주는 모델을 만들어 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시키는 것을 특징으로 한다.And the deep learning-based measurement model building unit, based on the water quality information and material data, it is characterized in that it improves the accuracy of measuring the concentration of trace pollutants in the environmental sample without an internal standard material by creating a model that corrects the analysis value.

그리고 상기 데이터 수집 및 분석부는 미량 오염 물질 DB를 구축하기 위하여, 지정된 기존의 모니터링의 결과와 유해물질 유입 가능성을 파악하여 대상지점을 설정 후 모니터링을 실시하는 대상지점 설정 모니터링부와,현장시료를 측정 검증하여 미량 오염물질의 특성을 분석하는 현장시료 검증부와,현장시료에서 산출된 MS 데이터를 이용하여 빅데이터로 산출하고, 산출된 데이터는 딥러닝 기반 미량오염물질 측정 및 예측 모델 구축에 이용할 수 있도록 하는 현장시료 빅데이터 생성부를 포함하는 것을 특징으로 한다.In addition, the data collection and analysis unit establishes a trace pollutant DB, a target point setting monitoring unit that sets a target point by identifying the results of designated existing monitoring and the possibility of influx of hazardous substances, and then performs monitoring; and a field sample measurement The on-site sample verification unit that verifies and analyzes the characteristics of trace pollutants, and the MS data calculated from the field sample is used to calculate big data, and the calculated data can be used for deep learning-based trace pollutant measurement and prediction model construction. It is characterized in that it includes a field sample big data generation unit to make it possible.

그리고 상기 데이터 수집 및 분석부는 추정 및 비표적 분석을 위하여, 시료 내 잔류가 예상되는 물질들에 대한 고유의 exact mass, 이온화 과정을 포함하는 추정 리스트를 작성하고, 고분해능 질량분석기를 통해 추출된 데이터로부터 추정리스트를 기반으로 한 물질들이 지니는 고유의 exact mass와 유사한 accurate mass, 동위원소 패턴 일치여부, MS/MS fragments 비교 분석 및 구조 분석 등을 통하여 대상물질을 잠정적으로 확인하는 것을 특징으로 한다.In addition, the data collection and analysis unit prepares an estimation list including the specific exact mass and ionization process for substances expected to remain in the sample for estimation and non-target analysis, and creates an estimation list from the data extracted through high-resolution mass spectrometer. It is characterized in that the target material is tentatively identified through an accurate mass similar to the intrinsic exact mass of the materials based on the estimated list, whether the isotope pattern matches, comparative analysis of MS/MS fragments, and structural analysis.

그리고 비표적 분석은 사전정보 없이 예상하지 못했거나 미지물질들을 확인하는 분석으로 추출된 데이터로부터 유의미한 피크를 선정한 다음 분자식을 할당하고, 해당 피크의 MS/MS fragment 데이터를 통한 비교 및 분자 구조 분석을 통하여 할당된 분자식에 대한 후보물질들 중 가장 유력한 물질을 최종적으로 확인하는 것을 특징으로 한다.And non-target analysis is an analysis that identifies unexpected or unknown substances without prior information, selects a significant peak from the extracted data, assigns a molecular formula, and compares and analyzes the molecular structure through MS/MS fragment data of the peak. It is characterized in that the most likely substance is finally identified among the candidates for the assigned molecular formula.

그리고 할당된 분자식에 대한 후보물질 선정시 ChemSpider, Pubchem의 화학물질 관련 데이터베이스가 이용되고, MS/MS fragment 비교 분석은 MassBank, mzCloud의 MS/MS fragment 데이터베이스가 이용되고, 분자 구조 분석은 metFrag 와 같은 MS/MS fragment 예측 시스템을 통하여 확인하는 것을 특징으로 한다.And when selecting a candidate for the assigned molecular formula, ChemSpider and Pubchem's chemical-related databases are used, MS/MS fragment comparison analysis uses MS/MS fragment databases of MassBank and mzCloud, and molecular structure analysis uses MS such as metFrag It is characterized by checking through the /MS fragment prediction system.

그리고 상기 딥러닝 기반 측정 모델 구축부는, 계층의 특징 추출을 위한 합성곱 계층 pooling 단계와 분류나 예측을 위한 fully-connected 단계로 구성되는 CNN을 이용하고, 입력데이터에서 내부표준물질의 변화와 유사한 특징을 보이는 부분을 CNN모델을 이용하여 추출하고, 필터의 크기, 개수, 구조, 보폭과 패딩, 활성화 함수의 요소들을 최적화하여 구축된 측정 모델은 학습을 통해 후보범위들 중 내부표준물을 대체할 수 있는 부분을 찾는 것을 특징으로 한다.And the deep learning-based measurement model building unit uses a CNN consisting of a convolutional layer pooling step for layer feature extraction and a fully-connected step for classification or prediction, and features similar to changes in internal standard materials in input data The measurement model constructed by extracting the part showing It is characterized by finding the part where there is.

그리고 상기 데이터 수집 및 분석부는 고분해능 질량분석기를 이용한 표적분석을 표준물질을 통하여 실시하고, 표준물질을 이용한 대상물질의 정량검정곡선 작성은 0.1 ng/L에서 2,000 ng/L의 범위에 대하여 작성하고, R2 0.995 이상의 정확도를 갖도록 하고, 기기분석 간 시료 분석에 대한 정확도와 재현성을 평가하기 위하여, 대상물질의 표준물질 혼합액을 이용하여 상대표준편차(RSD, Relative standard deviation)과 check standard 분석을 통하여 평가하는 것을 특징으로 한다.And the data collection and analysis unit performs target analysis using a high-resolution mass spectrometer through the standard material, and the quantitative calibration curve of the target material using the standard material is prepared in the range of 0.1 ng/L to 2,000 ng/L, R 2 In order to have an accuracy of 0.995 or higher, and to evaluate the accuracy and reproducibility of sample analysis between device analyzes, it is evaluated through RSD (Relative standard deviation) and check standard analysis using a standard material mixture of the target material. characterized in that

다른 목적을 달성하기 위한 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법은 고해상도 질량분석기에서 산출된 High resolution mass spectrum을 기반으로 하여 데이터를 수집, 구축하고 2차원, 3차원으로 시각화하여 미량 오염 물질 DB를 구축하는 데이터 수집 및 분석 단계;분석된 경향을 기초로 내부표준물질의 변화와 유사한 특징을 보이는 특성 인자를 조사하는 인자 조사 단계;조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 단계;적용된 측정 모델을 기반으로 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 확인 단계;를 포함하는 것을 특징으로 한다.The method for precise detection of trace pollutants through deep learning-based modeling according to the present invention for achieving another object collects and builds data based on the high resolution mass spectrum calculated by a high-resolution mass spectrometer, and visualizes it in 2D and 3D data collection and analysis step to build a trace pollutant DB by doing so; factor investigation step to investigate characteristic factors that show characteristics similar to changes in internal standard materials based on the analyzed trends; build a measurement model based on the investigated characteristic factors and a confirmation step of predicting and verifying the concentration of trace pollutants in an environmental sample without an internal standard material based on the applied measurement model.

여기서, 상기 데이터 수집 및 분석 단계에서 미량 오염 물질 DB를 구축하기 위하여, 기존 유해물질 모니터링을 하여 DB를 구축하는 기존 유해물질 모니터링 DB 구축 및 신종 유해물질 모니터링을 하여 DB를 구축하는 신종 유해물질 모니터링 DB 구축 및 미지 물질 모니터링을 하여 미지 물질 DB를 구축하는 미지 물질 DB 구축을 수행하는 것을 특징으로 한다.Here, in order to establish the trace pollutant DB in the data collection and analysis step, the existing hazardous substance monitoring DB is established by monitoring the existing hazardous substances and the new hazardous substance monitoring DB is constructed by monitoring the new hazardous substances It is characterized in that the unknown substance DB construction is performed to build the unknown substance DB by building and monitoring the unknown substance.

그리고 상기 데이터 수집 및 분석 단계에서 구해진 High resolution mass spectrum 데이터로부터 미량 오염물질 측정에 필요한 내부물질을 대신할 후보 영역(candidate subset)을 산출하고 미량오염물질 농도와 후보 영역(candidate subset)의 3차원 Peak를 정량화 하여 비교하여 mass spectrum에서 IS 대체 후보 영역(candidate subset)을 선정하는 것을 특징으로 한다.Then, from the high resolution mass spectrum data obtained in the data collection and analysis step, a candidate subset to replace the internal material required for the measurement of trace contaminants is calculated, and a three-dimensional peak of the trace contaminant concentration and candidate region is calculated. It is characterized by selecting a candidate subset of IS from the mass spectrum by quantifying and comparing them.

그리고 상기 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 단계에서, 상기 데이터 수집 및 분석 단계에서 선정된 IS 대체 후보 영역(candidate subset)과 High resolution mass spectrum, 미량오염물질 모니터링 농도 데이터를 기반으로 Convolutional Neural Network를 이용하여 미량오염물질 측정 모델 구축을 위한 모델 학습을 진행하여 IS를 사용하지 않고 Mass spectrum 만으로 미량 오염물질을 측정이 가능하도록 하는 것을 특징으로 한다.And in the step of building a measurement model based on the investigated characteristic factors, convolutional based on the IS candidate subset, high resolution mass spectrum, and trace pollutant monitoring concentration data selected in the data collection and analysis step It is characterized in that it is possible to measure trace pollutants only by mass spectrum without using IS by conducting model learning to build a trace pollutant measurement model using a neural network.

그리고 상기 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 단계에서, 계층의 특징 추출을 위한 합성곱 계층 pooling 단계와 분류나 예측을 위한 fully-connected 단계로 구성되는 CNN을 이용하고, 입력데이터에서 내부표준물질의 변화와 유사한 특징을 보이는 부분을 CNN모델을 이용하여 추출하고, 필터의 크기, 개수, 구조, 보폭과 패딩, 활성화 함수의 요소들을 최적화하여구축된 측정 모델은 학습을 통해 후보범위들 중 내부표준물을 대체할 수 있는 부분을 찾는 것을 특징으로 한다.And in the step of building a measurement model based on the investigated characteristic factors, a CNN consisting of a convolutional layer pooling step for layer feature extraction and a fully-connected step for classification or prediction is used, and The measurement model constructed by extracting the part showing characteristics similar to the change of the standard material using the CNN model and optimizing the filter size, number, structure, stride and padding, and the elements of the activation function is selected from among the candidate ranges through learning. It is characterized by finding a part that can replace the internal standard.

이상에서 설명한 바와 같은 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법은 다음과 같은 효과가 있다.As described above, the apparatus and method for precise detection of trace pollutants through deep learning-based modeling according to the present invention have the following effects.

첫째, 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시킬 수 있도록 한다.First, it is possible to improve the accuracy of measuring the concentration of trace pollutants in environmental samples without an internal standard material.

둘째, 수질 정보 및 물질 자료를 기반으로 분석 값을 보정해 주는 모델을 만들어 신뢰성 및 경제성을 높일 수 있도록 한다.Second, it is possible to increase reliability and economic efficiency by creating a model that corrects the analysis value based on water quality information and material data.

셋째, 정밀분석 시간을 단축시켜 화학사고 발생 시 즉각적으로 대응이 가능하도록 할 뿐만 아니라, 오염물질의 지속적인 모니터링을 가능하게 하여 지능적이고 강화된 정수처리 공정 개발에 기여할 수 있도록 한다.Third, it not only enables immediate response in the event of a chemical accident by shortening the precise analysis time, but also enables continuous monitoring of contaminants, thereby contributing to the development of an intelligent and enhanced water treatment process.

넷째, 고가의 내부표준물질을 대체하여 비용을 절감할 수 있으며, 시료 분석 및 결과 해석에 소요되는 노동시간 단축에 기여할 수 있도록 한다.Fourth, it is possible to reduce costs by replacing expensive internal standard materials, and to contribute to the reduction of labor time required for sample analysis and interpretation of results.

도 1은 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치의 구성도
도 2는 인공지능 기반 미량오염물질 농도 검출을 위한 상세 구성도
도 3은 데이터 수집 및 분석을 통한 미량 오염 물질 DB 구축부의 상세 구성도
도 4는 신종,미지 물질 빅데이터화 과정을 나타낸 구성도
도 5는 본 발명에 따른 표적 분석 및 비표적 분석 과정을 나타낸 플로우 차트
도 6a내지 도 6d는 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치에 적용되는 딥러닝 기술의 개요를 나타낸 구성도
도 7은 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법을 나타낸 플로우 차트
1 is a block diagram of an apparatus for precisely detecting micro-contaminants through deep learning-based modeling according to the present invention;
2 is a detailed configuration diagram for detecting the concentration of trace pollutants based on artificial intelligence.
3 is a detailed configuration diagram of a trace pollutant DB construction unit through data collection and analysis;
4 is a block diagram showing the process of converting new and unknown substances into big data
5 is a flowchart illustrating a target analysis and a non-target analysis process according to the present invention;
6a to 6d are diagrams showing the outline of deep learning technology applied to the device for precise detection of trace pollutants through deep learning-based modeling according to the present invention;
7 is a flowchart illustrating a method for precise detection of trace pollutants through deep learning-based modeling according to the present invention;

이하, 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법의 바람직한 실시 예에 관하여 상세히 설명하면 다음과 같다.Hereinafter, a preferred embodiment of the apparatus and method for precisely detecting trace pollutants through deep learning-based modeling according to the present invention will be described in detail as follows.

본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법의 특징 및 이점들은 이하에서의 각 실시 예에 대한 상세한 설명을 통해 명백해질 것이다.Features and advantages of the apparatus and method for precise detection of trace pollutants through deep learning-based modeling according to the present invention will become apparent through the detailed description of each embodiment below.

도 1은 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치의 구성도이다.1 is a block diagram of an apparatus for precisely detecting micro-contaminants through deep learning-based modeling according to the present invention.

본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치 및 방법은 수질 정보 및 물질 자료를 기반으로 분석 값을 보정해 주는 모델을 만들어 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시킬 수 있도록 한 것이다.The apparatus and method for precise detection of trace pollutants through deep learning-based modeling according to the present invention creates a model that corrects analysis values based on water quality information and material data, thereby improving the accuracy of measuring the concentration of trace pollutants in environmental samples without internal standards. that could be improved.

이를 위하여 본 발명은 Orbitrap Mass data를 수집하여 이의 물질별 경향을 분석하여 미량오염물질 농도 측정 정확도를 높이기 위한 표준화된 데이터 DB를 구축하는 구성을 포함할 수 있다.To this end, the present invention may include a configuration of constructing a standardized data DB for collecting orbitrap mass data and analyzing the trends for each material to increase the accuracy of measuring the concentration of trace pollutants.

본 발명은 내부 표준물질과 유사한 변화를 일으키는 특성 인자를 조사하여 조사한 특성 인자를 측정 모델에 적용하여 미량오염물질의 농도를 측정하는 구성을 포함할 수 있다.The present invention may include a configuration for measuring the concentration of trace pollutants by examining a characteristic factor that causes a change similar to an internal standard material and applying the investigated characteristic factor to a measurement model.

이와 같이 본 발명은 질량 스펙트럼 데이터와 딥러닝 기술을 이용하여 미량 오염 물질의 검출을 위한 제한적인 분석 방법을 대체하기 위한 것이다.As described above, the present invention is to replace the limited analysis method for detecting trace contaminants using mass spectral data and deep learning technology.

일반적으로 검출대상 피크의 스펙트럼 외의 다른 자연 유기 물질(NOM)의 질량 스펙트럼들은 대부분 사용할 수 없는 것으로 간주되어 버려져왔다. In general, mass spectra of natural organic matter (NOM) other than the spectrum of the peak to be detected have been mostly discarded as unusable.

본 발명은 딥러닝 기술의 하나인 합성곱 신경망(Convolutional Neural Network; CNN)을 이용하여 지금까지 버려져 온 대량의 NOM 데이터로부터 의미있는 결과를 도출하여 이를 이용하여 환경시료의 미량오염물질 농도 측정 정확도를 향상시킬 수 있도록 한 것이다.The present invention derives meaningful results from a large amount of NOM data that has been discarded so far using a convolutional neural network (CNN), which is one of the deep learning technologies, and uses it to measure the concentration of trace pollutants in environmental samples. that could be improved.

본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치는 Orbitrap Mass data를 수집하여 물질별 경향을 분석하는 데이터 수집 및 분석부(10)와, 데이터 수집 및 분석부(10)에서 분석된 경향을 기초로 내부표준물질과 유사한 변화를 일으키는 특성 인자를 추출하는 변화 인자 추출부(20)와, 변화 인자 추출부(20)에서 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 딥러닝 기반 측정 모델 구축부(30)와, 딥러닝 기반 측정 모델 구축부(30)에서 구축된 측정 모델을 적용하여 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 측정 모델 검증부(40)를 포함한다.The device for precise detection of trace pollutants through deep learning-based modeling according to the present invention is a data collection and analysis unit 10 that collects Orbitrap mass data and analyzes trends for each material, and the data collection and analysis unit 10 analyzes the A deep learning-based measurement that builds a measurement model based on the change factor extraction unit 20, which extracts a characteristic factor that causes a change similar to the internal standard material based on the tendency, and the characteristic factors investigated by the change factor extraction unit 20 A measurement model verification unit 40 that predicts and verifies the concentration of trace pollutants in an environmental sample without an internal standard material by applying the measurement model built in the model building unit 30 and the deep learning-based measurement model building unit 30 includes

여기서, 데이터 수집 및 분석부(10)는 오염물질 검출 및 분석 분야에서 축적된 방대한 양의 환경 데이터 및 해석되고 버려지는 데이터를 수집하여 데이터마이닝을 하고 빅데이터 분석을 통하여 물질별 경향을 분석하는 것이다.Here, the data collection and analysis unit 10 collects a vast amount of environmental data accumulated in the field of pollutant detection and analysis and data that is analyzed and discarded, performs data mining, and analyzes trends for each material through big data analysis. .

이와 같은 빅데이터 분석을 통한 물질별 경향 분석에 관하여 구체적으로 설명하면 다음과 같다.A detailed description of the trend analysis for each material through such big data analysis is as follows.

도 2는 인공지능 기반 미량오염물질 농도 검출을 위한 상세 구성도이다.2 is a detailed configuration diagram for detecting the concentration of trace pollutants based on artificial intelligence.

본 발명에 따른 미량오염물질 농도 검출 시스템은 크게 데이터 수집,데이터 마이닝, 딥러닝의 구성을 갖는다.Trace pollutant concentration detection system according to the present invention is largely composed of data collection, data mining, and deep learning.

첫 번째로, 유역에서 수 샘플링을 실시한 후 고해상도 질량분석기(HP LC/MSMS)를 이용하여 수체 내의 미량오염물질을 측정한다.First, after water sampling in the watershed, trace pollutants in the water body are measured using high-resolution mass spectrometry (HP LC/MSMS).

고해상도 질량분석기에서 산출된 High resolution mass spectrum을 기반으로 하여 데이터를 수집, 구축하고 2차원, 3차원으로 시각화한다.Based on the high resolution mass spectrum calculated by the high resolution mass spectrometer, data is collected and constructed and visualized in 2D and 3D.

다양한 성상을 가진 시료 내에 존재하는 미량오염물질을 대상으로 하는 분석 방법 중, 일반적으로 사용되며 가장 높은 신뢰도를 나타내는 분석 방법은 내부표준물질(IS, Internal standard)를 이용하는 내부표준물질법이다. Among the analysis methods that target trace contaminants present in samples with various properties, the commonly used and most reliable analysis method is the internal standard method using an internal standard (IS).

하지만, 내부표준물질법은 고가의 내부표준물질을 필요로 하며 비용소모적인 방법이다. However, the internal standard method requires an expensive internal standard material and is a cost-consuming method.

본 발명은 내부표준물질법을 이용하여 대상지역으로 선정된 수계 내에 거동하는 신종 미량오염물질을 정량 분석하여 농도 분포를 파악하고, 인공지능 기반의 모델을 이용하여 내부표준물질을 대신할 수 있는 수계 내의 대체물질을 찾을 수 있도록 한 것이다.The present invention uses the internal standard method to determine the concentration distribution by quantitatively analyzing new trace pollutants moving in the water system selected as the target area, and uses an artificial intelligence-based model to replace the internal standard material in an aqueous system. This is to help find alternative substances in it.

그리고 얻어진 High resolution mass spectrum 데이터로부터 신종미량 오염물질 측정에 필요한 내부물질을 대신할 후보 영역(candidate subset)을 산출하고 신종미량오염물질 농도와 후보 영역(candidate subset)의 3차원 Peak를 정량화 하여 비교한다.Then, from the obtained high resolution mass spectrum data, a candidate subset is calculated to replace the internal substances required for measurement of new trace pollutants, and the concentration of new trace pollutants and the 3D peak of the candidate subset are quantified and compared. .

그 후 최종적으로 mass spectrum에서 IS 대체 후보 영역(candidate subset)을 선정한다.After that, an IS candidate subset is finally selected from the mass spectrum.

선정된 IS 대체 후보 영역(candidate subset)과 High resolution mass spectrum, 미량오염물질 모니터링 농도 데이터를 기반으로 딥러닝 모델 중 하나인 Convolutional Neural Network를 이용하여 미량오염물질 측정 모델 시스템 개발을 위한 모델 학습을 진행한다. 학습이 마무리된 후, 학습된 모델은 IS를 사용하지 않고 Mass spectrum 만으로도 미량 오염물질을 측정이 가능하게 된다.Based on the selected IS replacement candidate region, high resolution mass spectrum, and trace pollutant monitoring concentration data, model learning for the development of a micro pollutant measurement model system is carried out using the Convolutional Neural Network, one of the deep learning models. do. After the training is completed, the trained model can measure trace pollutants only by mass spectrum without using IS.

도 3은 데이터 수집 및 분석을 통한 미량 오염 물질 DB 구축부의 상세 구성도이다.3 is a detailed configuration diagram of a trace pollutant DB construction unit through data collection and analysis.

현재 수계에는 산업용제, 의약물질 및 개인관리용품들을 포함한 다양한 미량오염물질들이 공존하고 있고, 이들의 출현 및 농도는 수계지점마다 상이하게 나타나므로, 보다 광범위한 분석 스크리닝 및 우선순위물질선정, 그리고 이에 대한 추가적인 모니터링 프로그램 구축이 필요하다.Various micro-contaminants, including industrial agents, pharmaceuticals, and personal care products, coexist in the current water system, and their appearance and concentration are different for each water system. It is necessary to establish an additional monitoring program.

우선순위물질선정을 위해서는 현재 수계에 존재하는 미량오염물질에 대한 스크리닝이 필요하며 이를 위해 본 발명에서는 다종의 물질을 동시에 분석할 수 있는 비표적 및 추정 분석을 수행한다.In order to select a priority material, it is necessary to screen for trace pollutants currently present in the water system.

비표적 및 추정 분석을 통해 확인된 미량오염물질들은 출현빈도, 농도, 및 독성정보 등을 바탕으로 우선순위 및 주요대상물질 선정 후 선정된 물질들에 대한 주요 지점별 모니터링 프로그램을 구축한다.Trace pollutants identified through non-target and presumptive analysis are prioritized and selected based on their frequency of occurrence, concentration, and toxicity information, and then a monitoring program for the selected substances is established for each major point.

이에 따라 검출 농도 및 빈도 분석 DB를 구축하여 인공지능 모델 개발을 위한 빅 데이터 생성 및 자료 분석을 수행한다.Accordingly, by building a detection concentration and frequency analysis DB, big data generation and data analysis for artificial intelligence model development are performed.

미량오염 물질 DB 구축을 위해서는 도 3에서와 같이, 기존 유해물질 모니터링을 하여 DB를 구축하는 기존 유해물질 모니터링 DB 구축부(11)와, 신종 유해물질 모니터링을 하여 DB를 구축하는 신종 유해물질 모니터링 DB 구축부(12)와, 미지 물질 모니터링을 하여 미지 물질 DB를 구축하는 미지 물질 DB 구축부(13)를 포함한다.In order to establish the trace pollutant DB, as shown in FIG. 3 , the existing hazardous substance monitoring DB construction unit 11 establishes a DB by monitoring the existing hazardous substances, and the new hazardous substance monitoring DB establishes the DB by monitoring the new hazardous substances. It includes a construction unit 12 and an unknown substance DB construction unit 13 configured to construct an unknown substance DB by monitoring the unknown substance.

기존의 미량오염물질 DB 구축을 위해 1) 국립환경과학원의 '내분비계 장애물질 조사결과자료, 2) 2015년 이후 수계 내 미량오염물질 모니터링 관련 국내외 문헌, 그리고 3) 이전부터 수계 관리를 위하여 조사되어왔던 물질이나 최근에 수계 내 잔류가 확인되었던 신종 물질 외에도 아직까지 잘 알려지지 않거나 미확인 물질들에 대해 확인한다.In order to establish the existing trace pollutant DB, 1) 'Endocrine System Obstacles Investigation Results Data of the National Academy of Environmental Sciences, 2) domestic and foreign literature related to the monitoring of trace pollutants in water system since 2015, and 3) have been investigated for water system management before. In addition to the substances that have been present or the new substances that have recently been confirmed to remain in the water system, substances that are still unknown or unidentified are checked.

European Union(EU)의 Registration of Chemicals(REACH) 화학 물질 등록, 평가, 승인 및 제한에 대한 보고에 따르면 유럽은 약 140,000개의 물질을 생산 또는 수입하고 미국의 경우 약 85,000개의 화학물질이 리스트에 포함되어 있으며 가정에서 사용하는 의약품, 살충제, 계면활성제 등 과 같은 물질들만 해도 30,000 ~ 70,000여 개가 되는 것으로 추정된다 (Hollender et al., 2017).According to the European Union (EU) Report on Registration, Evaluation, Authorization and Restriction of Chemicals Registration, Evaluation, Authorization and Restriction of Chemicals, Europe produces or imports about 140,000 substances and in the United States about 85,000 substances are on the list. It is estimated that there are about 30,000 to 70,000 substances used at home, such as pharmaceuticals, pesticides, and surfactants (Hollender et al., 2017).

이와 같이 수많은 오염물질이 수계 내로 배출되어지고 있음이 예상되지만 기존에 수계 모니터링을 위한 대상물질로 선정된 물질들은 수십 혹은 수백여 개에 지나지 않는다.Although it is expected that many pollutants are discharged into the water system as described above, only tens or hundreds of substances have been previously selected as target materials for water system monitoring.

반면에 추정 및 비표적 분석 기법과 같은 새로운 분석 방법은 표적 분석에 비하여 수많은 물질들을 대상으로 분석 가능하므로 표적 분석이 지니는 한계에 대한 해결책으로 제시되고 있다.On the other hand, new analysis methods such as estimation and non-target analysis techniques are suggested as a solution to the limitations of target analysis because they can analyze a large number of substances compared to target analysis.

대체적으로 고분해능 질량분석기 기반 추정 및 비표적 분석과 같은 새로운 분석기법을 이용하면 기존의 표적 분석보다 비교적 다종의 물질들에 대한 모니터링이 가능하다.In general, if new analytical techniques such as high-resolution mass spectrometry-based estimation and off-target analysis are used, it is possible to monitor a relatively wide variety of substances compared to conventional targeted analysis.

이러한 새로운 분석 기법을 통하여 기존에 모니터링 되어오던 물질들과 미지물질들에 대한 추가적인 모니터링이 수행하고 검출된 물질들에 대한 DB구축 후 이를 바탕으로 인공지능 모델 개발을 위한 빅 데이터 생성 및 자료 분석을 진행한다.Through this new analysis technique, additional monitoring of previously monitored substances and unknown substances is performed, and after establishing a DB for the detected substances, big data generation and data analysis are carried out for the development of artificial intelligence models based on this. do.

도 4는 신종,미지 물질 빅데이터화 과정을 나타낸 구성도이다.4 is a block diagram showing the process of converting new and unknown substances into big data.

본 발명은 신종,미지 물질 빅데이터화를 위하여 도 4에서와 같이, 지정된 기존의 모니터링의 결과와 유해물질 유입 가능성을 파악하여 대상지점을 설정 후 모니터링을 실시하는 대상지점 설정 모니터링부(31)와, 현장시료를 측정 검증하여 미량 오염물질의 특성을 분석하는 현장시료 검증부(32)와, 현장시료에서 산출된 MS 데이터를 이용하여 빅데이터로 산출하고, 산출된 데이터는 딥러닝 기반 미량오염물질 측정 및 예측 모델 구축에 이용할 수 있도록 하는 현장시료 빅데이터 생성부(33)를 포함한다.The present invention provides a target point setting monitoring unit 31 for monitoring after setting a target point by identifying the result of the designated existing monitoring and the possibility of inflow of harmful substances, as shown in FIG. 4 for new and unknown material big data; The field sample verification unit 32 that measures and verifies the field sample and analyzes the characteristics of trace pollutants, and the MS data calculated from the field sample is used to calculate big data, and the calculated data is deep learning-based micro pollutant measurement and a field sample big data generation unit 33 that can be used for constructing a predictive model.

수십 년간 다양한 방법을 통해 수계 내 모니터링이 수행되어왔는데, 오염물질 항목을 미리 정하고 각 물질들에 따른 전처리 및 분석 등을 확립한 후 정성 및 정량 분석이 가능한 표적 분석이 주로 사용되었다.Monitoring in water system has been carried out through various methods for decades, and target analysis that enables qualitative and quantitative analysis after pre-determining pollutant items and establishing pre-treatment and analysis for each material has been mainly used.

그러나 표준물질 구비가 필수적인 표적 분석 기법으로는 기존에 잘 알려지지 않거나 사전정보가 전혀 없는 미규제 물질의 검출에는 시행착오를 겪는 과정에서 많은 시간이 소요되어 활용성이 떨어진다.However, as a target analysis technique that requires the provision of standard materials, it takes a lot of time in the process of trial and error to detect unregulated substances that are not well known or have no prior information.

이에 대응하는 새로운 분석 기법으로는 추정 및 비표적 분석이 있으며, 이를 활용하기 위해서는 질량 분석 시 1단위로 질량을 분석하는 저분해능 질량분석기가 아닌 0.0001단위로 질량을 분석하는 고분해능 질량분석기가 필요하다.New analysis techniques corresponding to this include estimation and non-target analysis, and in order to utilize them, a high-resolution mass spectrometer that analyzes mass in units of 0.0001 is required rather than a low-resolution mass spectrometer that analyzes mass in units of 1 unit.

저분해능 질량분석기로는 mass error가 높아 분리할 수 없었던 물질들을 고분해능 질량분석기를 이용하면 분리가 가능하고 이러한 높은 선택성과 감도를 바탕으로 분석대상 물질을 미리 정하지 않더라도 수많은 오염물질을 식별해낼 수 있다.Materials that could not be separated with a low-resolution mass spectrometer due to a high mass error can be separated using a high-resolution mass spectrometer.

1995년과 2005년에 quadrupole-time-of-flight (QTOF) 및 Fourier transform orbitrap (Orbitrap)이 각각 상용화 된 이후로 고분해능과 정확도를 기반으로 한 유전자분석, 단백질 및 대사체 분석이 이루어졌고 이후 환경, 식품 등에서의 미량잔류오염물질 분석으로 활용성이 넓혀졌다.Since the commercialization of quadrupole-time-of-flight (QTOF) and Fourier transform orbitrap (Orbitrap) in 1995 and 2005, respectively, genetic analysis, protein and metabolite analysis based on high resolution and accuracy have been conducted, and since then, environmental, The applicability has been expanded by analyzing trace residual pollutants in food, etc.

최근까지 환경 분석 측면에서도 고분해능 질량분석기를 이용한 의약품, 농약, 개인위생용품, 산업용 물질 등에 대한 모니터링이 국내외에서 많이 이루어지고 있다. Until recently, in terms of environmental analysis, monitoring of pharmaceuticals, pesticides, personal hygiene products, industrial materials, etc. using high-resolution mass spectrometers has been carried out a lot at home and abroad.

또한, 분석결과를 해석하는 다양한 소프트웨어 개발로 인하여 고분해능 질량분석기를 통하여 추출된 신뢰성 높은 데이터로부터 peak picking, 동위원소 패턴 분석, MS/MS fragment 비교 분석 등 복잡한 과정을 단시간에 수행할 수 있다.In addition, due to the development of various software for interpreting analysis results, complex processes such as peak picking, isotope pattern analysis, and MS/MS fragment comparison analysis can be performed in a short time from reliable data extracted through high-resolution mass spectrometer.

이와 같은 특성을 활용하여 표적 분석 시에는 수십, 수백 종에 달하는 대상물질에 대하여 동시에 정량분석이 가능하고 시료 내 잔류할 것이라 예상되는 물질들에 대한 추정 분석 및 미지물질에 대한 비표적 분석까지 다양한 분석기법의 적용이 가능하다.In the case of target analysis using these characteristics, quantitative analysis of dozens or hundreds of target substances is possible at the same time, and various analyzes ranging from presumptive analysis of substances expected to remain in the sample to non-target analysis of unknown substances technique can be applied.

도 5는 본 발명에 따른 표적 분석 및 비표적 분석 과정을 나타낸 플로우 차트이다.5 is a flowchart illustrating a target analysis and a non-target analysis process according to the present invention.

표적 분석은 표준물질 구비 후 대상물질에 대한 정성 및 정량 분석을 수행하는 분석 기법이고 추정 및 비표적 분석은 표준물질을 확보하지 못한 상황에서도 수많은 물질들을 정성적으로 확인할 수 있는 분석 기법이다.Target analysis is an analysis technique that performs qualitative and quantitative analysis on a target material after the standard material is provided, and estimation and non-target analysis is an analysis technique that can qualitatively check numerous substances even in a situation where a standard material is not secured.

먼저 추정 분석은 표준물질이 확보되지 않아 정량분석은 불가능하지만 시료 내 잔류가 예상되는 물질들에 대한 고유의 exact mass, 이온화 과정 등을 포함하는 추정 리스트를 작성한다.First, in the estimation analysis, quantitative analysis is not possible because the standard material is not secured, but an estimation list including the exact mass and ionization process of substances expected to remain in the sample is prepared.

이 후, 고분해능 질량분석기를 통해 추출된 데이터로부터 추정리스트를 기반으로 한 물질들이 지니는 고유의 exact mass와 매우 유사한 accurate mass, 동위원소 패턴 일치여부, MS/MS fragments 비교 분석 및 구조 분석 등을 통하여 대상물질을 잠정적으로 확인한다.After that, from the data extracted through the high-resolution mass spectrometer, an accurate mass very similar to the intrinsic exact mass of the materials based on the estimation list, whether the isotope pattern matches, MS/MS fragments comparative analysis and structural analysis, etc. The substance is tentatively identified.

비표적 분석은 추정 리스트 등 과 같은 사전정보 없이 예상하지 못했거나 미지물질들을 확인하는 분석기법으로 추출된 데이터로부터 유의미한 피크를 선정한 다음 분자식을 할당한다.Non-target analysis is an analysis technique that identifies unexpected or unknown substances without prior information such as a list of estimates, selects a significant peak from the extracted data, and then assigns a molecular formula.

이후 해당 피크의 MS/MS fragment 데이터를 통한 비교 및 분자 구조 분석을 통하여 할당된 분자식에 대한 후보물질들 중 가장 유력한 물질을 최종적으로 확인한다.Thereafter, the most likely material among the candidates for the assigned molecular formula is finally confirmed through comparison and molecular structure analysis through MS/MS fragment data of the corresponding peak.

할당된 분자식에 대한 후보물질 선정시 ChemSpider, Pubchem 등 화학물질 관련 데이터베이스가 이용되고 MS/MS fragment 비교 분석은 MassBank, mzCloud 등 MS/MS fragment 데이터베이스가 이용되며 분자 구조 분석은 metFrag 와 같은 MS/MS fragment 예측 시스템을 통하여 확인한다.When selecting candidate substances for the assigned molecular formula, chemical substance-related databases such as ChemSpider and Pubchem are used, MS/MS fragment databases such as MassBank and mzCloud are used for MS/MS fragment comparison analysis, and MS/MS fragments such as metFrag for molecular structure analysis It is confirmed through the prediction system.

고분해능 질량분석기를 이용한 표적분석 또한 일반적인 표적분석과 마찬가지로 표준물질 구비를 통하여 실시된다. 해당 대상물질에 대하여 고분해능 질량분석기는 5ppm 이내의 정확한 질량 값(exact mass) 측정을 가능하게 하며, 동위원소 패턴(Isotopic pattern)과 물질 고유의 MS/MS fragment 확인을 통하여 높은 신뢰도를 제공한다.Target analysis using a high-resolution mass spectrometer is also performed through the provision of standard materials like general target analysis. The high-resolution mass spectrometer of the target material enables accurate mass measurement within 5 ppm, and provides high reliability through identification of isotopic patterns and MS/MS fragments unique to the material.

표준물질을 이용한 대상물질의 정량검정곡선 작성은 0.1 ng/L에서 2,000 ng/L의 범위에 대하여 작성하고, R2 0.995 이상의 정확도를 갖도록 한다.The quantitative calibration curve of the target substance using the standard material should be prepared in the range of 0.1 ng/L to 2,000 ng/L, and have an accuracy of R 2 0.995 or higher.

또한, 시료분석과 농도에 대한 정도보증관리(QA/QC)를 위하여 시료채취 간에는 환경시험·검사 QA/QC 핸드북에 따른 시료채취를 실시한다.In addition, for sample analysis and quality assurance control (QA/QC) for concentration, sampling is carried out according to the environmental test and inspection QA/QC handbook between sampling.

즉, 갈색병(amber bottle)을 이용하여 시료채취 후 시료변형을 최소화하기 위하여 헤드스페이스를 제거하여 시료채취를 실시하고, 일반항목(pH, 수온, 용존산소량, 전기전도도)은 현장에서 시료채취와 동시에 측정한다.That is, after sample collection using an amber bottle, sample collection is performed by removing the headspace to minimize sample deformation, and general items (pH, water temperature, dissolved oxygen amount, electrical conductivity) are measure at the same time.

시료 성상은 시료채취 지점에 따라 지표수와 폐수,하수처리장 방류수로 구분된다.The characteristics of the sample are divided into surface water, wastewater, and effluent from a sewage treatment plant according to the sampling point.

시료 성상에 따른 미량오염물질 농도 분석에 대한 matrix effect를 고려하여 대상물질에 대한 회수율(recovery) 실험을 한다.In consideration of the matrix effect on the analysis of the concentration of trace contaminants according to the characteristics of the sample, a recovery test is performed on the target material.

농도 분석 회수율 실험은 분석 시료와 동일한 시료에 주입실험(Spiking test)를 통하여 실시하고, 시료 내 대상물질을 일정농도 (ex. 100 ng/L)로 주입하여 동일한 전처리 과정과 분석을 거쳐 대상물질에 대한 일정 신뢰구간 이상(70~130%)의 회수율을 확보한다.The concentration analysis and recovery rate experiment is performed through a spiking test on the same sample as the analyte sample, and the target substance in the sample is injected at a certain concentration (ex. 100 ng/L) and subjected to the same pre-treatment process and analysis to be applied to the target substance. A recovery rate of over a certain confidence interval (70~130%) is secured.

그리고 기기분석 간 시료 분석에 대한 정확도와 재현성을 평가하기 위하여, 대상물질의 표준물질 혼합액을 이용하여 상대표준편차(RSD, Relative standard deviation)과 check standard 분석을 통하여 평가한다.And in order to evaluate the accuracy and reproducibility of sample analysis between device analysis, it is evaluated through RSD (Relative standard deviation) and check standard analysis using the standard material mixture of the target material.

도 6a내지 도 6d는 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치에 적용되는 딥러닝 기술의 개요를 나타낸 구성도이다.6A to 6D are diagrams showing the outline of deep learning technology applied to the device for precise detection of trace pollutants through deep learning-based modeling according to the present invention.

본 발명에서는 딥러닝, GIS 빅데이터 기반 신종미량오염물질 예측 모델을 개발하기 위하여, 미량오염물질 모니터링과 더불어 수리/수문/환경 데이터를 수집한다.In the present invention, in order to develop a deep learning and GIS big data-based new micro-pollutant prediction model, hydrological/hydraulic/environmental data is collected along with micro-pollutant monitoring.

이렇게 수집된 정보를 이용하여, 수리 수문 모델을 구축한다.Using the information collected in this way, a hydraulic sluice model is constructed.

수리/수문 모델은 유역내의 수리/수문/환경 정보를 GIS 형태로 산출이 가능하며, 미계측 지역에 대해서도 정보 산출이 가능하다.The hydraulic/sluice model can calculate hydraulic/sluice/environmental information in the watershed in the form of GIS, and information can also be calculated for unmeasured areas.

이렇게 산출된 수리/수문/환경 GIS정보와 오염원 정보, 오염물질 정보를 추가하여, 최종적으로 GIS 형태의 수리/수문/환경 빅데이터를 산출한다.By adding the hydraulic/hydraulic/environmental GIS information calculated in this way, pollutant source information, and pollutant information, finally, GIS type hydraulic/hydraulic/environmental big data is calculated.

최종적으로 산출된 GIS 형태의 빅데이터는 유역 내의 미량오염물질예측을 위해 딥러닝에 적용한다.The finally calculated big data in the form of GIS is applied to deep learning to predict trace pollutants in the watershed.

이 때 사용되는 딥러닝 모델은 LSTM 모델이다. 신종 미량오염물질 예측을 위해 LSTM과 GIS형태의 빅데이터를 이용하여 모델 학습을 진행한다.The deep learning model used in this case is the LSTM model. Model learning is carried out using big data in the form of LSTM and GIS to predict new micro-pollutants.

최종적으로 신종 미량오염물질 예측이 가능한 시스템 개발이 완료가 되면, 추가적인 모니터링 정보를 이용하여 모델 검증을 진행한다.Finally, when the development of a system capable of predicting new micro-pollutants is completed, the model is verified using additional monitoring information.

딥러닝 기반 측정 모델 구축부(30)에서 구축된 측정 모델은 학습을 통해 후보범위들 중 내부표준물질을 대체할 수 있는 부분을 찾을 것이며, 필터의 크기, 개수, 구조, 보폭과 패딩, 활성화 함수 등 주요 요소들을 최적화하여 설계된다.The measurement model built in the deep learning-based measurement model building unit 30 will find a part that can replace the internal standard among the candidate ranges through learning, and the size, number, structure, stride and padding of the filter, and the activation function It is designed by optimizing major factors such as

여러 입력데이터에서 내부표준물질이 보이는 특징과 유사한 특징을 보이는 부분을 CNN모델을 이용하여 추출한다.The part showing characteristics similar to the characteristics of the internal standard material from various input data is extracted using the CNN model.

Convolutional Neural Network (CNN)은 데이터의 특징을 추출하여 패턴을 파악하는 구조로, 크게 convolution과 pooling 과정으로 진행된다.Convolutional Neural Network (CNN) is a structure that identifies patterns by extracting features of data, and mainly consists of convolution and pooling processes.

Convolution 과정은 데이터의 특징을 추출하는 과정으로, 성분의 특징을 강조하고 압축하여 parameter의 개수를 줄이게 된다. 이러한 압축 과정은 데이터의 유무를 판단하고 처리하는 filter, 데이터의 크기를 적절하게 조절해주는 padding, 압축된 결과 값을 수치화 시켜주는 active function으로 진행된다.The convolution process is a process of extracting features of data, and the number of parameters is reduced by emphasizing and compressing the features of the components. This compression process proceeds with a filter that determines whether data exists and processes it, padding that appropriately adjusts the size of data, and an active function that digitizes the compressed result value.

Active function으로는 sigmoid, ReLU 함수 Pooling 과정은 입력 데이터의 특징 추출을 방해하는 노이즈와 크기를 줄여주며, max-pooling, average-pooling 등의 방법이 존재한다. 위 두 과정을 지나 fully connected layers를 통해 학습을 진행하고 입력 데이터에 대한 결과 값을 도출한다.As active functions, the sigmoid and ReLU function pooling processes reduce noise and size that interfere with feature extraction of input data, and methods such as max-pooling and average-pooling exist. After the above two processes, learning is carried out through fully connected layers, and the result value is derived from the input data.

도 7은 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법을 나타낸 플로우 차트이다.7 is a flowchart illustrating a method for precisely detecting micro-contaminants through deep learning-based modeling according to the present invention.

본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법은 Orbitrap Mass data를 수집하여 물질별 경향을 분석하는 데이터 수집 및 분석 단계(S301)와, 분석된 경향을 기초로 내부표준물질과 유사한 변화를 일으키는 특성 인자를 조사하는 인자 조사 단계(S302)와, 조사된 특성 인자들을 바탕으로 모델을 구축하는 개발 단계(S303)와, 적용된 측정 모델을 기반으로 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 확인 단계(S304)를 포함한다.The method for precise detection of trace contaminants through deep learning-based modeling according to the present invention includes the data collection and analysis step (S301) of collecting Orbitrap mass data to analyze the tendency of each material, and the analysis similar to the internal standard material based on the analyzed tendency. Factor investigation step (S302) of examining the characteristic factors that cause change, development step (S303) of building a model based on the investigated characteristic factors, and trace pollutants of environmental samples without internal standards based on the applied measurement model and a confirmation step (S304) of predicting and verifying the concentration of

이상에서 설명한 본 발명에 따른 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치는 수질 정보 및 물질 자료를 기반으로 분석 값을 보정해 주는 모델을 만들어 신뢰성 및 경제성을 높일 수 있도록 한 것으로, 정밀분석 시간을 단축시켜 화학사고 발생 시 즉각적으로 대응이 가능하도록 할 뿐만 아니라, 오염물질의 지속적인 모니터링을 가능하게 하여 지능적이고 강화된 정수처리 공정 개발에 기여할 수 있도록 한 것이다.The device for precise detection of trace pollutants through deep learning-based modeling according to the present invention described above is to make a model that corrects analysis values based on water quality information and material data to increase reliability and economic efficiency, and the precision analysis time It not only enables immediate response in the event of a chemical accident by reducing

이상에서의 설명에서와 같이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명이 구현되어 있음을 이해할 수 있을 것이다.As described above, it will be understood that the present invention is implemented in a modified form without departing from the essential characteristics of the present invention.

그러므로 명시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 범위는 전술한 설명이 아니라 특허청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.Therefore, the specified embodiments should be considered in an illustrative rather than a restrictive sense, the scope of the present invention is indicated in the claims rather than the foregoing description, and all differences within the equivalent scope are included in the present invention. will have to be interpreted.

10. 데이터 수집 및 분석부
20. 변화 인자 추출부
30. 딥러닝 기반 측정 모델 구축부
40. 측정 모델 검증부
10. Data Collection and Analysis Department
20. Change factor extraction unit
30. Deep learning-based measurement model building unit
40. Measurement model verification unit

Claims (16)

고해상도 질량분석기에서 산출된 High resolution mass spectrum을 기반으로 하여 데이터를 수집, 구축하고 2차원, 3차원으로 시각화하여 미량 오염 물질 DB를 구축하는 데이터 수집 및 분석부;
상기 데이터 수집 및 분석부에서 분석된 경향을 기초로 내부표준물질의 변화와 유사한 특징을 보이는 특성 인자를 추출하는 변화 인자 추출부;
상기 변화 인자 추출부에서 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 딥러닝 기반 측정 모델 구축부;
상기 딥러닝 기반 측정 모델 구축부에서 구축된 측정 모델을 적용하여 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 측정 모델 검증부;를 포함하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
a data collection and analysis unit that collects and builds data based on the high resolution mass spectrum calculated by the high resolution mass spectrometer, and visualizes it in 2D and 3D to build a trace pollutant DB;
a change factor extraction unit for extracting a characteristic factor showing characteristics similar to the change of the internal standard material based on the trend analyzed by the data collection and analysis unit;
a deep learning-based measurement model building unit for constructing a measurement model based on the characteristic factors investigated by the change factor extraction unit;
Deep learning-based modeling comprising a; a measurement model verification unit that predicts and verifies the concentration of trace pollutants in an environmental sample without an internal standard by applying the measurement model built in the deep learning-based measurement model building unit A device for precise detection of trace pollutants through
제 1 항에 있어서, 상기 데이터 수집 및 분석부는 미량 오염 물질 DB를 구축하기 위하여,
기존 유해물질 모니터링을 하여 DB를 구축하는 기존 유해물질 모니터링 DB 구축부와,
신종 유해물질 모니터링을 하여 DB를 구축하는 신종 유해물질 모니터링 DB 구축부와,
미지 물질 모니터링을 하여 미지 물질 DB를 구축하는 미지 물질 DB 구축부를 포함하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
According to claim 1, wherein the data collection and analysis unit to build a trace pollutant DB,
Existing hazardous substance monitoring DB construction department to build a DB by monitoring existing hazardous substances;
A new hazardous substance monitoring DB construction department that monitors new hazardous substances and builds a DB;
A device for precise detection of trace pollutants through deep learning-based modeling, characterized in that it comprises an unknown substance DB construction unit for establishing an unknown substance DB by monitoring the unknown substance.
제 1 항에 있어서, 상기 데이터 수집 및 분석부에서 구해진 High resolution mass spectrum 데이터로부터 미량 오염물질 측정에 필요한 내부물질을 대신할 후보 영역(candidate subset)을 산출하고 미량오염물질 농도와 후보 영역(candidate subset)의 3차원 Peak를 정량화 하여 비교하여 mass spectrum에서 IS 대체 후보 영역(candidate subset)을 선정하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.The method according to claim 1, wherein a candidate subset is calculated from the high resolution mass spectrum data obtained by the data collection and analysis unit to replace the internal material required for measuring trace contaminants, and the trace contaminant concentration and candidate subset are calculated. ), a device for precise detection of trace contaminants through deep learning-based modeling, characterized in that a candidate subset is selected from the mass spectrum by quantifying and comparing the three-dimensional peak. 제 1 항에 있어서, 상기 딥러닝 기반 측정 모델 구축부는,
상기 데이터 수집 및 분석부에서 선정된 IS 대체 후보 영역(candidate subset)과 High resolution mass spectrum, 미량오염물질 모니터링 농도 데이터를 기반으로 Convolutional Neural Network를 이용하여 미량오염물질 측정 모델 구축을 위한 모델 학습을 진행하여 IS를 사용하지 않고 Mass spectrum 만으로 미량 오염물질을 측정이 가능하도록 하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
According to claim 1, wherein the deep learning-based measurement model building unit,
Based on the IS candidate subset selected by the data collection and analysis unit, the high resolution mass spectrum, and the trace pollutant monitoring concentration data, the convolutional neural network is used to learn the model for establishing the micro pollutant measurement model. A device for precise detection of trace pollutants through deep learning-based modeling, characterized in that it is possible to measure trace pollutants only by mass spectrum without using IS.
제 4 항에 있어서, 상기 딥러닝 기반 측정 모델 구축부는,
수질 정보 및 물질 자료를 기반으로 분석 값을 보정해 주는 모델을 만들어 내부표준물질 없이도 환경시료의 미량오염물질 농도 측정 정확도를 향상시키는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
The method of claim 4, wherein the deep learning-based measurement model building unit,
A device for precise detection of trace pollutants through deep learning-based modeling, characterized in that it improves the accuracy of measuring the concentration of trace pollutants in environmental samples without an internal standard by creating a model that corrects analysis values based on water quality information and material data.
제 1 항에 있어서, 상기 데이터 수집 및 분석부는 미량 오염 물질 DB를 구축하기 위하여,
지정된 기존의 모니터링의 결과와 유해물질 유입 가능성을 파악하여 대상지점을 설정 후 모니터링을 실시하는 대상지점 설정 모니터링부와,
현장시료를 측정 검증하여 미량 오염물질의 특성을 분석하는 현장시료 검증부와,
현장시료에서 산출된 MS 데이터를 이용하여 빅데이터로 산출하고, 산출된 데이터는 딥러닝 기반 미량오염물질 측정 및 예측 모델 구축에 이용할 수 있도록 하는 현장시료 빅데이터 생성부를 포함하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
According to claim 1, wherein the data collection and analysis unit to build a trace pollutant DB,
A target point setting monitoring unit that establishes a target point by identifying the results of the specified existing monitoring and the possibility of influx of hazardous substances, and then conducts monitoring;
An on-site sample verification unit that measures and verifies on-site samples and analyzes the characteristics of trace pollutants;
Deep learning comprising a field sample big data generator that calculates big data using MS data calculated from field samples, and that the calculated data can be used for deep learning-based trace pollutant measurement and prediction model construction A device for precise detection of trace pollutants through based modeling.
제 1 항에 있어서, 상기 데이터 수집 및 분석부는 추정 및 비표적 분석을 위하여,
시료 내 잔류가 예상되는 물질들에 대한 고유의 exact mass, 이온화 과정을 포함하는 추정 리스트를 작성하고,
고분해능 질량분석기를 통해 추출된 데이터로부터 추정리스트를 기반으로 한 물질들이 지니는 고유의 exact mass와 유사한 accurate mass, 동위원소 패턴 일치여부, MS/MS fragments 비교 분석 및 구조 분석 등을 통하여 대상물질을 잠정적으로 확인하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
According to claim 1, wherein the data collection and analysis unit for estimation and non-target analysis,
Create an estimate list including the specific exact mass and ionization process for substances expected to remain in the sample,
From the data extracted through the high-resolution mass spectrometer, the target material can be tentatively analyzed through accurate mass similar to the intrinsic exact mass of the materials based on the estimation list, isotope pattern matching, MS/MS fragments comparative analysis and structural analysis, etc. A device for precise detection of trace pollutants through deep learning-based modeling, characterized in that it confirms.
제 7 항에 있어서, 비표적 분석은 사전정보 없이 예상하지 못했거나 미지물질들을 확인하는 분석으로 추출된 데이터로부터 유의미한 피크를 선정한 다음 분자식을 할당하고,
해당 피크의 MS/MS fragment 데이터를 통한 비교 및 분자 구조 분석을 통하여 할당된 분자식에 대한 후보물질들 중 가장 유력한 물질을 최종적으로 확인하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
The method of claim 7, wherein the off-target analysis selects a significant peak from the data extracted by analysis to identify unexpected or unknown substances without prior information, and then assigns a molecular formula,
A device for precise detection of trace contaminants through deep learning-based modeling, characterized in that the most potent material among candidates for the assigned molecular formula is finally confirmed through comparison and molecular structure analysis of the corresponding peak through MS/MS fragment data .
제 8 항에 있어서, 할당된 분자식에 대한 후보물질 선정시 ChemSpider, Pubchem의 화학물질 관련 데이터베이스가 이용되고,
MS/MS fragment 비교 분석은 MassBank, mzCloud의 MS/MS fragment 데이터베이스가 이용되고,
분자 구조 분석은 metFrag 와 같은 MS/MS fragment 예측 시스템을 통하여 확인하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
The method of claim 8, wherein when selecting a candidate for the assigned molecular formula, ChemSpider, Pubchem's chemical substance related database is used,
For MS/MS fragment comparison analysis, the MS/MS fragment database of MassBank and mzCloud is used,
Molecular structure analysis is a device for precise detection of trace contaminants through deep learning-based modeling, characterized in that it is confirmed through an MS/MS fragment prediction system such as metFrag.
제 1 항에 있어서, 상기 딥러닝 기반 측정 모델 구축부는,
계층의 특징 추출을 위한 합성곱 계층 pooling 단계와 분류나 예측을 위한 fully-connected 단계로 구성되는 CNN을 이용하고,
입력데이터에서 내부표준물질의 변화와 유사한 특징을 보이는 부분을 CNN모델을 이용하여 추출하고,
필터의 크기, 개수, 구조, 보폭과 패딩, 활성화 함수의 요소들을 최적화하여구축된 측정 모델은 학습을 통해 후보범위들 중 내부표준물을 대체할 수 있는 부분을 찾는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
According to claim 1, wherein the deep learning-based measurement model building unit,
Using a CNN consisting of a convolutional layer pooling step for layer feature extraction and a fully-connected step for classification or prediction,
The part showing characteristics similar to the change of the internal standard material from the input data is extracted using the CNN model,
A measurement model built by optimizing the elements of the filter size, number, structure, stride and padding, and activation function is a deep learning-based modeling characterized by finding a part that can replace the internal standard among candidate ranges through learning. A device for precise detection of trace pollutants through
제 1 항에 있어서, 상기 데이터 수집 및 분석부는 고분해능 질량분석기를 이용한 표적분석을 표준물질을 통하여 실시하고,
표준물질을 이용한 대상물질의 정량검정곡선 작성은 0.1 ng/L에서 2,000 ng/L의 범위에 대하여 작성하고, R2 0.995 이상의 정확도를 갖도록 하고,
기기분석 간 시료 분석에 대한 정확도와 재현성을 평가하기 위하여, 대상물질의 표준물질 혼합액을 이용하여 상대표준편차(RSD, Relative standard deviation)과 check standard 분석을 통하여 평가하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 장치.
The method of claim 1, wherein the data collection and analysis unit performs target analysis using a high-resolution mass spectrometer through a standard material,
The quantitative calibration curve of the target material using the standard material should be prepared in the range of 0.1 ng/L to 2,000 ng/L, and have an accuracy of R 2 0.995 or higher,
Deep learning-based modeling, characterized in that in order to evaluate the accuracy and reproducibility of sample analysis between device analysis, it is evaluated through RSD (Relative standard deviation) and check standard analysis using the standard material mixture of the target material A device for precise detection of trace pollutants through
고해상도 질량분석기에서 산출된 High resolution mass spectrum을 기반으로 하여 데이터를 수집, 구축하고 2차원, 3차원으로 시각화하여 미량 오염 물질 DB를 구축하는 데이터 수집 및 분석 단계;
분석된 경향을 기초로 내부표준물질의 변화와 유사한 특징을 보이는 특성 인자를 조사하는 인자 조사 단계;
조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 단계;
적용된 측정 모델을 기반으로 내부표준물질 없이 환경시료의 미량오염물질의 농도를 예측하고 검증하는 확인 단계;를 포함하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법.
A data collection and analysis step of collecting and constructing data based on the high resolution mass spectrum calculated by the high resolution mass spectrometer, and visualizing it in 2D and 3D to build a trace pollutant DB;
a factor investigation step of examining a characteristic factor showing a characteristic similar to the change of an internal standard material based on the analyzed trend;
building a measurement model based on the investigated characteristic factors;
A confirmation step of predicting and verifying the concentration of trace pollutants in an environmental sample without internal standards based on the applied measurement model;
제 12 항에 있어서, 상기 데이터 수집 및 분석 단계에서 미량 오염 물질 DB를 구축하기 위하여,
기존 유해물질 모니터링을 하여 DB를 구축하는 기존 유해물질 모니터링 DB 구축 및 신종 유해물질 모니터링을 하여 DB를 구축하는 신종 유해물질 모니터링 DB 구축 및 미지 물질 모니터링을 하여 미지 물질 DB를 구축하는 미지 물질 DB 구축을 수행하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법.
13. The method of claim 12, wherein in the data collection and analysis step, to build a trace pollutant DB,
Establish an existing hazardous substance monitoring DB to establish a DB by monitoring existing hazardous substances, establish a new hazardous substance monitoring DB to establish a DB by monitoring new hazardous substances, and establish an unknown substance DB to establish an unknown substance DB by monitoring unknown substances A method for precise detection of trace pollutants through deep learning-based modeling, characterized in that it performs.
제 12 항에 있어서, 상기 데이터 수집 및 분석 단계에서 구해진 High resolution mass spectrum 데이터로부터 미량 오염물질 측정에 필요한 내부물질을 대신할 후보 영역(candidate subset)을 산출하고 미량오염물질 농도와 후보 영역(candidate subset)의 3차원 Peak를 정량화 하여 비교하여 mass spectrum에서 IS 대체 후보 영역(candidate subset)을 선정하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법.13. The method of claim 12, wherein a candidate subset is calculated from the high resolution mass spectrum data obtained in the data collection and analysis step to replace the internal material required for the measurement of trace pollutants, and the trace pollutant concentration and candidate subset are calculated. ), a method for precise detection of trace contaminants through deep learning-based modeling, characterized in that a candidate subset of IS is selected from the mass spectrum by quantifying and comparing the three-dimensional peaks. 제 14 항에 있어서, 상기 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 단계에서,
상기 데이터 수집 및 분석 단계에서 선정된 IS 대체 후보 영역(candidate subset)과 High resolution mass spectrum, 미량오염물질 모니터링 농도 데이터를 기반으로 Convolutional Neural Network를 이용하여 미량오염물질 측정 모델 구축을 위한 모델 학습을 진행하여 IS를 사용하지 않고 Mass spectrum 만으로 미량 오염물질을 측정이 가능하도록 하는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법.
15. The method of claim 14, wherein in the step of building a measurement model based on the investigated characteristic factors,
Based on the IS candidate subset selected in the data collection and analysis step, the high resolution mass spectrum, and the trace pollutant monitoring concentration data, the model learning is carried out to build the micro pollutant measurement model using the Convolutional Neural Network. A method of precisely detecting trace pollutants through deep learning-based modeling, characterized in that it is possible to measure trace pollutants only by mass spectrum without using IS.
제 12 항에 있어서, 상기 조사된 특성 인자들을 바탕으로 측정 모델을 구축하는 단계에서,
계층의 특징 추출을 위한 합성곱 계층 pooling 단계와 분류나 예측을 위한 fully-connected 단계로 구성되는 CNN을 이용하고,
입력데이터에서 내부표준물질의 변화와 유사한 특징을 보이는 부분을 CNN모델을 이용하여 추출하고,
필터의 크기, 개수, 구조, 보폭과 패딩, 활성화 함수의 요소들을 최적화하여구축된 측정 모델은 학습을 통해 후보범위들 중 내부표준물을 대체할 수 있는 부분을 찾는 것을 특징으로 하는 딥러닝 기반 모델링을 통한 미량오염물질 정밀검출 방법.
The method of claim 12, wherein in the step of building a measurement model based on the investigated characteristic factors,
Using a CNN consisting of a convolutional layer pooling step for layer feature extraction and a fully-connected step for classification or prediction,
The part showing characteristics similar to the change of the internal standard material from the input data is extracted using the CNN model,
A measurement model built by optimizing the elements of the filter size, number, structure, stride and padding, and activation function is a deep learning-based modeling characterized by finding a part that can replace the internal standard among candidate ranges through learning. precision detection method of trace pollutants through
KR1020200080530A 2020-06-30 2020-06-30 System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling KR102407112B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200080530A KR102407112B1 (en) 2020-06-30 2020-06-30 System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200080530A KR102407112B1 (en) 2020-06-30 2020-06-30 System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling

Publications (2)

Publication Number Publication Date
KR20220001972A KR20220001972A (en) 2022-01-06
KR102407112B1 true KR102407112B1 (en) 2022-06-10

Family

ID=79347954

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200080530A KR102407112B1 (en) 2020-06-30 2020-06-30 System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling

Country Status (1)

Country Link
KR (1) KR102407112B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102520763B1 (en) 2022-04-29 2023-04-13 울산과학기술원 Apparatus and Method for quantifying of Micro-Pollutants using Deep-learning model
KR102485924B1 (en) * 2022-07-06 2023-01-06 강릉원주대학교산학협력단 Apparatus and method for calculating optical thickness of aerosol based on deep learning using remote sensing data of optical sensor
CN116306223B (en) * 2023-01-09 2023-09-22 浪潮智慧科技有限公司 Hydraulic engineering monitoring method, equipment and medium
CN117233116B (en) * 2023-11-09 2024-02-02 江西鼎智检测有限公司 Water quality analysis method and system based on machine vision

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009503480A (en) * 2005-07-25 2009-01-29 メタノミクス ゲーエムベーハー Means and methods for analyzing samples using chromatography / mass spectrometry
WO2018020652A1 (en) * 2016-07-29 2018-02-01 株式会社島津製作所 Mass spectrometric data analysis apparatus and analysis method
US20190079050A1 (en) * 2016-03-09 2019-03-14 Shimadzu Corporation Mass spectrometer and biological sample analysis method using said mass spectrometer

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101691283B1 (en) 2015-02-13 2016-12-30 이헌주 Apparatus and Method for analyzing elements of material using internal standard
KR102501581B1 (en) * 2016-03-31 2023-02-21 광주과학기술원 Method for predicting concentration of pathogenic microorganism using remote sensing hiperspectral images
KR20190054921A (en) * 2017-11-14 2019-05-22 주식회사 노스퀘스트 Mass spectrometric diagnosis apparatus and method for antimicrobial resistant bacteria inducing antibiotic modification
KR20190114241A (en) * 2018-03-29 2019-10-10 울산과학기술원 Apparatus for algae classification and cell countion based on deep learning and method for thereof
KR102101902B1 (en) 2018-07-31 2020-04-20 (주)휴엔릭스 Method for treating pollutant based on A.I data analysis and apparatus for treating pollutant based on A.I data analysis
KR102120427B1 (en) * 2018-11-09 2020-06-09 한국수자원공사 Water pipe attachment type water quality sensor having IoT function and tap water information service system using it
KR102148812B1 (en) * 2018-11-29 2020-08-28 주식회사 아림사이언스 Apparatus for measuring air quality and system therefor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009503480A (en) * 2005-07-25 2009-01-29 メタノミクス ゲーエムベーハー Means and methods for analyzing samples using chromatography / mass spectrometry
US20190079050A1 (en) * 2016-03-09 2019-03-14 Shimadzu Corporation Mass spectrometer and biological sample analysis method using said mass spectrometer
WO2018020652A1 (en) * 2016-07-29 2018-02-01 株式会社島津製作所 Mass spectrometric data analysis apparatus and analysis method

Also Published As

Publication number Publication date
KR20220001972A (en) 2022-01-06

Similar Documents

Publication Publication Date Title
KR102407112B1 (en) System and Method for Precision Detecting of Micro-Pollutants using Deep Learning based Modelling
JP6729455B2 (en) Analytical data analysis device and analytical data analysis method
JP4856993B2 (en) Self-diagnosis type automatic analyzer
Ahmed et al. Enhanced feature selection for biomarker discovery in LC-MS data using GP
CN103389430B (en) A kind of oil-filled transformer fault detection method based on Bayesian discrimination theory
CA2447888A1 (en) Model for spectral and chromatographic data
JP2004502934A (en) How to analyze selected multi-component samples
Samanipour et al. Machine learning combined with non-targeted LC-HRMS analysis for a risk warning system of chemical hazards in drinking water: A proof of concept
CN106932510A (en) The sorting technique of one vegetable oil
CN109633094B (en) Online odor concentration monitoring method
CN116030310A (en) Sample classification method and system based on laser-induced breakdown spectroscopy technology
CN117233347B (en) Carbon steel spheroidization grade measuring method, system and equipment
CN108663334B (en) Method for searching spectral characteristic wavelength of soil nutrient based on multi-classifier fusion
CN117705777A (en) Construction method of site soil heavy metal composite pollution fingerprint
KR102324230B1 (en) A method and system of measurement for agronomical survey using ASD-Fieldspec
Alvarez-Guerra et al. Development of models for predicting toxicity from sediment chemistry by partial least squares-discriminant analysis and counter-propagation artificial neural networks
CN116858822A (en) Quantitative analysis method for sulfadiazine in water based on machine learning and Raman spectrum
JP4915623B2 (en) Chemical agent detection / quantification method
CN116187861A (en) Isotope-based water quality traceability monitoring method and related device
KR101469168B1 (en) Method for verifying representativeness of sample using spatial correlation analysis
Yu et al. Detection of water contamination events using fluorescence spectroscopy and alternating trilinear decomposition algorithm
CN104297205A (en) Method for quickly and nondestructively identifying edible oil
Iwata et al. AI-aided Hammering Test System to Automatically Generate Anomaly Maps.
Woldegebriel et al. A new Bayesian approach for estimating the presence of a suspected compound in routine screening analysis
CN111613266A (en) Outlier detection method based on quantitative structure-activity relationship

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right