KR102420644B1 - 시료 내 타겟 분석물을 분석하는 방법 및 장치 - Google Patents

시료 내 타겟 분석물을 분석하는 방법 및 장치 Download PDF

Info

Publication number
KR102420644B1
KR102420644B1 KR1020207010373A KR20207010373A KR102420644B1 KR 102420644 B1 KR102420644 B1 KR 102420644B1 KR 1020207010373 A KR1020207010373 A KR 1020207010373A KR 20207010373 A KR20207010373 A KR 20207010373A KR 102420644 B1 KR102420644 B1 KR 102420644B1
Authority
KR
South Korea
Prior art keywords
signal
data set
sample
cycle
fitting
Prior art date
Application number
KR1020207010373A
Other languages
English (en)
Other versions
KR20200039851A (ko
Inventor
김영욱
박영용
고성문
이영조
이한빛
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20200039851A publication Critical patent/KR20200039851A/ko
Application granted granted Critical
Publication of KR102420644B1 publication Critical patent/KR102420644B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Algebra (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)

Abstract

본 발명은 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 방법 및 장치에 관한 것이다. 본 발명은 데이터 세트에 대한 비선형 함수의 피팅 정확도를 타겟 분석물 분석을 위한 직접적인 지표로 이용하여, 위양성 및 위음성 결과, 특히 위양성 결과 없이 타겟 분석물을 분석할 수 있다.

Description

시료 내 타겟 분석물을 분석하는 방법 및 장치
본 발명은 시료 내 타겟 분석물을 분석하는 방법 및 장치에 관한 것이다.
핵산 증폭을 위해 가장 많이 사용되는 중합효소 연쇄반응(Polymerse chain reaction: PCR)은 이중가닥 DNA의 변성, DNA 주형에로의 올리고뉴클레오타이드 프라이머의 어닐링 및 DNA 중합효소에 의한 프라이머 연장의 반복된 사이클 과정을 포함한다(Mullis 등, 미국 특허 제4,683,195호, 제4,683,202호 및 제4,800,159호; Saiki et al., Science 230:1350-1354(1985)).
실시간 PCR(Real-time PCR)은 시료에서 타겟 핵산분자를 실시간으로 검출하기 위한 PCR 기반 기술 중 하나 이다. 특정 타겟 분석물을 검출하기 위하여, 실시간 PCR은 타겟 분자의 양에 비례하여 검출 가능한 형광신호를 발생하는 신호-발생 수단을 이용한다. 각 측정지점 및 상기 측정지점에서의 신호값을 포함하는 데이터 세트가 수득된다. 형광신호의 세기는 타겟 분자의 양에 비례한다. 데이터 세트로부터 측정지점 대비 형광신호의 세기를 표시한 증폭곡선(amplification curve) 또는 증폭 프로파일 곡선(amplification profile curve)이 수득된다.
일반적으로 실시간 PCR에 의한 증폭곡선은 베이스라인(baseline) 영역, 지수(exponential) 영역, 정체(plateau) 영역으로 구분된다. 지수 영역은 PCR 증폭 산물의 증가에 비례하여 방출되는 형광신호가 증가하는 영역이며, 정체 영역은 PCR 증폭 산물의 증가 및 형광신호의 방출이 포화상태에 이르러 더 이상 형광신호의 증가가 나타나지 않는 영역이다. 베이스라인 영역은 PCR 초기 사이클 중에 형광 신호에서의 변화가 거의 없는 영역을 의미한다. 베이스라인 영역은 PCR 반응 산물이 방출하는 형광신호가 검출될 정도로 충분하지 않기 때문에, 반응 시료 자체의 형광신호와 측정 시스템 자체의 형광신호인 배경신호(background signal)가 베이스라인 영역의 형광신호의 대부분을 차지할 수 있다.
실시간 PCR의 데이터 세트로부터 타겟 분석물의 증폭이 존재하는 지 여부를 판단하는 다양한 방법이 개발되어 있다. 예를 들어, 역치값(threshold value)를 이용하는 방법이 있다. 역치값을 이용하는 방법은 분석되어야 하는 모든 반응들에 대한 특정의 신호 역치값(a defined signal threshold for all reactions to be analyzed)을 미리 결정하고, 데이터 세트의 신호값이 상기 특정의 신호 역치값을 도달(reach) 또는 도과(exceed)하는지를 판단하는 방법이다. 그러나, 특정의 신호 역치값을 이용하여 증폭 여부를 판단하는 방법은 다음과 같은 판단 오류들을 가질 수 있다: (ⅰ) 증폭에 의한 신호값이 아닌 비정상적 신호값 또는 노이즈 신호값이 역치값에 도달하여 발생하는 위양성 판단; (ⅱ) 베이스라이닝(baselining) 오류에 의한 위음성 판단; 및 (ⅲ) 비정상적 신호값 또는 노이즈 신호값에 의한 잘못된 Ct (Cycle threshold) 값의 산출. 또한, 역치값을 이용하는 방법은 각 반응에 적용할 특정의 신호 역치값을 도출하기 위해 실제 반응 데이터 세트를 최대한 많이 수집해야 하는 단점도 가지고 있다.
Jeffrey Lerner는 미국등록특허 제8,560,247호에서 데이터에 대해서 피팅되는 함수를 수득하고, 상기 함수의 기울기(slope)가 최대 증폭 기울기 경계(maximum amplification slope bound)를 초과하는지 여부에 따라 점프 에러(jump error)가 존재하는지를 결정하는 방법을 개시한다. 상기 방법은 데이터에 피팅된 함수를 계산할 때에 전체 데이터가 아닌 베이스라인 영역에서 일부 데이터에 피팅되는 함수를 계산한다. 상기 방법은 데이터의 베이스라인 영역에 피팅된 함수의 기울기가 최대 증폭 기울기 경계를 초과하면 점프 에러가 존재하는 것으로 결정한다. 따라서, 상기 방법은 함수의 최대 증폭 기울기를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 없고, 단지 점프 에러의 존재 여부만을 결정할 수 있다.
Ronald T. Kurnik 등은 미국공개특허 제2009-0119020호에서 PCR 커브와 같은 성장 곡선(growth curve)의 데이터가 유효(valid)하거나 의미있는(significant) 성장을 나타내는지를 판단하는 방법을 개시하였다. 상기 방법은 데이터와 2차 함수를 피팅하여, 피팅된 2차 함수를 수득하고, 2차 함수의 통계학적으로 의미있는 값(예컨대, R-square 값)을 구한 후에, 통계학적으로 의미 있는 값이 미리 정해진 특정 역치값(예컨대, 0.90-0.99)을 초과하는 지를 판단한다. 상기 방법에서는 통계학적으로 의미 있는 값이 미리 정해진 역치값을 초과하는 경우에는 데이터에 유효하거나 의미있는 성장(growth)이 존재하지 않는 것으로 결정한다. 상기 방법은 데이터가 2차 함수와 정확히 피팅 될수록 타겟 분석물이 부존재할 확률이 높기 때문에, R-square(R2) 값이 역치값보다 큰 경우 데이터를 버리는(discard) 구성을 개시한다. 하지만, 상기 방법은 2차 함수의 피팅을 이용하여 타겟 분석물이 부존재하는 것만을 결정할 뿐, 타겟 분석물이 존재하는 지를 판단하기 위해서는 Ct 값을 구하는 별도의 단계를 실시해야만 한다.
실시간 PCR로부터 수득된 데이터에 의미 있는 타겟 분석물의 증폭이 존재하는지 여부를 판단하기 위한 방법으로서 보다 효과적인 방법이 요구된다.
형광 신호를 이용한 시료의 분석은 다음과 같이 이루어진다. 우선 LED 등의 광원을 통하여 발광체에 에너지를 공급하고, 공급받은 에너지에 의하여 발광체의 전자가 들뜬 상태로 되었다가 바닥 상태로 돌아오면서 발광체가 특정파장의 빛을 방출(emit)한다. 분석 기기는 광다이오드(Photodiode) 또는 CCD 등을 이용하여 특정 파장의 빛을 전기적 신호로 변환하여 시료 분석에 필요한 정보를 제공한다.
동일한 양의 발광체가 시료에서 발생 되어도, 기기 간 광원(예, LED)의 광량의 차이(uneven illumination), 빛-전기 변환장치의 성능 편차(variation)에 의해 분석 기기마다 상이한 신호값을 제공하게 된다. 기기들간에 신호 차이를 기기 간 신호 편차라 한다.
기기 간 신호 편차뿐만 아니라, 단일의 동일한 분석 기기에 의해 동종, 동량의 타겟 분석물에 대해 실시된 복수의 반응들의 분석 결과는 신호의 편차를 가질 수 있다. 왜냐하면, 반응이 수행되는 기기 상의 반응 웰의 위치 차이, 또는 반응혼합물 조성 또는 농도의 미세한 차이와 같은 여러 반응 환경에서의 차이 때문이다. 동일한 기기 내에서 반응 중의 신호 차이를 기기 내 신호 편차라 한다.
측정 데이터의 정확하고, 신뢰도 높은 분석을 위해서는 신호 편차와 같은 문제의 해결이 필요하며, 문제를 해결하기 위해 다양한 방법이 사용되고 있다.
가장 기본적인 방법으로, 하드웨어 보정 방법이 이용된다. 예를 들어, 분석 기기 생산 시 LED 광원의 세기와 같은 각 분석 기기의 일부 부품의 특성은 동일한 시료에 대한 기기 간 신호 편차가 감소되고 적절한 범위 내에서 유지되도록 보정 또는 조절된다. 또 다른 방법은 기준 염색제(reference dye)를 이용하는 방법이다. 일정량의 신호를 생산하는 기준 염색제(reference dye; 예를 들어 ROXTM 또는 fluorescein)를 반응에 함께 포함시켜 기준 염색제로부터 발생하는 신호를 이용하여 시료에서 발생된 신호를 보정한다.
기존의 방법들은 몇몇 한계를 가지고 있다. 하드웨어 보정은 정확도에 한계가 있으며, 분석 기기 노후에 의해 발생되는 편차를 제거하기 위하여 추가 보정이 필요하다. 더구나, 하드웨어 보정은 기기 간 신호 편차만 감소시킬 수 있을 뿐 기기 내 신호 편차를 감소시키지는 못한다.
기준 염색제를 이용한 신호의 보정은 반응 당 비용을 증가시키며, 각 반응에 이용되는 기준 염색제에서의 양적 및 질적 편차(variation)는 다른 오차(error)를 야기할 수 있다. 또한, 기준 염색제의 이용은 상기 기준 염색제와 반응 혼합물에서 타겟 분석물의 존재를 결정하는 데 이용되는 다른 염색제(dye) 사이의 간섭 현상의 가능성을 증가시킬 수 있다. 특히, 다수의 염색제가 이용되고 이들의 형광을 검출해야 하는 멀티플렉스 PCR에서는 간섭 현상이 매우 중요한 문제이다. 또한, 신호 보정을 위해 하나의 염색제 및 하나의 검출 채널을 할당하면 하나의 적은 타겟을 동시에 검출할 수 있기 때문에 제품 경쟁력 측면에서 상당한 단점이 발생한다.
따라서 하드웨어에 대한 직접적인 제어나, 추가적인 기준 염색제의 사용 없이 데이터 세트를 보정하고 기기 간 및 기기 내 신호 편차를 감소시킬 수 있는 새로운 방법의 개발이 필요하다.
한편, 실시간 PCR 데이터의 정확하고, 재현성(repeatability) 있는 분석을 위하여 얻어진 증폭곡선의 일반화(normalization) 과정이 중요하다. 얻어진 증폭곡선은 베이스라인 영역을 인식하는 과정 및 베이스라인 영역의 배경신호(background signal)을 제거하는 과정을 통하여 일반화된다.
배경신호(background signal)는 PCR 반응 시 반응 조건 및 환경의 변화를 반영하기 때문에 반응마다 상이하게 나타나며, 시료내의 핵산 양과는 무관한 베이스라인 이동(baseline drift)이 빈번하게 나타난다. 베이스라인 이동은 반응 간 증폭곡선의 비교를 어렵게 만들며, 타겟 핵산 검출에 있어 위양성, 위음성 결과를 초래하기 쉽다. 따라서, PCR 데이터 분석에 있어, 베이스라인 영역의 설정 및 베이스라인을 기반으로 실험 데이터의 수정이 필요하다.
종래의 하나의 방법은 PCR 초기 사이클 중 임의의 사이클 영역(예, 3-15 사이클)을 베이스라인으로 결정하거나, 증폭곡선을 실험자가 분석하여 임의로 증폭이 시작되기 전 특정 사이클 영역을 베이스라인으로 설정하였다. 종래의 다른 방법은 증폭곡선의 2차 미분(second derivative)를 생성하여 특징을 가지는 포인트를 베이스라인의 끝으로 하여 베이스라인 영역을 결정하였다(미국 특허 등록 공보 제8,219,324호).
기존의 방법들은 몇 가지 단점이 있다.
모든 베이스라인을 임의 사이클 영역으로 결정하는 방법은 반응마다 상이한 배경신호의 변화를 보정할 수는 있으나, 베이스라인 이동(baseline drift)이 발생된 경우 적절하지 못하다. 또한 증폭영역의 시작은 초기 시료에 존재하는 타겟 핵산의 양에 따라 달라지므로, 베이스라인 영역이 미리 결정되어 있는 경우, 미리 결정된 베이스라인 영역을 다양한 샘플에 일률적으로 적용하는 것은 바람직하지 않다.
베이스라인 영역을 실험자가 임의로 결정하는 경우, 동일 증폭곡선이라도 분석하는 실험자에 따라 베이스라인 영역 설정이 달라질 수 있으며, 실험자의 결정에 따라 실제 증폭 산물의 양이 달라질 수 있으므로, 신뢰성 있는 결과를 도출하기 곤란하다.
또는 종래의 다른 방법에 의하면 베이스라인이 복잡한 알고리즘에 의해 결정되는데, 알고리즘에는 명확하게 정의되지 않는 많은 파라미터가 필요하게 되며, 종종 최적화가 어렵게 된다.
따라서, 객관적이고 정확한 실험 결과를 산출하기 위하여 샘플 별로 객관적인 베이스라인 영역 설정을 통한 새로운 증폭곡선 보정 방법이 필요하다.
타겟 핵산 서열의 검출을 위해, 실시간 방식으로 타겟 증폭을 모니터링하면서 타겟 핵산 서열을 검출하는 실시간 검출 방법이 널리 사용되고 있다. 실시간 검출 방법은 일반적으로 타겟 핵산 서열과 특이적으로 혼성화되는 표지된 프로브 또는 프라이머를 사용한다. 표지된 프로브와 타겟 핵산 서열 간의 혼성화를 이용하는 방법의 예로서, 헤어핀 구조를 갖는 이중 표지된 프로브를 이용한 Molecular beacon 방법(Tyagi et al., Nature Biotechnology v.14 MARCH 1996), HyBeacon 방법(French DJ et al., Mol. Cell Probes, 15(6):363-374(2001)), 공여체 및 수용체로 각각 표지된 2개의 프로브를 이용한 혼성화 프로브 방법(Bernad et al, 147-148 Clin Chem 2000; 46) 및 단일 표지된 올리고뉴클레오타이드를 이용한 Lux 방법(미국 특허 제7,537,886호)이 있다. 또한, 이중 표지된 프로브와 DNA 폴리머라아제의 5’-뉴클레아제 활성에 의한 상기 프로브의 절단을 이용한 TaqMan 방법(미국 특허 제5,210,015호 및 제5,538,848호)이 본 기술분야에서 널리 이용되고 있다.
표지된 프라이머를 이용한 방법의 예로는 Sunrise 프라이머 방법(Nazarenko et al, 2516-2521 Nucleic Acids Research, 1997, v.25 no.12, 및 미국 특허 제6,117,635호), Scorpion 프라이머 방법(Whitcombe et al, 804-807, Nature Biotechnology v.17 AUGUST 1999 및 미국 특허 제6,326,145) 및 TSG 프라이머 방법(WO 2011/078441)이 있다.
대안적인 방법으로서, 타겟 핵산 서열의 존재에 따라 형성되는 이합체를 이용한 실시간 검출 방법이 제안되어왔다: Invader 분석(미국 특허 제5,691,142호, 제6,358,691호 및 제6,194,149호), PTOCE(PTO cleavage AND extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법 (WO 2013/115442), PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(PCT/KR2013/012312).
종래 실시간 검출 기법들은 타겟 증폭과 관련되거나 관련되지 않은 신호 증폭 공정에서 하나의 선택된 검출 온도에서 형광 표지로부터 생성된 신호를 검출한다. 종래 실시간 검출 기술에 따라 단일 반응용기 내에서 단일 유형의 표지를 이용하여 다수의 타겟 핵산 서열을 검출할 때, 타겟 핵산 서열들에 대해 생성된 신호들은 서로 구별되지 못한다. 따라서, 종래 실시간 검출 기법들은 일반적으로 다수의 타겟 핵산 서열을 검출하기 위해 상이한 유형의 표지를 이용한다. Tm 차이를 이용한 멜팅 분석은 단일 유형의 표지를 이용하는 경우에도 다수의 타겟 핵산 서열을 검출할 수 있게 한다. 하지만, 멜팅 분석은 실시간 기술보다 시간이 더 소요되고 타겟 서열이 증가할수록 상이한 Tm을 갖는 프로브의 설계가 더 어렵다는 점에서 심각한 단점을 가진다.
따라서, 멜팅 분석에 의존하지 않는, 단일 반응용기 내에서 단일 유형의 표지 및 단일 유형의 검출기를 이용하여 다수의 타겟 핵산 서열을 검출하는 방법이 개발된다면, 현저히 향상된 편의성, 비용 효과 및 효율성으로 다수의 타겟 핵산 서열을 검출할 수 있을 것이다. 또한, 상기 방법을 다른 검출 방법(예를 들어, 멜팅 분석)과 조합한다면 매우 향상된 효율로 단일 반응용기에서 단일 유형의 라벨을 이용하여 다수의 타겟 핵산 서열을 검출할 수 있을 것이다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 신호-발생 반응으로부터 얻은 데이터 세트로부터 오류 없이(특히, 위양성 없이) 타겟 분석물을 분석할 수 있는 기술을 개발하고자 노력하였다. 특히, 본 발명자들은 핵산증폭반응에서 Ct 값을 얻기 위한 역치값(threshold)의 설정에 따른 종래의 방법의 문제점 및 단점을 극복하고자 노력하였다. 그 결과, 본 발명자들은 신호-발생 반응으로부터 얻은 데이터 세트 또는 가공된 데이터 세트(processed data set)에 대한 비-선형 함수의 피팅 정확도(fitting accuracy)가 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있는 지표(indicator)가 될 수 있음을 규명하였다. 본 발명자들은 특히 핵산증폭반응에서 Ct 값을 얻기 위한 역치값의 설정 없이도 피팅 정확도를 이용하여 타겟 분석물의 존재 또는 부존재를 결정할 수 있음을 규명하였고, 상술한 종래의 문제점을 해결할 수 있음을 규명하였다.
따라서, 본 발명의 목적은 시료 내 타겟 분석물의 분석 방법을 제공하는 데 있다.
본 발명의 다른 목적은 시료 내 타겟 분석물의 분석 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은 시료 내 타겟 분석물의 분석을 실행하기 위한 컴퓨터 해독가능한 기록매체를 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 실시예, 청구범위 및 도면에 의해 보다 명확하게 된다.
I. 비-선형 함수를 이용하여 시료 내 타겟 분석물을 분석하는 방법
본 발명의 일 양태에 따르면, 본 발명은 다음 단계를 포함하는 시료 내 타겟 분석물의 분석 방법을 제공한다:
상기 타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
상기 데이터 세트를 보정하는 단계;
상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하는 단계;
상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 피팅 정확도를 결정하는 단계; 및
상기 피팅 정확도를 이용하여 상기 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계.
본 발명은 “타겟 분석물을 분석하는 방법”으로 표현되지만, 분석 결과가 궁극적으로 타겟 분석물의 검출에 이용되기 때문에, “타겟 분석물의 분석 방법” 또는 “타겟 분석물의 검출 방법”으로 표현될 수 있다.
도 3은 본 발명의 방법에 대한 순서도이다. 도 3을 참조하여, 본 발명의 방법을 각각의 단계별로 상세하게 설명하면 다음과 같다.
타겟 분석물에 대한 데이터 세트를 수득(단계 310)
본 발명에 따르면, 타겟 분석물에 대한 데이터 세트를 수득한다. 상기 데이터 세트는 신호-발생 수단을 이용하는 상기 타겟 분석물에 대한 신호-발생 반응으로부터 수득되고, 상기 데이터 세트는 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함한다.
본 명세서에서 용어 “타겟 분석물(target analyte)”은 다양한 물질(예컨대, 화합물과 같은 생물학적 물질 및 비생물학적 물질)을 포함하며, 구체적으로 생물학적 물질, 보다 구체적으로 핵산분자(예컨대, DNA 및 RNA), 단백질, 펩타이드, 탄수화물, 지질, 아미노산, 생물학적 화합물, 호르몬, 항체, 항원 및 대사물질이다. 가장 구체적으로, 타겟 분석물은 타겟 핵산분자이다.
본 명세서에서 용어 “타겟 핵산분자”, “타겟 핵산”, “타겟 핵산서열” 또는 “타겟 서열”은 분석, 검출 또는 정량하고자 하는 핵산 서열을 의미한다. 타겟 핵산 서열은 단일- 또는 이중-가닥일 수 있다. 타겟 핵산 서열은 시료 내 초기에 존재하는 서열뿐만 아니라 반응 과정에서 생성된 서열을 포함한다.
타겟 핵산서열은 DNA(gDNA 및 cDNA), RNA 분자 및 이들의 혼성체(키메라 핵산)를 포함한다. 상기 서열은 이중-가닥 또는 단일-가닥 형태일 수 있다. 출발 물질로서 상기 핵산서열이 이중-가닥인 경우, 상기 두 가닥을 단일-가닥 또는 부분적 단일-가닥으로 변성시킬 수 있다. 변성 과정은 종래 기술들에 의하여 실시될 수 있으며, 예컨대, 열, 알카리, 포름아미드, 우레아 및 글리콕살 처리, 효소적 방법(예, 헬리카아제 작용) 및 결합 단백질을 포함하나, 이에 한정되는 것은 아니다. 예를 들어, 변성은 80-105℃의 온도로 열처리하여 달성될 수 있다. 이러한 처리의 일반적인 방법은 Joseph Sambrook, 등, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001)에 개시되어 있다.
타겟 핵산서열은 어떠한 자연(naturally occurring) 원핵세포 핵산, 진핵세포(예컨대, 원생동물과 기생동물, 균류, 효모, 고등 식물, 하등 동물 및 포유동물과 인간을 포함하는 고등 동물) 핵산, 바이러스(예컨대, 헤르페스 바이러스, HIV, 인플루엔자 바이러스, 엡스타인-바 바이러스, 간염 바이러스, 폴리오바이러스 등) 핵산 또는 비로이드 핵산도 모두 포함한다. 타겟 핵산 서열은 재조합 방법 또는 화학적 합성법으로 제조된 또는 제조될 수 있는 핵산 분자를 포함한다. 따라서, 타겟 핵산 서열은 자연계에 존재하거나 비존재하는 것일 수 있다. 타겟 핵산 서열은 공지 또는 비공지의 서열을 포함한다.
본 명세서에서 용어 “시료”는 생물학적 시료(예컨대, 세포, 조직 및 체액) 및 비생물학적 시료(예컨대, 음식물, 물 및 토양)를 포함하며, 상기 생물학적 시료는 예컨대, 바이러스, 세균, 조직, 세포, 혈액(전혈, 혈장 및 혈청 포함), 림프, 골수액, 타액, 객담(sputum), 스왑(swab), 흡인액(aspiration), 우유, 소변(urine), 분변(stool), 안구액, 정액, 뇌 추출물, 척수액, 관절액, 흉선액, 기관지 세척액, 복수 및 양막액이다. 타겟 분석물이 타겟 핵산분자인 경우 상기 시료는 핵산 추출(nucleic acid extraction) 과정을 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)). 상기 핵산 추출 과정은 시료의 종류에 따라 달라질 수 있다. 또한, 상기 추출된 핵산이 RNA인 경우 cDNA를 합성하기 위한 역전사(reverse transcription) 과정을 추가로 거칠 수 있다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001).
본 명세서에서 용어 "신호-발생 반응“은 시료 내 타겟 분석물의 특성(properties)에 의존적으로 신호를 발생시키는 반응을 의미한다. 상기 특성은 예컨대 타겟 분석물의 활성, 양 또는 존재(또는 부존재)이며, 구체적으로 시료 내 타겟 분석물의 존재 또는 부존재이다. 본 발명의 신호-발생 반응은 생물학적 반응 및 화학적 반응을 포함한다. 상기 생물학적 반응은 PCR, 실-시간 PCR, 마이크로어레이 및 인베이더(invader) 분석과 같은 유전적 분석 과정, 면역학적 분석 과정 및 박테리아 성장 분석을 포함한다. 상기 화학적 반응은 화학물질의 생성, 변화 또는 파괴를 포함하는 화학적 분석 과정을 포함한다. 본 발명의 일 구현예에 따르면, 신호-발생 반응은 유전적 분석 과정이다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 핵산 증폭반응, 효소 반응 또는 미생물 성장이다.
신호-발생 반응은 신호 변화를 동반한다. 본 명세서에서 용어 "신호“는 측정 가능한 아웃풋(output)을 의미한다.
신호-발생 반응의 진행정도는 신호를 측정하여 평가된다. 신호값 또는 신호 변화는 타겟 분석물의 특성, 구체적으로 존재 또는 부존재를 정성적으로 또는 정량적으로 지시하는 지시자 역할을 한다. 상기 신호 변화는 신호의 증가뿐만 아니라 감소도 포함한다.
본 명세서에서 용어 "신호-발생 수단"은 분석하고자 하는 타겟 분석물의 특성, 구체적으로 존재 또는 부존재를 나타내는 신호의 발생에 사용되는 물질을 의미한다.
다양한 신호-발생 수단이 알려져 있다. 신호-발생 수단은 표지를 포함한다. 상기 표지는 형광 표지, 발광 표지, 화학발광 표지, 전기화학적 표지 및 금속 표지를 포함한다. 단일 표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지가 하나 이상의 올리고뉴클레오타이드에 결합된 형태로 사용될 수 있다. 또는 인터컬레이팅 염료(intercalating dye) 자체도 신호-발생 수단으로서의 역할을 할 수 있다. 상기 신호-발생 수단은 신호를 발생시키기 위하여 핵산 절단 활성을 갖는 효소(예를 들어, 5' 핵산 절단 활성을 갖는 효소 또는 3' 핵산 절단 활성을 갖는 효소) 및 올리고뉴클레오타이드(예컨대, 프라이머 및 프로브)를 추가적으로 포함할 수 있다.
신호-발생 수단으로서 역할을 하는 올리고뉴클레오타이드의 예에는 타겟 핵산서열에 특이적으로 혼성화하는 올리고뉴클레오타이드를 포함한다(예컨대, 프로브 및 프라이머); 타겟 핵산서열에 혼성화된 프로브 또는 프라이머가 절단되어 단편을 방출한 경우, 신호-발생 수단으로서의 역할을 하는 올리고뉴클레오타이드는 상기 단편에 특이적으로 혼성화되는 캡처 올리고뉴클레오타이드를 포함한다; 상기 캡처 올리고뉴클레오타이드에 혼성화된 단편이 연장되어 연장 가닥을 생성하는 경우에, 신호-발생 수단으로서의 역할을 하는 올리고뉴클레오타이드는 상기 연장 가닥에 특이적으로 혼성화 되는 올리고뉴클레오타이드를 포함한다; 신호-발생 수단으로서의 역할을 하는 올리고뉴클레오타이드는 상기 캡처 올리고뉴클레오타이드에 특이적으로 혼성화 하는 올리고뉴클레오타이드를 포함한다; 그리고 신호-발생 수단으로서의 역할을 하는 올리고뉴클레오타이드는 이의 조합을 포함한다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 수단은 형광 표지를 포함한다. 보다 구체적으로 상기 신호-발생 수단은 형광 단일표지 또는 공여 분자(donor molecule) 및 수용 분자(acceptor molecule)를 포함하는 상호작용적인 이중 표지(예컨대, 형광 리포터 분자 및 퀀처 분자 포함하는 상호작용적인 이중 표지)를 포함한다.
상기 신호-발생 수단을 이용하여 타겟 분석물, 특히 타겟 핵산분자의 존재를 나타내는 신호를 발생시키는 다양한 방법이 알려져 있다. 상기 방법들은 다음을 포함한다: TaqMan 프로브 방법(미국특허 제5,210,015호), 분자 비콘 방법(Tyagi 등, Nature Biotechnology, 14 (3): 303(1996)), 스콜피온(Scorpion) 방법(Whitcombe 등, Nature Biotechnology 17:804-807(1999)), 선라이즈(Sunrise 또는 Amplifluor) 방법(Nazarenko 등, Nucleic Acids Research, 25(12):2516-2521(1997), 및 미국특허 제6,117,635호), 럭스(Lux) 방법(미국특허 제7,537,886호), CPT(Duck P, 등. Biotechniques, 9:142-148(1990)), LNA 방법 (미국특허 제6,977,295호), 플렉서(Plexor) 방법(Sherrill CB, 등, Journal of the American Chemical Society, 126:4550-4556(2004)), Hybeacons 방법(D.J. French, 등, Molecular and Cellular Probes (2001) 13, 363-374 및 미국특허 제7,348,141호), 이중표지된 자가-퀀칭된 프로브 방법(Dual-labeled, self-quenched probe; 미국특허 제5,876,930호), 혼성화 프로브 방법(Bernard PS, et al., Clin Chem 2000, 46, 147-148), PTOCE(PTO cleavage and extension) 방법(WO 2012/096523), PCE-SH(PTO Cleavage and Extension-Dependent Signaling Oligonucleotide Hybridization) 방법(WO 2013/115442), PCE-NH(PTO Cleavage and Extension-Dependent Non-Hybridization) 방법(PCT/KR2013/012312) 및 CER 방법(WO 2011/037306).
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 상기 타겟 핵산분자의 증폭으로 또는 증폭 없이 신호값을 증폭하는 반응이다.
본 명세서에서 용어 "증폭 반응"은 신호를 증가 또는 감소시키는 반응을 의미한다.
본 발명의 일 구현예에 따르면, 상기 증폭 반응은 타겟 분석물의 존재에 의존적으로 상기 신호-발생 수단에 의하여 발생하는 신호의 증가(또는 증폭) 반응을 의미한다. 이러한 증폭 반응은 타겟 분석물(예컨대, 핵산분자)의 증폭이 동반되거나 또는 동반되지 않을 수 있다. 보다 구체적으로, 본 발명에 있어서 증폭 반응은 타겟 분석물의 증폭이 동반되는 신호의 증폭 반응을 의미한다.
본 발명의 일 구현예에 따르면, 타겟 분석물(예컨대, 타겟 핵산분자)의 존재를 나타내는 신호를 증폭시키기 위한 증폭 반응은 타겟 핵산분자가 증폭되면서, 신호도 증폭되는 방법으로 실시될 수 있다(예를 들어, 실시간 PCR 방법). 또는 상기 증폭 반응은 타겟 분석물이 증폭되지 않고, 신호만이 증폭되는 방법으로 실시될 수 있다[예를 들어, CPT 방법(Duck P, et al., Biotechniques, 9:142-148(1990)), 인베이더 어세이(Invader assay)(미국특허 제6,358,691호 및 제6,194,149호)]
타겟 분석물, 특히 타겟 핵산분자는 다양한 방법으로 증폭될 수 있다. 예를 들어, 타겟 분석물의 증폭에 대한 다양한 방법들이 알려져 있으며, 상기 방법들은 중합효소연쇄반응(polymerase chain reaction (PCR)), 리가아제 연쇄반응(ligase chain reaction (LCR)) (미국특허 제4,683,195호 및 제4,683,202호; PCR Protocols: A Guide to Methods and Applications (Innis et al., eds, 1990)), 가닥 치환 증폭(strand displacement amplification (SDA)) (Walker, et al. Nucleic Acids Res. 20(7):1691-6 (1992); Walker PCR Methods Appl 3(1):1-6 (1993)), 전사 매개 증폭(transcription-mediated amplification) (Phyffer, et al., J. Clin. Microbiol. 34:834-841 (1996); Vuorinen, et al., J. Clin. Microbiol. 33:1856-1859 (1995)), 염기순서기반증폭(nucleic acid sequence-based amplification (NASBA)) (Compton, Nature 350(6313):91-2 (1991)), 롤링서클 증폭(rolling circle amplification, RCA) (Lisby, Mol. Biotechnol. 12(1):75-99 (1999); Hatch et al., Genet. Anal. 15(2):35-40 (1999)) 및 Q-beta 레플리카제(Q-Beta Replicase) (Lizardi et al., BiolTechnology 6:1197(1988))을 포함하나, 이에 한정되지 않는다.
본 발명의 일 구현예에 따르면, 상기 증폭 반응은 타겟 분석물(구체적으로, 타겟 핵산분자)의 증폭이 수반되면서 신호를 증폭한다. 본 발명의 일 구현예에 따르면, 상기 증폭 반응은 PCR 또는 실-시간 PCR에 따라 실시된다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 수단은 이합체의 형성에 의존적으로 신호를 생성시킨다. 신호-발생 수단과 함께 사용되는 표현 “이합체의 형성에 의존적으로 신호를 생성”은 검출되는 신호가 두 핵산 분자들의 결합 또는 분리에 의존적으로 제공됨을 의미한다. 구체적으로, 신호는 상기 타겟 핵산서열에 특이적으로 혼성화된 매개 올리고뉴클레오타이드(mediation oligonucleotide)의 절단에 의존적으로 형성된 이합체의 의해 생성된다. 본 명세서에서 용어 “매개 올리고뉴클레오타이드(mediation oligonucleotide)”는 타겟 핵산서열을 포함하지 않는 이합체의 생성을 매개하는 올리고뉴클레오타이드 이다. 본 발명의 일 구현예에 따르면, 상기 매개 올리고뉴클레오타이드 자체의 절단은 신호를 생성하지 않고 상기 절단에 의해 형성된 단편은 상기 매개 올리고뉴클레오타이드의 혼성화 및 절단 이후 신호 생성을 위한 연속적인 반응들에 관여한다. 본 발명의 일 구현예에 따르면, 상기 매개 올리고뉴클레오타이드는 타겟 핵산서열에 혼성화하고 절단되어 단편을 방출하여 이합체의 생성을 매개하는 올리고뉴클레오타이드를 포함한다. 구체적으로, 상기 단편은 캡처 올리고뉴클레오타이드(capture oligonucleotide)에서 상기 단편의 연장에 의해 이합체의 생성을 매개한다. 본 발명의 일 구현예에 따르면, 상기 매개 올리고뉴클레오타이드는 (ⅰ) 상기 타겟 핵산서열에 상보적인 혼성화 뉴클레오타이드 서열을 포함하는 3’-타겟팅 부위(targeting portion) 및 상기 타겟 핵산서열에 비-상보적인 뉴클레오타이드 서열을 포함하는 5’-태깅 부위(tagging portion)을 포함한다. 본 발명의 일 구현예에 따르면, 매개 올리고뉴클레오타이드의 절단은 단편을 방출하고 상기 단편은 캡처 올리고뉴클레오타이드에 특이적으로 혼성화되며 상기 캡처 올리고뉴클레오타이드 상에서 연장된다. 본 발명의 일 구현예에 따르면, 타겟 핵산서열에 혼성화된 매개 올리고뉴클레오타이드는 절단되어 단편을 방출하고 상기 단편은 캡처 올리고뉴클레오타이드에 특이적으로 혼성화되며, 상기 단편은 연장되어 연장 가닥을 형성하고, 상기 연장 가닥 및 상기 캡처 올리고뉴클레오타이드 사이에 연장 이합체를 형성하여 상기 타겟 핵산서열의 존재를 나타내는 신호를 제공한다. 이합체의 형성에 의존적으로 신호를 발생하는 신호-발생 수단의 대표적인 예는 PTOCE 방법이다(WO 2012/096523).
본 발명의 일 구현예에 따르면, 상기 신호-발생 수단은 검출 올리고뉴클레오타이드의 절단에 의존적으로 신호를 생성시킨다. 구체적으로, 상기 신호는 타겟 핵산서열에 상기 검출 올리고뉴클레오타이드의 혼성화 및 상기 검출 올리고뉴클레오타이드의 절단에 의해 생성된다. 타겟 핵산서열에 상기 검출 올리고뉴클레오타이드의 혼성화 및 상기 검출 올리고뉴클레오타이드의 절단에 의한 신호는 TaqMan 프로브 방법(미국특허 제5,210,015호 및 제5,538,848호)을 포함하는 다양한 방법으로 생성될 수 있다.
증폭 반응을 통하여 수득하는 데이터 세트에는 증폭 사이클 또는 사이클 번호가 포함된다.
본 명세서에서 용어 “사이클”은 일정한 조건의 변화를 수반한 복수의 측정에 있어, 상기 조건의 변화 단위를 말한다. 상기 일정한 조건의 변화는 예를 들어 온도, 반응시간, 반응횟수, 농도, pH 및/또는 측정 대상(예를 들어, 타겟 핵산분자)의 복제 횟수 등의 증가 또는 감소를 의미한다. 따라서 사이클은 시간(time) 또는 과정(process) 사이클, 단위 운영(unit operation) 사이클 및 재생산(reproductive) 사이클 일 수 있다.
일 예로 기질의 농도에 따른 효소의 기질 분해 능력을 측정하는 경우, 기질 농도를 달리하여 수 차례 효소의 기질 분해 정도를 측정한 후, 이로부터 효소의 기질 분해 능력을 분석한다. 이때 일정한 조건의 변화는 기질 농도의 증가이며, 사용된 기질 농도 증가 단위가 하나의 사이클로 설정된다.
다른 일 예로 핵산의 등온증폭 반응(isothermal amplification)의 경우 하나의 시료를 반응시간을 달리하여 수차례 측정을 할 수 있으며, 이 경우 반응시간이 조건의 변화이며, 반응시간 단위가 하나의 사이클로 설정된다.
보다 구체적으로, 용어 "사이클"은 일정한 과정의 반응을 반복하거나 일정한 시간 간격 기준으로 반응을 반복하는 경우, 상기 반복의 하나의 단위를 의미한다.
일 예로 중합효소 연쇄 반응(PCR)의 경우 하나의 사이클은 타겟 핵산분자의 변성단계(denaturation), 상기 타겟 핵산분자 및 프라이머의 사이의 어닐링(혼성화) 단계 및 프라이머의 연장 단계(extension)를 포함하는 반응 단위를 의미한다. 이 경우 일정한 조건의 변화는 반응의 반복 횟수의 증가이며, 상기 일련의 단계를 포함하는 반응의 반복 단위가 하나의 사이클에 해당한다.
신호-발생 반응에 의해 얻은 데이터 세트는 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함한다.
본 명세서에서 용어 “신호의 값” 또는 “신호값”은 신호-발생 반응의 사이클에서 실제적으로 측정된 신호의 값(예컨대, 신호의 세기) 또는 이의 변형값을 의미한다. 상기 변형값은 측정된 신호값의 수학적으로 가공된 값을 포함할 수 있다. 측정된 신호값의 수학적으로 가공된 값의 예는 측정된 신호값의 로그값 또는 도함수값(derivatives)을 포함할 수 있다. 측정된 신호값의 도함수값은 다중-도함수값을 포함할 수 있다.
본 명세서에 용어 “데이터 지점(data point)”은 사이클 번호 및 신호값을 포함하는 하나의 좌표값(a coordinate value)을 의미한다. 용어 “데이터”는 데이터 세트를 구성하는 모든 정보를 의미한다. 예컨대, 증폭 반응의 사이클 및 신호값 각각은 데이터이다.
신호-발생 반응, 특히 증폭 반응에 의해 얻어진 데이터 지점들은 2차원 직교 좌표계에 나타낼 수 있는 좌표값으로 표시될 수 있다. 상기 좌표값에서 X-축은 증폭 반응의 해당 사이클 수를 나타내며, Y-축은 해당 사이클에서 측정 또는 가공된 신호값을 나타낸다.
본 명세서에 용어 “데이터 세트”는 상기 데이터 지점들의 집합을 의미한다. 예를 들어, 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응(예컨대, 증폭 반응)으로부터 직접적으로 수득되는 데이터 지점의 집합인 원 데이터 세트(raw data set)를 포함 할 수 있다. 택일적으로, 상기 신호-발생 반응으로부터 직접적으로 수득된 데이터 지점들의 집합을 포함하는 데이터 세트의 변형에 의해 얻어지는 변형된 데이터 세트일 수 있다. 상기 데이터 세트는 신호-발생 반응으로부터 수득되는 데이터 지점들 또는 이의 변형된 데이터 지점들의 일부 또는 전체를 포함할 수 있다.
데이터 세트는 플롯팅될 수 있으며 상기 데이터 세트로부터 증폭곡선을 얻을 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 데이터 세트를 수득하기 위한 신호-발생 반응을 실시하는 단계를 추가적으로 포함한다.
데이터 세트를 보정(단계 320)
데이터 세트를 보정한다. 보정된 데이터 세트는 데이터 세트를 표준화(표준화 과정) 하여 생성되거나, 데이터 세트에 포함된 노이즈를 제거(노이즈 제거 과정)하여 제공될 수 있다. 일 구현예에 따르면, 데이터 세트는 표준화 과정 및 노이즈 제거 과정을 모두 이용하여 보정된다. 표준화 과정이 노이즈 제거 과정보다 먼저 또는 나중에 실시될 수 있다.
(A) 데이터 세트의 표준화
데이터 세트는 공지된 다양한 방법으로 표준화될 수 있다.
일 구현예에 따르면, 상기 데이터 세트의 표준화는 본 출원인이 이미 개발한 WO 2017/086762에 개시된 SBN 방법에 의해 실시된다. 비-선형 피팅 함수를 이용하는 본 발명의 방법에 상기 SBN 방법의 적용은 WO 2017/086762 및 본 특허출원의 명세서를 참조하여 당업자들에 의해 용이하게 실시될 수 있다고 당업자들은 이해할 것이다. 상기 SBN 방법은 아래에서 상세히 설명될 것이다.
일 구현예에 따르면, 상기 데이터 세트의 표준화는 다음의 단계를 포함하는 단계들로 실시된다: (i) 기준 사이클에서의 신호값 또는 (ii) 상기 기준 사이클에서의 상기 신호값의 변형값을 이용하여 표준화 계수를 생성하는 단계; 및 상기 표준화 계수를 상기 데이터 세트의 신호값들에 적용하여 상기 보정된 데이터 세트를 생성하는 단계. 데이터 세트는 제 1 데이터 세트로 표기되고, 표준화된 데이터 세트는 제 2 데이터 세트로 표기될 수 있다.
(A-1) 표준화 계수를 생성
(i) 기준 사이클에서의 신호값 또는 (ii) 기준 사이클에서의 신호값의 변형값을 이용하여 표준화 계수가 생성된다.
기준 사이클에서의 신호값이 표준화 계수가 될 수 있다. 기준 사이클에서의 신호값을 데이터 세트의 신호값들에 적용하여 데이터 세트를 표준화한다. 일 예에서, 기준 사이클에서의 신호값으로 데이터 세트의 신호값들을 나누는 것일 수 있다.
기준 사이클에서의 신호값의 변형값을 이용하여 표준화 계수가 생성되는 경우, 기준 사이클에서의 신호값과 기준값 사이의 관계를 이용하여 표준화 계수가 결정될 수 있다. 기준 사이클에서의 신호값과 기준값 사이의 관계는 기준 사이클에서의 신호값과 기준값의 차이일 수 있다. 구체적으로, 기준 사이클에서의 신호값과 기준값의 차이는 기준 사이클에서의 신호값과 기준값의 비(ratio)이다. 일 구현예에 따르면, 변형값을 이용하여 데이터 세트를 표준화하는 것은 변형값으로 데이터 세트의 신호값들을 나누는 것일 수 있다.
일 구현예에 따르면, 기준 사이클은 하나의 사이클 또는 복수의 사이클이다. 구체적으로, 데이터 세트의 5 사이클이 기준 사이클로 선택될 수 있다. 택일적으로, 4, 5 및 6 사이클들이 상기 기준 사이클로 선택될 수 있다. 기준 사이클이 복수인 경우, 복수의 사이클들에서의 신호값들의 평균값이 기준 사이클에서의 신호값으로 사용될 수 있다.
기준 사이클은 신호-발생 반응에서 신호 증폭이 검출되지 않는 사이클일 수 있다. 예를 들어, 핵산 증폭반응을 통해 수득된 데이터 세트들의 경우, 기준 사이클은 베이스라인 영역에서 선택될 수 있다.
본 발명의 일 구현예에 따르면, 신호-발생 반응은 베이스라인 영역과 신호 증폭 영역을 포함하는 반응이며, 기준 사이클은 베이스라인 영역에 위치한다. 본 발명의 기준 사이클은 50, 40, 30, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9 또는 8 번째 사이클 이하일 수 있다. 구체적으로 기준 사이클은 1-30 사이클, 2-30 사이클, 2-20 사이클, 2-15 사이클, 2-10 사이클, 2-8 사이클, 3-30 사이클, 3-20 사이클, 3-15 사이클, 3-10 사이클, 3-9 사이클, 3-8 사이클, 4-8 사이클 또는 5-8 사이클 중 어느 하나의 사이클로 결정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 기준 사이클은 하나의 사이클이다. 또한, 상기 기준 사이클은 둘 이상의 사이클들을 포함할 수 있고, 기준 사이클에서의 신호값은 복수의 신호값들을 포함한다.
예를 들어, 4, 5, 및 6 번째 사이클들이 기준 사이클로 지정될 수 있고, 기준 사이클들에서의 신호값들의 평균값을 표준화 계수를 제공하기 위한 신호값으로 이용할 수 있다.
표준화 계수로서, 기준 사이클에서의 신호값을 그대로 이용할 수 있지만, 또한 기준 사이클에서의 신호값의 변형값을 이용할 수도 있다.
일 구현예에 따르면, 변형값은 기준 사이클에서의 신호값과 기준값 사이의 관계를 결정하여 제공될 수 있다. 변형값이 기준 사이클에서의 신호값과 기준값의 비(ratio)로 결정되는 경우, 변형값은 다음의 수학식 1에 의해 제공될 수 있다.
수학식 1
Figure 112020037081791-pct00001
예를 들어, 기준 사이클로 5 번째 사이클이고, 5 번째 사이클에서의 신호값이 13,285 RFU이고, 기준값이 9000 RFU일 때, 변형값은 1.48이 될 수 있다.
기준값은 임의로 정해질 수 있다. 구체적으로, 기준값은 0 또는 1이 아닌 실수 중에서 임의로 정해진 값이다. 일 구현예에 따르면, 기준값은 사이클들에서의 신호값들의 평균값±표준편차 범위 내에서 결정된다.
본 발명의 일 구현예에 따르면, 기준값은 (ⅰ) 기준 총 신호 변화값(reference total signal change value)에 대한 표준 데이터 세트의 총 신호 변화값(total signal change value)의 비율; 상기 표준 데이터 세트는 알려진 농도의 타겟 분석물에 대한 신호-발생 반응에 의해 수득되고, 및 (ⅱ) 표준 데이터 세트에 의해 결정될 수 있다. 구체적으로 기준 총 신호 변화값에 대한 표준 데이터 세트의 총 신호 변화값의 비율을 이용하여 표준 데이터 세트의 기준 사이클의 신호값을 보정하고, 보정된 표준 데이터 세트의 기준 사이클의 신호값으로부터 기준값을 결정한다. 일 예에서, 보정된 표준 데이터 세트의 기준 사이클의 신호값이 기준값으로 결정된다.
표준 데이터 세트는 알려진 농도의 타겟 분석물에 대한 신호-발생 반응에 의해 수득된 데이터 세트를 말한다.
본 발명의 일 구현예에 따르면, 상기 데이터 세트는 총 신호 변화값을 이용하여 보정된다. 본 명세서에서 용어 “총 신호 변화값(total signal change value)”은 데이터 세트에서 (증가 또는 감소된) 신호 변화량을 의미한다. 데이터 세트의 일 구간에서 총 신호 변화값을 결정하는 경우, 데이터 세트의 일 구간에서 최초 사이클 및 마지막 사이클에서의 신호값의 차이 또는 데이터 세트의 일 구간에서의 최대 신호값과 최소 신호값에서의 차이가 총 신호 변화값으로 결정될 수 있다.
신호-발생 반응이 동일한 조건하에서 동일한 농도의 타겟 분석물을 이용하여 실시되는 경우, 동일한 총 신호 변화값은 동일한 또는 상이한 장비로부터 이론적으로 산출될 수 있다. 따라서 총 신호 변화값을 기준으로 데이터 세트를 보정하는 경우. 복수의 데이터 세트 사이의 편차가 감소된다.
본 발명의 일구현예에 따르면, 기준 총 신호 변화값은 타겟 분석물에 대한 데이터 세트와는 별개의 신호 발생 반응에 의해 수득된 표준 데이터 세트의 총 신호 변화값이다. 본 발명의 기준 총 신호 변화값은 알려진 농도의 타겟 분석물에 대한 신호-발생 반응에 의해 수득된 데이터 세트로부터 결정될 수 있다.
기준값으로 표준화 하려는 데이터 세트에서의 기준 사이클의 신호값을 나누어 표준화 계수가 제공될 수 있다.
(A-2) 표준화 계수를 데이터 세트에 적용
표준화 계수를 데이터 세트에 적용하여 표준화된 데이터 세트를 생성한다. 표준화 계수를 데이터 세트에 적용하는 방식은 다양하다. 표준화 계수를 비(ratio)로 결정한 경우, 표준화 계수는 다음의 수학식 2와 같이 적용되어 표준화된 데이터 세트를 생성한다.
수학식 2
Figure 112020037081791-pct00002
수학식 2에서 제 1 데이터 세트는 표준화 이전의 데이터 세트이고, 제 2 데이터 세트는 표준화 이후의 데이터 세트이다.
본 발명의 일 구현예에 따르면, 상기 신호-발생 반응은 다른 반응 환경(reaction environment)에서 동일한 타겟 분석물에 대한 복수의 신호-발생 반응을 포함하고; 상기 데이터 세트는 복수의 데이터 세트이고, 상기 복수의 데이터 세트는 상기 복수의 신호-발생 반응의 복수의 세트로부터 수득되고; 상기 기준 사이클 또는 상기 기준 사이클과 상기 기준값은 상기 복수의 데이터 세트에 동일하게 적용된다. 일 구현예에 따르면, 상기 복수의 신호-발생 반응은 서로 다른 기기들, 다른 반응 튜브들 또는 웰들, 다른 시료들, 다른 양의 타겟 분석물, 또는 다른 프라이머들 또는 프로브들을 포함하는 다른 반응 환경에서 실시된다.
일 구현예에 따르면, 상기 보정된 데이터 세트는 (i) 상기 데이터 세트에 상기 표준화 계수를 적용하여 표준화된 데이터 세트를 생성하거나, (ii) 상기 데이터 세트 또는 상기 표준화된 데이터 세트를 베이스라이닝하여 생성된다.
(B) 상기 데이터 세트에서 노이즈를 제거
(B-1) 베이스라이닝
(B-1-a) 종래 베이스라이닝 방법
본 발명의 일 구현예에 따르면, 상기 데이터 세트 또는 표준화된 데이터 세트는 상기 데이터 세트 또는 표준화된 데이터 세트로부터 배경 신호를 제거하기 위하여 베이스라이닝될 수 있다. 베이스라인 차감된 데이터 세트(baseline subtracted data set)는 당업계에 공지된 다양한 방법에 의해 얻어질 수 있다(미국특허 제8,560,247호 및 WO 2016/052991).
(B-1-b) 대칭축을 갖는 이차함수를 이용하여 베이스라이닝
이 접근법은 본 출원인에 의해 개발된 신규한 베이스라이닝 방법이다.
표준화 이전 데이터 세트 및 표준화 이후의 데이터 세트를 포함하는 데이터 세트는 대칭축을 갖는 이차함수를 이용하여 베이스라이닝 될 수 있다. 이차함수를 이용하여 데이터 세트를 베이스라이닝 한다는 것은 데이터 세트에서 이차함수를 차감하는 것에 의해 데이터 세트를 보정하는 것을 의미한다.
이차함수의 생성은 이차함수의 대칭축을 결정하고, 피팅 구간을 결정하고, 피팅 구간 내에서 데이터 세트와 이차함수를 피팅하여 실시될 수 있다.
이차함수의 대칭축은 신호-발생 반응의 최종 사이클에 기초하여 결정될 수 있다. 이차함수는 y=a(x-b)2 + c 형태의 함수이다. b는 이차함수의 대칭축이다. 본 발명의 일 구현예에 따르면, 이차함수의 대칭축은 최종 사이클±10, 최종 사이클±8, 최종 사이클±6, 최종 사이클±5, 최종 사이클±3, 최종 사이클±2 또는 최종 사이클±1의 범위에서 결정될 수 있다.
이차 함수에 의한 피팅 구간은 다양한 방법으로 결정될 수 있다.
우선, 피팅 구간은 미리 설정된 시작 피팅 사이클(Starting Fitting Cycle, SFC)부터 최소 피팅 사이클(Minimum Fitting Cycle, MFC)까지의 구역에서 결정될 수 있다. 시작 피팅 사이클은 0 사이클, 1 사이클, 2 사이클, 3 사이클, 4 사이클, 5 사이클, 6 사이클, 7 사이클, 8 사이클 또는 9 사이클일 수 있다. 최소 피팅 사이클은 7 사이클, 8 사이클, 9 사이클, 10 사이클, 11 사이클, 12 사이클, 13 사이클, 14 사이클, 15 사이클, 16 사이클, 17 사이클, 18 사이클, 19 사이클, 20 사이클 또는 21 사이클일 수 있다.
택일적으로, 피팅 구간을 결정할 때, 이차함수가 사용될 수 있다. 피팅 구간의 결정에 사용되는 이차함수는 제 1 이차함수로 표기되고, 데이터 세트의 보정에 사용되는 이차함수는 제 2 이차함수로 표기된다. 제 1 이차함수는 전체 구간에서 데이터 세트에 피팅되고, 제 2 이차함수는 피팅 구간에서 데이터 세트에 피팅된다. 또한, 제 1 이차함수는 대칭축을 갖지 않으나, 제 2 이차함수는 대칭축을 갖는다. 피팅 구간의 최종 사이클은 (ⅰ) 제1 이차함수가 최소일 때의 사이클(Cmin) 및/또는 (ⅱ) 최소 피팅 사이클에 기초하여 결정된다. 예를 들어, 피팅 구간의 최종 사이클은 (ⅰ) Cmin에서 N[N은 0 또는 양의 정수(구체적으로, 1-5의 정수)]을 뺀 사이클과 (ⅱ) 최소 피팅 사이클(MFC) 중 큰 사이클로 결정된다.
상기 결정된 피팅 구간 내에서, 데이터 세트 또는 표준화된 데이터 세트는 대칭축을 가지는 이차 함수와 피팅되고, 그 다음 대칭축을 가지는 이차 함수로 베이스라인-차감된다.
(B-2) 음성 대조군 차감
데이터 세트로부터 음성 대조군(negative control)을 차감하여 데이터 세트에서 노이즈를 제거할 수 있다. 음성 대조군은 신호-발생 반응을 위한 반응물에서 반응의 진행을 위한 필수성분이 1개 이상 없는 실험군이다. 예를 들어, 핵산증폭 반응에서 음성 대조군은 타겟 분석물, 프라이머 또는 중합효소가 없는 실험군이다. 또는 음성 대조군은 완충액만 있는 실험군이다. 구체적으로, 본 발명에서 이용되는 음성 대조군은, 핵산증폭 반응에서 타겟 핵산분자를 제외한 핵산증폭을 위한 성분들이 있는 실험군이다.
음성 대조군의 차감은 타겟 분석물에 대한 데이터 세트의 신호값으로부터 음성 대조군의 신호값을 차감하여 실시할 수 있다. 구체적으로, 타겟 분석물에 대한 데이터 세트의 신호값과 음성 대조군의 신호값은 동일한 반응 및 측정 환경에서 수득된 것이고, 예를 들어, 하나의 동일 증폭 및 분석 장치에서 동일한 반응 런(run)에서 수득된 신호값이다.
보정된 데이터 세트에 대한 비-선형 함수의 생성(단계 330)
보정된 데이터 세트에 대한 비-선형 함수(non-linear function)가 피팅 함수로 생성된다.
본 단계는 비선형 회귀 분석 방법에 따라 실시될 수 있다. 다양한 종래의 비선형 회귀 분석 방법이 본 발명에 이용될 수 있다(참조: Seber, G. A. F.; Wild, C. J. (1989). Nonlinear Regression. New York: John Wiley and Sons). 예를 들어 다항 함수, 지수 함수, 로그 함수, 삼각 함수 또는 시그모이드 함수가 비선형 함수로 이용될 수 있다.
본 발명의 일 구현예에 따르면, 본 발명에서 이용되는 비-선형 함수는 시그모이드 함수(sigmoid function)이다. 본 명세서에서 용어 “시그모이드 함수”는 시그모이드 형태의 곡선을 나타낼 수 있는 함수를 의미하며, 로지스틱 함수, Gompertz 함수 또는 Chapman 함수를 포함한다.
보정된 데이터 세트에 피팅된 비선형 함수를 생성한다. 비선형 함수를 생성한다는 것은 보정된 데이터 세트와 가장 일치하는(또는 가장 잘 나타내는) 비선형 함수를 결정하는 것을 의미할 수 있다. 본 단계는 기본적으로 비선형 회귀 분석 방법에 의해 실시된다.
본 발명의 일 구현예에서, 상기 비-선형 함수는 다음 수학식 3으로 표시되는 4개의 파라미터를 포함하는 시그모이드 함수일 수 있다.
수학식 3
Figure 112020037081791-pct00003
상기 수학식에서, f(x)는 피팅 함수로서 시그모이드 함수를 나타내고; x는 상기 신호-발생 반응의 사이클 번호를 나타내며; 그리고 a1, a2, a3 및 a4 각각은 독립적으로 상기 시그모이드 함수의 파라미터를 나타낸다.
일 구현예에 따르면, 상기 수학식 3에서 a1은 배경 신호값을 나타내고; a2-a1은 최대 신호값과 배경 신호값 사이의 차이를 나타내며; a3는 시그모이드 함수의 변곡점(inflection point)의 x 값을 결정하는 파라미터를 나타내고; a4는 시그모이드 함수의 첨예도(sharpness)를 결정하는 파라미터를 나타내며; a3 및 a4는 시그모이드 함수의 형태(shape)를 통합적으로 결정하는 파라미터를 나타낸다.
시그모이드 함수의 생성은 반복적인 계산에 의해 a1, a2, a3 및 a4를 결정하는 과정을 의미할 수 있다.
비-선형 함수의 생성은 상기 데이터 세트의 보정 후 또는 전에 실시할 수 있다. 구체적으로, 상기 비-선형 함수의 생성은 상기 데이터 세트의 보정 후에 실시된다.
비-선형 함수의 피팅 정확도를 결정(단계 340)
비선형 함수가 생성된 후, 보정된 데이터 세트에 대한 비선형 함수의 피팅 정확도(fitting accuracy)가 결정된다.
본 명세서에서 용어 “피팅 정확도”는 (a) 비선형 함수가 실제 측정값들(데이터 세트 또는 보정된 데이터 세트)과 얼마나 근접한지, 즉 피팅의 우수도(goodness of fit) 및 (b) 원인변수(explanatory variable)가 반응변수(response variable)를 예측하는데 얼마나 유용한지를 나타내는 값을 모두 포괄한다.
피팅의 우수도는 통상적으로 x2 값(chi square value)으로, 예측 유용성 값은 R2 값으로 나타낸다. 본 발명의 일 구현예에 따르면, 피팅 정확도는 보정된 데이터 세트에 대한 비선형 함수의 x2 값(chi square value) 또는 R2 값이다. 보다 구체적으로, 상기 피팅 정확도는 R2 값이다.
R2 값은 수학식 4를 이용하여 계산할 수 있다. 수학식 4는 전체 사이클에 대해 적용된다.
수학식 4
Figure 112020037081791-pct00004
yi: 데이터 세트의 각 사이클에서의 신호값
fi: 시그모이드 함수의 각 사이클에서의 함수값
ym: 데이터 세트의 신호값들의 평균값
L: 피팅 구간의 마지막 사이클
n: 전체 사이클의 수
수학식 4는 데이터 세트의 전체 분산 대비 오차(error)의 분산을 나타낸다. 오차는 데이터 세트와 시그모이드 함수의 차이이다. 수학식 4에서 데이터 세트는 표준화된 데이터 세트 또는 표준화 및 베이스라이닝된 데이터 세트일 수 있다.
피팅 정확도를 이용하여 타겟 분석물의 존재 또는 부존재를 결정(단계 350)
보정된 데이터 세트에 대한 비선형 함수의 피팅 정확도를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정한다.
본 발명의 특징 중 하나는 비선형 함수의 피팅 정확도를 타겟 분석물의 존재여부를 결정하는데 직접적인 지표로 이용하는 것이다. 시료 내 타겟 분석물의 존재 여부는 비선형 함수의 피팅 정확도를 이용(구체적으로, 직접적으로 이용)하여 결정되며, 이는 타겟 분석물의 존재여부를 결정하는데, 특히 Ct 값을 이용하지 않고, 상기 피팅 정확도만을 이용하거나 상기 피팅 정확도와 다른 기준(구체적으로, 비선형 피팅 함수와 관련된 파라미터들)을 함께 이용함을 의미한다.
핵산증폭 곡선에 시그모이드 함수를 적용한 선행기술들은 있지만, 비선형 함수의 피팅 정확도를 타겟 분석물의 존재여부를 결정하는데 직접적인 지표로 이용한 예는 없다.
예를 들어, 상술한 바와 같이 미국 공개 특허 제2009/0119020호는 시그모이드 함수의 R2 값을 이용하여 데이트 세트가 유의적 또는 유효한 성장을 나타내는지를 결정한다. 미국 공개 특허 제2009/0119020호의 교시사항들에 따르면, 타겟 분석물의 부존재만이 피팅 함수의 R2 값을 이용하여 결정될 수 있다. 타겟 분석물이 존재하는 것을 결정하기 위해서, Ct 값들을 얻는 추가적인 단계가 미국 공개 특허 제2009/0119020호에서는 필요할 것이다. 본 발명은 비선형 함수의 피팅 정확도(예, R2 값)을 직접적으로 이용하여 Ct 값들의 도움 없이도 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있다.
또한, 미국 공개 특허 제2009/0119020호는 R2 값들이 유의성 역치값(예, 0.90-0.99)을 초과하는 경우에, 데이터 세트는 유의적 또는 유효한 성장을 나타내지 않는 것으로, 즉 시료 내 타겟 분석물의 부존재를 나타내는 것으로 고려된다고 교시하고 있다. 이러한 접근법은 피팅 정확도(예, R2 값)가 역치값(예, 0.90-0.99)을 초과하는 경우 타겟 분석물이 존재하는 것으로 결정되는 후술한 본 발명의 방법의 일 구현예와 상반된다.
본 발명의 일 구현예에 따르면, 상기 타겟 분석물의 존재 또는 부존재를 결정하는 단계는 피팅 정확도를 피팅 정확도에 대한 역치값(threshold)과 비교하여 실시된다. 보다 구체적으로, 상기 타겟 분석물의 존재 또는 부존재를 결정하는 단계는 상기 피팅 정확도가 상기 역치값을 초과하는지 평가하여 실시된다. 피팅 정확도가 역치값을 초과하는 경우에, 타겟 분석물은 시료 내에 존재하는 것으로 결정될 수 있다. 피팅 정확도가 상기 역치값 이하인 경우에는, 타겟 분석물은 시료 내에 존재하지 않은 것으로 결정될 수 있다.
피팅 정확도로서 R2 값을 이용하는 경우, 역치값은 0.80, 0.85, 0.90, 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98 또는 0.99 이다.
타겟 분석물의 존재 또는 부존재는 비선형 함수의 피팅 정확도만을 이용하여 결정될 수 있다. 택일적으로, 타겟 분석물의 존재 또는 부존재는 특히 Ct 값을 이용하지 않고, 피팅 정확도 뿐만 아니라 추가적인 기준(구체적으로, 비선형 피팅 함수와 관련된 파라미터)을 이용하여 결정될 수 있다.
일 구현예에 따르면, 상기 시료 내 타겟 분석물의 존재 또는 부존재의 결정은 (ⅰ) 상기 데이터 세트, 상기 보정된 데이터 세트 또는 상기 비-선형 함수의 변위(displacement) 및 (ⅱ) 상기 비-선형 함수의 최대 기울기로 구성된 군으로부터 선택되는 최소 하나의 파라미터를 추가적으로 이용하여 실시된다.
일 구현예에 따르면, 상기 시료 내 타겟 분석물의 존재 또는 부존재의 결정은 (ⅰ) 상기 데이터 세트, 상기 보정된 데이터 세트 또는 상기 4개의 파라미터를 포함하는 시그모이드 함수의 변위 및 (ⅱ) 상기 4개의 파라미터를 포함하는 시그모이드 함수의 최대 기울기 및 a4 로 구성된 군으로부터 선택되는 최소 하나의 파라미터를 추가적으로 이용하여 실시된다.
추가적인 고려 사항들(considerations)은 시료 내 타겟 분석물의 부존재를 결정하는 데 특히 유용하다.
비선형 함수의 피팅 정확도가 타겟 분석물의 존재 또는 부존재를 결정하는데 유일한 지표로 역할을 하지만, 추가 고려 사항은 타겟 분석물을 포함하지 않은 음성 샘플을 보다 효과적으로 필터링하는데 이용될 수 있다. 또한, 음성 샘플에 대한 신호값들은 이론적으로 낮은 피팅 정확도를 나타낸다. 그러나, 때로는 높은 피팅 정확도를 가진다. 따라서, 위양성 결과를 초래할 수 있는 음성 샘플은 필터링해야 한다.
상기 데이터 세트, 상기 보정된 데이터 세트 또는 상기 비-선형 함수의 변위(displacement)는 시료 내 타겟 분석물의 부존재를 결정하는데 유용하다.
본 명세서에서 용어“변위”는 데이터 세트에서 신호 변화 정도, 구체적으로, 기준 신호값으로부터의 신호 변화 정도를 의미한다. 여기서 기준 신호값은 가장 작은 신호값, 첫 번째 사이클 신호값, 베이스라인 영역의 평균 신호값 또는 증폭구역 개시점에서의 신호값일 수 있다. 변위를 계산함에 있어서, 최종 신호값은 가장 큰 신호값, 최종 사이클의 신호값 또는 정체(plateau) 영역의 평균 신호값일 수 있다.
변위를 고려 또는 이용하여 타겟 분석물의 존재 또는 부존재를 결정하는 것은 다양한 방식으로 실시될 수 있다. 예를 들어, 데이터 세트의 변위가 변위에 대한 역치값 미만인 경우에, 그 데이터 세트는 음성으로 판단할 수 있다.
신호-발생 반응이 증폭 반응인 경우, 변위에 대한 역치값은 RFU(relative fluorescence unit) 70, 80, 90, 100, 110, 120, 130, 140 또는 150 이다.
또 다른 고려 요소는 비선형 함수의 최대 기울기이다.
양성 시료에 대한 증폭 곡선은 신호값이 급격하게 증가하는 증폭 구간을 포함하고, 음성 시료에 대한 증폭 곡선은 신호값이 급격하게 증가하는 증폭 구간이 없다. 따라서, 비선형 함수의 최대 기울기를 고려하여 시료에 대한 타겟 분석물의 양성 및 음성을 판정할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 상기 비선형 함수의 최대 기울기를 생성하는 단계; 및 상기 최대 기울기를 역치값과 비교하여 상기 시료 내 상기 타겟 분석물이 부존재하는 것으로 결정하는 단계를 포함한다.
비선형 함수의 최대 기울기를 계산하는 방법은 다양하다. 예를 들어 비선형 함수를 미분하고 미분된 비선형 함수의 최대값이 최대 기울기로 결정될 수 있다.
최대 기울기에 대한 역치값은 다양한 방식으로 설정될 수 있다. 예를 들어, 역치값은 다수의 시료들을 분석한 결과에 기초하여 설정될 수 있다. 예를 들어, 양성 또는 음성이 미리 정해진 다수의 시료들에서의 비선형 함수의 최대 기울기를 분석하고, 적합한 역치값을 선택할 수 있다. 예를 들어, 최대 기울기에 대한 역치값은 10-50, 20-50, 30-50, 10-40, 20-40 또는 30-40이고, 특히 20-40이다.
비선형 함수의 최대 기울기가 역치값 이상인 경우에는 시료 내 타겟 분석물이 존재하는 것으로 결정하고, 상기 최대 기울기가 역치값 미만인 경우에는 시료 내 타겟 분석물이 부존재하는 것으로 결정한다.
또 다른 추가 고려 요소는 비선형 함수의 형태를 나타내는 파라미터이다.
본 발명의 일 구현예에서, 비선형 함수의 형태를 나타내는 파라미터를 이용하여 타겟 핵산서열이 시료 내 존재 또는 부존재하는지 결정한다. 구체적으로, 4개의 파라미터를 포함하는 시그모이드 함수인 수학식 3의 a4를 이용한다.
a4가 시료 내 타겟 분석물의 존재 또는 부존재의 결정에 이용되는 경우, a4에 대한 역치값은 0.07, 0.08 또는 0.09로 설정될 수 있다. a4가 역치값을 초과하면 데이터 세트를 비정상적인 신호로 판단하고, 타겟 분석물이 시료 내 부존재하는 것으로 결정한다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 상기 비선형 피팅 함수에 신호 역치값(signal threshold)을 적용하여 Ct 값을 수득하는 단계를 추가적으로 포함한다. 본 발명은 신호 역치값(즉, Ct 값)을 이용하지 않고 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있지만, Ct 값들은 실험자에게 필요할 수 있다. 예를 들어, 타겟 분석물의 정량 정보가 필요한 경우, Ct 값들은 일반적으로 필요하다. 본 발명 방법의 분석 신뢰도를 증가시키기 위해서 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는데 비선형 함수의 피팅 정확도와 함께 Ct 값들 또한 이용될 수 있다. 예를 들어, 비선형 피팅 함수의 피팅 정확도가 피팅 정확도에 대한 역치값을 초과 할뿐만 아니라 Ct 값이 Ct 값에 대한 역치값을 초과하는 경우에만, 타겟 분석물은 시료 내 존재하는 것으로 결정된다.
Ⅱ. 비-선형 함수를 이용한 시료 내 타겟 분석물의 분석 장치 및 컴퓨터 해독가능한 기록매체
본 발명의 다른 양태에 따르면, 본 발명은 다음을 포함하는 시료 내 타겟 분석물의 분석 장치를 제공한다:
메모리; 및
프로세서;
상기 메모리는 상기 타겟 분석물에 대한 데이터 세트를 저장하고, 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득하며, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
상기 프로세서는 상기 데이터 세트를 보정하고, 상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하며, 상기 보정된 데이터 세트에 대한 상기 비-선형 함수 피팅 정확도를 결정하고, 상기 피팅 정확도를 이용하여 상기 시료 내 타겟 분석물의 존재 또는 부존재를 결정한다.
본 발명의 또 다른 양태에 따르면, 본 발명은 다음의 단계를 포함하는 시료 내 타겟 분석물을 분석하는 방법을 실행하기 위한 프로세서를 구현하는 지시들을 포함하는 비-일시적(non-transitory) 컴퓨터 해독가능한 기록매체를 제공한다:
상기 타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
상기 데이터 세트를 보정하는 단계;
상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하는 단계;
상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 피팅 정확도를 결정하는 단계; 및
상기 피팅 정확도를 이용하여 상기 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계.
상술한 본 발명의 기록매체, 장치 및 컴퓨터 프로그램은 상술한 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 본 발명의 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: (i) 상기 데이터 세트를 보정하도록 하는 지시; (ii) 상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하도록 하는 지시; (iii) 상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 피팅 정확도를 결정하도록 하는 지시; 및 (iv) 상기 피팅 정확도를 이용하여 상기 시료 내 타겟 분석물의 존재 또는 부존재를 결정하도록 하는 지시.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터(stand alone computer), 네트워크 부착 컴퓨터 또는 실시간 PCR 장치와 같은 데이터 수득 장치에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
데이터 세트는 다양한 방식으로 수집될 수 있다. 예를 들어, 데이터 세트는 PCR 데이터 수집 장치에 있는 프로세서에 의해 수집될 수 있다. 데이터 세트는 실시간으로 프로세서에 제공될 수 있고 또는 메모리 유닛 또는 버퍼에 저장되고 실험 완료 후 프로세서에 제공될 수 있다. 유사하게는, 데이터 세트는, 상기 수집 장치와의 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 데이터 세트는, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록 매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 데이터와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 장치는 시료 및 신호-발생 수단을 수용할 수 있는 반응용기, 상기 반응용기의 온도를 조절하는 온도조절 수단 및/또는 사이클 번호들에서의 신호를 검출하는 검출기를 추가적으로 포함할 수 있다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축할 수 있다. 본 발명의 일 구현예에 따르면, 프로세서는 타겟 분석물(예컨대, 타겟 핵산분자)의 검출에 이용되는 종래의 장치(예컨대, 실시간 PCR 장치)에 소프트웨어를 인스톨 하여 구현시킬 수 있다.
Ⅲ. 이차 함수를 이용하여 시료 내 타겟 분석물을 분석하는 방법
본 발명의 다른 양태에 따르면, 본 발명은 다음 단계를 포함하는 시료 내 타겟 분석물의 분석 방법을 제공한다:
상기 타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 상기 데이터 세트에 피팅된 이차 함수를 생성하는 단계; 및
상기 데이터 세트에서 상기 이차 함수를 차감하여 상기 데이터 세트를 보정하는 단계.
본 발명의 첫 번째 및 세 번째 양태 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
본 발명자들은 상술한 종래기술의 문제점 및 단점, 특히 핵산증폭반응에서 Ct 값을 얻기 위한 역치값(threshold) 설정에 따른 종래의 문제점들을 극복하고자 노력하였다. 그 결과, 본 발명자들은 신호-발생 반응으로부터 얻은 데이터 세트에 대한 피팅 함수의 다양한 파라미터(parameter), 구체적으로 피팅 이차함수가 최소일 때의 사이클(Cmin), x2의 계수 또는 피팅 정확도가 타겟 분석물의 존재 또는 부존재를 결정할 수 있는 지표(indicator)가 될 수 있음을 규명하였다. 또한, 본 발명자들은 종래의 베이스라이닝 방법을 개선하고자 노력하였으며, 피팅 구간에서 데이터 세트에 피팅된 이차함수를 이용하여 효율적이면서 용이하게 베이스라이닝 할 수 있음을 규명하였다.
본 발명은 타겟 분석물을 분석하는 방법으로 표현되지만, 타겟 분석물에 대한 데이터 세트를 베이스라이닝하는 방법으로 표현될 수 있다.
타겟 분석물에 대한 데이터 세트를 수득
본 단계는 본 발명의 첫 번째 양태에 기재된 내용을 참조하여 설명될 수 있다.
데이터 세트에 피팅된 이차 함수를 생성
피팅 함수로서 데이터 세트에 대한 이차 함수는 상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 생성된다. 피팅을 위해 다양한 종래의 비-선형 회귀 분석 방법이 본 발명에 이용될 수 있다(참조: Seber, G. A. F.; Wild, C. J. (1989). Nonlinear Regression. New York: John Wiley and Sons).
본 단계는 상술한 대칭축을 가지는 이차 함수를 이용한 베이스라이닝에 대한 내용을 참조하여 설명될 수 있다.
보정 전 및 보정 후 데이터 세트를 포함하는 데이트 세트는 이차 함수와 피팅될 수 있다.
일 구현예에 따르면, 상기 이차 함수는 대칭축을 가진다. 일 구현예에 따르면, 상기 이차 함수의 대칭축은 신호-발생 반응의 최종 사이클에 기초하여 결정된다. 보다 구체적으로, 상기 이차 함수의 대칭축은 최종 사이클±10, 최종 사이클±8, 최종 사이클±6, 최종 사이클±5, 최종 사이클±3, 최종 사이클±2 또는 최종 사이클±1의 범위 내에서 결정된다.
이차 함수의 생성은 이차 함수의 대칭축을 결정하고, 피팅 구간을 결정하며 상기 피팅 구간에서 상기 데이터 세트에 상기 이차 함수를 피팅하여 실시될 수 있다. 이차 함수는 y=a(x-b)2 + c 로 표현될 수 있다(a는 x2의 계수, b는 대칭축, c는 y축 절편이다).
피팅 구간은 데이터 세트의 베이스라인 영역 내에서 결정될 수 있다. 상기 피팅 구간은 다양한 방법으로 결정될 수 있다.
우선, 피팅 구간은 미리 결정될 수 있다. 일 구현예에 따르면, 피팅 구간은 시작 피팅 사이클(Starting Fitting Cycle, SFC)부터 최소 피팅 사이클(Minimum Fitting Cycle, MFC)까지이다.
본 발명의 일 구현예에 따르면, 상기 데이터 세트의 변위가 상기 변위에 대한 역치값을 초과하는 경우, 상기 피팅 구간은 시작 피팅 사이클(Starting Fitting Cycle, SFC)부터 최소 피팅 사이클(Minimum Fitting Cycle, MFC)까지이다. 보다 구체적으로, 데이터 세트의 최대값과 최소값 사이의 차이가 소정의 역치값(예컨대, RFU 100, 200, 300 또는 400) 보다 큰 경우에, 또는 데이터 세트의 최종값과 초기값의 차이가 소정의 역치값(예컨대, RFU 0) 보다 큰 경우에는, 상기 피팅 구간은 시작 피팅 사이클(Starting Fitting Cycle, SFC)부터 최소 피팅 사이클(Minimum Fitting Cycle, MFC)까지의 구간에서 결정된다.
시작 피팅 사이클은 0 사이클, 1 사이클, 2 사이클, 3 사이클, 4 사이클, 5 사이클, 6 사이클, 7 사이클, 8 사이클 또는 9 사이클일 수 있다. 최소 피팅 사이클은 7 사이클, 8 사이클, 9 사이클, 10 사이클, 11 사이클, 12 사이클, 13 사이클, 14 사이클, 15 사이클, 16 사이클, 17 사이클, 18 사이클, 19 사이클, 20 사이클 또는 21 사이클일 수 있다.
본 발명의 일 구현예에 따르면, 피팅 구간은 데이터 세트의 1-20 사이클, 2-20 사이클, 3-20 사이클, 4-20 사이클, 5-20 사이클, 6-20 사이클, 1-18 사이클, 2-18 사이클, 3-18 사이클, 4-18 사이클, 5-18 사이클, 6-18 사이클, 1-16 사이클, 2-16 사이클, 3-16 사이클, 4-16 사이클, 5-16 사이클, 6-16 사이클, 1-14 사이클, 2-14 사이클, 3-14 사이클, 4-14 사이클, 5-14 사이클, 1-12 사이클, 2-12 사이클, 3-12 사이클 또는 4-12 사이클이다.
둘째로, 피팅 구간은 이차 함수를 이용하여 결정될 수 있다. 피팅 구간을 결정하는데 이용되는 이차 함수는 본 명세서에서 제 1 이차 함수로 명명되고, 보정된 데이터 세트에 이용되는 이차 함수는 본 명세서에서 제 2 이차 함수로 명명된다.
일 구현예에 따르면, 상기 방법은, 상기 피팅 구간에서 이차 함수를 생성하는 단계 이전에, 전체 영역에서 상기 데이터 세트에 피팅된 제 1 이차 함수를 생성하는 단계를 추가적으로 포함하고; 그리고 상기 피팅 구간(구체적으로, 상기 피팅 구간의 최종 사이클)은 상기 제 1 이차 함수가 최소 신호값을 가지는 사이클(Cmin)에 기초하여 결정된다.
제 1 이차함수는 대칭축을 갖지 않으나, 제 2 이차함수는 대칭축을 갖는다. 상기 피팅 구간의 최종 사이클은 (ⅰ) 제 1 이차함수가 최소일 때의 사이클(Cmin) 및/또는 (ⅱ) 최소 피팅 사이클에 기초하여 결정된다. 예를 들어, 피팅 구간의 최종 사이클은 (ⅰ) Cmin에서 N[N은 0 또는 양의 정수(구체적으로, 1-5의 정수)]을 뺀 사이클과 (ⅱ) 최소 피팅 사이클(MFC) 중 큰 사이클로 결정된다.
데이터 세트에서 이차 함수를 차감하여 데이터 세트를 보정
상기 데이터 세트는 상기 데이터 세트에서 상기 이차 함수를 차감하여 보정한다.
일 구현예에 따르면, 상기 방법은 상기 보정된 데이터 세트에 대한 상기 이차 함수의 피팅 정확도를 결정하는 단계; 및 상기 피팅 정확도를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계를 추가적으로 포함한다.
상기 이차 함수에 대한 피팅 정확도는 상기 피팅 구간에서 결정될 수 있다. 상기 데이터 세트 및 이차 함수 사이의 피팅 정확도는 피팅 구간에서의 신호값들을 이용하여 결정된다. 본 발명의 일 구현예에 따르면, 상기 피팅 정확도는 상기 데이터 세트와 상기 이차 함수에 대한 x2 값(chi square value) 또는 R2 값이며, 보다 구체적으로 R2 값이다.
R2 값은 수학식 5를 이용하여 계산될 수 있다.
수학식 5
Figure 112020037081791-pct00005
수학식 5는 데이터 세트의 전체 분산 대비 피팅 구간에서의 오차(error)의 분산을 나타낸다. 오차는 데이터 세트와 이차 함수의 차이이다.
yi는 데이터 세트의 각 사이클에서의 신호값이다.
fi는 이차 함수의 값이다.
ym는 데이터 세트의 평균값이다.
L은 피팅 구간의 최종 사이클이다.
S는 피팅 구간의 시작 사이클이다.
L-S는 피팅 구간의 길이이다.
n은 전체 사이클의 수이다.
본 발명의 특징 중 하나는, 이차 함수의 피팅 정확도를 타겟 분석물의 분석 특히 타겟 분석물의 존재 또는 부존재, 특히 부존재를 결정하는데 직접적인 지표로 이용하는 것이다. 본 발명자들이 아는 한(To our best knowledge), 피팅 구간에서 이차 함수의 피팅 정확도를 타겟 분석물의 부존재 여부를 결정하는데 직접적인 지표로 이용한 예는 없다.
본 발명의 일 구현예에 따르면, 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계는, 피팅 정확도가 역치값 미만이면 시료 내 타겟 분석물이 부존재하는 것으로 결정한다.
상술한 바와 같이, 피팅 정확도는 타겟 분석물의 존재 또는 부존재 특히 부존재를 결정하는데 직접적인 지표로 이용할 수 있기 때문에, 역치값과 피팅 정확도를 비교함으로써 타겟 분석물의 부존재를 간편하게 결정할 수 있다.
피팅 구간에서의 피팅 정확도에 대한 역치값은 당업계에서 통상적으로 이용하는 역치값일 수 있다. 예를 들어, 피팅 정확도로서 R2 값을 이용하는 경우, 역치값은 0.80, 0.85, 0.90, 0.91, 0.92, 0.93, 0.94, 0.95, 0.96 또는 0.97일 수 있다.
또한, 시료 내 타겟 분석물의 존재 또는 부존재는 (ⅰ) 제 1 이차 함수가 최소 신호값을 가지는 사이클(Cmin) 및/또는 (ⅱ) 제 1 이차 함수의 x2의 계수에 기초하여 결정될 수 있다.
본 발명의 일 구현예에 따르면, 상기 결정은 시료 내 타겟 분석물의 부존재의 결정이다.
본 발명의 일 구현예에 따르면, 상기 타겟 분석물의 부존재를 결정하는 단계는 상기 Cmin과 역치값을 비교하여 실시된다. 상기 Cmin이 상기 역치값을 초과하는 경우, 시료 내 타겟 분석물은 부존재로 결정된다.
본 발명의 특징 중 하나는, 상기 Cmin이 타겟 분석물이 부존재 하는지를 결정하는데 직접적인 지표로 이용하는 것이다. 핵산 증폭 곡선에 피팅 함수를 적용한 선행문헌은 있지만, 상기 Cmin이 타겟 분석물이 부존재하는지를 결정하는데 직접적인 지표로 이용하는 예는 없다.
상술한 바와 같이, 상기 Cmin이 타겟 분석물의 부존재를 결정하는데 직접적인 지표로 이용될 수 있기 때문에, 상기 타겟 분석물의 부존재는 상기 역치값과 Cmin을 비교하여 용이하게 결정될 수 있다.
역치값은, 예를 들어, 사이클 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40 이다.
택일적으로, 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계는, 제 1 이차 함수의 x2의 계수가 0 보다 작은지를 평가하여 상기 시료 내 타겟 분석물이 부존재하는지를 결정하여 실시된다. 본 발명자들이 아는 한(To our best knowledge), 제 1 이차 함수의 x2의 계수가 0 보다 작은 데이터 세트는 모두 음성결과로 취급할 수 있다.
상술한 바와 같이, 상기 Cmin, 제 1 이차 함수의 x2의 계수, 및 제 2 이차 함수의 피팅 정확도는 시료 내 타겟 분석물의 부존재를 결정하는데 지표로서 이용될 수 있다.
Ⅳ. 본 발명과 MuDT 기술의 조합
본 출원인은 단일 반응 용기에서 단일 유형의 검출기를 이용하여 복수의 타겟 핵산서열을 검출하는 MuDT 기술(WO 2015/147412)을 개발하였다. MuDT 기술에서, 상대적 저온 검출 온도를 가지는 타겟 핵산서열의 존재는 (ⅰ) 상대적 고온 검출 온도 및 상대적 저온 검출 온도 모두에서 검출된 신호 및 (ⅱ) 다른 검출 온도에서 신호의 변화의 관계를 나타내는 기준값에 의해 결정된다. 제 1 타겟 핵산서열이 상대적 고온 검출 온도를 갖는 타겟 핵산서열이고 제 2 타겟 핵산서열이 상대적 저온 검출 온도를 갖는 타겟 핵산 서열인 경우에, 제 1 타겟 핵산서열에 대한 기준값을 이용하여 제 1 타겟 핵산서열에 대한 신호를 제거함으로써 제 2 타겟 핵산서열에 대한 신호는 상대적 저온 검출 온도에서 검출된 신호로부터 추출된다.
종래의 단일 유형의 검출기로 구별되지 않는, 제 1 타겟 핵산서열에 대한 신호 및 제 2 타겟 핵산서열에 대한 신호를 별개로 얻는 방법으로 종래 방법과 비교하여, MuDT 기술은 현저히 개선되었다. 특히, 상대적 고온 검출 온도를 갖는 타겟 핵산서열 및 상대적 저온 검출 온도를 갖는 타겟 핵산서열 모두를 포함하는 샘플(공동-감염 샘플)로부터 타겟 핵산서열들에 대한 신호들을 추출하는데 있어 상기 방법은 상당한 정확도를 나타낸다.
비선형 피팅 함수를 이용하는 본 발명은 MuDT 기술과 잘 조합될 수 있다.
일 구현예에 따르면, 상기 데이터 세트는 (ⅰ) 상대적 고온 검출온도에서 검출된 신호인 제 1 타겟 핵산서열에 대한 신호 및/또는 (ⅱ) 상대적 저온 검출온도에서 검출된 신호로부터 추출된 제 2 타겟 핵산서열에 대한 신호를 포함하고, 그리고 상기 제 1 타겟 핵산 서열 및 상기 제 2 타겟 핵산 서열은 하나의 반응 용기로부터 검출된다.
일 구현예에 따르면, 상기 제 1 타겟 핵산서열에 대한 신호 및 상기 제 2 타겟 핵산서열에 대한 신호는 다음의 단계를 통해 수득된다:
(a) 상기 반응 용기에서 상기 제 1 타겟 핵산서열에 대한 신호를 발생시킬 수 있는 제 1 신호-발생 수단 및 상기 제 2 타겟 핵산서열에 대한 신호를 발생시킬 수 있는 제 2 신호-발생 수단을 상기 시료와 함께 인큐베이션하고, 상기 상대적 고온 검출온도 및 상기 상대적 저온 검출온도에서 신호를 검출하는 단계; 상기 제 1 타겟 핵산서열 및 제 2 타겟 핵산서열 각각은 상응하는 신호-발생 수단에 의해 검출되며, 상기 제 1 신호-발생 수단은 상기 제 1 타겟 핵산 서열이 상기 시료에 존재하는 경우에, 상기 상대적 고온 검출온도 및 상기 상대적 저온 검출온도에서 신호를 발생시키고, 상기 제 2 신호-발생 수단은 상기 제 2 타겟 핵산 서열이 상기 시료에 존재하는 경우에, 상기 상대적 저온 검출온도에서 신호를 발생시키며,
(b) 상기 상대적 저온 검출온도에서 검출된 신호가 제 1 역치값 또는 제 1 신호 변위에 의해 정의된 제 1 기준을 만족하는지를 식별하는 단계; 상기 상대적 저온 검출온도에서 검출된 신호가 상기 제 1 기준을 만족할 때, 다음 단계 (c)를 진행하고, 상기 상대적 저온 검출온도에서 검출된 신호가 상기 제 1 기준을 만족하지 않을 때, 상기 제 1 타겟 핵산서열 및 상기 제 2 타겟 핵산서열이 상기 시료 내에 존재하지 않는 것으로 결정되고 다음 단계 (c)를 진행하지 않으며; 및
(c) (ⅰ) 상기 상대적 저온 검출온도에서 검출된 신호로부터 상기 제 1 타겟 핵산 서열에 대한 신호를 제거하기 위한 기준값 및 (ⅱ) 상기 상대적 저온 검출온도에서 검출된 신호를 이용하여 상기 상대적 저온 검출온도에서 검출된 신호로부터 상기 제 2 타겟 핵산 서열에 대한 신호를 추출하는 단계.
일 구현예에 따르면, 상기 제 2 타겟 핵산서열에 대한 신호는 다음 수학식 6에 의해 제공된다:
수학식 6
제 2 타겟 핵산 서열에 대한 신호 = [상대적 저온 검출온도에서 검출된 신호] - [(상대적 고온 검출온도에서 검출된 신호) x (제 1 타겟 핵산서열에 대한 기준값)]
본 명세서 사용된 용어 “상대적 고온 검출온도를 갖는 타겟 핵산 서열”은 2개의 검출 온도 중 상대적 고온 검출온도에서 신호를 발생할 수 있고, 상대적 낮은 검출 온도에서도 신호를 발생할 수 있는 타겟 핵산 서열을 의미한다. 반면, “상대적 저온 검출온도를 갖는 타겟 핵산 서열”은 2개의 검출 온도 중 상대적 저온 검출온도에서 신호를 발생하되, 상대적 고온 검출온도에서는 신호를 발생하지 않는 타겟 핵산 서열을 의미한다.
상대적 고온 검출온도는 상대적 고온 검출온도를 갖는 타겟 핵산 서열에 대한 신호를 생성할 수 있는 온도이고, 상대적 저온 검출온도는 상대적 저온 검출온도를 갖는 타겟 핵산 서열에 대한 신호 및 상대적 고온 검출온도를 갖는 타겟 핵산 서열에 대한 신호 모두를 생성할 수 있는 온도이다. 상대적 고온 검출온도는 제 1 검출 온도로 표현될 수 있고, 상대적 저온 검출온도는 제 2 검출 온도로 표현될 수 있다.
일 구현예에 따르면, 검출이 수행되는 상대적 고온 검출온도와 상대적 저온 검출온도는 결정될 수 있다. 예를 들어, 상대적 고온 검출온도와 상대적 저온 검출온도는 각각 72℃ 및 60℃로서 결정되고, 이후 상기 검출 온도에 적합한 신호-발생 수단이 구축된다.
일 구현예에 따르면, 상기 신호-발생 수단이 이합체의 형성에 의존적인 방식으로 신호를 발생할 때, 상기 검출 온도는 상기 이합체의 Tm 값을 조절함으로써 제어될 수 있다.
신호가 타겟 핵산 서열의 존재에 의존적으로 형성되는 이합체에 의해 생성되는 경우, 상기 신호의 검출은 이합체의 Tm 값을 조절함으로써 결정된 온도에서 성공적으로 수행된다. 예를 들어, 신호가 PTOCE 방법에 의해 생성되는 경우, 신호의 검출은 CTO 상에서 PTO 단편이 연장되어 형성된 연장이합체의 Tm 값을 조절함으로써 결정된 온도에서 성공적으로 수행된다.
기준값은 상대적 저온 검출온도에서 검출된 신호로부터 제 1 타겟 핵산 서열에 대한 신호를 제거하기 위한 값이다. 본 발명의 일 구현예에서, 기준값은 상대적 고온 검출온도와 상대적 저온 검출온도에서 시료 내 제1 타겟 핵산 서열이 존재할 때, 제 1 신호-발생 수단에 의해 제공되는 신호의 변화의 관계를 나타내는 값이다.
본 발명에 따르면, 상기 비-선형 피팅 함수는 제 2 타겟 핵산서열에 대한 추출된 신호에 대해 생성된다.
Ⅴ. 이차 함수를 이용하여 시료 내 타겟 분석물을 분석하는 방법
본 발명의 다른 양태에 따르면, 본 발명은 다음을 포함하는 시료 내 타겟 분석물의 분석 장치를 제공한다:
메모리; 및
프로세서;
상기 메모리는 상기 타겟 분석물에 대한 데이터 세트를 저장하고, 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득하며, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며, 그리고
상기 프로세서는 상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 상기 데이터 세트에 대해 피팅된 이차 함수를 생성하고, 상기 데이터 세트에서 상기 이차 함수를 차감하여 상기 데이터 세트를 보정한다.
본 발명의 또 다른 양태에 따르면, 본 발명은 다음의 단계를 포함하는 방법을 실행하기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터 해독가능한 기록매체를 제공한다:
상기 타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 상기 데이터 세트에 대한 이차 함수를 생성하는 단계; 및
상기 데이터 세트에서 상기 이차 함수를 차감하여 상기 데이터 세트를 보정하는 단계.
상술한 본 발명의 기록매체, 장치 및 컴퓨터 프로그램은 상술한 섹션 Ⅲ 및 Ⅳ의 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
VI. 본 발명의 구체적 구현예
본 발명의 구체적인 구현예를 상세히 설명하면 다음과 같다:
도 1은 일 실시 예에 따른 타겟 분석물을 분석하는 장치를 나타낸다. 도 1을 참조하면, 분석 시스템은 증폭 장치(110) 및 분석 장치(120)를 포함한다. 분석 시스템은 시료 내 타겟 분석물의 존재 또는 부존재를 결정하고, 사용자에게 결과를 표시할 수 있다.
증폭 장치(110)는 핵산 증폭 반응, 효소 반응 또는 미생물 성장 등을 수행하는 장치이다. 예를 들어, 증폭 장치(110)가 핵산 증폭 반응을 수행하는 경우, 증폭 장치(110)는 시료들의 온도를 증가, 감소시키는 동작을 반복적으로 수행할 수 있다. 증폭 장치(110)는 각 사이클마다 시료들로부터 발생하는 신호를 측정하여 데이터 세트를 수득할 수 있다.
증폭 장치(110)는 분석 장치(120)와 케이블(130)로 연결되거나, 무선으로 연결될 수 있다. 증폭 장치(110)는 수득된 데이터 세트를 유선 또는 무선으로 분석 장치(120)로 전송한다.
분석 장치(120)는 증폭 장치(110)로부터 데이터 세트를 수득한다. 분석 장치(120)는 데이터 세트를 분석하여, 시료 내 타겟 분석물이 존재 또는 부존재 하는지 여부를 결정한다. 다시 말해서, 분석 장치(120)는 시료에 대한 양성 또는 음성을 결정한다.
분석 장치(120)는 디스플레이 장치(124)를 포함한다. 디스플레이 장치(120)는 데이터 세트를 표시하거나, 플로팅 된 데이터 세트를 그래프로 표시할 수 있다. 디스플레이 장치(124)는 시그모이드 함수나 스텝 함수 등을 표시할 수 있다. 또한, 디스플레이 장치(124)는 타겟 분석물이 존재하는지 부존재하는지를 표시할 수 있고, 각 시료마다 검출 결과를 표시할 수 있다.
분석 장치(120)는 기록매체(122)에 포함된 데이터 세트를 독출(read)할 수 있다. 기록매체(122)는 데이터 세트를 저장하거나, 분석 장치(120)에서 사용되는 프로그램 등을 저장할 수 있다. 기록 매체(122)는 CD 또는 USB 등일 수 있다.
도 2는 일 실시 예에 따른 분석 장치를 설명하기 위한 구성도이다. 도 2를 참조하면, 분석 장치(200)는 프로세서(210), 메모리(220) 및 디스플레이 장치(230)를 포함한다.
메모리(220)는 증폭 장치(110)로부터 수신된 데이터 세트를 저장한다. 메모리(220)는 프로세서(210)에서 처리된 데이터를 저장할 수 있다. 예를 들어, 메모리(220)는 데이터 세트, 표준화 된 데이터 세트, 베이스라이닝 된 베이스세트, 보정된 데이터 세트, 비선형 함수, 피팅 정확도 및 역치값 등을 저장할 수 있다. 도 2에서는 메모리(220)이 프로세서(210)와 별도의 구성으로 도시되어 있으나, 메모리(220)가 프로세서(210)과 하나의 장치로 구현될 수도 있다. 예를 들어, 메모리(220)는 프로세서(210)의 내부에 포함된 캐쉬와 같은 스토리지일 수 있다.
프로세서(210)는 데이터 세트를 이용하여 시료 내 타겟 분석물이 존재 또는 부존재 하는지를 결정할 수 있다. 프로세서(210)는 비선형 함수를 이용하여, 데이터 세트와 비선형 함수의 피팅 정확도를 계산할 수 있고, 피팅 정확도의 크기에 따라 타겟 분석물의 존재 또는 부존재를 결정할 수 있다.
도 2에서는 분석 장치(200)가 하나의 프로세서(210)를 포함하는 것을 도시하고 있으나, 분석 장치(200)는 하나 이상의 프로세서(210)를 포함할 수 있다.
디스플레이 장치(230)는 프로세서(210)의 제어에 의해 그래프, 테이블 또는 텍스트 등을 표시할 수 있다. 예를 들어, 디스플레이 장치(230)는 데이터 세트, 비선형 함수 등을 그래프로 표시할 수 있다. 디스플레이 장치(230)는 웰들의 정보를 테이블로 표시할 수 있다. 디스플레이 장치(230)는 피팅 정확도, 양성/음성 등을 텍스트로 표시할 수 있다.
도 4는 일 실시 예에 따른 타겟 분석물의 존재 또는 부존재를 결정하는 방법을 설명하기 위한 순서도이다. 도 4를 참조하면, 분석 장치(200)는 피팅 정확도와 역치값을 비교하여 타겟 분석물의 존재 또는 부존재를 결정할 수 있다. 도 4의 단계들은 도 3의 단계 340 이후에 수행될 수 있다. 다시 말해서, 분석 장치(200)는 단계 340에서 피팅 정확도를 결정하고, 단계 410에서 피팅 정확도와 역치값을 비교할 수 있다.
단계 410에서, 분석 장치(200)는 피팅 정확도가 역치값을 초과하는지 결정한다. 만약, 피팅 정확도가 역치값을 초과하면 상기 프로세서는 단계 420으로 진행하고, 피팅 정확도가 역치값을 초과하지 않으면 상기 프로세서는 단계 430으로 진행한다. 역치값은 실험 데이터를 이용하여 결정될 수 있고, 일 예로서, 역치값은 0.9로 설정될 수 있다.
단계 420에서, 분석 장치(200)는 시료 내 타겟 분석물이 존재하는 것으로 결정한다. 피팅 정확도가 역치값보다 크다는 것은 비선형 함수가 증폭 곡선과 동일 또는 유사한 형태라는 것을 의미한다. 증폭 곡선이란 시료 내 타겟 분석물이 존재할 때 수득되는 곡선의 일반적인 형태일 수 있다. 다시 말해서, 시료 내 타겟 분석물이 존재하면, 타겟 분석물이 반복적으로 복제되기 때문에, 이차함수나 지수 함수와 같이 증가하는 형태의 신호가 시료로부터 수득된다. 따라서, 데이터 세트의 형태가 증폭 곡선의 형태인 경우, 비선형 함수와 데이터 세트가 유사한 형태이고, 피팅 정확도가 높아진다.
단계 430에서, 분석 장치(200)는 시료 내 타겟 분석물이 부존재하는 것으로 결정한다. 피팅 정확도가 역치값보다 작다는 것은 비선형 함수가 증폭 곡선에서 벗어나 있다는 것을 의미한다. 다시 말해서, 시료 내 타겟 분석물이 부존재하면, 타겟 분석물이 복제되는 반응이 발생하지 않는다. 따라서, 데이터 세트와 비선형 함수가 다른 형태이고, 피팅 정확도가 낮아진다.
도 5는 시료 내 타겟 분석물이 존재하는 경우 피팅 정확도를 이용하여 분석하는 방법을 설명하기 위한 도면이다. 도 5에서 보정된 데이터 세트(510)는 점선으로 표시되고, 비선형 함수(520)는 실선으로 표시되었다. 보정된 데이터 세트(510)는 (사이클, 신호값)의 좌표값들의 집합(불연속 데이터)이므로 점선으로 표시되었다. 비선형 함수(520)는 수학식 3의 시그모이드 함수일 수 있다. 비선형 함수(520)는 연속 함수 이므로 실선으로 표시되었다.
분석 장치(200)는 보정된 데이터 세트(510)와 비선형 함수(520)를 피팅한다. 피팅한다는 것은 보정된 데이터 세트(510)와 가장 유사한 비선형 함수(520)을 찾는(search) 것을 의미하거나, 비선형 함수(520)의 파라미터들(parameters)을 결정하는 것을 의미한다. 비선형 함수(520)는 최소 자승법에 의해 생성될 수 있다. 다시 말해서, 분석 장치(200)는 비선형 함수(520)와 보정된 데이터 세트(510)의 오차를 최소화시키기 위해 비선형 함수(520)의 파라미터들을 수정하는 과정을 반복한다. 분석 장치(200)는 비선형 함수(520)과 보정된 데이터 세트(510)의 오차가 최소일 때, 비선형 함수(520)의 파라미터들을 결정한다.
분석 장치(200)는 결정된 파라미터들을 갖는 비선형 함수(520)와 보정된 데이터 세트(510)의 R2 값을 계산한다. 분석 장치(200)는 R2 값의 크기에 따라 타겟 분석물의 존재 또는 부존재(양성/음성)를 결정한다. R2 값은 수학식 4를 이용하여 계산할 수 있다.
도 5을 참조하면, 비선형 함수(520)의 R2 값은 0.9985 이다. 역치값은 0.9로 설정된다. 따라서, R2 값이 역치값보다 크기 때문에, 분석 장치(200)는 시료 내 타겟 분석물이 존재하는 것으로 결정한다(양성). 분석 장치(200)는 분석 결과에 따라 존재 또는 양성(positive)이라는 텍스트를 디스플레이 장치(230)에 표시할 수 있다.
도 6은 최대 기울기를 이용하여 타겟 분석물의 존재 또는 부존재를 결정하는 방법을 설명하기 위한 순서도이다. 분석 장치(200)는 비선형 함수의 최대 기울기를 이용하여 시료 내 타겟 분석물의 부존재를 결정할 수 있다. 도 6의 단계들은 도 3의 단계 350이 수행된 이후에 수행되거나, 도 3의 단계 330이 수행된 이후에 수행될 수 있다.
단계 1410에서, 분석 장치(200)는 비선형 함수의 최대 기울기를 생성한다. 분석 장치(200)는 비선형 함수를 미분하고, 미분된 비선형 함수의 최대값을 최대 기울기로 결정할 수 있다.
단계 1420에서, 분석 장치(200)는 비선형 함수의 최대 기울기가 최대 기울기에 대한 역치값을 초과하는지를 판단한다. 분석 장치(200)는 최대 기울기가 역치값을 초과하면 단계 1430으로 진행하고, 그렇지 않으면 단계 1440으로 진행한다. 역치값은 20 내지 40 사이에서 설정될 수 있다.
단계 1430에서, 분석 장치(200)는 시료 내 타겟 분석물이 존재하는 것으로 결정한다. 비선형 함수의 최대 기울기가 역치값을 초과하므로, 분석 장치(200)는 타겟 분석물에 대한 증폭 반응이 발생했다고 판단할 수 있다.
단계 1440에서, 분석 장치(200)는 시료 내 타겟 분석물이 부존재하는 것으로 결정한다. 비선형 함수의 최대 기울기가 역치값을 초과하지 않으므로, 분석 장치(200)는 타겟 분석물에 대한 증폭 반응이 발생하지 않았다고 판단할 수 있다.
도 7은 시료 내 타겟 분석물이 존재하는 경우 최대 기울기를 이용하여 분석하는 방법을 설명하기 위한 도면이다. 도 7에서 분석 장치(200)는 비선형 함수(1510)의 최대 기울기를 생성한다. 도 7에서 비선형 함수(1510)의 최대 기울기는 50 이다. 분석 장치(200)는 최대 기울기가 역치값을 초과하는지 판단한다. 도 7에서는 역치값이 30으로 설정되었고, 비선형 함수(1510)의 최대 기울기(50)가 역치값(30)를 초과한다. 따라서, 분석 장치(200)는 시료 내 타겟 분석물이 존재하는 것으로 결정한다(양성).
시료 내 타겟 분석물이 존재하면, 도 7의 비선형 함수(1510)와 같이 신호값이 급격하게 증가하는 구간이 존재한다. 분석 장치(200)는 급격하게 증가하는 구간이 존재하면 시료 내 타겟 분석물이 존재하는 것으로 결정할 수 있다.
도 8은 SBN 방법으로 데이터 세트를 표준화하는 방법을 설명하기 위한 도면이다. 도 8을 참조하면, 데이터 세트(1900)에 대한 기준 사이클 및 기준 사이클에서의 신호값이 결정된다. 기준 사이클에서의 신호값이 결정되면, 기준 사이클에서의 신호값 또는 기준 사이클에서의 신호값의 변형값을 이용하여 표준화 계수가 생성된다.
기준 사이클에서의 신호값을 이용하여 표준화 계수가 생성되는 경우, 기준 사이클에서의 신호값 자체가 표준화 계수가 될 수 있다. 따라서, 기준 사이클에서의 신호값을 데이터 세트(1900)의 신호값들에 적용하여 데이터 세트(1900)를 표준화한다.
기준 사이클에서의 신호값의 변형값을 이용하여 표준화 계수가 생성되는 경우, 기준 사이클에서의 신호값과 기준값 사이의 관계를 이용하여 표준화 계수가 결정될 수 있다. 기준 사이클에서의 신호값과 기준값 사이의 관계는 기준 사이클에서의 신호값과 기준값의 차이일 수 있다. 일 예에서, 기준 사이클에서의 신호값과 기준값의 차이는 기준값에 대한 기준 사이클에서의 신호값의 비(ratio)이다.
기준 사이클은 임의로 결정된 사이클이고, 기준 사이클에서의 신호값은 데이터 세트(1900)의 신호값이다. 도 8에 도시된 바와 같이, 기준 사이클은 데이터 세트(1900)의 사이클들 중 결정되고, 베이스라인 영역에서 결정된다.
dRFU는 데이터 세트(1900)의 변위를 나타낸다. 데이터 세트(1900)의 변위는 데이터 세트의 신호값들 중 최대값과 최소값의 차이 또는 최종값과 초기값의 차이로 계산될 수 있다.
베이스라인 영역은 타겟 분석물에 대한 증폭이 발생되지 않는 구역이고, 신호 증폭 구역은 타겟 분석물에 대한 증폭이 발생된 구역이다. 기준 사이클은 베이스라인 영역의 사이클들 중에서 선택될 수 있다. 일 예에서 기준 사이클은 4 사이클일 수 있다. 도 8에서는 기준 사이클이 하나인 경우를 나타내고 있으나, 기준 사이클은 2 이상의 사이클들일 수 있다. 복수의 기준 사이클들이 선택되는 경우, 복수의 기준 사이클들에서의 복수의 신호값들이 결정되고, 복수의 신호값들을 이용하여 표준화 계수가 결정된다.
도 9는 비선형 함수에 대한 특성을 설명하기 위한 도면이다. 비선형 함수(2000)에 대한 특성은 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는데 이용된다. 구체적으로, 비선형 함수(2000)에 대한 특성들은 각 특성들에 대한 소정의 역치값과 비교될 수 있고, 비교 결과는 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는데 이용된다.
본 발명은 연속함수인 비선형 함수(2000)를 생성하기 때문에, 일부 증폭 구간에서 발생되는 점프 에러 또는 노이즈에 영향을 최소화할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명은 비선형 함수(500)의 변위가 신호 역치값을 초과하는지 여부에 따라 타겟 분석물의 존재 또는 부존재를 결정하지 않는다. 반응의 하나의 기준 또는 특성을 이용하는 대신, 본 발명은 비선형 함수(500)의 복수의 특성을 추출하고 상기 특성을 분석하여 시료 내 타겟 분석물의 존재를 결정한다.
기존의 방법은 데이터 세트가 역치값을 초과하는지 여부를 기준으로 타겟 분석물의 존재 또는 부존재를 결정하기 때문에, 데이터 세트의 각각의 신호값들이 타겟 분석물의 존재 또는 부존재의 결정에 영향을 미친다. 따라서, 점프 에러 또는 노이즈의 제거를 포함하는 데이터 세트를 보정하고, 역치값을 적절하게 설정하는 것이 매우 중요하며, 데이터 세트에 대한 보정이 제대로 이루어지지 않는 경우 또는 역치값의 설정이 정교하게 이루어지지 않는 경우에는 위양성 또는 위음성의 위험이 있다.
본 발명은 데이터 세트 또는 표준화된 데이터 세트에 피팅된 비선형 함수(2000)를 이용하기 때문에, 비선형 함수(2000)에 대한 복수의 특성들을 용이하게 추출할 수 있다. 다시 말해서, 비선형 함수(2000)는 연속 함수이고, 수학식으로 표시되기 때문에, 비선형 함수(2000)의 변위, 최대 기울기 및 파라미터들을 포함하여 타겟 분석물의 존재 또는 부존재를 결정하는데 유용한 비선형 함수(2000)의 복수의 특성을 추출하는데 용이하며, 정확하게 추출할 수 있다.
비선형 함수(2000)는 표준화된 데이터 세트에 피팅된 함수이다. 도 9에 도시된 수학식은 비선형 함수(2000)의 일 예이고, 시그모이드 함수의 한 형태이다. 도 9에 도시된 시그모이드 함수는 4개의 파라미터들(a1, a2, a3, a4)을 포함한다. 시그모이드 함수는 5개 이상의 파라미터들을 포함하거나, 3개 이하의 파라미터들을 포함할 수 있다.
비선형 함수(2000)의 특성은 파라미터들(a1, a2, a3, a4), 변위(dRFU), 최대 기울기(df) 또는 R2를 포함한다. 최대 기울기는 FDM(First Derivative Maximum)으로 표현될 수 있다.
비선형 함수(2000)의 변위는 비선형 함수(2000)의 최대값과 최소값의 차이 또는 초기값과 최종값의 차이일 수 있다. 일 예에서, 비선형 함수(2000)의 변위는 a2-a1 으로 계산될 수 있다. 비선형 함수(2000)의 변위는 변위에 대한 역치값과 비교될 수 있다. 예를 들어, 변위에 대한 역치값은 70, 80, 90, 100, 110, 120, 130 또는 140 이다. 변위에 대한 역치값의 단위는 RFU일 수 있다. 비선형 함수(2000)의 변위가 변위에 대한 역치값 미만인 경우, 시료 내 타겟 분석물이 부존재하는 것으로 결정될 수 있다.
파라미터 a3는 비선형 함수(2000)의 변곡점이다. df는 비선형 함수(2000)의 최대 기울기이다. df는 a3에서의 기울기일 수 있다. 비선형 함수(2000)의 최대 기울기는 최대 기울기에 대한 역치값과 비교될 수 있다. 예를 들어, 최대 기울기에 대한 역치값은 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 또는 32이다. 비선형 함수(2000)의 최대 기울기가 최대 기울기에 대한 역치값 미만인 경우, 시료 내 타겟 분석물이 부존재하는 것으로 결정될 수 있다.
본 발명의 일 구현예에서, 이차함수를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있다.
데이터 세트에 대한 이차함수(quadratic function)를 생성한다. 전체 구간(전체 사이클)에서 데이터 세트와의 피팅을 이용하여 이차함수가 생성된다. 전체 구간에서 피팅된 이차함수는 제 1 이차함수로 표기될 수 있다. 피팅을 위해 다양한 종래의 비선형 회귀 분석 방법이 본 발명에 이용될 수 있다(참조: Seber, G. A. F.; Wild, C. J. (1989). Nonlinear Regression. New York: John Wiley and Sons). 제 1 이차함수는 y=ax2 + bx + c 의 형태의 함수이다.
제 1 이차함수가 최소일 때의 사이클(Cmin) 또는 제 1 이차함수의 x2의 계수에 기초하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정한다.
본 발명의 일 구현예에서, 이차함수를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있다. 데이터 세트의 베이스라인 영역의 사이클에 기초하여 결정된 피팅 구간에서 데이터 세트에 대한 이차함수가 생성된다. 이차함수는 피팅 구간 내에서 데이터 세트와 피팅된 함수이다. 전체 구간에서 피팅된 이차함수는 제 1 이차함수로 표기되고, 피팅 구간에서 피팅된 이차함수는 제 2 이차함수로 표기될 수 있다. 피팅 구간에서 제 2 이차함수에 대한 피팅 정확도가 결정된다. 피팅 정확도를 이용하여 시료 내 상기 타겟 분석물의 존재 또는 부존재가 결정된다.
도 10은 이차 함수를 이용하는 본 발명의 일 실시예에 따른 순서도이다.
단계 2110에서 타겟 분석물에 대한 데이터 세트를 수득한다. 본 단계는 상술한 방법에 기재된 내용을 참조하여 설명될 수 있다. 단계 2120에서 데이터 세트에 대한 제 1 이차함수를 생성한다. 전체 구간(전체 사이클)에서 데이터 세트와의 피팅을 이용하여 제 1 이차함수가 생성된다. 피팅을 위해 다양한 종래의 비선형 회귀 분석 방법이 본 발명에 이용될 수 있다(참조: Seber, G. A. F.; Wild, C. J. (1989). Nonlinear Regression. New York: John Wiley and Sons). 제 1 이차함수는 y=ax2 + bx + c 의 형태의 함수이다.
단계 2130에서, 피팅 구간에서 데이터 세트에 대한 제 2 이차함수를 생성한다. 피팅 구간은 제 1 이차함수가 최소일 때의 사이클(Cmin) 또는 베이스라인 영역의 사이클에 기초하여 결정된다.
본 명세서에서 피팅 구간을 언급하면서 사용되는 용어 “베이스라인 영역의 사이클에 기초하여 결정”은 베이스라인 영역의 전체 사이클 또는 일부 사이클을 선택하여 피팅 구간으로 사용하는 것을 의미한다.
피팅 구간으로서 베이스라인 영역의 사이클은, 종래의 방법(예컨대, 미국특허 제8,560,247호 및 WO 2016/052991)에 의해 또는 경험적으로 결정된 베이스라인 영역 중에서 전체 또는 일부의 사이클 중에서 선택될 수 있다.
제 1 이차함수가 생성되고 최소값일 때의 사이클(Cmin)이 역치값 이상이거나 또는 x2의 계수가 0 보다 큰 경우, 피팅 구간에서 제 2 이차함수가 생성된다. 피팅 구간은 데이터 세트의 베이스라인 영역의 사이클에 기초하여 결정될 수 있다. 택일적으로, 피팅 구간은 제 1 이차함수가 최소일 때의 사이클(Cmin)에 기초하여 결정된다. 피팅 구간을 언급하면서 사용되는 용어 “제 1 이차함수가 최소일 때의 사이클(Cmin)에 기초하여 결정”은 피팅 구간의 최종 사이클(end cycle)이 Cmin 또는 Cmin 주변의 사이클(구체적으로 Cmin±5 사이클 내의 사이클)에 기초하여 결정되는 것을 의미한다. 피팅 구간은 상술한 시작 피팅 사이클로부터 최종 사이클까지로 결정되고, 최종 사이클은 제 1 이차함수가 최소일 때의 사이클(Cmin)에 기초하여 결정된 사이클로 결정될 수 있다.
제 2 이차함수는, 일차함수, 다차함수(예컨대, 이차함수 및 삼차함수) 및 지수함수와 같이 다양한 함수를 포함한다. 선형 또는 비선형 회귀 분석 방법을 이용하여 데이터 세트와 가장 일치하는 제 2 이차함수를 결정할 수 있다.
본 발명의 일 구현예에 따르면, 제 2 이차함수 대신 지수함수가 사용될 수 있다. 제 2 이차함수는 y=a(x-b)2 + c 형태의 함수이다. 지수 함수는 y=d(ea (b-x))+c 형태의 함수이다. b는 제 2 이차함수 또는 지수함수의 대칭축이다.
데이터 세트의 베이스라인 영역에서 신호값들에 피팅된 지수함수가 생성되고, 데이터 세트로부터 지수함수를 차감하여 보정된 데이터 세트가 생성된다.
단계 2140에서 피팅 구간에서 제 2 이차함수에 대한 피팅 정확도(fitting accuracy)를 결정한다. 데이터 세트와 제 2 이차함수 사이의 피팅 정확도는 피팅 구간 내에서의 신호값들을 이용하여 결정된다.
본 발명의 특징 중 하나는, 제 2 이차함수의 피팅 정확도를 타겟 분석물의 분석에 직접적인 지표로 이용하는 것이다. 단계 2150에서 피팅 정확도를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정한다.
도 11은 본 발명의 일 실시예에 따른 데이터 세트의 보정 방법을 설명하기 위한 순서도이다.
단계 2210에서 타겟 분석물에 대한 데이터 세트를 수득한다. 본 단계는 상술한 방법에 기재된 내용을 참조하여 설명될 수 있다. 단계 2220에서 데이터 세트에 대한 제 1 이차함수를 생성한다. 제 1 이차함수는 전체 구간에서 데이터 세트에 피팅된 이차함수이다. 단계 2230에서 데이터 세트의 베이스라인 영역의 사이클에 기초하여 결정된 피팅 구간에서 데이터 세트에 대한 제 2 이차함수를 생성한다. 제 2 이차함수는 피팅 구간에서 데이터 세트에 피팅된 이차함수이다. 단계 2240에서 데이터 세트의 신호값으로부터 제 2 이차함수의 값을 차감하여 데이터 세트를 보정한다.
도 12는 제 1 이차함수를 이용하여 피팅 구간을 설정하는 방법을 설명하기 위한 도면이다. 분석 장치는 제 1 이차함수(2320)가 최소일 때의 사이클(Cmin)에 기초하여 피팅 구간을 설정한다. 데이터 세트(2310)는 신호-발생 반응으로부터 수득된다. 데이터 세트(2310)는 증폭 장치로부터 수득되거나, 증폭 장치로부터 수득된 데이터 세트를 보정하여 수득될 수도 있다. 예를 들어, 동일한 채널에서 고온 및 저온 검출온도에서 데이터 세트를 수득하고, 저온 검출 온도에서 수득된 데이터 세트로부터 고온 검출 온도에서 수득된 데이터 세트를 차감하여 데이터 세트(2310)를 수득할 수도 있다. 또한, 증폭 장치는 채널들 사이의 간섭을 고려하여 데이터 세트를 보정하여 보정된 데이터 세트를 출력할 수도 있다.
제 1 이차함수(2320)는 데이터 세트(2310)와의 피팅을 통해 결정된다. 분석 장치는 3개의 파라미터를 갖는 이차함수(y=ax2 + bx + c)와 데이터 세트(2310)에 최소 자승법을 적용하여 데이터 세트(2310)에 대한 제 1 이차함수(2320)를 생성한다.
분석 장치는 제 1 이차함수(2320)를 생성한 후에, 제 1 이차함수(2320)가 최소일 때의 사이클(Cmin)을 결정한다. 분석 장치는 제 1 이차함수(2320)를 미분하여 Cmin을 결정할 수 있다. 도 12에서 제 1 이차함수(2320)에 대한 Cmin은 10 인 경우를 도시한다.
Cmin이 역치값 미만이면, 분석 장치는 Cmin을 이용하여 피팅 구간을 설정한다. 분석 장치는 Cmin을 이용하여 피팅 구간의 최종 사이클을 결정할 수 있다. 일 예에서, 분석 장치는 Cmin, Cmin-1, Cmin-2, Cmin-3, Cmin-4 또는 Cmin-5를 피팅 구간의 최종 사이클로 결정할 수 있다. 또는 분석 장치는 Cmin, Cmin+1, Cmin+2, Cmin+3, Cmin+4 또는 Cmin+5를 피팅 구간의 최종 사이클로 결정할 수 있다. Cmin 이 10 이고, 역치값이 30 이면, Cmin이 역치값 미만이므로, 분석 장치는 Cmin을 이용하여 피팅 구간의 최종 사이클을 결정한다.
분석 장치는 Cmin과 최소 피팅 사이클을 이용하여 피팅 구간의 최종 사이클을 결정할 수 있다. 일 예에서, 최소 피팅 사이클은 10, 9, 8, 7, 6, 5 사이클에서 결정될 수 있다. 최소 피팅 사이클은 증폭 반응의 최종 사이클에 따라 결정될 수 있다. 분석 장치는 Cmin, Cmin-1, Cmin-2, Cmin-3, Cmin-4 또는 Cmin-5 중 어느 하나의 값을 선택하고, 선택된 값과 최소 피팅 사이클 중 큰 값을 피팅 구간의 최종 사이클로 결정할 수도 있다. 최소 피팅 사이클이 9 이고, Cmin이 10이면, 분석 장치는 9와 10 중 큰 값인 10을 피팅 구간의 최종 사이클로 결정할 수 있다.
분석 장치는 시작 피팅 사이클을 설정한다. 시작 피팅 사이클은 피팅 구간의 최소 사이클이다. 피팅 구간은 최소 사이클부터 최대 사이클 사이가 된다. 시작 피팅 사이클은 증폭 반응의 최종 사이클에 따라 결정될 수 있다. 일 예에서, 제품의 최대 사이클이 40 사이클이면, 시작 피팅 사이클은 0, 1, 2 사이클이 될 수 있다. 일 예에서, 제품의 최대 사이클이 40 사이클을 초과하면, 시작 피팅 사이클은 4, 5, 6, 7 사이클이 될 수 있다.
도 13은 제 1 이차함수가 최소일 때의 사이클(Cmin)을 이용하여 시료 내 타겟 분석물의 부존재를 결정하는 방법을 설명하기 위한 도면이다. 분석 장치는 Cmin을 결정하고, Cmin이 역치값을 초과하면 시료 내 타겟 분석물이 부존재하는 것으로 결정한다. 제 1 이차함수(2420)는 데이터 세트(2410)와의 피팅을 통해 결정된다. 분석 장치는 3개의 파라미터를 갖는 이차함수(y=ax2 + bx + c)와 데이터 세트(2410)에 최소 자승법을 적용하여 데이터 세트(2410)에 대한 제 1 이차함수(2420)를 생성한다.
도 13에서 데이터 세트(2410)는 음성 시료이고, 사이클이 증가할수록 신호값의 크기가 작아진다. 따라서, 데이터 세트(2410)에 대한 제1 이차함수(2420)도 감소하는 형태가 된다. 제 1 이차함수(2420)가 최소일 때의 사이클(Cmin)이 40이 된다. 제 1 이차함수(2420)가 최소일 때의 사이클(40 사이클)이 역치값(30 사이클)을 초과하기 때문에, 분석 장치는 시료 내 타겟 분석물이 부존재하는 것으로 결정한다.
본 발명은 데이터 세트와 제1 이차함수가 최소일 때의 사이클(Cmin)만으로 시료 내 타겟 분석물이 부존재하는지 여부를 결정할 수 있다. 따라서, 기존의 방법들과 같이, 데이터 세트를 보정하고, 역치값을 이용하여 Ct 값을 획득하는 단계 없이, 시료 내 타겟의 부존재를 정확하고 신속하며 간편하게 결정할 수 있다.
도 14는 제 2 이차함수와 데이터 세트의 피팅 정확도를 이용하여 시료 내 타겟 분석물의 부존재를 결정하는 방법을 설명하기 위한 도면이다.
분석 장치는 제 1 이차함수(2510)을 이용하여 피팅 구간을 설정한다. 분석 장치는 데이터 세트(2500)에 대한 제 1 이차함수(2510)를 생성한다. 분석 장치는 제 1 이차함수(2510)가 최소일 때의 사이클(Cmin)을 계산한다. 제 1 이차함수(2510)가 최소일 때의 사이클(10 사이클)이 역치값(30 사이클) 미만이므로, 분석 장치는 제 1 이차함수(2510)가 최소일 때의 사이클(Cmin) 또는 베이스라인 영역의 사이클에 기초하여 피팅 구간을 결정한다.
분석 장치는 피팅 구간에서 데이터 세트(2500)에 피팅된 제 2 이차함수(2520)를 생성한다. 분석 장치는 피팅 구간에서 제 2 이차함수(2520)에 대한 피팅 정확도를 결정한다.
도 14에서는 피팅 정확도로 R2 값을 이용하였고, R2 값이 0.7925 이다. R2 값이 역치값(0.85) 미만이므로 분석 장치는 시료 내 타겟 분석물이 부존재하는 것으로 결정한다.
본 발명은 데이터 세트에 대한 제 1 이차함수(2510)가 최소일 때의 사이클(Cmin) 또는 베이스라인 영역의 사이클을 제 2 이차함수(2520)의 피팅 구간으로 이용하고 피팅 정확도를 타겟 분석물 분석, 특히 타겟 분석물의 부존재를 검출하는 직접적인 지표로 이용하여, 위양성 및 위음성, 특히 위양성 없이 타겟 분석물을 분석할 수 있도록 한다.
도 15는 제 2 이차함수를 이용하여 베이스라인을 설정하는 방법을 설명하기 위한 도면이다. 분석 장치는 제 2 이차함수(2620)를 베이스라인으로 설정할 수 있다.
분석 장치는 제 1 이차함수(2610)을 이용하여 피팅 구간을 설정한다. 분석 장치는 데이터 세트(2600)에 대한 제 1 이차함수(2610)를 생성한다. 분석 장치는 제 1 이차함수(2610)가 최소일 때의 사이클(Cmin)을 계산한다. 제 1 이차함수(2610)가 최소일 때의 사이클(9 사이클)이 역치값(30 사이클) 미만이므로, 분석 장치는 제 1 이차함수(2610)가 최소일 때의 사이클(Cmin) 또는 베이스라인 영역의 사이클에 기초하여 피팅 구간을 결정한다.
분석 장치는 피팅 구간에서 데이터 세트(2600)에 대한 피팅을 수행한다. 분석 장치는 피팅 구간에서 데이터 세트(2600)에 피팅된 제 2 이차함수(2620)를 생성한다.
분석 장치는 피팅 구간에서 제 2 이차함수(2620)에 대한 피팅 정확도를 결정한다. 분석 장치는 피팅 구간에서의 데이터 세트(2600)의 신호값들과 제 2 이차함수(2620)의 함수값을 이용하여 피팅 정확도를 결정한다. 도 15에서는 피팅 정확도로 R2 값을 이용하였고, R2 값이 0.7925 이다. R2 값이 역치값(0.85)을 초과하므로 분석 장치는 제 2 이차함수(2620)를 베이스라인을 결정한다.
제 2 이차함수(2620)를 결정할 때는 피팅 구간 내의 데이터 세트(2600)의 신호값들이 이용되지만, 제 2 이차함수(2620)가 베이스라인으로 설정되면 전체 사이클에서 제 2 이차함수(2620)의 함수값들이 이용된다.
분석 장치는 전체 사이클에서 데이터 세트(2600)의 신호값으로부터 제 2 이차함수(2620)의 함수값을 차감하여 데이터 세트(2600)를 보정할 수 있다. 분석 장치는 보정된 데이터 세트를 분석하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있다.
본 발명은 음성 대조군과 같은 별도의 분석물의 분석 없이도 데이터 세트(2600)를 분석하는 것만으로도 베이스라인을 설정할 수 있는 장점을 갖는다.
도 16은 MuDT 기술에 기초하여 본 발명의 방법에 대한 순서도이다. 도 16을 참조하여, 본 발명의 방법을 각각의 단계별로 상세하게 설명하면 다음과 같다.
단계 2710에서 2가지 상이한 온도에서 신호를 검출한다. 상대적으로 저온 검출 온도 및 상대적으로 고온 검출 온도에서 신호가 검출된다.
단계 2720에서 상대적 저온 검출온도에서 검출된 신호를 평가한다. 상대적 저온 검출온도에서 검출된 신호가 제 1 역치값에 의해 정의된 제 1 기준을 만족하는지를 결정한다.
상대적 저온 검출온도에서 검출된 신호가 제 1 기준을 만족할 때, 단계 2730을 진행하고, 상대적 저온 검출온도에서 검출된 신호가 제 1 기준을 만족하지 않을 때, 제 1 타겟 핵산 서열 및 제 2 타겟 핵산 서열이 시료 내 존재하지 않는 것으로 결정되고, 단계 2730을 진행하지 않는다.
상대적 저온 검출온도에서 검출된 신호가 제 1 기준을 만족하지 않는다는 것은 시료 내 제 1 타겟 핵산 서열 및 제 2 타겟 핵산 서열이 부존재한다는 것을 의미한다. 따라서, 단계 2730을 실시할 필요가 없으므로, 절차를 종료한다.
상대적 저온 검출온도에서 검출된 신호가 제 1 기준을 만족한다는 것은 제 1 타겟 핵산 서열 또는 제 2 타겟 핵산 서열이 시료 내 존재할 가능성이 있다는 것을 의미하므로, 다음 단계들을 진행한다. 상대적 저온 검출온도에서 검출된 신호가 제 1 기준을 만족한다고 해도, 반드시 2개의 타겟 핵산 서열 중 1개 이상의 타겟 핵산 서열이 시료 내 존재한다는 것을 의미하는 것은 아니다.
제 1 기준은 제 1 역치값에 의해 정의(define)될 수 있다. 본 단계에서 사용되는 “제 1 역치값”은 상대적 저온 검출온도에서 검출된 신호의 유의성을 결정하기 위해 사용되는 역치값을 의미한다.“제 2 역치값”은 제 2 타겟 핵산 서열에 대한 신호의 유의성을 결정하기 위해 사용되는 역치값을 의미한다.“제 3 역치값”은 제 1 타겟 핵산 서열에 대한 신호의 유의성을 결정하기 위해 사용되는 역치값을 의미한다.“제 3 역치값”은 상대적 고온 검출온도에서 검출된 신호의 유의성을 결정하기 위해 사용되는 역치값을 의미할 수도 있다. 신호의 유의성은 특정 온도에서 생성된 신호가 특정한 역치값 대비 의미있는 수준으로 생성되는 것을 의미한다. 신호의 유의성은 특정 신호-발생 수단에 의해 생성된 신호와 그 이외의 신호를 구분하기 위해 설정된 적절한 역치값에 의해 판단될 수 있다. 구체적으로, 신호의 유의성을 판단하는데 사용되는 역치값은 관심의 핵산 서열로부터 유래되지 않은 신호, 예컨대 배경 신호 또는 노이즈 신호 등을 배제할 수 있는 임의의 값으로 설정되는 것이다. 하나의 예로서, 증폭 반응이 진행됨에 따라 신호가 증폭되는 경우, 신호가 역치값 이상이면 신호는 유의한 것으로 결정될 수 있다.
역치값들(제 1, 제 2, 제 3 역치값들)은 통상적인 역치값 설정 방법에 따라 정해질 수 있다. 예를 들어, 역치값들은 배경 신호, 민감도, 표지 특성, 검출기의 신호 변이(signal variation) 또는 오차 범위를 고려하여 결정할 수 있다. 역치값들은 신호-발생 반응의 지수 구역(exponential region)에 설정될 수 있다. 역치값들은 신호-발생 반응의 정체 구역(plateau region)의 신호값보다 크지 않으면서 베이스라인 영역(baseline region)의 신호값보다 큰 값으로 설정될 수 있다. 또는, 역치값들은 베이스라인 차감된 증폭곡선에서 베이스라인 영역의 신호값들의 표준편차에 일정한 값(예컨대, 10)을 곱한 값으로 설정할 수 있다.
역치값들은 검출기가 자동적으로 또는 실시자가 직접 설정할 수 있다. 예를 들어, 제 1 역치값은 100(RFU)이 될 수 있다.
단계 2730에서 제 2 타겟 핵산 서열에 대한 신호를 추출한다. 단계 2720에서 상대적 저온 검출온도에서 검출된 신호가 제 1 기준을 만족할 때, 제 2 타겟 핵산 서열에 대한 신호를 추출한다. 본 발명의 특징 중 하나는, 상대적 고온 검출온도에서 검출된 신호가 제 3 기준을 만족하지 않더라도, 제 2 타겟 핵산 서열에 대한 신호를 추출하는 단계를 실시하는 것이다.
본 발명은 상대적 고온 검출온도에서 검출된 신호가 제 3 기준을 만족하지 못할 때도, 즉 상대적 고온 검출온도에서 검출된 신호와 무관하게 신호를 추출하는 단계 2730을 실시한다.
2개의 상이한 검출 온도에서 검출된 신호들과 기준값을 이용하여 특정 타겟 핵산 서열에 대한 신호를 추출하는 과정을 본원에서는‘신호 추출 과정(Signal Extraction Process)’이라 명명한다.
단계 2740에서 제 2 타겟 핵산 서열에 대한 신호를 평가한다. 추출된 제 2 타겟 핵산 서열에 대한 신호가 제 2 역치값 또는 제 2 신호 변위에 의해 정의된 제 2 기준을 만족하는지 식별한다. 제 2 타겟 핵산 서열에 대한 신호가 제 2 기준을 만족할 때, 제 2 타겟 핵산 서열이 시료 내 존재하는 것으로 결정된다. 제 2 타겟 핵산 서열에 대한 신호가 제 2 기준을 만족하지 않을 때, 제 2 타겟 핵산 서열이 시료 내 부존재하는 것으로 결정된다. 제 2 기준은 제 2 역치값 또는 제 2 신호 변위에 의해 정의된다.
비선형 함수 피팅 방법을 적용하기 이전에, 제 2 타겟 핵산 서열에 대한 신호는 이차함수를 이용하여 보정될 수 있고, 이차함수와 제 2 타겟 핵산 서열에 대한 신호 사이의 피팅 정확도를 이용하여 제 2 타겟 핵산 서열의 부존재가 결정될 수 있다.
피팅을 수행하기 이전에, 분석 장치는 제 2 타겟 핵산 서열에 대한 신호에 대한 베이스라인을 설정하고, 제 2 타겟 핵산 서열에 대한 신호에서 베이스라인을 차감하여 보정된 제 2 타겟 핵산 서열에 대한 신호를 생성할 수 있다. 분석 장치는 보정된 제 2 타겟 핵산 서열에 대한 신호에 비선형 함수 피팅 방법을 적용할 수 있다.
본 발명의 일 구현예에서, 분석 장치는 피팅 구간을 설정하고, 피팅 구간에서 제 2 타겟 핵산 서열에 대한 신호에 피팅된 이차함수를 생성하여, 이차함수를 베이스라인으로 설정할 수 있다. 피팅 구간은 미리 설정된 구간일 수 있다. 일 예에서, 피팅 구간은 4 사이클부터 12 사이클까지 설정될 수 있다. 분석 장치는 4 사이클부터 12 사이클까지의 신호값들과 가장 일치하는 이차함수를 피팅을 통해 생성한다. 이때, 이차함수는 대칭축을 가질 수 있고, 대칭축은 신호-발생 반응의 최종 사이클±10, 최종 사이클±8, 최종 사이클±6, 최종 사이클±5, 최종 사이클±3, 최종 사이클±2 또는 최종 사이클±1의 범위에서 선택될 수 있다.
분석 장치는 보정된 데이터 세트(또는, 보정된 제 2 타겟 핵산 서열에 대한 신호)와 비선형 함수를 피팅하고, 피팅된 비선형 함수와 보정된 데이터 세트 사이의 피팅 정확도를 이용하여 제 2 타겟 핵산 서열의 존재 또는 부존재를 결정할 수 있다.
단계 2750에서 제 1 타겟 핵산 서열에 대한 신호를 평가한다.
분석 장치는 상대적 고온 검출온도에서 검출된 신호가 제 3 역치 또는 제 3 신호 변위에 의해 정의되는 제 3 기준을 만족하는지 식별한다. 상대적 고온 검출온도에서 검출된 신호가 제 3 기준을 만족할 때, 제 1 타겟 핵산 서열이 시료 내 존재하는 것으로 결정되고, 상대적 고온 검출온도에서 검출된 신호가 제 3 기준을 만족하지 않을 때, 제 1 타겟 핵산 서열이 시료 내 부존재하는 것으로 결정된다.
본 발명의 일 구현 예에서, 상대적 고온 검출온도에서 검출된 신호가 제 3 기준을 만족하더라도, 제 1 타겟 핵산 서열이 시료 내 존재하는 것으로 최종적으로 결정하기 위해 비선형 함수 피팅 방법이 사용될 수 있다.
단계 2750은 단계 2710 및 단계 2720 사이, 단계 2720 및 단계 2730 사이, 단계 2730 및 단계 2740 사이 또는 단계 2740 이후에 실시될 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 데이터 세트에 대한 비선형 함수의 피팅 정확도를 타겟 분석물 분석, 특히 타겟 분석물의 검출에 직접적인 지표로 이용하여, 위양성 및 위음성, 특히 위양성 없이 타겟 분석물을 검출할 수 있도록 한다.
(b) 타겟 핵산서열을 핵산 증폭반응으로 검출하는 본 발명의 구현예에서, 본 발명은 Ct 값을 얻기 위한 역치값을 설정하지 않고, 시료 내 타겟의 존재 또는 부존재를 정확하고 신속하며 간편하게 결정할 수 있다.
(c) 타겟 핵산서열을 핵산 증폭반응으로 검출하는 본 발명의 구현예에서, 비선형 피팅 함수의 피팅 정확도 이외에 (ⅰ) 데이터 세트, 보정된 데이터 세트 또는 비선형 피팅 함수의 변위, (ⅱ) 비선형 피팅 함수의 최대 기울기 및 (ⅲ) 비선형 피팅 함수의 형태를 결정하는 파라미터(특히, 4개의 파라미터를 포함하는 시그모이드 함수의 a4)를 이용하여 타겟 핵산서열은 검출될 수 있으며, 이로 인해 다양한 임상 시료에서 나타나는 잘못된 타겟 결정, 특히 위양성을 완벽하게 제거할 수 있다.
(d) 본 발명에서, 변위, 최대 기울기 및 형태-결정적 파라미터와 같은 타겟 분석물의 존재 또는 부존재를 결정하는데 이용되는 파라미터들에 적용되는 역치값들은 특정 신호값을 고려하는 종래 기술과 다르게 데이트 세트의 신호 패턴(예컨대, 핵산 증폭 반응의 데이터 세트)을 고려하여 설정된다. 이러한 점에서, 본 발명은 실험 마다, 반응 마다, 제품 마다, 장비 마다 구체적으로 역치값을 설정할 필요가 없는 장점을 갖는다. 예컨대, 미리 핵산 증폭반응의 데이터 세트에서 적합한 역치값을 설정하면, 설정된 역치값은 이후의 모든 핵산 증폭반응에 적용될 수 있다. 또는, 역치값은 시료의 종류마다 각각 설정하고, 설정된 역치값은 이후의 해당 시료를 이용하는 모든 핵산 증폭반응에 적용될 수 있다. 예를 들어, 분변(stool)을 이용한 핵산증폭 반응에 대한 역치값을 미리 설정하면, 설정된 역치값은 이후의 분변 시료를 이용하는 모든 핵산 증폭반응에 적용될 수 있다.
(e) 본 발명은 기본적으로 신호의 세기가 아니라 신호의 패턴을 이용하여 타겟 분석물을 분석하는 것이기 때문에, 노이즈 영향을 상당히 줄일 수 있다.
(f) SBN 기술을 이용하는 일 구현예에서, 비선형 피팅 함수는 표준화 계수를 이용하여 표준화된 데이터 세트에 적용된다.
(g) SBN 기술을 이용하는 일 구현예에서, 본 발명은 보다 편리한 방식으로 데이터 세트를 보정할 수 있으며, 기기 간 및 기기 내 신호 편차를 크게 줄일 수 있다. SBN 기술을 이용하여 표준화된 데이터 세트는 매우 편리한 방식으로 비선형-피팅 함수의 파라미터들에 대한 역치값들을 설정하도록 한다.
(h) 본 발명은 표준화된 데이터 세트의 형태(shape)가 전형적인 증폭 곡선의 형태와 일치하는지 여부를 분석하여 타겟 분석물의 존재 또는 부존재를 결정하므로, 노이즈나 점프 에러로 인해 위양성으로 판단할 가능성이 매우 낮다.
(i) 일 구현예에 따르면, 본 발명은 하나의 특성이 아닌 비선형 피팅 함수의 최소 두 개의 특성들을 분석하여 검출 결과를 도출하기 때문에 위양성 또는 위음성 결과들을 줄일 수 있다는 점에서 매우 획기적인 기술이다.
(j) SBN 기술을 이용하는 일 구현예에서, 적절한 기준값을 이용한 데이터 표준화를 하는 본 발명은 신호-발생 수단(예를 들어, 프라이머 및 프로브)의 양을 줄이는데 보다 유리하다.
(k) 일 구현예에서, 본 발명은 데이터 세트에 대한 제 1 이차함수가 최소일 때의 사이클을 특히 타겟 분석물의 부존재를 검출하는 직접적인 지표로 이용하여, 위양성 및 위음성, 특히 위양성 없이 타겟 분석물을 분석할 수 있다.
(l) 일 구현예에서, 본 발명은 (ⅰ) 데이터 세트에 대한 제 1 이차함수가 최소일 때의 사이클 또는 (ⅱ) 베이스라인 영역의 사이클을 제 2 이차함수의 피팅 구간으로 이용하여 제 2 이차함수의 피팅 정확도를 타겟 분석물의 부존재를 결정하는 직접적인 지표로 이용하여, 위양성 및 위음성, 특히 위양성 없이 타겟 분석물을 분석할 수 있다.
(m) 일 구현예에서, 본 발명은 (ⅰ) 데이터 세트에 대한 제 1 이차함수가 최소일 때의 사이클 또는 (ⅱ) 베이스라인 영역의 사이클에 기초하여 결정된 제 2 이차함수를 데이터 세트를 보정하는데 이용할 수 있다.
(n) 데이터 세트에 대한 제 1 이차함수가 최소일 때의 사이클에 대한 역치값 및 제 2 이차함수의 피팅 정확도에 대한 역치값은 특정의 신호값을 고려하는 종래 기술과 다르게 데이터 세트(예컨대, 핵산 증폭반응의 데이터 세트)의 신호 패턴을 고려하여 설정된다. 이러한 점에서, 본 발명은 실험 마다, 반응 마다, 제품 마다, 장비 마다 역치값을 구체적으로 설정할 필요가 없는 장점을 갖는다.
도 1은 일 실시예에 따른 타겟 분석물을 분석하는 장치를 나타낸다.
도 2는 일 실시예에 따른 분석 장치를 설명하기 위한 구성도이다.
도 3은 일 실시예에 따른 타겟 분석물의 분석 방법을 설명하기 위한 순서도이다.
도 4는 일 실시예에 따른 타겟 분석물의 존재 또는 부존재를 결정하는 방법을 설명하기 위한 순서도이다.
도 5는 시료 내 타겟 분석물이 존재하는 경우 피팅 정확도를 이용하여 분석하는 방법을 설명하기 위한 도면이다.
도 6은 최대 기울기를 이용하여 타겟 분석물의 존재 또는 부존재를 결정하는 방법을 설명하기 위한 순서도이다.
도 7은 시료 내 타겟 분석물이 존재하는 경우 최대 기울기를 이용하여 분석하는 방법을 설명하기 위한 도면이다.
도 8은 SBN 방법을 이용하여 데이터 세트를 표준화하는 방법을 설명하기 위한 도면이다.
도 9는 비-선형 함수에 대한 특성을 설명하기 위한 도면이다.
도 10은 이차 함수를 이용하는 본 발명의 일 실시예에 따른 순서도이다.
도 11은 본 발명의 일 실시예에 따른 데이터 세트를 보정하는 방법을 설명하기 위한 순서도이다.
도 12는 제 1 이차 함수를 이용하여 피팅 구간을 설정하는 방법을 설명하기 위한 도면이다.
도 13은 Cmin을 이용하여 시료 내 타겟 분석물의 부존재를 결정하는 방법을 설명하기 위한 도면이다.
도 14는 제 2 이차 함수와 데이터 세트의 피팅 정확도를 이용하여 시료 내 타겟 분석물의 부존재를 결정하는 방법을 설명하기 위한 도면이다.
도 15는 제 2 이차 함수를 이용하여 베이스라인을 설정하는 방법을 설명하기 위한 도면이다.
도 16은 MuDT 기술에 기초한 본 발명의 방법을 설명하기 위한 순서도이다.
도 17 내지 도 20은 표준화 되지 않은 데이터 세트에 대한 분석 결과를 나타내는 도면이다.
도 21 내지 도 24는 표준화 된 데이터 세트에 대한 분석 결과를 나타내는 도면이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1: 위장관 감염 바이러스의 검출
데이터 세트의 수득
급성설사의 주요 원인인 노로바이러스(Norovirus) GI, 노로바이러스 GⅡ, 아데노바이러스(Adenovirus) 및 로타바이러스(Rotavirus)를 검출하기 위하여 Seegene 사의 AllplexTM GI-Virus Assay를 사용하였다.
CFX96TM 실-시간 PCR 검출 시스템(Bio-rad)을 이용하여 30개의 샘플들에 대해 핵산 증폭 반응을 수행하였다. 핵산 증폭 반응은 95℃에서 10초, 60℃에서 1분 그리고 72℃에서 30초를 반복하는 조건으로 수행되었고, 총 45 사이클을 진행하였다. PTOCE(WO 2012/096523) 및 MuDT(WO 2015/147412) 기술을 이용하여 CFX96으로부터 데이터 세트를 수득하였다. 상기 데이터 세트는 모든 증폭 사이클들에 대한 신호값들을 포함한다.
30개의 샘플들은 다음의 표 1과 같이 임상 실험에 의해 양성 또는 음성이 확인된 샘플들이다(양성 샘플 20개, 음성 샘플이 10개).
샘플 1, 2, 3, 6 및 7은 노로바이러스 GⅡ, 샘플 9, 10, 11, 13 및 14는 아데노바이러스, 샘플 16, 17, 19, 20 및 21은 노로바이러스 GI, 그리고 샘플 24, 26, 27, 28 및 29는 로타바이러스에 감염된 샘플이다.
샘플1 양성 샘플11 양성 샘플21 양성
샘플2 양성 샘플12 음성 샘플22 음성
샘플3 양성 샘플13 양성 샘플23 음성
샘플4 음성 샘플14 양성 샘플24 양성
샘플5 음성 샘플15 음성 샘플25 음성
샘플6 양성 샘플16 양성 샘플26 양성
샘플7 양성 샘플17 양성 샘플27 양성
샘플8 음성 샘플18 음성 샘플28 양성
샘플9 양성 샘플19 양성 샘플29 양성
샘플10 양성 샘플20 양성 샘플30 음성
보정된 데이터 세트의 수득
데이터 세트를 보정하기 위해 음성 대조군 차감(Negative control Subtraction)을 수행하였다. 음성 대조군은 시료의 첨가 없이 AllplexTM GI-Virus Assay의 구성(component)만을 포함한다. 샘플들에 대한 핵산 증폭 반응을 수행할 때, 동일한 플레이트에서 함께 음성 대조군의 증폭 반응을 수행하여 음성 대조군에 대한 데이터 세트를 수득하였다. 각 사이클에서 데이터 세트의 신호값에서 음성 대조군의 신호값을 차감하여 보정된 데이터 세트를 수득하였다. 각 샘플에 대해 음성 대조군 차감을 수행하였고, 보정된 데이터 세트를 수득하였다.
시그모이드 함수 피팅을 이용한 타겟 핵산분자의 존재 또는 부존재를 결정
(a) 시그모이드 피팅 함수의 수득
샘플들 각각으로부터 수득된 보정된 데이터 세트에 대해 4개의 파라미터들을 포함하는 수학식 3을 이용하여 시그모이드 함수와의 피팅을 수행하였다. LM 알고리즘(Levenberg-Marquardt 알고리즘; Christian Kanzow et al., JCAM, 172(2):375(2004))을 적용하여 보정된 데이터 세트에 피팅된 시그모이드 함수를 수득하였다.
(b) 시그모이드 함수의 변위에 의한 음성 1차 필터링
시그모이드 함수의 변위를 이용하여 음성 샘플을 필터링하였다. 시그모이드 피팅 함수의 변위는 시그모이드 피팅 함수의 최대 RFU와 최소 RFU의 차이를 계산하여 수득하였다. 계산된 변위와 변위에 대한 역치값(RFU 100)을 비교하여 음성 샘플을 필터링하였다. 상기 피팅된 시그모이드 함수의 변위가 100(RFU) 이하인 샘플은 음성으로 결정하였다.
5개의 샘플들의 시그모이드 함수의 변위가 100(RFU) 이하이었고, 음성으로 필터링하였다(샘플 5, 8, 12, 23 및 25)(표 2).
샘플 변위
(ΔRFU)
샘플 변위
(ΔRFU)
샘플 변위
(ΔRFU)
샘플1 3452 샘플11 1516 샘플21 2209
샘플2 1202 샘플12 -85 샘플22 315
샘플3 3224 샘플13 2553 샘플23 -82
샘플4 260 샘플14 2670 샘플24 2470
샘플5 -395 샘플15 412 샘플25 -121
샘플6 3393 샘플16 1584 샘플26 2034
샘플7 4047 샘플17 621 샘플27 700
샘플8 -913 샘플18 307 샘플28 4588
샘플9 1916 샘플19 1953 샘플29 112
샘플10 1897 샘플20 2111 샘플30 3452
(c) 시그모이드 피팅 함수의 최대 기울기에 의한 음성 2차 필터링
시그모이드 피팅 함수의 최대 기울기를 이용하여 나머지 25개의 샘플들에 대해 2차 음성 필터링을 수행하였다. 최대 기울기는 각 샘플들에 대하여 시그모이드 피팅 함수를 미분하여 계산하였다(즉, 상기 시그모이드 함수에 대한 FDM(the first derivative maximum) 값). 최대 기울기에 대한 역치값은 28로 설정되었다.
표 3에 정리된 바와 같이, 4개의 샘플들(샘플 15, 18, 22 및 30)의 시그모이드 함수의 최대 기울기가 28 미만이므로, 4개의 샘플들을 음성으로 필터링하였다.
샘플 최대기울기 샘플 최대기울기 샘플 최대기울기
샘플1 672 샘플11 420 샘플21 355
샘플2 127 샘플12 - 샘플22 12
샘플3 665 샘플13 236 샘플23 -
샘플4 56 샘플14 193 샘플24 453
샘플5 - 샘플15 11 샘플25 -
샘플6 306 샘플16 149 샘플26 61
샘플7 472 샘플17 43 샘플27 235
샘플8 - 샘플18 8 샘플28 53
샘플9 194 샘플19 157 샘플29 479
샘플10 246 샘플20 273 샘플30 5
(d) 피팅 정확도 R2 값에 의한 양성 또는 음성 샘플의 최종 결정
음성으로 결정된 9개의 샘플들을 제외한, 나머지 21개의 샘플들에 대해 피팅 정확도를 계산하였다. 피팅 정확도로 R2 값을 이용하였다. R2 값은 수학식 4를 이용하여 계산되었고, R2 값에 대한 역치값은 0.87을 설정하였다. R2 값이 0.87 이하인 샘플은 음성으로 결정하였다.
표 4에서 볼 수 있듯이, 21개의 샘플들 중 1개의 샘플들에 대한 R2값이 0.87 미만으로서 음성 샘플로 확인되었다(샘플 4). 나머지 20개의 샘플들은 R2 값이 0.87을 초과하여 양성 샘플로 확인되었다.
샘플 R2 샘플 R2 샘플 R2
샘플1 0.998 샘플11 0.962 샘플21 0.998
샘플2 0.997 샘플12 - 샘플22 -
샘플3 0.994 샘플13 0.993 샘플23 -
샘플4 0.203 샘플14 0.994 샘플24 0.999
샘플5 - 샘플15 - 샘플25 -
샘플6 0.992 샘플16 0.996 샘플26 0.993
샘플7 0.992 샘플17 0.993 샘플27 0.994
샘플8 - 샘플18 - 샘플28 0.995
샘플9 0.997 샘플19 0.999 샘플29 0.998
샘플10 0.998 샘플20 0.999 샘플30 -
실시예 2: 종래 기술에 의한 위장관 감염 바이러스의 검출 (실시예 1에 대한 비교 실시예)
데이터 세트의 수득
실시예 1과 동일한 과정을 통해 데이터 세트를 수득하였다.
보정된 데이터 세트의 수득
Nearest neighbor smoothing 알고리즘(Winfried Stute et al., Journal of Multivariate Analysis, 34:61(1990))을 통해 노이즈를 제거하였다. 원 데이터 세트(raw data set)의 차이가 기준 역치값 이상이 되는 사이클까지 선형회귀를 시행하여 베이스라인을 수득하였고, 베이스라인 차감을 통해 보정된 데이터 세트를 수득하였다.
C t 값들에 대한 역치값을 이용하여 타겟 핵산분자의 존재 또는 부존재를 결정
상기 보정된 데이터 세트가 Ct 값들에 대한 역치값을 초과하는지를 판단하여 샘플들 각각에 대한 양성 또는 음성을 판정하였다. 보정된 데이터 세트에서 역치값을 초과하는 신호값이 있으면 그 샘플은 양성으로 판정하고, 역치값을 초과하는 신호값이 없으면 그 샘플은 음성으로 판정하였다. Ct 값들에 대한 역치값은 노로바이러스 GI, 노로바이러스 GⅡ, 아데노바이러스 및 로타바이러스에 대해서 각 120, 120, 60 그리고 120이 사용되었다.
샘플1 양성 샘플11 양성 샘플21 양성
샘플2 양성 샘플12 음성 샘플22 음성
샘플3 양성 샘플13 양성 샘플23 음성
샘플4 양성 샘플14 양성 샘플24 양성
샘플5 양성 샘플15 음성 샘플25 음성
샘플6 양성 샘플16 양성 샘플26 양성
샘플7 양성 샘플17 양성 샘플27 양성
샘플8 양성 샘플18 음성 샘플28 양성
샘플9 양성 샘플19 양성 샘플29 양성
샘플10 양성 샘플20 양성 샘플30 음성
표 5에 정리된 바와 같이, 7개 음성, 및 23개 양성으로 분석되었다. 23개의 양성 샘플들 중 3개의 샘플들(4, 5 및 8)은 임상 실험 결과에서는 음성 샘플로 확인되었다. 따라서, 역치값을 적용하는 종래 기술은 본 발명 보다 위양성 결과가 나올 가능성이 더 클 것이다.
실험 결과
본 발명과 종래 방법을 적용하여 30개의 샘플들을 분석하였다. 샘플은 총 30개이고, 임상 실험에 의해 양성 샘플은 20개, 음성 샘플은 10개로 판정되었다.
샘플 임상실험 종래기술 본 발명
샘플1 양성 양성 양성
샘플2 양성 양성 양성
샘플3 양성 양성 양성
샘플4 음성 양성 음성
샘플5 음성 양성 음성
샘플6 양성 양성 양성
샘플7 양성 양성 양성
샘플8 음성 양성 음성
샘플9 양성 양성 양성
샘플10 양성 양성 양성
샘플11 양성 양성 양성
샘플12 음성 음성 음성
샘플13 양성 양성 양성
샘플14 양성 양성 양성
샘플15 음성 음성 음성
샘플16 양성 양성 양성
샘플17 양성 양성 양성
샘플18 음성 음성 음성
샘플19 양성 양성 양성
샘플20 양성 양성 양성
샘플21 양성 양성 양성
샘플22 음성 음성 음성
샘플23 음성 음성 음성
샘플24 양성 양성 양성
샘플25 음성 음성 음성
샘플26 양성 양성 양성
샘플27 양성 양성 양성
샘플28 양성 양성 양성
샘플29 양성 양성 양성
샘플30 음성 음성 음성
표 6에서 볼 수 있듯이, 종래 기술에 의해 3개의 샘플들에 대해 위양성 결과가 나왔다. 그러나, 본 발명은 30개의 샘플들 모두 임상 실험 결과와 동일한 분석 결과를 나타내었다. 따라서, 본 발명의 분석 방법에 따르면 Ct 값을 얻기 위한 역치값 설정 없이 시료 내 타겟 핵산분자의 존재 또는 부존재를 정확하고 신속하며 간편하게 결정할 수 있음을 알 수 있었다.
실시예 3: 데이터 세트의 표준화 방법 및 비선형 피팅 함수를 이용한 시료 내 타겟 분석물의 분석 방법
SBN(Specific Background signal-based Normalization) 방법에 따라 표준화 방법에 의해 데이터 세트를 보정한 뒤 본 발명의 방법에 따라 비선형 피팅 함수를 이용하여 시료 내 타겟 분석물의 존재 여부를 분석하였다.
데이터 세트의 수득
4개의 타겟 핵산서열에 대한 실-시간 중합효소 연쇄반응을 실시하였다. 3대의 CFX96 실-시간 PCR 장치(Bio-Rad)을 이용하여 4개의 타겟 핵산서열을 동시에 증폭하였고, 각각의 타겟 핵산서열에 대하여 TaqMan 프로브를 신호-발생 수단으로 사용하여 증폭 사이클 50회로 수행하였다. 동일한 타겟 핵산서열이 동일한 농도로 포함된 샘플을 이용하여 각 장비별, 채널별로 96개 웰에서 96개 반응을 동일한 조건에서 수행하였으며, 이로부터 12개 그룹(3개 장비 x 4개 채널)의 데이터 세트를 수득하였다.
명칭 실-시간 PCR 장치
장비 1 CFX96 실-시간 사이클러 (Bio-rad)
장비 2
장비 3
데이터 세트의 표준화
장비별/채널별 기준값을 적용하여 데이터 세트를 보정하였다. 기준 총 신호 변화값(Reference TSC; R-TSC)에 대한 각 장비별/채널별 데이터 세트의 총 신호 변화값의 비율을 이용하여 장비별/채널별 기준값을 결정하였다. 기준 총 신호 변화값은 모든 장비/채널에 대해서 RFU 5,000으로 임의로 결정하였고, 데이터 세트의 총 신호 변화값은 각 장비별/채널별 96개 반응의 평균값을 기준으로 결정하였다. 상기 데이터 세트의 기준 사이클의 신호값을 상기 비율로 보정하였고 상기 기준 사이클의 보정된 신호값을 기준값으로 이용하여 해당 장비의 해당 채널로부터 수득된 데이터 세트들에 적용하였다.
하기 단계 1 내지 단계 3에서 장비별, 채널별 데이터 세트로부터 기준값을 결정하고, 단계 4에서는 상기 결정된 장비별, 채널별 기준값을 이용하여 상기 데이터 세트를 보정하였다.
<단계 1>
기준 사이클을 데이터 세트의 5 사이클로 결정하였고, 상기 5 사이클의 신호값을 기준값의 결정에 사용하였다. 또한, 데이터 세트의 총 신호 변화값은 마지막 50 번째 사이클에서의 신호값에서 기준 사이클에서의 신호값을 차감하여 산출하였다. TSC 및 기준 사이클의 신호값은 표 8에 정리하였다.
채널 장비 데이터 세트의 총 신호 변화값 (RFU) 데이터 세트의기준 사이클에서의 신호값 (RFU)
채널 1
(FAM)
장비 1 2,567 5,635
장비 2 4,365 8,495
장비 3 8,704 14,158
채널 2
(HEX)
장비 1 3,572 2,877
장비 2 6,087 3,497
장비 3 12,478 4,631
채널 3
(CalRed 610)
장비 1 4,757 2,069
장비 2 11,078 2,451
장비 3 16,361 2,642
채널 4
(Quasar 670)
장비 1 928 2,923
장비 2 3,022 4,284
장비 3 5,984 5,981
<단계 2>
상기 산출된 총 신호 변화값과 함께 각 장비와 채널에서 기준값 결정에 사용될 기준 총 신호 변화값(reference TSC; R-TSC)을 RFU 5,000으로 지정하였다.
<단계 3>
상기 총 신호 변화값, 기준 사이클의 신호값과 기준 총 신호 변화값을 이용하여 각 장비에 적용될 기준값을 다음과 같이 산출하였다.
Figure 112020037081791-pct00006
데이터 세트의 보정에 사용될 기준값은 표 9와 같이 결정되었다.
채널 장비 TSC R-TSC R-TSC에 대한 TSC의 비율 기준 사이클의 신호값 기준값
1 1 2,567 5,000 0.5133 5,635 10,978
2 4,365 5,000 0.8730 8,495 9,731
3 8,704 5,000 1.7407 14,158 8,134
2 1 3,572 5,000 0.7145 2,877 4,027
2 6,087 5,000 1.2174 3,497 2,873
3 12,478 5,000 2.4656 4,631 1,856
3 1 4,757 5,000 0.9514 2,069 2,175
2 11,078 5,000 2.2157 2,451 1,106
3 16,361 5,000 3.2722 2,642 808
4 1 928 5,000 0.1855 2,923 15,758
2 3,022 5,000 0.6045 4,284 7,088
3 5,984 5,000 1.1969 5,981 4,997
<단계 4>
상기 결정된 기준값을 이용하여, 12개 그룹의 데이터 세트들을 다음과 같이 표준화 하였다: 각 웰의 데이터 세트에서 기준 사이클의 신호값과 상기 단계 3에서 결정된 기준값을 이용하여 표준화 계수(Normalization coefficient)를 계산하였다: 표준화 계수 = 기준 사이클의 신호값 ÷ 기준값
표준화 계수를 사용하여 모든 사이클에서 신호값들을 표준화 하여, 12개 그룹에 대해 표준화된 데이터 세트들을 수득하였다. 표준화된 신호값(RFU) = 데이터 세트의 신호값(RFU) ÷ 표준화 계수
베이스라이닝
12개 그룹의 데이터 세트와 표준화된 데이터 세트에 대한 베이스라이닝을 실시하였다. 대칭축을 갖는 이차함수를 이용하여 베이스라이닝을 수행하였다. 이차함수는 y = a(x-50)2 + c 의 형태를 사용하였다. 베이스라이닝에 대한 피팅 구간은 4 사이클 내지 12 사이클로 결정하였다. 4 사이클에서 12 사이클까지의 데이터 세트의 신호값에 피팅되는 이차함수를 생성하였다. 데이터 세트의 신호값으로부터 이차함수의 값을 차감하여 12개 그룹의 베이스라이닝 된 데이터 세트와 12개 그룹의 표준화 및 베이스라이닝 된 데이터 세트를 얻었다.
비선형 피팅 함수로서 시그모이드 함수의 수득
12개 그룹의 베이스라이닝 된 데이터 세트(도 17 내지 20 참조) 및 12개 그룹의 표준화 및 베이스라이닝 된 데이터 세트(도 21 내지 24)에 대해 4개의 파라미터들을 포함하는 수학식 3의 시그모이드 함수를 이용하여 시그모이드 함수와의 피팅을 수행하였다.
R2 값, 변위 값 및 최대 기울기를 실시예 1과 같이 계산하였다.
타겟 핵산분자의 존재 또는 부존재를 결정
시료 내 타겟 분석물의 존재 여부를 결정하기 위하여, 시그모이드 함수에서의 4개 파라미터, 변위, R2 및 최대 기울기에 대한 역치값을 하기와 같이 설정하였다: 변위 ≥ RFU 100; R2 ≥ 0.9; 최대 기울기 ≥ 50; 및 a4 < 2.0.
기준 4가지를 모두 만족하는 경우, 타겟 분석물이 시료 내에 존재하는 것으로 결정하였다. 4개의 기준 중 어느 하나라도 만족하지 못하는 경우, 타겟 분석물이 시료 내에 존재하지 않는 것으로 결정하였다. 12개 그룹의 표준화된 데이터 세트에 대한 비선형 피팅 함수의 분석 결과, 4가지 기준을 모두 만족하여 12개의 시료 내에 타겟 분석물이 모두 존재하는 것으로 결정되었다.
채널 1 2 3 4 1 2 3 4
- 1. 변위 ≥ RFU 100 2. a4 < 2.0
장비 1 4806 4500 4388 4570 0.29 0.30 0.23 0.29
장비 2 4699 4469 4198 4680 0.29 0.30 0.23 0.29
장비 3 4909 4699 4491 4780 0.28 0.30 0.23 0.29
- 3. R2 ≥ 0.9000 4. 최대 기울기 ≥ 50
장비 1 0.9997 0.9999 0.9997 0.9998 770 756 561 744
장비 2 0.9993 0.9995 0.9990 0.9989 758 742 499 745
장비 3 0.9997 0.9999 0.9997 0.9999 785 773 572 770
따라서, 데이터 세트를 표준화하고, 베이스라이닝 한 뒤, 비선형 피팅 함수로 분석하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정할 수 있음을 확인할 수 있었다.
Ct 값에 대한 역치값을 이용하여 정량 분석이 필요한 경우, 본 발명은 비선형 피팅 함수를 적용하여 데이터 세트의 노이즈 신호들을 표준화할 수 있고, SBN 방법에 의해 변위 또한 표준화할 수 있기 때문에 장비별 또는 채널별 신호 차이를 고려할 필요 없이 다른 장비들 또는 채널들에 대한 역치값을 용이하게 또는 균일하게 설정할 수 있다는 점에서 우수한 이점들을 보여준다.
도 17 내지 도 20은 각각 채널 1(FAM), 채널 2(HEX), 채널 3(CalRed 610) 및 채널 4(Quasar 670)에 대한 표준화 되지 않은 데이터 세트의 결과를 나타낸다. 도 17 내지 도 20에서 볼 수 있는 바와 같이, 표준화 되지 않은 데이터 세트에 대한 비선형 피팅 함수는 장비 간 신호 변화량 차이를 나타내는 변동 계수(Coefficient of Variation, CV)가 49.5%, 51.1%, 44.7%, 그리고 62.6%로 편차가 큰 것을 확인할 수 있었다.
도 21 내지 도 24는 각각 채널 1(FAM), 채널 2(HEX), 채널 3(CalRed 610) 및 채널 4(Quasar 670)에 대한 표준화된 데이터 세트의 결과를 나타낸다. 도 21 내지 도 24에서와 같이, 표준화된 데이터 세트의 비선형 함수는 장비 간 신호 변화량 변동 계수가 2.7%, 4.0%, 5.3%, 그리고 3.7%로 편차가 현저하게 감소한 것을 확인할 수 있다. 상기 비선형 함수 곡선으로부터 모든 장비 및 채널에서 동일한 역치값인 RFU 110를 사용하여 Ct 값을 계산하여 비교한 결과, Ct 값의 변동 계수가 표준화 방법의 미적용시 5.7% 이었고 표준화 방법의 적용시 1.6% 이었으며, 이는 SBN 방법과 함께 비선형 피팅 방법이 장비 및 채널 간에 변동(variation)이 크게 감소된 정량 데이터(예, Ct 값)를 제공 할 수 있음을 확인할 수 있었다.
표 11 내지 표 18는 도 17 내지 도 24의 데이터를 나타낸다.
SBN 미적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 2298 3643 7892 2298
Max. 2939 5443 9867 9867
Range 641 1799 1975 7569
Mean 2654 4491 8893 5346
SD 146 421 398 2645
CV (%) 5.5% 9.4% 4.5% 49.5%
SBN 미적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 3103 5201 10948 3103
Max. 3977 7054 13923 13923
Range 874 1854 2975 10820
Mean 3563 6026 12358 7316
SD 191 419 571 3735
CV (%) 5.4% 7.0% 4.6% 51.1%
SBN 미적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 4143 9092 14285 4143
Max. 5122 12902 18112 18112
Range 980 3810 3827 13969
Mean 4671 10867 16051 10530
SD 225 850 654 4703
CV (%) 4.8% 7.8% 4.1% 44.7%
SBN 미적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 830 2695 5338 830
Max. 1081 3557 6843 6843
Range 252 862 1505 6014
Mean 946 3064 6020 3343
SD 49 183 258 2093
CV (%) 5.2% 6.0% 4.3% 62.6%
SBN 적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 4806 4699 4909 4699
Max. 5529 5688 5314 5688
Range 723 989 404 989
Mean 5170 5137 5110 5139
SD 136 181 64 137
CV (%) 2.6% 3.5% 1.3% 2.7%
SBN 적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 4500 4469 4699 4469
Max. 5573 5474 5230 5573
Range 1073 1004 531 1103
Mean 4986 4946 4950 4961
SD 210 244 117 198
CV (%) 4.2% 4.9% 2.4% 4.0%
SBN 적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 4388 4198 4491 4198
Max. 5342 5721 5317 5721
Range
955 1523 827 1523
Mean 4909 4899 4903 4904
SD 219 354 176 260
CV (%) 4.5% 7.2% 3.6% 5.3%
SBN 적용 분석 결과
- 장비 1 장비 2 장비 3 전체
Min. 4570 4680 4780 4570
Max. 5809 6246 5300 6246
Range 1239 1566 520 1676
Mean 5099 5067 5030 5065
SD 225 215 96 189
CV (%) 4.4% 4.2% 1.9% 3.7%
Min.: 최소(Minimum)
Max.: 최대(Maximum)
Range : Max-Min
SD: 표준 편차(Standard Deviation)
CV: 변동 계수(Coefficient of variation)
SBN: 특정 배경신호 기반 표준화(Specific Background signal-based Normalization)
Ct 값

분석결과
(CV %)
채널 1 2 3 4 1 2 3 4
SBN - - - - + + + +
장비 1 0.4 0.5 0.5 0.4 0.3 0.4 0.5 0.4
장비 2 0.6 0.6 0.9 0.7 0.5 0.5 0.7 0.8
장비 3 0.5 0.5 0.4 0.3 0.4 0.4 0.4 0.2
전체 2.9 2.9 4.2 4.5 0.4 0.5 0.5 0.6
장비 1 4.4 1.6
장비 2 4.7 1.7
장비 3 4.4 1.7
전체 5.7 1.6
흥미롭게는, SBN 방법에 의해 신호 세기를 조절하여 표준화 시, 시그모이드 함수의 기본 형태와 관련된 파라미터 a3, a4 및 피팅 정확도인 R2 값은 변하지 않았으며, 이는 SBN 방법 적용에 의해 R2 값을 이용한 양성 또는 음성 시료의 결정 과 같은 본 발명의 비선형 피팅 분석 결과 및 파라미터 a4를 이용한 비정상적인 신호 검출에 영향을 주지 않음을 보여주었다. 따라서, 비선형 피팅 함수를 이용한 본 발명의 방법과 연동해서 상기 SBN 방법을 사용하기 적합함을 알 수 있었다.
실시예 4: 호흡기 감염 바이러스 Ⅰ의 검출
데이터 세트의 수득
호흡기 감염의 주요 원인인 인플루엔자 바이러스(Flu A 및 Flu B) 및 3종의 Flu A 서브타입(H1, H1pdm09 및 H3)을 검출하기 위하여 Seegene 사의 AllplexTM Respiratory Panel 1을 사용하였다.
CFX96TM 실-시간 PCR 검출 시스템(Bio-rad)을 이용하여 10개의 샘플들에 대해 핵산 증폭 반응을 수행하였다. 핵산 증폭 반응은 95℃에서 10초, 60℃에서 1분 그리고 72℃에서 10초를 반복하는 조건으로 수행되었고, 총 45 사이클을 진행하였다. PTOCE(WO 2012/096523) 및 MuDT(WO 2015/147412) 기술이 적용되어 CFX96으로부터 데이터 세트를 수득하였다. 데이터 세트는 모든 증폭 사이클들에 대한 신호값들을 포함한다.
10개의 샘플들은 다음의 표 20과 같이 임상 실험에 의해 양성 또는 음성이 확인된 샘플들이다(양성 샘플 5개, 음성 샘플 5개). 샘플 1은 Flu A, 샘플 2는 Flu B, 샘플 4는 Flu A-H1, 그리고 샘플 7 및 8은 Flu A-H3 바이러스에 감염된 샘플이다.
샘플1 양성 샘플6 음성
샘플2 양성 샘플7 양성
샘플3 음성 샘플8 양성
샘플4 양성 샘플9 음성
샘플5 음성 샘플10 음성
데이터 세트에 대한 제 1 이차함수를 생성
샘플들 각각의 데이터 세트와 제 1 이차함수를 피팅하였다. 제 1 이차함수로 y = ax2 + bx + c를 사용하였다. 데이터 세트와 제1 이차함수의 피팅은 LM 알고리즘(Levenberg-Marquardt 알고리즘; Christian Kanzow et al., JCAM, 172(2):375(2004))이 적용되었다.
제1 이차함수를 이용한 음성 필터링
(a) 제 1 이차함수의 계수를 이용하는 음성 1차 필터링
샘플
Figure 112020037081791-pct00007
의 계수
샘플
Figure 112020037081791-pct00008
의 계수
샘플1 1.808 샘플6 -0.079
샘플2 0.240 샘플7 0.481
샘플3 -0.011 샘플8 0.748
샘플4 0.866 샘플9 0.025
샘플5 0.262 샘플10 0.032
10개 샘플들 중 2개 샘플들에 대한 제 1 이차함수의
Figure 112020037081791-pct00009
의 계수가 0 미만이었고, 2개의 샘플들(샘플 3, 6)을 음성으로 필터링하였다.
(b) 제 1 이차 함수의 Cmin을 이용하는 음성 2차 필터링
샘플 Cmin 샘플 Cmin
샘플1 20 샘플6 -
샘플2 23 샘플7 1
샘플3 - 샘플8 16
샘플4 20 샘플9 17
샘플5 34 샘플10 45
10개 샘플들 중 2개 샘플들은 30 이상의 Cmin을 가졌고, 2개의 샘플들(샘플 5, 10)을 음성으로 필터링하였다.
C min 에 기초하여 결정된 피팅 구간에서 데이터 세트에 대한 제 2 이차함수를 생성
제 1 이차함수를 이용한 음성 필터링을 통과한 데이터 세트에 대해서 Cmin 값을 이용하여 피팅 구간을 결정하였다. 최소 피팅 사이클을 12로 정하고, Cmin이 12 이하인 경우에는 피팅 구간을 1 사이클에서 12 사이클까지, 그리고 Cmin이 12를 초과하는 경우에는 피팅 구간을 1 사이클에서 Cmin 사이클까지로 결정하고, 데이터 세트의 피팅 구간에서 제 2 이차함수를 생성하였다. 제 2 이차함수는 사이클 50의 대칭축을 갖는 함수로서 y = a(x-50)2 + c 의 형태를 사용하였다. 피팅 구간에서 데이터 세트와 제 2 이차함수의 피팅은 LM 알고리즘이 적용되었다.
제 2 이차함수를 이용한 음성 필터링
음성 필터링의 결과는 아래 표 23에 정리하였다.
샘플
Figure 112020037081791-pct00010
샘플
Figure 112020037081791-pct00011
샘플1 0.993 샘플6 -
샘플2 0.93173 샘플7 0.999
샘플3 - 샘플8 0.999
샘플4 0.996 샘플9 -0.131
샘플5 - 샘플10 -
제 1 이차 함수에 의한 음성 필터링에서 음성으로 결정된 4개의 샘플들을 제외한, 나머지 6개의 샘플들에 대해 피팅 정확도(R2 값)를 계산하였다. 피팅 정확도는 피팅 구간 내에서 데이터 세트와 제 2 이차함수를 이용하여 계산되었다. R2 값은 수학식 5를 이용하여 계산되었고, R2 값에 대한 역치값은 0.9를 적용하였다. 따라서, R2 값이 0.9 이하인 샘플은 음성으로 결정하였다.
표 23에서 볼 수 있듯이, 6개의 샘플들 중 1개의 샘플들에 대한 R2 값이 0.9 미만으로서 음성 샘플로 확인되었다(샘플 9). 나머지 5개의 샘플들은 R2 값이 0.9을 초과하여 데이터 세트의 신호값으로부터 제 2 이차함수의 값을 차감하여 데이터 세트를 보정하였다.
또한, 보정된 데이터 세트에 대한 시그모이드 피팅 함수에 의해 결정된 피팅 정확도(R2 값)를 계산한 결과, 샘플 1, 2, 4, 7 및 8의 경우 R2 값이 0.9 이상을 나타내어, 양성 샘플로 결정하였다.
실험 결과
본 발명을 적용하여 10개의 샘플들을 분석하였다. 이들 중, 제 1 이차함수의 x2의 계수를 이용하여 2개 샘플들을 음성으로 판정하였고, 제 1 이차함수가 최소일 때의 사이클(Cmin)을 이용하여 2개의 샘플들을 음성으로 판정하였다. 데이터 세트에 대한 제 2 이차함수의 피팅 정확도를 이용하여 1개의 샘플을 음성 판정하였다. 나머지 5개 샘플들에 대한 데이터 세트들은 제 2 이차함수를 이용하여 보정하였다.
따라서, 본 발명의 분석 방법에 따르면, 제 1 이차함수의 x2의 계수 및/또는 제1 이차함수가 최소일 때의 사이클(Cmin), 그리고 데이터 세트에 대한 제 2 이차함수의 피팅 정확도를 이용하여 신속하고 간편하게 시료 내 타겟의 부존재를 결정할 수 있음을 알 수 있다. 또한, 본 발명의 분석 방법에 따르면, 제 2 이차함수를 이용하여 데이터 세트를 보정하여 노이즈가 제거된 데이터 세트를 생성할 수 있다.
실시예 5: 호흡기 감염 바이러스 Ⅱ의 검출
데이터 세트의 수득
호흡기 감염의 주요 원인인 인플루엔자 바이러스(Flu A) 및 Flu A 서브타입(H1pdm09 및 H3)을 검출하기 위하여 Seegene 사의 AllplexTM Respiratory Panel 1을 사용하였다.
CFX96TM 실-시간 PCR 검출 시스템(Bio-rad)을 이용하여 4개의 샘플들에 대해 핵산 증폭 반응을 수행하였다. 핵산 증폭 반응은 95℃에서 10초, 60℃에서 1분 그리고 72℃에서 10초를 반복하는 조건으로 수행되었고, 총 45 사이클을 진행하였다. PTOCE(WO 2012/096523) 및 MuDT(WO 2015/147412) 기술이 적용되어 CFX96으로부터 데이터 세트를 수득하였다. 데이터 세트는 모든 증폭 사이클에서 상대적 저온 검출온도로 60℃ 및 상대적 고온 검출온도로 72℃에서의 모든 신호값들을 포함한다.
4개의 샘플들은 다음의 표 24와 같이 임상 실험에 의해 양성 또는 음성이 확인된 샘플들이다(양성 샘플 3개, 음성 샘플 1개). 샘플 1은 Flu A(72℃), 샘플 3은 Flu A-H1pdm09(60℃), 그리고 샘플 4는 Flu A-H3(72℃) 바이러스에 감염된 샘플이다. 샘플 4는 60℃에서 내부 대조군(Internal Control)에 대한 신호값들을 포함한다.
샘플 60℃에서 검출 결과 72℃에서 검출 결과
샘플1 음성 양성
샘플2 음성 음성
샘플3 양성 음성
샘플4 양성 양성
60℃ 데이터 세트에 대한 변위를 이용한 음성 필터링
샘플 60℃ 데이터 세트에 대한 변위
샘플1 3406.605
샘플2 24.169
샘플3 3902.416
샘플4 2977.709
변위는 최종 사이클에서의 신호값과 최소 신호 강도를 갖는 사이클에서의 신호값(최소 신호값) 사이의 차이로 계산되었다. 샘플 2는 변위가 역치값 100(RFU)을 초과하지 못하여, 음성으로 필터링 하였다.
60℃에서 검출된 신호에서 제 1 타겟 핵산서열에 대한 신호를 제거
(ⅰ) 제 1 타겟 핵산서열에 대한 신호를 제거하기 위한 기준값 및 (ⅱ) 상대적 저온 검출온도에서 검출된 신호를 이용하여 상대적 저온 검출온도에서 검출된 신호로부터 제 2 타겟 핵산서열에 대한 신호를 추출하였다.
제 2 타겟 핵산서열에 대한 신호 = [60℃ 온도에서 검출된 신호] - [(72℃의 상대적 고온 검출 온도에서 검출된 신호) x (제 1 타겟 핵산 서열에 대한 기준값)]
제 1 타겟 핵산서열에 대한 기준값은 검출 채널에 따라 달라지며 샘플 1, 3 및 4의 기준값은 각각 1.3, 1.2, 및 1.8이었다.
신호 변위를 이용한 음성 필터링
샘플 제 2 타겟 핵산서열에 대한 변위(60℃) 제 1 타겟 핵산서열에 대한 변위(72℃)
샘플1 55.529 2969.266
샘플2 - -
샘플3 3738.540 170.505
샘플4 671.070 1309.855
제 2 타겟 핵산서열에 대한 신호는 60℃에서 검출된 신호로부터 추출된 신호이다. 샘플 3개 중 1개의 샘플(샘플 1)에 대해 제 2 타겟 핵산 서열에 대한 마지막 45 사이클에서의 신호값과 최소 신호값 사이의 차이가 역치값 100(RFU)을 넘지 못하여, 샘플 1에 대한 제 2 타겟 핵산 서열을 음성으로 필터링하였다.
피팅 구간에서 신호에 대한 이차함수를 생성
제 1 타겟 핵산서열에 대한 신호 및 제 2 타겟 핵산서열에 대한 신호 각각을 이차함수와 피팅하였다. 피팅 구간은 4에서 12사이클로 설정하고, 이차함수의 대칭축은 사이클 50으로 설정되었다. 피팅은 LM 알고리즘을 이용하여 수행하였다.
이차함수의 피팅 정확도를 이용한 음성 필터링
샘플 제 2 타겟 핵산서열에 대한 피팅 정확도(60℃) 제 1 타겟 핵산서열에 대한 피팅 정확도(72℃)
샘플1 - 0.999
샘플2 - -
샘플3 0.999 0.990
샘플4 0.999 0.999
신호 변위 필터링에서 음성으로 결정된 하나의 샘플(샘플 1)을 제외한, 나머지 샘플들에 대해 피팅 구간에서 이차 함수를 이용하여 피팅 정확도(R2 값)를 계산하였다. R2 값은 수학식 5를 이용하여 계산되었고, R2 값에 대한 역치값은 0.9를 적용하였다. 0.9 이하의 R2 값을 가지는 샘플들은 음성으로 결정하였다.
표 27에서 볼 수 있듯이, 0.9를 초과하는 R2 값을 갖는 샘플들의 데이터 세트들을 상기 데이터 세트의 신호값들에서 이차 함수의 값들을 차감하여 보정하였다.
비선형 피팅 함수를 이용한 음성 필터링
샘플 제 2 타겟(60℃) 제 1 타겟(72℃)
Figure 112020037081791-pct00012
ΔRFU df
Figure 112020037081791-pct00013
ΔRFU df
샘플1 - - - 0.998 3063 338
샘플2 - - - - - -
샘플3 0.998 3616 311 0.990 200 14
샘플4 0.996 568 61 0.999 1330 179
(a) 시그모이드 함수의 생성
4개의 파라미터들을 포함하는 수학식 3의 시그모이드 함수를 이용하여 상기 보정된 데이터 세트와 시그모이드 함수의 피팅을 실시하였다. LM 알고리즘을 적용하여 보정된 데이터 세트에 피팅된 시그모이드 함수를 생성하였다.
(b) 시그모이드 피팅 함수의 변위에 의한 음성 1차 필터링
시그모이드 함수의 변위를 이용하여 음성 샘플을 필터링하였다. 시그모이드 피팅 함수의 변위는 시그모이드 피팅 함수의 최대 신호값과 최소 신호값 사이의 차이를 계산하여 수득하였다. 계산된 변위와 변위에 대한 역치값(100 RFU)을 비교하여 음성 샘플들을 필터링하였다. 모든 샘플들에 대한 변위가 역치값 100을 모두 초과하였다.
(c) 시그모이드 피팅 함수의 최대 기울기에 의한 음성 2차 필터링
시그모이드 피팅 함수의 최대 기울기를 이용하여 음성 2차 필터링을 실시하였다. 최대 기울기는 각 샘플들에 대하여 시그모이드 피팅 함수를 미분하여 계산하였다. 최대 기울기에 대한 역치값은 30으로 설정되었다. 표 28에 정리된 바와 같이, 샘플 3의 제 1 타겟 핵산서열에 대한 신호에 대해 시그모이드 피팅 함수의 최대 기울기가 30 미만이었고, 따라서 샘플 3의 제 1 타겟 핵산서열을 음성으로 필터링하였다.
(d) 피팅 정확도 R2 값에 의한 양성 또는 음성 샘플의 최종 결정
피팅 정확도는 R2 값을 이용하였다. R2 값은 수학식 4를 이용하여 계산되었고, R2 값에 대한 역치값은 0.90을 적용하였다. R2 값이 0.90을 초과하는 샘플들은 양성으로 결정되었다.
실험 결과
MuDT 기술과 함께 비선형 피팅 함수를 이용하는 본 발명을 적용하여 4개의 샘플들을 분석하였다. 상대적 저온 검출온도에서 검출된 신호의 변위가 역치값 (100 RFU) 보다 작은 1개의 샘플(샘플 2)을 음성으로 필터링하였다. 샘플 2는 제 1 타겟 핵산서열 및 제 2 타겟 핵산서열 모두가 존재하지 않는 것으로 결정되었다.
샘플 2를 제외한 3개의 샘플들에 대해 제 2 타겟 핵산서열에 대한 신호를 추출하였고, 제 1 타겟 핵산서열에 대한 신호의 변위 및 제 2 타겟 핵산서열에 대한 신호의 변위와 역치값 (100 RFU)를 비교하였다. 역치값을 초과하지 못하는 변위를 갖는 샘플 1의 제 2 타겟 핵산서열에 대한 신호를 음성으로 필터링하였다.
음성으로 필터링되지 않는 신호들에 대한 시그모이드 함수를 생성하였고, 시그모이드 함수의 최대 기울기가 역치값 (30)을 초과하지 못하는 샘플 3의 제1 타겟 핵산서열에 대한 신호를 음성으로 필터링하였다.
시그모이드 함수와 신호들 사이의 R2 값을 계산하였고, 나머지 모든 신호들의 R2값이 역치값 0.90을 초과하므로 양성으로 필터링하였다.
본 발명의 분석 방법에 따르면, 상대적 저온 검출온도에서 검출된 신호의 변위와 역치값을 비교하여 상이한 검출 온도를 갖는 2개의 타겟 핵산서열의 부존재를 결정할 수 있다. 본 발명의 분석 방법에 따르면, 상대적 고온 검출온도에서 검출된 신호의 변위와 상관없이 제 2 타겟 핵산서열에 대한 신호를 추출함으로써, 제 2 타겟 핵산서열의 존재 또는 부존재를 결정할 수 있다. 본 발명의 분석 방법에 따르면, 시그모이드 피팅 함수를 이용하여, 제 1 타겟 핵산서열 및 제 2 타겟 핵산서열의 존재 또는 부존재를 결정할 수 있다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.

Claims (30)

  1. 다음의 단계를 포함하는, 시료 내 타겟 분석물의 분석 장치를 이용하여 시료 내 타겟 분석물의 분석 방법:
    상기 타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
    상기 데이터 세트를 보정하는 단계;
    상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하는 단계;
    상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 피팅 정확도를 결정하는 단계; 상기 피팅 정확도는 상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 x2 값(chi square value) 또는 R2 값(R-square value)를 포함하며,
    상기 피팅 정확도를 이용하여 상기 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계.
  2. 제 1 항에 있어서, 상기 비-선형 함수는 시그모이드(sigmoid) 함수인 것을 특징으로 하는 방법.
  3. 제 2 항에 있어서, 상기 시그모이드 함수는 다음 수학식 3으로 표시되는 4개의 파라미터를 포함하는 시그모이드 함수인 것을 특징으로 하는 방법:
    수학식 3
    Figure 112020037081791-pct00014

    상기 수학식에서, f(x)는 피팅 함수로서 시그모이드 함수를 나타내고; x는 상기 신호-발생 반응의 사이클 번호를 나타내며; 그리고 a1, a2, a3 및 a4 각각은 독립적으로 상기 시그모이드 함수의 파라미터를 나타낸다.
  4. 삭제
  5. 제 1 항에 있어서, 상기 시료 내 타겟 분석물의 존재 또는 부존재의 결정은 상기 피팅 정확도를 상기 피팅 정확도에 대한 역치값과 비교하여 실시되는 것을 특징으로 하는 방법.
  6. 제 5 항에 있어서, 상기 시료 내 타겟 분석물의 존재 또는 부존재의 결정은 상기 피팅 정확도를 상기 피팅 정확도에 대한 역치값과 비교하고 상기 피팅 정확도가 상기 역치값을 초과하는지 판단하여 실시되는 것을 특징으로 하는 방법.
  7. 제 1 항에 있어서, 상기 시료 내 타겟 분석물의 존재 또는 부존재의 결정은 (ⅰ) 상기 데이터 세트, 상기 보정된 데이터 세트 또는 상기 비-선형 함수의 변위(displacement) 및 (ⅱ) 상기 비-선형 함수의 최대 기울기로 구성된 군으로부터 선택되는 최소 하나의 파라미터를 추가적으로 이용하여 실시되는 것을 특징으로 하는 방법.
  8. 제 3 항에 있어서, 상기 시료 내 타겟 분석물의 존재 또는 부존재의 결정은 (ⅰ) 상기 데이터 세트, 상기 보정된 데이터 세트 또는 상기 4개의 파라미터를 포함하는 시그모이드 함수의 변위 및 (ⅱ) 상기 4개의 파라미터를 포함하는 시그모이드 함수의 최대 기울기 및 a4 로 구성된 군으로부터 선택되는 최소 하나의 파라미터를 추가적으로 이용하여 실시되는 것을 특징으로 하는 방법.
  9. 제 1 항에 있어서, 상기 타겟 분석물은 타겟 핵산분자인 것을 특징으로 하는 방법.
  10. 제 9 항에 있어서, 상기 신호-발생 반응은 상기 타겟 핵산분자의 증폭으로 또는 증폭 없이 신호값을 증폭하는 과정인 것을 특징으로 하는 방법.
  11. 제 10 항에 있어서, 상기 신호-발생 수단은 이합체의 형성에 의존적으로 신호를 생성시키는 것을 특징으로 하는 방법.
  12. 제 10 항에 있어서, 상기 신호-발생 수단은 검출 올리고뉴클레오타이드의 절단에 의존적으로 신호를 생성시키는 것을 특징으로 하는 방법.
  13. 제 1 항에 있어서, 상기 데이터 세트의 보정 단계는 다음의 단계를 포함하는 단계들로 실시되는 것을 특징으로 하는 방법:
    (i) 기준 사이클에서의 신호값 또는 (ii) 상기 기준 사이클에서의 상기 신호값의 변형값을 이용하여 표준화 계수를 생성하는 단계; 및
    상기 표준화 계수를 상기 데이터 세트의 신호값들에 적용하여 상기 보정된 데이터 세트를 생성하는 단계.
  14. 제 13 항에 있어서, 상기 신호-발생 반응은 다른 반응 환경(reaction environment)에서 동일한 타겟 분석물에 대한 복수의 신호-발생 반응을 포함하고, 상기 데이터 세트는 복수의 데이터 세트이고, 상기 복수의 데이터 세트는 상기 복수의 신호-발생 반응의 복수의 세트로부터 수득되고, 상기 기준 사이클 또는 상기 기준 사이클과 기준값은 상기 복수의 데이터 세트에 동일하게 적용되는 것을 특징으로 하는 방법.
  15. 제 14 항에 있어서, 상기 복수의 신호-발생 반응은 서로 다른 기기들, 다른 반응 튜브들 또는 웰들, 다른 시료들, 다른 양의 타겟 분석물, 또는 다른 프라이머들 또는 프로브들을 포함하는 다른 반응 환경에서 실시되는 것을 특징으로 하는 방법.
  16. 제 13 항에 있어서, 상기 보정된 데이터 세트는 (i) 상기 데이터 세트에 상기 표준화 계수를 적용하여 표준화된 데이터 세트를 생성하거나, (ii) 상기 데이터 세트 또는 상기 표준화된 데이터 세트를 베이스라이닝하여 생성되는 것을 특징으로 하는 방법.
  17. 제 1 항에 있어서, 상기 데이터 세트는 (ⅰ) 상대적 고온 검출온도에서 검출된 신호인 제 1 타겟 핵산서열에 대한 신호 및/또는 (ⅱ) 상대적 저온 검출온도에서 검출된 신호로부터 추출된 제 2 타겟 핵산서열에 대한 신호를 포함하고, 그리고 상기 제 1 타겟 핵산 서열 및 상기 제 2 타겟 핵산 서열은 하나의 반응 용기로부터 검출되는 것을 특징으로 하는 방법.
  18. 제 17 항에 있어서, 상기 제 1 타겟 핵산서열에 대한 신호 및 상기 제 2 타겟 핵산서열에 대한 신호는 다음의 단계를 통해 수득되는 것을 특징으로 하는 방법:
    (a) 상기 반응 용기에서 상기 제 1 타겟 핵산서열에 대한 신호를 발생시킬 수 있는 제 1 신호-발생 수단 및 상기 제 2 타겟 핵산서열에 대한 신호를 발생시킬 수 있는 제 2 신호-발생 수단을 상기 시료와 함께 인큐베이션하고, 상기 상대적 고온 검출온도 및 상기 상대적 저온 검출온도에서 신호를 검출하는 단계; 상기 제 1 타겟 핵산서열 및 제 2 타겟 핵산서열 각각은 상응하는 신호-발생 수단에 의해 검출되며, 상기 제 1 신호-발생 수단은 상기 제 1 타겟 핵산 서열이 상기 시료에 존재하는 경우에, 상기 상대적 고온 검출온도 및 상기 상대적 저온 검출온도에서 신호를 발생시키고, 상기 제 2 신호-발생 수단은 상기 제 2 타겟 핵산 서열이 상기 시료에 존재하는 경우에, 상기 상대적 저온 검출온도에서 신호를 발생시키며,
    (b) 상기 상대적 저온 검출온도에서 검출된 신호가 제 1 역치값 또는 제 1 신호 변위에 의해 정의된 제 1 기준을 만족하는지를 식별하는 단계; 상기 상대적 저온 검출온도에서 검출된 신호가 상기 제 1 기준을 만족할 때, 다음 단계 (c)를 진행하고, 상기 상대적 저온 검출온도에서 검출된 신호가 상기 제 1 기준을 만족하지 않을 때, 상기 제 1 타겟 핵산서열 및 상기 제 2 타겟 핵산서열이 상기 시료 내에 존재하지 않는 것으로 결정되고 다음 단계 (c)를 진행하지 않으며; 및
    (c) (ⅰ) 상기 상대적 저온 검출온도에서 검출된 신호로부터 상기 제 1 타겟 핵산 서열에 대한 신호를 제거하기 위한 기준값 및 (ⅱ) 상기 상대적 저온 검출온도에서 검출된 신호를 이용하여 상기 상대적 저온 검출온도에서 검출된 신호로부터 상기 제 2 타겟 핵산 서열에 대한 신호를 추출하는 단계.
  19. 제 18 항에 있어서, 상기 제 2 타겟 핵산서열에 대한 신호는 다음 수학식 6에 의해 제공되는 것을 특징으로 하는 방법:
    수학식 6
    제 2 타겟 핵산 서열에 대한 신호 = [상대적 저온 검출온도에서 검출된 신호] - [(상대적 고온 검출온도에서 검출된 신호) x (제 1 타겟 핵산서열에 대한 기준값)]
  20. 제 16 항에 있어서, 상기 베이스라이닝은 대칭축을 가지는 이차 함수를 이용하여 실시되는 것을 특징으로 하는 방법.
  21. 다음을 포함하는 시료 내 타겟 분석물의 분석 장치:
    메모리; 및
    프로세서;
    상기 메모리는 상기 타겟 분석물에 대한 데이터 세트를 저장하고, 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득하며, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하고, 그리고
    상기 프로세서는 상기 데이터 세트를 보정하고, 상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하며, 상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 피팅 정확도를 결정하고, 상기 피팅 정확도는 상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 x2 값(chi square value) 또는 R2 값(R-square value)을 포함하며, 상기 피팅 정확도를 이용하여 상기 시료 내 타겟 분석물의 존재 또는 부존재를 결정한다.
  22. 다음의 단계를 포함하는 방법을 실행하기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터 해독가능한 기록매체:
    타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
    상기 데이터 세트를 보정하는 단계;
    상기 보정된 데이터 세트에 대한 비-선형 함수를 생성하는 단계;
    상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 피팅 정확도를 결정하는 단계; 상기 피팅 정확도는 상기 보정된 데이터 세트에 대한 상기 비-선형 함수의 x2 값(chi square value) 또는 R2 값(R-square value)을 포함하며,
    상기 피팅 정확도를 이용하여 시료 내 타겟 분석물의 존재 또는 부존재를 결정하는 단계.
  23. 다음의 단계를 포함하는, 시료 내 타겟 분석물의 분석 장치를 이용하여 시료 내 타겟 분석물의 분석 방법:
    상기 타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
    상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 상기 데이터 세트에 피팅된 이차 함수를 생성하는 단계; 및
    상기 데이터 세트에서 상기 이차 함수를 차감하여 상기 데이터 세트를 보정하는 단계.
  24. 제 23 항에 있어서, 상기 이차 함수는 대칭축을 가지는 것을 특징으로 하는 방법.
  25. 제 23 항에 있어서, 상기 피팅 구간은 시작 피팅 사이클(Starting Fitting Cycle, SFC)부터 최소 피팅 사이클(Minimum Fitting Cycle, MFC)까지인 것을 특징으로 하는 방법.
  26. 제 25 항에 있어서, 상기 데이터 세트의 변위가 상기 변위에 대한 역치값을 초과하는 경우, 상기 피팅 구간은 시작 피팅 사이클(Starting Fitting Cycle, SFC)부터 최소 피팅 사이클(Minimum Fitting Cycle, MFC)까지인 것을 특징으로 하는 방법.
  27. 제 23 항에 있어서, 상기 방법은, 상기 피팅 구간에서 이차 함수를 생성하는 단계 이전에, 전체 영역에서 상기 데이터 세트에 피팅된 제 1 이차 함수를 생성하는 단계를 추가적으로 포함하고; 그리고 상기 피팅 구간은 상기 제 1 이차 함수가 최소 신호값을 가지는 사이클에 기초하여 결정되는 것을 특징으로 하는 방법.
  28. 제 23 항에 있어서, 상기 방법은 상기 이차 함수의 피팅 정확도를 결정하는 단계를 추가적으로 포함하고; 상기 피팅 정확도가 상기 피팅 정확도에 대한 역치값을 초과하는 경우, 상기 이차 함수를 차감하는 단계를 실시하는 것을 특징으로 하는 방법.
  29. 다음을 포함하는 시료 내 타겟 분석물의 분석 장치:
    메모리; 및
    프로세서;
    상기 메모리는 상기 타겟 분석물에 대한 데이터 세트를 저장하고, 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득하며, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며, 그리고
    상기 프로세서는 상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 상기 데이터 세트에 대해 피팅된 이차 함수를 생성하고, 상기 데이터 세트에서 상기 이차 함수를 차감하여 상기 데이터 세트를 보정한다.
  30. 다음의 단계를 포함하는 방법을 실행하기 위한 프로세서를 구현하는 지시들을 포함하는 컴퓨터 해독가능한 기록매체:
    타겟 분석물에 대한 데이터 세트를 수득하는 단계; 상기 데이터 세트는 신호-발생 수단을 이용하는 신호-발생 반응으로부터 수득되고, 사이클 번호 및 신호값을 포함하는 복수의 데이터 지점을 포함하며,
    상기 데이터 세트의 베이스라인 영역의 피팅 구간에서 상기 데이터 세트에 대한 이차 함수를 생성하는 단계; 및
    상기 데이터 세트에서 상기 이차 함수를 차감하여 상기 데이터 세트를 보정하는 단계.
KR1020207010373A 2017-09-28 2018-09-28 시료 내 타겟 분석물을 분석하는 방법 및 장치 KR102420644B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
KR20170125908 2017-09-28
KR1020170125908 2017-09-28
KR20170136772 2017-10-20
KR1020170136772 2017-10-20
KR20170143792 2017-10-31
KR1020170143792 2017-10-31
KR1020170184510 2017-12-29
KR20170184510 2017-12-29
PCT/KR2018/011559 WO2019066572A2 (en) 2017-09-28 2018-09-28 METHOD AND DEVICE FOR TARGET ANALYTE ANALYSIS IN A SAMPLE

Publications (2)

Publication Number Publication Date
KR20200039851A KR20200039851A (ko) 2020-04-16
KR102420644B1 true KR102420644B1 (ko) 2022-07-13

Family

ID=65902699

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207010373A KR102420644B1 (ko) 2017-09-28 2018-09-28 시료 내 타겟 분석물을 분석하는 방법 및 장치

Country Status (8)

Country Link
US (1) US12018318B2 (ko)
EP (1) EP3688760A4 (ko)
JP (2) JP7012151B2 (ko)
KR (1) KR102420644B1 (ko)
CN (1) CN111149170A (ko)
AU (3) AU2018339207A1 (ko)
CA (2) CA3077137A1 (ko)
WO (1) WO2019066572A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024128468A1 (ko) * 2022-12-12 2024-06-20 주식회사 씨젠 Assay용 컴포넌트 생성 방법 및 이를 수행하는 assay용 컴포넌트 생성 장치

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210040542A1 (en) * 2018-04-20 2021-02-11 Seegene, Inc. Method And Apparatus For Detecting A Plurality Of Target Nucleic Acid Sequences In Sample
BR112021024853A2 (pt) 2019-06-14 2022-01-18 Seegene Inc Método implementado por computador para o desenvolvimento colaborativo de reagentes para a detecção de ácidos nucleicos-alvo
WO2024128878A1 (ko) * 2022-12-15 2024-06-20 주식회사 씨젠 형광 데이터의 분석 알고리즘에 대한 성능 비교 결과를 디스플레이하는 장치 및 방법
CN116564411B (zh) * 2023-07-12 2023-09-29 广州普世君安生物科技有限公司 等温扩增核酸的结果判定方法、***、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006141394A (ja) * 2004-09-29 2006-06-08 F Hoffmann La Roche Ag アルゴリズムを使用する試料の定量分析
US20080033701A1 (en) * 2005-12-20 2008-02-07 Roche Molecular Systems, Inc. Temperature step correction with double sigmoid levenberg-marquardt and robust linear regression
JP2012502634A (ja) * 2008-09-19 2012-02-02 コーベット リサーチ プロプライエタリー リミテッド 融解曲線、特にdsDNA及びタンパク質の融解曲線の解析

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5541311A (en) 1992-12-07 1996-07-30 Third Wave Technologies, Inc. Nucleic acid encoding synthesis-deficient thermostable DNA polymerase
US5538848A (en) 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
US6117635A (en) 1996-07-16 2000-09-12 Intergen Company Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
US6194149B1 (en) 1998-03-03 2001-02-27 Third Wave Technologies, Inc. Target-dependent reactions using structure-bridging oligonucleotides
GB9812768D0 (en) 1998-06-13 1998-08-12 Zeneca Ltd Methods
NZ528967A (en) 1999-06-22 2005-03-24 Invitrogen Corp Improved primers and methods for the amplification and discrimination of nucleic acids
KR100738073B1 (ko) 2004-09-01 2007-07-12 삼성전자주식회사 실시간 핵산 증폭 데이터로부터 초기 핵산 농도를정량화하는 방법
US7680604B2 (en) 2005-03-11 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by rotational transform after zero slope alignment
EP1798650A1 (en) 2005-12-19 2007-06-20 Roche Diagnostics GmbH Analytical method and instrument
EP1804172B1 (en) * 2005-12-20 2021-08-11 Roche Diagnostics GmbH PCR elbow determination using curvature analysis of a double sigmoid
US7680868B2 (en) 2005-12-20 2010-03-16 Roche Molecular Systems, Inc. PCR elbow determination by use of a double sigmoid function curve fit with the Levenburg-Marquardt algorithm and normalization
US20080209978A1 (en) 2007-01-29 2008-09-04 Applera Corporation System and Method for Instrument Calibration
US20090119020A1 (en) 2007-09-25 2009-05-07 Roche Molecular Systems, Inc. Pcr elbow determination using quadratic test for curvature analysis of a double sigmoid
KR101413659B1 (ko) * 2007-12-06 2014-07-01 삼성전자주식회사 실시간 핵산 증폭 데이터로부터 시료 중의 표적 핵산의초기 농도를 결정하는 방법
WO2010030686A1 (en) 2008-09-09 2010-03-18 Bio-Rad Laboratories, Inc. Multi-stage, regression-based pcr analysis system
US8219324B2 (en) 2008-09-12 2012-07-10 Roche Molecular Systems, Inc. Real-time PCR elbow calling by equation-less algorithm
CA2784344C (en) 2009-12-21 2018-01-02 Seegene, Inc. Tsg primer target detection
CN103038774B (zh) * 2010-04-11 2017-09-22 生命技术公司 基于模型的qPCR的***和方法
WO2012050844A1 (en) * 2010-09-28 2012-04-19 Authentix, Inc. Determining the quantity of a taggant in a liquid sample
WO2012096430A1 (en) 2011-01-11 2012-07-19 Seegene, Inc. Detection of target nucleic acid sequences by pto cleavage and extension assay
WO2012166913A1 (en) * 2011-06-01 2012-12-06 Streck, Inc. Rapid thermocycler system for rapid amplification of nucleic acids and related methods
US10176293B2 (en) * 2012-10-02 2019-01-08 Roche Molecular Systems, Inc. Universal method to determine real-time PCR cycle threshold values
WO2016052991A1 (en) * 2014-10-01 2016-04-07 Seegene, Inc. Methods for analyzing samples
US20180247015A1 (en) * 2015-09-24 2018-08-30 Seegene, Inc. Multiple dataset analysis for determining the presence or absence of target analyte
AU2016356474A1 (en) * 2015-11-20 2018-06-21 Seegene, Inc. Method for calibrating a data set of a target analyte

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006141394A (ja) * 2004-09-29 2006-06-08 F Hoffmann La Roche Ag アルゴリズムを使用する試料の定量分析
US20080033701A1 (en) * 2005-12-20 2008-02-07 Roche Molecular Systems, Inc. Temperature step correction with double sigmoid levenberg-marquardt and robust linear regression
JP2012502634A (ja) * 2008-09-19 2012-02-02 コーベット リサーチ プロプライエタリー リミテッド 融解曲線、特にdsDNA及びタンパク質の融解曲線の解析

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024128468A1 (ko) * 2022-12-12 2024-06-20 주식회사 씨젠 Assay용 컴포넌트 생성 방법 및 이를 수행하는 assay용 컴포넌트 생성 장치

Also Published As

Publication number Publication date
EP3688760A2 (en) 2020-08-05
JP7379548B2 (ja) 2023-11-14
CA3077137A1 (en) 2019-04-04
JP7012151B2 (ja) 2022-01-27
CA3229263A1 (en) 2019-04-04
US12018318B2 (en) 2024-06-25
US20200291462A1 (en) 2020-09-17
WO2019066572A2 (en) 2019-04-04
KR20200039851A (ko) 2020-04-16
JP2022050639A (ja) 2022-03-30
EP3688760A4 (en) 2021-07-14
AU2024201268A1 (en) 2024-03-14
JP2021500869A (ja) 2021-01-14
CN111149170A (zh) 2020-05-12
AU2018339207A1 (en) 2020-04-16
WO2019066572A3 (en) 2019-06-27
AU2022202180B2 (en) 2023-11-30
AU2022202180A1 (en) 2022-04-21

Similar Documents

Publication Publication Date Title
KR102420644B1 (ko) 시료 내 타겟 분석물을 분석하는 방법 및 장치
KR102270771B1 (ko) 표적 분석물질에 대한 데이터 세트의 보정 방법
EP3201359B1 (en) Methods for analyzing samples
KR102300738B1 (ko) 타겟 분석물질에 대한 데이터 세트의 노이즈 수준 감축 방법
KR102326604B1 (ko) 신호 변화량 데이터 세트를 이용한 샘플 내 타겟 분석물질 검출 방법
WO2016052991A1 (en) Methods for analyzing samples
KR102165931B1 (ko) 타겟 분석물질의 존재 또는 부존재를 결정하기 위한 다중 데이터 세트 분석법
WO2017171469A1 (en) Detection of abnormal signal using two or more datasets
KR102270849B1 (ko) 타겟 핵산 서열의 존재를 결정하기 위한 분석 시그널

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right