KR20200106179A

KR20200106179A - 서열분석 기반 어세이의 유효성을 보장하기 위한 품질 관리 주형

Info

Publication number: KR20200106179A
Application number: KR1020207022621A
Authority: KR
Inventors: 데이비드 차오; 수크리트 사일러스; 오구즈한 아타이
Original assignee: 빌리언투원, 인크.
Priority date: 2018-01-05
Filing date: 2018-08-06
Publication date: 2020-09-11
Also published as: WO2019135790A1; CN112020565A; EP3735470B1; EP4335928A3; ES2970286T3; AU2018399524A1; CA3087046A1; EP4335928A2; FI3735470T3; US20230015348A1; EP3735470A1; DK3735470T3; IL275699A; EP3735470A4; JP2021509583A; JP7164125B2; CN112020565B; PT3735470T; AU2018399524B2; US20190211395A1

Abstract

방법 및/또는 시스템의 실시양태는 품질 관리 주형(QCT) 분자 세트를 생성하는 단계; 상기 QCT 분자 세트에 기반하여, 예컨대, 상기 QCT 분자 세트의 가변 영역에 기반하여, QCT 서열 리드 클러스터 세트를 확인하는 단계; 및 상기 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 서열분석 관련 파라미터, 예컨대, 오염 파라미터 및/또는 분자 카운트 파라미터를 확인하는 단계를 포함할 수 있다.

Description

서열분석 기반 어세이의 유효성을 보장하기 위한 품질 관리 주형

관련 출원에 대한 상호 참조

본원은 이 참조에 의해 전체적으로 본원에 포함되는, 2018년 1월 5일에 출원된 미국 가출원 제62/614,236호를 우선권으로 주장한다.

기술분야

본 개시는 일반적으로 유전자 서열분석의 분야에 관한 것이다.

고처리량 서열분석(예를 들면, 차세대 서열분석(NGS))은 진단 어세이, 전체 게놈 및 엑솜 서열분석 둘 다, 및 보다 더 전문화된 적용, 예컨대, 비침습적 출생전 검사(NIPT), 액체 생검, 및 다형성을 검출하는 유사한 어세이를 위해 점점 더 사용되고 있다. 고처리량 서열분석(예를 들면, NGS)에서, 복수의 샘플들(예를 들면, 최대 384개의 샘플들 등)이 동일한 서열분석 실시에서 처리될 수 있기 때문에, 교차오염은 임상 적용을 위한 중요한 관심사항이다. 특히, 돌연변이 또는 다형성이, 그의 대립유전자 빈도가 전체의 단지 몇 퍼센트만을 차지할 정도로 드문 어세이에서, 다른 샘플로부터의 교차오염은 거짓 양성을 초래할 수 있다. 이것은 몇 퍼센트 미만의 정량적 차이가 양성 결과와 음성 결과 사이의 차이인 NIPT 및 액체 생검에 있어서 특히 사실이다.

고처리량 서열분석을 위한 표준 라이브러리 제조 실행은 초기 투입 DNA 샘플의 증폭을 요구할 수 있다. 통상적으로 PCR 이월(carry-over) 오염으로서 공지되어 있는, 실험실에서의 돌연변이체 대립유전자의 임의의 증폭이 후속 샘플 및 실험을 오염시킬 수 있기 때문에, 이 증폭 단계는 교차오염의 영향을 악화시킬 수 있다. 이 문제점을 방지하기 위해, 일부 표준 진단 어세이, 예컨대, qPCR은 PCR에서 dTTP 대신에 dUTP가 사용되고 우라실 함유 앰플리콘이 효소 우라실 DNA 글리코실라제에 의한 처리를 통해 어세이 후 분해되는 dUTP/UNG 이월 방지 시스템을 사용한다. 그러나, 고처리량 서열분석(예를 들면, NGS)의 증가된 민감성 및 고처리량 서열분석 기반 어세이가 측정하는 미세한 정량적 변화 때문에 훨씬 더 결정적으로 필요함에도 불구하고 고처리량 서열분석 기반 어세이(예를 들면, NGS 기반 어세이 등)에 대한 유사한 해결수단은 없다.

고처리량 서열분석에서 교차오염을 완전히 제거하는 것이 관련된 화학반응으로 인해 어렵지만, 이것을 추적할 수 있다는 것은 유사하게 가치 있을 것이다. 예를 들면, 상이한 식별될 수 있는 서열을 각각의 샘플에 첨가하여 다른 웰로의 그의 오염을 추적할 수 있다. 그러나, 각각의 사용자, 각각의 실험 및 각각의 샘플이 상이한 서열 라이브러리를 가진 경우와 같은 예는 다루기 어려울 수 있고, 다중체화된 고처리량 서열분석 기반 어세이(예를 들면, NGS 기반 어세이 등)의 교차오염을 추적하기 위해 사용될 때 큰 복수의 상이한 라이브러리들(예를 들면, 384개의 상이한 라이브러리들; 동일한 서열분석 실시에서 처리되는 샘플의 수에 상응하는 다수의 상이한 라이브러리들 등)의 유지를 요구할 수 있다. 더욱이, 이러한 예는 상기 라이브러리들이 상이한 실험들에서 사용될 것이기 때문에 이전 실험으로부터의 PCR 이월을 추적할 수 없을 것이다. 나아가, 큰 복수의 상이한 라이브러리들(예를 들면, 384개의 상이한 라이브러리들 등)을 유지하는 것이 어렵기 때문에, 식별자 서열 그 자체가 교차오염될 수 있다. 따라서, 예컨대, 이 한계점들을 극복하면서 교차오염을 추적하는 방법 및/또는 시스템의 신규 유용한 실시양태에 대한 필요성이 있다.

[도면의 간단한 설명]

도 1a 내지 1d는 방법의 실시양태의 변형의 순서도 묘사를 포함한다.

도 2는 방법의 실시양태의 변형의 순서도 묘사를 포함한다.

도 3은 방법의 실시양태의 변형의 순서도 묘사를 포함한다.

도 4a 내지 4d는 특히 교차오염 및 인덱스(index) 배정오류와 관련하여 방법의 실시양태의 변형의 부분의 검증으로부터의 결과의 그래픽 묘사를 포함한다.

도 5a 및 5b는 분자 카운팅을 위한 QCT 분자의 사용을 검증하는 실험으로부터의 결과의 구체적인 예를 포함한다.

도 6은 기술자 관리 및/또는 실험실 관리와 관련된 품질 양태와 관련된 결과의 구체적인 예를 포함한다.

도 7a 내지 7c는 특히 QCT 분자의 정량과 관련하여 방법의 실시양태의 변형의 부분의 검증으로부터의 결과의 그래픽 묘사를 포함한다.

도 8a 및 8b는 특히 생물학적 표적의 정량과 관련하여 방법의 실시양태의 변형의 부분의 검증으로부터의 결과의 그래픽 묘사를 포함한다.

도 9는 어세이가능한 게놈 당량을 측정하기 위한 QCT 분자의 사용의 구체적인 예를 포함한다.

도 10은 오염 파라미터의 확인의 구체적인 예를 포함한다.

도 11은 샘플 처리 오류를 확인하기 위한 복수의 샘플들과 함께 QCT 분자의 사용의 구체적인 예를 포함한다.

도 12는 상이한 단계에서 QCT 분자의 사용의 구체적인 예를 포함한다.

도 13a 및 13b는 인덱스-호핑과 관련된 특성화의 구체적인 예를 포함한다.

도 14는 고유 이중 인덱스 프라이머의 사용과 관련된 실제 오염 수준의 측정을 용이하게 하는 단계에 대한 구체적인 예를 포함한다.

도 15a 내지 15d는 단일 유전자 장애의 진단을 용이하게 하는 단계와 관련된 구체적인 예를 포함한다.

도 16a 및 16b는 염색체 이상의 진단을 용이하게 하는 단계와 관련된 구체적인 예를 포함한다.

실시양태들의 하기 설명은 이 실시양태들로 한정되기 위한 것이 아니라, 오히려 당분야에서 숙련된 임의의 사람이 제조하고 사용할 수 있게 하기 위한 것이다.

1. 개요

도 1a 내지 1d, 도 2 및 도 3에 나타낸 바와 같이, 방법(100)(예를 들면, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 특성화 방법 등)의 실시양태는 품질 관리 주형(QCT) 분자 세트(예를 들면, 표적 관련 영역, 변이 영역 등을 포함하는 각각의 QCT 분자)를 생성하는 단계(S110); 상기 QCT 분자 세트에 기반하여, QCT 서열 리드 클러스터 세트(예를 들면, 상기 QCT 분자 세트 등에 상응함)를 확인하는(예를 들면, 전산 등으로 확인하는) 단계(S120); 및/또는 상기 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 서열분석 관련 파라미터(예를 들면, 오염 파라미터, 분자 카운트 파라미터 등)를 확인하는 단계(S130)를 포함할 수 있다.

추가로 또는 대안적으로, 방법(100)의 실시양태는 하나 이상의 서열 라이브러리를 제조하는 단계(S112); 하나 이상의 서열 라이브러리로 서열분석하는 단계(S114); (예를 들면, 하나 이상의 서열분석 관련 파라미터 등에 기반하여) 하나 이상의 상태(예를 들면, 유전 장애 등)의 하나 이상의 진단을 용이하게 하는(예를 들면, 보조하거나, 확인하거나, 제공하는 등) 단계(S140); 예컨대, 서열분석 관련 파라미터, 진단 및/또는 다른 적합한 성분에 근거하여, 하나 이상의 상태에 대한 치료를 용이하게 하는(예를 들면, 보조하거나, 확인하거나, 제공하거나, 투여하는 등) 단계(S150); 및/또는 임의의 다른 적합한 과정을 포함할 수 있다.

구체적인 예를 들면, 방법(100)(예를 들면, 임산부와 관련된 모체 샘플로부터 유전 장애의 출생전 진단을 용이하게 하는 방법 등)은 유전 장애와 관련된 QCT 분자 세트로서, (예를 들면, 유전 장애 등과 관련된) 내생성 표적 분자의 표적 서열 영역에 대해 서열 유사성을 갖는 표적 관련 영역, 및 내생성 표적 분자의 서열 영역에 대해 서열 비유사성을 갖는 변이 영역(예를 들면, 가변 "N" 염기 세트를 포함하는 매립(embedded) 분자 식별자(EMI) 영역을 포함함, 이때 각각의 "N" 염기는 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 등 중 어느 한 염기로부터 선택됨)을 포함하는 QCT 분자 세트를 모체 샘플에 첨가하는 단계; 상기 QCT 분자 세트와, 표적 서열 영역을 포함하는 핵산 분자(예를 들면, 핵산; 핵산 단편 등)의 공-증폭에 기반하여, 공-증폭된 혼합물을 생성하는 단계; 상기 공-증폭된 혼합물을 서열분석하는 단계; 상기 서열분석으로부터의 QCT 분자 서열 리드와 상이하고 이 서열 리드로부터 검출되는 변이 영역들의 수에 기반하여, 상기 QCT 분자 세트의 고유 수를 전산으로 확인하는 단계로서, 상기 QCT 분자 서열 리드가 상기 QCT 분자 세트에 상응하는 것인 단계; 상기 QCT 분자 서열 리드의 수를 QCT 분자의 고유 수로 나누는 것에 기반하여, 평균 QCT 서열분석 깊이를 계산하는 단계; 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 내생성 표적 분자의 절대 카운트를 확인하는 단계; 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 내생성 기준 분자의 절대 카운트를 확인하는 단계; 및 내생성 표적 서열의 절대 카운트와 내생성 기준 서열의 절대 카운트의 비교에 기반하여, 유전 장애의 출생전 진단을 용이하게 하는 단계를 포함할 수 있다

구체적인 예를 들면, 방법(100)(예를 들면, 특성화, 예컨대, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 오염을 식별하는 방법 등)은 QCT 분자 세트를 생성하는 단계로서, 각각의 QCT 분자가 변이 영역(예를 들면, 하나 이상의 EMI 영역 등을 포함함) 및/또는 표적 관련 영역(예를 들면, 생물학적 표적의 표적 서열 영역과 유사한 서열 등을 가짐)을 포함하는 것인 단계; 상기 QCT 분자 세트의 변이 영역에 기반하여, QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계로서, 예컨대, 상기 QCT 서열 리드 클러스터 세트가 상기 QCT 분자 세트, 및 생물학적 표적을 포함하는 샘플(예를 들면, 생물학적 표적에 상응하는 내생성 표적 분자를 포함하는 샘플 등)에 기반하여 생성된 QCT 혼합물에 상응하는 서열분석으로부터 유도된 QCT 분자 서열 리드를 포함하고, 예컨대, 상기 서열분석 라이브러리 제조가 (예를 들면, 표적 관련 영역과 생물학적 표적의 표적 서열 영역의 서열 유사성 등에 기반하여) 상기 QCT 분자 세트와 생물학적 표적을 포함하는 핵산 분자의 공-증폭을 포함하는 것인 단계; 및 상기 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 서열분석 관련 파라미터를 확인하는(예를 들면, 서열분석 라이브러리 제조 및 고처리량 서열분석 중 적어도 하나와 관련된 오염을 기술하는 오염 파라미터 등을 확인하는) 단계를 포함할 수 있다.

구체적인 예를 들면, 도 2에 나타낸 바와 같이, 방법(100)(예를 들면, QCT 분자에 기반한 서열분석 기반 어세이의 유효성을 보장하는 방법 등)은 QCT 분자(예를 들면, 도 2에서 흑색 화살표로서 표시된 PCR 프라이머를 사용한 공-증폭을 가능하게 하기 위해 관심 있는 유전자와 높은 유사성을 가진 표적 관련 영역을 포함하는 QCT DNA; 관심 있는 유전자에 비해 서열 차이를 가진 변이 영역을 포함하는 QCT DNA로서, 예컨대, 상기 변이 영역이 "A", "C", "T" 또는 "G" 염기를 무작위로 채택할 수 있는 "N" 염기를 포함하는 EMI 영역을 포함할 수 있고, 예컨대, 최대 4^4개의 고유 EMI 서열들이 "NNNN"에 의해 생성될 수 있고, 예컨대, 2개의 QCT 분자들이 동일한 EMI를 가질 확률이 해시 충돌(hash collision) 확률을 계산하기 위해 생일 문제(birthday problem)에 대한 해결수단을 이용함으로써 확인될 수 있고, 예컨대, QCT와 HBB 서열 차이의 세부사항이 도 2에서 확인될 수 있는 것인 QCT DNA; 서열분석 리드에서 QCT 라이브러리와 관심 있는 유전자 서열을 식별하기 위한 QCT 식별자(QCT ID) 영역을 포함하는 QCT DNA 등)의 QCT 라이브러리 또는 QCT 라이브러리의 혼합물을 생성하는 단계; 예컨대, QCT 라이브러리를 인간 DNA에 섞음으로써, QCT 분자 및 생물학적 표적(예를 들면, 도 2에 나타낸 HBB 등)을 포함하는 하나 이상의 샘플에 기반하여, 서열분석 라이브러리를 제조하는 단계; 전산 접근법을 적용하여 QCT 분자 서열 리드를 클러스터링하고(예를 들면, EMI 서열 유사성에 기반함; 이때 EMI 클러스터의 수는 샘플에 섞인 QCT 분자의 절대 수에 상응함) 상기 클러스터를 상이한 샘플 식별자(예를 들면, 상이한 샘플에 상응함; 서열분석에서 사용된 상이한 샘플 구획에 상응함 등)에 배정하는 단계; 및 이러한 데이터를 사용하여, 품질 관리 메트릭스(metrics), 예컨대, 교차오염, 인덱스(index) 배정오류, (예를 들면, 어세이를 실행하는 데 있어서) 사용자 오류, 어세이 파라미터의 비-준수(예를 들면, 너무 작은 양의 투입 DNA, 샘플 중의 접근가능한 게놈 당량 등)를 평가하고/하거나 어세이에 의해 접근될 수 있는 투입 생물학적 표적의 양을 정량하는 단계를 포함할 수 있다.

방법(100) 및/또는 시스템(200)의 실시양태는 생물학적 표적의 존재도를 정확히 정량하고/하거나, 오염(예를 들면, 상이한 샘플들, 상이한 실험들 전체에 걸친 교차오염; 고유 이중 인덱스 프라이머의 사용과 관련된 실제 오염 수준 등)의 정도를 정확히 추적하고/하거나 정량하고/하거나, 서열분석 기반 어세이를 실행하는 데 있어서 사용자 오류를 식별하고/하거나, 서열분석 인덱스 배정오류를 모니터링하고/하거나, 어세이 파라미터의 비-준수를 확인하고/하거나, 오염 및/또는 인덱스-호핑(index-hopping) 프라이머의 제거를 식별하고/하거나 용이하게 하고/하거나, 예컨대, 진단제 및/또는 치료제를 개선하기 위해 서열분석 라이브러리 제조 및/또는 서열분석과 관련된 임의의 적합한 양태를 개선하는 기능을 할 수 있다.

예를 들면, 단일 시약을 모든 샘플들에 첨가함으로써 교차오염뿐만 아니라 다른 사용자 오류도 추적하기 위해 샘플 세트에 첨가될 수 있는 단일 시약(예를 들면, QCT 분자 세트 등을 포함함)이 본원에 개시된다. 예를 들면, QCT 분자의 첨가는 해시 충돌에 대한 생일 문제에 대한 해결수단에 기반한 주문제작 수학적 및 전산적 분석 파이프라인을 동반할 때 상이한 사용자들, 상이한 실험들 및 상이한 샘플들 전체에 걸쳐 교차 오염을 동시에 추적할 수 있다. 예를 들면, 단일 QCT 라이브러리는 예컨대, 사용자 친화성 및 편의를 개선하기 위해 모든 샘플들(예를 들면, 고처리량 서열분석과 관련된 샘플들 등)에 첨가될 수 있다. 구체적인 예를 들면, 상이한 QCT 라이브러리(예를 들면, QCT ID 등과 같은 상이한 QCT 식별자 영역에 상응함)는 임의의 사용자 오류 또는 투입 샘플의 손실을 추적하기 위해 샘플 제조의 상이한 단계에서 첨가될 수 있다. 예를 들면, 각각의 샘플이 (예를 들면, QCT 분자의 변이 영역; QCT 분자의 QCT 식별자 영역 등에 기반하여) QCT 분자에 의해 식별될 수 있는 경우, 자동 지문인식 분배(fingerprint-on-dispense) 접근법이 적용될 수 있다. 예를 들면, PCR 이월로 인한 오염이 측정될 수 있고, 이러한 오염은 임상 환경 및/또는 다른 상황에 있어서 관심사항일 수 있다. 구체적인 예를 들면, QCT 분자는 분자 지문을 모든 PCR 튜브에 배정하는 데 사용될 수 있고, PCR 이월은 소정의 실험실 위치 또는 실내에서 수행된 모든 PCR 튜브와 관련된 모든 변이 영역들(예를 들면, EMI 영역의 EMI 서열 등)의 데이터베이스를 유지함으로써 검출되고 정량될 수 있다. 그 후, 후속 어세이에서 이월 PCR은 기록 데이터베이스에서 가변 영역 지문(예를 들면, EMI 지문 유사성 등)을 전산으로 검색함으로써 식별될 수 있다.

실시양태는 추가로 또는 대안적으로 고처리량 서열분석(예를 들면, NGS 등)을 위한 중요한 관심사항, 즉 "인덱스 스위칭" 또는 인덱스 배정오류에 대한 품질 보증을 위해 사용될 수 있다. 예를 들면, 임의의 교차오염의 부재 하에서 조차도, 동일한 유동 셀 상에서 다중체화될 때 한 샘플로부터의 서열분석 리드 또는 신호(예를 들면, 최대 5% 내지 10% 등)가 또 다른 샘플로 잘못 배정될 수 있다. 예를 들면, 편리한 지문인식 분배 접근법을 수행하여 모든 샘플에서 배정오류의 정도를 정확히 정량할 수 있다. 구체적인 예를 들면, 도 4a 내지 4d에 나타낸 바와 같이, 인접 웰에서의 교차오염 및 인덱스 배정오류의 누적 효과는 90% 초과의 민감성으로 검출될 수 있다. 구체적인 예를 들면, 도 4a에 나타낸 바와 같이, i7 인덱스와 i5 인덱스의 모든 96개의 조합들을 사용하여 일루미나(Illumina) Truseq HT 라이브러리를 제조할 수 있고, 이때 각각의 웰은 각각의 웰에 첨가된 400개, 200개, 100개 또는 0개의 QCT 분자를 사용한 HBB 앰플리콘 서열분석 실험에 상응하고; 교차오염으로서 식별된 QCT 리드의 분율이 각각의 웰에 표시되고, 이때 상기 실험에서 교차오염 및 인덱스 배정오류는 1% 미만 내지 최대 13%이었고; D710 내지 D712 열에서 0개의 QCT 분자로 인해, 이 웰들에서의 분율은 방법(100)의 실시양태의 변형이 교차오염을 검출할 수 있는 민감성을 표시하고; 도 4b는 X(좌측)에 의해 표시된, D702/D504에서 발견된 오염 리드의 수 및 출처; 및 0(우측)에 의해 표시된, D702/D504로부터 유래한 오염 리드의 수 및 목적지를 보여주고; 도 4c는 웰 D707/D504를 제외하고 도 4b에 대한 분석과 유사한 분석을 보여주고; 도 4d는 웰 D710/D504 및 D711/D504에 대한 오염의 출처를 보여주고, 이 웰들로부터 유래한 오염 리드는 발견되지 않았는데, 이것은 이 웰들에 첨가된 QCT 분자의 부재와 일치한다.

실시양태는 추가로 또는 대안적으로 예컨대, 리드 깊이가 복잡한 서열의 첨가를 이용하는 접근법에서 정확한 표적 정량을 수득하는 데 있어서 도움이 될 수 있을 정도로 충분할 때(예를 들면, 상이한 QCT 분자당 20개 초과의 리드 깊이 등), (예를 들면, QCT 분자 세트의 변이 영역 세트의 사용 등에 기반하여) 생물학적 표적의 정확한 분자 카운팅을 가능하게 할 수 있다. 실시양태는 리드 깊이가 충분히 높을 때 어세이되는 접근가능한 생물학적 표적을 정량할 수 있다. 예를 들면, 앰플리콘 서열분석에 의한 비침습적 출생전 검사에 사용될 돌연변이의 검출의 경우, 복잡한 서열에 대한 이러한 높은 리드 깊이는 400개 미만의 QCT 분자들이 각각의 샘플에 첨가될 때, 예컨대, 96개의 이러한 샘플들이 (예를 들면, 도 7c에 나타낸 바와 같이) MiSeq 실시 상에서 다중체화되는 경우 수득된다. 그러나, 분자 카운팅 및/또는 다른 적합한 기능을 용이하게 하기 위해 임의의 적합한 수의 QCT 분자가 하나 이상의 샘플에 첨가될 수 있다. 구체적인 예를 들면, 도 5a 및 5b에 나타낸 바와 같이, (예를 들면, QCT 분자와 관련된 서열 리드 및 처리 등에 기반하여 확인된) 서열 리드의 수와 분자의 수는 상관관계를 가질 수 있고, 분자의 수와 리드의 수 사이의 비는 2배 내지 3배만큼 상이할 수 있는데, 이는 소정의 샘플에서 분자의 수를 확인하기 위한 QCT 분자의 사용과 관련된 개선(예를 들면, 리드 수 그 자체의 사용에 비해 신뢰성의 개선 등)을 시사한다.

(예를 들면, 하나 이상의 생물학적 표적에 대한 절대 분자 카운트 등을 정량하는) 예를 들면, 방법(100) 및/또는 시스템(200)은 a) 어세이의 진단 결과를 확인하기 위한 알고리즘에 사용될 파라미터를 확인하고/하거나, b) 실험 또는 어세이의 상이한 단계에서 투입 DNA의 손실을 추적하고/하거나, c) 표적 분자의 수가 너무 낮을 때 판정 없음 결과를 돌려주고/주거나(예를 들면, 어세이가 신뢰할 수 없을 때 등을 확인하고/하거나), d) 특정 좌위에서 또는 좌위들 전체에 걸쳐 카피 수 변이를 검출하는 어세이를 디자인하고/하거나, e) 진단 어세이의 결과에 기반한 치료적 및 임상적 의사결정을 보조하는 데 사용될 수 있다.

실시양태는 추가로 또는 대안적으로 기술자 관리 및/또는 실험실 관리(예를 들면, 임상 실험실 관리 등)와 관련된 여러 품질 양태를 평가할 수 있고/있거나 개선할 수 있다. 도 6에 나타낸 바와 같이, 구체적인 예를 들면, 방법(100) 및/또는 시스템(200)은 상이한 기술자 또는 실험실에 의한 문제성 샘플 처리를 식별하는 데 사용될 수 있고, 이때 샘플 A01 내지 A06 대 샘플 B31 내지 B35를 상이한 PCR 전/후 분리 실행으로 2개의 상이한 실험실들에서 실시하였고; 약 200개의 분자들에 대체로 상응하는, 동일한 키트로부터의 동일한 부피의 QCT 분자들을 처리 전에 각각의 샘플에 첨가하였고; "num_seqs"는 각각의 샘플에 대해 식별된 상이한 EMI 클러스터들의 수를 표시하고; "contam_frac"는 각각의 샘플에서 식별된 오염 리드의 총 분율을 표시하고; "collision_frac"는 2개의 유효 EMI 클러스터들이 2개의 상이한 샘플들에서 발견되는 정도를 식별하고; "contam_collision_frac"는 상기 2개의 메트릭스들을 조합하고; "ident_frac"는 그 특정 샘플에 대한 리드의 총 수에 의해 나누어진, 유효 EMI에 맵핑되는 리드의 수이고; "reads_per_qctmol"은 EMI에 대한 평균 리드 깊이를 표시하고; 필터 역치는 이 유도된 메트릭스들이 품질 관리(QC)를 통과하거나 통과하지 못한 샘플을 식별하는 데 사용되었고; 6개의 샘플들 중 1개의 샘플만이 실험실 A에 대한 QC 메트릭스를 통과한 반면, 5개의 샘플들 중 5개의 샘플들이 실험실 B에서 QC 메트릭스를 통과하였고; 이 결과들은 샘플 처리 및 PCR 전/후 분리를 수행할 수 있는 방법을 바꾸는 데 사용될 수 있다(예를 들면, 실험실 A에서 샘플 처리의 개선을 이용한 다음 실시에서, 샘플은 동일한 QC 메트릭스를 통과함 등). 도 7a 내지 7c에 나타낸 바와 같이, 구체적인 예를 들면, 동일한 풀로부터 분배된 다수의 QCT 종들을 포함시킴으로써, QCT 분자의 절대 카운트의 상관관계를 통해 피펫에서의 무작위 오류를 (예를 들면, 도 7c에 나타낸 바와 같이) 측정할 수 있고/있거나, (예를 들면, 도 7a에 나타낸 바와 같이, 중간 패널 대 좌측 및 우측 패널의 비교에 기반하여) 시스템적 피펫 및/또는 정량 오류를 추가로 또는 대안적으로 추적할 수 있다. 구체적인 예를 들면, 도 7a 내지 7c에 나타낸 바와 같이, 섞인 QCT 분자의 절대 정량을 확인할 수 있다. 구체적인 예를 들면, 도 7a에 나타낸 바와 같이, (예를 들면, 상이한 QCT 분자 세트 등에 상응하는) QCT1, QCT2 및 QCT3 라이브러리들을 제조하고 풀링하고 QCT 라이브러리당 100개, 200개 또는 400개 분자로 PCR 반응물에 섞을 수 있고; 최대 2개의 염기 변화를 가진 EMI 서열 리드들을 취합함으로써 각각의 QCT 라이브러리에 대한 EMI를 클러스터링할 수 있고; 오차 막대는 24회 반복실험에 대한 평균 +/- 표준 편차를 표시할 수 있고; 그래프 선은 평균의 95% 신뢰 구간에 상응하는 음영을 가진 선형 회귀 피트를 표시할 수 있다. 구체적인 예를 들면, 도 7b에 나타낸 바와 같이, 리드 깊이에 대한 QCT 카운팅의 강건성을 확인하기 위해, 총 리드의 1/2를 무작위로 선택함으로써 서열분석 리드를 다운-샘플링할 수 있고; 다운-샘플링된 서열분석 리드로부터 회수된 EMI 클러스터의 수를 전체 데이터세트에 대해 작도할 수 있고; 점의 색상은 EMI 클러스터당 다운-샘플링된 리드 깊이를 표시할 수 있고, 이때 흑색 선은 기울기=1 및 절편=0을 갖고; QCT 분석은 QCT 분자당 리드 깊이가 20보다 더 클 때 강건하고, 이는 분자 카운팅의 신뢰성에 도움이 될 수 있고; QCT 클러스터의 수가 400일 때, 다운-샘플링된 리드 깊이는 분자당 20 미만이다. 구체적인 예를 들면, 도 7c에 나타낸 바와 같이, QCT 분자 카운트는 (예를 들면, 예상된 바와 같이) QCT 라이브러리들 전체에 걸쳐 상관관계를 갖지 않을 수 있고; 이때 QCT3 클러스터 대 QCT1 클러스터의 수의 산점도가 100 QCT 분자 투입 수준에서 도 7a로부터 각각의 PCR 반복실험에 대해 표시될 수 있다.

실시양태는 추가로 또는 대안적으로 샘플 손실을 추적하기 위해 상이한 서열분석 라이브러리 제조 단계(예를 들면, 샘플 제조 단계) 및/또는 서열분석 단계에서 QCT 라이브러리를 활용할 수 있다. 구체적인 예를 들면, 제1 QCT 분자 세트(예를 들면, QCT1 분자; 제1 공유된 QCT 식별자 영역을 포함하는 제1 QCT 분자 등)가 샘플 수집 시점에서 분배되고, 동등한 양의 제2 QCT 분자 세트(예를 들면, QCT2 분자; 제2 공유된 QCT 식별자 영역을 포함하는 제2 QCT 분자 등)가 샘플 정제 후 분배되는 경우, 제1 QCT 분자 세트 및 제2 QCT 분자 세트에 대한 분자 카운트(예를 들면, QCT1 대 QCT2 분자 카운트 등)의 비교를 통해 정제 수율을 평가할 수 있다.

실시양태는 추가로 또는 대안적으로, 모든 표적들이 어세이에 의해 접근될 수 있는 것은 아니기 때문에, 예컨대, 이용될 수 있는 총 게놈 물질의 측정 및 예상된 생물학적 표적 농도의 계산을 개선할 수 있는, QCT 분자의 사용에 기반한 생물학적 표적의 정량을 통해 어세이에 의해 접근될 수 있는 생물학적 물질의 부분을 확인할 수 있다. 구체적인 예를 들면, 이것은 태아의 유전적 상태의 확인을 위한 비침습적 출생전 검사(NIPT)의 적용 및 순환 종양 DNA가 어세이되는 액체 생검 적용에서 어세이되는 순환 유리 DNA의 경우와 같이, 짧은 크기 분포까지의 DNA의 전단에 기인할 수 있다. 구체적인 예를 들면, 이 적용들에서, 관심 있는 표적에 따라, 25% 미만의 DNA가 접근될 수 있고, 이때 도 8a 및 8b에 나타낸 바와 같이, 투입 DNA 게놈 당량의 확인은 QCT 분자의 사용을 통해 수행될 수 있고, 예컨대, 인간 게놈 DNA가 관심 있는 유전자의 각각 외부 및 내부를 절단하는 Alu 또는 Hpy에 의해 제한효소 분해될 수 있는 경우, QCT 분자를 (2,500 내지 10,000 게놈 당량에 상응하는) 9 ng 내지 36 ng의 분해된 DNA에 섞을 수 있고 PCR로 증폭할 수 있고 MiSeq 상에서 서열분석할 수 있고; 각각의 PCR 반응에서 인간 DNA의 게놈 당량(G.E.)은 방법(100)의 실시양태의 부분을 적용하는 데 있어서 QCT 분자와 관련된 분석에 의해 측정될 수 있고; PCR 반응은 중복실험으로 수행될 수 있고, 이때 도 8a는 선형 피트 선을 보여주고, 음영은 평균의 95% CI이고, 투입 DNA의 측정은 반복실험 및 연속 희석 전체에 걸쳐 일관되나, 상수 인자만큼 Qubit 측정보다 전반적으로 더 높고; 도 8b에 나타낸 바와 같이, 인간 게놈 DNA는 100 내지 150 bp에서 피크를 가진 크기 분포까지 전단될 수 있고; 그 후, QCT 분자는 2.3 ng 내지 36 ng의 전단된 DNA에 섞일 수 있고, 전단된 DNA의 게놈 당량은 약 150 bp의 앰플리콘 크기로 측정될 수 있고, 도 8b는 무작위 전단으로 인해 증폭될 수 있는 분자의 분율을 표시하는 선의 기울기를 보여준다. 구체적인 예를 들면, 도 9에 나타낸 바와 같이, QCT 분자는 어세이마다 상이할 수 있고 심지어 상이한 지문을 사용하는 동일한 어세이의 경우에도 상이할 수 있는 어세이가능한 게놈 당량을 측정하는 데 사용될 수 있고; 동일한 돌연변이를 둘러싸는 영역은 전단된 DNA로부터 증폭되어 150 bp PCR 생성물 대 72 bp PCR 생성물(좌측 대 우측)을 형성하였고, QCT 분자는 두 경우들에서 증폭된 분자의 수를 측정하는 데 사용되었고; 5000 투입 게놈 당량에 상응하는 18 나노그램(ng)의 게놈 DNA는 약 170 bp의 평균 길이(예를 들면, 순환 유리 DNA의 평균 길이)까지 전단되었고, 모든 경우들에 포함되었고(150 bp의 경우 n=8, 및 72 bp의 경우 n=4); 이론 모델과 일치하여, 증폭될 수 있는 분자의 수는 투입 DNA보다 상당히 더 적고 동일한 투입 DNA 질량에 대한 상이한 지문들 사이에 2배만큼 많은 차이를 가질 수 있고; 도 9는 투입 DNA의 다른 측정치(예컨대, 농도)가 분자 정보를 요구하는 정밀한 분자 진단을 위해 왜 충분하지 않을 수 있는지를, 예컨대, 분자 카운트의 약 2배 감소가 95%(2 시그마) 정확도와 99%(3 시그마) 정확도의 차이일 수 있는 그의 푸아송 노이즈(Poisson noise)를 약 40%까지 증가시킬 것임을 시사할 수 있다.

방법(100) 및/또는 시스템(200)의 실시양태는 하나 이상의 상태와 관련하여(예를 들면, 하나 이상의 상태와 관련된 특성화, 진단, 치료 및/또는 과정 수행 등과 관련하여) 사용될 수 있고, 이때 상기 상태는 하기 상태들 중 하나 이상을 포함할 수 있고/있거나 이와 다른 방식으로 관련될 수 있다: 비침습적 출생전 검사(NIPT)(예를 들면, 이수성, 예컨대, 삼염색체증 21 또는 다운 증후군, 삼염색체증 18 또는 에드워드 증후군, 삼염색체증 13 또는 파타우 증후군, 성염색체 이수성, 예컨대, 터너 증후군, 다른 적합한 이수성을 포함하는 염색체 이상의 존재에 대한 유전적 스크리닝과 관련하여; 디죠지(DiGeorge) 증후군을 포함하는 염색체 이상; 단일 유전자 장애에 대한 유전적 스크리닝 등과 관련하여); 다른 출생전 검사; 이수성 분석 및/또는 출생전 환경의 외부에서의 다른 적합한 분석; 유전 장애(예를 들면, 겸상 세포 질환을 포함하는 단일 유전자 장애; 염색체 이상; 유전자 증폭과 관련된 장애; 유전자 결실; 부분적 염색체 이상; 22q11.2 결실 증후군 또는 디죠지 증후군; 샤르코-마리-투쓰(Charcot-Marie-Tooth) 증후군, 낭성 섬유증, 헌팅톤병; 뒤시엔느(Duchenne) 근이영양증; 혈우병, 지중해빈열 등), 염색체 이상(예를 들면, 추가, 상실, 불규칙 염색체 DNA 등)과 관련된 다른 적용, 암(예를 들면, 임의의 적합한 발암유전자, 암 바이오마커 및/또는 다른 암 관련 표적과 관련된 분석을 통해; 액체 생검과 관련된 분석을 통해), 및/또는 임의의 다른 적합한 상태. 예를 들면, 방법(100)은 비침습적 출생전 검사 및 액체 생검 중 적어도 하나와 관련된 진단을 용이하게 하기 위해 표적 분자 카운트(예를 들면, 샘플 중의 표적 분자의 수에 상응함; QCT 분자의 사용에 기반함 등)를 확인하는 단계를 포함할 수 있다. 상태는 추가로 또는 대안적으로 정신 및 거동 상태(예를 들면, 정신과 장애; 우울증; 정신병 등); 소통 관련 상태(예를 들면, 표현 언어 장애; 말더듬증; 음운 장애; 자폐증 장애; 목소리 상태; 청각 상태; 눈 상태 등); 수면 관련 상태(예를 들면, 불면증, 수면 무호흡 등); 심혈관 관련 상태(예를 들면, 관상 동맥 질환; 고혈압 등); 대사 관련 상태(예를 들면, 당뇨병 등), 류마티스 관련 상태(예를 들면, 관절염 등); 체중 관련 상태(예를 들면, 비만 등); 통증 관련 상태; 내분비 관련 상태; 만성 질환; 및/또는 임의의 다른 적합한 유형의 상태를 포함한다.

방법(100) 및/또는 시스템(200)의 하나 이상의 실시양태와 관련된(예를 들면, S112와 관련된) 서열분석은 바람직하게는 NGS, NGS 관련 기술, 대량 병렬 시그니처 서열분석, 폴로니(Polony) 서열분석, 454 피로서열분석, 일루미나 서열분석, SOLiD 서열분석, 이온 토렌트(Ion Torrent) 반도체 서열분석, DNA 나노볼(nanoball) 서열분석, 헬리스코프(Heliscope) 단일 분자 서열분석, 단일 분자 실시간(SMRT) 서열분석, 나노포어(Nanopore) DNA 서열분석, 임의의 세대 수의 서열분석 기술(예를 들면, 2세대 서열분석 기술, 3세대 서열분석 기술, 4세대 서열분석 기술 등), 앰플리콘 관련 서열분석(예를 들면, 표적화된 앰플리콘 서열분석), 메타게놈 관련 서열분석, 합성에 의한 서열분석, 터널링 전류 서열분석, 하이브리드화에 의한 서열분석, 질량 분광측정 서열분석, 현미경관찰 기반 기법, 및/또는 고처리량 서열분석과 관련된 임의의 적합한 기술 중 어느 하나 이상을 포함할 수 있고/있거나 이와 관련될 수 있는 고처리량 서열분석을 포함한다. 추가로 또는 대안적으로, 서열분석은 임의의 적합한 서열분석 기술(예를 들면, 생거 서열분석, 모세관 서열분석 등)을 포함할 수 있다.

본원에 기재된 방법(100) 및/또는 과정의 실시양태의 하나 이상의 경우 및/또는 부분은 본원에 기재된 시스템(200), 구성요소 및/또는 독립체의 실시양태의 하나 이상의 경우에 의해, 그리고/또는 이러한 경우를 이용함으로써 비동기적으로(예를 들면, 순차적으로), 동시적으로(예를 들면, 병렬로; 다중체 자동화된 방식으로 생물학적 샘플을 동시적으로 처리; 시스템 처리 능력을 개선하기 위해 서열 리드를 동시적으로 전산으로 처리 등), 유발제 사건과 시간적으로 관련하여, 및/또는 임의의 적합한 시간 및 빈도로 임의의 다른 적합한 순서로 수행될 수 있다.

추가로 또는 대안적으로, 본원에 기재된 데이터(예를 들면, 클러스터, 서열분석 관련 파라미터, 식별자, 리드 깊이, 서열 리드, 서열 영역 확인, QCT 분자 디자인, 프라이머 디자인 등)는 데이터가 수집되고/되거나, 확인되고/되거나, 전송되고/되거나, 수용되고/되거나, 다른 방식으로 처리된 때를 표시하는 시간적 표시자; 데이터에 의해 기재된 컨텐츠에 대한 환경을 제공하는 시간적 표시자, 예컨대, 서열분석 라이브러리 제조 및/또는 서열분석의 단계들의 순서를 표시하는 시간적 표시자; 시간적 표시자의 변화(예를 들면, 시간에 따른 데이터; 데이터의 변화; 데이터 패턴; 데이터 경향; 데이터 추정 및/또는 다른 예측 등); 및/또는 시간과 관련된 임의의 다른 적합한 표시자 중 하나 이상을 포함하는 임의의 적합한 시간적 표시자(예를 들면, 초, 분, 시, 일, 주, 시간, 시점, 타임스탬프 등)와 관련될 수 있다.

추가로 또는 대안적으로, 본원에 기재된 파라미터, 메트릭스, 입력물, 출력물 및/또는 다른 적합한 데이터는 점수, 이진법 값, 분류, 신뢰 수준, 식별자(예를 들면, 샘플 식별자, QCT 분자 식별자 등), 스펙트럼에 따른 값, 및/또는 임의의 다른 적합한 유형의 값 중 어느 하나 이상을 포함하는 값 유형과 관련될 수 있다. 본원에 기재된 임의의 적합한 유형의 데이터는 입력물로서 사용될 수 있고/있거나, 출력물로서 생성될 수 있고/있거나, 방법(100) 및/또는 시스템(200)의 실시양태와 관련된 임의의 적합한 구성요소를 위해 임의의 적합한 방식으로 조작될 수 있다.

시스템(200)의 실시양태는 추가로 또는 대안적으로 분자(예를 들면, QCT 분자; QCT 라이브러리 등)를 생성하고/하거나, 생물학적 샘플을 처리하고/하거나 다른 적합한 과정을 수행하도록 구성된 샘플 취급 네트워크; 생물학적 샘플 및 QCT 분자에 기반하여 생성된 혼합물로부터 처리된 유전 물질을 서열분석하도록 구성된 서열분석 시스템; 서열 리드를 분석하고/하거나, QCT 서열 리드 클러스터를 확인하고/하거나, 서열분석 관련 파라미터를 확인하고/하거나, 진단을 용이하게 하고/하거나, 치료를 용이하게 하고/하거나, 다른 적합한 과정(예를 들면, 전산 과정)을 수행하도록 구성된 전산 시스템(예를 들면, 원격 전산 시스템; 근거리 전산 시스템 등); 및/또는 임의의 다른 적합한 구성요소를 포함할 수 있다. 시스템(200)의 구성요소는 임의의 방식으로(예를 들면, 구성요소 전체에 걸쳐, 예컨대, 방법(100)의 실시양태의 부분과 관련하여 기능성의 임의의 적합한 분포로) 물리적 및/또는 논리적으로 통합될 수 있다. 그러나, 방법(100) 및 시스템(200)은 임의의 적합한 방식으로 구성될 수 있다.

2.1 QCT 분자를 생성하는 단계

방법(100)의 실시양태는 예컨대, 다운스트림 전산 처리(예를 들면, 서열 관련 파라미터 확인을 용이하게 하기 위한 QCT 서열 리드 클러스터 확인 등)를 용이하게 하기 위해 서열분석 라이브러리 제조 및 서열분석(예를 들면, 고처리량 서열분석 등) 중 적어도 하나의 하나 이상의 단계(예를 들면, 단계, 상, 기간, 시간 등)에서 사용되는(예를 들면, 첨가, 처리, 서열분석 등) 분자를 생성하는 기능을 할 수 있는 QCT 분자 세트를 생성하는 단계(S110)를 포함할 수 있다.

QCT 분자는 바람직하게는 표적 관련 영역(예를 들면, QCT 분자당 하나 이상의 표적 관련 영역 등)을 포함한다. 도 2에 나타낸 바와 같이, 표적 관련 영역은 바람직하게는 하나 이상의 표적 분자(예를 들면, 내생성 표적 분자; 하나 이상의 생물학적 표적에 상응하는 분자 등)의 하나 이상의 표적 서열 영역에 대한 서열 유사성(예를 들면, 전체 서열 유사성; 역치 조건을 충족시키는 서열 유사성; 특정된 수의 염기의 서열 유사성 등)을 포함하나, 추가로 또는 대안적으로 하나 이상의 표적 분자의 임의의 적합한 성분과의 임의의 적합한 관련성을 포함할 수 있다. 표적 관련 영역은 바람직하게는 분자 카운팅에 있어서(예를 들면, 분자 카운트 파라미터를 확인하는 데 있어서; 증폭 편향을 설명함으로써 등) 개선된 정확도를 용이하게 할 수 있는, 상응하는 QCT 분자(예를 들면, 표적 관련 영역 등을 포함함)와 표적 서열 영역을 포함하는 핵산 분자(예를 들면, 핵산, 핵산 단편 등)의 공-증폭을 가능하게 하나, 추가로 또는 대안적으로 서열분석 라이브러리 제조, 서열분석 및/또는 방법(100)의 실시양태의 부분과 관련된 임의의 적합한 과정을 가능하게 한다. 예를 들면, 서열분석 라이브러리 제조(예를 들면, 서열분석 라이브러리 제조를 수행하는 단계(S112))는 표적 관련 영역과 생물학적 표적의 표적 서열 영역의 서열 유사성에 기반하여, 상기 QCT 분자 세트와 생물학적 표적을 포함하는 핵산 분자를 공-증폭하는 단계를 포함할 수 있고, 이때 서열분석 관련 파라미터를 확인하는 단계는 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석과 관련된 생물학적 표적 분자의 수를 기술하는 표적 분자 카운트를 확인하는 단계를 포함할 수 있다.

변형에서, QCT 분자는 표적 관련 영역을 누락할 수 있다. 예를 들면, 표적 관련성을 갖지 않고(예를 들면, 생물학적 표적의 표적 서열 영역에 대한 소정의 유사성을 갖지 않고)/않거나, 샘플의 성분(예를 들면, 표적 서열 영역을 포함하는 핵산 분자 등)과의 상응하는 공-증폭을 갖지 않는 QCT 분자를, 생물학적 표적을 포함하는 샘플의 성분과 함께 사용할 수 있다. 예를 들면, QCT 분자는 서열분석에 맞도록 전처리될 수 있고, 예컨대, 이때 전처리된 QCT 분자는 (예를 들면, 사용자 친화성을 개선하기 위해) 공-증폭을 필요로 하지 않으면서 공-서열분석되기 위해 서열분석에 적합한 처리된 샘플에 첨가될 수 있다. 표적 관련 영역을 누락한 QCT 분자는 바람직하게는 오염 파라미터 확인을 용이하게 하는 데 사용될 수 없으나, 추가로 또는 대안적으로 임의의 적합한 서열분석 관련 파라미터 확인을 용이하게 하는 데 사용될 수 있다. 구체적인 예를 들면, QCT 분자 세트는 후속 서열분석(예를 들면, 고처리량 서열분석, 예컨대, NGS 등)에 맞추어질 수 있고, 이때 상기 QCT 분자 세트를 생성하는 단계는 상기 QCT 분자 세트의 제1 QCT 분자 서브세트(예를 들면, 제1 공유된 QCT 식별자 영역 등을 각각 포함함)를 증폭하는 단계; 및 상기 QCT 분자 세트의 제2 QCT 분자 서브세트(예를 들면, 제2 공유된 QCT 식별자 영역 등을 각각 포함함)를 증폭하는 단계를 포함할 수 있고, QCT 분자 서열분석 리드는 제1 QCT 분자 서브세트 및 생물학적 표적을 포함하는 샘플(예를 들면, 생물학적 표적에 상응하는 제1 표적 분자 등을 포함함)에 기반하여 생성된 QCT 혼합물, 및 제2 QCT 분자 서브세트 및 생물학적 표적을 포함하는 추가 샘플(예를 들면, 생물학적 표적에 상응하는 제2 표적 분자 등을 포함함)에 기반하여 생성된 추가 QCT 혼합물에 상응하는 서열분석으로부터 유도되고, 상기 샘플 및 상기 추가 샘플은 각각 샘플 구획의 제1 샘플 구획 및 제2 샘플 구획에 상응한다. 그러나, 표적 관련 영역 및/또는 표적 관련 영역을 누락한 QCT 분자는 임의의 적합한 방식으로 구성될 수 있다.

QCT 분자는 바람직하게는 하나 이상의 변이 영역(예를 들면, QCT 분자당 하나 이상의 변이 영역; 인접 변이 영역; 분리된 변이 영역 등)을 포함한다. 도 2에 나타낸 바와 같이, 변이 영역은 바람직하게는 표적 분자의 하나 이상의 서열 영역(예를 들면, 표적 서열 영역과 상이한 영역 등)에 대한 서열 비유사성(예를 들면, 완전한 서열 비유사성; 특정된 수의 염기의 비유사성; 부분적 서열 비유사성 등)을 포함한다. 변이 영역은 추가로 또는 대안적으로 하나 이상의 EMI 영역을 포함할 수 있다. 변형에서, EMI 영역은 가변 "N" 염기 세트(예를 들면, 하나 이상의 가변 "N" 염기 등)를 포함할 수 있고, 이때 각각의 "N" 염기는 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택된다(예를 들면, 무작위로 선택되거나; 소정의 통계학적 분포 및/또는 확률에 따라 선택된다). 변형에서, EMI 영역은 하나 이상의 특정된 염기(예를 들면, 디자인되고 합성된 염기 등)를 포함하는 합성된 영역(예를 들면, 마이크로어레이 상에서의 합성; 규소 기반 합성 등), 예컨대, (EMI 영역들 사이의 쌍별 해밍(hamming) 거리를 최대화함으로써) QCT 서열 리드 클러스터 확인을 용이하게 하도록 디자인된 합성된 영역을 포함할 수 있다. 변형에서, QCT 분자는 추가로 또는 대안적으로 복수의 EMI 영역들(예를 들면, 복수의 EMI 영역들을 포함하는 변이 영역; 인접 EMI 영역; 분리된 EMI 영역; 가변 "N" 염기를 포함하는 EMI 영역; 합성된 영역을 포함하는 EMI 영역 등)을 포함할 수 있다. 예를 들면, QCT 분자 세트의 각각의 변이 영역은 가변 "N" 염기 세트를 포함하는 매립 분자 식별자 영역을 포함할 수 있고, 이때 각각의 "N" 염기는 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택되고, 상기 QCT 분자 세트의 각각의 QCT 분자는 추가 가변 "N" 염기 세트를 포함하는 추가 EMI 영역을 더 포함하고, 추가 EMI 영역은 QCT 분자의 서열 영역에 의해 EMI 영역으로부터 분리되고, 예컨대, 가변 "N" 염기 세트 및 추가 가변 "N" 염기 세트는 결정된(예를 들면, 소정의) 수의 "N" 염기(예를 들면, 3개 초과의 "N" 염기, 임의의 적합한 수 초과의 "N" 염기, 정확한 수의 "N" 염기 등)를 각각 포함할 수 있고, 서열분석 관련 파라미터(예를 들면, 오염 파라미터)를 확인하는 단계는 상기 QCT 분자 세트의 EMI 영역 및 추가 EMI 영역에 기반하여 유도된 QCT 서열 리드 클러스터에 기반(예를 들면, EMI 영역과 추가 EMI 영역의 쌍에 상응하는 상이한 EMI 서열 리드 등에 기반)할 수 있다. 변형에서, 변이 영역은 추가로 또는 대안적으로 합성된 영역을 포함할 수 있다.

변형에서, 도 2에 나타낸 바와 같이, QCT 분자는 QCT 분자(및/또는 다른 적합한 QCT 분자)를 식별하는 QCT 식별자 영역, 예컨대, QCT 분자 세트에 속하는 QCT 분자를 식별하는 공유된 QCT 식별자 영역(예를 들면, 표적 분자의 하나 이상의 서열 영역에 대한 비유사성을 가진 공유된 서열 영역 등)을 포함할 수 있다(예를 들면, 이때 상이한 QCT 식별자 영역은 상이한 QCT 분자 세트에 고유하다). 예를 들면, 제1 QCT 분자 세트의 각각의 QCT 분자의 변이 영역은 적어도 제1 QCT 식별자 영역에 의해 제2 EMI 영역으로부터 분리된 제1 EMI 영역을 포함할 수 있고, 이때 제2 QCT 분자 세트의 각각의 추가 QCT 분자는 적어도 제2 QCT 식별자 영역에 의해 제2 추가 EMI 영역으로부터 분리된 제1 추가 EMI 영역을 포함할 수 있다. 예를 들면, 제1 EMI 영역, 제2 EMI 영역, 제1 추가 EMI 영역 및 제2 추가 EMI 영역은 가변 "N" 염기 세트를 포함할 수 있고, 이때 각각의 "N" 염기는 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택되고, QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계는 제1 QCT 식별자 영역 및 제2 QCT 식별자 영역, 및 제1 EMI 영역, 제2 EMI 영역, 제1 추가 EMI 영역 및 제2 추가 EMI 영역에 기반하여, QCT 서열 리드 클러스터 세트를 확인하는 단계를 포함할 수 있다. 예를 들면, 제1 QCT 분자 세트의 각각의 QCT 분자의 경우, 제1 QCT 식별자 영역, 제1 EMI 영역 및 제2 EMI 영역을 제외하고는, 상응하는 QCT 분자 서열은 생물학적 표적의 제1 서열 주형에 대한 전체 서열 유사성을 특징으로 하고; 제2 QCT 분자 세트의 각각의 추가 QCT 분자의 경우, 제2 QCT 식별자 영역, 제1 추가 EMI 영역 및 제2 추가 EMI 영역을 제외하고는, 상응하는 추가 QCT 분자 서열은 제2 서열 주형에 대한 전체 서열 유사성을 특징으로 한다. 구체적인 예를 들면, 상이한 이전에 확인된 QCT 식별자 영역(예를 들면, 고유 식별자 서열 등)에 의해 단절된 5N 서열의 2개의 별개 구획들을 제외한 QCT 분자 서열은 표적 분자 서열(예를 들면, 표적 분자 서열의 하나 이상의 영역 등)과 동일할 수 있다. 구체적인 예를 들면, QCT 식별자 영역(예를 들면, 도 2에 나타낸 고유 QCT ID 서열 등)은 내부 대조군을 위해 하나의 단계에서, 또는 투입 생물학적 표적의 손실 또는 다른 사용자 오류를 추적하기 위해 상이한 단계들에서 첨가될 수 있는 다수의 QCT 라이브러리들의 사용을 가능하게 하는 데 사용될 수 있다. 추가로 또는 대안적으로, QCT 식별자 영역은 임의의 적합한 방식으로 구성될 수 있다. 그러나, QCT 분자는 임의의 적합한 유형의 영역들의 임의의 적합한 조합을 포함할 수 있다(예를 들면, 이때 상이한 QCT 분자는 동일하거나 상이한 유형 및/또는 수의 영역을 포함하거나; 표적 분자의 서열 영역에 대한 임의의 적합한 서열 유사성 및/또는 비유사성을 가진다).

변형에서, 방법(100)은 추가로 또는 대안적으로 하나 이상의 QCT 라이브러리(예를 들면, QCT 분자를 각각 포함하는 QCT 라이브러리 등)를 생성하는 단계를 포함할 수 있고, 예컨대, 이때 QCT 라이브러리는 다수의 QCT 분자 세트들을 포함할 수 있고, 예컨대, 이때 각각의 QCT 분자 세트는 상이한 QCT 식별자 영역에 의해 식별될 수 있다. 예를 들면, QCT 라이브러리를 생성하는 단계는 상이한 QCT 분자 세트를 증폭하는 단계를 포함할 수 있고(예를 들면, 서열분석의 준비를 위해, 예컨대, QCT 분자를 샘플의 하나 이상의 성분에 첨가하기 전에 증폭하여 QCT 혼합물을 생성한다). 예를 들면, QCT 라이브러리를 생성하는 단계는 QCT 라이브러리에 포함시킬 QCT 분자의 수를 확인하는 단계를 포함할 수 있다. 구체적인 예를 들면, 생일 문제에 대한 해결수단은 QCT 분자의 특정 다양성을 고려하여 각각의 샘플에 포함되어야 하는 고유 QCT 분자의 최대 수를 확인하는 데 사용될 수 있고, 예컨대, QCT 분자에서 10개의 가변 N 염기에 의해 생성될 수 있는 4^10개의 서열의 경우, 최대 1200개의 QCT 분자들이 단일 유효 EMI 충돌의 약 0.5의 확률(exp(-1200*1199/2/4^10)~0.5)로 사용될 수 있고, 200개의 QCT 분자에서 단일 유효 충돌의 확률은 약 2%이다. 구체적인 예를 들면, QCT 라이브러리를 생성하는 단계는 샘플 세트의 각각의 샘플에 대해 0.00001 나노그램 미만(및/또는 다른 적합한 양)의 증폭가능한 QCT 분자를 (예를 들면, 서열분석 라이브러리 제조 및 고처리량 서열분석 중 적어도 하나의 단일 단계 등에서) 활용하도록 적합화된 QCT 라이브러리를 생성하는 단계를 포함할 수 있다. 그러나, QCT 라이브러리에 포함시킬 QCT 분자의 수를 확인하는 단계 및 QCT 라이브러리를 생성하는 단계는 임의의 적합한 방식으로 수행될 수 있다.

예를 들면, QCT 라이브러리는 가변 "N" 서열을 함유하는 단일 가닥 올리고뉴클레오티드 서열에 상보적인 가닥을 합성함으로써 생성될 수 있다. 구체적인 예를 들면, 이중 가닥 QCT 라이브러리는 QCT 울트라머와 상보적 프라이머 서열을 재현탁하고 어닐링하고 클레나우(Klenow) 단편(엑소)을 사용하여 서열을 연장시키고 엑소뉴클레아제 I로 처리함으로써 생성될 수 있다. 최종 생성물은 사용되지 않은 단일 가닥 DNA 분자를 제거하도록 정제될 수 있고, QCT 라이브러리는 이중 가닥 QCT 분자의 예상된 분자량을 사용함으로써 각각의 샘플에 첨가되는 QCT 분자의 수를 계산할 수 있는 형광측정 어세이, 예컨대, Qubit HS 어세이를 이용함으로써 정량될 수 있다.

그러나, QCT 분자를 생성하는 단계(S110)는 임의의 적합한 방식으로 수행될 수 있다.

2.2 QCT 서열 리드 클러스터 세트를 확인하는 단계

방법(100)의 실시양태는 서열분석 관련 파라미터 확인을 용이하게 하기 위해 (예를 들면, 서열분석 라이브러리 제조 및 서열분석 후 등) QCT 분자 서열 리드를 클러스터링하는 기능을 할 수 있는 하나 이상의 QCT 서열 리드 클러스터를 확인하는 단계(S120)를 포함할 수 있다.

QCT 서열 리드 클러스터는 바람직하게는 (예를 들면, 하나 이상의 QCT 분자 세트 및 생물학적 표적을 포함하는 하나 이상의 샘플에 기반하여 생성된 하나 이상의 QCT 혼합물에 상응하는 서열분석으로부터 유도된) QCT 분자 서열 리드를 포함하나, 추가로 또는 대안적으로 서열분석과 관련된 임의의 적합한 리드 및/또는 성분을 포함할 수 있다.

QCT 분자 서열 리드는 예컨대, 각각의 샘플 내로 분배된 하나 이상의 QCT 분자 세트의 정체성을 확인하기 위해 전산에 의해 클러스터링될 수 있다. 주성분 분석, K 수단, 계층적 클러스터링, 및/또는 임의의 서열-정체성 기반 클러스터링 접근법을 포함하나 이들로 한정되지 않는 다양한 전산 클러스터링 접근법들이 이용될 수 있다. 추가로 또는 대안적으로, 클러스터링, 클러스터링과 관련된 전산 분석(예를 들면, 전처리, 여과 등), 및/또는 방법(100)의 실시양태의 임의의 다른 적합한 부분은 지도 학습(예를 들면, 로지스틱 회귀의 이용, 역전파 신경 네트워크의 이용, 랜덤 포레스트(random forest)의 이용, 결정 나무 등), 비지도 학습(예를 들면, 선험(Apriori) 알고리즘의 이용, K-수단 클러스터링의 이용), 반지도 학습, 심층 학습 알고리즘(예를 들면, 신경 네트워크, 제한된 볼츠만 머신, 심층 신뢰 네트워크 방법, 콘볼루션 신경 네트워크 방법, 순환 신경 네트워크 방법, 스태킹 오토-인코더(stacked auto-encoder) 방법 등), 강화 학습(예를 들면, Q-학습 알고리즘의 이용, 시간적 차이 학습의 이용), 회귀 알고리즘(예를 들면, 보통 최소 제곱, 로지스틱 회귀, 단계별 회귀, 다변량 적응 회귀 스플라인, 국소 추정 산점도 평활화 등), 사례 기반 방법(예를 들면, k-최근접 이웃, 학습 벡터 양자화, 자가 조직화 맵 등), 정규화 방법(예를 들면, 능선 회귀, 최소 절대 수축 및 선택 연산자, 탄성 네트 등), 결정 나무 학습 방법(예를 들면, 분류 및 회귀 나무, 반복 이분화기(iterative dichotomiser) 3, C4.5, 카이제곱 자동 상호작용 검출, 의사결정 단속(decision stump), 랜덤 포레스트, 다변량 적응 회귀 스플라인, 경사 부스팅 머신(gradient boosting machine) 등), 베이지안(Bayesian) 방법(예를 들면, 나이브 베이즈(naive Bayes), 평균 단일 의존성 추정기, 베이지안 신뢰 네트워크 등), 커넬(kernel) 방법(예를 들면, 서포트 벡터 머신, 방사 기저 함수, 선형 판별 분석 등), 클러스터링 방법(예를 들면, k-수단 클러스터링, 예상 최대화 등), 관련 규칙 학습 알고리즘(예를 들면, 선험 알고리즘, 에클라트(Eclat) 알고리즘 등), 인공 신경 네트워크 모델(예를 들면, 퍼셉트론(Perceptron) 방법, 역전파 방법, 홉필드(Hopfield) 네트워크 방법, 자가 조직화 맵 방법, 학습 벡터 양자화 방법 등), 차원 감소 방법(예를 들면, 주성분 분석, 부분적 최소 제곱 회귀, 새몬(Sammon) 맵핑, 다차원적 스케일링, 사영 추적 등), 앙상블(ensemble) 방법(예를 들면, 부스팅, 부트스트랩핑 취합(bootstrapped aggregation), 아다부스트(AdaBoost), 스태킹 일반화, 경사 부스팅 머신 방법, 랜덤 포레스트 방법 등), 및/또는 임의의 적합한 인공 지능 접근법 중 어느 하나 이상을 포함하는 인공 지능 접근법(예를 들면, 기계 학습 접근법 등)을 적용할 수 있다.

QCT 서열 리드 클러스터를 확인하는 단계는 바람직하게는 QCT 분자의 하나 이상의 영역(예를 들면, 변이 영역; QCT 식별자 영역 등)에 기반하나(예를 들면, QCT 분자의 영역에 상응하는 서열 리드 등에 기반하나), 추가로 또는 대안적으로 임의의 적합한 데이터에 기반할 수 있다. 구체적인 예를 들면, QCT 분자(예를 들면, 표적 관련 품질 관리 주형 등)를 샘플의 성분과 조합하고, 표적 서열 영역 및 QCT 분자 서열(예를 들면, QCT 분자의 표적 관련 영역 등) 둘 다에 상보적인 프라이머를 사용하여 생물학적 표적(예를 들면, 표적 서열 영역을 포함하는 핵산 분자 등)을 증폭한 후, 다중체화를 위해 상기 분자를 인덱싱하고 서열분석할 수 있고, 서열분석 리드들을 이들의 다중체화 인덱스에 기반하여 분리할 수 있다. 그 다음, 구체적인 예를 들면, 인덱싱된 리드는 QCT 식별자 영역(예를 들면, QCT ID 서열 등)에 의해 상이한 QCT 군으로 클러스터링될 수 있거나, (EMI 영역과 같은 변이 영역 등을 제외하고) 예상된 QCT 서열에의 정확한 서열 일치에 기반하여 확인될 수 있다. 예를 들면, QCT 서열 리드 클러스터 세트를 (예를 들면, 전산 등으로) 확인하는 단계는 제1 조건(예를 들면, 역치 수보다 적은 비유사한 염기 등)을 충족시키는 (제1 QCT 분자의 제1 가변 영역과 제2 QCT 분자의 제2 가변 영역 사이의) 가변 영역 서열 유사성에 기반하여, 제1 QCT 분자 서열 리드 및 제2 QCT 분자 서열 리드를 QCT 서열 리드 클러스터 세트의 QCT 서열 리드 클러스터로 클러스터링하는 단계, 및 QCT 서열 리드 클러스터 세트의 각각의 QCT 서열 리드 클러스터에 대해, 샘플 세트를 식별하는 샘플 식별자 세트의 샘플 식별자(예를 들면, 샘플, 서열분석 라이브러리 제조 및/또는 서열분석과 관련된 샘플 구획 등)에의 QCT 서열 리드 클러스터의 배정을 확인하는 단계를 포함할 수 있고, 예컨대, 이때 서열분석 관련 파라미터(예를 들면, 오염 파라미터 등)를 확인하는 단계는 QCT 서열 리드 클러스터 세트, 및 샘플 식별자 세트의 샘플 식별자로의 QCT 서열 리드 클러스터의 배정에 기반할 수 있다. 구체적인 예를 들면, 제1 QCT 서열 리드 및 제2 QCT 서열 리드의 클러스터링은 3점보다 적은 치환의 가변 영역 서열 유사성, 및 제2 조건(예를 들면, QCT 서열 리드 클러스터당 20 리드 깊이 초과; 30 리드 깊이 초과; 임의의 적합한 리드 깊이 초과 등)을 충족시키는 QCT 서열 리드 클러스터와 관련된 리드 깊이에 기반하여, 제1 QCT 서열 리드 및 제2 QCT 서열 리드를 QCT 서열 리드 클러스터로 클러스터링하는 단계를 포함할 수 있다. 구체적인 예를 들면, QCT 분자 서열 리드(예를 들면, EMI 영역 서열을 포함하는 서열 리드)는 2점 이하의 치환을 가진 또 다른 QCT 분자 서열 리드가 더 높은 리드 깊이에서 동일한 웰에서 관찰되는 경우 취합될 수 있다. 구체적인 예를 들면, 각각의 EMI는 특정 샘플 및 상응하는 웰 및 인덱스 또는 인덱스 쌍에 배정된다.

변형에서, QCT 서열 리드 클러스터를 확인하는 단계는 비-유효 QCT 서열 리드 클러스터(예를 들면, 비-유효 EMI 클러스터 등)를 확인하고/하거나 버리는(예를 들면, 여과하는 등) 단계를 포함할 수 있다. 예를 들면, 도 10에 나타낸 바와 같이, 비-유효 QCT 서열 리드 클러스터는 역치 이하의 리드 깊이(예를 들면, 20개 이하의 리드; 30개 이하의 리드; 임의의 적합한 리드 깊이의 역치 등)를 갖고/갖거나 임의의 적합한 조건(예를 들면, 소정의 리드 깊이 조건에 부합하는 리드의 수 등)을 충족시키는 QCT 서열 리드 클러스터를 포함할 수 있고, 예컨대, 이때 비-유효 QCT 서열 리드 클러스터는 분자 카운팅을 위해 버려질 수 있다. 구체적인 예를 들면, 유효 QCT 서열 리드 클러스터(예를 들면, 비-유효 QCT 서열 리드 클러스터의 폐기 후 남은 QCT 서열 리드 클러스터 등)는 각각의 샘플에 대한 품질 관리 주형 수 대 서열분석 리드 카운트의 비를 확인하는 데 사용될 수 있다(예를 들면, 이때 상기 비는 표적 분자의 수 등을 정량하기 위한 보정 계수로서 사용될 수 있다). 구체적인 예를 들면, 도 10에 나타낸 바와 같이, 30 초과의 평균 EMI 리드 깊이에서 유효 QCT 서열 리드 클러스터 대 비-유효 QCT 서열 리드 클러스터(예를 들면, EMI 클러스터 등)는 서열분석 깊이의 현저한 감소에 의해 명확히 식별될 수 있고, 보다 더 낮은 평균 리드 깊이에서 적응 접근법(예를 들면, 적응 리드 깊이 역치 확인 등)을 이용하여 유효 EMI 대 비-유효 EMI를 식별할 수 있다. 구체적인 예를 들면, QCT 서열 리드 클러스터 세트를 확인하는 단계는 QCT 서열 리드 클러스터의 여과된 서브세트에 상응하는 리드 깊이(예를 들면, 리드 깊이 역치 조건 및/또는 다른 적합한 조건 등의 충족)에 기반하여, QCT 서열 리드 클러스터(예를 들면, 유효 QCT 서열 리드 클러스터 등)의 여과된 서브세트를 확인할 수 있고, 예컨대, 이때 서열분석 관련 파라미터(예를 들면, 표적 분자 카운트, 예컨대, 원래의 샘플에 존재하는 표적 분자의 수 등)를 확인하는 단계는 QCT 서열 리드 클러스터의 여과된 서브세트에 기반하여, QCT 분자를 확인하는 단계(예를 들면, 이때 QCT 서열 리드 클러스터의 여과된 서브세트에서 QCT 서열 리드 클러스터의 수는 QCT 분자 카운트에 상응할 수 있음); QCT 분자 카운트 및 QCT 분자 서열 리드에 기반하여, 보정 계수 비를 확인하는 단계(예를 들면, QCT 분자 카운트를 QCT 분자 서열 리드로 나누기 등); 및 상기 보정 계수 비, 및 서열분석으로부터 유도된 표적 분자 서열 리드에 기반하여, 표적 분자 카운트를 확인하는 단계(예를 들면, 표적 분자 서열 리드의 수와 보정 계수 비의 곱하기 등)로서, 상기 표적 분자 서열 리드가 생물학적 표적(예를 들면, 표적 분자의 표적 서열 영역 등을 포함함)과 관련된 것인 단계를 포함할 수 있다. 구체적인 예를 들면, 방법(100)은 QCT 분자 서열 리드에 대한 리드 깊이 분포 특징에 기반하여, 리드 깊이 역치를 적응적으로 확인하는 단계를 포함할 수 있고, 이때 QCT 서열 리드 클러스터의 여과된 서브세트를 확인하는 단계는 리드 깊이에 의해 적응적으로 확인된 리드 깊이 역치의 충족에 기반하여, 상기 여과된 서브세트를 확인하는 단계를 포함할 수 있다. 구체적인 예를 들면, 상기 리드 깊이의 각각의 리드 깊이는 QCT 서열 리드 클러스터의 여과된 서브세트의 상응하는 QCT 서열 리드 클러스터에 대해 20개 초과의 리드(및/또는 다른 적합한 수의 리드 등)에 상응할 수 있다. 예를 들면, 서열분석 및 PCR 오류로 인해, 비-유효 QCT 서열 리드 클러스터는 오염 이외의 양태로 인해 비-유효할 수 있다. 추가로 또는 대안적으로, 유효 또는 비-유효 QCT 서열 리드 클러스터를 확인하는 단계는 임의의 적합한 방식으로 수행될 수 있다. 그러나, QCT 서열 리드 클러스터를 확인하는 단계(S120)는 임의의 적합한 방식으로 수행될 수 있다.

2.3 서열분석 관련 파라미터를 확인하는 단계

방법(100)의 실시양태는 하나 이상의 서열분석 관련 파라미터를 확인하는 단계(S130)를 포함할 수 있다.

서열분석 관련 파라미터는 (예를 들면, 상이한 사용자, 샘플, 실험 등 전체에 걸쳐 서열분석 라이브러리 제조 및/또는 서열분석과 관련된 오염을 기술하는) 오염 파라미터; (예를 들면, 소정의 샘플 및/또는 혼합물에 처음부터 존재하는 분자, 예컨대, 표적 분자 및/또는 QCT 분자의 수 등을 기술하는) 분자 카운트 파라미터; (예를 들면, 샘플 손실 등과 관련된) 샘플 추적 파라미터; (예를 들면, 노이즈; 잘못된 샘플 처리 작업, 예컨대, 피펫 오류; 시스템적 오류 등을 기술하는) 샘플 처리 오류 파라미터; (예를 들면, 정량 오류 등을 기술하는) 정량 오류 파라미터; (예를 들면, 전산 분석 오류 등을 기술하는) 분석 오류 파라미터; 및/또는 서열분석 라이브러리 제조, 서열분석, 관련성 분석 및/또는 다른 적합한 양태와 관련된 임의의 적합한 파라미터 중 어느 하나 이상을 포함할 수 있다. 예를 들면, 도 11에 나타낸 바와 같이, 복수의 샘플들 전체에 걸쳐 확인된 QCT 분자의 수를 사용하여, 노이즈 및/또는 잘못된 샘플 처리를 기술하는 샘플 처리 오류를 확인할 수 있고; 이때 약 200개의 고유 QCT 분자에 대략적으로 상응하는 동일한 부피의 QCT 분자를 PCR 전에 각각의 샘플에 첨가할 수 있고, 유효 QCT 서열 리드 클러스터(예를 들면, EMI 클러스터 등)를 PCR 및 서열분석 후 서열분석 데이터로부터 확인할 수 있고; 약 200개의 QCT 분자들에 대한 예상된 변이 계수(CV)는 12개의 샘플들 전체에 걸쳐 도 11에 나타낸 관찰된 데이터와 일치하는 sqrt(200)/200 ~ 7%이고; 임의의 샘플이 특정 역치(예를 들면, 3 sigmas, 200-3*sqrt(200) ~150, 또는 ~200/2~100의 덜 엄격한 역치) 미만으로 떨어지는 경우, 결과를 이용하여 그 특정 샘플에 대한 샘플 처리 오류를 식별할 수 있고; QCT 분자의 수를 증가시켜, 과정에서 7% CV 미만에 상응하는 추가 샘플 처리 오류 파라미터를 확인할 수도 있다. 예를 들면, 서열분석 관련 파라미터를 확인하는 단계는 QCT 서열 리드 클러스터 세트의 QCT 서열 리드 클러스터에 배정되지 않은 QCT 서열 리드를 식별하는 단계; 및 배정되지 않은 QCT 서열 리드의 수 및 QCT 서열 리드의 총 수로부터 서열분석 오류율 및 중합효소 오류율(예를 들면, 말단-대-말단 서열분석 및 중합효소 오류율 등) 중 적어도 하나를 확인하는 단계를 포함할 수 있다. 구체적인 예를 들면, 표적 또는 기준 서열에 대한 가변 영역(예를 들면, 표적 변이 영역, 기준 변이 영역 등)을 갖지만 서열이 QCT 리드 클러스터 서열과 동일하지 않은 임의의 서열은 서열 또는 중합효소 오류에 기인한다. 구체적인 예를 들면, 총 QCT 리드 카운트에 의해 나누어진, 이 서열들의 리드 카운트는 조합된 서열분석 및 중합효소 오류 빈도이다. 전자, 즉 서열분석 오류는 선형 과정에 의해 생성될 수 있는 반면, 중합효소 오류는 (예를 들면, 선형 PCR이 이용되지 않은 한) 기하급수적 과정에 의해 생성될 수 있고, 이때 PCR의 초기 주기에서 오류의 효과는 기하급수적으로 증폭될 수 있다. 따라서, 구체적인 예를 들면, QCT 리드 클러스터에 배정되지 않은 서열의 리드 카운트의 분포를 분석함으로써, 서열분석 오류 대 중합효소 오류의 기여를 계산할 수 있다. 그러나, 서열분석 오류율 및/또는 중합효소 오류율을 확인하는 단계는 임의의 적합한 방식으로 수행될 수 있다.

변형에서, 서열분석 관련 파라미터를 확인하는 단계는 복수의 QCT 분자 세트들(예를 들면, 상이한 공유된 QCT 식별자 영역들에 의해 식별된 상이한 QCT 분자 세트들; 서열분석 라이브러리 제조 및/또는 서열분석과 관련된 상이한 단계들에서 활용된 상이한 QCT 분자 세트들 등)을 사용한 처리에 기반할, 예컨대, 상이한 QCT 분자 세트들에 상응하는 상이한 QCT 서열 리드 클러스터 서브세트들에 기반할 수 있다. 예를 들면, 방법(100)은 QCT 분자 세트를 생성하는 단계로서, 각각의 QCT 분자가 상기 QCT 분자 세트 사이에 공유되고 QCT 분자를 식별하도록 적합화된 제1 QCT 식별자 영역을 포함하는 것인 단계; 추가 QCT 분자 세트를 생성하는 단계로서, 각각의 추가 QCT 분자가 상기 추가 QCT 분자 세트 사이에 공유되고 추가 QCT 분자를 식별하도록 적합화된 제2 QCT 식별자 영역을 포함하는 것인 단계; 상기 제1 QCT 식별자 영역 및 상기 제2 QCT 식별자 영역에 기반하여, QCT 서열 리드 클러스터 세트를 확인하는 단계; 및 상기 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 관련 파라미터를 확인하는 단계를 포함할 수 있다. 구체적인 예를 들면, 상기 QCT 분자 세트는 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나의 제1 단계에서 활용되도록 맞추어질 수 있고, 이때 상기 추가 QCT 분자 세트는 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나의 제2 단계에서 활용되도록 맞추어지고, QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계는 (예를 들면, 상응하는 제1 QCT 분자의 제1 QCT 식별자 영역 및 제1 변이 영역에 기반하여) QCT 서열 리드 클러스터 세트의 제1 서브세트를 확인하는 단계로서, 상기 제1 서브세트가 상기 제1 QCT 식별자 영역에 상응하고 제1 단계와 관련되는 것인 단계; 및 (예를 들면, 상응하는 제2 QCT 분자의 제2 QCT 식별자 영역 및 제2 변이 영역 등에 기반하여) QCT 서열 리드 클러스터 세트의 제2 서브세트를 확인하는 단계로서, 상기 제2 서브세트가 상기 제2 QCT 식별자 영역에 상응하고 제2 단계와 관련되는 것인 단계를 포함하고; 서열분석 관련 파라미터를 확인하는 단계는 QCT 서열 리드 클러스터 세트의 제1 서브세트 및 제2 서브세트에 기반하여, 샘플 손실과 관련된 샘플 추적 파라미터를 확인하는 단계를 포함한다.

예를 들면, 서열분석 관련 파라미터를 확인하는 단계는 QCT 서열 리드 클러스터 세트에 기반하여, 각각 QCT 분자 세트 및 추가 QCT 분자 세트에 상응하는 제1 절대 카운트 및 제2 절대 카운트를 확인하는 단계, 및 제1 절대 카운트 및 제2 절대 카운트에 기반하여, 피펫 오류 파라미터 및 정량 오류 파라미터 중 적어도 하나를 확인하는 단계를 포함할 수 있다.

구체적인 예를 들면, 도 12에 나타낸 바와 같이, 상이한 단계에서 QCT 분자의 사용은 상이한 샘플 준비 접근법들의 비교를 가능하게 하고; 예컨대, 이때 DNA 정제 접근법은 DNA 정제 전에 200개의 QCT1 분자들(및/또는 임의의 적합한 수의 QCT 분자들)을 각각의 혈장 샘플에 첨가함으로써 평가될 수 있고; DNA를 정제 방법 #1 또는 정제 방법 #2로 혈장으로부터 정제하였고, 생성된 DNA 샘플을 PCR로 증폭하고 서열분석하였고; 200개의 QCT2 분자들(및/또는 임의의 적합한 수의 QCT 분자들)을 DNA 정제 후, 그러나 PCR 증폭 전에 첨가하였고; QCT2 분자에 상응하는 유효 QCT 서열 리드 클러스터의 수는 2개의 샘플들 전체에 걸쳐 (약 25% 이내에서) 유사하였는데, 이는 정제 후 처리가 이 2개의 샘플들에 대해 상이하지 않았다는 것을 시사하고; 정제 방법 #1의 경우 QCT1에 대한 약 3배 더 적은 유효 QCT 서열 리드 클러스터가 있었는데, 이는 정제 방법 #1이 샘플(예를 들면, cfDNA)의 상당한 손실을 초래한다는 것을 시사한다.

그러나, 서열분석 관련 파라미터를 확인하는 단계(S130)는 임의의 적합한 방식으로 수행될 수 있다.

2.3.A 오염 파라미터를 확인하는 단계

서열분석 관련 파라미터를 확인하는 단계(S130)는 추가로 또는 대안적으로 하나 이상의 오염 파라미터를 확인하는 단계(S132)를 포함할 수 있다. 오염 파라미터는 (예를 들면, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된, 샘플 및/또는 샘플 구획 전체에 걸친 교차오염; 상이한 사용자들 전체에 걸친 교차오염 등을 기술하는) 교차오염 파라미터, (예를 들면, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나의 복수의 경우들 전체에 걸친 이월 오염 등을 기술하는) 이월 오염 파라미터, (예를 들면, 인덱스-호핑 프라이머와 관련된 인덱스-호핑 오염 등을 기술하는) 인덱스-호핑 오염 파라미터 중 하나 이상을 포함할 수 있다. 오염 파라미터는 (예를 들면, 고처리량 서열분석 등과 관련된) 인덱스 배정오류의 정도를 기술할 수 있고, 예컨대, 이때 오염 파라미터는 교차오염(및/또는 다른 적합한 오염)및 인덱스 배정오류, 및/또는 서열분석 라이브러리 제조 및/또는 서열분석과 관련된 임의의 다른 적합한 특성 둘 다(예를 들면, 이들의 누적 효과)를 기술할 수 있다.

예를 들면, 오염 파라미터를 확인하는 단계는 (예를 들면, 특정 샘플과 관련된 것으로 발견되거나, 샘플에 상응하는 샘플 구획에서 발견된) 오염 서열에 대한 리드 깊이를 합산하고 리드의 총 수(또는 유효 QCT 서열 리드 클러스터와 관련된 QCT 분자 서열 리드의 총 수)로 나누는 것에 기반하여, 특정 샘플에 대한 총 오염 퍼센트 또는 분율을 확인하는 단계를 포함할 수 있다. 구체적인 예를 들면, 도 10에 나타낸 바와 같이, 오염 파라미터는 확인될 수 있고, 이때 샘플 A의 서열분석을 위한 비-유효 EMI 클러스터의 서열이 또 다른 샘플(샘플 B)에서 유효 EMI 클러스터로서 발견되는 경우, 이것은 샘플 A에서의 이 리드가 샘플 B로부터의 오염에 기인한다는 것을 시사하고; 이때, 모든 이러한 오염 서열들에 대한 리드 깊이를 발견하고 합산하고 리드의 총 수(또는 유효 EMI 클러스터에 맵핑되는 리드의 총 수)로 나눔으로써, 특정 샘플에 대한 총 오염 퍼센트 또는 오염률이 확인될 수 있고; 총 오염 퍼센트 또는 분율은 임상 어세이가 보고할 수 있는 최대 수준의 분석 민감성 및 특이성의 분석에 사용될 수 있고/있거나, 거짓 양성 대신에 실패한 어세이 및/또는 판정 없음 결과를 보고하기 위한 역치로서 사용될 수 있고; 예컨대, 특정 어세이가 0.1% 대립유전자 분율의 검출을 요구하는 경우, 그 샘플에 대해 0.1%이거나, 0.1%보다 더 높거나 0.1%에 가까운 총 오염률을 사용하여 판정 없음 결과를 식별할 수 있고; 대안적으로, 오염 샘플로부터의 대립유전자 분율의 지식을 이용하여 이 역치를 채택할 수 있다(즉, 소정의 샘플에서 특정 대립유전자를 측정하는 경우, 동일한 대립유전자에 대해 10%를 가진 또 다른 샘플로부터의 1% 오염은 1%로 그 대립유전자를 가진 샘플로부터의 10% 오염과 동일한 효과를 가진다).

구체적인 예를 들면, 도 4a 내지 4d에 나타낸 바와 같이, 오염은 각각의 샘플 구획(예를 들면, 웰 등)에서 QCT 분자 서열 리드(예를 들면, EMI 서열 리드 등)의 출처 및 목적지를 식별함으로써 측정될 수 있다. 구체적인 예를 들면, 동일한 QCT 분자 서열 리드(예를 들면, 동일한 EMI 서열 리드)가 복수의 샘플 구획들(예를 들면, 복수의 웰들 등)에서 관찰되는 경우, QCT 분자 서열 리드는 상기 복수의 동일한 구획들 중 가장 큰 리드 깊이를 가진 샘플 구획으로부터 유래한 것으로서 표시될 수 있고, 상기 복수의 샘플 구획들 중 다른 샘플 구획(예를 들면, 다른 웰(들) 등)에서 오염물질인 것으로 간주될 수 있다. 구체적인 예를 들면, 오염 파라미터를 확인하는 단계는 공유된 변이 영역 서열에 상응하는 제1 QCT 서열 리드 클러스터 및 제2 QCT 서열 리드 클러스터를 식별하는 단계로서, 제1 QCT 서열 리드 클러스터 및 제2 QCT 서열 리드 클러스터가 샘플 식별자 세트의 상이한 샘플 식별자들(예를 들면, 상이한 샘플 구획들; 상이한 샘플들 등을 식별함)에 배정되는 것인 단계; 제1 QCT 서열 리드 클러스터와 관련된 제1 리드 깊이와 제2 QCT 서열 리드 클러스터와 관련된 제2 리드 깊이 사이의 리드 깊이 비교를 생성하는 단계; 및 리드 깊이 비교에 기반하여, 상기 상이한 샘플 식별자들 중 상이한 샘플 식별자에 의해 식별된 샘플과 관련된 오염 파라미터를 확인하는 단계를 포함할 수 있다.

예를 들면, 오염 파라미터를 확인하는 단계는 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조의 제1 경우에서 제1 증폭과 관련된 제1 분자 지문을 확인하는 단계; 추가 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조의 제2 경우에서 제2 증폭과 관련된 제2 분자 지문을 확인하는 단계; 및 상기 제1 분자 지문과 상기 제2 분자 지문 사이의 비교에 기반하여, 상기 제1 경우로부터 상기 제2 경우로의 이월 오염을 기술하는 이월 오염 파라미터를 확인하는 단계를 포함할 수 있다.

변형에서, 오염 파라미터를 확인하는 단계는 인덱스-호핑 오염 파라미터를 확인하는 단계를 포함할 수 있다. 구체적인 예를 들면, 도 13a 및 13b에 나타낸 바와 같이, QCT 분자는 오염 및/또는 인덱스-호핑 프라이머의 식별 및 제거를 용이하게 하는 데 사용될 수 있고; 이때, 도 13a에 나타낸 바와 같이, 각각의 샘플을 상응하는 D7xx 인덱싱 프라이머로 바코딩하였고 검증 실험을 위해 동일한 서열분석 유동 셀 레인 상에서 실시하였고; D701 및 D707은 잠재적으로 D701 및 D707 인덱싱 올리고가 동일한 올리고 합성 컬럼 상에서 합성되기 때문에 서로로부터 유래한 높은 오염률, 합성 오류 또는 인덱스-호핑을 가진 것으로 발견되었고, 수준은 5%에서 유의미하고 임상 결과에 영향을 미칠 수 있고; 도 13b에 나타낸 바와 같이, 임상 샘플을 사용한 후속 실시에서 인덱싱 프라이머가 사용되지 않았고, 이것은 최대 오염 수준을 1% 미만까지 감소시켰다.

구체적인 예를 들면, 도 14에 나타낸 바와 같이, QCT 분자는 고유 이중 인덱스 프라이머의 사용과 관련된 진정한 오염 수준의 측정을 용이하게 하는 데 사용될 수 있고; 표준 이중 인덱싱 프라이머는 실제 샘플-대-샘플 오염, 인덱스-호핑 및/또는 인덱싱 올리고 오염의 조합으로 인해 0.1% 오염(샘플 1 내지 9에 의해 표시됨)을 초래할 수 있고; 고유 이중 인덱싱은 인덱스-호핑 및 인덱싱 올리고 오염의 효과를 0.001*0.001~ 1e-6까지 감소시킬 것으로 예상되나; 측정은 이중 고유 인덱싱 반응(샘플 10 내지 29에 의해 표시됨)에서 상기 예상된 1e-6 오염보다 더 높은 최대 0.03%(3e-5) 오염률을 표시하는데, 이것은 소정의 어세이에 대한 실험실 조건 하에서 실제 오염 수준의 검출을 시사할 수 있다.

그러나, 오염 파라미터를 확인하는 단계(S132)는 임의의 적합한 방식으로 수행될 수 있다.

2.3.B 분자 카운트 파라미터를 확인하는 단계

서열분석 관련 파라미터를 확인하는 단계(S130)는 추가로 또는 대안적으로 하나 이상의 분자 카운트 파라미터를 확인하는 단계(S134)를 포함할 수 있다. 분자 카운트 파라미터는 표적 분자 카운트(예를 들면, 표적 분자, 예컨대, 원래의 샘플 중의 표적 분자의 절대 분자 카운트; 내생성 표적 분자, 예컨대, 원래의 샘플 중의 내생성 표적 분자의 절대 카운트 등); 기준 분자 카운트(예를 들면, 내생성 기준 분자, 예컨대, 원래의 샘플 중의 내생성 기준 분자의 절대 카운트 등); QCT 분자 카운트(예를 들면, 유효 QCT 서열 리드 클러스터의 수에 상응하거나, 샘플의 성분에 첨가된 상이한 QCT 분자의 수에 상응함); 관련된 비(예를 들면, 보정 계수; 분자 카운트와 서열 리드의 관련된 수 사이의 비 등); 및/또는 분자 카운트와 관련된 임의의 다른 적합한 파라미터 중 하나 이상을 포함할 수 있다.

분자 카운트 파라미터는 바람직하게는 하나 이상의 진단을 용이하게 하는 데 사용되나, 추가로 또는 대안적으로 방법(100)의 실시양태의 임의의 적합한 부분을 위해(예를 들면, 입력물로서) 사용될 수 있다.

변형에서, 분자 카운트 파라미터(예를 들면, 표적 분자 카운트 등)을 확인하는 단계는 예컨대, 표적 분자 서열 리드의 수와 보정 계수 비를 곱함으로써, QCT 분자 카운트(예를 들면, QCT 서열 리드 클러스터의 수, 예컨대, 유효 QCT 서열 리드 클러스터 수 등에 상응함) 및 QCT 분자 서열 리드(예를 들면, QCT 서열 리드 클러스터에 상응하는 QCT 분자 서열 리드의 수 등)에 기반하여 확인된 보정 계수 비에 기반할 수 있다. 구체적인 예를 들면, 유효 비-오염 QCT 서열 리드 클러스터(예를 들면, 2개 이하의 리드를 갖고/갖거나 임의의 적합한 수 이하의 리드를 가진 QCT 서열 리드 클러스터를 버린 후 남은 QCT 서열 리드 클러스터 등)의 수는 QCT 분자 카운트(예를 들면, 특정 샘플 구획; 특정 샘플; 특정 샘플 식별자 등에 대한 QCT 분자의 수)를 표시할 수 있다. 구체적인 예를 들면, QCT 분자 카운트를 상응하는 QCT 분자로부터 비롯된 서열분석 리드로 나눔으로써, 보정 계수를 확인할 수 있고, 예컨대, 이때 (예를 들면, 특정 샘플 구획에 있거나; 특정 샘플로부터 유래하거나; 특정 샘플 식별자와 관련된) 표적 분자에 속하는 서열 리드와 곱해진 보정 계수는 표적 분자 카운트(예를 들면, 증폭을 위한 어세이에 의해 접근될 수 있었던 초기 생물학적 표적 분자의 절대 수 등)를 생성할 것이다. 예를 들면, 내생성 표적 분자의 절대 카운트 및 내생성 기준 분자의 절대 카운트를 확인하는 데 사용된 평균 QCT 서열분석 깊이는 이들의 상응하는 QCT와 별도로 확인된다.

대안적으로, 한 실시양태의 변형에서, (예를 들면, 분자 카운트 파라미터 및/또는 적합한 서열분석 관련 파라미터 등을 확인하기 위해) QCT 서열 리드 클러스터를 버리기 위한 리드 깊이 역치는 QCT 분자 서열 리드(예를 들면, EMI 서열 리드) 깊이 분포의 특징에 기반하여, 적응적으로 확인될 수 있다. 예를 들면, 각각의 샘플 내에서 평균 EMI 리드 깊이를 계산하고, 이 평균 리드 깊이의 제곱근을 계산하고, 평균 리드 깊이의 제곱근 미만의 리드 깊이를 가진 QCT 서열 리드 클러스터를 버림으로써 각각의 인덱싱된 샘플에 대한 역치를 설정할 수 있다. 추가로 또는 대안적으로, QCT 서열 리드 클러스터를 버리기 위한 리드 깊이 역치는 임의의 적합한 방식으로 계산될 수 있다.

그러나, 분자 카운트 파라미터를 확인하는 단계(S134)는 임의의 적합한 방식으로 수행될 수 있다.

2.4 진단을 용이하게 하는 단계

방법(100)의 실시양태는 추가로 또는 대안적으로 하나 이상의 상태에 대한 하나 이상의 진단을 보조하고/하거나, 확인하고/하거나, 제공하고/하거나 다른 방식으로 용이하게 하는 기능을 할 수 있는, 진단을 용이하게 하는 단계(S140)를 포함할 수 있다.

하나 이상의 진단을 용이하게 하는 단계는 (예를 들면, 하나 이상의 서열분석 관련 파라미터 등에 기반하여) 하나 이상의 진단을 확인하는 단계; (예를 들면, 1명 이상의 사용자; 예컨대, 환자에게 의학적 진단을 제공하는 데 있어서 1명 이상의 케어 제공자에 의해 사용되도록 1명 이상의 케어 제공자 등에게) 하나 이상의 진단을 제공하는 단계; 하나 이상의 진단을 보조하는(예를 들면, 다른 데이터와 함께 진단을 확인하는 데 사용되도록 1명 이상의 케어 제공자 및/또는 다른 적합한 독립체에게 하나 이상의 서열분석 관련 파라미터 및/또는 다른 적합한 파라미터를 제공하는) 단계; 및/또는 진단과 관련된 임의의 적합한 과정 중 어느 하나 이상을 포함할 수 있다. 예를 들면, 진단을 보조하는 단계는 비침습적 출생전 검사 및 액체 생검 중 적어도 하나와 관련된 어세이에 대한 진단 결과의 확인에 사용되도록 적합화된 오염 파라미터를 (예를 들면, 사용자; 케어 제공자 등에게) 제공하는 단계를 포함할 수 있다. 예를 들면, 표적 분자 카운트(및/또는 적합한 서열분석 관련 파라미터 등)를 확인하는 단계는 비침습적 출생전 검사 및 액체 생검 중 적어도 하나와 관련된 진단을 용이하게 하기 위해 표적 분자 카운트(및/또는 적합한 서열분석 관련 파라미터 등)를 확인하는 단계를 포함할 수 있다.

변형에서, 진단을 용이하게 하는 단계는 출생전 진단(예를 들면, 비침습적 출생전 검사와 관련된 출생전 진단; 관련된 유전 장애 및/또는 적합한 상태에 대한 출생전 진단 등)을 용이하게 하는 단계를 포함할 수 있다. 예를 들면, 진단을 용이하게 하는 단계는 표적 분자 카운트 파라미터 및 기준 분자 카운트 파라미터에 기반하여(예를 들면, 내생성 표적 서열의 절대 카운트와 내생성 기준 서열의 절대 카운트의 비교 등에 기반하여), 하나 이상의 유전 장애(예를 들면, 단일 유전자 장애, 염색체 이상 등)의 출생전 진단을 용이하게 하는 단계를 포함할 수 있다.

변형에서, 진단을 용이하게 하는 단계는 하나 이상의 단일 유전자 장애( 및/또는 적합한 유전 장애)의 진단을 용이하게 하는 단계를 포함할 수 있다. 예를 들면, 내생성 표적 분자의 절대 카운트를 확인하는 단계는 (예를 들면, 내생성 표적 분자에 대한 총 리드 카운트를, 예컨대, QCT 분자 서열 리드의 수를 QCT 분자의 고유 수로 나눔으로써 유도된 평균 QCT 서열분석 깊이로 나누는 것 등에 기반하여) 단일 유전자 장애와 관련된 돌연변이를 포함하는 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함할 수 있고, 이때 내생성 기준 분자의 절대 카운트를 확인하는 단계는 (예를 들면, 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것 등에 기반하여) 상기 돌연변이가 결여된 내성성 기준 분자의 절대 카운트를 확인하는 단계; 및 내생성 표적 서열의 절대 카운트 및 내생성 기준 서열의 절대 카운트(예를 들면, 이들의 비교 등)에 기반하여, 단일 유전자 장애라는 유전 장애의 출생전 진단을 용이하게 하는 단계를 포함할 수 있다. 구체적인 예를 들면, 도 15a 내지 15d에 나타낸 바와 같이, 샘플에서 질환 대립유전자 및 비-질환 대립유전자의 수를 측정하여 비교함으로써 모체 혈액으로부터 발생 태아의 유전형을 확인할 수 있고; 이때 도 15a는 임산부 및 발생 태아 둘 다가 상기 장애에 대한 이형접합성을 나타내는 경우를 대표하는 겸상 세포 형질(SCT) 샘플에서 QCT 분자에 의해 측정된 HbS(돌연변이된 헤모글로빈) 및 HbA(정상 헤모글로빈) 분자의 수를 포함하고, 이때 HbS 및 HbA 대립유전자는 동일한 빈도로 존재할 것으로 예상되고; 도 15b는 임산부가 상기 장애에 대한 보인자이고 발생 태아가 부모 둘 다로부터 질환 대립유전자를 물려받아 상기 질환을 가진 경우를 대표하는 SCT+10% 겸상 세포 질환(SCD) 샘플에서 QCT에 의해 측정된 HbS 및 HbA 분자의 수를 포함하고; 도 15c는 태아가 상대적 돌연변이 용량(RMD) 분석에 의해 상기 장애를 물려받을 사후 확률을 계산하는 데 사용될 분자 수 및 태아 분율 측정(예를 들면, 모체 및 태아의 유전형이 상이한 최대 9개의 좌위에서의 측정)을 포함하고; 도 15d는 (예를 들면, 상기 장애에 대한 보인자인 임산부로부터의 보인자 대 질환 태아를 대표하는) SCT 샘플에의 0% 대 10% SCD 추가에 대한 평균 및 95% 신뢰 구간을 포함한다. 그러나, 단일 유전자 장애의 진단을 용이하게 하는 단계는 임의의 적합한 방식으로 수행될 수 있다.

변형에서, 진단을 용이하게 하는 단계는 하나 이상의 염색체 이상(및/또는 적합한 유전 장애)의 진단을 용이하게 하는 단계를 포함할 수 있다. 예를 들면, 내생성 표적 분자의 절대 카운트를 확인하는 단계는 (예를 들면, 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것 등에 기반하여) 제1 염색체와 관련된 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함할 수 있고, 이때 내생성 기준 분자의 절대 카운트를 확인하는 단계는 (예를 들면, 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것 등에 기반하여) 제2 염색체와 관련된 내생성 기준 분자의 절대 카운트를 확인하는 단계; 및 내생성 표적 서열의 절대 카운트 및 내생성 기준 서열의 절대 카운트(예를 들면, 이들의 비교 등)에 기반하여, 염색체 이상의 출생전 진단을 용이하게 하는 단계를 포함할 수 있다. 구체적인 예를 들면, 도 16a 및 16b에 나타낸 바와 같이, QCT 분자를 유사하게 사용하여 21번 염색체 및 또 다른 염색체의 수를 카운팅하여 (예를 들면, 또 다른 염색체에 비해) 과도한 수의 21번 염색체가 존재하는지를 확인함으로써, 태아가 다운 증후군을 가진다는 것을 표시할 수 있고; 이때 3개 염색체 대 2개 염색체라는 차이가 카운팅되는 경우, 이 신호는 모체 혈액 중의 순환 DNA로부터 발생 태아의 다운 증후군을 측정하는 데 있어서 개선된 정확도를 위해 각각의 염색체 상의 하나 초과의 좌위가 카운팅될 것을 요구한다는 것을 시사할 수 있는, 유전된 열성 장애의 절반일 수 있고(예를 들면, HbSS 대 HbAS는 2 대 1의 신호임; 100% 증가 대 50% 증가); 방법(100)의 실시양태의 부분은 추가로 또는 대안적으로 다른 드 노보 돌연변이 및/또는 염색체 이상, 예컨대, 삼염색체증 18 및/또는 디죠지 증후군에 대한 진단을 용이하게 하는 데 사용될 수 있다.

변형에서, 진단을 용이하게 하는 단계는 하나 이상의 염색체 미세결실의 진단을 용이하게 하는 단계를 포함할 수 있다. 예를 들면, 내생성 표적 분자의 절대 카운트를 확인하는 단계는 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 미세결실 영역과 관련된 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함할 수 있고, 이때 내생성 기준 분자의 절대 카운트를 확인하는 단계는 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 미세결실을 가질 것으로 예상되지 않는 제2 염색체 영역과 관련된 내생성 기준 분자의 절대 카운트를 확인하는 단계를 포함할 수 있고, 유전 장애의 진단(예를 들면, 출생전 진단 등)을 용이하게 하는 단계는 비교에 기반하여, 염색체 미세결실의 진단(예를 들면, 출생전 진단 등)을 용이하게 하는 단계를 포함할 수 있다.

변형에서, 진단을 용이하게 하는 단계는 하나 이상의 카피 수 변이의 진단을 용이하게 하는 단계를 포함할 수 있다. 예를 들면, 내생성 표적 분자의 절대 카운트를 확인하는 단계는 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 카피 수 변이를 가질 수 있는 영역과 관련된 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함할 수 있고, 이때 내생성 기준 분자의 절대 카운트를 확인하는 단계는 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 카피 수 변이를 가질 것으로 예상되지 않는 영역과 관련된 내생성 기준 분자의 절대 카운트를 확인하는 단계를 포함할 수 있고, 유전 장애의 진단(예를 들면, 출생전 진단)을 용이하게 하는 단계는 비교에 기반하여, 카피 수 변이의 진단(예를 들면, 출생전 진단)을 용이하게 하는 단계를 포함할 수 있다.

추가로 또는 대안적으로, 진단을 용이하게 하는 단계는 임의의 적합한 상태에 대한 진단일 수 있다.

도 15c 및 16b에 나타낸 바와 같이, 진단을 용이하게 하는 단계는 하나 이상의 태아 분율 측정에 기반할 수 있다. 예를 들면, 출생전 진단을 용이하게 하는 단계는 태아 분율 측정, 내생성 표적 서열의 절대 카운트 및 내생성 기준 서열의 절대 카운트에 기반하여, 유전 장애의 출생전 진단을 용이하게 하는 단계를 포함할 수 있다. 그러나, 방법(100)의 실시양태의 임의의 적합한 과정을 위한 태아 분율 측정의 이용은 임의의 적합한 방식으로 수행될 수 있고, 진단을 용이하게 하는 단계(S140)는 임의의 적합한 방식으로 수행될 수 있다.

그러나, 방법(100)의 실시양태는 임의의 적합한 방식으로 수행될 수 있다.

방법(100) 및/또는 시스템(200)의 실시양태는 임의의 변형물(예를 들면, 실시양태, 변형, 예, 구체적인 예, 도면 등)을 포함하는, 다양한 시스템 구성요소들 및 다양한 방법 과정들의 모든 조합 및 순열을 포함할 수 있고, 이때 본원에 기재된 방법(100) 및/또는 과정의 실시양태의 부분은 본원에 기재된 시스템(200) 및/또는 다른 독립체의 하나 이상의 경우, 요소, 구성요소 및/또는 다른 양태에 의해, 그리고/또는 이를 사용함으로써 비동기적으로(예를 들면, 순차적으로), 동시적으로(예를 들면, 동시에) 또는 임의의 다른 적합한 순서로 수행될 수 있다.

본원에 기재된 임의의 변형물(예를 들면, 실시양태, 변형, 예, 구체적인 예, 도면 등) 및/또는 본원에 기재된 변형물의 임의의 부분은 추가로 또는 대안적으로 조합될 수 있고/있거나, 취합될 수 있고/있거나, 배제될 수 있고/있거나, 사용될 수 있고/있거나, 연속적으로 수행될 수 있고/있거나, 동시에 수행될 수 있고/있거나, 다른 방식으로 적용될 수 있다.

방법(100) 및/또는 시스템(200)의 실시양태의 부분은 적어도 부분적으로 컴퓨터 판독가능한 지시를 저장하는 컴퓨터 판독가능한 매체를 수용하도록 구성된 기계로서 구현될 수 있고/있거나 실시될 수 있다. 상기 지시는 시스템과 통합될 수 있는 컴퓨터 실행가능한 구성요소에 의해 실행될 수 있다. 컴퓨터 판독가능한 매체는 임의의 적합한 컴퓨터 판독가능한 매체, 예컨대, RAM, ROM, 플래시 메모리, EEPROM, 광학 디바이스(CD 또는 DVD), 하드 드라이브, 플로피 드라이브 또는 임의의 적합한 디바이스 상에 저장될 수 있다. 컴퓨터 실행가능한 구성요소는 일반 또는 응용 특이적 프로세서일 수 있으나, 임의의 적합한 전용 하드웨어 또는 하드웨어/펌웨어 조합 디바이스가 대안적으로 또는 추가로 상기 지시를 실행할 수 있다.

당분야에서 숙련된 자가 앞의 상세한 설명, 및 도면 및 청구범위로부터 인식할 바와 같이, 청구범위에서 정의된 범위를 벗어나지 않으면서 방법(100), 시스템(200) 및/또는 변형물의 실시양태에 대한 변경 및 변화를 만들 수 있다.

Claims

임산부와 관련된 모체 샘플로부터 유전 장애의 출생전 진단을 용이하게 하는 방법으로서,
상기 유전 장애와 관련된 품질 관리 주형(QCT) 분자 세트를 상기 모체 샘플에 첨가하는 단계로서, 상기 QCT 분자 세트는
내생성 표적 분자의 표적 서열 영역에 대해 서열 유사성을 갖는 표적 관련 영역, 및
내생성 표적 분자의 서열 영역에 대해 서열 비유사성을 갖는 변이 영역을 포함하는 것인 단계;
상기 QCT 분자 세트 및 상기 표적 서열 영역을 포함하는 핵산 분자의 공-증폭에 기반하여, 공-증폭된 혼합물을 생성하는 단계;
상기 공-증폭된 혼합물을 서열분석하는 단계;
상기 서열분석으로부터의 QCT 분자 서열 리드와 상이하고 이 서열 리드로부터 검출된 변이 영역의 수에 기반하여, 상기 QCT 분자 세트의 고유 수를 전산으로 확인하는 단계로서, 상기 QCT 분자 서열 리드는 상기 QCT 분자 세트에 상응하는 것인 단계;
상기 QCT 분자 서열 리드의 수를 QCT 분자의 고유 수로 나누는 것에 기반하여, 평균 QCT 서열분석 깊이를 계산하는 단계;
내생성 표적 분자에 대한 총 리드 카운트를 상기 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 내생성 표적 분자의 절대 카운트를 확인하는 단계;
내생성 기준 분자에 대한 총 리드 카운트를 상기 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 내생성 기준 분자의 절대 카운트를 확인하는 단계; 및
내생성 표적 서열의 절대 카운트와 내생성 기준 서열의 절대 카운트의 비교에 기반하여, 유전 장애의 출생전 진단을 용이하게 하는 단계
를 포함하는, 임산부와 관련된 모체 샘플로부터 유전 장애의 출생전 진단을 용이하게 하는 방법.
제1항에 있어서, 유전 장애는 단일 유전자 장애를 포함하고,
내생성 표적 분자의 절대 카운트를 확인하는 단계는, 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 상기 단일 유전자 장애와 관련된 돌연변이를 포함하는 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함하고,
내생성 기준 분자의 절대 카운트를 확인하는 단계는, 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 상기 돌연변이가 결여된 내생성 기준 분자의 절대 카운트를 확인하는 단계를 포함하고,
유전 장애의 출생전 진단을 용이하게 하는 단계는, 상기 비교에 기반하여, 단일 유전자 장애의 출생전 진단을 용이하게 하는 단계를 포함하는 것인 방법.
제1항에 있어서, 유전 장애는 염색체 이상을 포함하고,
내생성 표적 분자의 절대 카운트를 확인하는 단계는, 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 제1 염색체와 관련된 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함하고,
내생성 기준 분자의 절대 카운트를 확인하는 단계는, 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 제2 염색체와 관련된 내생성 기준 분자의 절대 카운트를 확인하는 단계를 포함하고,
유전 장애의 출생전 진단을 용이하게 하는 단계는, 상기 비교에 기반하여, 염색체 이상의 출생전 진단을 용이하게 하는 단계를 포함하는 것인 방법.
제1항에 있어서, 유전 장애는 염색체 미세결실을 포함하고,
내생성 표적 분자의 절대 카운트를 확인하는 단계는, 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 미세결실 영역과 관련된 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함하고,
내생성 기준 분자의 절대 카운트를 확인하는 단계는, 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 미세결실을 가질 것으로 예상되지 않는 제2 염색체 영역과 관련된 내생성 기준 분자의 절대 카운트를 확인하는 단계를 포함하고,
유전 장애의 출생전 진단을 용이하게 하는 단계는, 상기 비교에 기반하여, 상기 염색체 미세결실의 출생전 진단을 용이하게 하는 단계를 포함하는 것인 방법.
제1항에 있어서, 유전 장애는 카피 수 변이를 포함하고,
내생성 표적 분자 의 절대 카운트를 확인하는 단계는, 내생성 표적 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 카피 수 변이를 가질 수 있는 영역과 관련된 내생성 표적 분자의 절대 카운트를 확인하는 단계를 포함하고,
내생성 기준 분자의 절대 카운트를 확인하는 단계는, 내생성 기준 분자에 대한 총 리드 카운트를 평균 QCT 서열분석 깊이로 나누는 것에 기반하여, 카피 수 변이를 가질 것으로 예상되지 않는 영역과 관련된 내생성 기준 분자의 절대 카운트를 확인하는 단계를 포함하고,
유전 장애의 출생전 진단을 용이하게 하는 단계는, 상기 비교에 기반하여, 카피 수 변이의 출생전 진단을 용이하게 하는 단계를 포함하는 것인 방법.
제1항에 있어서, 내생성 표적 분자의 절대 카운트 및 내생성 기준 분자의 절대 카운트를 확인하는 데 사용된 평균 QCT 서열분석 깊이는, 이들의 상응하는 QCT와 별도로 확인되는 것인 방법.
제1항에 있어서, 출생전 진단을 용이하게 하는 단계는, 태아 분율 측정, 내생성 표적 서열의 절대 카운트, 및 내생성 기준 서열의 절대 카운트에 기반하여, 유전 장애의 출생전 진단을 용이하게 하는 단계를 포함하는 것인 방법.
서열분석 라이브러리 제조 및 고처리량 서열분석 중 적어도 하나와 관련된 오염을 식별하는 방법으로서,
품질 관리 주형(QCT) 분자 세트를 생성하는 단계로서, 각각의 QCT 분자는
생물학적 표적의 표적 서열 영역에 대해 서열 유사성을 갖는 표적 관련 영역, 및
생물학적 표적의 서열 영역에 대해 서열 비유사성을 갖는 변이 영역을 포함하는 것인 단계;
상기 QCT 분자 세트의 변이 영역에 기반하여, QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계로서,
상기 QCT 서열 리드 클러스터 세트는, 상기 QCT 분자 세트 및 생물학적 표적을 포함하는 샘플 세트에 기반하여 생성된 QCT 혼합물 세트에 상응하는 고처리량 서열분석으로부터 유도된 QCT 분자 서열 리드를 포함하고,
서열분석 라이브러리 제조는, 표적 관련 영역과 생물학적 표적의 표적 서열 영역의 서열 유사성에 기반한, 상기 QCT 분자 세트 및 생물학적 표적을 포함하는 핵산 분자의 공-증폭을 포함하는 것인 단계; 및
상기 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조 및 고처리량 서열분석 중 적어도 하나와 관련된 오염을 기술하는 오염 파라미터를 확인하는 단계
를 포함하는, 서열분석 라이브러리 제조 및 고처리량 서열분석 중 적어도 하나와 관련된 오염을 식별하는 방법.
제8항에 있어서, QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계는,
제1 조건을 충족시키는 변이 영역 서열 유사성에 기반하여, 제1 QCT 분자 서열 리드 및 제2 QCT 분자 서열 리드를 상기 QCT 서열 리드 클러스터 세트의 QCT 서열 리드 클러스터로 클러스터링하는 단계, 및
QCT 서열 리드 클러스터 세트의 각각의 QCT 서열 리드 클러스터에 대해, 샘플 세트를 식별하는 샘플 식별자 세트의 샘플 식별자에의 상기 QCT 서열 리드 클러스터의 배정을 확인하는 단계를 포함하고,
오염 파라미터를 확인하는 단계는, 상기 QCT 서열 리드 클러스터 세트 및 상기 샘플 식별자 세트의 샘플 식별자에의 상기 QCT 서열 리드 클러스터의 배정에 기반한 오염 파라미터의 확인을 포함하는 것인 방법.
제9항에 있어서, 오염 파라미터를 확인하는 단계는,
공유된 변이 영역 서열에 상응하는 제1 QCT 서열 리드 클러스터 및 제2 QCT 서열 리드 클러스터를 식별하는 단계로서, 제1 QCT 서열 리드 클러스터 및 제2 QCT 서열 리드 클러스터를 샘플 식별자 세트의 상이한 샘플 식별자에 배정하는 것인 단계;
제1 QCT 서열 리드 클러스터와 관련된 제1 리드 깊이와 제2 QCT 서열 리드 클러스터와 관련된 제2 리드 깊이의 리드 깊이 비교를 생성하는 단계; 및
상기 리드 깊이 비교에 기반하여, 상이한 샘플 식별자들의 상이한 샘플 식별자에 의해 식별된 샘플과 관련된 오염 파라미터를 확인하는 단계
를 포함하는 것인 방법.
제9항에 있어서, 제1 QCT 서열 리드 및 제2 QCT 서열 리드를 클러스터링하는 단계는, 3점보다 적은 치환의 변이 영역 서열 유사성, 및 제2 조건을 충족시키는 QCT 서열 리드 클러스터와 관련된 리드 깊이에 기반하여, 제1 QCT 서열 리드 및 제2 QCT 서열 리드를 QCT 서열 리드 클러스터로 클러스터링하는 단계를 포함하는 것인 방법.
제8항에 있어서, 오염 파라미터를 확인하는 단계는,
QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조의 제1 경우에서 제1 증폭과 관련된 제1 분자 지문을 확인하는 단계;
추가 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조의 제2 경우에서 제2 증폭과 관련된 제2 분자 지문을 확인하는 단계; 및
상기 제1 분자 지문과 상기 제2 분자 지문의 비교에 기반하여, 상기 제1 경우로부터 상기 제2 경우로의 이월(carry-over) 오염을 기술하는 이월 오염 파라미터를 확인하는 단계
를 포함하는 것인 방법.
제8항에 있어서, 오염 파라미터는 고처리량 서열분석과 관련된 인덱스 배정오류의 정도를 기술하는 것인 방법.
제13항에 있어서, 오염 파라미터는, 비침습적 출생전 검사 및 액체 생검 중 적어도 하나와 관련된 어세이에 대한 진단 결과의 확인에 사용되도록 적합화되는 것인 방법.
제8항에 있어서, QCT 분자 세트를 포함하는 단일 QCT 라이브러리를 생성하는 단계를 추가로 포함하고,
서열분석 라이브러리 제조 및 고처리량 서열분석 중 적어도 하나의 단일 단계에서, 샘플 세트의 각각의 샘플에 대해 0.00001 나노그램 미만의 증폭가능한 QCT 분자를 활용하도록 상기 단일 QCT 라이브러리가 적합화되는 것인 방법.
제8항에 있어서, QCT 분자 세트의 각각의 변이 영역은 가변 "N" 염기 세트를 포함하는 매립 분자 식별자(EMI) 영역을 포함하고, 각각의 "N" 염기는 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택되고,
QCT 분자 세트의 각각의 QCT 분자는 추가 가변 "N" 염기 세트를 포함하는 추가 EMI 영역을 추가로 포함하고, 추가 EMI 영역은 QCT 분자의 서열 영역에 의해 EMI 영역으로부터 분리되고, 가변 "N" 염기 세트 및 추가 가변 "N" 염기 세트가 3개 초과의 "N" 염기를 각각 포함하고,
오염 파라미터를 확인하는 단계는, 상기 QCT 분자 세트의 상기 EMI 영역 및 상기 추가 EMI 영역에 기반하여 유도된 QCT 서열 리드 클러스터 세트에 기반하여 오염 파라미터를 확인하는 단계를 포함하는 것인 방법.
서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 특성화 방법으로서,
품질 관리 주형(QCT) 분자 세트를 생성하는 단계로서, 각각의 QCT 분자가 변이 영역을 포함하는 것인 단계;
상기 QCT 분자 세트의 변이 영역에 기반하여, QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계로서, 상기 QCT 서열 리드 클러스터 세트는, 상기 QCT 분자 세트 및 생물학적 표적을 포함하는 샘플에 기반하여 생성된 QCT 혼합물에 상응하는 서열분석으로부터 유도된 QCT 분자 서열 리드를 포함하는 것인 단계; 및
상기 QCT 서열 리드 클러스터 세트에 기반하여, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 서열분석 관련 파라미터를 확인하는 단계
를 포함하는, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된 특성화 방법.
제17항에 있어서, 각각의 QCT 분자는 QCT 분자 세트 사이에 공유되고 QCT 분자를 식별하도록 적합화된 제1 QCT 식별자 영역을 포함하고;
상기 방법은 추가 QCT 분자 세트를 생성하는 단계를 추가로 포함하고, 각각의 추가 QCT 분자는 상기 추가 QCT 분자 세트 사이에 공유되고 추가 QCT 분자를 식별하도록 적합화된 제2 QCT 식별자 영역을 포함하고;
QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계는, 상기 제1 식별자 영역 및 상기 제2 식별자 영역에 기반하여, 상기 QCT 서열 리드 클러스터 세트를 확인하는 단계를 포함하는 것인 방법.
제18항에 있어서, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나의 제1 단계에서 활용되도록 QCT 분자 세트를 적합화하고;
서열분석 라이브러리 제조 및 서열분석 중 적어도 하나의 제2 단계에서 활용되도록 추가 QCT 분자 세트를 적합화하고;
QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계는,
상기 QCT 서열 리드 클러스터 세트의 제1 서브세트를 확인하는 단계로서, 상기 제1 서브세트는 제1 QCT 식별자 영역에 상응하고 상기 제1 단계와 관련되는 것인 단계, 및
상기 QCT 서열 리드 클러스터 세트의 제2 서브세트를 확인하는 단계로서, 상기 제2 서브세트는 제2 QCT 식별자 영역에 상응하고 상기 제2 단계와 관련되는 것인 단계
를 포함하고;
서열분석 관련 파라미터를 확인하는 단계는, 상기 QCT 서열 리드 클러스터 세트의 상기 제1 서브세트 및 상기 제2 서브세트에 기반하여, 샘플 손실과 관련된 샘플 추적 파라미터를 확인하는 단계를 포함하는 것인 방법.
제18항에 있어서, 서열분석 관련 파라미터를 확인하는 단계는
QCT 서열 리드 클러스터 세트에 기반하여, 각각 QCT 분자 세트 및 추가 QCT 분자 세트에 상응하는 제1 절대 카운트 및 제2 절대 카운트를 확인하는 단계, 및
상기 제1 절대 카운트 및 상기 제2 절대 카운트에 기반하여, 피펫 오류 파라미터 및 정량 오류 파라미터 중 적어도 하나를 확인하는 단계
를 포함하는 것인 방법.
제18항에 있어서, 서열분석 관련 파라미터를 확인하는 단계는
QCT 서열 리드 클러스터 세트의 QCT 서열 리드 클러스터에 배정되지 않은 QCT 서열 리드를 식별하는 단계; 및
배정되지 않은 QCT 서열 리드의 수 및 QCT 서열 리드의 총 수로부터 서열분석 오류율 및 중합효소 오류율 중 적어도 하나를 확인하는 단계
를 포함하는 것인 방법.
제18항에 있어서, 각각의 QCT 분자의 변이 영역은 적어도 제1 QCT 식별자 영역에 의해 제2 매립 분자 식별자(EMI) 영역으로부터 분리된 제1 EMI 영역을 포함하고,
각각의 추가 QCT 분자는 적어도 제2 QCT 식별자 영역에 의해 제2 추가 EMI 영역으로부터 분리된 제1 추가 EMI 영역을 포함하고,
제1 EMI 영역, 제2 EMI 영역, 제1 추가 EMI 영역 및 제2 추가 EMI 영역은 가변 "N" 염기 세트를 포함하고, 각각의 "N" 염기가 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택되고,
QCT 서열 리드 클러스터 세트를 전산으로 확인하는 단계는, 제1 QCT 식별자 영역, 제2 QCT 식별자 영역, 제1 EMI 영역, 제2 EMI 영역, 제1 추가 EMI 영역 및 제2 추가 EMI 영역에 기반하여, QCT 서열 리드 클러스터 세트를 확인하는 단계를 포함하는 것인 방법.
제22항에 있어서, 각각의 QCT 분자에 대해, 제1 QCT 식별자 영역, 제1 EMI 영역 및 제2 EMI 영역을 제외하고는, 상응하는 QCT 분자 서열은 생물학적 표적의 제1 서열 주형에 대한 전체 서열 유사성을 특징으로 하고;
각각의 추가 QCT 분자에 대해, 제2 QCT 식별자 영역, 제1 추가 EMI 영역 및 제2 추가 EMI 영역을 제외하고는, 상응하는 추가 QCT 분자 서열은 제2 서열 주형에 대한 전체 서열 유사성을 특징으로 하는 것인 방법.
제17항에 있어서, QCT 분자 세트의 각각의 QCT 분자는 생물학적 표적의 표적 서열 영역에 대해 서열 유사성을 갖는 표적 관련 영역을 포함하고,
서열분석 라이브러리 제조는 상기 표적 관련 영역과 상기 생물학적 표적의 표적 서열 영역의 서열 유사성에 기반하여, 상기 QCT 분자 세트와 상기 생물학적 표적을 포함하는 핵산 분자를 공-증폭하는 단계를 포함하고,
서열분석 관련 파라미터를 확인하는 단계는, QCT 서열 리드 클러스터 세트에 기반하여, 서열분석과 관련된 생물학적 표적의 분자 수를 기술하는 표적 분자 카운트를 확인하는 단계를 포함한다는 것
을 추가로 포함하는 방법.
제24항에 있어서, QCT 서열 리드 클러스터 세트를 확인하는 단계는, QCT 서열 리드 클러스터의 여과된 서브세트에 상응하는 리드 깊이에 기반하여, QCT 서열 리드 클러스터의 여과된 서브세트를 확인하는 단계를 포함하고,
표적 분자 카운트를 확인하는 단계는
QCT 서열 리드 클러스터의 여과된 서브세트에 기반하여, QCT 분자 카운트를 확인하는 단계;
QCT 분자 카운트 및 QCT 분자 서열 리드에 기반하여, 보정 계수 비를 확인하는 단계; 및
상기 보정 계수 비, 및 서열분석으로부터 유도된 표적 분자 서열 리드에 기반하여, 표적 분자 카운트를 확인하는 단계로서, 상기 표적 분자 서열 리드는 생물학적 표적과 관련된 것인 단계
를 포함하는 것인 방법.
제25항에 있어서, QCT 분자 서열 리드에 대한 리드 깊이 분포 특징에 기반하여, 리드 깊이 역치를 적응적으로 확인하는 단계를 추가로 포함하고, QCT 서열 리드 클러스터의 여과된 서브세트를 확인하는 단계는, 리드 깊이에 의한 상기 적응적으로 확인된 리드 깊이 역치의 충족에 기반하여, 상기 여과된 서브세트를 확인하는 단계를 포함하는 것인 방법.
제25항에 있어서, 리드 깊이들의 각각의 리드 깊이는, QCT 서열 리드 클러스터의 여과된 서브세트의 상응하는 QCT 서열 리드 클러스터에 대해 20개 초과의 리드에 상응하는 것인 방법.
제24항에 있어서, 표적 분자 카운트를 확인하는 단계는 비침습적 출생전 검사 및 액체 생검 중 적어도 하나와 관련된 진단을 용이하게 하기 위해 표적 분자 카운트를 확인하는 단계를 포함하는 것인 방법.
제17항에 있어서, 서열분석 관련 파라미터를 확인하는 단계는, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나와 관련된, 샘플 구획들 전체에 걸친 교차오염을 기술하는 교차오염 파라미터, 서열분석 라이브러리 제조 및 서열분석 중 적어도 하나의 복수의 경우들 전체에 걸친 이월 오염을 기술하는 이월 오염 파라미터, 및 인덱스-호핑(index-hopping) 프라이머와 관련된 인덱스-호핑 오염을 기술하는 인덱스-호핑 오염 파라미터 중 적어도 하나를 포함하는 오염 파라미터를 확인하는 단계를 포함하는 것인 방법.
제29항에 있어서, QCT 분자 세트를 서열분석에 적합화하고,
상기 QCT 분자 세트를 생성하는 단계는,
상기 QCT 분자 세트의 제1 QCT 분자 서브세트를 증폭하는 단계, 및
상기 QCT 분자 세트의 제2 QCT 분자 서브세트를 증폭하는 단계를 포함하고,
제1 QCT 분자 서브세트 및 생물학적 표적을 포함하는 샘플에 기반하여 생성된 QCT 혼합물, 및
제2 QCT 분자 서브세트 및 생물학적 표적을 포함하는 추가 샘플에 기반하여 생성된 추가 QCT 혼합물
에 상응하는 QCT 분자 서열분석 리드는 서열분석으로부터 유도되고, 이때 상기 샘플 및 상기 추가 샘플은 각각 샘플 구획들의 제1 샘플 구획 및 제2 샘플 구획에 상응하는 것인 방법.