KR20220063169A - 폴리뉴클레오타이드 분자 집단의 생성 방법 - Google Patents

폴리뉴클레오타이드 분자 집단의 생성 방법 Download PDF

Info

Publication number
KR20220063169A
KR20220063169A KR1020227008282A KR20227008282A KR20220063169A KR 20220063169 A KR20220063169 A KR 20220063169A KR 1020227008282 A KR1020227008282 A KR 1020227008282A KR 20227008282 A KR20227008282 A KR 20227008282A KR 20220063169 A KR20220063169 A KR 20220063169A
Authority
KR
South Korea
Prior art keywords
dna
stranded
polynucleotide
sequence
sequencing
Prior art date
Application number
KR1020227008282A
Other languages
English (en)
Inventor
가브리엘라 픽즈
에밀리 손더슨
Original Assignee
퀸 메리 유니버시티 오브 런던
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀸 메리 유니버시티 오브 런던 filed Critical 퀸 메리 유니버시티 오브 런던
Publication of KR20220063169A publication Critical patent/KR20220063169A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/531Glycosylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

폴리뉴클레오타이드 분자 집단의 생성 방법
본 발명은 적어도 하나의 폴리뉴클레오타이드를 포함하는 샘플로부터 이중-가닥 폴리뉴클레오타이드 분자의 집단을 생성하기 위한 신규한 방법에 관한 것이다.

Description

폴리뉴클레오타이드 분자 집단의 생성 방법
본 발명은 적어도 하나의 폴리뉴클레오타이드를 포함하는 샘플로부터 이중 -가닥 폴리뉴클레오타이드 분자의 집단(population)을 생성하기 위한 신규한 방법에 관한 것이다.
전장 유전체 시퀀싱(whole genome sequencing, WGS)은 의료 진단과 연구를 근본적으로 변화시켰으며 빠르게 진화하는 기술 플랫폼이다. 일루미나 시퀀싱(Illumina sequencing) 기술은 단일-영역, 단일-유전자 접근 방식으로부터 전장 유전체에서 동시에 정보를 얻는 방식으로 연구를 확장하였다. 이 접근 방식은 비용면에서는 효율적이지만, 단편화된 유전체 DNA의 WGS는, 포르말린-고정 파라핀-포매(formalin-fixed paraffin-embedded, FFPE) 물질에서는 훨씬 더 빈번하게 나타나는, 시퀀싱 및 맵핑(mapping) 인공물(artefact)과 관련이 있다. FFPE 처리는 고고학적 또는 역사적 샘플뿐만 아니라 임상 표본을 보존하기 위해 일상적으로 사용된다. 그러나 이는 광범위한 DNA 손상(특히 DNA 가교 및 시토신의 탈아미노화)과 단편화를 초래할 수 있으며, 이로 인해 많은 샘플을 WGS에 사용할 수 없게 만드는 낮은 품질의 시퀀싱 데이터가 생성될 수 있다. 결과적으로, Genomics England가 주도하는 '10만 유전체 프로젝트(The 100,000 Genomes Project)'와 같은 대규모 시퀀싱 활동은 현대 암 진단에서 신선한 조직(tissue)의 수집이 절차기준(standard of care)이 되어야 한다고 제안하였다. 그럼에도 불구하고, 후향성 연구(retrospective study)에서 FFPE 조직(tissue)은 보통 이용 가능한 유일한 물질이므로, 시퀀싱 품질을 향상시킬 수 있는 새로운 방법을 개발할 필요가 있다.
연구자가 사용할 수 있는 WGS 라이브러리 제조 방법은 다양하며, 이들의 가격, 제조 시간 및 권장 입력 물질이 상이하다. WGS를 위한 대부분의 라이브러리 제조 방법은 선택한 신선한 또는 FFPE 샘플에서 분리된 단편화된 유전체 dsDNA에 짧은 이중 가닥 DNA(double stranded DNA, dsDNA) 올리고(oligo)를 부착하는 데에 의존한다. 주요 생명 공학 회사에서 판매하는 WGS 라이브러리 제조에 대한 황금 표준 방법(gold standard method)은, 물질의 품질이 좋은 경우라면(신선한 조직 또는 세포로부터 분리한 것과 같은), 매우 적은 양의 입력 DNA에 적용할 수 있도록 시간이 지남에 따라 계속 개선되고 있다. 이 키트의 한 가지 제한 사항은 어댑터 라이게이션(adaptor ligation) 단계가 비효율적이며 단일 가닥 DNA(single stranded DNA, ssDNA)를 회수(recover)하지 못한다는 것이다.
학술 연구에서 WGS 작업-흐름에 대한 점점 더 중요한 확장은 표적화 시퀀싱(targeted sequencing)이라는 후속 방법이다. 이는 WGS에서 식별된 관심 돌연변이(mutations-of-interest)가 있는 유전체의 특정 영역(DNA 염기 당 수만에서 수천 개의 리드(read) 제공)을 더 깊이(depth)(즉, DNA 염기 당 수만에서 수천 개의 리드) 조사하는 데 사용된다. 이는 돌연변이가 항상 100%의 침투율(penetrance)을 나타내는 것은 아니므로 중요하며(즉, 이들은, 특히 질병-관련 돌연변이는, 모든 세포에서 발견되지 않을 수 있음); 사실상, 기능적으로 관련된 다수의 돌연변이가 낮은 빈도(즉, 50% 미만)에 있으며, DNA 염기 당 커버리지(coverage)가 제한되기 때문에 WGS는 실패할 수 있다. 특정 유전자 돌연변이(예, 엑손 돌연변이)를 환자 예후 및/또는 치료 반응과 관련시키는 임상 지식이 빠르게 증가함에 따라, 잘-확립된 다른 진단 기술을 보완하기 위해, 점차 표적화 시퀀싱을 사용하여 환자 생검을 평가하고 있다. 환자 샘플의 표적화 시퀀싱은 WGS와 비교하여 높은 정확도와 적은 비용으로 질병-관련 돌연변이 핫-스팟(hot-spot)의 존재 또는 부재를 확인할 수 있다. 예를 들어, 최대 130개의 유전자로 이루어진 표적화 시퀀싱을 위한 유전자 패널(gene panel)은 인간 유전체의 약 0.015%이므로, WGS 비용의 일부만으로도 보다 더 많은 데이터(DNA 염기 당 더 많은 리드)를 생성할 수 있다.
표적화 시퀀싱을 위한 현재 방법은 항상 샘플 DNA(즉, 짧은 dsDNA 올리고뉴클레오타이드)에 올리고뉴클레오타이드(oligonucleotide)를 부착하는 라이게이션을 사용한다. 관심 표적(target-of-interest)을 포착하기 위해, 표준 방법은 보통 부착된 관심 표적 올리고뉴클레오타이드를 가지는, 특수 '칩(chip)'을 필요로 하며, 그 후 비용과 시간이 많이 소요되는 과정인, 샘플 DNA를 칩에 어닐링(annealing)하는 긴 혼성화(hybridisation) 단계가 이어진다. WGS 샘플 제조와 유사하게, 이 접근 방식의 한계는 ssDNA의 손실이다.
발명의 요약
본 발명은 적어도 하나의 폴리뉴클레오타이드를 포함하는 샘플로부터 이중-가닥 폴리뉴클레오타이드 분자의 집단(population)을 생성하는 방법을 제공하며, 상기 방법은 상기 폴리뉴클레오타이드에 아황산수소(bisulfite) 처리를 포함하지 않으며, 상기 방법은 다음 단계를 포함한다:
a. 상기 폴리뉴클레오타이드를 변성(denaturing)시켜 단일 가닥 폴리뉴클레오타이드를 생산하는 단계;
b. 상기 단계 a.의 단일 가닥 폴리뉴클레오타이드에 첫 번째 단일-가닥 올리고뉴클레오타이드를 어닐링(annealing)하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열(sequencing adaptor sequence) 및 프라이머 서열(primer sequence)을 포함하는 첫 번째 단일-가닥 올리고뉴클레오타이드와 함께 상기 단계 a.로부터의 단일 가닥 폴리뉴클레오타이드를 인큐베이션(incubating)하는 단계, 및 그 후 상기 프라이머를 중합효소(polymerase)로 신장(extending)하여 이중-가닥 폴리뉴클레오타이드를 생산하는 단계;
c. 상기 단계 b.의 이중-가닥 폴리뉴클레오타이드를 변성시켜 단일 가닥 폴리뉴클레오타이드를 생산하는 단계;
d. 상기 단계 c.의 단일 가닥 폴리뉴클레오타이드에 두 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열 및 프라이머 서열을 포함하는 두 번째 단일-가닥 올리고뉴클레오타이드와 함께 상기 단계 c.로부터의 단일 가닥 폴리뉴클레오타이드를 인큐베이션하는 단계, 및 그 후 상기 프라이머를 중합효소로 신장하여 이중-가닥 폴리뉴클레오타이드 분자의 집단(population)을 생산하는 단계.
발명의 상세한 설명
개시된 방법의 상이한 적용이 당업계의 특이적인 요구에 맞춰질 수 있음을 이해해야 한다. 본 명세서에서 사용된 용어는 단지 본 발명의 특정 구현예를 설명하기 위한 것이며, 제한하려는 의도가 아님을 이해해야 한다.
또한, 본 명세서 및 첨부된 청구항에 사용된 바와 같이, 단수형은 내용이 달리 명백하게 지시하지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, "방법"에 대한 언급은 "방법들" 등을 포함한다.
상기 또는 하기에 인용된 모든 간행물, 특허 및 특허 출원서는 그 전문이 참조로 본원에 포함된다.
본 발명자들은 적어도 하나의 폴리뉴클레오타이드를 포함하는 샘플로부터 이중-가닥 폴리뉴클레오타이드 분자의 집단을 생성하기 위한 방법을 고안하였다.
본 명세서에서 사용된, "집단(population)"은 복수의 분자를 의미한다. 본 명세서에서 사용된 "폴리뉴클레오타이드 분자(polynucleotide molecule)"는 DNA, 데옥시리보뉴클레오타이드(deoxyribonucleotide)의 서열, 폴리뉴클레오타이드, 폴리뉴클레오티드 유사체(analog), 합성 데옥시리보뉴클레오타이드의 서열, 또는 DNA 단편을 의미할 수 있다. 폴리뉴클레오타이드 분자의 집단은 단일-가닥 폴리뉴클레오타이드 또는 이중-가닥 폴리뉴클레오타이드를 포함할 수 있다. 폴리뉴클레오타이드 분자의 집단은 cDNA일 수 있다. 폴리뉴클레오타이드 분자의 집단은 DNA 시퀀싱 라이브러리일 수 있다. DNA 시퀀싱 라이브러리는 또한 시퀀싱 어댑터 및 프라이머 중 어느 하나, 또는 모두를 포함할 수 있다. 본 명세서에 기재된 어느 방법에서, 집단은 복수의 RNA 분자를 의미할 수 있다.
본 발명의 방법은 또한 RNA를 포함하는 샘플로부터 이중-가닥 폴리뉴클레오타이드 분자의 집단을 생성하기 위해 사용될 수 있다. 본 명세서에서 사용된 "RNA 분자"는 리보뉴클레오타이드(ribonucleotide), 폴리뉴클레오타이드, 폴리리보뉴클레오타이드(polyribonucleotide), 폴리리보뉴클레오타이드 유사체, 합성 리보뉴클레오타이드의 서열, 또는 RNA 단편을 의미할 수 있다. RNA 분자는 단일-가닥 RNA 또는 이중-가닥 RNA를 포함할 수 있다. RNA 분자는 RNA 시퀀싱 라이브러리에 의한 것일 수 있다.
본 명세서에서 사용된 "샘플(sample)"은 적어도 하나의 폴리뉴클레오타이드를 포함하는 어느 물질을 의미한다. 적어도 하나의 폴리뉴클레오타이드는 RNA 또는 DNA일 수 있다. 예시적인 샘플은 토양 샘플, 또는 식물 또는 동물로부터 얻은 어느 물질 또는 조직의 샘플일 수 있다. 바람직한 동물 물질은 모낭 및 체액(body fluid), 예컨대, 혈액, 타액(saliva), 정액(semen), 질액(vaginal fluid), 점액(mucus), 소변 또는 임의의 다른 체액성 물질(humoral material)을 포함한다. 샘플은 세포 용해물(cellular lysate)일 수 있다. 샘플은 예를 들어, 열, 침지(immersion) 또는 관류(perfusion)에 의해 고정될 수 있다. 특히, 샘플은 화학적 고정을 거친 유기체, 조직(tissue), 또는 조직 단면(tissue cross-section)으로부터 유래될 수 있다. 예를 들어, 샘플은 포르말린(formalin)-, 파라포름알데히드(paraformaldehyde)-, 사산화오스뮴(osmium tetroxide)-, 글루타르알데히드(glutaraldehyde)-, 알코올-, HOPE(hepes-glutamic acid buffer-mediated organic solvent protection effect)-, 또는 Bouin 용액-고정 물질일 수 있다. 샘플은 포르말린-고정 및 파라핀 포매(FFPE) 물질일 수 있다. "샘플"은 또한 '입력 폴리뉴클레오타이드(input polynucleotide)', 즉 폴리뉴클레오타이드를 포함하는 원료 물질로부터 유래되었을 수 있는, 폴리뉴클레오타이드를 의미할 수 있으며, 이는 본 명세서에 기재된 방법의 첫 번째 변성시키는 단계에 직접 입력된다.
샘플은 임의의 양 또는 품질의 폴리뉴클레오타이드를 포함할 수 있다. 특히, 샘플은 임의의 양 또는 품질의 DNA 또는 RNA를 포함할 수 있다. 샘플에는 소량(low quantity) 및/또는 낮은 품질(low quality)의 DNA 또는 RNA가 포함될 수 있다. 샘플은 약 10 μg 이하, 약 5 μg 이하, 약 1 μg 이하, 약 500 ng 이하, 약 200 ng 이하, 약 100 ng 이하, 약 50 ng 이하, 약 10 ng 이하, 약 5 ng 이하 또는 약 1 ng 이하의 DNA 또는 RNA를 포함할 수 있다. 바람직하긴 하지만, 샘플은 약 0.1 ng 내지 약 100 ng, 약 0.5 ng 내지 약 20 ng, 약 2 ng 내지 약 10 ng의 DNA를 포함한다. 샘플은 약 1 μg 이하, 바람직하게는 약 200 ng 이하, 가장 바람직하게는 약 2 ng 내지 약 10 ng의 DNA 또는 RNA를 포함할 수 있다. DNA 또는 RNA의 상당 부분이 단편화된, 손상된 및/또는 단일-가닥의 형태일 수 있다.
본 명세서의 방법에서 사용된 폴리뉴클레오타이드의 품질은 당업계에 공지된 어느 방법을 사용하여 결정될 수 있다. 예를 들어, DNA를 포함하는 샘플은 아가로오스 겔 상에서 실행될 수 있으며, 따라서 샘플에서 DNA의 품질을 결정하기 위해 임의의 적절한 방법 또는 기기를 사용하여 샘플 내에 포함된 DNA를 시각화할 수 있다. 시각화(visualisation)는 샘플에서 DNA를 사전에 증폭하거나 또는 증폭하지 않고 수행될 수 있다.
DNA를 포함하는 샘플은 샘플에서 DNA의 품질을 결정하기 위해 예를 들어, NanoDrop(Thermo Fisher Scientific), TapeStation(Agilent) 또는 Bioanalyzer(Agilent)로 시각화되고/시각화되거나 검출될 수 있다. DNA 품질은 당업계에 잘 공지된 멀티플렉스 PCR-기반 분석을 사용하여 추정될 수 있다. 멀티플렉스 PCR-기반 분석 후, DNA의 시각화 및/또는 검출은, 당업계에 공지된 방법 또는 기기, 예를 들어, DNA 샘플을 아가로오스 겔 전기 영동에 적용하거나, 또는 DNA 샘플을 NanoDrop(Thermo Fisher Scientific), TapeStation(Agilent) 또는 Bioanalyzer(Agilent)에 적용함으로써 수행될 수 있다. 선택적으로 멀티플렉스 PCR-기반 분석되는, 사전에 증폭하거나 또는 증폭하지 않은, 낮은 품질 DNA 샘플은, DNA 샘플이 당업계에 공지된 임의의 적합한 방법에 의해 분석되는 경우 검출 가능한 및/또는 가시적인 PCR 산물을 나타내지 않을 것이다. 숙련된 사용자는 이러한 예시적인 DNA 품질 평가 기기의 출력(output) 데이터를 이해할 것이고 샘플에서 DNA의 품질, 특히 샘플에서 DNA의 상당 부분이 단편화되고, 손상되고 및/또는 단일 가닥 형태인지 여부를 결정할 수 있을 것이다.
본 발명에 따라 사용되는 샘플 내에 포함된 폴리뉴클레오타이드는 단편화되고, 손상되고 및/또는 단일 가닥인 형태일 수 있다. 샘플에서 상당한 비율의 폴리뉴클레오타이드는 단편화되고, 손상되고, 및/또는 단일 가닥 형태일 수 있다.
본 명세서에 기재된 어느 방법에서, 상기 방법에 따른 활용을 위한 샘플은 소량의 폴리뉴클레오타이드 및/또는 낮은 품질의 폴리뉴클레오타이드를 포함할 수 있으며, 선택적으로 상기 샘플은 약 1 μg 이하, 바람직하게는 약 200 ng 이하, 가장 바람직하게는 약 2 ng 내지 약 10 ng의 폴리뉴클레오타이드를 포함하고, 및/또는 상당한 비율의 폴리뉴클레오타이드는 단편화되고, 손상되고 및/또는 단일 가닥 형태이다. 상기 폴리뉴클레오타이드는 RNA 또는 DNA일 수 있다.
본 명세서에 기재된 방법은 다음을 추가적으로 포함할 수 있다:
a. 샘플로부터 폴리뉴클레오타이드를 변성시켜 단일-가닥 폴리뉴클레오타이드를 생산하는 단계;
b. 상기 단계 a.의 단일 가닥 폴리뉴클레오타이드에 첫 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열 및 프라이머 서열을 포함하는 첫 번째 단일-가닥 올리고뉴클레오타이드와 함께 단계 a.로부터의 단일 가닥 폴리뉴클레오타이드를 인큐베이션하는 단계, 및 그 후 상기 프라이머 서열을 중합효소로 신장하여 이중-가닥 폴리뉴클레오타이드를 생산하는 단계;
c. 상기 단계 b.의 이중-가닥 폴리뉴클레오타이드를 변성시켜 단일 가닥 폴리뉴클레오타이드를 생산하는 단계;
d. 상기 단계 c.의 단일 가닥 폴리뉴클레오타이드에 두 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열 및 프라이머 서열을 포함하는 두 번째 단일-가닥 올리고뉴클레오타이드와 함께 상기 단계 c.로부터의 단일 가닥 폴리뉴클레오타이드를 인큐베이션하는 단계, 및 그 후 상기 프라이머 서열을 중합효소로 신장하여 이중-가닥 폴리뉴클레오타이드를 생산하는 단계.
본 명세서에 기재된 어느 방법에서, "변성(denaturing)"은 폴리뉴클레오타이드 내의 뉴클레오타이드 사이에 존재하는 수소 결합을 파괴함으로써 단일 가닥 폴리뉴클레오타이드를 생산하는 단계일 수 있다. 본 발명의 방법에 적용되는 샘플에 존재하는 폴리뉴클레오타이드는 단일 가닥 폴리뉴클레오타이드를 생산하도록 변성될 수 있다. 예를 들어, 폴리뉴클레오타이드가 DNA인 경우, DNA는 사용자가 적절하다고 간주하는 방식으로 변성될 수 있다. 변성은 사용자가 적절하다고 간주하는 임의의 기간 동안 화학적 또는 열 처리로 수행될 수 있다. DNA는 당업계에 공지된 임의의 알칼리 변성 방법을 사용하여, 예를 들어, DNA에 수산화나트륨(NaOH) 또는 수산화칼륨(KOH), 고염(high salt) 조건, 또는 요소(urea) 처리를 가함으로써, 변성될 수 있다. 바람직하게는, DNA에 열 처리를 가하여 DNA를 변성시킨다. 바람직하게는 열 처리는 짧다. 보다 더 바람직하게는, 열 처리는 95℃에서 1분 동안이다.
본 명세서에 기재된 어느 방법에서, 단일-가닥 폴리뉴클레오타이드에 첫 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열 및 프라이머 서열을 포함하는 첫 번째 단일-가닥 올리고뉴클레오타이드와 함께 단일 가닥 폴리뉴클레오타이드는 인큐베이션될 수 있다. 시퀀싱 어댑터 서열은 첫 번째 단일-가닥 올리고뉴클레오타이드 내의 프라이머 서열에 대해 5' 또는 프라이머 서열에 대해 3'에 있을 수 있다. 바람직하게는, 시퀀싱 어댑터 서열은 첫 번째 단일-가닥 올리고뉴클레오타이드 내의 프라이머 서열에 대해 5' 방향에 있다. 본 명세서에 기재된 방법에 사용하기에 적합한 프라이머 서열은 하나 이상의 표적에 특이적인 서열, 랜덤 서열, 부분적 랜덤 서열, 및 이들의 조합을 포함할 수 있다. 이 문맥에서 "특이적인(specific)"은 종래의 왓슨-크릭 염기-쌍을 의미한다. 따라서, 서열 5'-ACGA-3'의 첫 번째 단일-가닥 올리고뉴클레오타이드는 서열 5'-TCGT-3'의 단일 가닥 폴리뉴클레오타이드에 혼성화될 수 있고, 단일-가닥 올리고뉴클레오타이드의 G는 단일 가닥 폴리뉴클레오타이드의 C 반대편에 위치할 것이며, 이와 함께 수소 결합할 것이다. 이 원칙은 보편적인 뉴클레오타이드를 포함하는 올리고뉴클레오타이드를 포함하여, 본 명세서에 개시된 임의의 상보적인 올리고뉴클레오타이드 관계에 적용된다.
DNA 및 RNA와 같은 폴리뉴클레오타이드에 대한 프라이머 서열의 어닐링, 즉 상보적 뉴클레오타이드 서열에 대한 뉴클레오타이드 서열의 혼성화에 적합한 반응 조건은 당업계에 공지되어 있다. 프라이머 서열의 뉴클레오타이드 조성은 샘플 내에 포함된 폴리뉴클레오타이드 내의 관심 영역에 특이적이거나, 또는 랜덤일 수 있다. 올리고뉴클레오타이드 조성물의 랜덤 특성은 샘플에서 단일 가닥 폴리뉴클레오타이드의 랜덤 프라이밍(priming)을 유도한다. 첫 번째 단일-가닥 올리고뉴클레오타이드의 랜덤 프라이밍은 샘플의 단일 가닥 폴리뉴클레오타이드 전체에 걸쳐 랜덤 유전자좌(loci)에서 중합효소-매개 확장을 가능하게 한다. "신장(extension)" 단계를 포함하는 본 명세서에 기재된 방법의 임의의 단계에서, 랜덤으로 프라이밍된 첫 번째 단일-가닥 올리고뉴클레오타이드로부터의 신장은 중합효소의 사용을 통해 매개될 수 있다.
본 명세서에 기재된 어느 방법에서, 폴리뉴클레오타이드는 RNA일 수 있고 프라이밍된 첫 번째 단일-가닥 올리고뉴클레오타이드로부터의 신장을 위해 사용되는 중합효소는 역전사효소일 수 있다. 역전사효소는 RNA 폴리뉴클레오타이드에 상보적인 DNA 가닥(cDNA)을 생산한다. 많은 역전사효소가 당업계에 공지되어 있으며, 사용자는 적절하다고 간주하는 임의의 역전사효소를 사용할 수 있다.
본 명세서에 기재된 어느 방법에서, 샘플에 포함된 폴리뉴클레오타이드는 DNA일 수 있고 중합효소는 DNA-매개 DNA 중합효소(DNA-directed DNA polymerase)일 수 있다. 많은 DNA-매개 DNA 중합효소가 당업계에 공지되어 있으며, 사용자는 그들이 적절하다고 간주하는 임의의 DNA-매개 DNA 중합효소를 사용할 수 있다. 사용된 DNA-매개 DNA 중합효소는, 예를 들어, 클레나우 중합효소(Klenow polymerase), 벤트 중합효소(Vent polymerase), 딥 벤트 중합효소(Deep Vent polymerase), DNA 중합효소 I 또는 T4 DNA 중합효소일 수 있다. 바람직하게는, 클레나우, 벤트 및 딥 벤트 중합효소는 이들의 핵산외부가수분해효소(exonuclease) 활성을 유지한다. ssDNA에 프라이밍된 첫 번째 단일-가닥 올리고뉴클레오타이드는 신장되어 샘플에서 ssDNA에 상보적인, DNA 또는 RNA, 바람직하게는 DNA를 포함하는 폴리뉴클레오타이드 분자를 합성할 수 있다. 본 명세서에 기재된 신장 단계에서, DNA-매개 DNA 중합효소에 의해 새롭게 합성된 폴리뉴클레오타이드 내로 삽입된 뉴클레오타이드는 데옥시뉴클레오타이드 삼인산(deoxynucleotide triphosphate, dNTP), 예컨대, dATP, dTTP, dCTP 또는 dGTP, 또는 변형된 dNTP, 예컨대 변형된 dATP, 변형된 dTTP, 변형된 dCTP, 변형된 dGTP 및/또는 보편적인 뉴클레오타이드일 수 있다. 이들 뉴클레오타이드 중 어느 하나 이상은 DNA-매개 DNA 중합효소와의 반응 혼합물 내에 포함될 수 있다. DNA-매개 DNA 중합효소 반응 혼합물의 다른 잠재적인 성분은 당업계에 잘 공지되어 있다. 첫 번째 이중-가닥 DNA(dsDNA)는 본 명세서에 기재된 발명에 따라 ssDNA에 어닐링된 프라이머 서열을 연장함으로써 생산될 수 있다.
본 명세서에 기재된 방법에 따른 프라이밍 및 신장은 샘플에서 잠재적으로 손상된 폴리뉴클레오타이드의 무결성(integrity)을 유지한다는 사실에 의해 기존 방법에 비해 이점이 있다. 다른 방법에는 시퀀싱 어댑터 서열을 삽입하기 전에 단편화 단계가 필요하다. 초음파 처리와 같은 단편화 방법은 폴리뉴클레오타이드의 무결성을 잠재적으로 손상시키는 것으로 공지되어 있다. FFPE-처리 조직(tissue)로부터 추출된 폴리뉴클레오타이드는 보통 이미 손상되고, 단편화되고, 및 단일-가닥이므로, 프라이밍 및 신장은 샘플에서 잠재적으로 손상된 폴리뉴클레오타이드의 무결성을 유지한다.
본 발명의 첫 번째 단일-가닥 올리고뉴클레오타이드 내에 포함된 시퀀싱 어댑터는 당업계에 공지된 임의의 올리고뉴클레오타이드 시퀀싱 어댑터를 포함할 수 있다. 예시적인 시퀀싱 어댑터는 Illumina® 시퀀싱 플랫폼과 함께 사용될 수 있는 Illumina® 시퀀싱 어댑터이다. Illumina 시퀀싱 어댑터는 Illumina 시퀀싱 플로우 셀(flow cell)을 코팅하는 서열에 상보적이도록 설계되므로, 샘플 폴리뉴클레오타이드의 플로우 셀로의 부착 및 샘플에서 폴리뉴클레오타이드 서열의 합성 및 결정에 의한 시퀀싱의 구현을 가능하게 한다.
본 명세서에 기재된 어느 방법에서, 첫 번째 단일 가닥 폴리뉴클레오타이드를 변성시켜 두 번째 단일 가닥 폴리뉴클레오타이드를 생성할 수 있다. 첫 번째 이중 가닥 폴리뉴클레오타이드는 사용자가 적절하다고 간주하는 방식으로 변성될 수 있다. 예를 들어, 변성은 사용자가 적절하다고 간주하는 임의의 기간 동안 화학적 또는 열 처리로 수행될 수 있다. 예를 들어, 변성은 사용자가 적절하다고 간주하는 임의의 기간 동안 화학적 또는 열 처리로 수행될 수 있다. 첫 번째 이중 가닥 폴리뉴클레오타이드는 당업계에 공지된 임의의 알칼리 변성 방법을 사용하여, 예를 들어, 첫 번째 이중 가닥 폴리뉴클레오타이드에 수산화나트륨(NaOH) 또는 수산화칼륨(KOH), 고염 조건, 또는 요소 처리를 가함으로써 변성될 수 있다. 바람직하게는, 첫 번째 이중 가닥 폴리뉴클레오타이드는 첫 번째 이중 가닥 폴리뉴클레오타이드에 열 처리를 가함으로써 변성된다. 바람직하게는 열 처리는 짧다. 보다 더 바람직하게는, 열 처리는 95℃에서 1분 동안이다.
본 명세서에 기재된 어느 방법에서, 두 번째 단일-가닥 폴리뉴클레오타이드에 두 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열 및 랜덤 프라이머 서열을 포함하는 두 번째 단일-가닥 올리고뉴클레오타이드와 함께 두 번째 단일-가닥 폴리뉴클레오타이드는 인큐베이션될 수 있다. 시퀀싱 어댑터 서열은 두 번째 단일-가닥 올리고뉴클레오타이드 내의 프라이머 서열에 대해 5' 또는 프라이머 서열에 대해 3'에 있을 수 있다. 바람직하게는, 시퀀싱 어댑터 서열은 두 번째 단일-가닥 올리고뉴클레오타이드 내의 프라이머 서열에 대해 5' 방향에 있다. 본 명세서에 기재된 방법에서 사용하기에 적합한 프라이머 서열은 하나 이상의 표적에 특이적인 서열, 랜덤 서열, 부분적 랜덤 서열, 및 이들의 조합을 포함할 수 있다. 이 문맥에서 "특이적인(specific)"은 종래의 왓슨-크릭 염기-쌍을 의미한다. 따라서, 서열 5'-ACGA-3'의 두 번째 단일-가닥 올리고뉴클레오타이드는 서열 5'-TCGT-3'의 ssDNA에 혼성화될 수 있고, 단일-가닥 올리고뉴클레오타이드의 G는 두 번째 단일-가닥 폴리뉴클레오타이드의 C 반대편에 위치할 것이며, 이와 수소 결합될 것이다. 이 원칙은 보편적인 뉴클레오타이드를 포함하는 올리고뉴클레오타이드를 포함하여, 본 명세서에 개시된 임의의 상보적인 올리고뉴클레오타이드 관계에 적용된다.
폴리뉴클레오타이드에 대한 프라이머 서열의 어닐링, 즉 상보적 뉴클레오타이드 서열에 대한 뉴클레오타이드 서열의 혼성화에 적합한 반응 조건은 당업계에 공지되어 있다. 프라이머 서열의 뉴클레오타이드 조성은 샘플 내에 포함된 폴리뉴클레오타이드 내의 관심 영역에 특이적이거나 또는 랜덤일 수 있다. 프라이머 서열의 조성은 바람직하게는 랜덤이다. 올리고뉴클레오타이드 조성물의 랜덤 특성은 샘플에서 두 번째 단일 가닥 올리고뉴클레오타이드의 랜덤 프라이밍을 유도한다. 두 번째 단일-가닥 올리고뉴클레오타이드의 랜덤 프라이밍은 샘플에서 두 번째 단일 가닥 올리고뉴클레오타이드 전체에 걸쳐 랜덤 유전자좌에서 중합효소-매개 신장을 가능하게 한다. "신장" 단계를 포함하는 본 명세서에 기재된 방법의 임의의 단계에서, 랜덤으로 프라이밍된 두 번째 단일-가닥 올리고뉴클레오타이드로부터의 신장은 중합효소의 사용을 통해 매개될 수 있다.
본 명세서에 기재된 어느 방법에서, 두 번째 단일-가닥 폴리뉴클레오타이드는 DNA일 수 있고 중합효소는 DNA-매개 DNA 중합효소일 수 있다. 많은 DNA-매개 DNA 중합효소는 당업계에 공지되어 있으며, 사용자는 그들이 적절하다고 간주하는 임의의 DNA-매개 DNA 중합효소를 사용할 수 있다. 사용된 DNA-매개 DNA 중합효소는, 예를 들어 클레나우 중합효소, 벤트 중합효소, 딥 벤트 중합효소, DNA 중합효소 I 또는 T4 DNA 중합효소일 수 있다. 바람직하게는, 클레나우, 벤트 및 딥 벤트 중합효소는 이들의 핵산외부가수분해효소 활성을 유지한다. 두 번째 ssDNA에 프라이밍된 두 번째 단일-가닥 올리고뉴클레오타이드는 연장되어 샘플에서 두 번째 ssDNA에 상보적인, DNA 또는 RNA, 바람직하게는 DNA를 포함하는 폴리뉴클레오타이드 분자를 합성할 수 있다. 본 명세서에 기재된 신장 단계에서, DNA-매개 DNA 중합효소에 의해 새롭게 합성된 폴리뉴클레오타이드 내로 삽입된 뉴클레오타이드는 데옥시뉴클레오타이드 삼인산(dNTP), 예컨대, dATP, dTTP, dCTP 또는 dGTP, 또는 변형된 dNTP, 예컨대, 변형된 dATP, 변형된 dTTP, 변형된 dCTP, 변형된 dGTP 및/또는 보편적인 뉴클레오타이드일 수 있다. 이들 뉴클레오타이드 중 임의의 하나 이상은 DNA-매개 DNA 중합효소와 함께 반응 혼합물 내에 포함될 수 있다. DNA-매개 DNA 중합효소 반응 혼합물의 다른 잠재적인 성분은 당업계에 잘 공지되어 있다. 두 번째 dsDNA는 본 명세서에 기재된 본 발명에 따른 두 번째 ssDNA에 어닐링된 프라이머 서열을 신장함으로써 생산될 수 있다.
본 명세서에 기재된 방법에 따른 랜덤 프라이밍 및 신장은 샘플에서 잠재적으로 손상된 폴리뉴클레오타이드의 무결성을 유지한다는 사실에 의해 기존의 방법에 비해 이점이 있다. 다른 방법에는 시퀀싱 어댑터 서열을 삽입하기 전에 단편화 단계가 필요하다. 초음파 처리와 같은 단편화 방법은 폴리뉴클레오타이드의 무결성을 잠재적으로 손상시키는 것으로 공지되어 있다. FFPE-처리 조직(tissue)에서 추출된 폴리뉴클레오타이드는 보통 이미 손상되고, 단편화되고, 단일-가닥이므로, 랜덤 프라이밍 및 신장은 샘플에서 잠재적으로 손상된 폴리뉴클레오타이드의 무결성을 유지한다.
본 발명의 두 번째 단일-가닥 올리고뉴클레오타이드 내에 포함된 시퀀싱 어댑터는 당업계에 공지된 임의의 올리고뉴클레오타이드 시퀀싱 어댑터를 포함할 수 있다. 예시적인 시퀀싱 어댑터는 Illumina® 시퀀싱 플랫폼과 함께 사용될 수 있는 Illumina® 시퀀싱 어댑터이다. Illumina 시퀀싱 어댑터는 Illumina 시퀀싱 플로우 셀을 코팅하는 서열에 상보적이도록 설계되므로, 샘플 폴리뉴클레오타이드의 플로우 셀으로의 부착 및 샘플에서 폴리뉴클레오타이드 서열의 합성 및 결정에 의한 시퀀싱의 구현을 가능하게 한다.
본 명세서에 기재된 어느 방법에서, 첫 번째 단일-가닥 올리고뉴클레오타이드에서 프라이머 서열 및/또는 두 번째 단일-가닥 올리고뉴클레오타이드에서 프라이머는 다음과 같다:
i. 선택적으로 랜덤 노나머 올리고뉴클레오타이드 서열을 포함하는, 랜덤 프라이머 서열; 또는
ii. 선택적으로 20mer 올리고뉴클레오타이드 서열을 포함하는, 폴리뉴클레오타이드에서 관심 영역에 특이적인 프라이머 서열.
본 명세서에 기재된 어느 방법에서, 본 발명의 첫 번째 단일-가닥 올리고뉴클레오타이드의 프라이머 서열은 폴리뉴클레오타이드에서 관심 영역에 특이적인 프라이머 서열이며, 이는 선택적으로 20mer 올리고뉴클레오타이드 서열을 포함하고, 본 발명의 두 번째 단일-가닥 올리고뉴클레오타이드에서 프라이머 서열은 바람직하게는 랜덤 프라이머 서열이고, 이는 선택적으로 랜덤 노나머(nonamer) 올리고뉴클레오타이드 서열을 포함한다.
본 명세서에 기재된 어느 방법에서, 본 발명의 첫 번째 단일-가닥 올리고뉴클레오타이드에서 프라이머는 폴리뉴클레오타이드의 관심 영역에 특이적인 프라이머 서열이고, 및 본 발명의 두 번째 단일-가닥 올리고뉴클레오타이드에서 프라이머는 랜덤 프라이머 서열이며, 두 번째 단일 가닥 올리고뉴클레오타이드 내에 포함된 시퀀싱 어댑터 서열은 바람직하게는 임의의 적합한 시퀀싱 장치 상에서의 시퀀싱이 상기 시퀀싱 어댑터 서열을 포함하는 이중 가닥 폴리뉴클레오타이드의 말단에서 시작하는 것을 결정한다. 이는 랜덤으로 프라이밍되고 신장된 부위(site)로부터 시작하는 시퀀싱이 첫 번째 시퀀싱 사이클(cycle) 동안 높은 수준의 서열 다양성을 유지함으로써, 낮은 시퀀싱 수율(yield) 또는 낮은 데이터 품질의 위험을 감소시키기 때문에 특히 유리하다. 본 명세서에 기재된 바와 같이, 임의의 적합한 시퀀싱 기술을 이용하여 DNA의 서열을 결정할 수 있다.
본 명세서에 기재된 어느 방법에서, 첫 번째 단일-가닥 올리고뉴클레오타이드의 프라이머 서열 및/또는 두 번째 단일-가닥 올리고뉴클레오타이드의 프라이머 서열은 폴리뉴클레오타이드의 관심 영역에 특이적인 프라이머 서열이고, 복수(plurality)의 첫 번째 및/또는 두 번째 단일 가닥 올리고뉴클레오타이드는 관심 영역의 커버리지(coverage)를 최대화하기 위해 사용될 수 있다. 바람직하게는, 복수의 첫 번째 및/또는 두 번째 단일 가닥 올리고뉴클레오타이드는 관심 영역의 1 kb 당 약 5개의 올리고뉴클레오타이드, 보다 바람직하게는 관심 영역의 1 kb 당 약 10개의 올리고뉴클레오타이드, 보다 더 바람직하게는 관심 영역의 1 kb 당 약 15개의 올리고뉴클레오타이드를 포함한다. 가장 바람직하게는, 복수의 첫 번째 및/또는 두 번째 단일 가닥 올리고뉴클레오타이드는 관심 영역에 걸쳐 대략 균일하게 이격되어 있다.
본 명세서에 기재된 어느 방법에서, 첫 번째 및/또는 두 번째 단일-가닥 올리고뉴클레오타이드의 시퀀싱 어댑터 서열은 다음 중 하나 이상을 포함할 수 있다:
- 시퀀싱 프라이머 서열에 상보적인 서열;
- 증폭 프라이머 서열에 상보적인 서열;
- 바코드 또는 인덱스 서열; 및/또는
- 고체 표면에 부착을 용이하게 하는 서열, 선택적으로 상기 서열은 상기 표면에 부착된 올리고뉴클레오타이드에 상보적이다.
본 명세서에 사용된 "시퀀싱 프라이머 서열에 상보적인 서열(sequence complementary to sequencing primer sequence)"은 공지된 프라이머 서열에 상보적일 수 있는 올리고뉴클레오타이드 서열일 수 있으며, 따라서 표적화 시퀀싱 생어 시퀀싱, 또는 임의의 다른 시퀀싱 기술, 예를 들어, 고-깊이 고-처리량 시퀀싱(high-depth high-throughput sequencing)을 가능하게 한다. "시퀀싱 프라이머 서열에 상보적인 서열"은 또한 Illumina 플로우 셀을 코팅하고 있는 시퀀싱 어댑터 서열의 것과 상보적인 서열이 됨으로써, 본 명세서에 기재된 방법의 첫 번째 및/또는 두 번째 단일-가닥 올리고뉴클레오타이드 내의 시퀀싱 어댑터 서열과 동일한 기능을 수행할 수 있고, 따라서 샘플 폴리뉴클레오타이드의 플로우 셀로의 부착과 샘플에서 폴리뉴클레오타이드 서열의 합성 및 결정에 의한 시퀀싱의 구현을 가능하게 한다. 본 명세서에 기재된 방법에 사용된 "증폭 프라이머 서열에 상보적인 서열(sequence complementary to an amplification primer sequence)"은 특히 시퀀싱 전에 샘플 폴리뉴클레오타이드의 전부, 또는 표적 영역을 증폭하는 데 사용될 수 있다. 샘플 폴리뉴클레오타이드의 전부, 또는 표적 영역의 증폭은 본 명세서에 기재된 본 발명의 방법에서 소량의 입력 폴리뉴클레오타이드에 특히 유용하고 효과적일 수 있다. 본 명세서에 기재된 방법에서, "바코드 서열(barcode sequence)" 및 "인덱스 서열(index sequence)"은 상호교환적으로 사용될 수 있다. "인덱스 서열"은 또한 첫 번째 및/또는 두 번째 단일 가닥 올리고뉴클레오타이드 내의 증폭 프라이머 서열에 상보적인 서열과 동일한 기능을 수행할 수 있다. 바람직하게는, "인덱스 서열"은 바람직하게는 샘플 및/또는 폴리뉴클레오타이드 시퀀싱 라이브러리를 멀티플렉스(multiplex)하는 데에 사용될 수 있다. 샘플 및/또는 폴리뉴클레오타이드 시퀀싱 라이브러리를 인덱싱하면 다수의 샘플 및/또는 라이브러리를 풀링(pooling)하고 함께 시퀀싱할 수 있다. 인덱싱은 "싱글(single)" 또는 "듀얼(dual)" 인덱싱 방식으로 적용될 수 있으며, 이러한 인덱싱 기술을 위한 방법은 당업계에 잘 공지되어 있다. 본 명세서에 기재된 본 발명의 방법은 라이브러리 준비 및 시퀀싱 모두의 대규모 멀티플렉싱(multiplexing)에 적합하다. 본 명세서에 기재된 방법의 첫 번째 및/또는 두 번째 단일-가닥 올리고뉴클레오타이드는, 이들 서열에 제한되지 않으며, 첫 번째 및/또는 두 번째 단일-가닥 올리고뉴클레오타이드 내에서 이들 서열의 임의의 특정 방향에 제한되지 않고, 다음 서열 중 어느 하나, 또는 복수를 포함할 수 있다:
- 시퀀싱 어댑터 시퀀스
- 프라이머 서열
- 증폭 프라이머 서열에 상보적인 서열
- 바코드 또는 인덱스 서열 및/또는
- 고체 표면에 부착을 용이하게 하는 서열, 선택적으로 상기 서열은 상기 표면에 부착된 올리고뉴클레오타이드에 상보적이다.
본 명세서에 기재된 본 발명의 방법에서, 신장 단계는, 즉 시퀀싱 어댑터 및 프라이머 서열을 포함하는 첫 번째 또는 두 번째 단일 가닥 올리고뉴클레오타이드를 단일 가닥 폴리뉴클레오타이드에 어닐링한 후, 중합효소의 최적 작동 온도까지 온도를 천천히 증가시키는 단계 및 신장이 실질적으로 완료될 때까지 상기 최적 작동 온도를 유지하는 단계 전에, 약 4℃에서 적합한 반응 혼합물과 함께 중합효소를 인큐베이션함으로써 실시될 수 있다. 본 명세서에 기재된 어느 방법에서, 폴리뉴클레오타이드는 DNA일 수 있고 중합효소는 DNA-매개 중합효소일 수 있다. 본 명세서에 기재된 어느 방법에서, 폴리뉴클레오타이드는 RNA일 수 있고 프라이밍된 첫 번째 단일-가닥 올리고뉴클레오타이드로부터의 신장을 위해 사용되는 중합효소는 역전사효소일 수 있다.
신장 반응은 먼저 4℃에서 적어도 약 1분, 적어도 약 2분, 적어도 약 3분, 적어도 약 4분, 적어도 약 5분, 적어도 약 6분, 적어도 약 7분, 적어도 약 8분, 적어도 약 9분, 또는 적어도 약 10분 동안 인큐베이션될 수 있다. 바람직하게는, 신장 반응은 먼저 약 5분 동안 4℃에서 인큐베이션된다. 본 명세서에 기재된 방법의 이 단계에서, 온도는 신장이 실질적으로 완료될 때까지 상기 최적 작동 온도에서 유지하는 단계 전에 DNA-매개 DNA 중합효소의 최적 온도까지 천천히 증가된다. 느린 램핑 속도(ramping rate)(4℃에서 중합효소의 최적 온도까지의 온도 증가 속도)가 본 명세서에 기재된 방법에서 바람직하다. 램핑 속도는 약 1℃/분 이하, 약 2℃/분 이하, 약 3℃/분 이하, 약 4℃/분 이하, 약 5℃/분 이하, 약 6℃/분 이하, 약 7℃/분 이하, 약 8℃/분 이하, 약 9℃/분 이하, 약 10℃/분 이하, 약 20℃/분 이하, 약 30℃/분 이하, 약 40℃/분 이하, 약 50℃/분 이하 또는 약 100℃/분 이하일 수 있다. 사용된 특정 중합효소의 최적 작동 온도는 사용된 중합효소에 따라 상이하다. 예를 들어, 많은 DNA-매개 DNA 중합효소가 당업계에 공지되어 있고, 사용자는 그들이 적절하다고 간주하는 임의의 DNA-매개 DNA 중합효소를 사용할 수 있다. 사용된 DNA-매개 DNA 중합효소는, 예를 들어, 클레나우 중합효소, 벤트 중합효소, 딥 벤트 중합효소, DNA 중합효소 I 또는 T4 DNA 중합효소일 수 있다. 바람직하게는, 클레나우, 벤트 및 딥 벤트 중합효소는 핵산외부가수분해효소 활성을 유지한다. 바람직하게는, DNA-매개 DNA 중합효소의 최적 작동 온도는 약 37℃이고 온도는 약 4℃/분 이하의 속도로 이 온도까지 증가된다. 바람직하게는, DNA-매개 DNA 중합효소는 클레나우 중합효소이다.
본 명세서에 기재된 어느 방법에서, 샘플에서 두 번째 이중-가닥 폴리뉴클레오타이드의 카피(copy)를 생산하기 위해 두 번째 이중-가닥 폴리뉴클레오타이드가 증폭될 수 있다. 증폭 단계에는 중합효소 연쇄 반응(polymerase chain reaction, PCR)이 포함될 수 있다. 증폭 단계는 본 명세서에 기재된 본 발명의 방법에서 이중-가닥 폴리뉴클레오타이드에 도입된 시퀀싱 어댑터 서열의 적어도 일부에 상보적인 프라이머 서열의 사용을 포함할 수 있다. 예를 들어, Illumina® 시퀀싱 어댑터가 본 명세서에 기재된 본 발명의 방법에 사용되는 경우, Illumina® 어댑터 서열의 적어도 일부에 대해 상보적인 뉴클레오타이드 서열을 포함하는 프라이머 서열이 PCR 반응에 사용될 수 있다. PCR은 당업계에 공지된 조건 및 프라이머 서열의 효율적인 어닐링에 적합한 온도에서 수행될 수 있다. PCR은 GC 편향(bias)을 감소시키고 샘플에서 DNA 카피에 오류가 삽입되는 것을 방지하도록 최적화될 수 있다. 두 번째 dsDNA는 40 사이클 이하를 사용하여 PCR에 의해 증폭될 수 있다. 두 번째 dsDNA는 30 사이클 이하를 사용하여 PCR에 의해 증폭될 수 있다. 두 번째 dsDNA는 20 사이클 이하를 사용하여 PCR에 의해 증폭될 수 있다. 두 번째 dsDNA는 10 사이클 이하를 사용하여 PCR에 의해 증폭될 수 있다. 두 번째 dsDNA는 5 사이클 이하를 사용하여 PCR에 의해 증폭될 수 있다. 두 번째 dsDNA는 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38 또는 39 사이클을 사용하여 PCR에 의해 증폭될 수 있다. 바람직하게는, 두 번째 dsDNA는 10 사이클을 사용하여 PCR에 의해 증폭된다. 다른 적합한 증폭 방법에는 LCR(ligase chain reaction), 전사 증폭(transcription amplification), 자가-유지 서열 복제(self-sustained sequence replication), 표적 폴리뉴클레오타이드 서열의 선택적 증폭, CP-PCR(consensus sequence primed polymerase chain reaction), AP-PCR(arbitrarily primed polymerase chain reaction), DOP-PCR(degenerate oligonucleotide-primed PCR) 및 NABSA(nucleic acid based sequence amplification)가 포함된다.
본 명세서에 기재된 본 발명의 방법에서, 방법의 하나 이상의 단계는 샘플로부터 폴리뉴클레오타이드의 추출을 포함할 수 있다. 본 명세서에 기재된 방법에 적용되는 샘플 내에 포함된 폴리뉴클레오타이드는 변성 전에 추출이 필요할 수 있다. 추출 방법은 폴리뉴클레오타이드가 포함된 물질에 따라 다르다. 또한, 추출 방법은 샘플 내에 포함된 폴리뉴클레오타이드의 유형, 예를 들어, DNA 또는 RNA에 따라 달라질 수 있다. 예를 들어, 모발 및 모낭, 혈액 및 다른 생체 체액, 동물 조직, 토양 및 세포로부터 DNA를 추출하는 방법은 당업계에 잘 공지되어 있다.
본 명세서에 기재된 본 발명의 방법에서, 샘플은 손상된 뉴클레오타이드 염기를 갖는 폴리뉴클레오타이드를 포함할 수 있다. 예를 들어, 뉴클레오타이드 염기는 탈아미노화(deamination), 산화(oxidation), 탈퓨린화(depurination), 탈피리미드화(depyrimidination)의 결과로 손상될 수 있다. 본 명세서에 기재된 본 발명의 방법에서, 방법의 하나 이상의 단계는 적어도 하나의 염기 절제 수선 효소(base excision repair enzyme)로 폴리뉴클레오타이드로부터 손상된 염기를 제거하는 단계를 포함할 수 있다.
염기 절제 수선 효소는 본 명세서에 기재된 방법에서 단일-가닥 폴리뉴클레오타이드 또는 이중-가닥 폴리뉴클레오타이드에 적용될 수 있다. 어떤 유형의 폴리뉴클레오타이드, 예를 들어, DNA 또는 RNA가 샘플 내에 포함되어 있는지에 따라 임의의 적합한 염기 절제 수선 효소가 사용될 수 있다. 본 명세서에 기재된 어느 방법에서, 폴리뉴클레오타이드로부터 손상된 염기를 제거하는 단계를 포함하는 방법의 단계에서 하나 이상의 염기 절제 수선 효소가 사용될 수 있다. 염기 절제 수선 단계를 포함하는 방법의 단계는 폴리뉴클레오타이드로부터 손상된 염기를 제거하는 단계 및 손상된 염기를 손상되지 않은 염기로 교체하는 단계를 포함할 수 있다. 다른 경우에, 염기 절제 수선 단계를 포함하는 방법의 단계는 손상된 염기를 손상되지 않은 염기로 교체하지 않고 폴리뉴클레오타이드로부터 손상된 염기를 제거하는 단계를 포함할 수 있다. 염기 절제 수선 효소는 당업계에 공지된 임의의 적합한 염기 절제 수선 효소일 수 있다. 단일-가닥 DNA 또는 이중-가닥 DNA에 처리하기 위한 예시적인 염기 절단 복구 효소는 APE 1, Endo III, TMA Endo III, Endo IV, Tth Endo IV, Endo V, Endo VIII, Fpg, hOGG1, hNEIL1, hNEIL2, hNEIL3, T7 Endo I, T4 PDG, UDG 및 Afu UDG, Afu UDG, SMUG1, hAAG를 포함한다. 염기 절제 수선 효소는 바람직하게는 글리코실가수분해 효소(glycosylase enzyme), 또는 보다 바람직하게는 hNEIL1, hNEIL2, hNEIL3, Fpg 또는 SMUG1 중 어느 하나 이상이다. 보다 더 바람직하게는 염기 절제 수선 효소는 SMUG1 및/또는 Fpg이다.
본 명세서에 기재된 방법은 폴리뉴클레오타이드 신장의 목적을 위해 첫 번째 또는 두 번째 단일-가닥 폴리뉴클레오타이드에 어닐링되지 않은 어느 남아 있는 단일 가닥 올리고뉴클레오타이드의 제거를 추가적으로 포함할 수 있다. 짧은 단일-가닥 폴리뉴클레오타이드 단편 또한 제거될 수 있다. "짧은(short)" 단편은 본 발명의 맥락에서 사용된 단일 가닥 올리고뉴클레오타이드보다 짧은 임의의 단일 가닥 폴리뉴클레오타이드를 의미할 수 있다. 어느 남아 있는 단일 가닥 올리고뉴클레오타이드 및/또는 짧은 단일-가닥 폴리뉴클레오타이드 단편의 제거는 당업계에 공지된 임의의 적합한 방법에 의해 수행될 수 있다. 예를 들어, 본 명세서에 기재된 방법은 핵산외부가수분해효소로 어느 남아 있는 단일 가닥 올리고뉴클레오타이드 및/또는 짧은 단일-가닥 폴리뉴클레오타이드 단편의 제거를 추가적으로 포함할 수 있다. 바람직하게는, 핵산외부가수분해효소는 3'에서 5' 활성, 또는 5'에서 3' 활성, 또는 3'에서 5' 활성 및 5'에서 3' 활성 모두를 갖는 핵산가수분해효소이다. 예시적인 핵산외부가수분해효소에는 람다(Lamda) 핵산외부가수분해효소, RecJ, 핵산외부가수분해효소 II, 핵산외부가수분해효소 I, 열불안정성(Thermolabile) 핵산외부가수분해효소 I, 핵산외부가수분해효소 T, 핵산외부가수분해효소 V (RecBCD), 절단된(truncated) 핵산외부가수분해효소 VIII, 핵산외부가수분해효소 VII, 핵산가수분해효소 BAL-31, T5 핵산가수분해효소, T7 핵산가수분해효소를 포함한다. 바람직하게는, 핵산가수분해효소는 3'에서 5' 활성으로 당업계에 공지된 임의의 핵산가수분해효소이다. 보다 더 바람직하게는, 핵산외부가수분해효소는 핵산외부가수분해효소 I(NEB)이다.
바람직하게는, 어느 남아 있는 단일 가닥 올리고뉴클레오타이드 및/또는 짧은 단일-가닥 폴리뉴클레오타이드 단편의 제거 단계는 첫 번째 이중-가닥 폴리뉴클레오타이드를 생성하는 단계 후 및 첫 번째 이중-가닥 폴리뉴클레오타이드를 변성시키는 단계 전에 본 발명의 방법에 적용된다. 대안적으로, 첫 번째 이중-가닥 폴리뉴클레오타이드는 첫 번째 dsDNA를 생산하는 단계 후 및 첫 번째 이중-가닥 폴리뉴클레오타이드를 변성시키는 단계 전에 정제될 수 있다. 추가로 대안적으로, 첫 번째 이중 -가닥 폴리뉴클레오타이드를 생성하는 단계 후 및 첫 번째 이중-가닥 폴리뉴클레오타이드를 변성시키는 단계 전에, 어느 남아 있는 단일 가닥 올리고뉴클레오타이드 및/또는 짧은 ssDNA 단편을 제거하는 단계는 본 발명의 방법에 적용되고, 첫 번째 이중-가닥 폴리뉴클레오타이드는 정제될 수 있다. 바람직하게는, 두 번째 이중-가닥 폴리뉴클레오타이드는 두 번째 이중-가닥 폴리뉴클레오타이드를 생산하는 단계 후에 정제될 수 있다.
본 명세서에 기재된 방법에서, 이중-가닥 폴리뉴클레오타이드를 정제하는 단계를 포함하는 단계는 이중-가닥 폴리뉴클레오타이드를 정제하는 데에 적합한 당업계에 공지된 어느 방법에 의해 수행될 수 있다. 샘플에 포함된 폴리뉴클레오타이드의 유형에 따라 상이한 공지된 폴리뉴클레오타이드 정제 방법이 더 적합할 수 있다. DNA를 정제하기 위한 예시적인 방법은 에탄올 침전 또는 페놀-클로로포름 침전과 같은 유기 추출 방법, Chelex 추출 정제 및 고체상 정제, 및 당업계에 공지된 임의의 DNA 정제 키트를 포함한다. 바람직하게는, 본 명세서에 기재된 방법에 사용되는 정제 단계는 SPRI(solid phase reversible immobilization) 비드를 사용한다.
첫 번째 단일 가닥 올리고뉴클레오타이드의 프라이머가 폴리뉴클레오타이드 내의 관심 영역에 특이적인 프라이머 서열인, 본 명세서에 기재된 본 발명의 방법에서, 첫 번째 단일 가닥 올리고뉴클레오타이드를 단일 폴리뉴클레오타이드에 어닐링한 후 및 이중-가닥 폴리뉴클레오타이드를 생산하기 위해 중합효소로 프라이머를 신장하기 전에 방법이 어느 남아 있는 단일-가닥 올리고뉴클레오타이드, 선택적으로 짧은 단일-가닥 폴리뉴클레오타이드의 제거를 포함하는 것이 바람직하다. 어느 남아 있는 단일 가닥 올리고뉴클레오타이드의 제거는 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일 가닥 폴리뉴클레오타이드를 정제함으로써 달성될 수 있다. 그 다음, 핵산외부가수분해효소 분해를 수행하여 어느 남아 있는 단일 가닥 올리고뉴클레오타이드 및/또는 짧은 단일-가닥 폴리뉴클레오타이드를 제거할 수 있다. 더 선택적으로, (i) 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일 가닥 올리고뉴클레오타이드를 정제하는 단계; 및/또는 (ii) 핵산외부가수분해효소 분해의 추가적인 사이클은; 이중-가닥 폴리뉴클레오타이드를 생산하기 위해 중합효소로 프라이머를 신장하기 전에 수행될 수 있다. 바람직하게는, 첫 번째 단일 가닥 올리고뉴클레오타이드에서 프라이머가 폴리뉴클레오타이드 내의 관심 영역에 특이적인 프라이머 서열인, 본 명세서에 기재된 어느 방법에서, 샘플에서 폴리뉴클레오타이드의 변성 및 첫 번째 단일-가닥 올리고뉴클레오타이드의 어닐링 후, 상기 방법은 다음을 포함하는 것이 바람직하다:
i. 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일-가닥 폴리뉴클레오타이드의 정제에 의한 어느 남아 있는 첫 번째 단일-가닥 올리고뉴클레오타이드의 제거;
ii. 핵산외부가수분해효소로 어느 남아 있는 첫 번째 단일-가닥 올리고뉴클레오타이드의 분해;
iii. 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일-가닥 폴리뉴클레오타이드의 추가적인 정제.
더 바람직하게는, 첫 번째 단일 가닥 올리고뉴클레오타이드에서 프라이머가 폴리뉴클레오타이드 내의 관심 영역에 특이적인 프라이머 서열인, 본 명세서에 기재된 어느 방법에서, 샘플에서 폴리뉴클레오타이드를 변성하는 단계 및 첫 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 단계 후, 상기 방법은 다음을 포함하는 것이 바람직하다:
i. SPRI 비드를 사용하여 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일-가닥 폴리뉴클레오타이드의 정제에 의한 어느 남아 있는 첫 번째 단일-가닥 올리고뉴클레오타이드의 제거;
ii. 핵산외부가수분해효소I로 어느 남아 있는 첫 번째 단일-가닥 올리고뉴클레오타이드의 분해;
iii. SPRI 비드를 사용하여 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일-가닥 폴리뉴클레오타이드의 추가적인 정제.
본 명세서에 기재된 방법은 본 명세서에 기재된 본 발명의 방법에 의해 생성된 DNA 분자의 집단을 시퀀싱하는 단계를 추가적으로 포함할 수 있다. DNA를 시퀀싱하는 단계는 그 서열의 전체 또는 일부를 결정하기 위한 것일 수 있다. 어느 적합한 시퀀싱 기술을 사용하여 DNA의 서열을 결정할 수 있다. 본 발명의 방법에서, 고-처리량(high-throughput), 이른바 "2세대", "3세대" 및 "차세대" 기술을 사용하여 DNA를 시퀀싱할 수 있다.
2세대 기술에서는, 많은 수의 DNA 분자가 병렬로 시퀀싱된다. 일반적으로, 수만 개의 분자가 주어진 위치에 고밀도로 고정되어 있으며 DNA 합성에 의존적인 과정으로 서열이 결정된다. 반응은 예를 들어, 가역적으로 표지된 종결자 염기의 삽입을 허용하는, 연속적인 시약 전달 및 세척 단계, 및 염기 삽입의 순서를 결정하기 위한 스캐닝 단계로 대개 구성된다. 이러한 유형의 어레이-기반 시스템은 예를 들어, 일루미나 주식회사(Illumina, Inc., San Diego, CA; http://www.illumina.com/)로부터, 상업적으로 이용 가능하다.
3세대 기술은 일반적으로 검출 단계 사이에 시퀀싱 과정을 중단해야 하는 요구 사항의 부재가 특징이므로 실-시간 시스템으로 살펴볼 수 있다. 예를 들어, 삽입 과정에서 발생하는, 수소 이온의 염기-특이적 방출은 마이크로웰 시스템의 맥락에서 검출될 수 있다(예를 들어, Life Technologies에서 이용 가능한 Ion Torrent 시스템 참조; http://www.lifetechnologies.com/). 유사하게, 파이로시퀀싱(pyrosequencing)에서 파이로포스페이트(pyrophosphate, PPi)의 염기-특이적 방출이 검출되고 분석된다. 나노포어 기술에서, DNA 분자는 나노포어를 통과하거나 그 옆에 위치하며, 나노포어에 대한 DNA 분자의 움직임에 따라 개별 염기의 정체가 결정된다. 이러한 유형의 시스템은 예를 들어, 옥스포드 나노포어(Oxford Nanopore; https://www.nanoporetech.com/)로부터 상업적으로 이용 가능하다. 대안적인 방법에서, DNA 중합효소는 "제로-모드 웨이브가이드(zero-mode waveguide)"에 국한되고 삽입된 염기의 정체는 감마-표지된 포스포뉴클레오타이드의 형광 검출로 결정된다(예를 들어, Pacific Biosciences; http://www.pacificbiosciences.com/ 참조).
도 1은 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하는 당업계에 공지된 방법과 비교하여, DNA 시퀀싱 라이브러리가 손상된 DNA 샘플로부터 생성되는 본 발명의 예시적인 일 구현예(Damaged DNA Adapter Sequencing 또는 DDAT)를 도시하는 개략도를 나타낸다. 도 1의 오른쪽 패널에 도시된 본 발명의 구현예는 먼저 FFPE 처리로 인한, 데옥시우라실(deoxyuracil) 및 8-옥소구아닌(8-oxoguanine)과 같은 손상된 염기를 제거하는, 입력 DNA(input DNA)(도 1의 A 및 B 부분)에 효소 SMUG1(single-strand-selective monofunctional uracil-DNA Glycosylase) 및 Fpg(formamidopyrimidine [fapy]-DNA glycosylase)의 첨가를 나타낸다. 짧은 변성 단계(도 1의 B 부분)에 이어 첫 번째 가닥 합성이 뒤따르고; 이 단계 동안 유전체 DNA, 프라이머 및 클레나우 중합효소(3'→5' 핵산외부가수분해효소 활성이 있음)는, 37℃에서 추가적인 1.5시간 동안의 배양 전에, 분(minute)당 4℃의 느린 램핑 속도(ramping speed)로 4℃에서 37℃까지 점진적으로 가열된다(도 1의 C 부분). 프라이머는 표준 일루미나 어댑터 서열(Illumina adaptor sequence)에 더하여 3'-말단으로부터 9개의 랜덤 뉴클레오타이드를 포함하고, DNA 샘플에 존재하는 상보적인 DNA 서열에 어닐링될 것이다. 첫 번째 가닥 합성 후, 어느 남아 있는 프라이머 또는 짧은 ssDNA 단편은 핵산외부가수분해효소 I으로 분해되고 dsDNA는 AmpureXP 비드로 정제된다. 다음으로, dsDNA는 변성되어 첫 번째 합성과 동일한 조건으로, 9개의 랜덤 뉴클레오타이드 또한 포함하는 두 번째 어댑터 프라이머를 사용하여 두 번째 가닥 합성을 수행한 다음, 비드 정제가 뒤따른다(도 1의 C 부분). 마지막으로, 표준 일루미나 p5 및 p7 인덱싱된 프라이머(standard Illumina p5 and p7 indexed primer)(도 1의 D 부분)를 사용하여 10개의 PCR 사이클이 수행된다. 라이브러리는 표준 품질 관리(quality control) 방법을 사용하여 정제되고 평가된다.
도 2a는 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하는 당업계에 공지된 방법과 비교하여, 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리가 생성되는 본 발명의 예시적인 일 구현예(DDAT)로부터 유래된 시퀀싱 리드(read)에 의해 커버되는 유전체의 백분율을 나타낸다. DDAT 방법은 유전체에서 염기 당 리드(read) 수 측면에서 커버리지(coverage)가 2.5배 증가되는 결과를 가져왔다.
도 2b는 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하는 당업계에 공지된 방법과 비교하여, DNA 시퀀싱 라이브러리가 손상된 DNA 샘플로부터 생성되는 본 발명의 예시적인 일 구현예(DDAT)로부터 유래된 시퀀싱 리드(read)에서 삽입체(insert) 크기의 분포를 나타낸다. DDAT 방법은 유전체에서 염기 당 리드(read) 수 측면에서 커버리지가 2.5배 증가되는 결과를 가져왔다. 이러한 맥락에서, "삽입체(insert)"는 시퀀싱 라이브러리 내의 페어드-엔드 어댑터 서열(paired-end adaptor sequence) DNA 분자 사이의 뉴클레오타이드 서열을 의미한다. 예시적인 DDAT 방법에 의해 생성된 더 큰 삽입체 크기는 당업계에서 이전에 공지된 표준 방법보다 샘플에서 더 많은 입력 DNA를 포획하는 본 발명의 방법을 나타낸다.
도 2c는 Integrative Genomics Viewer 상의 시퀀싱 리드(read)를 나타낸다. 본 발명의 예시적인 일 구현예(DDAT)에 따라 도출된 시퀀싱 데이터(상단 패널)는 C > A 전이(transition)를 나타내고(점선 사이에 나타낸 A 염기; chr 5:112838399; GRCh38; 총 리드(read) = 19, 변경된 리드 = 9, 변이체 대립유전자 빈도(variant allele frequency, VAF) = .474), 이는 APC 유전자에서 정지 코돈(stop codon)을 초래한다(p.Y935*, c.2805C>A; COSMIC19031). 표준 라이브러리 제조 방법(하단 패널)을 사용하는 경우, 이 영역은 식별할 수 있는 충분한 리드로 커버되지 않는다(총 리드 = 2, 변경된 리드 = 2, VAF = 1).
도 3은 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하기 위한 당업계에 공지된 방법과 비교하여 본 발명의 예시적인 일 구현예(DDAT)를 구현하는 경우 양호한(good), 불량한(poor) 또는 매우 불량한(very poor) 샘플로부터 유래된 시퀀싱 라이브러리 수율을 나타내는 막대 도표를 나타낸다. 시퀀싱 라이브러리를 제조하는 표준 방법(standard)과 대조적으로 본 발명의 방법을 사용하면 DNA의 더 높은 수율을 달성할 수 있다.
도 4는 분석된 모든 샘플 품질에 대해, 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하기 위한 당업계에 공지된 방법과 비교하여 본 발명의 예시적인 일 실시예(DDAT)를 구현함으로써 더 큰 유전체 커버리지 및 염기 당 리드가 달성될 수 있음을 나타낸다.
도 5a는 DNA 시퀀싱 라이브러리를 제조하기 위해 당업계에 공지되어 있는 표준 방법과 비교하여, 양호한, 불량한, 또는 매우 불량한 샘플로부터 유래된 DNA 시퀀싱 라이브러리의 시퀀싱에 의해 결정된 C>T/A>G 돌연변이 비율이 염기 절제 수선 효소를 특징으로 하는 본 발명의 방법에서 동등함을 나타낸다. 염기 절제 수선 효소의 사용이 결여된 본 발명의 예시적인 일 실시예는 DNA 시퀀싱 라이브러리를 제조하기 위한 당업계에 공지된 표준 방법에 비해 증가된 C>T/A>G 돌연변이 비율을 나타내므로, 본 발명의 방법에서 염기 절단 복구 효소의 사용은 손상된 입력 DNA로 인한 시퀀싱 인공물(artefact)을 감소시킬 수 있다.
도 5b는 DNA 시퀀싱 라이브러리를 제조하기 위해 당업계에 알려진 표준 방법 또는 염기 절제 수선 효소를 사용하거나 사용하지 않은 본 발명에 따른 방법에 의해 분석되는 경우, 양호한, 불량한, 또는 매우 불량한 샘플로부터 유래된 DNA 시퀀싱 라이브러리의 시퀀싱 전반에 걸친 평균 C>T/A>G 돌연변이 비율을 보여주는 막대 도표를 나타낸다.
도 6은 GAPDH 유전자의 100 bp, 200 bp, 300 bp 및 400 bp 단편의 PCR 증폭에 의해 평가된 샘플 품질을 나타내기 위해 아가로오스 겔 상에서 실행된 FFPE 샘플로부터 유래된 DNA의 멀티플렉스 PCR 산물을 나타낸다. 나타낸 샘플은 표준 또는 DDAT 방법을 사용하여 본 출원의 실시예에서 시퀀싱 라이브러리를 생성하는 데에 사용된 샘플이다.
도 7은 Tapestation(Agilent) 정량화로 측정한 FFPE 샘플로부터 유래된 DNA를 사용하여 표준 라이브러리 제조 방법(상단) 또는 DDAT(하단)로 준비한 시퀀싱 라이브러리 내 DNA 단편 크기 분포를 나타낸다.
도 8은 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하기 위한 당업계에 공지된 표준 방법과 비교하여, SMUG1/Fpg 염기 절제 수선 효소를 추가로 사용하거나 사용하지 않고 본 발명의 예시적인 일 실시예(DDAT)를 구현하는 경우, 양호한, 불량한, 또는 매우 불량한 샘플로부터 유래된 시퀀싱 라이브러리에서 삽입체 크기 중앙값을 보여주는 막대 도표를 나타낸다. 당업계의 표준 방법과 비교하여 DDAT가 사용되는 경우 시퀀싱 라이브러리 내에서 더 큰 삽입체 크기가 관찰된다. 본 발명의 방법에 따라 SMUG1/Fpg 염기 절단 복구 효소가 사용되는 경우 불량한 품질(poor quality)의 샘플에 대해 삽입체 크기의 추가적인 증가가 관찰된다.
도 9는 손상된 DNA 샘플로부터 DNA 시퀀싱 라이브러리를 제조하기 위한 당업계에 공지된 표준 방법과 비교하여, SMUG1/Fpg 염기 절제 복구 효소를 추가로 사용하거나 사용하지 않고 본 발명의 예시적인 일 실시예(DDAT)를 구현하는 경우, 양호한, 불량한, 또는 매우 불량한 샘플로부터 유래된 라이브러리를 시퀀싱함으로써 달성된 평균 유전체 커버리지(염기 당 평균 리드)를 나타낸다. 본 발명의 방법에 따라 SMUG1/Fpg 염기 절제 복구 효소가 사용되는 경우 불량한 품질의 샘플에 대해 유전체 커버리지의 추가적인 증가가 관찰된다.
도 10은 DNA 시퀀싱 라이브러리를 제조하기 위한 공지된 표준 방법과 비교하여 본 발명의 예시적인 일 구현예(DDAT)에 적용되는 경우 본 발명의 방법의 라이브러리 수율(라이브러리 몰 농도 nM로 측정됨) 상에 첫 번째 및 두 번째 신장 단계에서 느린 램핑 속도(4℃에서 DNA-매개 DNA 중합효소의 최적 온도까지의 온도 증가 비율)가 미치는 영향을 도시하는 막대 도표를 나타낸다. 빠른 램핑 속도 = 132℃/min; 느린 램핑 속도 = 4℃/min.
도 11은 TET2-특이적 서열 및 일루미나 어댑터의 절단된(truncated) P7 부분을 포함하는 프라이머가 첫 번째 가닥 합성에 사용되는 것을 나타낸다. 일루미나 어댑터의 절단된 P5 부분에 부착된 랜덤 N x 9 bp는 두 번째 가닥 합성에 사용된다. 두 번째 가닥 합성 프라이머는 첫 번째 가닥 합성 동안 생성된 새로운 DNA 가닥에 랜덤으로 결합할 것이다. PCR 증폭 후 최종 라이브러리는 완전한 시퀀싱 단편을 포함할 것이고, 시퀀싱은 P5 끝(end)에서 시작될 것이며, 이는 P7 끝에 있는 TET2-특이적 프라이머가 아닌, TET2 유전자의 랜덤 서열에서 첫 번째 리드가 항상 시작될 것임을 의미한다.
도 12는 IGV(integrative genome viewer)를 사용하여 시각화된 본 발명의 예시적인 구현예(TDAT 및 DDAT)에서 유래된 데이터를 나타낸다. 회색 피크는 TET2 유전자에서 시퀀싱 리드의 요약을 나타낸다.
도 13은 KG-1 세포에서 G/A 돌연변이를 검증하는 본 발명의 예시적인 구현예(TDAT) 시퀀싱 트레이스(trace)로부터 유래된 생어(sanger) 시퀀싱 데이터를 나타낸다. 중첩되는 G 및 A 트레이스는 본 발명의 구현예를 사용하여 식별된 이형 접합(heterozygous) 돌연변이를 나타낸다.
도 14는 IGV(integrative genome viewer)를 사용하여 시각화된 본 발명의 예시적인 구현예(TDAT)에서 유래된 데이터를 나타낸다. 수평 회색 막대는 IGV 시각화 영역에 걸쳐 있는 리드(read)를 나타낸다. 야생형 인간 유전체 서열은 x축을 따라 볼 수 있다. TDAT 방법은 G/A 돌연변이를 성공적으로 식별한다.
서열의 간단한 설명
서열번호 1은, 첫 번째 단일-가닥 폴리뉴클레오타이드에 어닐링함으로써, DNA 중합효소로 신장하여 첫 번째 이중-가닥 폴리뉴클레오타이드를 생성할 수 있도록 하기 위한, 시퀀싱 어댑터 서열 및 랜덤 프라이머 서열('N'으로 표시됨)을 포함하는 예시적인 첫 번째 단일-가닥 올리고뉴클레오타이드를 나타낸다.
서열번호 2는, 두 번째 단일-가닥 폴리뉴클레오타이드에 어닐링함으로써, DNA 중합효소로 신장하여 두 번째 이중-가닥 폴리뉴클레오타이드를 생성할 수 있도록 하기 위한, 시퀀싱 어댑터 서열 및 랜덤 프라이머 서열('N'으로 표시됨)을 포함하는 예시적인 두 번째 단일-가닥 올리고뉴클레오타이드이다.
서열번호 3은 시퀀싱 플로우 셀(예를 들어, Illumina® 차세대 시퀀싱 기술)을 코팅하는 올리고뉴클레오타이드에 어닐링하는 데에 적합한 뉴클레오타이드 서열을 포함하는 시퀀싱 라이브러리 PCR 프라이머이다.
서열번호 4는 시퀀싱 플로우 셀(예를 들어, Illumina® 차세대 시퀀싱 기술)을 코팅하는 올리고뉴클레오타이드에 어닐링하는 데에 적합한 뉴클레오타이드 서열을 포함하는 인덱스 시퀀싱 라이브러리 PCR 프라이머이고, 상기 인덱스는 사용자가 시퀀싱을 위해 라이브러리를 풀링(pooling)/멀티플렉싱(multiplexing)할 수 있게 하여, 이후 생명정보학적으로 각각 구별되도록 인덱싱된 라이브러리에 대한 시퀀싱 데이터를 분리하고 분석할 수 있게 한다.
서열번호 5는 TET2 유전자에서 관심 영역을 어닐링함으로써 DNA 중합효소로 신장하여 첫 번째 이중-가닥 폴리뉴클레오타이드를 생성할 수 있도록 하기 위한, 시퀀싱 어댑터 서열 및 프라이머 서열을 포함하는 예시적인 첫 번째 단일-가닥 올리고뉴클레오타이드이다.
서열번호 6은 두 번째 단일-가닥 폴리뉴클레오타이드에 어닐링함으로써, DNA 중합효소로 신장하여 두 번째 이중-가닥 폴리뉴클레오타이드를 생성할 수 있도록 하기 위한, 바람직하게는 첫 번째 단일-가닥 올리고뉴클레오타이드가 특정 관심 영역에 어닐링하도록 설계되는 경우 사용되는, 시퀀싱 어댑터 서열 및 랜덤 프라이머 서열('N'으로 표시됨)을 포함하는 예시적인 두 번째 단일-가닥 올리고뉴클레오타이드이다.
본 발명은 다음 실시예에 의해 추가적으로 설명되지만, 이는 보호 범위를 제한하는 것으로 해석되어서는 안 된다. 전술한 설명 및 다음 실시예에 개시된 특징은 개별적으로 및 이들의 어느 조합 모두에서, 이의 다양한 형태로 본 발명을 실현하기 위한 물질일 수 있다.
실시예 1
본 명세서에 기재된 바와 같이, 이전에 개발된 방법을 DNA 메틸화 분석에 맞게 조정하면 기존에-존재하는 어댑터 라이게이션-기반 라이브러리 제조 방법과 관련된 여러 비효율적인 단계를 우회할 수 있음을 놀랍게도 발견하였고, 이는 본 발명의 개선된 라이브러리 제조 방법을 초래하였다. 분해된(degraded) DNA 어댑터 태깅(DDAT)은 기재된 본 발명의 예시적인 방법이다. DDAT는 현재 상업적으로 이용 가능한 키트로 포획되는 dsDNA와 더불어 단일 가닥 ssDNA를 증폭할 수 있는 랜덤 프라이밍을 활용한다. 본 연구에서, DDAT 방법은 어댑터 라이게이션을 활용하는 표준 제조 방법과 비교되며, 각 방법은 다양한 품질의 FFPE 샘플 상에서 사용되는 경우 라이브러리 품질 및 수율에 대해 평가된다. DDAT 방법이 특히 효과적인 것으로 확인된다.
재료 및 방법
샘플 정보
샘플은 유니버시티 컬리지 런던 병원 바이오뱅크(University College London Hospitals Biobank, REC: 15/YH/0311) 옥스포드 대학교 병원(Oxford University Hospitals, MREC 10/H0604/72)로부터 수득하였다.
유전체 DNA추출
제조사의 프로토콜에 따라 High Pure FFPET DNA 분리 키트(Roche Diagnostics Ltd.)를 사용하여 포르말린 고정 파라핀 포매(formalin fixed paraffin embedded, FFPE) 대장암 샘플로부터 DNA를 추출하였다. DNA는 Qubit® 3.0 형광계(fluorometer)(Life Technologies)를 사용하여 정량화되었고 품질은 이전에 설명한 대로 멀티플렉스 PCR-기반 분석을 사용하여 측정되었다.
전장 유전체 시퀀싱(Whole Genome Sequencing, WGS) 라이브러리 제조(분해된 DNA 어댑터 태깅 프로토콜)
손상된 염기를 제거하기 위해, 2 ng의 양호한(good) 또는 불량한(poor) 품질의 FFPE DNA와 10 ng의 매우 불량한(very poor) 품질의 DNA를 5U의 SMUG1, 1U Fpg, 1x NEB 버퍼 1 및 0.1 μg/ml BSA(NEB)를 10 μl에서 결합시키고 37℃에서 1시간 동안 인큐베이션하였다(이 효소 분해 단계는 파일럿 실험에서 제외되었다). 첫 번째 가닥 합성은 10 μl 반응을 1x 블루 버퍼(blue buffer), 400 nM dNTP 및 4 uM 올리고 1(5'-CTACACGACGCTCTTCCGATCTNNNNNNNNN - 3')(서열번호 1, 및 'N'은 임의의 뉴클레오타이드일 수 있음)을 49 μl에서 결합시킨 다음 즉시 수행되었다. 샘플을 1분 동안 95℃로 가열하고 즉시 얼음 상에서 냉각시켰다. 50U의 클레나우(Klenow)(3'→5' 핵산외부가수분해-; Enymatics) 단편을 각 샘플에 첨가하고 튜브를 4℃에서 5분 동안 인큐베이션한 후 37℃(즉, 램핑 단계에서 8분)까지 느리게 램핑(4℃/분)하고, 그 다음 90분 동안 37℃에서 유지하였다. 이 단계 후에 필요한 경우 샘플을 -20℃에서 밤새 보관할 수 있다. 나머지 프라이머는 AMPure XP 비드(Beckman)를 사용하여 정제하기 전에 100 μl에서 1시간 동안 37℃에서 20U의 핵산외부가수분해효소 I(NEB)으로 분해되었다. 정제를 위해, 80 μl AMPure XP 비드를 샘플에 직접 첨가하였고 실온에서 10분 동안 인큐베이션하였다. 자석 상에 비드를 수집한 후 자석 상에 2x 200 μl 80% 에탄올 세척(wash)을 수행하였다. 비드가 과도하게 건조되고 금(crack)이가지 않도록 주의하면서 6분 내지 10분 동안 비드를 건조시켰다. 두 번째 가닥 합성을 위한 구성 요소(1x 블루 버퍼, 400 nM dNTP 및 0.8 μM 올리고 2(5' - CAGACGTGTGCTTCTTCCGATCTNNNNNNNNN - 3')(서열번호 2, 및 'N'은 임의의 뉴클레오타이드일 수 있음))를 비드를 여전히(still) 포함하는 PCR 튜브에 첨가하기 전에 DNA를 38 μl의 물(water)에서 용리시켰다. 샘플을 98℃에서 2분 동안 가열한 다음 얼음 상에서 인큐베이션하였고 50U의 클레나우(3'→5' 핵산외부가수분해-)를 첨가하였으며 첫 번째 가닥 합성과 동일한 조건을 사용하여 인큐베이션하였다. 두 번째 가닥 합성 반응을 정제하기 위해, AMPure XP 비드의 분주액(aliquot)을 원심분리하고 상층액을 수집하였다. 샘플에 50 μl의 물(water)을 첨가한 후, 80 μl의 비드 버퍼를 첨가하고 혼합하여 여전히(still) 튜브 내에 있는 비드를 재현탁시키고 DNA를 상술한 바와 같이 정제하였다. 최종 건조 단계 후, 비드를 33 μl의 물에 재현탁시키고 10분 동안 인큐베이션하여 DNA를 용리시켰다. 자성 랙(magnetic rack)을 사용하여 비드를 수집하였고 최종 라이브러리 PCR 증폭을 위한 구성 요소(1x KAPA HiFi 버퍼, 400 nM dNTPs, 1U KAPA HiFi Hotstart Taq, PE1.0 (5' - AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT - 3')(서열번호 3) 및 일루미나 TruSeq 서열을 기반으로 한 인덱스된 커스텀 역방향 프라이머 (5' - CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT - 3')(서열번호 4)를 추가하기 전에 33 μl의 정제된 DNA를 새로운 PCR 튜브로 옮겼다. 파일럿 실험을 위해, 라이브러리는 Illumina®(NEB)를 위한 NEBNext® Multiplex Oligos를 사용하여 듀얼 인덱싱되었다(dual indexed). 샘플을 10 PCR 사이클 동안 증폭한 다음, DNA 대 비드의 1:0.8 비율과 15 μl의 물에서 용리(elution)를 사용하여 라이브러리를 정제하였다. Qubit® 3.0 형광계, 2200 TapeStation(Agilent, Santa Clara, CA) 및 KAPA Library Quantification Kit(Roche)를 사용하여 라이브러리를 정량하였다.
전장 유전체 시퀀싱(Whole Genome Sequencing, WGS) 라이브러리 제조 (표준 프로토콜)
FFPE DNA는 Covaris M220 집속형-초음파기(focused-ultrasonicator)를 사용하여 300 bp의 평균 단편 크기로 초음파 처리되었다. 그 다음 제조업체의 프로토콜(New England Biolabs, Hitchin, UK)에 따라 NEBNext® FFPE DNA Repair Mix를 사용하여 DNA를 수선하였다. 라이브러리 제조는 FFPE 샘플에 대한 제조업체의 프로토콜에 따라 Illumina®를 위한 NEBNext® Ultra™ DNA Library Prep Kit(New England Biolabs, 모든 시약의 절반 부피가 파일럿 실험에 사용됨) 및 라이브러리 증폭 10 사이클을 사용하여 수행되었으며, 그 동안 라이브러리는 커스텀 PE1.0(5' - AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT - 3')(서열번호 3) 및 인덱스된 역방향 프라이머(5' - CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT - 3')(서열번호 4); 인덱스 서열에 밑줄이 그어짐)를 사용하여 인덱싱되었다. 파일럿 실험을 위해, 라이브러리는 Illumina®(NEB)를 위한 NEBNext® Multiplex Oligos를 사용하여 듀얼 인덱싱되었다. 라이브러리는 DDAT에 대해 설명한 것과 동일한 방법을 사용하여 정량화되었다.
시퀀싱 분석 및 생명정보학적 분석 파이프라인
각 샘플에 대해, FastQC v0.11.5로 페어드-엔드(paired-end) 시퀀스 리드의 품질을 초기에 확인하여, 염기 품질 점수(base quality scores), 서열 길이 분포 및 데이터의 추가 특징을 조사하였다. 그 다음 리드를 BWA(Burrows-Wheeler Aligner) v0.7.8에서 사용된 BWA-MEM 알고리즘에 의해 참조 인간 유전체(reference human genome) hg19(파일럿 실험용) 및 hg38(표 1의 샘플용)에 정렬하였다. 그 결과 SAM 파일은 Samtools v1.3.1을 사용하여 BAM 파일로 가공된 다음, Picard v2.6 및 v2.12(각각 표 1의 파일럿 실험용 및 샘플용)를 사용하여 표시된 PCR 중복과 함께 정렬되고 인덱싱되었다. BamQC v0.1 및 Picard v2.12를 사용하여 최종 BAM 파일의 품질을 확인하여, 맵핑 품질, 소프트 클리핑된 리드(soft clipped read)의 백분율, 및 표 2 및 표 4에 나타낸 가공된 데이터의 기타 기본 통계를 조사하였다. 커버리지(coverage) 통계 및 맵핑된 삽입체 크기 도수 분포도(리드/염기)(reads/base)는 GATK v3.6 및 Picard v2.12의 DepthofCoverage 도구로 계산되었다. VCF 파일은 GATK v4.0 Mutect2를 사용하여 생성되었다.
통계 분석
유의성 검정은 도면 범례에 명시된 대로 본페로니 사후 검정(Bonferroni post-hoc test)과 함께 일원분산분석(one-way ANOVA) 및 Prism(v.5.04)을 사용하여 수행되었다. 적용 가능한 경우, 데이터는 평균 ± SEM으로 표시된다.
Figure pct00001
결과 및 고찰
DDAT 라이브러리 제조는 표준 방법과 비교하여 시퀀싱 품질을 개선하고 깊이(depth)를 증가시킨다
대표적인 FFPE 대장암 DNA 샘플을 사용하여, DDAT 및 NEBNext Ultra II('표준') 라이브러리 준비 방법을 사용하여 생성된 WGS 데이터를 비교하기 위한 파일럿 실험이 먼저 수행되었다. 상기 샘플들은 표준 방법을 사용하여 접근할 수 없는 더 많은 ssDNA를 포함하므로, DDAT 방법은 실질적으로 분해된 FFPE DNA에 대해 가장 큰 이점이 있을 것으로 예상되었다. 따라서, 불량한(poor) 품질의 FFPE DNA가 DDAT 방법의 첫 번째 테스트에 사용되었다(멀티플렉스 PCR을 사용한 FFPE DNA 품질의 평가는 도 6을 참조).
라이브러리 제조 방법 모두에 대한 DNA 입력은 2 ng이었고, 모두 최종 라이브러리 증폭의 10 PCR 사이클을 사용하였다. 파일럿 실험에서는, DDAT 방법(도 1)의 '손상된 염기 제거' 단계가 사용되지 않았다. 라이브러리를 준비하고 품질 관리를 수행한 후(도 7, 표 3), 일루미나의 HiSeq X Ten 상에서 샘플을 시퀀싱하여 두 경우 모두 거의 4억 4천만 개의 원시 리드(raw read)를 달성하였다.
Figure pct00002
인간 유전체에 대해 리드를 필터링하고 맵핑한 후, 정렬 메트릭스(alignment metrics)를 평가하였고, DDAT 방법이 커버리지에서 평균 2.5배 증가를 나타내었으며(도 2a, 표 4), 표준 방법을 사용한 70%와 비교하여, 이러한 리드(read)의 80%가 높은 맵핑 품질(MAPQ >= 20)을 가졌음을 확인하였다(표 4). 표준 제조에는 이러한 차이를 설명할 수 있는 초음파 처리에 의한 초기 단편화 단계가 포함된다는 주의사항과 함께, DDAT-생성 라이브러리는 또한 개선된 라이브러리 제조의 또 다른 지표인, 96 bp(도 2b)에 비해 162 bp의 더 큰 삽입체 크기 중앙값을 가졌다(도 1 참조).
Figure pct00003
인간 암에서 추정상의 드라이버 돌연변이(driver mutation)를 식별하는 경우 개선된 라이브러리 제조의 유용성을 설명하기 위해, Integrative Genome Viewer 상에서 정렬된 리드를 검토하였고, APC 유전자에서 추정상의 드라이버 돌연변이(TAA)를 확인하였다(p.Y935*, c.2805C>A, 도 2c). 이 돌연변이는 표준 변이 검출(variant calling) 파이프라인을 사용하여 DDAT 데이터 세트에서 식별될 것이지만(변경된 리드 = 9, 총 리드 = 19, VAF = .474), 염기를 커버하는 오직 두 개의 리드 때문에 표준 방법으로 생산된 데이터에서 필터링되었을 가능성이 있다(변경된 리드 = 2, 총 리드 = 2, VAF = 1). 파일럿 실험은 표준 방법에 비해 DDAT를 사용하여 2 ng의 입력 DNA로부터 더 큰 임상적 가치로 WGS 데이터를 생성할 수 있음을 나타내었다.
DDAT 프로토콜은 표준 방법에 비해 라이브러리 수율을 개선시키고, 매우 분해된 FFPE 샘플에 대해 사용될 수 있다
두 가지 WGS 라이브러리 제조 방법의 보다 포괄적인 비교를 수행하기 위해, 본 발명자들은 다양한 품질의 세 가지 FFPE 대장암(colorectal cancer) DNA 샘플을 선택하였다(도 6; 샘플은 박스로 강조 표시됨). 조직(tissue)의 FFPE 처리는 보통 시토신(cytosine)이 탈아미노화(deamination)되어 우라실(uracil)이 되는 것과 같은 DNA 손상을 초래한다. 손상된 DNA 염기를 제거하거나/제거하고 수선(repairing)하면 WGS 데이터에서 위양성(false positive) 돌연변이 검출(mutational call)을 방지하는 데 도움이 될 수 있다. 상업적으로 이용 가능한 키트를 사용하여 손상된 염기의 수선은 상보적 가닥 주형에 의존하기 때문에(표준 방법의 경우와 같음), ssDNA 내의 손상된 염기는 반대 가닥이 없기 때문에 수선될 수 없다. 따라서, 본 발명자들은, 수선 없이, 손상된 염기의 절제가 FFPE DNA로부터의 WGS 데이터의 품질을 개선시킬 것인지 여부를 평가하였다. 이를 위해, DDAT 프로토콜은 상업적으로 이용 가능한 SMUG1(데옥시 우라실 및 데옥시우라실-유도체를 절제함) 및 Fpg(8-옥소구아닌과 같은 손상된 염기를 제거하는 N-글리코실가수분해효소 및 AP-분해효소(AP-lyase))를 사용하는 초기 효소 분해 단계를 포함하도록 변경되었다. 이러한 효소는 ssDNA와 dsDNA에 염기결손자리(abasic site)를 생성하고, Fpg의 AP-분해효소 활성은 DNA 백본에 틈(nick)을 생성한다. 그 다음, 표준 방법에서는, 중합효소는 누락된 상보적 염기를 추가하여 dsDNA 단편의 갭(gap)을 수선할 것이고; 대조적으로, DDAT 방법에서는 누락된 염기가 첨가되지 않고, 열 변성이 DNA 가닥을 분리하여, 손상된 염기가 제거된 더 짧은 ssDNA 단편을 생성한다. 표 1은 이 일련의 테스트에 대한 실험 설정을 요약한다. 매우 불량한 품질의 샘플의 입력 양은 DNA가 실질적으로 분해됨에 따라 10 ng으로 증가되었다(보충 도 1).
각 시퀀싱 라이브러리의 총 수율을 측정하였고, DDAT 방법(손상된 DNA 제거 포함)이 모든 샘플에 대해 표준 방법에 비해 더 높은 라이브러리 수율을 나타내는 것으로 나타났다(도 3, 양호(good): 52배, 불량(poor): 9.8배 및 매우 불량(very poor): 23배). 손상된 염기 제거 단계를 추가하면 DDAT 방법의 라이브러리 수율이 약간 감소하였다(양호: 1.35배, 불량: 1.8배 및 매우 불량: 1.3배). 삽입체 크기를 평가하였을 때, DDAT 방법(손상된 염기를 제거하거나 또는 제거하지 않음)은 더 높은 라이브러리 품질을 나타내는 표준 방법(도 8)에 비해 모든 샘플에 대해 더 높은 삽입체 크기 중앙값을 나타내었다. 보통 증가된 라이브러리 수율과 삽입체 크기는 DDAT 방법이 표준 방법에 비해 입력 DNA를 더 많이 포획하고 있음을 나타내고, 이는 파일럿 실험의 결과를 검증하는 것이다.
DDAT에 대한 유전체 커버리지는 표준 방법에 비해 최대 3.7배 더 높다
샘플을 시퀀싱하고 리드를 인간 유전체에 정렬한 후, 정렬 메트릭스를 평가하였다(표 2). 보통 DDAT 라이브러리로부터의 데이터는 표준 라이브러리보다 품질이 더 높았다. DDAT 방법은 세 가지 샘플 모두에 대해 더 높은 맵핑 품질과 더 낮은 비율의 키메라(chimera) 및 부적절한 리드 쌍(read pair)을 초래하였다. DDAT 방법에 손상된 DNA 제거 단계를 추가하는 것은 MAPQ 점수를 기반으로 하는 시퀀싱 데이터의 품질에 일관된 영향을 미치지 않았다. 그러나, 이러한 샘플에서 DDAT 방법이 맵핑되지 않은 리드의 비율이 더 높았다는 점은 주목할 만하다(결론 참조).
파일럿 실험과 일치하게, DDAT 방법을 사용하여 제조한 샘플은 표준 방법을 사용하여 제조한 샘플보다 유전체 커버리지가 더 높았다(도 4 참조, DDAT + SMUG1/Fpg의 경우, 양호: 2.45배, 불량: 2.54배, 매우 불량: 3.77배, 도 9 참조). 양호한(good) 품질과 불량한(poor) 품질의 샘플의 경우, DDAT 방법에 손상된 염기 제거 단계를 추가하면 정렬된 리드에서 달성되는 커버리지가 감소하였고(도 4 및 도 9 참조); 그러나, 매우 불량한(very poor) 샘플의 경우, 커버리지는 동일하게 유지되었다(도 4 및 도 9 참조).
Figure pct00004
손상된 DNA 염기의 글리코실가수분해 효소 절제는 DDAT에서 FFPE-유도 시퀀싱 인공물을 감소시킨다
효소 SMUG1 및 Fpg를 사용하여 손상된 DNA 염기를 제거하는 것이 DDAT 방법에서 시퀀싱 인공물(sequencing artefact)의 수를 감소시켰는지 여부를 정량하기 위해, 각 데이터세트 내에서 C>T/A>G 전이(transition)의 비율을 계산하였다(도5A). 이는 손상된 DNA 염기가 제거될 때, 이 비율은 감소하고, 그러므로, 효소 분해 단계를 포함하여 모든 FFPE 샘플에 대한 C>T 전이의 존재를 상당히 감소시킨다는 것을 나타내었다(도 5b). 이는 DNA 손상 수선 단계를 포함하는 표준 라이브러리 제조 방법과 비교할 만하다. 이는 FFPE-유도 시퀀싱 인공물을 피하기 위해 DDAT 프로토콜 이전에 SMUG1/Fpg 분해를 포함하는 것의 중요성을 입증한다.
요약하면, DDAT 라이브러리 제조 방법은 표준 방법과 비교할 때 WGS 데이터의 라이브러리 수율과 품질을 증가시킨다. 따라서, 분해된 FFPE 샘플의 시퀀싱에 DDAT를 적용하면 표준 방법보다 시작 DNA 물질의 더 많은 부분을 회수할 수 있을 것으로 예상된다. 이는 라이브러리 수율을 증가시켜, 시퀀싱 전에 더 적은 PCR 사이클을 허용하므로, 시퀀싱 데이터에서 더 적은 PCR이 중복(duplicate)되고 유전체 커버리지가 2배 내지 3배 증가한다. 또한, 라이브러리 수율이 더 높기 때문에, 더 적은 양의 입력 DNA를 사용할 수 있어, 귀중한 임상적 물질을 아낄 수 있다. FFPE 처리 자체가 DNA 단편화를 일으키기 때문에, DDAT는 DNA 전단(shearing) 또는 초음파 처리(sonication)가 필요하지 않으며, 랜덤 프라이머 증폭에 접근 가능하도록 dsDNA를 변성시키는 데에 단지 짧은 가열 단계만 필요하다. DDAT를 사용하면, 표준 방법으로 증폭할 수 없는 것으로 간주되는 샘플을 사용하여 개선된 품질의 시퀀싱 라이브러리를 생성할 수 있으며, 또한 DDAT의 샘플-당 비용이 상업적으로 이용 가능한 키트보다 더 저렴하다. 즉, 동일한 시퀀싱 처리량에 대해, 3배 내지 4배 더 많은 사용 가능한 리드가 생성된다. DDAT 시퀀싱 데이터의 품질은 FFPE가-유도한 손상된 DNA 염기를 제거하는 효소 분해 단계의 포함에 의존하고, 이는 FFPE-관련 시퀀싱 인공물을 최소화한다. 마지막으로, 시퀀싱의 품질이 유의하게 개선되므로, 보다 강력한 생물학적 관련 정보를 추출할 수 있다.
결론
본 발명자들은, DDAT를 사용하여, 선택적으로 DNA 시퀀싱 라이브러리를 형성하는, DNA 분자의 집단을 생성하기 위한 새로운 방법을 확립하였으며, 이는 표준 상업적으로 이용 가능한 키트와 비교하여 FFPE DNA로부터 더 우수한 라이브러리 수율 및 WGS 데이터의 품질을 제공한다. 개선된 효율성은 ssDNA 및 dsDNA 포획을 가능하게 하는 두 개의 랜덤 프라이밍 및 신장 단계로 인한 것이다. 결과적으로, 입력 DNA는 DDAT를 사용하기 전에 추가적인 DNA 단편화 단계(예를 들어, 초음파 처리)를 필요로 하지 않으며, 이는 DNA의 무결성을 더욱 유지한다. 이는 입력 DNA가 보통 이미 고도로 단편화되고 단일 가닥인 FFPE-처리 조직에서 추출될 때 특히 중요하다.
프로토콜을 최적화하는 동안 본 발명자들은 첫 번째 및 두 번째 가닥 합성 동안 37℃ 인큐베이션 단계에 도달하는 데에 사용되는 램프 속도가 효율적인 라이브러리 준비에 중요하고, 더 빠른 램핑 속도(132℃/분 대(vs.) 4℃/분)가 전체 라이브러리 수율을 감소시킨다는 것을 발견하였다(도 10). 이 효과에 대한 이유는 불분명하지만, 본 발명자들은 램핑 속도가 랜덤 프라이머/DNA/클레나우 결합의 역학에 영향을 미친다고 가정하며, 이는 온도가 점차 증가하면 복합체가 더 효율적으로 형성된다는 것을 의미한다.
FFPE DNA의 DNA 분해 수준을 검출하기 위해, 본 발명자들은 GAPDH 유전자의 멀티플렉스 PCR(도 6)을 사용하였고, 이는 CNV를 검출하기 위한 어레이 비교 유전체 혼성화(array comparative genomic hybridization)로부터 데이터 품질에 대한 우수한 예측을 제공하는 것으로 나타났지만, 멀티플렉스 PCR이 WGS 데이터의 품질을 얼마나 잘 예측하는지 확립하려면 더 넓은 범위의 분해된 FFPE 샘플을 포함하는 추가적인 심층 평가가 필요하다.
본 발명자들은 DDAT 방법에서 손상된 DNA 염기를 제거하는 것이 FFPE-유도 시퀀싱 인공물로부터 WGS 데이터를 구하기에 충분하다는 것을 보여주었다. ssDNA에서 손상된 염기는 주형으로 사용할 상보적인 가닥이 없기 때문에 수선될 수 없으므로 제거가 유일한 선택이다. 손상된 염기를 제거한 DDAT 제조로부터의 데이터의 수율과 품질이 보통 표준 방법에 비해 개선되기 때문에, 수선보다는 제거가 결과로 얻어진 WGS 데이터에 부정적인 영향을 미치지 않는 것으로 보이고; 또한, 이러한 유형의 손상된 염기 제거는 낮은 DNA 입력 표적화 시퀀싱에 효과적인 것으로 나타났다.
본 발명자들은 전장 유전체 아황산수소 시퀀싱(whole genome bisulfite sequencing)을 위한 PBAT(post-bisulfite adapter tagging) 방법을 사용할 때 최근에 확인된 것과 유사한, DDAT 방법에 잠재적인 문제가 있는지 여부를 고려하였다. 즉, 랜덤 프라이밍은 키메릭 리드(chimaeric read)를 증가시킨다 (https://sequencing.qcfail.com/articles/pbat-libraries-may-generate-chimaeric-read-pairs/). 그러나, 정렬 통계를 기반으로 하여, 이는 DDAT를 사용하는 경우에 해당되지 않는 것으로 보이며, 실제로 본 발명자들은 표준 라이브러리보다 DDAT 제조 라이브러리에 대한 키메라 리드의 비율이 더 낮다는 것을 관찰했기 때문이다(표 2).
예를 들어, 아주 오래된 DNA로부터 WGS 라이브러리를 생성을 위한 방법, 및 임상 샘플로부터 표적화 시퀀싱하는 방법과 같이 WGS를 위한 dsDNA 뿐만 아니라 ssDNA를 활용할 수 있는 대체 방법이 있다. 그러나, 이 두 가지 방법 모두 ssDNA에 대한 단일 가닥 어댑터의 라이게이션에 의존하며, 이는 DDAT에 사용되는 랜덤 프라이밍에 비해 비효율적이므로, 낮은 양의 입력 DNA로부터 열등한 라이브러리 수율 및 시퀀싱 데이터를 제공할 것이다.
요약하면, 본 발명자들은 ssDNA를 포함하는 고도로 분해된 DNA 샘플(예를 들어, 기록 보관소의 FFPE 샘플)에 특히 적합한 대안적인 WGS 라이브러리 제조 방법으로서 DDAT를 개발하였다. DDAT는 FFPE WGS 데이터의 수율과 품질을 증가시키고, 본 발명자들은 이 방법을 적용하면 낮은 입력 양, 특히 양호한(good) 품질의 출발 물질로부터 높은 품질의 WGS 데이터를 생성할 수 있을 것으로 예상하며, 이는 이전에는 WGS에 적합하지 않는 것으로 간주된 샘플로부터 관련 데이터를 수득하는 사용자의 역량을 개선시킨다.
실시예 2
본 명세서에 기재된 바와 같이, 이전에 개발된 방법을 DNA 메틸화 분석에 맞게 조정하면 기존에-존재하는 어댑터 라이게이션-기반 라이브러리 제조 방법과 관련된 여러 비효율적인 단계를 우회할 수 있음을 놀랍게도 발견하였고, 이는 본 발명의 개선된 라이브러리 제조 방법을 초래하였다. 표적화된 DNA 어댑터 태깅(Targeted DNA adaptor tagging, TDAT)은 기재된 본 발명의 예시적인 방법이다. TDAT는 단일 가닥 DNA(ssDNA) 및 이중 가닥 DNA(dsDNA)를 증폭할 수 있는 표적화 프라이밍을 활용함으로써, dsDNA만을 포획할 수 있는 상업적으로 이용 가능한 키트에 비해 이점을 제공한다. 본 연구에서는, TDAT 방법(표적화 프라이밍을 사용함)과 DDAT 방법(랜덤 프라이밍을 사용함)을 비교하였으며, 각 방법은 유전체 변이를 검출하는 능력에 대해 평가되었다. TDAT 방법은 전장 유전체 커버리지를 제공하는 DDAT 방법과 달리, 국소적인(localised) 관심 유전자(gene-of-interest)에서 유전체 변이를 검출하는 데에 특히 효과적인 것으로 확인되었다.
유전체 영역의 표적화 증폭은 유전체의 특정 영역에 대한 시퀀싱 데이터를 생성하는 데에 사용되는 방법이다. 이는 특정 유전자가 돌연변이되었는지 여부만 문제가 되는 경우 전장 유전체 시퀀싱에 대한 유용한 대안이 될 수 있다. 예를 들어, 많은 유형의 암에서 공지된 돌연변이 취약 부분(mutational hot spot)이 있고; TET2 유전자를 예로 들면, 골수암(myeloid cancer) 환자의 약 15%에서 이 유전자의 코딩 영역(엑손)이 돌연변이된다. 전장 유전체(30억 염기 쌍)를 시퀀싱하는 대신, 수천 개의 염기 쌍에 대해 표적화 시퀀싱이 사용될 수 있고, 이는 시퀀싱 비용을 크게 감소시키면서, 필요한 표적에서 생성되는 정보의 깊이를 증가시킬 수 있다. 특정 영역을 커버하는 더 많은 수의 리드(증가된 커버리지)는, 암 진행을 주도(driving)하는 데에 중요할 수 있는, 진정한 유전적 변이를 식별하는 데 더 큰 신뢰성을 제공한다. 또한, 유전자 패널(panel)에 대한 표적화 시퀀싱으로부터 생성된 데이터는 이제 임상의가 환자에게 가장 적합한 치료법을 결정하는 데 도움이 되도록 클리닉에서 사용된다.
재료 및 방법
DDAT에 대해 기재된 방법은 표적화 DNA 어댑터 태깅(targeted DNA adapter tagging, TDAT)에 사용하도록 최적화될 수 있다. 이 방법의 실행 가능성을 입증하기 위해, KG-1 세포주로부터 추출한 유전체 DNA를 초음파 처리하여, 양호한 품질의 FFPE(평균 1000 bp 단편)를 시뮬레이션하는, 길이로 DNA를 전단(shear)하였다. 첫 번째 가닥 합성을 위해, 143개의 프라이머가 TET2 유전자의 엑손을 커버하도록 설계되었다(총 약 6013 bp). 18 bp 내지 22 bp의 TET2-특이적 서열은 온라인 프라이머 타일링(tiling) 도구를 사용하여 두 DNA 가닥 상에서 약 80 bp 내지 100 bp 간격으로 설계되었다. 본 발명자들은 각 TET2-특이적 서열의 5' 말단에 일루미나 어댑터를 추가하였다(표 5).
Figure pct00005
TET2-특이적 서열 및 P7 절단된 일루미나 어댑터를 포함하는 첫 번째 가닥 합성 프라이머를 KG-1 세포로부터 추출한 50 ng의 전단된 DNA를 50 μl에서 혼합하였고, 혼합물을 95℃에서 2분 동안 가열하였으며 초(second) 당 0.1℃로 냉각하여, 프라이머의 표적 어닐링을 촉진시켰다. DNA/프라이머 혼합물은 AmpureXP 비드를 사용하여 정제한 다음, 핵산외부가수분해효소 I을 처리하여 과량의 어닐링되지 않은 첫 번째 가닥 합성 프라이머를 제거하였으며, 이는 유전체에서 프라이머의 비-특이적(즉, 비-TET2) 결합을 감소시키는 데 도움이 된다.
그 다음 기재된 바와 같이 클레나우 단편과 4℃에서 37℃로의 느린 램프 속도를 사용하여 DDAT에 대해 기재된 바와 같이 새로운 DNA의 첫 번째 가닥 합성을 수행하였다. 두 번째 가닥 합성을 위한 후속 단계는 표 5에 나타낸 두 번째 가닥 합성 프라이머를 사용하여 DDAT에 대해 기재된 바와 같이 수행되었다. 시퀀싱 라이브러리를 생성하기 위한 최종 PCR 증폭은 증폭된 영역이 6013 bp에 불과하기 때문에 20 사이클이었다.
TDAT의 경우, TET2-특이적 서열을 포함하는 첫 번째 가닥 합성 프라이머가 어댑터 분자의 P7 쪽을 구성하는 일루미나 어댑터의 절단된 부분에 부착되었다(P7 쪽에 밑줄이 그어짐: 5' - CAGACGTGTGCTCTTCCGATCTN18-22 - 3'). 두 번째 가닥 합성 프라이머는 9개의 랜덤 염기에 부착된, 일루미나 어댑터의 P5 쪽의 절단된 부분을 포함하므로(P5 쪽에 밑줄이 그어짐: 5' - CTACACGACGCTCTTCCGATCTNNNNNNNNN - 3'), 두 번째 가닥 합성 프라이머는 첫 번째 가닥 합성 동안 생성된 새로운 DNA 가닥 상의 랜덤 위치에서 어닐링될 수 있다(도 11, 좌측). PCR 반응 동안 DNA 라이브러리가 생성되면, 절단된 P5와 P7을 모두 포함하는 서열만 증폭될 것이다(도 11, 우측). 일루미나 기기 상에서 최종 라이브러리의 시퀀싱은 항상 P5끝에서 먼저 데이터를 생성하므로, 첫 번째 리드는 항상 TET2-특이적 서열을 포함하기보다는 TET2 유전자의 랜덤 서열로부터 시작될 것이다(도 11, 우측). 이는 여러 가지 이유로 이점이 있다; 첫 번째 시퀀싱 사이클 동안 높은 수준의 서열 다양성을 유지하여, 낮은 시퀀싱 수율 또는 데이터 품질의 위험을 감소시킨다(https://emea.support.illumina.com/bulletins/2016/07/what-is-nucleotide-diversity-and-why-is-it-important.html). 또한 표적 유전자에서 커버된 염기의 %를 개선하고 돌연변이를 식별할 가능성을 높이는 데 도움이 되며, 이는 항상 TET2-특이적 서열에 가까이 위치하지는 않을 것이다(도 11).
결과
표적화 시퀀싱 데이터는 BWA(버전 0.7.17.4)를 사용하여 인간 유전체 버전 hg38에 정렬되었다. IGV(Integrative Genomics Viewer)를 사용하여 데이터를 시각화함으로써, TDAT를 사용하여 생성된 데이터는, DDAT로 생성된 데이터(그림 12, 하단 패널)에서 볼 수 있듯이, 전장 유전체가 아니라 TET2 엑손(그림 12, 상단 패널)에 특이적임이 분명했다. TET2 엑손에서 최대 커버리지는 TDAT를 사용할 때 또한 더 컸다(도 12에 나타낸 318개 리드 대(vs.) 76개 리드).
Figure pct00006
본 발명자들은 QualiMap BamQC(버전 2.2.2; 표 2)를 사용하여 정렬 메트릭스를 평가하였다. 분석은 리드의 65.5%가 유전체에 맵핑되었지만, 0.3%만이 TET2 엑손에 맵핑된, 표적-상 리드(on-target read)였음을 나타내었다. 일반적으로, 이 양의 입력 DNA에서 약 50%의 표적-상 커버리지가 예상된다. 그럼에도 불구하고, TET2 엑손 전체의 평균 커버리지는 염기 당 49개 리드였으며, 염기의 88.5%가 적어도 8개 리드로 커버되었다. 이는 변이 대립유전자 빈도(variant allele frequency, VAF)가 높은 돌연변이에 대한 변이 검출을 수행하기에 충분한 커버리지이다. 이는 세포주로부터 시퀀싱 데이터였기 때문에, 본 발명자들은 이전에 생어 시퀀싱을 사용하여 검증한 TET2 엑손에서 공지된 돌연변이를 검출하는 것을 목표로 하였다(도 13). 본 발명자들은 Varscan(버전 2.4.2)을 사용하여 데이터를 분석하였고 chr4:105276312(p = 1.6210-2)에서 G/A 돌연변이를 확인하였다(도 14).
그런 다음, 본 발명자들은 Varscan을 사용하여 모든 TET2 엑손을 분석하였고 KG-1 세포에서 이전에 공지되지 않은, 2개의 추가적인 단일 염기 다형성(single nucleotide polymorphism, SNP)을 식별하였다. 본 발명자들은 Cosmic 데이터베이스를 이용하여 이들이 인간에게서 발견되는 공지된 돌연변이임을 확인하였다(표 7).
Figure pct00007
결론
결론적으로, 본 발명자들은 DDAT 방법이 표적화 DNA 어댑터 태깅(targeted DNA adapter tagging, TDAT)에 맞게 조정되어 낮은 DNA 입력으로부터 특정 유전자에 대한 시퀀싱 데이터를 생성할 수 있음을 보여주었다. 이 데이터를 사용하여 인간 유전체에서 검증된 SNP인, KG-1 세포주에서 이전에 공지되지 않은 돌연변이를 식별하는 것이 가능하였다. TET2에 대한 표적-상 리드는 0.3%로 낮았지만(최적은 약 50%), 이는 실험에서 더 엄격한 프라이머 설계와 더 많은 프라이머를 사용함으로써 개선될 수 있다. 이전에 관련 방법을 사용한 연구에서는 낮은 DNA 입력에서 표적화 시퀀싱을 수행할 때 14,000개의 프라이머를 사용하였으므로, 낮은 입력에서 시작할 때 50%의 표적-상 리드를 생성하기에는 143개의 프라이머가 너무 적었을 수 있다.
서열목록
서열번호 1
CTACACGACGCTCTTCCGATCTNNNNNNNNN
서열번호 2
CAGACGTGTGCTCTTCCGATCTNNNNNNNNN
서열번호 3
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
서열번호 4
CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
서열번호 5
CAGACGTGTGCTCTTCCGATCTTTGAGATATGCCCATCTCCT
서열번호 6
CTACACGACGCTCTTCCGATCTNNNNNNNNN
<110> QUEEN MARY UNIVERSITY OF LONDON <120> METHODS FOR GENERATING A POPULATION OF POLYNUCLEOTIDE MOLECULES <130> PI220005EP <150> GB 1911515.3 <151> 2019-08-12 <160> 6 <170> PatentIn version 3.5 <210> 1 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <220> <221> misc_feature <222> (23)..(31) <223> wherein each "N" can be any nucleotide <400> 1 ctacacgacg ctcttccgat ctnnnnnnnn n 31 <210> 2 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <220> <221> misc_feature <222> (23)..(31) <223> wherein each "N" can be any nucleotide <400> 2 cagacgtgtg ctcttccgat ctnnnnnnnn n 31 <210> 3 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 3 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 4 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 4 caagcagaag acggcatacg agatcgtgat gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 5 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <400> 5 cagacgtgtg ctcttccgat ctttgagata tgcccatctc ct 42 <210> 6 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide primer <220> <221> misc_feature <222> (23)..(31) <223> wherein each "N" can be any nucleotide <400> 6 ctacacgacg ctcttccgat ctnnnnnnnn n 31

Claims (13)

  1. 적어도 하나의 폴리뉴클레오타이드(polynucleotide)를 포함하는 샘플로부터 이중-가닥 폴리뉴클레오타이드 분자의 집단(population)을 생성하는 방법으로, 상기 방법은 상기 적어도 하나의 폴리뉴클레오타이드에 아황산수소(bisulfite) 처리를 포함하지 않으며, 상기 방법은 다음 단계를 포함하는, 방법:
    a. 상기 적어도 하나의 폴리뉴클레오타이드를 변성(denaturing)시켜 단일 가닥 폴리뉴클레오타이드를 생산하는 단계;
    b. 상기 단계 a.의 단일 가닥 폴리뉴클레오타이드에 첫 번째 단일-가닥 올리고뉴클레오타이드를 어닐링(annealing)하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열(sequencing adaptor sequence) 및 프라이머 서열(primer sequence)을 포함하는 첫 번째 단일-가닥 올리고뉴클레오타이드와 함께 상기 단계 a.로부터의 단일 가닥 폴리뉴클레오타이드를 인큐베이션(incubating)하는 단계, 및 그 후 상기 프라이머를 중합효소(polymerase)로 신장(extending)하여 이중-가닥 폴리뉴클레오타이드를 생산하는 단계;
    c. 상기 단계 b.의 이중-가닥 폴리뉴클레오타이드를 변성시켜 단일 가닥 폴리뉴클레오타이드를 생산하는 단계; 및
    d. 상기 단계 c.의 단일 가닥 폴리뉴클레오타이드에 두 번째 단일-가닥 올리고뉴클레오타이드를 어닐링하는 데에 적합한 조건 하에서, 시퀀싱 어댑터 서열 및 프라이머 서열을 포함하는 두 번째 단일-가닥 올리고뉴클레오타이드와 함께 상기 단계 c.로부터의 단일 가닥 폴리뉴클레오타이드를 인큐베이션하는 단계, 및 그 후 상기 프라이머를 중합효소로 신장하여 이중-가닥 폴리뉴클레오타이드 분자의 집단(population)을 생산하는 단계.
  2. 제1항에 있어서, 상기 샘플에서 상기 적어도 하나의 폴리뉴클레오타이드가 RNA 또는 DNA이고/이거나 상기 이중-가닥 폴리뉴클레오타이드 분자의 집단이 RNA 또는 DNA인 것인, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 적어도 하나의 폴리뉴클레오타이드는 RNA이고, 상기 단계 b.에서 중합효소는 역전사효소(reverse transcriptase)이고, 및 상기 방법에 의해 생성된 집단에서 DNA 분자는 이중 가닥 cDNA 분자인 것인, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 샘플은 소량(low quantity)의 DNA 및/또는 낮은 품질(low quality)의 DNA를 포함하고, 선택적으로(optionally) 상기 샘플은 약 1 μg 이하, 바람직하게는 약 200 ng 이하, 가장 바람직하게는 약 2 ng 내지 약 10 ng 사이의 DNA를 포함하고, 및/또는 상기 DNA의 상당한 비율은 단편화되고, 손상되고, 및/또는 단일-가닥 형태인 것인, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 샘플은 포르말린-고정된 및 파라핀 포매된(formalin-fixed and paraffin embedded, FFPE) 물질인 것인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 첫 번째 변성시키는 단계 이전에 다음 단계를 포함하는, 방법:
    - 상기 샘플로부터 적어도 하나의 폴리뉴클레오타이드를 추출(extracting)하는 단계; 및/또는
    - 선택적으로는 DNA 글리코실가수분해효소(glycosylase)이고, 바람직하게는 SMUG1 (Single-strand selective monofunctional uracil DNA glycosylase) 및/또는 FPG (Formamidopyrimidine DNA glycosylase)로부터 선택되는, 적어도 하나의 염기 절제 수선(base excision repair) 효소로 적어도 하나의 폴리뉴클레오타이드로부터 손상된 염기를 제거하는 단계.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 다음인, 방법:
    - 상기 단계 b.는 상기 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 상기 단일 가닥 폴리뉴클레오타이드를 정제하는 단계 및/또는 핵산외부가수분해효소(exonuclease)로 어느 남아 있는 단일 가닥 올리고뉴클레오타이드를 제거하는 단계 및/또는 이중 가닥 폴리뉴클레오타이드를 정제하는 단계를 추가적으로 포함하고; 및/또는
    - 상기 단계 d.는 상기 첫 번째 단일 가닥 올리고뉴클레오타이드에 어닐링된 단일 가닥 폴리뉴클레오타이드를 정제하는 단계 및/또는 핵산외부가수분해효소로 어느 남아 있는 단일 가닥 올리고뉴클레오타이드를 제거하는 단계 및/또는 이중 가닥 폴리뉴클레오타이드를 정제하는 단계를 추가적으로 포함하고;
    어느 한 단계에서 상기 정제는 선택적으로 SPRI(solid phase reversible immobilisation) 비드를 사용한다.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 다음을 추가적으로 포함하는, 방법:
    e. 일반적으로(typically) 8 내지 12 사이클(cycle) 동안, PCR (polymerase chain reaction)에 의해 상기 단계 d.의 이중 가닥 폴리뉴클레오타이드를 증폭하는 단계; 및 선택적으로
    f. DNA를 시퀀싱(sequencing)하는 단계;
    상기 단계 e. 및 단계 f.는 첫 번째 및/또는 두 번째 단일 가닥 올리고뉴클레오타이드의 시퀀싱 어댑터 서열의 적어도 일부에 상보적인 프라이머를 사용한다.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 단계 b. 및/또는 단계 d.의 상기 신장(extending)은, 상기 중합효소의 최적 작동 온도까지 온도를 서서히 증가시키는 단계 및 신장이 실질적으로 완료될 때까지 상기 최적 작동 온도를 유지하는 단계 전에, 상기 단일 가닥 폴리뉴클레오타이드 및 상기 중합효소를 약 4℃에서 적합한 반응 혼합물과 함께 인큐베이션함으로써 실시되는 것인, 방법.
  10. 제9항에 있어서, 상기 중합효소의 상기 최적 작동 온도는 약 37℃이고 및 상기 온도는 약 4℃/분 이상의 속도에서 상기 온도로 증가되는 것인, 방법.
  11. 제10항에 있어서, 상기 중합효소는 클레나우 DNA 중합효소(Klenow DNA polymerase)인 것인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 첫 번째 단일-가닥 올리고뉴클레오타이드에서 상기 프라이머 및/또는 상기 두 번째 단일-가닥 올리고뉴클레오타이드에서 상기 프라이머는 다음인 것인, 방법:
    i. 선택적으로 랜덤 노나머(random nonamer) 올리고뉴클레오티드 서열을 포함하는, 랜덤 프라이머 서열; 또는
    ii. 선택적으로 20mer 올리고뉴클레오타이드 서열을 포함하는, 상기 폴리뉴클레오타이드 내의 관심 영역에 특이적인 프라이머 서열.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 첫 번째 및/또는 두 번째 단일 가닥 올리고뉴클레오타이드의 상기 시퀀싱 어댑터 서열은 다음 중 하나 이상을 포함하는 것인, 방법:
    - 시퀀싱 프라이머(sequencing primer)에 상보적인 서열;
    - 증폭 프라이머(amplification primer)에 상보적인 서열;
    - 바코드(barcode) 또는 인덱스(index) 서열; 및/또는
    - 고체 표면에 대한 부착을 촉진시키는 서열, 선택적으로 상기 서열은 상기 표면에 부착된 올리고뉴클레오타이드에 상보적이다.
KR1020227008282A 2019-08-12 2020-08-12 폴리뉴클레오타이드 분자 집단의 생성 방법 KR20220063169A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1911515.3A GB201911515D0 (en) 2019-08-12 2019-08-12 Methods for generating a population of polynucleotide molecules
GB1911515.3 2019-08-12
PCT/GB2020/051917 WO2021028682A1 (en) 2019-08-12 2020-08-12 Methods for generating a population of polynucleotide molecules

Publications (1)

Publication Number Publication Date
KR20220063169A true KR20220063169A (ko) 2022-05-17

Family

ID=67874472

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227008282A KR20220063169A (ko) 2019-08-12 2020-08-12 폴리뉴클레오타이드 분자 집단의 생성 방법

Country Status (8)

Country Link
US (1) US20220325317A1 (ko)
EP (1) EP4013891A1 (ko)
JP (1) JP2022544779A (ko)
KR (1) KR20220063169A (ko)
AU (1) AU2020327667A1 (ko)
CA (1) CA3147490A1 (ko)
GB (1) GB201911515D0 (ko)
WO (1) WO2021028682A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4034676A1 (en) 2020-07-30 2022-08-03 Cambridge Epigenetix Limited Compositions and methods for nucleic acid analysis

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004029560D1 (de) * 2003-03-07 2010-11-25 Rubicon Genomics Inc Amplifikation und analyse von gesamtgenom- und gesamttranskriptom- bibliotheken, die durch ein dns-polymerisierungsverfahren produziert wurden
CN103060924B (zh) * 2011-10-18 2016-04-20 深圳华大基因科技有限公司 微量核酸样本的文库制备方法及其应用
US20150329855A1 (en) * 2011-12-22 2015-11-19 Ibis Biosciences, Inc. Amplification primers and methods

Also Published As

Publication number Publication date
EP4013891A1 (en) 2022-06-22
GB201911515D0 (en) 2019-09-25
US20220325317A1 (en) 2022-10-13
JP2022544779A (ja) 2022-10-21
AU2020327667A1 (en) 2022-03-03
WO2021028682A1 (en) 2021-02-18
CA3147490A1 (en) 2021-02-18

Similar Documents

Publication Publication Date Title
US11999949B2 (en) Methods for targeted genomic analysis
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
JP6803327B2 (ja) 標的化されたシークエンシングからのデジタル測定値
EP2619329B1 (en) Direct capture, amplification and sequencing of target dna using immobilized primers
US8034568B2 (en) Isothermal nucleic acid amplification methods and compositions
EP2964778B1 (en) Detection of genomic rearrangements by sequence capture
US8986958B2 (en) Methods for generating target specific probes for solution based capture
KR20080005188A (ko) 선별 프로브 증폭
AU2018252018A1 (en) Methods of attaching adapters to sample nucleic acids
JP2007530026A (ja) 核酸配列決定
EP3464575A1 (en) Transposase-random priming dna sample preparation
US20220267848A1 (en) Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion
US20160258002A1 (en) Synthesis of Pools of Probes by Primer Extension
US20230374574A1 (en) Compositions and methods for highly sensitive detection of target sequences in multiplex reactions
US20180100180A1 (en) Methods of single dna/rna molecule counting
US20220325317A1 (en) Methods for generating a population of polynucleotide molecules
WO2018081666A1 (en) Methods of single dna/rna molecule counting
CN110468179B (zh) 选择性扩增核酸序列的方法

Legal Events

Date Code Title Description
A201 Request for examination