KR102506635B1 - Rna 시퀀싱 방법 - Google Patents

Rna 시퀀싱 방법 Download PDF

Info

Publication number
KR102506635B1
KR102506635B1 KR1020227004475A KR20227004475A KR102506635B1 KR 102506635 B1 KR102506635 B1 KR 102506635B1 KR 1020227004475 A KR1020227004475 A KR 1020227004475A KR 20227004475 A KR20227004475 A KR 20227004475A KR 102506635 B1 KR102506635 B1 KR 102506635B1
Authority
KR
South Korea
Prior art keywords
region
nucleotides
homopolymer
primer
sequence
Prior art date
Application number
KR1020227004475A
Other languages
English (en)
Other versions
KR20220025201A (ko
Inventor
플로리안 오베르스트라스
길라드 알모기
Original Assignee
울티마 제노믹스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울티마 제노믹스, 인크. filed Critical 울티마 제노믹스, 인크.
Priority to KR1020237007303A priority Critical patent/KR20230035702A/ko
Publication of KR20220025201A publication Critical patent/KR20220025201A/ko
Application granted granted Critical
Publication of KR102506635B1 publication Critical patent/KR102506635B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/107RNA dependent DNA polymerase,(i.e. reverse transcriptase)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/173Modifications characterised by incorporating a polynucleotide run, e.g. polyAs, polyTs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/185Modifications characterised by incorporating bases where the precise position of the bases in the nucleic acid string is important
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 본원에 기재되어 있다. 시퀀싱된 폴리뉴클레오티드는 바코드 영역, 호모폴리머 영역 (예를 들어, 폴리-A 영역), 및 mRNA 분자와 연관된 표적 영역을 포함할 수 있다. 일부 방법에 따라, 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략한다. 일부 방법에 따라, 시퀀싱에 사용되는 프라이머의 연장은 호모폴리머 영역 내에서 중단된다. 일부 방법에 따라, 시퀀싱 흐름 사이클 및 폴리뉴클레오티드의 상이한 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성된다. 일부 방법에 따라, 2개의 프라이머 또는 절단가능한 프라이머가 바코드 영역 및 표적 영역을 별도로 시퀀싱하기 위해 사용된다.

Description

RNA 시퀀싱 방법
관련 출원에 대한 상호 참조
본 출원은 2019년 7월 10일에 출원된 미국 가출원 번호 62/872,558을 우선권 주장하며, 이는 모든 목적을 위해 본원에 참조로 포함된다.
발명의 분야
mRNA 분자 내의 관심 영역을 시퀀싱하는 방법이 본원에 기재되어 있다.
메신저 RNA (mRNA) 시퀀싱은 실시간 유전자 발현, 상이한 조직에서의 유전자 발현 프로파일, 및 유전자 발현 수준에 대한 정보를 제공할 수 있다. 특정 유전자의 발현 수준의 변동은 환경 자극에 대한 반응으로, 상이한 발달 단계 동안, 또는 질환과의 인과 또는 효과 관계에 따라 달라질 수 있다.
직접 mRNA 시퀀싱은 어렵고, 표적화된 mRNA 분자는 전형적으로 역전사효소를 사용하여 상보적 DNA (cDNA) 분자로 역전사된다. 그 후, cDNA 분자는 원래의 mRNA 분자에 대한 시퀀싱 정보를 제공하기 위해 시퀀싱된다. 진핵생물 mRNA는 일반적으로 mRNA 분자의 3' 말단에 폴리(A) 꼬리를 포함하며, 이는 cDNA 분자의 5' 말단에 있는 폴리(T) 영역에 의해 반영된다. 임의로, cDNA 분자에 상보적인 DNA 가닥이 합성되어, DNA 분자의 3' 말단에 폴리(A) 꼬리가 생성된다.
특정의 고도로 효율적인 시퀀싱 방법은 핵산 분자를 시퀀싱하기 위해 비종결 뉴클레오티드를 사용한다. 이들 시퀀싱 방법은 "흐름 시퀀싱", "합성에 의한 자연 시퀀싱", 또는 "합성에 의한 비종결 시퀀싱" 방법으로 지칭될 수 있다 (예를 들어, 미국 특허 번호 8,772,473을 참조하며, 이는 그 전문이 본원에 참조로 포함됨).
발명의 간단한 요약
mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 본원에 기재되어 있다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략하는 것인 단계; (b) 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기가 결여된 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 단계 (b)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (c)에서 사용된 뉴클레오티드는 비종결 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (d)에서 사용된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (b)에서 사용된 표지된 뉴클레오티드는 동일한 염기의 비표지된 뉴클레오티드와 혼합된다. 일부 실시양태에서, 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드는 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 영역의 서열은 비표지된 뉴클레오티드 및 표지된 뉴클레오티드의 혼합물을 사용하여 결정된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 바코드 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 각 폴리뉴클레오티드의 표적 영역은 고유한 바코드 영역과 연관된다. 일부 실시양태에서, 단계 (b), 단계 (c) 또는 단계 (d)에서 사용된 총 뉴클레오티드의 50% 이하가 표지된다. 일부 실시양태에서, 단계 (c)에서 사용된 총 뉴클레오티드의 0.1% 이하가 표지된다. 일부 실시양태에서, 방법은 프라이머가 호모폴리머 영역의 말단으로 연장될 때까지 단계 (c)를 1회 이상 반복하는 것을 추가로 포함하고, 여기서 비혼입된 뉴클레오티드는 반복되는 단계 사이에서 제거된다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제1 비율로 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제2 비율로 호모폴리머 영역에 존재하는 염기에 상보적인 표지된 뉴클레오티드를 사용하여 프라이머를 연장하는 단계이며, 여기서 제2 비율은 제1 비율보다 크고, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단되는 것인 단계; (d) 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역의 말단으로 프라이머를 연장하는 단계; 및 (e) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 단계 (b)에서 사용된 표지된 뉴클레오티드 및 비표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드 및 비종결 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (c)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (d)에서 사용된 비표지된 뉴클레오티드는 비종결 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (e)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 영역의 서열은 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 사용하여 결정된다. 일부 실시양태에서, 단계 (b) 또는 (e)에서 사용된 뉴클레오티드의 50% 이하가 표지된다. 일부 실시양태에서, 단계 (c)에서 사용된 뉴클레오티드의 50% 초과가 표지된다. 일부 실시양태에서, 단계 (d)에서 사용된 뉴클레오티드의 0.1% 이하가 표지된다. 일부 실시양태에서, 단계 (d)에서 사용된 모든 뉴클레오티드가 비표지된다. 일부 실시양태에서, 단계 (d)는 비혼입된 뉴클레오티드를 반복적으로 제거하고 프라이머가 호모폴리머 영역의 말단으로 연장될 때까지 새로운 뉴클레오티드를 1회 이상 첨가하는 것을 포함한다. 일부 실시양태에서, 각 폴리뉴클레오티드의 표적 영역은 고유한 바코드 영역과 연관된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 바코드 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 표적 영역은 고유한 바코드 영역과 연관되는 것인 단계; (b) 복수의 미리 결정된 사이클에서 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계이며, 여기서 미리 결정된 사이클 및 폴리뉴클레오티드의 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성되는 것인 단계; (c) 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 단계 (b)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (c)에서 사용된 비표지된 뉴클레오티드는 비종결 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (d)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (b) 또는 단계 (d)에서 사용된 표지된 뉴클레오티드는 동일한 염기의 비표지된 뉴클레오티드와 혼합된다. 일부 실시양태에서, 단계 (b) 또는 단계 (d)에서 사용된 뉴클레오티드의 50% 이하가 표지된다. 일부 실시양태에서, 단계 (c)에서 사용된 뉴클레오티드의 0.1% 이하가 표지된다. 일부 실시양태에서, 단계 (c)에서 사용된 모든 뉴클레오티드가 비표지된다. 일부 실시양태에서, 방법은 프라이머가 호모폴리머 영역의 말단으로 연장될 때까지 단계 (c)를 1회 이상 반복하는 것을 추가로 포함하고, 여기서 비혼입된 뉴클레오티드는 단계 (c)를 반복하기 전에 제거된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 각 폴리뉴클레오티드의 표적 영역은 고유한 바코드 영역과 연관된다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 제1 프라이머와 혼성화하여 복수의 제1 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 복수의 폴리뉴클레오티드를 제2 프라이머와 혼성화하여 복수의 제2 혼성화된 주형을 형성하는 단계이며, 여기서 제2 프라이머는 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역을 포함하는 것인 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 단계 (b)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (d)에서 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (b) 또는 단계 (d)에서 사용된 표지된 뉴클레오티드는 동일한 염기의 비표지된 뉴클레오티드와 혼합된다. 일부 실시양태에서, 단계 (c) 및 단계 (d)는 단계 (a) 및 단계 (b) 전에 수행된다. 일부 실시양태에서, 단계 (a) 및 단계 (b)는 단계 (c) 및 단계 (d) 전에 수행된다. 일부 실시양태에서, 방법은 단계 (b) 후에 제1 프라이머를 제거하거나 단계 (d) 후에 제2 프라이머를 제거하는 단계를 포함한다. 일부 실시양태에서, 제2 프라이머는 프라이머의 3' 말단에 3' 앵커를 포함하고, 3' 앵커는 제2 프라이머의 호모폴리머 영역에 존재하는 염기 이외의 염기를 포함한다. 일부 실시양태에서, 제2 프라이머는 프라이머의 5' 말단에 5' 앵커를 포함하고, 여기서 앵커는 링커를 통해 제2 프라이머의 호모폴리머 영역에 공유결합으로 결합된다. 일부 실시양태에서, 5' 앵커는 제1 프라이머의 적어도 일부와 동일한 서열을 포함하는 핵산 세그먼트를 포함한다. 일부 실시양태에서, 링커는 하나 이상의 핵산을 포함한다. 일부 실시양태에서, 링커는 PEG 포스포라미다이트 링커이다. 일부 실시양태에서, 방법은 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 제2 프라이머를 연장하는 단계를 추가로 포함한다. 일부 실시양태에서, 호모폴리머 영역 내에서 제2 프라이머를 연장하는데 사용된 뉴클레오티드는 비종결 뉴클레오티드를 포함한다. 일부 실시양태에서, 호모폴리머 영역 내에서 제2 프라이머를 연장하는데 사용된 뉴클레오티드는 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 영역 또는 바코드 영역의 서열은 비표지된 뉴클레오티드 및 표지된 뉴클레오티드의 혼합물을 사용하여 결정된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 각 폴리뉴클레오티드의 표적 영역은 고유한 바코드 영역과 연관된다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계로서; 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고; 여기서 프라이머는 제1 프라이머 세그먼트, 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 염기를 포함하는 호모폴리머 영역을 포함하는 제2 프라이머 세그먼트, 및 제1 프라이머 세그먼트와 제2 프라이머 세그먼트 사이의 절단가능한 링커를 포함하는 것인 단계; (b) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계; (c) 절단가능한 링커에서 프라이머를 절단하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계. 일부 실시양태에서, 단계 (b)에서 표적 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (d)에서 바코드 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (b) 또는 단계 (d)에서 사용된 표지된 뉴클레오티드는 동일한 염기의 비표지된 뉴클레오티드와 혼합된다. 일부 실시양태에서, 절단가능한 링커는 하나 이상의 핵산을 포함한다. 일부 실시양태에서, 절단가능한 링커는 우라실 염기를 포함하고, 여기서 프라이머는 프라이머를 우라실-특이적 절단 효소와 접촉시킴으로써 절단된다. 일부 실시양태에서, 방법은 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 제2 프라이머 세그먼트를 연장하는 단계를 추가로 포함한다. 일부 실시양태에서, 호모폴리머 영역 내에서 제2 프라이머 세그먼트를 연장하는데 사용된 뉴클레오티드는 비종결 뉴클레오티드를 포함한다. 일부 실시양태에서, 호모폴리머 영역 내에서 제2 프라이머 세그먼트를 연장하는데 사용된 뉴클레오티드는 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 영역 또는 바코드 영역의 서열은 비표지된 뉴클레오티드 및 표지된 뉴클레오티드의 혼합물을 사용하여 결정된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기는 별개로 사용된다. 일부 실시양태에서, 각 폴리뉴클레오티드의 표적 영역은 고유한 바코드 영역과 연관된다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 여기서 폴리뉴클레오티드는 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 동일한 염기의 뉴클레오티드를 사용하여 프라이머를 호모폴리머 영역으로 연장하고, 여기서 프라이머는 호모폴리머 영역 내에서 중단되고, 비혼입된 뉴클레오티드를 제거하는 단계; (c) 단계 (b)를 1회 이상 반복하여 호모폴리머 영역을 통해 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 단계 (b)에서 프라이머를 연장하는데 사용된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (d)에서 표적 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드는 비종결 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (b)에서 사용된 뉴클레오티드는 표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 단계 (b)에서 사용된 뉴클레오티드는 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 영역의 서열은 비표지된 뉴클레오티드 및 표지된 뉴클레오티드의 혼합물을 사용하여 결정된다. 일부 실시양태에서, 폴리뉴클레오티드는 바코드 영역을 추가로 포함하고, 여기서 표적 영역은 고유한 바코드 영역과 연관되고, 방법은 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계를 추가로 포함한다.
상기 방법 중 어느 하나의 일부 실시양태에서, 폴리뉴클레오티드의 호모폴리머 영역 내 염기는 아데닌 또는 티민 염기이다.
상기 방법 중 어느 하나의 일부 실시양태에서, 폴리뉴클레오티드의 호모폴리머 영역은 적어도 8개의 인접하고 동일한 염기를 포함한다. 일부 실시양태에서, 폴리뉴클레오티드의 호모폴리머 영역은 적어도 50개의 인접하고 동일한 염기를 포함한다.
상기 방법 중 어느 하나의 일부 실시양태에서, 바코드 영역은 샘플 바코드를 포함한다.
상기 방법 중 어느 하나의 일부 실시양태에서, 방법은 바코드 영역의 결정된 서열을 동일한 표적 핵산 분자로부터의 mRNA 코딩 영역과 연관된 결정된 서열과 연관시키는 단계를 추가로 포함한다.
상기 방법 중 어느 하나의 일부 실시양태에서, 폴리뉴클레오티드는 cDNA 분자이다.
상기 방법 중 어느 하나의 일부 실시양태에서, mRNA 분자의 관심 영역은 mRNA 분자의 코딩 영역을 포함한다.
상기 방법 중 어느 하나의 일부 실시양태에서, mRNA 분자의 관심 영역은 mRNA 분자의 3'-비번역 영역 또는 5'-비번역 영역을 포함한다.
도 1은 본원에 기재된 방법을 사용하여 시퀀싱될 수 있는 폴리뉴클레오티드를 수득하기 위한 예시적인 방법을 예시한다.
도 2a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략한다.
도 2b는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여주며, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략한다.
도 3a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단된다.
도 3b는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여주며, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단된다.
도 4a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 흐름 사이클 및 폴리뉴클레오티드의 상이한 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성된다.
도 4b는 상이한 바코드 영역 서열을 갖지만 동일한 흐름 길이를 갖는 다중 폴리뉴클레오티드를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여준다.
도 5a는 2개의 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여준다.
도 5b는 2개의 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여준다.
도 5c는 2개의 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 또 다른 예시적인 방법의 흐름 차트를 보여주며, 여기서 폴리뉴클레오티드에 혼성화된 2개의 프라이머의 서열은 도 5a에 표시된 예시적인 방법과 비교하여 역전된다.
도 5d는 2개의 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여주며, 여기서 폴리뉴클레오티드에 혼성화된 2개의 프라이머의 서열은 도 5a에 표시된 예시적인 방법과 비교하여 역전된다.
도 6a는 절단가능한 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여준다.
도 6b는 절단가능한 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여준다.
도 7a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 프라이머 연장은 폴리뉴클레오티드의 호모폴리머 영역 내에서 중단되고 재개된다.
도 7b는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법을 그래프 형태로 보여주며, 여기서 프라이머 연장은 폴리뉴클레오티드의 호모폴리머 영역 내에서 중단되고 재개된다.
도 8은 바코드 영역, 호모폴리머 영역 및 관심 영역을 포함하는 3개의 예시적인 서열에 대한 시퀀싱 흐름 매트릭스 및 신호 트레이스를 보여준다.
발명의 상세한 설명
mRNA 분자 내의 관심 영역 (예를 들어, 코딩 영역, 3' 비번역 영역 (3'-UTR), 및/또는 5' 비번역 영역 (5'-UTR))의 서열을 결정하는 방법이 본원에 기재되어 있다. 방법은 호모폴리머 영역 (예를 들어, 폴리-A 영역 또는 그의 상보체, 폴리-T 영역)의 전체 또는 실질적인 부분의 시퀀싱을 피하면서 mRNA 분자 내의 관심 영역의 시퀀싱을 허용한다. mRNA 분자의 폴리-A 영역은 일반적으로 mRNA 서열 또는 유전자 발현 수준에 대한 유의한 정보를 제공하지 않기 때문에 흥미롭지 않고 유익하지 않은 것으로 간주된다. 따라서, 폴리뉴클레오티드의 보다 유익한 영역에 도달하기 위해 호모폴리머 영역을 통해 시퀀싱 프라이머를 연장하는데 필요한 비용 또는 시간을 줄이는데 실질적인 이점이 있다. 예를 들어, 비표지된 뉴클레오티드 대응부보다 실질적으로 더 비싼 표지된 뉴클레오티드의 사용을 줄이거나 제거하면서 시퀀싱 프라이머를 연장함으로써 비용을 줄일 수 있다. 또한, 각 혼입된 염기에 대한 검출 단계를 건너뛰고 프라이머가 호모폴리머 영역을 통해 지속적으로 연장하도록 허용함으로써 시퀀싱 프라이머 연장 시간을 줄일 수 있다.
시퀀싱된 폴리뉴클레오티드는 예를 들어, 샘플 바코드 및/또는 고유한 분자 식별자 (UMI)를 포함할 수 있는 바코드 영역을 포함할 수 있다. 호모폴리머 영역은 바코드 영역 및 mRNA 분자 내 관심 영역 사이의 폴리뉴클레오티드에 위치될 수 있다. 이는 서열에 대한 지식이 필요한 두 영역 (즉, 바코드 영역 및 mRNA 분자로부터의 관심 영역)이 흥미롭지 않은 영역 (호모폴리머 영역)에 의해 분리되는 상황을 초래한다. 본원에 기재된 방법 중 일부는 호모폴리머 영역의 존재에 의해 야기되는 파괴를 최소화하면서 바코드 영역 및 관심 mRNA 영역 둘 모두의 시퀀싱을 허용한다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략하는 것인 단계; (b) 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기가 결여된 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 임의로, 뉴클레오티드는 비종결 뉴클레오티드이다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제1 비율로 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제2 비율로 호모폴리머 영역에 존재하는 염기에 상보적인 표지된 뉴클레오티드를 사용하여 프라이머를 연장하는 단계이며, 여기서 제2 비율은 제1 비율보다 크고, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단되는 것인 단계; (d) 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역의 말단으로 프라이머를 연장하는 단계; 및 (e) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 임의로, 뉴클레오티드는 비종결 뉴클레오티드이다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 표적 영역은 고유한 바코드 영역과 연관되는 것인 단계; (b) 복수의 미리 결정된 사이클에서 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계이며, 여기서 미리 결정된 사이클 및 폴리뉴클레오티드의 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성되는 것인 단계; (c) 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 임의로, 뉴클레오티드는 비종결 뉴클레오티드이다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 제1 프라이머와 혼성화하여 복수의 제1 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 복수의 폴리뉴클레오티드를 제2 프라이머와 혼성화하여 복수의 제2 혼성화된 주형을 형성하는 단계이며, 여기서 제2 프라이머는 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역을 포함하는 것인 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 임의로, 뉴클레오티드는 비종결 뉴클레오티드이다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계로서; 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고; 여기서 프라이머는 제1 프라이머 세그먼트, 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 염기를 포함하는 호모폴리머 영역을 포함하는 제2 프라이머 세그먼트, 및 제1 프라이머 세그먼트와 제2 프라이머 세그먼트 사이의 절단가능한 링커를 포함하는 것인 단계; (b) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계; (c) 절단가능한 링커에서 프라이머를 절단하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계. 임의로, 뉴클레오티드는 비종결 뉴클레오티드이다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 여기서 폴리뉴클레오티드는 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 동일한 염기의 뉴클레오티드를 사용하여 프라이머를 호모폴리머 영역으로 연장하고, 여기서 프라이머는 호모폴리머 영역 내에서 중단되고, 비혼입된 뉴클레오티드를 제거하는 단계; (c) 단계 (b)를 1회 이상 반복하여 호모폴리머 영역을 통해 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 임의로, 뉴클레오티드는 비종결 뉴클레오티드이다.
정의
본원에서 사용된 바와 같이, 단수 형태 "하나"는 문맥이 명백하게 달리 지시하지 않는 한 복수의 지시대상을 포함한다.
본원에서 "약" 값 또는 파라미터에 대한 언급은 해당 값 또는 파라미터 그 자체에 대한 변경을 포함 (및 기재)한다. 예를 들어, "약 X"를 언급하는 기재는 "X"의 기재를 포함한다.
용어 "개체," "환자" 및 "대상체"는 동의어로 사용되고, 인간을 포함하는 동물을 지칭한다.
본원에서 사용된 바와 같은 용어 "표지"는 또 다른 모이어티, 예를 들어 뉴클레오티드 또는 뉴클레오티드 유사체에 커플링되거나 커플링될 수 있는 검출가능한 모이어티를 지칭한다. 표지는 표지의 존재 또는 부재가 검출될 수 있도록 신호를 방출하거나 표지에 전달된 신호를 변경할 수 있다. 일부 경우에, 커플링은 절단가능, 예컨대 광-절단가능 (예를 들어, 자외선 하에 절단가능), 화학적으로-절단가능 (예를 들어, 환원제, 예컨대 디티오트레이톨 (DTT), 트리스(2-카르복시에틸)포스핀 (TCEP)을 통해) 또는 효소적으로 절단가능 (예를 들어, 에스테라제, 리파제, 펩티다제, 또는 프로테아제를 통해)할 수 있는 링커를 통해 이루어질 수 있다.
"비종결 뉴클레오티드"는 폴리머라제 또는 전사효소를 사용하여 폴리뉴클레오티드의 3' 말단에 부착될 수 있고, 뉴클레오티드로부터 보호기 또는 가역적 종결자를 제거할 필요 없이 폴리머라제 또는 전사효소를 사용하여 이에 부착된 또 다른 비종결 핵산을 가질 수 있는 핵산 모이어티이다. 자연 발생 핵산은 일종의 비종결 핵산이다. 비종결 핵산은 표지되거나 비표지될 수 있다.
본원에 기재된 본 발명의 측면 및 변경은 측면 및 변경으로 "이루어진" 및/또는 "본질적으로 이루어진"을 포함하는 것으로 이해된다.
값의 범위가 제공되는 경우, 해당 범위의 상한 및 하한 사이의 각 개재 값, 및 해당 언급 범위 내의 임의의 다른 언급된 또는 개재 값은 본 개시내용의 범위 내에 포함되는 것으로 이해되어야 한다. 언급된 범위가 상한 또는 하한을 포함하는 경우, 포함된 한계 중 어느 하나를 제외한 범위가 또한 본 개시내용에 포함된다.
본원에서 사용된 섹션 제목은 조직화 목적만을 위한 것이며, 설명된 주제를 제한하는 것으로 해석되어서는 안된다. 설명은 관련 기술분야의 통상의 기술자가 본 발명을 만들고 사용할 수 있도록 제공되며 특허 출원 및 그 요건의 문맥에서 제공된다. 설명된 실시양태에 대한 다양한 변형은 관련 기술분야의 통상의 기술자에게 쉽게 명백할 것이고, 본원에서 일반적인 원리는 다른 실시양태에 적용될 수 있다. 그러므로, 본 발명은 표시된 실시양태에 제한되도록 의도되지 않지만, 본원에 기재된 원리 및 특징과 일치하는 가장 넓은 범위가 부여되어야 한다.
도 1-8은 다양한 실시양태에 따른 공정을 예시한다. 예시적인 공정에서, 일부 블록은 임의로 조합되고, 일부 블록의 순서는 임의로 변경되고, 일부 블록은 임의로 생략된다. 일부 예에서, 추가 단계는 예시적인 공정과 조합하여 수행될 수 있다. 따라서, 예시된 (및 아래에서 더 자세히 설명된) 바와 같은 작동은 본래 예시적인 것이며, 이와 같이 제한적인 것으로 간주되어서는 안된다.
본원에 언급된 모든 간행물, 특허 및 특허 출원의 개시내용은 각각 그 전문이 본원에 참조로 포함된다. 참조로 포함된 임의의 참고문헌이 본 개시내용과 충돌하는 범위 내에서는 본 개시내용이 우선한다.
폴리뉴클레오티드
본원에 기재된 방법에서 사용된 폴리뉴클레오티드는 호모폴리머 영역 및 표적 영역을 포함할 수 있다. 일부 실시양태에서, 폴리뉴클레오티드는 바코드 영역을 추가로 포함한다. 일반적으로, 폴리뉴클레오티드는 예를 들어 역전사효소 효소로부터 상보적 DNA (cDNA) 분자를 생성함으로써 mRNA 분자로부터 유래된다. 일부 실시양태에서, 폴리뉴클레오티드는 cDNA 분자의 상보체이다. 복수의 폴리뉴클레오티드는 복수의 mRNA 분자로부터 유래될 수 있고, 상이한 폴리뉴클레오티드는 상이한 mRNA 분자를 반영하는 서열을 포함할 수 있다. 상이한 mRNA 분자가 관심 영역에 대한 상이한 서열 및/또는 상이한 호모폴리머 (예를 들어, 폴리-A 영역) 길이를 포함할 수 있는 것처럼, 폴리뉴클레오티드도 상이한 표적 영역 및/또는 상이한 호모폴리머 길이를 포함할 수 있다.
폴리뉴클레오티드의 표적 영역은 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함한다. 서열은 예를 들어 mRNA 분자로부터의 관심 영역과 동일하거나 상보적일 수 있다. 관심 영역은 mRNA 분자로부터의 하나 이상의 3'-UTR, 5'-UTR, 및/또는 코딩 영역, 또는 이들 영역 중 어느 하나의 부분을 포함할 수 있다.
폴리뉴클레오티드는 호모폴리머 영역 (예를 들어, 폴리-A 또는 폴리-T 영역)을 포함하며, 이는 mRNA 분자 또는 그의 상보체 내 폴리-A 영역을 대표한다. 일부 실시양태에서, 폴리뉴클레오티드의 호모폴리머 영역은 약 5개 염기 이상의 길이, 약 8개 염기 이상의 길이, 약 10개 염기 이상의 길이, 약 20개 염기 이상의 길이, 약 30개 염기 이상의 길이, 약 40개 염기 이상의 길이, 약 50개 염기 이상의 길이, 약 100개 염기 이상의 길이, 또는 약 200개 염기 이상의 길이이다. 일부 실시양태에서, 폴리뉴클레오티드의 호모폴리머 영역은 약 5개 염기 내지 약 200개 염기 길이, 예컨대 약 5개 염기 내지 약 8개 염기 길이, 약 8개 염기 내지 약 10개 염기 길이, 약 10개 염기 내지 약 20개 염기 길이, 약 20개 염기 내지 약 30개 염기 길이, 약 30개 염기 내지 약 40개 염기 길이, 약 40개 염기 내지 약 50개 염기 길이, 약 50개 염기 내지 약 100개 염기 길이, 또는 약 100개 염기 내지 약 200개 염기 길이이다.
일부 실시양태에서, 폴리뉴클레오티드는 바코드 영역 (예를 들어, 샘플 바코드 및/또는 UMI)을 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 상이한 mRNA 분자로부터 유래되고, 따라서 상이한 mRNA 분자로부터의 상이한 관심 표적 영역을 포함할 수 있고, 존재하는 경우, 원래의 mRNA 분자를 고유하게 식별하기 위해 상이한 바코드 영역을 포함할 수 있다. 일부 실시양태에서, 바코드 영역은 샘플 바코드를 포함한다. 샘플 바코드는 주어진 샘플에 대해 고유할 수 있으며, 따라서 동일한 샘플 (예를 들어, 동일한 환자, 환자의 동일한 조직, 또는 동일한 세포로부터)에 사용되는 캡처 프라이머에 걸쳐 공통적일 수 있다. 그러므로, 상이한 샘플로부터의 폴리뉴클레오티드는 다중화된 시퀀싱을 위해 조합될 수 있고, 임의의 주어진 시퀀싱된 폴리뉴클레오티드의 공급원은 샘플 바코드에 기초하여 결정될 수 있다.
일부 실시양태에서, 폴리뉴클레오티드의 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치된다. 예를 들어, 일부 실시양태에서, 호모폴리머 영역의 5' 말단은 표적 영역의 3' 말단에 근접하고, 호모폴리머 영역의 3' 말단은 바코드 영역의 5' 말단에 근접한다. 일부 실시양태에서, 호모폴리머 영역의 3' 말단은 표적 영역의 5' 말단에 근접하고, 호모폴리머 영역의 5' 말단은 바코드 영역의 3' 말단에 근접한다. 일부 실시양태에서, 바코드 영역 및 호모폴리머 영역 사이에 개재 염기가 없다. 일부 실시양태에서, 호모폴리머 영역 및 표적 영역 사이에 개재 염기가 없다.
mRNA는 캡처 프라이머 (예컨대 DNA 캡처 프라이머)를 사용하여 생물학적 샘플 (예를 들어, 혈액 샘플, 세포 샘플, 조직 샘플, 또는 다른 생물학적 샘플로부터 유래된 샘플)로부터 단리될 수 있다. 예를 들어, 혈액 샘플을 채취하거나 조직 샘플을 생검하여 생물학적 샘플을 수득할 수 있다. 일부 실시양태에서, 생물학적 샘플은 단일 세포이고, 단일 세포로부터의 mRNA는 공통 샘플 바코드 (예를 들어, 단일-세포 RNA 시퀀싱, 또는 "scRNA-seq")로 표지될 수 있다. 일부 실시양태에서, 캡처 프라이머는 폴리-T 서열을 포함하며, 이는 mRNA의 3' 말단에서 폴리-A 꼬리에 혼성화한다. 캡처 프라이머는 표면, 예컨대 비드 또는 다른 부착 표면에 결합될 수 있고, 비결합된 핵산 분자 또는 다른 생물학적 파편은 제거될 수 있다. 일부 실시양태에서, 캡처 프라이머는 바코드 영역을 포함할 수 있다. 바코드 영역은 고유한 분자 식별자 (UMI)를 포함할 수 있으며, 이는 특정 캡처 프라이머에 혼성화된 mRNA 분자와 연관되게 된다. 그러므로, 복수의 상이한 mRNA 분자는 고유한 바코드 영역으로 캡처될 수 있다.
mRNA 분자에 혼성화된 캡처 프라이머는 역전사효소를 사용하여 연장되어 cDNA 분자를 생성할 수 있다. 바코드가 최종 폴리뉴클레오티드에 존재하는 경우, cDNA 분자는 캡처 프라이머의 바코드 영역과 함께 폴리-T 호모폴리머 영역을 포함한다. 일부 실시양태에서, cDNA 분자의 상보체가 생성되고, cDNA 분자 및/또는 cDNA 분자의 상보체가 시퀀싱을 위한 주형으로 사용된다. 일부 실시양태에서, 캡처 프로브 내 폴리-T 호모폴리머 영역은 약 5개 염기 길이 내지 약 50개 염기 길이, 예컨대 약 10 내지 약 30개 염기 길이, 또는 약 20개 염기 길이이다.
도 1은 본원에 기재된 방법을 사용하여 시퀀싱될 수 있는 폴리뉴클레오티드를 수득하기 위한 예시적인 방법을 예시한다. mRNA 분자 (102)는 표적 영역 (104) 및 표적 영역 (102)의 3' 말단에 근접한 폴리-A 호모폴리머 영역 (106)을 포함한다. 표적 영역은 3'-UTR (108), 코딩 영역 (110), 및 5'-UTR을 포함할 수 있다. 샘플로부터 수득된 mRNA 분자 (102)는 캡처 프로브 (116)에 혼성화될 수 있으며, 이는 일반적으로 표면 (114), 예컨대 비드 또는 다른 적합한 표면에 융합된다. 캡처 프로브 (116)는 캡처 프로브 (116)를 표면 (114)에 부착하는 연결 영역 (118), 바코드 영역 (120) (임의), 및 폴리-T 호모폴리머 영역 (122)을 포함한다. 캡처 프로브의 폴리-T 호모폴리머 영역 (122)은 mRNA 분자의 폴리-A 호모폴리머 영역 (106)에 혼성화한다. mRNA 분자 (102)에 혼성화된 부착된 캡처 프로브 (116)를 포함하는 표면 (114)은 샘플로부터 캡처되지 않은 폴리뉴클레오티드 또는 다른 물질을 제거하기 위해 세척될 수 있다. mRNA 분자 (102)를 주형으로 사용하여 캡처 프로브 (116)를 연장하기 위한 역전사효소 (124). 이는 mRNA 분자 (102)의 표적 영역에 상보적인 표적 영역 (128), 폴리 T 호모폴리머 영역 (122) 및 바코드 영역 (120)을 포함하는 cDNA 분자 (126)를 생성한다. 연결 영역 (118)은 표면 (114)으로부터 절단되어, 이에 의해 cDNA 분자 (126)를 방출할 수 있다. 어댑터 (130) 및 (132)는 cDNA 분자 (126)의 3' 및/또는 5' 말단에 라이게이션될 수 있다. cDNA 분자 (126)의 상보체 (134)가 생성될 수 있으며, 이는 시퀀싱 프라이머 (136)에 혼성화되어 혼성화된 주형을 생성할 수 있다. 어느 하나의 실시양태에서, 혼성화된 주형은 본원에 기재된 임의의 시퀀싱 방법으로 진행할 수 있다.
흐름 시퀀싱 방법
본원에 기재된 방법을 사용하여, mRNA 분자로부터 관심 영역의 서열을 결정할 수 있다. mRNA로부터 유래된 폴리뉴클레오티드는 시퀀싱 프라이머에 혼성화되어 시퀀싱을 위한 혼성화 주형을 생성한다. 본원에 기재된 방법은 흐름 시퀀싱 방법을 사용하여 폴리뉴클레오티드를 시퀀싱하는 것을 포함할 수 있으며, 이는 또한 "합성에 의한 자연 시퀀싱" 또는 "합성에 의한 비종결 시퀀싱" 방법으로 지칭될 수 있다. 예시적인 방법은 미국 특허 번호 8,772,473에 기재되어 있으며, 이는 그 전문이 본원에 참조로 포함된다. 흐름 시퀀싱 방법을 참조하여 하기 설명이 제공되지만, 전부 또는 일부 (예를 들어, 하나 이상의 영역, 예컨대 바코드 영역 및/또는 표적 영역)를 시퀀싱하기 위해 다른 시퀀싱 방법이 사용될 수 있음이 이해되어야 한다. 흐름 시퀀싱은 폴리뉴클레오티드에 혼성화된 프라이머를 연장하기 위해 뉴클레오티드를 사용하는 것을 포함한다. 주어진 염기 유형 (예를 들어, A, C, G, T, U 등)의 뉴클레오티드는 상보적 염기가 주형 가닥에 존재하는 경우 프라이머를 연장하기 위해 혼성화된 주형과 혼합될 수 있다. 뉴클레오티드는 예를 들어 비종결 뉴클레오티드일 수 있다. 뉴클레오티드가 비종결인 경우, 하나 초과의 연속 상보적 염기가 주형 가닥에 존재하는 경우 하나 초과의 연속 염기는 연장 프라이머 가닥에 혼입될 수 있다. 비종결 뉴클레오티드는 3' 가역적 종결자를 갖는 뉴클레오티드와 대조되며, 여기서 차단기는 일반적으로 연속 뉴클레오티드가 부착되기 전에 제거된다. 상보적 염기가 주형 가닥에 존재하지 않는 경우, 주형 가닥에서 다음 염기에 상보적인 뉴클레오티드가 도입될 때까지 프라이머 연장이 중단된다. 뉴클레오티드의 적어도 일부는 혼입이 검출될 수 있도록 표지될 수 있다. 가장 일반적으로, 특정 실시양태에서 2 또는 3개의 상이한 유형의 뉴클레오티드가 동시에 도입될 수 있지만, 한번에 단일 뉴클레오티드 유형만이 도입된다 (즉, 별개로 첨가됨). 이 방법론은 가역적 종결자를 사용하는 시퀀싱 방법과 대조될 수 있으며, 여기서 프라이머 연장은 모든 단일 염기의 연장 후 종결자가 역전되어 다음 후속 염기의 혼입을 허용하기 전에 정지된다.
뉴클레오티드는 결정된 순서로 도입될 수 있으며, 이는 사이클로 추가로 나눌 수 있다. 뉴클레오티드는 단계별로 첨가되며, 이는 주형 가닥이 존재하는 상보적 염기의 시퀀싱 프라이머의 말단에 첨가된 뉴클레오티드의 혼입을 허용한다. 사이클은 뉴클레오티드의 동일한 순서 및 상이한 염기 유형의 수 (즉, 대칭적 사이클) 또는 뉴클레오티드의 상이한 순서 및/또는 상이한 염기 유형의 상이한 수 (즉, 비대칭적 사이클)를 가질 수 있다. 그러나, 염기는 동일한 사이클에서 반복되지 않으며, 이는 상이한 사이클 간에 구별하기 위한 마커를 제공한다. 단지 예로서, 제1 사이클의 순서는 A-T-G-C일 수 있고, 제2 사이클의 순서는 A-T-C-G일 수 있다. 또한, 하나 이상의 사이클은 하나 이상의 뉴클레오티드를 생략할 수 있다. 단지 예로서, 제1 사이클의 순서는 A-T-G-C일 수 있고, 제2 사이클의 순서는 A-T-C일 수 있다. 관련 기술분야의 통상의 기술자는 대안적인 순서를 쉽게 고려할 수 있다. 상이한 뉴클레오티드의 도입 사이에, 비혼입된 뉴클레오티드는 예를 들어 시퀀싱 플랫폼을 세척액으로 세척함으로써 제거될 수 있다.
폴리머라제는 주형-의존적 방식으로 프라이머의 말단에 하나 이상의 뉴클레오티드를 혼입함으로써 시퀀싱 프라이머를 연장하는데 사용될 수 있다. 일부 실시양태에서, 폴리머라제는 DNA 폴리머라제이다. 일부 실시양태에서, 폴리머라제는 RNA 폴리머라제이다. 폴리머라제는 자연 발생 폴리머라제 또는 합성 (예를 들어, 돌연변이체) 폴리머라제일 수 있다. 폴리머라제는 프라이머 연장의 초기 단계에서 첨가될 수 있지만, 보충 폴리머라제는 예를 들어 뉴클레오티드의 단계별 첨가와 함께 또는 다수의 흐름 사이클 후에 시퀀싱 동안 임의로 첨가될 수 있다.
혼입된 표지된 핵산의 존재 또는 부재는 서열을 결정하기 위해 검출될 수 있다. 표지는 예를 들어 광학 활성 표지 (예를 들어, 형광 표지) 또는 방사성 표지일 수 있고, 표지에 의해 방출되거나 변경된 신호는 검출기를 사용하여 검출될 수 있다.
흐름도는 혼입된 뉴클레오티드의 검출 및 뉴클레오티드 도입의 순서에 기초하여 생성될 수 있다. 예를 들어, 흐르는 주형 서열: CTG 및 CAG, 및 T-A-C-G의 반복 흐름 사이클을 취한다. 생성된 흐름도는 표 1에 표시되며, 여기서 1은 도입된 뉴클레오티드의 혼입을 나타내고, 0은 도입된 뉴클레오티드의 혼입이 없음을 나타낸다. 흐름도는 주형 가닥의 서열을 결정하는데 사용될 수 있다.
<표 1>
Figure 112022014690873-pct00001
도입된 뉴클레오티드는 주형 가닥의 서열을 결정할 때 표지된 뉴클레오티드를 포함할 수 있다. 표지는 예를 들어 형광 표지일 수 있다. 주형 폴리뉴클레오티드에 혼성화된 프라이머에 혼입된 표지된 뉴클레오티드의 존재 또는 부재는 검출될 수 있으며, 이는 서열의 결정을 허용한다 (예를 들어, 흐름도를 생성함으로써). 일부 실시양태에서, 표지된 뉴클레오티드는 형광성, 발광성 또는 다른 광-방출 모이어티로 표지된다. 일부 실시양태에서, 표지는 링커를 통해 뉴클레오티드에 부착된다. 일부 실시양태에서, 링커는 예를 들어 광화학적 또는 화학적 절단 반응을 통해 절단가능하다. 예를 들어, 표지는 연속 뉴클레오티드(들)의 검출 후에 및 혼입 전에 절단될 수 있다. 일부 실시양태에서, 표지 (또는 링커)는 뉴클레오티드 염기에, 또는 DNA의 초기 가닥의 신장을 방해하지 않는 뉴클레오티드 상의 또 다른 부위에 부착된다. 일부 실시양태에서, 링커는 디술피드 또는 PEG-함유 모이어티를 포함한다.
일부 실시양태에서, 도입된 뉴클레오티드는 비표지된 뉴클레오티드만을 포함하고, 일부 실시양태에서 뉴클레오티드는 표지된 및 비표지된 뉴클레오티드의 혼합물을 포함한다. 예를 들어, 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 90% 이하, 약 80% 이하, 약 70% 이하, 약 60% 이하, 약 50% 이하, 약 40% 이하, 약 30% 이하, 약 20% 이하, 약 10% 이하, 약 5% 이하, 약 4% 이하, 약 3% 이하, 약 2.5% 이하, 약 2% 이하, 약 1.5% 이하, 약 1% 이하, 약 0.5% 이하, 약 0.25% 이하, 약 0.1% 이하, 약 0.05% 이하, 약 0.025% 이하, 또는 약 0.01% 이하이다. 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 50% 이상, 약 40% 이상, 약 30% 이상, 약 20% 이상, 약 10% 이상, 약 5% 이상, 약 4% 이상, 약 3% 이상, 약 2.5% 이상, 약 2% 이상, 약 1.5% 이상, 약 1% 이상, 약 0.5% 이상, 약 0.25% 이상, 약 0.1% 이상, 약 0.05% 이상, 약 0.025% 이상, 또는 약 0.01% 이상이다. 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 0.01% 내지 약 100%, 예컨대 약 0.01% 내지 약 0.025%, 약 0.025% 내지 약 0.05%, 약 0.05% 내지 약 0.1%, 약 0.1% 내지 약 0.25%, 약 0.25% 내지 약 0.5%, 약 0.5% 내지 약 1%, 약 1% 내지 약 1.5%, 약 1.5% 내지 약 2%, 약 2% 내지 약 2.5%, 약 2.5% 내지 약 3%, 약 3% 내지 약 4%, 약 4% 내지 약 5%, 약 5% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 약 90% 내지 100% 미만, 또는 약 90% 내지 약 100%이다.
시퀀싱 전에, 폴리뉴클레오티드는 고체 지지체에 고정된 프라이머에 혼성화될 수 있다. 프라이머는 폴리뉴클레오티드의 3' 및/또는 5' 말단 상의 어댑터 영역에 혼성화할 수 있다. 폴리뉴클레오티드는 혼성화 후 증폭되어 (예를 들어, 브릿지 증폭 또는 다른 증폭 기술에 의해) 폴리뉴클레오티드 시퀀싱 콜로니를 생성할 수 있다. 콜로니 형성은 검출기가 각 콜로니에 대한 표지된 뉴클레오티드의 혼입을 정확하게 검출할 수 있도록 신호 증폭을 허용한다.
본원에 기재된 방법에 따라 사용될 수 있는 시퀀싱 및/또는 시퀀싱 데이터의 분석을 위한 추가 방법은 미국 특허 출원 번호 16/864,971; 미국 특허 출원 번호 16/864,981; 및 국제 PCT 출원 번호 PCT/US2020/031196에 기재되어 있으며, 이들 각각의 내용은 본원에 참조로 포함된다.
바코드 영역 설계를 통한 제어된 프라이머 연장
바코드 영역은 생물학적 샘플로부터의 개별 mRNA 분자를 표지하는데 사용되는 인공 구축물이다. 이와 같이, 일부 실시양태에서, 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략하도록 설계된다. 바코드 영역은 예를 들어 흐름 시퀀싱 방법을 사용하여 시퀀싱되며, 이는 시퀀싱 프라이머가 바코드 영역을 통해 연장하는 것을 허용한다. 그러나, 바코드 영역은 호모폴리머 영역에 존재하는 염기 (예를 들어, 아데닌 또는 티민 염기)를 포함하지 않기 때문에, 호모폴리머 영역의 염기에 상보적인 염기는 바코드 영역이 시퀀싱되고 프라이머가 바코드 영역 내에서 연장되는 동안 흐름 시퀀싱 사이클 순서로부터 생략될 수 있다. 프라이머가 호모폴리머 영역의 시작으로 연장되면, 호모폴리머 영역 내에서 프라이머를 연장하기 위해 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드 (예컨대 비종결 뉴클레오티드)를 사용하여 프라이머를 연장할 수 있다. 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드는 비표지되거나, 표지되거나, 또는 표지된 및 비표지된 뉴클레오티드 (예컨대 비종결 비표지된 뉴클레오티드)의 혼합물일 수 있다. 일부 실시양태에서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드는 비표지된 뉴클레오티드, 예컨대 비종결 비표지된 뉴클레오티드를 포함한다. 일부 실시양태에서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드는 비표지된 뉴클레오티드 및 표지된 뉴클레오티드 (예컨대 비표지된 비종결 뉴클레오티드 및 표지된 비종결 뉴클레오티드)를 포함하며, 여기서 폴리뉴클레오티드의 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 총 뉴클레오티드에 비교한 표지된 뉴클레오티드의 비율은 바코드 영역 및/또는 폴리뉴클레오티드의 표적 영역 내에서 프라이머를 연장하는데 사용된 비율보다 작다.
일부 실시양태에서, 호모폴리머 영역은 폴리-A 영역이고, 바코드 영역은 아데닌 염기를 생략한다. 일부 실시양태에서, 호모폴리머 영역은 폴리-T 영역이고, 바코드 영역은 티민 염기를 생략한다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략하는 것인 단계; (b) 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기가 결여된 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략하는 것인 단계; (b) 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기가 결여된 표지된 비종결 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 호모폴리머 영역에 존재하는 염기에 상보적인 비종결 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 비종결 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
시퀀싱 프라이머는 mRNA로부터 유래된 복수의 폴리뉴클레오티드에 혼성화되어 복수의 혼성화된 주형을 형성한다. 폴리뉴클레오티드는 폴리뉴클레오티드의 3' 및/또는 5' 말단에 어댑터 영역을 포함할 수 있고, 어댑터 영역은 시퀀싱 프라이머에 혼성화할 수 있다.
일단 혼성화된 주형이 형성되면, 프라이머는 예를 들어 흐름 시퀀싱 방법을 사용하여 바코드 영역을 통해 연장될 수 있다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 그러나, 정의된 순서는 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기를 생략하는 반면, 프라이머는 바코드 영역 내에서 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T, 호모폴리머 영역 내 염기에 상보적인 염기 제외)은 혼성화된 주형과 별개로 접촉될 수 있다. 즉, 뉴클레오티드는 미리 결정된 순서로 한 번에 하나씩 첨가된다. 일부 실시양태에서, 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용된다. DNA 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 프라이머의 주형-의존적 연장은 상보적 염기 (즉, 첨가된 뉴클레오티드에 상보적인)가 새로 혼입된 염기의 위치와 반대 위치에 주형 폴리뉴클레오티드 가닥에 존재하는 경우 발생한다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 바코드 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되며, 여기서 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기는 순서로부터 생략된다. 이러한 방식으로, 프라이머는 바코드 영역을 통해 연장되지만, 호모폴리머 영역으로 연장하지 않는다. 그러므로, 프라이머 연장은 호모폴리머 영역에 상보적인 염기가 도입될 때까지 호모폴리머 영역의 시작 전에 중단된다.
호모폴리머 영역의 서열이 일반적으로 흥미롭지 않기 때문에, 프라이머는 예를 들어 비표지된 뉴클레오티드를 사용하거나 표지 (예를 들어, 형광)를 검출하지 않음으로써 뉴클레오티드 혼입의 존재 또는 부재를 검출하지 않고 호모폴리머 영역 내에서 연장될 수 있다. 표지된 뉴클레오티드는 일반적으로 더 비싸고 프라이머 연장 중단의 증가된 위험을 가지므로, 표지된 뉴클레오티드는 총 뉴클레오티드의 더 작은 비율로 (바코드 영역의 서열을 결정하는데 사용된 부분과 비교하여) 포함되거나 호모폴리머 영역을 통한 프라이머 연장 동안 제거될 수 있다. 프라이머 연장이 호모폴리머 영역 내에서 중단되는 경우, 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있고, 호모폴리머 영역에 존재하는 염기에 상보적인 새로운 뉴클레오티드가 첨가될 수 있다.
일부 실시양태에서, 프라이머는 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 연장된다. 일부 실시양태에서, 프라이머는 표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 연장된다. 일부 실시양태에서, 프라이머는 표지된 뉴클레오티드 및 비표지된 뉴클레오티드 둘 모두를 사용하여 호모폴리머 영역 내에서 연장된다. 예를 들어, 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 90% 이하, 약 80% 이하, 약 70% 이하, 약 60% 이하, 약 50% 이하, 약 40% 이하, 약 30% 이하, 약 20% 이하, 약 10% 이하, 약 5% 이하, 약 4% 이하, 약 3% 이하, 약 2.5% 이하, 약 2% 이하, 약 1.5% 이하, 약 1% 이하, 약 0.5% 이하, 약 0.25% 이하, 약 0.1% 이하, 약 0.05% 이하, 약 0.025% 이하, 또는 약 0.01% 이하이다. 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 50% 이상, 약 40% 이상, 약 30% 이상, 약 20% 이상, 약 10% 이상, 약 5% 이상, 약 4% 이상, 약 3% 이상, 약 2.5% 이상, 약 2% 이상, 약 1.5% 이상, 약 1% 이상, 약 0.5% 이상, 약 0.25% 이상, 약 0.1% 이상, 약 0.05% 이상, 약 0.025% 이상, 또는 약 0.01% 이상이다. 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 0.01% 내지 약 100%, 예컨대 약 0.01% 내지 약 0.025%, 약 0.025% 내지 약 0.05%, 약 0.05% 내지 약 0.1%, 약 0.1% 내지 약 0.25%, 약 0.25% 내지 약 0.5%, 약 0.5% 내지 약 1%, 약 1% 내지 약 1.5%, 약 1.5% 내지 약 2%, 약 2% 내지 약 2.5%, 약 2.5% 내지 약 3%, 약 3% 내지 약 4%, 약 4% 내지 약 5%, 약 5% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 약 90% 내지 100% 미만, 또는 약 90% 내지 약 100%이다.
바코드 영역의 시퀀싱과 대조적으로, 표적화 영역의 시퀀싱은 4개의 염기 모두가 표적 영역에 존재할 수 있기 때문에 호모폴리머 영역에 존재하는 염기를 생략하지 않고 4개의 염기 모두 (A, T, G, C)의 순서화된 사용을 포함할 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 호모폴리머 영역의 말단으로부터 표적 영역으로 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
도 2a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략한다. 도 2b는 예시적인 방법을 그래프 형태로 보여준다. 단계 (202)에서, 호모폴리머 영역, 바코드 영역, 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역을 갖는 폴리뉴클레오티드는 프라이머에 혼성화되어 혼성화된 주형을 형성한다. 상이한 폴리뉴클레오티드는 폴리뉴클레오티드에 걸친 상이한 표적 영역이 고유한 분자 식별자와 연관되도록 상이한 바코드 영역 및 상이한 표적 영역을 함유한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 프라이머는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단에 근접한다. 도 2b에 나타낸 바와 같이, 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치되며, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다. 그러나, 바코드 영역은 호모폴리머 영역에 존재하는 동일한 염기를 생략한다. 예를 들어, 호모폴리머 영역이 폴리-A 서열인 경우, 상이한 바코드는 T, C 및/또는 G의 상이한 서열을 함유하지만 A를 생략한다. 유사하게, 호모폴리머 영역이 폴리-T 서열인 경우, 상이한 바코드는 A, C 및/또는 G의 상이한 서열을 함유한다. 폴리뉴클레오티드는 어댑터 영역을 추가로 포함할 수 있고, 프라이머는 어댑터 영역에 혼성화한다. 그러므로, 프라이머 연장 동안, 폴리뉴클레오티드는 프라이머 가닥의 연장으로부터 주형 가닥으로 기능한다.
도 2a 및 도 2b의 단계 (204)에서, 바코드 영역의 서열은 호모폴리머 영역에 존재하는 동일한 염기의 상보체 염기가 결여된 뉴클레오티드를 사용하여 결정된다. 예를 들어, 바코드 영역은 흐름 시퀀싱 방법을 사용하여 시퀀싱될 수 있다. 뉴클레오티드의 적어도 일부가 표지된다. 일부 실시양태에서, 뉴클레오티드는 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 포함한다.
도 2a 및 도 2b의 단계 (206)에서, 프라이머는 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 연장된다. 뉴클레오티드는 표지되거나, 비표지되거나, 또는 표지된 및 비표지된 뉴클레오티드 둘 모두의 혼합물일 수 있다. 일부 실시양태에서, 호모폴리머 영역 내의 프라이머 연장 동안 뉴클레오티드 혼입의 존재 또는 부재는 검출되지 않는다.
일단 프라이머가 호모폴리머 영역을 통해 연장되면, 표적 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 도 2a 및 도 2b의 단계 (208)에 나타낸 바와 같이 뉴클레오티드를 사용하여 결정된다. 뉴클레오티드의 적어도 일부는 시퀀싱 동안 표지된다. 일부 실시양태에서, 뉴클레오티드는 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 포함한다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
호모폴리머 영역 내의 프라이머 연장 중단
mRNA 분자로부터 관심 영역의 서열을 결정하는 방법의 일부 실시양태에서, 호모폴리머 영역 내의 프라이머 연장은 폴리뉴클레오티드의 다른 영역 (예를 들어, 바코드 영역 및/또는 표적 영역)의 서열을 결정할 때 사용된 표지된 뉴클레오티드의 비율과 비교하여 표지된 뉴클레오티드의 더 높은 비율을 사용함으로써 중단된다. 프라이머로 연장하는데 사용된 뉴클레오티드는 표지된 뉴클레오티드 또는 표지된 및 비표지된 뉴클레오티드의 혼합물을 포함할 수 있다. 뉴클레오티드의 총량 (즉, 표지된 및 비표지된 뉴클레오티드의 합)에 비해 표지된 뉴클레오티드의 비율이 증가함에 따라, 프라이머를 연장하는데 사용된 폴리머라제가 중단할 가능도가 증가된다. 그러므로, 프라이머 연장은 표지된 뉴클레오티드의 더 높은 비율을 사용하여 호모폴리머 영역 내에서 의도적으로 중단될 수 있고, 비혼입된 뉴클레오티드는 제거될 수 있고, 프라이머 연장은 비표지된 뉴클레오티드를 사용하여 계속될 수 있다.
예를 들어, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함할 수 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제1 비율로 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제2 비율로 호모폴리머 영역에 존재하는 염기에 상보적인 표지된 뉴클레오티드를 사용하여 프라이머를 연장하는 단계이며, 여기서 제2 비율은 제1 비율보다 크고, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단되는 것인 단계; (d) 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역의 말단으로 프라이머를 연장하는 단계; 및 (e) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 총 비종결 뉴클레오티드에 대한 표지된 비종결 뉴클레오티드의 제1 비율로 표지된 비종결 뉴클레오티드 및 비표지된 비종결 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 총 비종결 뉴클레오티드에 대한 표지된 비종결 뉴클레오티드의 제2 비율로 표지된 호모폴리머 영역에 존재하는 염기에 상보적인 비종결 뉴클레오티드를 사용하여 프라이머를 연장하는 단계이며, 여기서 제2 비율은 제1 비율보다 크고, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단되는 것인 단계; (d) 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 비종결 뉴클레오티드를 사용하여 호모폴리머 영역의 말단으로 프라이머를 연장하는 단계; 및 (e) 표지된 비종결 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
일부 실시양태에서, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다. 일부 실시양태에서, 바코드 영역 및 호모폴리머 영역 사이에 개재 염기가 없다. 그 후, 프라이머는 바코드 영역을 통해, 그리고 임의로 표지된 뉴클레오티드의 비율이 증가되기 전에 호모폴리머 영역으로 연장될 수 있다.
일단 혼성화된 주형이 형성되면, 프라이머는 예를 들어 흐름 시퀀싱 방법을 사용하여 바코드 영역을 통해 연장될 수 있다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)이 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 바코드 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복된다.
일단 프라이머가 호모폴리머 영역으로 연장되면, 프라이머를 연장하는데 사용된 표지된 뉴클레오티드의 비율은 프라이머 연장을 의도적으로 중단하기 위해 증가될 수 있다. 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율 증가가 폴리머라제가 중단할 가능도를 증가시키기 때문에, 호모폴리머 영역 내의 프라이머 연장을 중단할 때 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율은 바코드 영역 및 표적화 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드의 비율보다 더 높다. 즉, 바코드 영역의 서열을 결정하는데 사용된 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율은 프라이머 연장이 호모폴리머 영역 내에서 중단되도록 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율보다 더 낮다.
폴리머라제가 중단할 확률은 폴리머라제의 유형, 표지된 뉴클레오티드의 구조 (예를 들어, 표지 또는 표지와 뉴클레오티드 사이의 링커의 구조), 및 프라이머 연장 동안 사용되는 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율에 의존한다. 서열 결정 동안 (예를 들어, 바코드 영역 또는 표적 영역의 서열을 결정할 때) 폴리머라제의 중단은 일반적으로 바람직하지 않다. 그러나, 호모폴리머 영역의 서열은 일반적으로 중요하지 않기 때문에, 일부 실시양태에서, 폴리머라제는 의도적으로 중단된다. 그러므로, 호모폴리머 영역 내에서 프라이머를 연장하여, 이에 의해 폴리머 영역 내의 프라이머 연장을 중단하는데 사용된 표지된 뉴클레오티드의 비율은 일반적으로 서열 (예컨대 바코드 영역 및/또는 표적 영역의 서열)을 결정할 때 사용되는 표지된 뉴클레오티드의 비율보다 더 크다. 프라이머 연장의 중단을 유도하거나 제한하기 위해 사용되는 표지된 뉴클레오티드의 비율은 관련 기술분야의 통상의 기술자에 의해 쉽게 선택될 수 있다. 예를 들어, 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 90% 이하, 약 80% 이하, 약 70% 이하, 약 60% 이하, 약 50% 이하, 약 40% 이하, 약 30% 이하, 약 20% 이하, 약 10% 이하, 약 5% 이하, 약 4% 이하, 약 3% 이하, 약 2.5% 이하, 약 2% 이하, 약 1.5% 이하, 약 1% 이하, 약 0.5% 이하, 약 0.25% 이하, 약 0.1% 이하, 약 0.05% 이하, 약 0.025% 이하, 또는 약 0.01% 이하이다. 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 50% 이상, 약 40% 이상, 약 30% 이상, 약 20% 이상, 약 10% 이상, 약 5% 이상, 약 4% 이상, 약 3% 이상, 약 2.5% 이상, 약 2% 이상, 약 1.5% 이상, 약 1% 이상, 약 0.5% 이상, 약 0.25% 이상, 약 0.1% 이상, 약 0.05% 이상, 약 0.025% 이상, 또는 약 0.01% 이상이다. 일부 실시양태에서, 총 뉴클레오티드와 비교하여 표지된 뉴클레오티드의 부분은 약 0.01% 내지 약 100%, 예컨대 약 0.01% 내지 약 0.025%, 약 0.025% 내지 약 0.05%, 약 0.05% 내지 약 0.1%, 약 0.1% 내지 약 0.25%, 약 0.25% 내지 약 0.5%, 약 0.5% 내지 약 1%, 약 1% 내지 약 1.5%, 약 1.5% 내지 약 2%, 약 2% 내지 약 2.5%, 약 2.5% 내지 약 3%, 약 3% 내지 약 4%, 약 4% 내지 약 5%, 약 5% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 약 90% 내지 100% 미만, 또는 약 90% 내지 약 100%이다.
프라이머 연장이 호모폴리머 영역 내에서 중단된 후, 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 뉴클레오티드를 사용하여 연장을 재개할 수 있다. 임의로, 표지된 및 비표지된 뉴클레오티드 둘 모두가 사용될 수 있지만, 프라이머 연장을 중단한 후 호모폴리머 영역 내의 프라이머 연장을 계속하는데 사용된 표지된 뉴클레오티드의 비율은 프라이머 연장을 중단할 때 사용된 비율보다 더 낮아야 하고, 추가로 영역 (예를 들어, 바코드 영역 및/또는 표적 영역)의 서열을 결정할 때 사용된 비율보다 더 낮을 수 있다. 일부 실시양태에서, 표지된 뉴클레오티드는 호모폴리머 영역 내에서 프라이머를 중단한 후 호모폴리머 영역 내에서 프라이머를 연장할 때 사용되지 않는다. 일부 실시양태에서, 프라이머 연장이 중단된 후 호모폴리머 영역 내의 프라이머의 연장을 계속하는데 사용된 총 뉴클레오티드의 약 5% 미만, 약 4% 미만, 약 3% 미만, 약 2% 미만, 약 1% 미만, 약 1% 미만, 약 0.5% 미만, 약 0.1% 미만, 약 0.05% 미만, 또는 약 0.01% 미만은 표지된 뉴클레오티드이다.
표지된 뉴클레오티드의 비율을 감소 또는 제거함으로써 프라이머 연장 중단의 확률이 감소되더라도, 프라이머 연장이 의도적으로 중단되었을 때 포함되는 비율에 비해 표지된 뉴클레오티드의 비율을 감소시킨 후에도 프라이머 연장은 호모폴리머 영역 내에서 여전히 중단될 수 있다. 중단 후 프라이머 연장을 재개하기 위해, 비혼입된 뉴클레오티드 및 폴리머라제를 제거한 후 (예를 들어, 혼성화된 주형을 세척함으로써), 혼성화된 주형을 새로운 비표지된 뉴클레오티드 및 폴리머라제와 다시 접촉시킬 수 있다. 이 공정은 프라이머가 호모폴리머 영역을 통해 연장될 때까지 1, 2, 3, 4회 또는 그 이상 반복될 수 있다.
프라이머는 표적 영역에 대한 비표지된 뉴클레오티드 (또는 작은 비율의 표지된 뉴클레오티드)를 사용하여 호모폴리머 영역의 말단으로 연장될 수 있다. 표적 영역이 관심 mRNA 영역과 연관된 서열을 포함하기 때문에, 프라이머가 예를 들어 흐름 시퀀싱 방법을 사용하여 표적 영역으로 연장하면 시퀀싱이 재개된다. 폴리머라제를 사용하여 표지된 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 호모폴리머 영역의 말단으로부터 표적 영역으로 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
도 3a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단된다. 도 3b는 예시적인 방법을 그래프 형태로 보여준다. 단계 (302)에서, 호모폴리머 영역, 바코드 영역, 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역을 갖는 폴리뉴클레오티드는 프라이머에 혼성화되어 혼성화된 주형을 형성한다. 상이한 폴리뉴클레오티드는 폴리뉴클레오티드에 걸친 상이한 표적 영역이 고유한 분자 식별자와 연관되도록 상이한 바코드 영역 및 상이한 표적 영역을 함유한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 프라이머는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단에 근접할 수 있다. 도 3b에 나타낸 바와 같이, 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치되며, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다.
도 3a 및 도 3b의 단계 (304)에서, 바코드 영역의 서열은 표지된 뉴클레오티드를 사용하여, 예를 들어 흐름 시퀀싱 방법을 사용하여 결정된다. 일부 실시양태에서, 표지된 및 비표지된 뉴클레오티드 둘 모두가 사용된다. 일부 실시양태에서, 호모폴리머 영역 내의 프라이머 연장 동안 뉴클레오티드 혼입의 존재 또는 부재는 검출되지 않는다.
도 3a 및 도 3b의 단계 (306)에서, 프라이머는 호모폴리머 영역에 존재하는 염기에 상보적인 표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 연장되어, 이에 의해 호모폴리머 영역 내의 프라이머 연장을 중단한다. 일부 실시양태에서, 두 뉴클레오티드 모두는 표지된 및 비표지된 뉴클레오티드 둘 모두를 포함한다. 프라이머를 연장하는데 사용된 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율은 바코드 영역 내에서 프라이머를 연장하는데 사용된 비율보다 크며, 그러므로 호모폴리머 영역 내의 프라이머 연장을 중단한다.
도 3a 및 도 3b의 단계 (308)에서, 호모폴리머 영역 내의 프라이머 연장은 프라이머 연장이 호모폴리머 영역 내에서 중단된 후 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 뉴클레오티드를 사용하여 계속된다. 임의로, 표지된 뉴클레오티드는 또한 호모폴리머 영역 내에서 프라이머를 연장하는데 사용되지만, 프라이머 연장을 중단한 후 호모폴리머 영역 내의 프라이머 연장을 계속하는데 사용된 표지된 뉴클레오티드의 비율은 프라이머 연장을 중단할 때 사용된 비율보다 더 낮아야 하고, 추가로 영역 (예를 들어, 바코드 및/또는 표적 영역)의 서열을 결정할 때 사용된 비율보다 더 낮을 수 있다.
일단 프라이머가 호모폴리머 영역을 통해 연장되면, 표적 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 도 3a 및 도 3b의 단계 (310)에 나타낸 바와 같이 뉴클레오티드를 사용하여 결정된다. 뉴클레오티드의 적어도 일부는 시퀀싱 동안 표지된다. 일부 실시양태에서, 뉴클레오티드는 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 포함한다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
공통 흐름 길이를 갖는 바코드 영역
폴리뉴클레오티드에 걸친 상이한 바코드 영역 및 상이한 바코드 영역을 시퀀싱하는데 사용되는 흐름 시퀀싱 사이클은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성될 수 있다. 이는 바코드가 동일한 물리적 길이 (즉, 동일한 수의 염기)인 것을 필요로 하지 않으며, 바코드 서열 및 사이클 순서에 의해 결정된 바와 같이 상이한 바코드 영역의 흐름 길이가 동일한 것만을 필요로 한다. 영역의 흐름 길이는 프라이머를 영역의 시작으로부터 영역의 말단으로 연장하는데 필요한 사이클의 수이다. 이러한 방식으로, 프라이머는 호모폴리머 영역 내의 프라이머 연장이 폴리뉴클레오티드에 걸쳐 동일한 시간에 개시되도록 동일한 흐름 사이클 내에서 호모폴리머 영역의 시작으로 연장된다.
일부 실시양태에서, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다. 일부 실시양태에서, 바코드 영역 및 호모폴리머 영역 사이에 개재 염기가 없다. 바코드 영역 내 마지막 염기는 일반적으로 호모폴리머 영역 내의 염기와 상이하다.
사이클 및 사이클의 순서는 바코드 영역의 시퀀싱 시작 전에 미리 결정될 수 있다. 그러나, 바코드 영역의 시퀀싱 동안 사용되는 사이클은 동일하거나 (즉, 대칭적 사이클) 상이할 수 있다 (즉, 비대칭적 사이클). 또한, 주어진 사이클은 4개의 상이한 염기 모두 (즉, A, T, C, G)를 포함할 필요는 없지만, 2, 3 또는 4개의 상이한 염기를 포함할 수 있다. 즉, 사이클은 대칭적 사이클 또는 비대칭적 사이클일 수 있다. 그러나, 상기 논의된 바와 같이, 동일한 사이클 내에서 염기가 반복되지 않는다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 표적 영역은 고유한 바코드 영역과 연관되는 것인 단계; (b) 복수의 미리 결정된 사이클에서 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계이며, 여기서 미리 결정된 사이클 및 폴리뉴클레오티드의 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성되는 것인 단계; (c) 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법이 있다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고, 여기서 표적 영역은 고유한 바코드 영역과 연관되는 것인 단계; (b) 복수의 미리 결정된 사이클에서 표지된 비종결 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계이며, 여기서 미리 결정된 사이클 및 폴리뉴클레오티드의 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성되는 것인 단계; (c) 비표지된 비종결 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및 (d) 표지된 비종결 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
일단 혼성화된 주형이 형성되면, 프라이머는 예를 들어 흐름 시퀀싱 방법을 사용하여 바코드 영역을 통해 연장될 수 있다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 일부 실시양태에서 비표지된 뉴클레오티드 포함)와 접촉시킴으로써 연장된다. 상이한 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)은 주어진 사이클 내에서 혼성화된 주형과 별개로 접촉될 수 있거나, 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 바코드 영역은 복수의 미리 결정된 사이클을 사용하여 시퀀싱된다. 바코드 영역을 시퀀싱하는데 사용되는 사이클은 임의로 별개로 사용되는 뉴클레오티드 유형의 동일한 (즉, 대칭적) 또는 상이한 (즉, 비대칭적) 순서를 가질 수 있다. 이 공정은 바코드 영역의 서열이 결정될 때까지 미리 결정된 사이클 동안 반복된다. 미리 결정된 사이클 및 바코드 영역의 서열은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성된다. 이는 임의의 주어진 폴리뉴클레오티드에 대한 호모폴리머 영역으로의 프라이머의 연장이 복수의 모든 폴리뉴클레오티드에 대한 호모폴리머 영역으로의 프라이머의 연장 없이 발생하지 않도록 프라이머 연장을 제어한다.
프라이머의 연장은 바코드 영역의 말단에서 및 프라이머를 호모폴리머 영역으로 연장하기 전에 제어되기 때문에, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 표지된 뉴클레오티드의 비율이 제어될 수 있다. 예를 들어, 호모폴리머 영역 내의 프라이머 연장은 바코드 영역 및/또는 표적 영역 내에서 프라이머를 연장하는데 사용된 비율과 상이한 비율의 표지된 뉴클레오티드를 사용할 수 있다. 일부 실시양태에서, 비표지된 뉴클레오티드는 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된다. 일부 실시양태에서, 표지된 뉴클레오티드는 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된다. 일부 실시양태에서, 표지된 및 비표지된 뉴클레오티드 둘 모두는 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된다. 일부 실시양태에서, 표지된 뉴클레오티드는 호모폴리머 영역 내에서 프라이머를 중단한 후 호모폴리머 영역 내에서 프라이머를 연장할 때 사용되지 않는다. 일부 실시양태에서, 호모폴리머 영역 내에서 연장하는데 사용된 총 뉴클레오티드의 약 5% 미만, 약 4% 미만, 약 3% 미만, 약 2% 미만, 약 1% 미만, 약 1% 미만, 약 0.5% 미만, 약 0.1% 미만, 약 0.05% 미만, 또는 약 0.01% 미만.
표지된 뉴클레오티드의 비율을 감소 또는 제거함으로써 프라이머 연장 중단의 확률이 감소되더라도, 프라이머 연장이 의도적으로 중단되었을 때 포함되는 비율에 비해 표지된 뉴클레오티드의 비율을 감소시킨 후에도 프라이머 연장은 호모폴리머 영역 내에서 여전히 중단될 수 있다. 중단 후 프라이머 연장을 재개하기 위해, 비혼입된 뉴클레오티드 및 폴리머라제를 제거한 후 (예를 들어, 혼성화된 주형을 세척함으로써), 혼성화된 주형을 새로운 비표지된 뉴클레오티드 및 폴리머라제와 다시 접촉시킬 수 있다. 이 공정은 프라이머가 호모폴리머 영역을 통해 연장될 때까지 1, 2, 3, 4회 또는 그 이상 반복될 수 있다.
프라이머는 호모폴리머 영역의 말단으로 및 표적 영역의 시작으로 연장될 수 있다. 표적 영역이 관심 mRNA 영역과 연관된 서열을 포함하기 때문에, 표적 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 결정된다. 폴리머라제를 사용하여 표지된 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 호모폴리머 영역의 말단으로부터 표적 영역으로 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
도 4a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 흐름 사이클 및 폴리뉴클레오티드의 상이한 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성된다. 도 4b는 상이한 바코드 영역 서열을 갖지만 동일한 흐름 길이를 갖는 다중 폴리뉴클레오티드를 사용하여 예시적인 방법을 그래프 형태로 보여준다. 단계 (402)에서, 호모폴리머 영역, 바코드 영역, 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역을 갖는 폴리뉴클레오티드는 프라이머에 혼성화되어 혼성화된 주형을 형성한다. 상이한 폴리뉴클레오티드는 폴리뉴클레오티드에 걸친 상이한 표적 영역이 고유한 분자 식별자와 연관되도록 상이한 바코드 영역 및 상이한 표적 영역을 함유한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 프라이머는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단에 근접한다. 도 4b의 (402)에 나타낸 바와 같이, 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치되며, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다.
도 4a의 단계 (404)에서, 바코드 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 표지된 뉴클레오티드를 사용하여 결정된다. 일부 실시양태에서, 표지된 및 비표지된 뉴클레오티드 둘 모두가 사용된다. 미리 결정된 사이클 및 폴리뉴클레오티드의 상이한 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성된다.
도 4b로 넘어가면, (404a)에서, 폴리뉴클레오티드에 혼성화된 프라이머는 혼성화된 주형을 임의로 별개로 사용되는 상이한 표지된 뉴클레오티드 유형과 접촉시킴으로써 바코드 영역 내에서 연장된다. 폴리머라제는 상보체 염기가 주형 가닥에 존재할 때 주형-의존적 방식으로 프라이머를 연장한다. 비혼입된 뉴클레오티드를 제거하고, 혼입된 뉴클레오티드의 존재 또는 부재를 검출하여 시퀀싱 정보를 수득한다. 이 공정은 프라이머가 호모폴리머 영역의 시작으로 연장될 때까지 프라이머 연장을 계속하기 위해 미리 결정된 사이클을 사용하여 반복된다. 도 4b의 (404b)에 나타낸 바와 같이, 프라이머는 프라이머가 호모폴리머 영역으로 연장되기 전에 바코드 영역을 통해 복수의 폴리뉴클레오티드에 걸쳐 연장된다.
프라이머가 상이한 바코드 영역을 통해 연장될 때까지 프라이머는 폴리뉴클레오티드에 걸쳐 호모폴리머 영역 내에서 연장되지 않는다. 그러나, 일단 프라이머가 바코드 영역을 통해 연장되면, 프라이머는 도 4a 및 도 4b의 (406)에 나타낸 바와 같이 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 연장될 수 있다. 뉴클레오티드는 표지되거나, 비표지되거나, 또는 표지된 및 비표지된 뉴클레오티드 둘 모두의 혼합물일 수 있다. 호모폴리머 영역의 서열이 일반적으로 흥미롭지 않기 때문에, 프라이머는 예를 들어 비표지된 뉴클레오티드를 사용하거나 표지 (예를 들어, 형광)를 검출하지 않음으로써 뉴클레오티드 혼입의 존재 또는 부재를 검출하지 않고 호모폴리머 영역 내에서 연장될 수 있다. 표지된 뉴클레오티드는 일반적으로 더 비싸고 프라이머 연장 중단의 증가된 위험을 가지므로, 표지된 뉴클레오티드는 총 뉴클레오티드의 더 작은 비율로 (바코드 영역의 서열을 결정하는데 사용된 부분과 비교하여) 포함되거나 호모폴리머 영역을 통한 프라이머 연장 동안 제거될 수 있다. 프라이머 연장이 호모폴리머 영역 내에서 중단되는 경우, 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있고, 호모폴리머 영역에 존재하는 염기에 상보적인 새로운 뉴클레오티드가 첨가될 수 있다.
일단 프라이머가 호모폴리머 영역을 통해 연장되면, 표적 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 도 4a 및 도 4b의 단계 (410)에 나타낸 바와 같이 뉴클레오티드를 사용하여 결정된다. 뉴클레오티드의 적어도 일부는 시퀀싱 동안 표지된다. 일부 실시양태에서, 뉴클레오티드는 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 포함한다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
이중 프라이머 시퀀싱
일부 실시양태에서, 2개의 프라이머가 mRNA 분자로부터 관심 영역의 서열을 결정하는데 사용되며, 제1 프라이머는 서열 바코드 영역으로 연장되고, 제2 프라이머는 서열 표적 영역으로 연장된다. 제2 프라이머는 폴리뉴클레오티드의 호모폴리머 영역 내에서 혼성화하여 호모폴리머 영역 내의 프라이머 연장을 피하거나 제한한다. 프라이머 혼성화 및 연장의 순서는 가역적이다. 즉, 바코드 영역의 서열을 결정하기 위한 제1 프라이머의 연장은 표적 영역의 서열을 결정하기 위한 제2 프라이머의 연장 전 또는 후에 일어날 수 있다. 그러므로, 하기 제공된 "제1 프라이머" 및 "제2 프라이머"에 대한 설명은 명확성을 위해서만 제공되며, 프라이머의 서열은 역전될 수 있다.
제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 내 염기에 상보적인 염기를 포함하는 호모폴리머 영역을 포함한다. 예를 들어, 제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 영역이 폴리-T 영역인 경우 폴리-A 영역을 포함할 수 있거나, 또는 제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 영역이 폴리-A 영역인 경우 폴리-T 영역을 포함할 수 있다. 이는 제2 프라이머가 폴리뉴클레오티드의 호모폴리머 영역에 효율적으로 혼성화하는 것을 허용한다. 프라이머의 호모폴리머 영역은 폴리뉴클레오티드의 호모폴리머 영역보다 더 길거나 더 짧거나 대략적으로 동일한 길이일 수 있다.
일부 실시양태에서, 제2 프라이머의 3' 말단은 복수의 폴리뉴클레오티드에 걸쳐 표적 영역을 포함하는 폴리뉴클레오티드 내 호모폴리머 영역의 5' 말단에 혼성화하지 않는다. 따라서 호모폴리머 영역에 혼성화된 프라이머는 호모폴리머 영역 내에서 연장되어, 이에 의해 프라이머의 3' 말단을 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 정렬시킬 수 있다. 프라이머는 표지된, 비표지된, 또는 표지된 뉴클레오티드의 혼합물을 사용하여 호모폴리머 영역을 통해 연장될 수 있다. 프라이머 연장이 호모폴리머 영역 내에서 중단되는 경우, 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있고, 호모폴리머 영역에 존재하는 염기에 상보적인 새로운 뉴클레오티드가 첨가될 수 있다. 일단 프라이머가 폴리뉴클레오티드의 호모폴리머 영역을 통해 연장되면, 폴리뉴클레오티드의 표적 영역은 표적 영역 내에서 프라이머를 추가로 연장함으로써 시퀀싱될 수 있다.
일부 실시양태에서, 제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 내 염기에 상보적인 염기를 포함하는 호모폴리머 영역, 및 3' 앵커를 포함한다. 3' 앵커는 제2 프라이머의 호모폴리머 영역의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단과 혼성화할 가능도를 증가시킨다. 3' 앵커는 예를 들어, 제2 프라이머의 호모폴리머 영역에 존재하는 염기 이외의 염기를 포함할 수 있다. 그 후, 가변 염기는 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단 (즉, 표적 영역의 제1 염기) 뒤에 있는 제1 염기에 혼성화할 수 있다. 예를 들어, 폴리뉴클레오티드의 호모폴리머 영역이 폴리-A 서열인 경우, 제2 프라이머는 5' -(폴리-T)-V-3' 서열을 포함할 수 있으며, 여기서 V는 T 이외의 임의의 염기 (즉, G, C 또는 A)이다.
일부 실시양태에서, 제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 내 염기에 상보적인 염기를 포함하는 호모폴리머 영역, 및 5' 앵커를 포함한다. 임의로, 제2 프라이머는 3' 앵커 및 5' 앵커 둘 모두를 포함할 수 있다. 5' 앵커는 예를 들어, 폴리뉴클레오티드 상의 어댑터 서열에 상보적인 폴리뉴클레오티드 서열 (예를 들어, 바코드 영역의 3' 말단에 근접하게 위치될 수 있음)을 포함할 수 있다. 5' 앵커를 사용하면, 제2 프라이머의 호모폴리머 영역이 호모폴리머 영역의 3' 말단에 더 가깝게 혼성화할 가능성이 더 높다. 호모폴리머 영역 및 5' 앵커는 링커, 예를 들어 PEG 포스포라미다이트 링커 또는 무염기 데옥시리보스 또는 무염기 리보스 링커에 의해 연결될 수 있다. 링커의 길이는 예를 들어, 바코드 영역과 대략적으로 동일한 길이이거나, 바코드 영역보다 더 길거나 바코드 영역보다 더 짧을 수 있다.
제1 프라이머는 바코드 영역의 3' 말단에 근접한 위치에서 바코드 영역 및 표적 영역을 포함하는 폴리뉴클레오티드에 혼성화할 수 있다. 예를 들어, 폴리뉴클레오티드는 3' 어댑터 영역을 포함할 수 있고, 제1 프라이머는 어댑터 영역에 혼성화할 수 있다. 제1 프라이머는 바코드 영역 내에서 연장되어 바코드 영역의 서열을 결정한다.
일부 실시양태에서, 제1 프라이머는 제2 프라이머를 폴리뉴클레오티드에 혼성화하기 전에 혼성화된 주형으로부터 제거된다. 프라이머는 예를 들어, 높은 pH 용액, 예컨대 수산화나트륨 용액을 사용하여 제거될 수 있다. 일부 실시양태에서, 제1 프라이머는 제2 프라이머를 폴리뉴클레오티드에 혼성화하기 전에 혼성화된 주형으로부터 제거되지 않는다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 제1 프라이머와 혼성화하여 복수의 제1 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 복수의 폴리뉴클레오티드를 제2 프라이머와 혼성화하여 복수의 제2 혼성화된 주형을 형성하는 단계이며, 여기서 제2 프라이머는 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역을 포함하는 것인 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 제2 프라이머는 뉴클레오티드 (표지되거나 비표지되거나 또는 이들의 혼합물일 수 있음)를 사용하여 호모폴리머 영역 내에서 연장된다. 일부 실시양태에서, 제1 프라이머는 제2 프라이머가 폴리뉴클레오티드에 혼성화되기 전에 폴리뉴클레오티드에 혼성화된다. 일부 실시양태에서, 제2 프라이머는 제1 프라이머가 폴리뉴클레오티드에 혼성화되기 전에 폴리뉴클레오티드에 혼성화된다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 제1 프라이머와 혼성화하여 복수의 제1 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 표지된 비종결 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계; (c) 복수의 폴리뉴클레오티드를 제2 프라이머와 혼성화하여 복수의 제2 혼성화된 주형을 형성하는 단계이며, 여기서 제2 프라이머는 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역을 포함하는 것인 단계; 및 (d) 표지된 비종결 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계. 일부 실시양태에서, 제2 프라이머는 비종결 뉴클레오티드 (표지되거나 비표지되거나 또는 이들의 혼합물일 수 있음)를 사용하여 호모폴리머 영역 내에서 연장된다. 일부 실시양태에서, 제1 프라이머는 제2 프라이머가 폴리뉴클레오티드에 혼성화되기 전에 폴리뉴클레오티드에 혼성화된다. 일부 실시양태에서, 제2 프라이머는 제1 프라이머가 폴리뉴클레오티드에 혼성화되기 전에 폴리뉴클레오티드에 혼성화된다.
도 5a는 2개의 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여준다. 도 5b는 예시적인 방법을 그래프 형태로 보여준다. 단계 (502)에서, 호모폴리머 영역, 바코드 영역, 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역을 갖는 폴리뉴클레오티드는 제1 프라이머에 혼성화되어 제1 혼성화된 주형을 형성한다. 상이한 폴리뉴클레오티드는 폴리뉴클레오티드에 걸친 상이한 표적 영역이 고유한 분자 식별자와 연관되도록 상이한 바코드 영역 및 상이한 표적 영역을 함유한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 프라이머는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단에 근접할 수 있다. 도 5b에 나타낸 바와 같이, 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치되며, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다.
도 5a 및 도 5b의 단계 (504)에서, 바코드 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 표지된 뉴클레오티드를 사용하여 제1 프라이머를 연장함으로써 결정된다. 표지된 뉴클레오티드는 비표지된 뉴클레오티드와 임의로 조합된다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)이 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 바코드 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복된다.
도 5a 및 도 5b의 단계 (506)에서, 폴리뉴클레오티드는 폴리뉴클레오티드의 호모폴리머 영역에 존재하는 염기에 상보적인 염기와 호모폴리머 영역을 포함하는 제2 프라이머에 혼성화되어, 이에 의해 제2 혼성화된 주형을 형성한다. 임의로, 제1 프라이머는 제2 프라이머를 폴리뉴클레오티드에 혼성화하기 전에 제거된다. 일부 실시양태에서, 제2 프라이머는 단계 (508)에 나타낸 바와 같이 프라이머의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 위치되도록 호모폴리머 영역 내에서 연장된다. 이는 예를 들어 프라이머의 주형-의존적 연장에 의해 수행될 수 있다. 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 및/또는 표지된 뉴클레오티드는 제2 혼성화된 주형과 접촉되고, 예를 들어 폴리머라제를 사용하여 제2 프라이머의 말단에 혼입되어, 이에 의해 제2 프라이머를 연장할 수 있다. 단계 (508)가 항상 필요한 것은 아니며, 제2 프라이머는 예를 들어 3' 앵커의 사용을 통해 혼성화 시 프라이머의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 위치되도록 구성될 수 있기 때문이다.
제2 프라이머는 예를 들어 본원에 기재된 흐름 시퀀싱 방법을 사용하여 표지된 (및 임의로 비표지된) 뉴클레오티드를 사용하여 표적 영역으로 연장되어, 이에 의해 도 5a 및 도 5b의 단계 (510)에 나타낸 바와 같이 표적 영역의 서열을 결정한다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)은 제2 혼성화된 주형과 임의로 별개로 접촉되거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 제2 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 제2 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
도 5c는 2개의 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 또 다른 예시적인 방법의 흐름 차트를 보여주며, 여기서 폴리뉴클레오티드에 혼성화된 2개의 프라이머의 서열은 도 5a에 표시된 예시적인 방법과 비교하여 역전된다. 도 5d는 예시적인 방법을 그래프 형태로 보여준다. 도 5c 및 도 5d의 단계 (512)에서, 호모폴리머 영역, 바코드 영역, 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역이 제1 프라이머에 혼성화되어 혼성화된 주형을 형성한다. 제1 프라이머는 폴리뉴클레오티드의 호모폴리머 영역에 존재하는 염기에 상보적인 염기를 갖는 호모폴리머 영역을 포함한다. 일부 실시양태에서, 제2 프라이머는 단계 (514)에 나타낸 바와 같이 프라이머의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 위치되도록 호모폴리머 영역 내에서 연장된다. 이는 예를 들어 프라이머의 주형-의존적 연장에 의해 수행될 수 있다. 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 및/또는 표지된 뉴클레오티드는 제2 혼성화된 주형과 접촉되고, 예를 들어 폴리머라제를 사용하여 제2 프라이머의 말단에 혼입되어, 이에 의해 제1 프라이머를 연장할 수 있다.
제1 프라이머는 예를 들어 흐름 시퀀싱 방법을 사용하여 표지된 (및 임의로 비표지된) 뉴클레오티드를 사용하여 표적 영역으로 연장되어, 이에 의해 도 5c 및 도 5d의 단계 (516)에 나타낸 바와 같이 표적 영역의 서열을 결정한다. 표적 영역의 시퀀싱 동안, 제1 프라이머는 제1 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)은 제1 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 이상의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 제1 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 제1 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
도 5c 및 도 5d의 단계 (518)에서, 폴리뉴클레오티드는 제2 프라이머에 혼성화되어 제2 혼성화된 주형을 형성한다. 임의로, 연장된 제1 프라이머는 제2 프라이머가 폴리뉴클레오티드에 혼성화되기 전에 제거된다. 상이한 폴리뉴클레오티드는 폴리뉴클레오티드에 걸친 상이한 표적 영역이 고유한 분자 식별자와 연관되도록 상이한 바코드 영역 및 상이한 표적 영역을 함유한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 프라이머는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단에 근접할 수 있다. 도 5d에 나타낸 바와 같이, 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치되며, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다.
도 5c 및 도 5d의 단계 (520)에서, 바코드 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 표지된 뉴클레오티드를 사용하여 제2 프라이머를 연장함으로써 결정된다. 표지된 뉴클레오티드는 비표지된 뉴클레오티드와 임의로 조합된다. 바코드 영역의 시퀀싱 동안, 제2 프라이머는 제2 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)이 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 바코드 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복된다.
절단가능한 링커를 갖는 프라이머
일부 실시양태에서, 절단가능한 링커를 갖는 프라이머는 mRNA 분자로부터 관심 영역의 서열을 결정하는데 사용된다. 프라이머는 제1 프라이머 세그먼트, 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 염기를 포함하는 호모폴리머 영역을 포함하는 제2 프라이머 세그먼트, 및 제1 프라이머 세그먼트와 제2 프라이머 세그먼트 사이의 절단가능한 링커를 포함한다. 제1 프라이머 세그먼트는 프라이머의 3' 말단에 근접하고, 제2 프라이머 세그먼트는 프라이머의 5' 말단에 근접한다.
제2 프라이머 세그먼트는 예를 들어 흐름 시퀀싱 방법을 사용하여 폴리뉴클레오티드의 표적 영역을 시퀀싱하도록 연장될 수 있다. 본원에서 추가로 논의된 바와 같이, 일부 실시양태에서, 제2 프라이머 세그먼트는 프라이머를 표적 영역으로 연장하고 프라이머 영역의 서열을 결정하기 전에 폴리뉴클레오티드의 호모폴리머 영역의 말단으로 연장된다. 그 후, 절단가능한 링커는 절단될 수 있고, 프라이머의 제1 세그먼트는 예를 들어 흐름 시퀀싱 방법을 사용하여 폴리뉴클레오티드의 바코드 영역을 시퀀싱하도록 연장될 수 있다.
제2 프라이머 세그먼트는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 내 염기에 상보적인 염기를 포함하는 호모폴리머 영역을 포함한다. 예를 들어, 제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 영역이 폴리-T 영역인 경우 폴리-A 영역을 포함할 수 있거나, 또는 제2 프라이머는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 영역이 폴리-A 영역인 경우 폴리-T 영역을 포함할 수 있다. 이는 제2 프라이머가 폴리뉴클레오티드의 호모폴리머 영역에 효율적으로 혼성화하는 것을 허용한다. 프라이머의 호모폴리머 영역은 폴리뉴클레오티드의 호모폴리머 영역보다 더 길거나 더 짧거나 대략적으로 동일한 길이일 수 있다.
일부 실시양태에서, 제2 프라이머 세그먼트의 3' 말단은 복수의 폴리뉴클레오티드에 걸쳐 표적 영역을 포함하는 폴리뉴클레오티드 내 호모폴리머 영역의 5' 말단에 혼성화하지 않는다. 제2 프라이머 세그먼트는 호모폴리머 영역 내에서 연장되어, 이에 의해 프라이머의 3' 말단을 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 정렬시킬 수 있다. 제2 프라이머 세그먼트는 표지된, 비표지된, 또는 표지된 뉴클레오티드의 혼합물을 사용하여 호모폴리머 영역을 통해 연장될 수 있다. 프라이머 연장이 호모폴리머 영역 내에서 중단되는 경우, 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있고, 호모폴리머 영역에 존재하는 염기에 상보적인 새로운 뉴클레오티드가 첨가될 수 있다. 제2 프라이머 세그먼트가 폴리뉴클레오티드의 호모폴리머 영역을 통해 연장되면, 폴리뉴클레오티드의 표적 영역은 표적 영역 내에서 프라이머를 추가로 연장함으로써 시퀀싱될 수 있다.
일부 실시양태에서, 제2 프라이머 세그먼트는 표적 영역을 포함하는 폴리뉴클레오티드의 호모폴리머 내 염기에 상보적인 염기를 포함하는 호모폴리머 영역, 및 3' 앵커를 포함한다. 3' 앵커는 제2 프라이머 세그먼트의 호모폴리머 영역의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단과 혼성화할 가능도를 증가시킨다. 3' 앵커는 예를 들어, 제2 프라이머 세그먼트의 호모폴리머 영역에 존재하는 염기 이외의 염기를 포함할 수 있다. 그 후, 가변 염기는 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단 (즉, 표적 영역의 제1 염기) 뒤에 있는 제1 염기에 혼성화할 수 있다. 예를 들어, 폴리뉴클레오티드의 호모폴리머 영역이 폴리-A 서열인 경우, 제2 프라이머는 5'-(폴리-T)-V-3' 서열을 포함할 수 있으며, 여기서 V는 T 이외의 임의의 염기 (즉, G, C 또는 A)이다.
절단가능한 링커는 절단이 제어될 수 있는 제1 프라이머 세그먼트 및 제2 프라이머 세그먼트를 공유결합으로 연결시키는 임의의 적합한 링커일 수 있다. 일부 실시양태에서, 절단가능한 링커는 우라실 (U) 염기를 포함하는 폴리뉴클레오티드 서열을 포함한다. 우라실 염기는 우라실-특이적 절단 효소 (예를 들어, 뉴 잉글랜드 바이오랩스(New England BioLabs)로부터 입수가능한 우라실-특이적 절제 시약 (USER®) 효소)를 사용하여 제어가능하게 절단될 수 있다. 우라실 염기는 RNA에 고유하기 때문에, DNA 폴리뉴클레오티드 또는 프라이머를 절단할 위험이 없다.
제1 프라이머 세그먼트는 바코드 영역의 5' 말단에 근접한 서열 (예를 들어, 어댑터 서열)에 혼성화하도록 구성된다. 일단 프라이머가 절단되면, 제1 프라이머 세그먼트의 3' 말단은 연장되어, 예를 들어 흐름 시퀀싱 방법을 사용하여 바코드 영역의 서열을 결정할 수 있다.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계로서; 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고; 여기서 프라이머는 제1 프라이머 세그먼트, 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 염기를 포함하는 호모폴리머 영역을 포함하는 제2 프라이머 세그먼트, 및 제1 프라이머 세그먼트와 제2 프라이머 세그먼트 사이의 절단가능한 링커를 포함하는 것인 단계; (b) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계; (c) 절단가능한 링커에서 프라이머를 절단하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계.
일부 실시양태에서, 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계로서; 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하고; 여기서 프라이머는 제1 프라이머 세그먼트, 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 염기를 포함하는 호모폴리머 영역을 포함하는 제2 프라이머 세그먼트, 및 제1 프라이머 세그먼트와 제2 프라이머 세그먼트 사이의 절단가능한 링커를 포함하는 것인 단계; (b) 표지된 비종결 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계; (c) 절단가능한 링커에서 프라이머를 절단하는 단계; 및 (d) 표지된 비종결 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계.
도 6a는 절단가능한 프라이머를 사용하여 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여준다. 도 6b는 예시적인 방법을 그래프 형태로 보여준다. 단계 (602)에서, 호모폴리머 영역, 바코드 영역, 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역을 갖는 폴리뉴클레오티드는 프라이머에 혼성화되어 혼성화된 주형을 형성한다. 프라이머는 제1 프라이머 세그먼트, 폴리뉴클레오티드의 호모폴리머 영역 내 염기에 상보적인 복수의 염기를 포함하는 호모폴리머 영역을 포함하는 제2 프라이머 세그먼트, 및 제1 프라이머 세그먼트와 제2 프라이머 세그먼트 사이의 절단가능한 링커를 포함한다. 상이한 폴리뉴클레오티드는 폴리뉴클레오티드에 걸친 상이한 표적 영역이 고유한 분자 식별자와 연관되도록 상이한 바코드 영역 및 상이한 표적 영역을 함유한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 제1 프라이머 세그먼트는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단에 근접한다. 도 6b에 나타낸 바와 같이, 호모폴리머 영역은 표적 영역과 바코드 영역 사이에 위치되며, 바코드 영역은 호모폴리머 영역의 3' 말단에 근접한다.
일부 실시양태에서, 제2 프라이머 세그먼트는 단계 (604)에 나타낸 바와 같이 프라이머의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 위치되도록 호모폴리머 영역 내에서 연장된다. 이는 예를 들어 프라이머의 주형-의존적 연장에 의해 수행될 수 있다. 호모폴리머 영역에 존재하는 염기에 상보적인 비표지된 및/또는 표지된 뉴클레오티드는 제2 혼성화된 주형과 접촉되고, 예를 들어 폴리머라제를 사용하여 제2 프라이머의 말단에 혼입되어, 이에 의해 제2 프라이머를 연장할 수 있다. 단계 (504)가 항상 필요한 것은 아니며, 제2 프라이머는 예를 들어 3' 앵커의 사용을 통해 혼성화 시 프라이머의 3' 말단이 폴리뉴클레오티드의 호모폴리머 영역의 5' 말단에 위치되도록 구성될 수 있기 때문이다.
프라이머는 예를 들어 흐름 시퀀싱 방법을 사용하여 표지된 (및 임의로 비표지된) 뉴클레오티드를 사용하여 표적 영역으로 연장되어, 이에 의해 도 6a 및 도 6b의 단계 (606)에 나타낸 바와 같이 표적 영역의 서열을 결정한다. 표적 영역의 시퀀싱 동안, 제1 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)은 제1 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 제1 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 제1 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
도 6a 및 도 5b의 단계 (608)에서, 프라이머는 절단가능한 링커에서 절단된다. 절단가능한 링커는 제1 프라이머 세그먼트의 3' 말단을 자유롭게 하는 적합한 절단 시약과 접촉될 수 있다. 임의로, 제2 프라이머 세그먼트는 예를 들어 높은 pH 용액 (예를 들어, 수산화나트륨을 함유하는 용액)을 사용하여 제거된다.
도 6a 및 도 6b의 단계 (610)에서, 바코드 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 표지된 뉴클레오티드를 사용하여 제1 프라이머 세그먼트를 연장함으로써 결정된다. 표지된 뉴클레오티드는 비표지된 뉴클레오티드와 임의로 조합된다. 바코드 영역의 시퀀싱 동안, 제2 프라이머는 제2 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)이 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 바코드 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복된다.
중단된 프라이머 연장의 재개
긴 호모폴리머 영역 내의 프라이머 연장은 프라이머 연장의 중단을 초래할 수 있다. 프라이머 연장 중단의 가능도는 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율이 증가할수록 더 커지며, 이는 폴리머라제가 일반적으로 천연 또는 거의-천연 뉴클레오티드를 혼입하는데 더 잘 적응되기 때문이다. 그럼에도 불구하고, 프라이머 연장은 일부 mRNA 분자의 폴리-A 영역과 같이 충분히 긴 호모폴리머 영역이 주어진 프라이머 연장에 천연 뉴클레오티드를 사용하는 경우에도 중단되는 경향이 있다.
비혼입된 뉴클레오티드를 제거하고 혼성화된 주형을 새로운 뉴클레오티드와 접촉시키는 것은 프라이머 연장을 재개할 수 있다. 일부 경우에, 혼성화된 주형이 새로운 뉴클레오티드와 접촉된다. 이 공정은 프라이머가 호모폴리머 영역을 통해 완전히 연장되는 것을 보장하기 위해 1, 2, 3, 4, 5회 또는 그 이상 반복될 수 있다. 이 전략은 본원에 기재된 다른 전략과 조합하여 사용될 수 있으며, 여기서 프라이머의 연장은 호모폴리머 영역 내의 프라이머의 연장 동안 중단될 수 있다. 예를 들어, 프라이머 연장은 폴리뉴클레오티드가 바코드 영역 (예컨대 호모폴리머 영역에 존재하는 염기를 생략한 바코드 영역, 복수의 폴리뉴클레오티드에서 다른 바코드 영역과 공통 흐름 길이를 갖는 바코드 영역)을 갖는 경우, 프라이머 연장이 호모폴리머 영역 내에서 의도적으로 중단되는 경우 (예를 들어, 프라이머를 연장하는데 사용된 표지된 뉴클레오티드의 비율을 증가시킴으로써), 또는 이중 프라이머 또는 절단가능한 프라이머 시스템을 사용하는 경우 호모폴리머 영역 내에서 중단되고 재개될 수 있다.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 여기서 폴리뉴클레오티드는 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 동일한 염기의 뉴클레오티드를 사용하여 프라이머를 호모폴리머 영역으로 연장하고, 여기서 프라이머는 호모폴리머 영역 내에서 중단되고, 비혼입된 뉴클레오티드를 제거하는 단계; (c) 단계 (b)를 1회 이상 반복하여 호모폴리머 영역을 통해 프라이머를 연장하는 단계; 및 (d) 표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
일부 실시양태에서, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법은 하기를 포함한다: (a) mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 여기서 폴리뉴클레오티드는 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역 및 mRNA 분자로부터의 관심 영역과 연관된 서열을 포함하는 표적 영역을 포함하는 것인 단계; (b) 동일한 염기의 비종결 뉴클레오티드를 사용하여 프라이머를 호모폴리머 영역으로 연장하고, 여기서 프라이머는 호모폴리머 영역 내에서 중단되고, 비혼입된 비종결 뉴클레오티드를 제거하는 단계; (c) 단계 (b)를 1회 이상 반복하여 호모폴리머 영역을 통해 프라이머를 연장하는 단계; 및 (d) 표지된 비종결 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
도 7a는 mRNA 분자로부터 관심 영역의 서열을 결정하기 위한 예시적인 방법의 흐름 차트를 보여주며, 여기서 프라이머 연장은 폴리뉴클레오티드의 호모폴리머 영역 내에서 중단되고 재개된다. 도 7b는 예시적인 방법을 그래프 형태로 보여준다. 하기 기재된 예시적인 방법이 호모폴리머 영역 및 표적 영역을 갖는 폴리뉴클레오티드를 언급하지만, 폴리뉴클레오티드는 추가 영역, 예를 들어 호모폴리머 영역의 3' 말단에 근접한 바코드 영역을 추가로 포함할 수 있다.
단계 (702)에서, 호모폴리머 영역 및 관심 mRNA 영역과 연관된 (예를 들어, 이에 상보적이거나 동일한) 서열을 포함하는 표적 영역 (및 임의로, 바코드 영역, 이는 도 7b에 표시되지 않음)을 갖는 폴리뉴클레오티드는 프라이머에 혼성화되어 혼성화된 주형을 형성한다. 폴리뉴클레오티드의 3' 말단은 어댑터 영역을 포함할 수 있고, 프라이머는 폴리뉴클레오티드의 어댑터 영역에 혼성화할 수 있다. 어댑터 영역은 바코드 영역의 3' 말단 (존재하는 경우) 또는 호모폴리머 영역의 3' 말단에 근접할 수 있다.
바코드 영역이 존재하는 경우, 바코드 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 뉴클레오티드를 사용하여 결정될 수 있다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)이 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 바코드 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복된다.
도 7a 및 도 7b의 단계 (704)에서, 프라이머는 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 연장된다. 일부 실시양태에서, 뉴클레오티드는 표지된 뉴클레오티드, 비표지된 뉴클레오티드, 또는 표지된 및 비표지된 뉴클레오티드 둘 모두를 포함한다. 상기 논의된 바와 같이, 표지된 뉴클레오티드의 비율이 증가함에 따라, 프라이머 연장 중단의 가능도가 증가한다. 그러나, 뉴클레오티드가 완전히 비표지된 경우에도, 더 긴 호모폴리머 영역 내에서 연장될 때 프라이머 연장이 중단될 수 있다.
도 7a의 단계 (706)에서, 비혼입된 뉴클레오티드가 제거된다. 예를 들어, 혼성화된 주형은 세척 완충액을 사용하여 세척될 수 있다. 이 단계는 중단 후 프라이머 연장이 재개될 수 있도록 혼성화된 주형을 효과적으로 "재설정"한다.
도 7a 및 도 7b의 단계 (708)에서, 호모폴리머 영역 내의 프라이머 연장은 단계 (704) 및 (706)를 반복함으로써 재개된다. 호모폴리머 영역에 존재하는 염기에 상보적인 뉴클레오티드는 호모폴리머 영역 내에서 프라이머를 추가로 연장하는데 사용된다. 뉴클레오티드는 비표지되거나, 표지되거나, 또는 표지된 및 비표지된 뉴클레오티드의 혼합물일 수 있다. 일부 실시양태에서, 표지된 뉴클레오티드는 호모폴리머 영역 내에서 프라이머를 중단한 후 호모폴리머 영역 내에서 프라이머를 연장할 때 사용되지 않는다. 일부 실시양태에서, 프라이머 연장이 중단된 후 호모폴리머 영역 내의 프라이머의 연장을 계속하는데 사용된 총 뉴클레오티드의 약 5% 미만, 약 4% 미만, 약 3% 미만, 약 2% 미만, 약 1% 미만, 약 1% 미만, 약 0.5% 미만, 약 0.1% 미만, 약 0.05% 미만, 또는 약 0.01% 미만은 표지된 뉴클레오티드이다.
단계 (704) 및 (706)는 호모폴리머 영역을 통해 프라이머를 연장하기 위해 1, 2, 3, 4, 5회 또는 그 이상 반복될 수 있다. 프라이머 연장은 이 방법이 효과적이기 위해 복수의 폴리뉴클레오티드 내 모든 폴리뉴클레오티드에서 실제로 중단되거나 중단될 필요는 없다. 비혼입된 뉴클레오티드는 제거될 수 있고, 새로운 뉴클레오티드를 사용하여 중단 후 폴리머라제를 재개하거나 중단을 선점할 수 있다. 예를 들어, 비혼입된 뉴클레오티드의 제거 및 새로운 뉴클레오티드를 사용한 추가 프라이머 연장은 실제 중단의 수에 관계없이 규칙적 또는 불규칙적 간격으로 주기적으로 반복될 수 있다 (예를 들어 15초마다, 30초마다, 60초마다, 2분마다, 5분마다 등).
일단 프라이머가 호모폴리머 영역을 통해 연장되면, 표적 영역의 서열은 예를 들어 흐름 시퀀싱 방법을 사용하여 도 7a 및 도 7b의 단계 (710)에 나타낸 바와 같이 뉴클레오티드를 사용하여 결정된다. 뉴클레오티드의 적어도 일부는 시퀀싱 동안 표지된다. 일부 실시양태에서, 뉴클레오티드는 표지된 뉴클레오티드 및 비표지된 뉴클레오티드를 포함한다. 바코드 영역의 시퀀싱 동안, 프라이머는 혼성화된 주형을 뉴클레오티드 (표지된 뉴클레오티드 및 임의로 비표지된 뉴클레오티드 포함)와 정의된 순서로 접촉시킴으로써 연장된다. 상이한 뉴클레오티드 유형 (예를 들어, A, C, G 또는 T)이 혼성화된 주형과 별개로 접촉될 수 있거나, 또는 2개 또는 3개의 상이한 뉴클레오티드 유형이 동시에 사용될 수 있다. 폴리머라제를 사용하여 뉴클레오티드를 프라이머의 3' 말단에 주형-의존적 방식으로 혼입하여, 이에 의해 프라이머를 연장할 수 있다. 비혼입된 뉴클레오티드는 예를 들어 혼성화된 주형을 세척함으로써 제거될 수 있다. 그 후, 혼입된 표지된 뉴클레오티드의 존재 또는 부재를 검출하여 그 위치에서 서열을 결정한다. 이 공정은 표적 영역의 서열이 결정될 때까지 뉴클레오티드의 순서를 사용하여 반복되어, 이에 의해 mRNA 분자로부터의 관심 영역의 서열이 추론되는 것을 허용한다.
호모폴리머 영역 및 비-호모폴리머 영역 내를 포함하여 중단된 시퀀싱 프라이머 연장을 복구하기 위한 추가 방법은 국제 PCT 출원 번호 PCT/US2020/031196에 기재되어 있으며, 그 내용은 모든 목적을 위해 본원에 참조로 포함된다.
실시예
본 출원은 본 출원의 예시적인 실시양태로서 제공되는 하기 비제한적인 실시예를 참조하여 더 잘 이해될 수 있다. 하기 실시예는 실시양태를 보다 완전하게 예시하기 위해 제시되지만, 본 출원의 넓은 범위를 제한하는 것으로 결코 해석되어서는 안된다. 본 출원의 특정 실시양태가 본원에 도시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 명백할 것이다. 본 발명의 사상 및 범위를 벗어나지 않으면서 관련 기술분야의 통상의 기술자에게 수많은 변경, 변화 및 치환이 발생할 수 있다. 본원에 기재된 실시양태에 대한 다양한 대안이 본원에 기재된 방법을 실시하는데 사용될 수 있음을 이해해야 한다.
실시예 1
용해 완충액을 사용하여 샘플 세포를 용해하고, 원심분리를 사용하여 액체 용해물을 분리한다. 분리된 액체 용해물을 캡처 비드와 인큐베이션하며, 각 캡처 비드는 10-30개의 연속 티민 염기를 함유하는 폴리-T 영역의 5'에 융합된 바코드 영역 (공통 샘플 바코드 및 UMI 함유)을 함유하는 DNA 올리고머를 함유한다. 캡처 비드를 분리하고 세척함으로써 캡처 비드를 사용하여 액체 용해물 내 mRNA 분자를 단리한다. 캡처 프로브 DNA 올리고머 및 역전사효소를 사용하여 mRNA 분자를 역전사하여, cDNA 라이브러리를 생성한다. cDNA 라이브러리 내 각 cDNA 분자는 샘플 바코드 및 UMI를 갖는 바코드 영역, 호모폴리머 폴리-T 영역, 및 관심 mRNA 영역에 상보적인 표적 영역 (코딩 영역의 적어도 일부 포함)을 포함한다. 아데닌 염기를 생략하도록 바코드 영역을 특이적으로 설계한다.
시퀀싱 라이브러리를 생성하기 위해 어댑터 서열을 cDNA 폴리뉴클레오티드의 5' 및 3' 말단에 부착함으로써 시퀀싱을 위한 cDNA 라이브러리를 제조한다. 표면에 부착된 DNA 올리고뉴클레오티드를 함유하는 시퀀싱 어레이 표면에 시퀀싱 라이브러리를 적용한다. DNA 올리고뉴클레오티드는 cDNA 분자의 어댑터 영역에 혼성화하는 서열을 포함한다. 브릿지 증폭에 의해 시퀀싱 콜로니를 형성하며, 이는 cDNA 분자의 카피 및 cDNA 분자의 상보체를 생성한다.
시퀀싱 프라이머를 시퀀싱 표면에 적용하며, 이는 cDNA 분자 상보체의 3' 말단에서 어댑터 영역에 혼성화한다. DNA 폴리머라제를 또한 시퀀싱 표면에 적용하고, DNA 폴리머라제는 혼성화된 주형에 결합한다. 제1 뉴클레오티드 (예를 들어, 데옥시-A, 데옥시-G 또는 데옥시-C), 예컨대 비종결 뉴클레오티드를 함유하는 제1 용액, 및 시퀀싱 표면을 세척하여 세척 완충액을 사용하여 비혼입된 뉴클레오티드를 제거한다. 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 콜로니에 걸친 염기 혼입의 존재 또는 부재를 형광 검출기를 사용하여 검출한다. 흐름 사이클을 완료하기 위해 각각 상이한 (즉, 제2 및 제3) 뉴클레오티드를 함유하는 제2 용액 및 제3 용액을 사용하여 이 공정을 반복하고, 바코드 영역을 시퀀싱하기 위해 흐름 사이클을 반복한다. 제2 및 제3 용액 내 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 이 공정 동안, 사이클에 티민 염기가 포함되지 않는다. 각 영상화 단계 후에 성장하는 폴리뉴클레오티드로부터 형광 표지를 절단한다.
일단 시퀀싱 프라이머가 바코드 영역을 통해 연장되면, 100% 비표지된 티미딘 트리포스페이트를 함유하는 제4 용액을 시퀀싱 표면에 적용하며, 이는 호모폴리머 영역을 통한 프라이머의 연장을 개시한다. 표면을 세척 완충액으로 세척하고 중단된 프라이머 연장을 제거하기 위해 공정을 반복하기 전에 일정 기간 동안 표면이 반응하도록 허용한다. 이는 프라이머가 폴리-A 호모폴리머 영역을 통해 및 cDNA 분자 상보체의 표적 영역의 시작으로 연장되도록 허용한다.
티민 뉴클레오티드 (약 2.5% 형광으로 표지된 및 약 97.5% 비표지된)를 함유하는 제5 용액에 더하여 제1, 제2 및 제3 용액을 사용하여 표적 영역의 표적 영역을 시퀀싱한다. 용액을 시퀀싱 표면에 별도로 적용하고, 표면을 세척하고, 일련의 사이클 동안 사이클에서 다음 용액을 적용하기 전에 염기 혼입의 존재 또는 부재를 검출한다. 각 영상화 단계 후에 성장하는 폴리뉴클레오티드로부터 형광 표지를 절단한다.
실시예 2
용해 완충액을 사용하여 샘플 세포를 용해하고, 원심분리를 사용하여 액체 용해물을 분리한다. 분리된 액체 용해물을 캡처 비드와 인큐베이션하며, 각 캡처 비드는 10-30개의 연속 티민 염기를 함유하는 폴리-T 영역의 5'에 융합된 바코드 영역 (공통 샘플 바코드 및 UMI 함유)을 함유하는 DNA 올리고머를 함유한다. 캡처 비드를 분리하고 세척함으로써 캡처 비드를 사용하여 액체 용해물 내 mRNA 분자를 단리한다. 캡처 프로브 DNA 올리고머 및 역전사효소를 사용하여 mRNA 분자를 역전사하여, cDNA 라이브러리를 생성한다. cDNA 라이브러리 내 각 cDNA 분자는 샘플 바코드 및 UMI를 갖는 바코드 영역, 호모폴리머 폴리-T 영역, 및 관심 mRNA 영역에 상보적인 표적 영역 (코딩 영역의 적어도 일부 포함)을 포함한다.
시퀀싱 라이브러리를 생성하기 위해 어댑터 서열을 cDNA 폴리뉴클레오티드의 5' 및 3' 말단에 부착함으로써 시퀀싱을 위한 cDNA 라이브러리를 제조한다. 표면에 부착된 DNA 올리고뉴클레오티드를 함유하는 시퀀싱 어레이 표면에 시퀀싱 라이브러리를 적용한다. DNA 올리고뉴클레오티드는 cDNA 분자의 어댑터 영역에 혼성화하는 서열을 포함한다. 브릿지 증폭에 의해 시퀀싱 콜로니를 형성하며, 이는 cDNA 분자의 카피 및 cDNA 분자의 상보체를 생성한다.
시퀀싱 프라이머를 시퀀싱 표면에 적용하며, 이는 cDNA 분자 상보체의 3' 말단에서 어댑터 영역에 혼성화한다. DNA 폴리머라제를 또한 시퀀싱 표면에 적용한다. 제1 뉴클레오티드 (예를 들어, 데옥시-A, 데옥시-G, 데옥시-C 또는 데옥시-T), 예컨대 비종결 뉴클레오티드를 함유하는 제1 용액, 및 시퀀싱 표면을 세척하여 세척 완충액을 사용하여 비혼입된 뉴클레오티드를 제거한다. 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 콜로니에 걸친 염기 혼입의 존재 또는 부재를 형광 검출기를 사용하여 검출한다. 흐름 사이클을 완료하기 위해 각각 상이한 (즉, 제2, 제3 및 제4) 뉴클레오티드를 함유하는 제2, 제3 및 제4 용액을 사용하여 이 공정을 반복하고, 바코드 영역을 시퀀싱하기 위해 흐름 사이클을 반복한다. 제2 및 제3 용액 내 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 각 영상화 단계 후에 성장하는 폴리뉴클레오티드로부터 형광 표지를 절단한다.
일단 시퀀싱 프라이머가 바코드 영역을 통해 연장되면, 80% 표지된 티미딘 트리포스페이트를 함유하는 제5 용액을 시퀀싱 표면에 적용하고, 이는 신속하게 중단되기 전에 호모폴리머 영역 내의 프라이머의 연장을 개시한다. 그 후, 시퀀싱 표면을 세척하여 비혼입된 뉴클레오티드를 제거한다.
프라이머 연장이 중단된 후, 100% 비표지된 티미딘 트리포스페이트를 함유하는 제6 용액을 시퀀싱 표면에 적용하며, 이는 호모폴리머 영역을 통한 프라이머의 연장을 개시한다. 표면을 세척 완충액으로 세척하고 중단된 프라이머 연장을 제거하기 위해 공정을 반복하기 전에 일정 기간 동안 표면이 반응하도록 허용한다. 이는 프라이머가 폴리-A 호모폴리머 영역을 통해 및 cDNA 분자 상보체의 표적 영역의 시작으로 연장되도록 허용한다.
제1, 제2, 제3 및 제4 용액을 사용하여 표적 영역의 표적 영역을 시퀀싱한다. 용액을 시퀀싱 표면에 별도로 적용하고, 표면을 세척하고, 일련의 사이클 동안 사이클에서 다음 용액을 적용하기 전에 염기 혼입의 존재 또는 부재를 검출한다. 각 영상화 단계 후에 성장하는 폴리뉴클레오티드로부터 형광 표지를 절단한다.
실시예 3
용해 완충액을 사용하여 샘플 세포를 용해하고, 원심분리를 사용하여 액체 용해물을 분리한다. 분리된 액체 용해물을 캡처 비드와 인큐베이션하며, 각 캡처 비드는 10-30개의 연속 티민 염기를 함유하는 폴리-T 영역의 5'에 융합된 바코드 영역 (공통 샘플 바코드 및 UMI 함유)을 함유하는 DNA 올리고머를 함유한다. 캡처 비드를 분리하고 세척함으로써 캡처 비드를 사용하여 액체 용해물 내 mRNA 분자를 단리한다. 캡처 프로브 DNA 올리고머 및 역전사효소를 사용하여 mRNA 분자를 역전사하여, cDNA 라이브러리를 생성한다. cDNA 라이브러리 내 각 cDNA 분자는 샘플 바코드 및 UMI를 갖는 바코드 영역, 호모폴리머 폴리-T 영역, 및 관심 mRNA 영역에 상보적인 표적 영역 (코딩 영역의 적어도 일부 포함)을 포함한다.
바코드 영역이 동일한 흐름 길이를 갖도록 바코드 영역을 흐름 사이클 설계와 조합하여 특이적으로 설계한다. 해당 흐름도를 갖는 예시적인 바코드는 표 2에 표시되어 있다. 4개의 바코드 각각에 대한 시퀀싱 프라이머는 제4 사이클 내에서 바코드의 말단에 도달한다.
<표 2>
Figure 112022014690873-pct00002
시퀀싱 라이브러리를 생성하기 위해 어댑터 서열을 cDNA 폴리뉴클레오티드의 5' 및 3' 말단에 부착함으로써 시퀀싱을 위한 cDNA 라이브러리를 제조한다. 표면에 부착된 DNA 올리고뉴클레오티드를 함유하는 시퀀싱 어레이 표면에 시퀀싱 라이브러리를 적용한다. DNA 올리고뉴클레오티드는 cDNA 분자의 어댑터 영역에 혼성화하는 서열을 포함한다. 브릿지 증폭에 의해 시퀀싱 콜로니를 형성하며, 이는 cDNA 분자의 카피 및 cDNA 분자의 상보체를 생성한다.
시퀀싱 프라이머를 시퀀싱 표면에 적용하며, 이는 cDNA 분자 상보체의 3' 말단에서 어댑터 영역에 혼성화한다. 흐름 시퀀싱 방법을 사용하여 바코드 영역을 질문하며, 적용된 뉴클레오티드의 순서는 프라이머가 호모폴리머 영역으로 연장되기 전에 시퀀싱 라이브러리에 걸친 모든 바코드가 시퀀싱되도록 구성된다. 간단히 말해서, DNA 폴리머라제를 시퀀싱 표면에 적용하고, 제1 뉴클레오티드 (예를 들어, 데옥시-A, 데옥시-G 또는 데옥시-C), 예컨대 비종결 뉴클레오티드를 함유하는 제1 용액을 적용한 후, 시퀀싱 표면을 세척하여 세척 완충액을 사용하여 비혼입된 뉴클레오티드를 제거한다. 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 콜로니에 걸친 염기 혼입의 존재 또는 부재를 형광 검출기를 사용하여 검출한다. 흐름 사이클을 완료하기 위해 제1 용액에 더하여 각각 상이한 (즉, 제2, 제3 및 제4) 뉴클레오티드를 함유하는 제2, 제3 및 제4 용액을 사용하여 이 공정을 반복한다. 바코드 영역을 시퀀싱하기 위해 다중 흐름 사이클을 사용한다 (비대칭적일 수 있음). 제2 및 제3 용액 내 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다.
프라이머는 바코드 영역의 시퀀싱 동안 호모폴리머 영역으로 연장되지만, 바코드 영역 및 별개로 적용된 뉴클레오티드의 순서는 프라이머가 호모폴리머 영역에 도달하는 타이밍이 제어되도록 설계된다. 일단 시퀀싱 프라이머가 바코드 영역을 통해 및 호모폴리머 영역의 시작으로 연장되면, 100% 비표지된 티미딘 트리포스페이트를 함유하는 제5 용액을 시퀀싱 표면에 적용하고, 이는 호모폴리머 영역을 통한 프라이머의 연장을 개시한다. 표면을 세척 완충액으로 세척하고 중단된 프라이머 연장을 제거하기 위해 공정을 반복하기 전에 일정 기간 동안 표면이 반응하도록 허용한다. 이는 프라이머가 폴리-A 호모폴리머 영역을 통해 및 cDNA 분자 상보체의 표적 영역의 시작으로 연장되도록 허용한다.
그 후, 제1, 제2, 제3 및 제4 용액을 사용하여 표적 영역의 표적 영역을 시퀀싱한다. 용액을 시퀀싱 표면에 별도로 적용하고, 표면을 세척하고, 일련의 사이클 동안 사이클에서 다음 용액을 적용하기 전에 염기 혼입의 존재 또는 부재를 검출한다.
실시예 4
용해 완충액을 사용하여 샘플 세포를 용해하고, 원심분리를 사용하여 액체 용해물을 분리한다. 분리된 액체 용해물을 캡처 비드와 인큐베이션하며, 각 캡처 비드는 10-30개의 연속 티민 염기를 함유하는 폴리-T 영역의 5' 말단에 융합된 바코드 영역 (공통 샘플 바코드 및 UMI 함유)을 함유하는 DNA 올리고머를 함유한다. 캡처 비드를 분리하고 세척함으로써 캡처 비드를 사용하여 액체 용해물 내 mRNA 분자를 단리한다. 캡처 프로브 DNA 올리고머 및 역전사효소를 사용하여 mRNA 분자를 역전사하여, cDNA 라이브러리를 생성한다. cDNA 라이브러리 내 각 cDNA 분자는 샘플 바코드 및 UMI를 갖는 바코드 영역, 호모폴리머 폴리-T 영역, 및 관심 mRNA 영역에 상보적인 표적 영역 (코딩 영역의 적어도 일부 포함)을 포함한다.
시퀀싱 라이브러리를 생성하기 위해 어댑터 서열을 cDNA 폴리뉴클레오티드의 5' 및 3' 말단에 부착함으로써 시퀀싱을 위한 cDNA 라이브러리를 제조한다. 표면에 부착된 DNA 올리고뉴클레오티드를 함유하는 시퀀싱 어레이 표면에 시퀀싱 라이브러리를 적용한다. DNA 올리고뉴클레오티드는 cDNA 분자의 어댑터 영역에 혼성화하는 서열을 포함한다. 브릿지 증폭에 의해 시퀀싱 콜로니를 형성하며, 이는 cDNA 분자의 카피 및 cDNA 분자의 상보체를 생성한다.
제1 시퀀싱 프라이머를 시퀀싱 표면에 적용하며, 이는 cDNA 분자 상보체의 3' 말단에서 어댑터 영역에 혼성화한다. DNA 폴리머라제를 시퀀싱 표면에 적용한다. 비종결 뉴클레오티드일 수 있는 제1 뉴클레오티드 (예를 들어, 데옥시-A, 데옥시-G, 데옥시-C 또는 데옥시-T)를 함유하는 제1 용액, 및 시퀀싱 표면을 세척하여 세척 완충액을 사용하여 비혼입된 뉴클레오티드를 제거한다. 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 콜로니에 걸친 염기 혼입의 존재 또는 부재를 형광 검출기를 사용하여 검출한다. 흐름 사이클을 완료하기 위해 각각 상이한 (즉, 제2, 제3 및 제4) 뉴클레오티드를 함유하는 제2, 제3 및 제4 용액을 사용하여 이 공정을 반복하고, 바코드 영역을 시퀀싱하기 위해 흐름 사이클을 반복한다. 제2 및 제3 용액 내 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다.
폴리-T 호모폴리머 영역 및 티민 이외의 가변 염기 (즉, A, C 또는 G)를 함유하는 5' 앵커를 포함하는 시퀀싱 표면에 제2 시퀀싱 프라이머를 적용한다. 즉, 제2 시퀀싱 프라이머는 실제로 상이한 서열을 갖는 3개의 상이한 프라이머의 혼합물이며, 차이는 프라이머의 5' 말단에 있는 가변 염기에 의해서만 정의된다. 제2 시퀀싱 프라이머는 cDNA 상보체의 호모폴리머 영역에 혼성화하며, 5' 앵커는 표적 영역의 제1 염기에 혼성화한다. 제1, 제2, 제3 및 제4 용액을 사용하여 제2 시퀀싱 프라이머를 연장하고 cDNA 분자 상보체의 표적 영역을 시퀀싱한다. 용액을 시퀀싱 표면에 별도로 적용하고, 표면을 세척하고, 일련의 사이클 동안 사이클에서 다음 용액을 적용하기 전에 염기 혼입의 존재 또는 부재를 검출한다.
바코드 영역 및 표적 영역이 별도의 프라이머를 사용하여 시퀀싱되더라도, 시퀀싱 표면 상의 공간 좌표에 기초하여 서열을 연관시킬 수 있다.
실시예 5
용해 완충액을 사용하여 샘플 세포를 용해하고, 원심분리를 사용하여 액체 용해물을 분리한다. 분리된 액체 용해물을 캡처 비드와 인큐베이션하며, 각 캡처 비드는 10-30개의 연속 티민 염기를 함유하는 폴리-T 영역의 5' 말단에 융합된 바코드 영역 (공통 샘플 바코드 및 UMI 함유)을 함유하는 DNA 올리고머를 함유한다. 캡처 비드를 분리하고 세척함으로써 캡처 비드를 사용하여 액체 용해물 내 mRNA 분자를 단리한다. 캡처 프로브 DNA 올리고머 및 역전사효소를 사용하여 mRNA 분자를 역전사하여, cDNA 라이브러리를 생성한다. cDNA 라이브러리 내 각 cDNA 분자는 샘플 바코드 및 UMI를 갖는 바코드 영역, 호모폴리머 폴리-T 영역, 및 관심 mRNA 영역에 상보적인 표적 영역 (코딩 영역의 적어도 일부 포함)을 포함한다.
시퀀싱 라이브러리를 생성하기 위해 어댑터 서열을 cDNA 폴리뉴클레오티드의 5' 및 3' 말단에 부착함으로써 시퀀싱을 위한 cDNA 라이브러리를 제조한다. 표면에 부착된 DNA 올리고뉴클레오티드를 함유하는 시퀀싱 어레이 표면에 시퀀싱 라이브러리를 적용한다. DNA 올리고뉴클레오티드는 cDNA 분자의 어댑터 영역에 혼성화하는 서열을 포함한다. 브릿지 증폭에 의해 시퀀싱 콜로니를 형성하며, 이는 cDNA 분자의 카피 및 cDNA 분자의 상보체를 생성한다.
cDNA 분자 상보체의 3' 말단에 있는 어댑터 영역에 혼성화하는 제1 프라이머 세그먼트, 및 cDNA 분자 상보체의 호모폴리머 영역에 혼성화하는 제2 프라이머 세그먼트를 포함하는 시퀀싱 표면에 시퀀싱 프라이머를 적용한다. 제1 프라이머 세그먼트 및 제2 프라이머 세그먼트를 분리하는 것은 우라실 RNA 모이어티이다. 100% 비표지된 티미딘 트리포스페이트를 함유하는 제1 용액을 시퀀싱 표면에 적용하고, 이는 제2 프라이머 세그먼트를 cDNA 분자 상보체의 호모폴리머 영역의 말단으로 연장한다. 그 후, 시퀀싱 표면을 세척 완충액으로 세척함으로써 비혼입된 뉴클레오티드를 제거한다.
뉴클레오티드 (예를 들어, 데옥시-A, 데옥시-G 또는 데옥시-C)를 함유하는 제2 용액을 시퀀싱 표면에 적용하고, 시퀀싱 표면을 세척하여 세척 완충액을 사용하여 비혼입된 뉴클레오티드를 제거한다. 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다. 콜로니에 걸친 염기 혼입의 존재 또는 부재를 형광 검출기를 사용하여 검출한다. 흐름 사이클을 완료하기 위해 각각 상이한 뉴클레오티드를 함유하는 제3, 제4 및 제5 용액을 사용하여 이 공정을 반복하고, 표적 영역을 시퀀싱하기 위해 흐름 사이클을 반복한다. 제2 용액은 티민을 함유하지 않지만, 제3, 제4 또는 제5 중 어느 하나는 티민 염기를 함유할 수 있었다. 제2 및 제3 용액 내 뉴클레오티드는 약 2.5% 형광으로 표지된 및 약 97.5% 비표지된 뉴클레오티드를 함유한다.
제1 및 제2 프라이머 세그먼트 사이의 우라실 모이어티를 특이적으로 절단하는 우라실-특이적 절제 시약 (USER®) 효소 (뉴 잉글랜드 바이오랩스로부터 입수가능함)를 함유하는 제6 용액을 적용함으로써 프라이머를 절단한다. 그 후, 세척 완충액을 사용하여 절단 용액을 제거한다.
그 후, 제2, 제3, 제4 및 제5 용액을 사용하여 제1 프라이머 세그먼트를 연장하고 cDNA 분자 상보체의 바코드 영역을 시퀀싱한다. 용액을 시퀀싱 표면에 별도로 적용하고, 표면을 세척하고, 일련의 사이클 동안 사이클에서 다음 용액을 적용하기 전에 염기 혼입의 존재 또는 부재를 검출한다.
바코드 영역 및 표적 영역이 별도의 프라이머를 사용하여 시퀀싱되더라도, 시퀀싱 표면 상의 공간 좌표에 기초하여 서열을 연관시킬 수 있다.
실시예 6
합성에 의한 비종결 시퀀싱 방법을 사용하여 3개의 합성 시험 서열을 시퀀싱하였다. 시험 cDNA 서열은 개시 영역, 바코드 영역, 호모폴리머 영역 (C-C), 및 관심 영역을 포함하였다. 도 8a를 참조한다. 서열 3의 바코드 영역은 호모폴리머 (예를 들어, 흐름 번호 14의 T-T-T 호모폴리머, 흐름 16의 G-G-G 호모폴리머, 흐름 18의 A-A-A 호모폴리머 및 흐름 30의 A-A-A-A-A 호모폴리머)를 포함하였지만, 이들 호모폴리머는 C-C 호모폴리머 영역과 구별된다. 뉴클레오티드의 상이한 흐름 순서를 사용하여 (1) 개시 영역 (T-A-C-G 흐름 순서 사용, 2 사이클), (2) 바코드 영역 (T-C-A 흐름 순서 사용, 9 사이클), 및 (3) 호모폴리머 영역 및 관심 영역 (G-A-T-C의 흐름 순서 사용, 2 사이클)을 시퀀싱하였다. 바코드는 호모폴리머 영역에 포함된 C 뉴클레오티드를 생략하도록 설계되었다. 따라서, 바코드를 시퀀싱하는데 사용된 흐름 순서는 상보적 G 뉴클레오티드를 생략하였다. 또한, 호모폴리머 영역 및 관심 영역을 시퀀싱하는데 사용된 흐름 순서는 관심 영역을 시퀀싱하기 전에 호모폴리머 영역을 통해 시퀀싱하기 위해 G 뉴클레오티드로 시작하도록 설계되었다.
도 8은 각 흐름 위치에서 3개의 서열 각각에 대한 생성된 시퀀싱 데이터의 흐름 매트릭스를 보여준다. 데이터는 시퀀싱된 분자의 뉴클레오티드에 상보적인 시퀀싱 반응으로 유입된 뉴클레오티드에 기초하여 제공된다. 흐름 매트릭스 아래에 각 시퀀싱된 분자에 대한 신호 트레이스가 있다. 임의의 주어진 위치에서 더 큰 신호 강도는 표시된 흐름 위치에 혼입된 더 많은 수의 뉴클레오티드를 나타낸다.
3개의 서열 모두의 바코드는 흐름 번호 9-30에서 성공적으로 시퀀싱되었다. 바코드 흐름 사이클은 흐름 31-35를 통해 계속되었지만, 바코드는 완전히 시퀀싱되었으며 이들 흐름 동안 뉴클레오티드가 혼입되지 않았다. 이는 5개의 인접 T 뉴클레오티드의 혼입을 포함한 서열 3의 흐름 번호 30에서도 발생하였다 (추가 T 뉴클레오티드가 위치 33에 혼입되지 않았음). 흐름 36에서, G 뉴클레오티드가 도입되었으며, 이는 호모폴리머 영역 (C-C)을 통해 시퀀싱 가닥의 연장을 허용하였다. 이 방식의 추가된 이점은 3개의 서열 모두의 시퀀싱이 흐름 36에서 동기화되었다는 것이다.

Claims (86)

  1. 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법:
    mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 폴리뉴클레오티드는 바코드 영역, 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역, 및 mRNA 분자로부터의 관심 영역과 동일하거나 또는 상보적인 서열을 포함하는 표적 영역을 포함하고, 여기서 표적 영역은 고유한 바코드 영역과 연관이 있는 것인 단계;
    복수의 미리 결정된 사이클에서 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계이며, 여기서 미리 결정된 사이클 및 폴리뉴클레오티드의 바코드 영역은 프라이머가 호모폴리머 영역으로 연장되기 전에 복수의 폴리뉴클레오티드에 걸쳐 바코드 영역의 말단으로 연장되도록 구성되는 것인 단계;
    비표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계; 및
    표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
  2. 제1항에 있어서, 바코드 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드가 비종결 표지된 뉴클레오티드를 포함하는 것인 방법.
  3. 제1항에 있어서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 비표지된 뉴클레오티드가 비종결 비표지된 뉴클레오티드를 포함하는 것인 방법.
  4. 제1항에 있어서, 바코드 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드가 동일한 염기의 비표지된 뉴클레오티드와 혼합되는 것인 방법.
  5. 제1항에 있어서, 프라이머가 호모폴리머 영역의 말단으로 연장될 때까지 비표지된 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하는 단계를 1회 이상 반복하는 것을 추가로 포함하고, 여기서 비혼입된 뉴클레오티드가 연장 단계를 반복하기 전에 제거되는 것인 방법.
  6. 제1항에 있어서, 표적 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기가 별개로 사용되는 것인 방법.
  7. 제1항에 있어서, 폴리뉴클레오티드의 호모폴리머 영역 내 염기가 아데닌 또는 티민 염기인 방법.
  8. 제1항에 있어서, 폴리뉴클레오티드의 호모폴리머 영역이 적어도 8개의 인접하고 동일한 염기를 포함하는 것인 방법.
  9. 제1항에 있어서, 폴리뉴클레오티드가 cDNA 분자인 방법.
  10. 제1항에 있어서, mRNA 분자의 관심 영역이 코딩 영역을 포함하는 것인 방법.
  11. 제1항에 있어서, 표적 영역의 서열 결정에 사용된 표지된 뉴클레오티드가 비종결 표지된 뉴클레오티드를 포함하는 것인 방법.
  12. 제1항에 있어서, 바코드 영역의 서열 결정 또는 표적 영역의 서열 결정에 사용된 뉴클레오티드의 50% 이하가 표지된 것인 방법.
  13. 제1항에 있어서, 호모폴리머 영역 내에서의 프라이머 연장에 사용된 뉴클레오티드의 0.1% 이하가 표지된 것인 방법.
  14. 제1항에 있어서, 호모폴리머 영역 내에서의 프라이머 연장에 사용된 모든 뉴클레오티드가 비표지된 것인 방법.
  15. 제1항에 있어서, 바코드 영역을 결정하는데 사용된 표지된 뉴클레오티드의 상이한 염기가 별개로 사용되는 것인 방법.
  16. 제1항에 있어서, 폴리뉴클레오티드의 호모폴리머 영역이 적어도 50개의 인접하고 동일한 염기를 포함하는 것인 방법.
  17. 제1항에 있어서, 바코드 영역이 샘플 바코드를 포함하는 것인 방법.
  18. 제10항에 있어서, 바코드 영역의 결정된 서열을 표적 영역의 결정된 서열과 연관 짓는 단계를 추가로 포함하는 방법.
  19. 제1항에 있어서, mRNA 분자의 관심 영역이 mRNA 분자의 3'-비번역 영역 또는 5'-비번역 영역을 포함하는 것인 방법.
  20. 제1항에 있어서, 표적 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드가 동일한 염기의 비표지된 뉴클레오티드와 혼합되는 것인 방법.
  21. 하기를 포함하는, mRNA 분자로부터 관심 영역의 서열을 결정하는 방법:
    mRNA로부터 유래된 복수의 폴리뉴클레오티드를 프라이머와 혼성화하여 복수의 혼성화된 주형을 형성하는 단계이며, 여기서 폴리뉴클레오티드는 mRNA 분자의 폴리-A 영역으로부터 유래된 복수의 인접하고 동일한 염기를 포함하는 호모폴리머 영역 및 mRNA 분자로부터의 관심 영역과 동일하거나 또는 상보적인 서열을 포함하는 표적 영역을 포함하는 것인 단계;
    동일한 염기의 뉴클레오티드를 사용하여 호모폴리머 영역 내에서 프라이머를 연장하고, 여기서 프라이머 연장은 호모폴리머 영역 내에서 중단되고, 비혼입된 뉴클레오티드를 제거하는 단계;
    뉴클레오티드의 프라이머로의 혼입을 검출하지 않으면서 상기 연장을 1회 이상 반복하여 호모폴리머 영역을 통해 프라이머를 연장하는 단계; 및
    표지된 뉴클레오티드를 사용하여 표적 영역의 서열을 결정하는 단계.
  22. 제21항에 있어서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드가 비종결 표지된 뉴클레오티드를 포함하는 것인 방법.
  23. 제21항에 있어서, 표적 영역의 서열을 결정하는데 사용된 표지된 뉴클레오티드가 비종결 표지된 뉴클레오티드를 포함하는 것인 방법.
  24. 제21항에 있어서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드가 표지된 뉴클레오티드를 포함하는 것인 방법.
  25. 제21항에 있어서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드가 비표지된 뉴클레오티드를 포함하는 것인 방법.
  26. 제21항에 있어서, 표적 영역의 서열이 비표지된 뉴클레오티드 및 표지된 뉴클레오티드의 혼합물을 사용하여 결정되는 것인 방법.
  27. 제21항에 있어서, 폴리뉴클레오티드가 바코드 영역을 추가로 포함하고, 표적 영역이 고유한 바코드 영역과 연관이 있고, 상기 방법은 표지된 뉴클레오티드를 사용하여 바코드 영역의 서열을 결정하는 단계를 추가로 포함하는 것인 방법.
  28. 제27항에 있어서, 바코드 영역이 샘플 바코드를 포함하는 것인 방법.
  29. 제27항에 있어서, 바코드 영역의 결정된 서열을 표적 영역의 결정된 서열과 연관 짓는 단계를 추가로 포함하는 방법.
  30. 제21항에 있어서, 폴리뉴클레오티드의 호모폴리머 영역 내 염기가 아데닌 또는 티민 염기인 방법.
  31. 제21항에 있어서, 폴리뉴클레오티드의 호모폴리머 영역이 적어도 8개의 인접하고 동일한 염기를 포함하는 것인 방법.
  32. 제21항에 있어서, 폴리뉴클레오티드의 호모폴리머 영역이 적어도 50개의 인접하고 동일한 염기를 포함하는 것인 방법.
  33. 제21항에 있어서, 폴리뉴클레오티드가 cDNA 분자인 방법.
  34. 제21항에 있어서, mRNA 분자의 관심 영역이 mRNA 분자의 코딩 영역을 포함하는 것인 방법.
  35. 제21항에 있어서, mRNA 분자의 관심 영역이 mRNA 분자의 3'-비번역 영역 또는 5'-비번역 영역을 포함하는 것인 방법.
  36. 제21항에 있어서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 뉴클레오티드가 표지된 뉴클레오티드 및 비표지된 뉴클레오티드의 혼합물을 포함하는 것인 방법.
  37. 제36항에 있어서, 표적 영역의 서열이 표지된 뉴클레오티드 및 비표지된 뉴클레오티드의 혼합물을 사용하여 결정되는 것인 방법.
  38. 제37항에 있어서, 호모폴리머 영역 내에서 프라이머를 연장하는데 사용된 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율은 표적 영역의 서열을 결정하는데 사용된 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 비율보다 큰 것인 방법.
  39. 제21항에 있어서, 프라이머가 초기에 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제1 비율을 사용하여 호모폴리머 영역 내에서 연장되고, 연장을 반복하여 호모폴리머 영역을 통해 프라이머를 연장하는 단계가 총 뉴클레오티드에 대한 표지된 뉴클레오티드의 제2 비율을 사용하는 것을 포함하고, 여기서 제1 비율은 제2 비율보다 큰 것인 방법.
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
KR1020227004475A 2019-07-10 2020-07-10 Rna 시퀀싱 방법 KR102506635B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237007303A KR20230035702A (ko) 2019-07-10 2020-07-10 Rna 시퀀싱 방법

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962872558P 2019-07-10 2019-07-10
US62/872,558 2019-07-10
PCT/US2020/041552 WO2021007495A1 (en) 2019-07-10 2020-07-10 Rna sequencing methods

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237007303A Division KR20230035702A (ko) 2019-07-10 2020-07-10 Rna 시퀀싱 방법

Publications (2)

Publication Number Publication Date
KR20220025201A KR20220025201A (ko) 2022-03-03
KR102506635B1 true KR102506635B1 (ko) 2023-03-07

Family

ID=74101778

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020237007303A KR20230035702A (ko) 2019-07-10 2020-07-10 Rna 시퀀싱 방법
KR1020227004475A KR102506635B1 (ko) 2019-07-10 2020-07-10 Rna 시퀀싱 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020237007303A KR20230035702A (ko) 2019-07-10 2020-07-10 Rna 시퀀싱 방법

Country Status (8)

Country Link
US (4) US11578363B2 (ko)
EP (1) EP3997205A4 (ko)
JP (3) JP7194311B2 (ko)
KR (2) KR20230035702A (ko)
CN (1) CN114423873A (ko)
AU (2) AU2020309582B2 (ko)
CA (1) CA3146860A1 (ko)
WO (1) WO2021007495A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3939047A4 (en) 2019-03-10 2022-11-30 Ultima Genomics, Inc. METHODS AND SYSTEMS FOR SEQUENCE CALLING
AU2020267365A1 (en) 2019-05-03 2021-11-25 Ultima Genomics, Inc. Methods for detecting nucleic acid variants
KR20220032516A (ko) 2019-05-03 2022-03-15 울티마 제노믹스, 인크. 합성 방법에 의한 고속-정방향 시퀀싱
AU2020309582B2 (en) 2019-07-10 2022-02-24 Ultima Genomics, Inc. RNA sequencing methods
WO2022204685A1 (en) * 2021-03-23 2022-09-29 Ultima Genomics, Inc. Methods for sequencing nucleic acid molecules with sequential barcodes
EP4186982A1 (en) * 2021-11-24 2023-05-31 Miltenyi Biotec B.V. & Co. KG Sequencing of dna by sequential addition/incorporation of 3' unprotected labeled nucleotides

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7223538B2 (en) 2001-12-14 2007-05-29 Ge Healthcare Bio-Sciences Ab Post-synthesis labeling of nucleic acids, assays using nucleic acids that are labeled post-synthetically, single nucleotide polymorphism detection, and associated compounds and microarrays
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US8772473B2 (en) 2009-03-30 2014-07-08 The Regents Of The University Of California Mostly natural DNA sequencing by synthesis
WO2010127304A2 (en) * 2009-05-01 2010-11-04 Illumina, Inc. Sequencing methods
EP2633069B1 (en) 2010-10-26 2015-07-01 Illumina, Inc. Sequencing methods
US9914950B2 (en) 2012-08-23 2018-03-13 Tufts University Homopolymer mediated nucleic acid amplification
US10227584B2 (en) 2013-02-20 2019-03-12 Emory University Methods of sequencing nucleic acids in mixtures and compositions related thereto
EP3965111A1 (en) * 2013-08-30 2022-03-09 Personalis, Inc. Methods and systems for genomic analysis
EP3256624A4 (en) * 2015-02-13 2018-07-25 Vaccine Research Institute of San Diego Materials and methods to analyze rna isoforms in transcriptomes
EP3430140A4 (en) * 2016-03-17 2019-11-20 Life Technologies Corporation IMPROVED REINFORCEMENT AND SEQUENCING PROCEDURES
WO2017192387A1 (en) * 2016-05-02 2017-11-09 Cellular Research, Inc. Accurate molecular barcoding
EP3700856A4 (en) * 2017-10-26 2021-12-15 Ultima Genomics, Inc. METHODS AND SYSTEMS FOR SEQUENCE CALL
US10273528B1 (en) 2017-11-17 2019-04-30 Ultima Genomics, Inc. Methods and systems for analyte detection and analysis
US10975479B2 (en) 2018-03-08 2021-04-13 Ugsi Solutions, Inc. Electrolytic cells and water treatment systems containing the same
KR20220032516A (ko) 2019-05-03 2022-03-15 울티마 제노믹스, 인크. 합성 방법에 의한 고속-정방향 시퀀싱
CN114222824A (zh) 2019-05-03 2022-03-22 阿尔缇玛基因组学公司 测序核酸分子的方法
AU2020267365A1 (en) 2019-05-03 2021-11-25 Ultima Genomics, Inc. Methods for detecting nucleic acid variants
WO2020236630A1 (en) 2019-05-17 2020-11-26 Ultima Genomics, Inc. Methods and systems for detecting residual disease
AU2020309582B2 (en) 2019-07-10 2022-02-24 Ultima Genomics, Inc. RNA sequencing methods

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PLoS One, 8(12): e82933 (2013.12.30.)
Wiley Interdiscip Rev RNA, 8(1): 10 (2016.05.19.)

Also Published As

Publication number Publication date
JP2023116779A (ja) 2023-08-22
EP3997205A1 (en) 2022-05-18
EP3997205A4 (en) 2023-08-16
US20210147931A1 (en) 2021-05-20
AU2020309582B2 (en) 2022-02-24
WO2021007495A8 (en) 2021-09-02
WO2021007495A1 (en) 2021-01-14
JP7194311B2 (ja) 2022-12-21
JP2022534445A (ja) 2022-07-29
AU2022203479B2 (en) 2023-08-10
US11220710B2 (en) 2022-01-11
AU2022203479A1 (en) 2022-06-09
JP7302085B2 (ja) 2023-07-03
US20230313289A1 (en) 2023-10-05
US11578363B2 (en) 2023-02-14
US20210010075A1 (en) 2021-01-14
AU2020309582A1 (en) 2022-02-03
KR20220025201A (ko) 2022-03-03
CA3146860A1 (en) 2021-01-14
US20210147930A1 (en) 2021-05-20
US11220709B2 (en) 2022-01-11
CN114423873A (zh) 2022-04-29
KR20230035702A (ko) 2023-03-14
JP2023017047A (ja) 2023-02-02

Similar Documents

Publication Publication Date Title
KR102506635B1 (ko) Rna 시퀀싱 방법
US9910956B2 (en) Sequencing using concatemers of copies of sense and antisense strands
KR101994494B1 (ko) 조직 샘플 중의 핵산의 국지적 또는 공간적 검출을 위한 방법 및 그 방법의 생성물
US20230101896A1 (en) Enhanced Detection of Target Nucleic Acids by Removal of DNA-RNA Cross Contamination
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant