KR20180097536A - 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트 - Google Patents

단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트 Download PDF

Info

Publication number
KR20180097536A
KR20180097536A KR1020187015881A KR20187015881A KR20180097536A KR 20180097536 A KR20180097536 A KR 20180097536A KR 1020187015881 A KR1020187015881 A KR 1020187015881A KR 20187015881 A KR20187015881 A KR 20187015881A KR 20180097536 A KR20180097536 A KR 20180097536A
Authority
KR
South Korea
Prior art keywords
nucleic acid
sequence
barcode
construct
bar code
Prior art date
Application number
KR1020187015881A
Other languages
English (en)
Inventor
개리 위디
Original Assignee
아트레카, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아트레카, 인크. filed Critical 아트레카, 인크.
Publication of KR20180097536A publication Critical patent/KR20180097536A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/30Characterised by physical treatment
    • C12Q2523/319Photocleavage, photolysis, photoactivation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/173Modifications characterised by incorporating a polynucleotide run, e.g. polyAs, polyTs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/149Particles, e.g. beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Toxicology (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

핵산 샘플의 기원을 동정하는 방법이 본원에 제공된다. 상기 방법은 단일 세포로부터의 핵산 분자 및 바코드의 세트를 포함하는 핵산 샘플을 포함하는 반응 혼합물을 형성하는 단계, 상기 바코드의 세트를 상기 샘플의 핵산 분자에 혼입하는 단계, 및 상기 단일 세포의 핵산 분자에 혼입된 바코드의 세트를 동정함으로써 상기 핵산 샘플의 기원을 동정하는 단계를 포함한다.

Description

단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트
관련 출원의 상호 참조
본원은 그 전체가 본원에 참고로 인용된, 2015년 11월 4일자로 출원된 미국 가출원 제62,250,900호의 우선권을 주장한다.
세포 집단의 게놈 및 전사체(transcriptomic) 프로파일링은 생명 공학 및 의학 분야에서 상당한 영향을 갖는 강렬하고 커져 가는 관심 영역이다. 핵산 서열분석 기술의 최근 발전으로 인해 기존 접근법의 실제 처리량보다 훨씬 큰 규모의 프로파일링 연구가 가능해졌다. 단일 세포 게놈 또는 전사체 프로파일링을 위한 초기 노력은 FACS 분류 또는 심지어 개별 세포의 개별적인 반응 바이알, 예를 들면, 다중-웰 미세역가 플레이트의 웰로의 핸드-피킹을 포함하고, 여기서 게놈 또는 전사체 분석 방법 선택이 적용될 수 있다. 이러한 포맷에서, 개별 반응은 개별적으로 조작되고 조절될 수 있다. 예를 들면, 각 웰이 단일 세포만을 함유한다는 것을 보장하는 것은 비교적 간단하다. 이는, 여러 세포의 공동 격리가 서로 세포의 게놈 또는 전사체 프로파일의 뇌회(convolution)를 유도하기 때문에 중요하고, 개별 프로파일을 분리하는 것은 어렵거나 불가능할 것이다. 이러한 포맷의 단점은 그들이 시간, 시약 및 노동 집약적이고, 이러한 이유로 비교적 저-처리량 공정만을 허용한다는 점이다. 보다 최근의 접근법은 마이크로-웰 또는 나노-웰 또는 액적과 같은 나노리터 및 피코리터 크기의 용기에서 세포 및 필요한 화학적 및 분자 시약의 격리를 향한 경향이 있다. 이러한 포맷은 용기에서 세포 및 다른 반응 성분의 정확한 적재를 조절하는 것이 상당히 더 어렵다는 단점과 함께 시간, 비용 및 처리량 면에서 엄청난 개선을 가능하게 한다. 성분은 흔히 무작위로 용기에 할당되고, 그 경우에 많은 용기들 사이에서 성분의 분포는 포아송 분포(Poisson distribution)를 따른다. 세포의 경우, 예를 들면, 시스템이 적어도 95%의 세포가 단일 격리될 것을 요구하면(즉, 세포를 갖는 용기의 단지 5%만이 2개 이상의 세포를 함유하도록 허용된다), 조건은 각 용기가 평균 0.1개의 세포를 함유하도록 설정되어야 한다. 포아송 측면에서, 이는 기대값, 또는 0.1의 "람다"이다. 이러한 경우에, 용기의 90.48%는 세포를 수용하지 않고, 용기의 9.05%는 단일 세포를 수용하고, 0.45%는 2개의 세포를 수용하고, 0.02%는 3개의 세포를 수용하고, 더 낮은 백분율은 4개, 5개, 6개 등을 수용한다. 이러한 경우, 하나의 세포를 수용한 용기 중 95.1%는 정확히 하나의 세포를 함유한다. 그러한 시스템의 비효율성은 모든 반응 용기의 90% 초과가 세포가 결여되고, 따라서 비생산적인 것으로 명백하다. 비효율성은 둘 이상의 이러한 포아송 분포의 교차로가 연관될 때 더해진다. 게놈 및 전사체 프로파일링에 대한 일반적인 접근법은 그 세포로부터 유래된 유전자 및/또는 전사체에 첨부된 핵산 바코드와 함께 세포의 격리를 포함한다. 바코드는 이후에 각 유전자 또는 전사체를 원래의 세포에 명확하게 할당하여 그 세포의 게놈 또는 전사체 프로파일을 포함하는 데 사용된다. 이러한 도식의 명확화는 단일 격리되는 세포뿐만 아니라 단일 바코드만을 수용하는 동일 용기에 의존한다. 바코드는 단일 핵산 분자일 수 있지만, 보다 일반적으로 폴리스티렌 비드와 같은 입자를 통해 전달되고, 그 표면은 동일한 핵산 바코드의 많은 카피로 작용화된다. 어느 경우에나, 반응 용기에 고유한 바코드의 무작위 할당은 이전과 동일한 적재 통계, 즉 기대 값(람다)에 의해 결정된 포아송 분포를 따른다. 정확하게 하나의 세포가 정확하게 하나의 바코드와 함께 공동 격리된 용기만이 명확한 게놈 또는 전사체 프로파일을 산출한다. 하류 데이터 분석시, 특정 바코드를 갖는 다중 세포 격리는 공동 격리된 세포의 개별 프로파일의 결합인 단일 게놈 또는 전사체 프로파일로서 나타난다. 다수의 바코드를 갖는 다중 세포의 공동 격리의 경우가 훨씬 더 복잡한 모호성을 초래한다. 이러한 모호성은 단일 세포 유전 또는 전사체 프로파일링을 포함하는 모든 응용에 부정적인 영향을 미친다. 예를 들면, 응용이 전사체 프로파일에 의해 동정되는 특정 클론의 정량화를 포함하는 경우, 다중 바코드가 그 클론 형태의 세포와 함께 공동 격리되는 경우, 하류 분석에서 그 클론 형태의 다중 세포를 출현시키고, 따라서 샘플에서 세포의 전체 집단의 명백한 백분율을 인위적으로 팽창시킨다. 세포와 바코드를 수용하는 용기의 적어도 95%가 정확하게 하나의 세포와 정확하게 하나의 바코드를 수용한다는 것을 요구하는 이 설계의 프로파일링 시스템의 경우, 목적하는 결과(용기가 각각 적어도 하나를 수용하지 못하면, 비생산적이며 고려에서 제외된다는 것이 주시됨)를 제공하는 세포와 바코드 람다 조합의 연속체가 존재한다. 하나의 대표적인 조합은 세포와 바코드 둘 다에 대해 0.05의 람다이다. 이러한 경우, 용기는 평균 0.05개의 세포 및 0.05개의 바코드를 수용할 것이다. 세포 및 바코드 각각에서, 용기의 95.12%는 0개를 수용하고, 4.76%는 1개를 수용하고, 0.12%는 2개를 수용하고, 낮은 백분율은 3개, 4개, 5개 등을 수용한다. 적어도 하나의 세포를 수용하는 용기 중에서, 97.52%는, 바코드의 경우와 유사하게, 정확하게 1개의 세포를 수용한다. 이러한 두 백분율을 중첩시키면 정확하게 하나의 세포 및 정확하게 하나의 바코드로서 세포-바코드 공동 격리 사상의 97.52% x 97.52% = 95.1%를 수득한다. 그러나, 이 표준을 달성하기 위해서, 용기의 99.76% 초과는 세포를 수용하지 않거나, 바코드를 수용하지 않거나, 둘 다 수용하지 않기 때문에 비생산적이다. 다른 말로, 용기의 0.24% 미만은 세포 프로파일을 생산할 기회를 가질 것이다. 또한, 5% 미만의 세포가 바코드와 함께 공동 격리되기 때문에, 95% 이상의 세포가 분석에서 손실된다. 이것이 분석으로 95%의 세포의 손실을 유도하기 때문에, 이것은 시스템의 처리량을 크게 감소시키고, 분석될 관심 있는 세포가 희소 세포일 때 특히 해롭다. 이러한 피코 및 나노리터 규모의 방법은, 바코드를 수용하는 용기의 백분율이 바코드화 도식의 정확도를 희생시키지 않고 증가될 수 있는 경우, 처리량(즉, 처리되는 세포의 수) 및 샘플 범위(즉, 처리되는 원래 샘플 중 전체 세포의 수의 백분율)의 측면에서 의미 있는 개선을 실현할 수 있다.
바코드 핵산 작용화 비드, 핵산 바코드가 적재된 하이드로겔 또는 유사한 바코드 전달 방법과 같은 핵산 바코드의 모노클로날 "패킷" 또는 "세트"를 사용하는 게놈 및 전사체 프로파일링 접근법의 경우, 핵산 바코드의 패킷은 거의 항상 어느 정도의 다클론성을 나타낸다. 다클론성의 정도는 바코드 패킷을 생성하는데 사용되는 방법에 의존한다. 예를 들면, 하나의 방법은 보편적인 프라이밍 서열을 갖는 DNA 올리고로 작용화되고 PCR에 의해 비드의 표면에서 증폭되는 개별적 바코드 분자로 유화된 비드를 사용한다. 이 도식에서, 에멀젼 중 각 액적은 모두 동일한 바코드 서열을 수용하는 다수의 비드를 함유할 수 있지만, 이상적인 경우에 임의의 소정의 액적은 하나의 바코드 핵산만을 수용할 것이다. 2개 이상의 바코드 핵산이 단일 액적으로 들어가면, 그 액적에서 생성된 임의의 비드는 폴리클로날일 것이다. 바코드 핵산 분자는 바코드 농도를 변경하여 조정할 수 있는 포아송 분포에 따라 액적에 할당된다. 여기서, 절충안이 또한 존재한다. 저농도의 바코드는 전체 바코드화 비드가 더 적게 생산된다는 불리한 비용으로, 고도의 모노클론성을 갖는 비드를 생성한다. 고농도는 바코드화 비드 수율을 증가시키고, 여기서 높은 비율의 비드는 높은 다클론성을 나타낸다. 다클론성은 이 방법의 설계에 내장된다. 핵산 바코드를 패키징하는 다른 방법은 조합 합성을 포함한다. 384-웰 플레이트에서 수행된 각 웰은 보편적인 DNA 올리고 프라이머로 작용화되는 다수의 입자 - 이 경우에, 하이드로겔-를 함유한다. 각 웰은 또한 PCR에 의해 그 웰 중 각 하이드로겔에 혼입되는 별개의 초기 바코드 서열을 함유한다. 이어서, 하이드로겔은 함께 풀링하고, 다른 384-웰 플레이트로 재분배되고, 이의 각 웰은 다시 PCR에 의해 각 하이드로겔로 혼입되는 별개의 두 번째 바코드 서열을 함유한다. 이 방법에 의해 생성되는 하이드로겔의 라이브러리는 약 150K 바코드의 다양성을 갖고, 이론적으로는 고도의 모노클론성을 나타내야 한다. 그러나, 실제로 이 방법은 무시할 수 없을 정도(약 8%)의 다클론성을 산출한다고 보고되어 있다(참조: Klein, A. Cell 161 (2015)). 이 다클론성은 어느 하나의 PCR 단계에서 PCR 플레이트의 웰 사이의 하이드로겔 또는 바코드 핵산의 오염으로부터 또는 원래의 바코드 핵산 라이브러리 - 초기 또는 2차 바코드 서열의 오염으로부터 또는 둘 다로부터 발생할 수 있다. 설계에 의해서든 오염에 의해서든, 바코드 패킷의 라이브러리에 대한 임의의 다클론성은 각 세포에 단일 바코드를 할당하도록 설계된 게놈 또는 전사체 프로파일링 시스템을 혼동시킬 것이다. 바코드화 도식은 바코드 패킷의 라이브러리의 어느 정도의 다클론성에 대처할 수 있는 임의의 능력으로부터 이점을 얻을 수 있다.
핵산 바코드의 포아송 기반 분포로부터 발생하는 비효율성을 극복하거나 피하기 위해 취해진 접근법의 몇 가지 예가 존재한다. 개별 바코드가 적재되고, (0.1 내지 0.2의 람다를 갖는 포아송 분포에 따라 무작위로 적재된) 세포에 따라 액적으로 캡슐화하기 직전에 액적 장치의 수성 스트림으로 혼입된 하이드로겔 입자를 사용하는 전사체 프로파일링 방법이 보고되었다. 하이드로겔은 매우 순응적이기 때문에, 그들은 좁은 입구에서 단일 파일로 패킹되고, 액적 형성 속도와 동기화될 수 있는 고도로 정돈된 공정으로 혼입될 수 있다. 결과적으로, 거의 모든 액적은 고유한 바코드의 많은 카피를 갖는 하나의 하이드로겔 입자(참조: Abate, R. Lab on a Chip 9 (2009))를 수용한다. 그러나, 이러한 조심스럽게 조정된 실험은 고도로 최적화된 환경에서 전문가의 손으로 실행될 수 있지만, 이 접근법이 광범위하게 사용하기에 충분히 확장 가능하고 견고한 지의 여부는 여전히 남아 있다. 또한, 도식은 폴리클로날 바코드 패킷에 견고하지 않다. 다른 접근법은, 중첩 확장 PCR의 경우에서와 같이, 단일 연속 앰플리콘에 관심 있는 다중 게놈 또는 전사체 표적의 혼입을 포함한다. 이러한 접근법은 각 표적물에 바코드를 추가하는 대신 관심 있는 표적을 물리적으로 연결하기 위해 맞춤형 보편적 프라이머 세트에 의존한다. 프라이머 세트는 보편적이고, 많은 카피가 모든 용기에 혼입되기 때문에, 표적이 그들의 기원 세포에 할당되는 메카니즘은 포아송 구동 분포의 단점에 직면하지 않는다. 그러나, 이러한 접근법은 각 세포로부터 표적화될 수 있는 잠재적인 유전자 또는 전사체의 수에 심각하게 제한된다. 현재 존재하는 모든 방법은 아니지만 대부분은 현재 두 가지로 제한된다(참조: DeKosky, BJ, Nat Biotechnol 31(2) (2013)).
본원은 핵산 샘플의 기원을 동정하는 방법을 제공한다. 상기 방법은 단일 세포 및 한 세트의 바코드로부터의 핵산 분자를 포함하는 핵산 샘플을 포함하는 반응 혼합물을 형성하는 단계, 상기 바코드 세트를 상기 샘플의 핵산 분자에 혼입시키는 단계 및 상기 단일 세포의 핵산 분자에 혼입된 바코드 세트를 동정함으로써 상기 핵산 샘플의 기원을 동정하는 단계를 포함한다. 또한, 각각의 작제물이 고유한 5' 또는 3' 바코드 서열을 각각 포함하는 5' 및 3' 핵산 작제물의 세트를 제공하는 단계, 단일 세포로부터의 핵산 분자를 포함하는 핵산 샘플을 제공하는 단계, 5' 및 3' 핵산 작제물의 세트와 핵산 샘플을 접촉시키는 단계, 5' 및 3' 핵산 작제물로부터 각각 5' 및 3' 바코드 서열을 핵산 분자에 혼입하는 단계, 및 5' 및 3' 바코드 서열의 세트를 동정함으로써 상기 단일 세포로부터 핵산 샘플의 기원을 동정하는 단계를 포함하는 방법도 또한 제공된다.
도 1은 액적 형성을 위한 유동-초점 구성의 오일 입력 채널 및 다음의 수성 입력 채널을 갖는 미세 유체 액적 칩의 개략도이다: (1) 현탁 완충액 중 세포 및 (2) 바코드 혼합물 중 바코드화 비드. 현탁 완충액 및 바코드 혼합물은 액적에서 목적하는 최종 혼합물을 포함하는 비율로 성분을 병합하기 위해 집중되는 상이한 미세 유체 채널에 위치된다. 바코드화 비드 및 세포는 포아송 분포에 의해 기재된 바와 같이 수성 액적으로 적재된다. 액적 당 비드의 평균 값(람다) 및 액적 당 세포는 이들 유입 스트림에서 이들 성분의 농도의 함수이다. 액적은 바코드 반응이 일어나는 반응 용기이다.
도 2는 2개의 비드 세트(3' 및 5')의 예시적 조성을 도시하는 개략도이다. 각 3' 비드 상의 바코드 핵산은 비드로부터 바코드 서열을 절단하기 위해 사용되는 제한 부위(RS), 하류 분석에 사용되는 고유한 분자 동정자 서열(UMI), 바코드 서열(BC3) 및 폴리-T 서열(TTT)을 포함한다. 각 5' 비드 상의 바코드 핵산은 제한 부위(RS), 바코드 서열(BC5) 및 3개의 구아닌 잔기를 포함한다.
도 3은 액적 내에서 세포가 용해되고, mRNA 전사체가 방출되어 바코드 반응에 접근할 수 있음을 보여주는 개략도이다. 제한 효소(RE)는 제한 부위에서 그들의 비드로부터 3' 및 5' 바코드 둘 다를 절단한다. 역전사는, 3' 바코드의 폴리-T 서열이 mRNA 전사체의 3' 말단에서 폴리-A 꼬리에 어닐링될 때, 개시된다. 이러한 3' 바코드 프라이머로부터 출발하여, 역전사효소(RT) 효소는 3' 바코드 및 mRNA 서열을 모두 포함하는 단일 cDNA 앰플리콘을 생성하기 위해 5' 내지 3' 방향으로 역전사시킨다. 전사체의 말단에 도달시, RT 효소(M-MLV 효소)를 5' 바코드의 3개의 구아닌 잔기를 위한 어닐링 부위를 제공하는 몇몇 시토신 잔기를 추가한다. 5' 바코드가 어닐링되면, RT 효소는 "주형-스위칭하고", 5' 바코드 서열을 동일한 cDNA에 혼입한다.
도 4는 2개의 3' 바코드화 비드 및 3개의 5' 바코드화 비드가 세포와 공동 캡슐화됨을 도시하는 개략도이다. 각각의 3' 바코드는 각각의 5' 바코드와 쌍을 이루고, 그 반대의 경우도 이 세포로부터 기원하는 모든 전사체를 동정하는 응집성이고 고유한 바코드 세트를 형성한다.
도 5는 역전사가 조기에 종결되면, cDNA가 5' 바코드를 혼입하지 못한다는 것을 도시하는 개략도이다. 3' 바코드의 라이브러리는 임의의 하나의 바코드가 다중 세포와 공동 캡슐화될 가능성이 거의 없도록 (총 바코드의 수와 연관하여) 설계될 수 있다. 이러한 경우, 비-전장 바코드화 cDNA는 높은 수준의 신뢰성으로 적절한 프로파일에 할당할 수 있다.
도 6은 동일한 2개의 3' 바코드 서열이 2개의 상이한 액적으로 공동 캡슐화되지만, 그럼에도 불구하고 2개의 바코드 세트가 여분의 3' 바코드로 인해 구별가능하다는 것을 도시하는 개략도이다. 이 세 번째 3' BC가 다른 액적의 2개의 5' BC'와 쌍을 이루지 않기 때문에, 2개의 바코드 세트를 구분하는 라인은 명확하게 그려질 수 있다.
도 7은 예시적인 바코드 세트의 사용을 도시하는 개략도이다. 여기서, 5' 바코드 비드 세트는 이본쇄 DNA 올리고로 작용화되고, 이의 혼성화된(비공유결합된) 가닥은 T7 프로모터 서열("T7"), 바코드 서열 및 3개의 시토신 잔기를 포함한다. 제한 효소에 의해 비드 표면으로부터 절단되는 것이 아니라, T7 프로모터는 T7 RNA 폴리머라제가 비드 표면 상의 DNA 올리고 주형으로부터 RNA 바코드 카피에 결합하고 전사하도록 한다. 이러한 RNA 바코드 카피는 3' 말단에서 그들을 전장 3'-바코드화 cDNA의 3' 말단에 어닐링할 수 있도록 하는 3개의 구아닌 잔기로 종결된다. RT 효소는 5' 바코드 RNA 올리고 주형으로 주형-스위칭하고, 5' 바코드를 cDNA로 혼입한다.
도 8은 일본쇄 바코드 올리고뉴클레오티드로 표면 작용화된 각 비드를 도시하는 개략도이다. 올리고는 이본쇄 세그먼트가 제한 부위를 함유하는 헤어-핀 구조를 형성한다. 제한 효소는 두 가닥을 절단하고, 전사체 바코드화 세그먼트 및 루프화 세그먼트를 방출한다. 루프화 세그먼트는 전사체 바코드화 세그먼트 상의 바코드와 동일하거나 이와 간단히 연관되는 바코드, 및 "바코드 연관 세그먼트"(BAS)를 포함한다. BAS는 두 개의 루프화 세그먼트의 2개의 바코드를 단일 앰플리콘에서 함께 물리적으로 연결하는 DNA 폴리머라제 반응에서 다수의 루프화 세그먼트가 서로 프라이밍되도록 한다. 이를 달성하기 위해, BAS는 회문성일 수 있거나, 모두가 각각의 비드 상에 혼입된 별개의 세트(예: 2개의 상보성 서열)로 구성될 수 있다.
도 9는 mRNA의 폴리-A 꼬리에 선택적으로 어닐링하는 폴리-T 꼬리를 갖는 전사체-바코드화 세그먼트를 도시하는 개략도이다. 전사체 서열은 바코드를 또한 포함하는 단일 cDNA로 역전사된다.
도 10은 2개의 바코드화 비드가 세포와 공동 캡슐화될 때, 그 세포로부터의 각 전사체가 2개의 바코드 중 하나(BC1a 또는 BC2a)에 의해 바코드화될 수 있음을 도시하는 개략도이다. 동일한 액적은 또한 2개의 전사체 바코드 각각에 상응하는 루프화 세그먼트의 많은 카피를 함유한다.
도 11은 루프화 세그먼트가, BAS를 통해 루프화 세그먼트 사이의 교차 어닐링이 루프 구조에서 나머지 자체 어닐링된 단일 루프화 세그먼트에 비해 바람직하도록 설계될 수 있음을 도시하는 개략도이다. DNA 폴리머라제는 다른 바코드의 상보체를 혼입하기 위해 각 루프화 세그먼트를 확장하기 위해 포함될 수 있다.
도 12는 샘플과 연관된 바코드를 도시하는 개략도이다. 5' 바코드(5'BC) 또는 3' 바코드(3'BC)는 샘플과 연관될 수 있다: (a) 샘플과 연관된 핵산의 각 말단 상의 하나, 또는 (b) 핵산의 5' 말단 상의 둘 또는 (c) 핵산의 3' 말단 상의 둘 또는 (d-f) 내부적으로, 핵산 내에서 또는 샘플과 연관된 2개의 핵산이 공유 결합되는 경우. 바코드는 폴리머라제 연쇄 반응(PCR)과 같은 결찰 또는 증폭 시술을 포함하지만, 이에 제한되지 않는 공지된 방법을 통해 샘플에 첨가될 수 있다.
도 13은 샘플과 연관된 바코드 세트의 분석을 도시하는 개략도이다. 바코드화 핵산은 둥근 정점(5' 바코드) 및 직사각형 정점(3' 바코드)이 (핵산을 나타내는) 엣지로 연결되어 있는 이분할 그래프로서 표현될 수 있다. 반응 용기에서, 5' 및 3' 바코드의 모든 조합은 핵산과 연관될 수 있고, 따라서 모든 둥근 정점은 엣지에 의해 모든 직사각형 정점에 연결되어 최대 클리크를 형성해야 한다. 최대 클리크를 사용하면 바코드와 핵산을 샘플 내에 올바르게 연관시킨다.
도 14는 샘플과 연관된 다수의 바코드 세트가 바코드 "충돌"을 분석함을 도시하는 개략도이다. (상부) 단일 바코드 세트가 사용되고, 상이한 반응 용기가 동일한 바코드 비드를 함유하는 경우, 상이한 샘플의 핵산의 잘못된 연관이 발생한다. (중간) 여러 바코드 세트가 사용되는 경우, 두 반응 용기 중의 동일한 바코드(5' 바코드)는 다른 바코드 세트(여기서, 3' 바코드)와 연관에 의해 명확해질 수 있다. 공유된 5' 바코드는 두 클리크에 속하지만, 5' 바코드 정점의 엣지(핵산을 나타내는)는 유일하게 1개의 클리크에만 속한다. (하부) 두 반응 용기에 동일한 5' 및 3' 바코드가 존재하는 경우, 엣지는 두 클리크에 속하고, 핵산이 어떤 샘플과 연관되는지는 공지되지 않았다. 이는 분석(파선으로 표시된)에서 검출되고 폐기될 수 있다.
도 15는 서열 판독 쌍에서 관찰된 바코드 쌍의 빈도((y-축, 분수) 및 관찰된 횟수(x-축, 카운트)를 도시하는 그래프이다. 바코드 쌍의 절반 이상이 정확하게 한번 관찰되었으며, 직접 여과 제거할 수 있는 실험적 소음(예: 서열분석 오류)을 나타내는 이들과 일치한다. 10회 이상 바코드 쌍이 거의 관찰되지 않았다. 50번 저장소는 50회 이상 관찰된 모든 바코드 쌍을 포함한다.
반응 용기에 단일의 고유한 바코드를 혼입하려고 시도하는 대신, 본원은 생산 반응의 대부분 또는 모든 경우에 그 용기에서 모든 게놈 또는 전사체 표적의 세포 기원을 동정하는 구별가능한 바코드 세트를 형성하는 다수의 바코드를 고의적으로 혼입하는 것에 관한 것이다. 이는 임의의 몇몇 다른 방식으로 구현될 수 있고, 중요한 공통 특징은, 다수 바코드가 단일 용기에 혼입되는 경우, 관심 있는 게놈 또는 전사체 표적을 바코드 처리하는 것 이외에, 용기 중의 모든 바코드가 그 용기의 다른 모든 바코드와 직접 또는 간접적으로 연관될 수 있는 메카니즘도 또한 존재한다는 것이다. 단일 바코드가 아닌 여러 바코드가 개별 용기에 할당되면, 바코드의 무작위 배분은 용기의 대부분이 비어 있어 비생산적인 요건 없이 적용될 수 있다. 제공된 방법은 또한 2개 이상의 포아송 분포의 교차점을 적용하는 비효율성을 감소시킨다.
처리량 및 적용 범위와 연관하여 바코드화 도식의 이점을 입증하기 위해, 세포 및 바코드를 수용하는 용기의 적어도 95%가 정확하게 하나의 세포 및 하나의 바코드를 수용하는 경우를 고려한다. 다중 바코드화 도식에서, 상응하는 요건은, 수용된 바코드의 수가 실용적인 고려사항과 무관하기 때문에 세포를 수용하는 95% 초과의 용기가 정확하게 하나의 세포를 수용한다는 것이다. 이 표시는 용기 당 0.1개 세포의 평균 값으로 도달되고, 이때 적어도 하나의 세포를 수용하는 용기의 95.1%가 정확히 하나의 세포를 수용한다. 용기당 바코드의 평균 수는 바코드 경제성, 하류 분석의 복잡성 및 다른 인자들 중 샘플 적용 범위 사이의 목적하는 균형을 기반으로 선택될 수 있다. 용기당 3개의 바코드의 평균 값의 경우, 상응하는 포아송 분포는 용기의 95.02%가 적어도 하나의 바코드를 수용하도록 규정한다. 단일 바코드 접근법에서, 용기의 0.24% 미만이 적어도 하나의 세포 및 하나의 바코드를 수용하고 따라서 게놈 또는 전사체 프로파일링 시스템에 생산적으로 참여하는 기회를 갖는 반면, 이 유사한 다중 바코드 접근법에서 용기의 9.04%는 적어도 하나의 세포 및 하나의 바코드를 수용한다. 이는 잠재적으로 생산적인 용기의 수를 거의 40배 증강시키고, 생성되는 처리량(프로파일링된 세포의 수와 연관하여)은 따라서 증가할 것으로 예상될 수 있다. 중요하게는, 이는 프로파일링되는 세포의 수뿐만 아니라 백분율도 반영한다. 단일 반코드 접근법에서, 용기의 4.88%만이 적어도 하나의 바코드를 수용하고, 따라서 낮은 비율의 세포가 프로파일링되는 반면, 용기당 3개의 바코드의 평균 값을 갖는 복수의 비드 접근법에서, 용기의 95.02%가 적어도 하나의 바코드를 수용한다. 이는 샘플 적용 범위에서 거의 20배 증가를 가능하게 하고, 용기당 더 높은 평균 바코드의 수가 선택되는 경우 더 큰 이득이 실현될 수 있다. 샘플 적용 범위에서 이러한 개선은 매우 유익하며, 비교적 희귀한 세포 클론의 프로파일이 요구되는 용도에는 특히 유용하다.
다중 바코드 접근법의 또 다른 이점은, 도식이 모노클로날 바코드의 세트를 생성하는 것을 목표로 하는 대부분의 또는 모든 방법의 공통 결과인 다클론성에 대해 견고하다는 것이다. 단일 바코드 접근법에서, 2개 이상의 명확한 바코드를 함유하는 단일 세트가 그 바코드 세트가 할당된 세포의 프로파일을 혼동시키는 반면, 소정의 용기에서 모든 바코드를 포괄적인 바코드 세트로 함께 결합시키는 프로파일링 도식은 폴리클로날 바코드 세트에 대처할 수 있다. 이는 또한, 비드 바코드화 공정의 수율 및/또는 비용과 연관하여 상당한 개선을 가능하게 할 수 있다. 본원에서 기재된 에멀젼 PCR 기반 방법을 예로서 사용하여, 허용되는 임계값이 바코드화 비드의 적어도 95%가 모노클로날이어야 하는 경우, 유화 공정 중 바코드 카피 람다는 비드의 10% 미만이 바코드를 수용하고 비드의 나머지는 낭비된다는 결과와 함께 0.1로 설정해야 한다. 더 큰 비율의 폴리클로날 비드가 허용될 수 있도록 시스템이 설계되는 경우 - 예를 들면, 비드의 99%는 단일-, 이중- 또는 삼중 코딩되어야 하고(이 경우에, 약 70%는 단일 코딩됨)- 바코드 카피 람다는 비드의 >50%가 적어도 하나의 바코드를 수용하는 결과와 함께 0.7로 설정될 수 있다. 이는 생산 수율을 5배 이상 증가시킨다.
표 1. 바코드화 비드 수율의 상응하는 배수 증가 대 람다 = 0.1의 경우와 함께 emPCR 비드 바코드화 반응에서 액적 당 바코드의 평균 카피 수(람다)의 함수로서 비드의 클론성 비율
Figure pct00001
단일 바코드가 아닌 식별 가능한 바코드 세트를 사용하여 유전자 또는 전사체 프로파일을 동정함으로써, 도식은 또한 임의의 하나의 바코드가 여러 반응 용기에 들어간 경우를 동정할 수 있다. 단일 바코드 서열과 두 개의 다른 별개의 세트를 연결하면 이러한 경우가 동정되도록 하고, 별도의 분석 메카니즘에 의해 분류되거나 폐기되도록 할 수 있다.
샘플과 연관된 바코드와 핵산의 올바른 할당은 그래프 이론을 사용하여, 구체적으로 이분할 그래프를 사용하고 최대 클리크를 검색하여 수행될 수 있다. 이분할 그래프는 정점들(또는 노드들)이 모든 엣지가 제1 세트의 정점과 제2 세트의 정점을 연결하는 2개의 분리된 세트로 나누어질 수 있는 그래피이다. 본 목적을 위해, 두 세트의 정점은 두 개의 바코드 세트(5' 및 3' 바코드 세트)를 나타내고, 정점들을 연결하는 엣지는 그 5' 바코드 및 이에 혼입된 그 특별한 3' 바코드를 갖는 핵산을 나타낸다(도 13). 반응 용기에서, 5' 및 3' 바코드의 모든 조합은 핵산과 연관될 수 있고, 따라서, 모든 둥근 정점은 엣지에 의해 모든 직사각형 정점에 연결되어 최대 클리크를 형성해야 한다. 클리크는 클리크 중 모든 두 개의 별개의 정점이 인접하는 무방향성 그래프의 정점의 서브세트이다. 최대 클리크는 하나 이상의 인접 정점을 포함시킴으로써 확장시킬 수 없는 클리크로, 더 큰 클리크의 서브세트가 아님을 의미한다. 컴퓨터 프로그램을 사용하여 최대 클리크를 정보적으로 해결하면 바코드와 핵산을 샘플 내에서 올바르게 연결시킨다(참조: 도 13 및 14). 도 14는 다중 바코드 세트를 사용하는 추가의 이점을 나타낸다. 임의의 하나의 바코드가 다중 반응 용기 (또는 바코드 "충돌")에 들어가는 경우가 검출되고 분석될 수 있다. 이는 하나의 바코드만을 사용하는 경우에는 가능하지 않다.
작용성 세트 내의 다중 바코드의 조합은 본질적으로 코드 공간에 더 큰 다양성을 추가한다. 예를 들면, 각각의 cDNA 카피가 각 말단(5' 및 5')에서 하나의 바코드를 수용하고, 각 세트(5' 및 3') 중의 코드 공간이 100인 본 발명의 하나의 가능한 구현예에서, 시스템의 전체 코드 공간은 100 X 100 = 10,000의 가능한 바코드 조합이다. 이는 더 큰 바코드화 정확도로 더 많은 수의 세포를 바코드화하기 위해 보다 작은 바코드화 비드의 라이브러리가 생성되도록 할 수 있다.
편의상, 바코드 세트는 5' 및 3' 바코드로서 칭명된다. 다중 바코드 세트는 핵산을 적절한 반응 용기에 할당하고, 따라서 핵산 샘플의 기원을 동정하는데 사용될 수 있다. 바코드 세트는 5' 말단 및 3' 말단에서 어느 하나 또는 5' 말단에서 모두 또는 3' 말단에서 모두, 또는 심지어 핵산 샘플 내에서 내부적으로 핵산 샘플과 연관될 수 있다(참조: 도 12). 바코드는 증폭(예: 폴리머라제 연쇄 반응(PCR)), 결찰 및 전위 반응(참조: Green et al., Molecular Cloning, A Laboratory Manual, 4th Edition, Cold Spring Harbor Press (2012))을 포함하지만, 이에 제한되지 않는 당해 기술 분야에 공지된 방법을 사용하여 핵산에 첨가할 수 있다. 적어도 2개 이상의 바코드 세트가 핵산 샘플과 연관되어 있는 한, 핵산은, 바코드 비드를 갖는 반응 용기를 적재하는데 있어서 포아송 통계학을 통제하고, 임의의 하나의 바코드가 다중 반응 용기에 들어가는 바코드 '충돌'을 분석함을 포함하는 본원에 기재된 모든 이점을 갖는 적절한 반응 용기 (및 따라서 샘플)에 할당될 수 있다.
단일 액적에 다중 바코드화 비드를 포함시키면 유전자 또는 전사체 바코드화 반응이 진행되는 분자 생물학에도 또한 도움이 될 것이다. 바코드 핵산 분자가 바코드화 반응에서 반응물이고, 임의의 반응의 효율이 이의 반응물의 공급과 직접 연관되기 때문에, 각 반응에 복수의 바코드를 포함시키면 바코드화 생성물의 수율이 증가된다.
핵산 샘플의 기원을 동정하는 방법이 본원에 제공된다. 상기 방법은 단일 세포 및 바코드의 세트로부터의 핵산 분자를 포함하는 핵산 샘플을 포함하는 반응 혼합물을 형성하는 단계, 바코드의 세트를 샘플의 핵산 분자로 혼입하는 단계 및 단일 세포의 핵산 분자에 혼입된 바코드의 세트를 동정함으로써 핵산 샘플의 기원을 동정하는 단계를 포함한다. 임의로, 바코드의 세트는 각 작제물이 고유한 5' 바코드를 포함하는 적어도 2개의 5' 핵산 작제물을 포함한다. 임의로, 바코드의 세트는 각 작제물이 고유한 3' 바코드를 포함하는 적어도 2개의 3' 핵산 작제물을 포함한다. 임의로, 하나 이상의 핵산 분자는 둘 이상의 고유한 바코드를 포함한다. 임의로, 고유한 바코드는 핵산 분자의 5' 말단, 3' 말단 또는 5' 및 3' 말단 둘 다에 위치된다. 임의로, 상기 방법은 복수의 반응 혼합물을 형성하는 단계를 포함한다. 임의로, 둘 이상의 고유한 바코드는 반응 혼합물의 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%에 존재한다. 임의로, 복수의 반응 혼합물을 형성시키는 단계는 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 2.0, 3.0, 4.0 또는 5.0보다 큰 람다에서 복수의 반응 혼합물에 바코드의 세트를 첨가하는 단계를 포함한다.
또한, 각 작제물이 고유한 3' 바코드 서열을 포함하는 3' 핵산 작제물의 세트를 제공하는 단계, 단일 세포로부터의 핵산 분자를 포함하는 핵산 샘플을 제공하는 단계, 핵산 샘플을 3' 핵산 작제물의 세트와 접촉시키는 단계, 3' 핵산 작제물로부터의 3' 바코드 서열을 핵산 분자에 혼입하는 단계, 및 3' 바코드 서열의 세트를 동정함으로써 단일 세포로부터의 핵산 샘플의 기원을 동정하는 단계를 포함하는, 핵산 샘플의 기원을 동정하는 방법도 또한 제공된다.
용어가 본원에서 사용되는 바와 같이, 폴리뉴클레오티드로 서열을 "혼입시키는" 것은, 예를 들면, 폴리뉴클레오티드의 3' 또는 5' 말단에서 일련의 뉴클레오티드를 폴리뉴클레오티드의 나머지와 포스포디에스테르 결합에 의해 공유결합시킴을 의미하고, 여기서 뉴클레오티드는 서열에 의해 규정된 순서로 연결된다. 폴리뉴클레오티드가 서열 또는 이의 상보체를 함유하는 경우, 서열은 폴리뉴클레오티드에 "혼입되어" 있거나, 동등하게 폴리뉴클레오티드는 서열을 "혼입한다". 폴리뉴클레오티드로 서열의 혼입은 효소적으로(예: 결찰 또는 중합에 의해) 또는 화학적 합성을 사용하여(예: 포르포르아미디트 화학에 의해) 발생할 수 있다.
용어 "프라이머"는 표적 핵산에 선택적으로 어닐링하거나 하이드리드화할 수 있는 폴리뉴클레오티드(올리고뉴클레오티드) 및 이의 유사체를 의미한다. 프라이머는 적절한 조건하에, 예를 들면, 적절한 효소(들), 보조 인자, 기질, 예를 들면, 뉴클레오티드(dNTP) 등의 존재하에 DNA 합성을 위한 개시 프라이머로서 작용한다. 프라이머는 프라이머의 3' 말단으로부터 상응하는 폴리뉴클레오티드 주형, 플랭킹 서열 또는 증폭 생성물에 상보적인 서열의 합성을 가능하게 한다. 전형적으로, 프라이머는 길이가 약 10 내지 100개의 뉴클레오티드일 수 있다. 프라이머 결합 부위 또는 보편적인 프라이밍 서열은 프라이머가 결합하여 증폭을 개시할 수 있는 핵산 서열을 의미한다.
본원에 사용된 용어 "증폭하다" 및 "증폭"은 서열 또는 이의 상보체를 또한 함유하는 더 많은 폴리뉴클레오티드를 생성하기 위해 폴리뉴클레오티드의 서열을 전체적으로 또는 부분적으로 효소적 카피하는 것을 의미한다. 카피되는 서열은 주형 서열로서 칭명된다. 증폭의 예는 RNA 폴리머라제에 의한 DNA-주형화 RNA 합성, 역전사효소에 의한 RNA-주형화 제1 가닥 cDNA 합성, 및 열경화성 DNA 폴리머라제를 사용하는 DNA-주형화 PCR 증폭을 포함한다. 증폭은 모든 프라이머 연장 반응을 포함한다.
본원에 사용된 용어 "등온성"은 일정한 온도 또는 온도 범위에서 수행되는 효소 반응과 같은 반응을 의미한다.
용어 "연관된"은 샘플과 DNA 분자, RNA 분자, 또는 그 샘플로부터 유래되거나 그 샘플로부터 유도된 다른 폴리뉴클레오티드 사이의 관계를 의미하기 위해 본원에서 사용된다. 용어는 하나의 바코드 서열과 다른 바코드 서열 사이의 관계 또는 하나의 바코드 서열과 다른 바코드 서열의 세트 사이의 관계를 의미하기 위해 사용될 수 있다. 예를 들면, 바코드가 동일한 바코드의 세트에 존재하는 경우, 바코드는 다른 바코드와 연관된다. 대안적으로, 바코드 서열이 바코드 서열의 세트 중 바코드의 하나인 경우, 바코드는 바코드의 세트와 연관될 수 있다. 폴리뉴클레오티드는, 그것이 내인성 폴리뉴클레오티드인 경우, 즉, 그것이 샘플이 선택되는 시간에 샘플에서 발생하거나, 내인성 폴리뉴클레오티드로부터 유도되는 경우, 샘플과 연관된다. 예를 들면, 세포에 내인성인 mRNA는 그 세포와 연관된다. 이러한 mRNA의 역전사로부터 생성되는 cDNA, 및 cDNA의 PCR 증폭으로부터 생선되는 DNA 앰플리콘은 mRNA의 서열을 함유하고, 또한 세포와 연관된다. 샘플과 연관된 폴리뉴클레오티드는 샘플 내에 위치하거나 합성될 필요가 없으며, 샘플이 파괴된 후에도(예를 들면, 세포가 용해된 후에도) 샘플과 연관된 것으로 간주된다. 분자 바코드화 또는 다른 기술을 사용하여 혼합물 중의 어느 폴리뉴클레오티드가 특정 샘플과 연관되는지를 결정할 수 있다.
용어가 본원에서 사용되는 바와 같이, "반응 용적" (또는 동등하게 "용기" 또는 "구획")은 액체, 예를 들면, 수용액의 용적이 보유되고 액체 또는 주변 매질의 다른 이러한 용적으로부터 분리된(예: 단리된) 상태로 유지될 수 있는 공간이다. 반응 용적과 이의 주위의 분리는 반응 용적 주위의 고체 장벽 또는 상 분리에 기인할 수 있다. 예를 들면, 소수성 담체 유체에 현탁된 수성의 미세 유체 액적은 물이 담체 유체에서 비혼화성이기 때문에 반응 용적을 구성할 수 있다. 따라서, 담체 유체에서 서로 분리된 두 액적은 분리된 상태로 유지되고, 하나의 액적에 용해된 핵산 또는 다른 친수성 종은 액적에서 방출되거나 다른 액적으로 이동할 수 없다. 반응 용적은 또한, 예를 들면, 플라스크, 비이커, 원심분리관 및 다중 웰 플레이트 중 웰로 정의될 수 있다.
예를 들면, 단일 세포로부터의 샘플과 연관된 RNA에 바코드의 세트를 "추가하는 단계"는 RNA 및 바코드가 바코드화 반응에 참여할 수 있도록 바코드 및 단일 세포 또는 단일 세포로부터의 RNA를 함유하는 반응 혼합물을 형성하는 단계를 포함한다. 일단 첨가되면, 바코드는, 예를 들면, RNA로 하이브리드화함으로써 하나 이상의 RNA와 직접 반응할 수 있거나, 중합 반응 또는 RNA 분자가 주형으로서 작용하는 일련의 반응(예를 들면, 역전사 또는 RT-PCR)에 참여할 수 있다.
용어 "폴리뉴클레오티드(들)"는 핵산, 예를 들면, DNA 분자 및 RNA 분자 및 이의 유사체(예: 분자 유사체를 사용하거나 핵산 화학을 사용하여 생성된 DNA 또는 RNA)를 의미한다. 목적하는 경우, 폴리뉴클레오티드는, 예를 들면, 당해 기술 분야 인식된 핵산 화학을 사용하여 합성적으로 또는, 예를 들면, 폴리머라제를 사용하여 효소적으로 제조될 수 있고, 경우에 따라, 변형될 수 있다. 전형적인 변형은 메틸화, 비오티닐화, 및 다른 기술 분야 공지된 변형을 포함한다. 또한, 폴리뉴클레오티드는 일본쇄 또는 이본쇄일 수 있고, 경우에 따라, 검출 가능한 잔기에 연결될 수 있다. 일부 측면에서, 폴리뉴클레오티드는, 예를 들면, DNA 및 RNA를 포함하는 하이브리드 분자를 포함할 수 있다.
"G", "C", "A", "T" 및 "U"는 각각 일반적으로 염기로서 구아닌, 시토신, 아데닌, 티미딘 및 우라실을 각각 함유하는 뉴클레오티드를 나타낸다. 그러나, 용어 "리보뉴클레오티드" 또는 "뉴클레오티드"는 변형된 뉴클레오티드 또는 대리 치환 잔기를 의미할 수도 있음이 이해될 것이다. 당업자는 구아닌, 시토신, 아데닌 및 우라실이 이러한 치환 잔기를 포함하는 뉴클레오티드를 포함하는 올리고뉴클레오티드의 염기 쌍화 특성을 실질적으로 변경하지 않고 다른 잔기로 대체될 수 있음을 잘 알고 있다. 예를 들면, 제한 없이, 이의 염기로서 이노신을 포함하는 뉴클레오티드는 아데닌, 시토신 또는 우라실을 함유하는 뉴클레오티드와 염기 쌍을 형성할 수 있다. 따라서, 우라실, 구아닌 또는 아데닌을 함유하는 뉴클레오티드는 뉴클레오티드 서열에서, 예를 들면, 이노신을 함유하는 뉴클레오티드로 대체될 수 있다. 다른 예에서, 올리고뉴클레오티드 중 임의의 위치의 아데닌 및 시토신은 각각 구아닌 및 우라실로 대체되어 표적 mRNA와 G-U 워블 염기 쌍을 형성할 수 있다. 이러한 치환 잔기를 함유하는 서열은 본원에 기재된 조성물 및 방법에 적합하다.
본원에 사용된 바와 같이, 달리 지시되지 않는 한, 제2 뉴클레오티드 서열과 연관하여 제1 뉴클레오티드 서열을 기술하기 위해 사용될 때 용어 "상보성"은, 당업자에 의해 이해되는 바와 같이, 혼성화하고, 특정 조건하에 제2 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드와 이중 구조를 형성하는 제1 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드의 능력을 의미한다. 이러한 조건은, 예를 들면, 엄격한 조건일 수 있고, 여기서 엄격한 조건은 400mM NaCl, 40mM PIPES pH 6.4, 1mM EDTA, 50℃ 또는 70℃ 12 내지 16시간 동안에 이어, 세척을 포함할 수 있다. 유기체 내부에서 발생할 수 있는 생리적으로 연관된 조건과 같은 다른 조건을 적용할 수 있다. 당업자는 하이브리드화된 뉴클레오티드의 궁극적인 적용에 따라 두 서열의 상보성 시험에 가장 적합한 조건 세트를 결정할 수 있을 것이다.
상보성 서열은 하나 또는 두 뉴클레오티드 서열의 길이 또는 길이의 일부에 대해 제1 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드의 영역 대 제2 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드의 영역의 염기쌍을 포함한다. 이러한 서열은 본원에서 서로에 대해 "상보성"인 것으로 지칭될 수 있다. 그러나, 제1 서열이 본원에서 제2 서열에 대해 "실질적으로 상보성"인 것으로 언급되는 경우, 두 서열은 상보성일 수 있거나, 그들은 염기쌍이 있는 영역 내에 하나 이상이지만, 일반적으로 약 5개, 4개, 3개 또는 2개 이하의 불일치 염기쌍을 포함할 수 있다. 불일치된 염기쌍을 갖는 두 서열에 대해, 2개의 뉴클레오티드 서열이 염기쌍을 통해 서로 결합하는 한 "실질적으로 상보성"인 것으로 간주될 것이다.
본원에 사용된 "상보성" 서열은, 혼성화하는 능력과 연관하여 상기 구현예가 충족되는 한, 비-왓슨-크릭 염기쌍 및/또는 비천연 및 변형된 뉴클레오티드로부터 형성된 염기쌍을 포함할 수도 있고, 또는 이로부터 완전히 형성될 수 있다. 이러한 비-왓슨-크릭 염기쌍은 G:U 워블 또는 호그슈타인(Hoogstein) 염기쌍을 포함하지만, 이에 제한되지 않는다.
2개 이상의 핵산 또는 폴리펩티드 서열의 문맥에서, 용어 퍼센트 "동일성"은 이하 기재된 서열 비교 알고리즘(예: BLASTP 및 BLASTN 또는 당업자에게 이용가능한 다른 알고리즘) 중 하나를 사용하거나 육안 검사에 의해 측정된 바와 같이, 최대 일치에 대해 비교하여 정렬될 경우, 동일한 뉴클레오티드 또는 아미노산 잔기의 특정 백분율을 갖는 두 개 이상의 서열 또는 부분서열을 의미한다. 적용에 따라, 퍼센트 "동일성"은 비교되는 서열의 영역, 예를 들면, 작용성 영역에 존재할 수 있거나, 대안적으로 비교되는 두 서열의 전장에 존재할 수 있다.
서열 비교를 위해, 전형적으로 하나의 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 필요할 경우, 부분서열 좌표가 지정되고, 서열 알고리즘 프로그램 파라미터가 지정된다. 이어서, 서열 비교 알고리즘은, 지정된 프로그램 파라미터에 기초하여, 기준 서열에 대한 시험 서열(들)의 퍼센트 서열 동일성을 계산한다.
비교를 위한 서열의 최적 정렬은, 예를 들면, 문헌(참조: Smith & Waterman, Adv. Appl. Math. 2:482 (1981))의 국부 상동성 알고리즘, 문헌(참조: Needleman & Wunsch, J. Mol. Biol. 48:443 (1970))의 상동성 정렬 알고리즘, 문헌(참조: Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988))의 유사성 방법의 검색, 이러한 알고리즘의 컴퓨터화 구현(GAP, BESTFIT, FASTA, 및 TFASTA, Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.), 또는 육안 검사(참조: 일반적으로, Ausubel et al., 이하)에 의해 수행될 수 있다.
퍼센트 서열 동일성 및 서열 유사성을 결정하기에 적합한 알고리즘의 일례는 문헌(참조: Altschul et al., J. Mol. Biol. 215:403-410 (1990))에 기재된 BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명 공학 정보 센터(National Center for Biotechnology Information) 웹-사이트를 통해 공개적으로 이용가능하다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 민감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열에 대한)은 디폴트로서 단어 길이(W) 11, 기대치(E) 또는 10, M=5, N=-4 및 두 가닥의 비교를 사용한다.
동일한 서열은 하나 또는 두 개의 뉴클레오티드 서열의 전체 길이에 걸쳐 제2 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드에 대한 제1 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드의 100% 동일성을 포함한다. 이러한 서열은 본원에서 서로에 대해 "완전히 동일하다"라고 지칭될 수 있다. 그러나, 일부 국면에서, 제1 서열이 본원에서 제2 서열에 대해 "실질적으로 동일하다"라고 지칭되는 경우, 두 서열은 완전히 상보성일 수 있거나, 그들은 정렬시 하나 이상이지만, 일반적으로 약 5개, 4개, 3개 또는 2개 이하의 불일치 뉴클레오티드를 가질 수 있다. 일부 국면에서, 제1 서열이 본원에서 제2 서열에 대해 "실질적으로 동일하다"라고 지칭되는 경우, 두 서열은 완전히 상보성일 수 있거나, 그들은 서로 적어도 약 50, 60, 70, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일할 수 있다. 본원에 기재된 두 개의 뉴클레오티드 서열의 퍼센트 동일성을 결정하기 위해, 상기한 BLASTN의 디폴트 세팅이 사용될 수 있다.
제1 서열이 본원에서 제2 서열의 동일성에 대해 "별개의"로 지칭되느 경우, 두 서열은 정렬시 적어도 하나 이상의 불일치 뉴클레오티드를 갖는다. 일부 국면에서, 별개의 서열은 정렬시 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 이상의 불일치 뉴클레오티드를 가질 수 있다. 일부 국면에서, 별개의 서열은 서로 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 또는 100% 미만 동일할 수 있다. 일부 국면에서, 제1 서열이 본원에서 제2 서열에 대해 "별개"로서 지칭되는 경우, 두 서열은 실질적으로 또는 완전히 동일한 서열을 가질 수 있지만, 대신에 서열 내에서 상이한 변형 패턴에 기초하여 서로 상이하다. 이러한 변형은 일반적으로 당해 기술 분야에 공지되어 있고, 예를 들면, 메틸화이다.
일부 국면에서, 폴리뉴클레오티드는 폴리뉴클레오티드의 라이브러리에 존재할 수 있다. 일부 국면에서, 폴리뉴클레오티드 라이브러리는 복수의 폴리뉴클레오티드를 포함할 수 있다. 일부 국면에서, 복수의 폴리뉴클레오티드 중 각 폴리뉴클레오티드는 단일 샘플로부터 유도될 수 있다. 일부 국면에서, 단일 샘플은 단일 세포이다.
통상적인 표기법이 뉴클레오티드 서열을 기재하기 위해 본원에 사용된다: 일본쇄 뉴클레오티드 서열의 좌측 말단은 5'-말단이고; 이본쇄 뉴클레오티드 서열의 좌측 방향은 5'-방향으로서 지칭된다. 초기 RNA 전사체에 뉴클레오티드의 5' 내지 3' 첨가 방향은 전사 방향으로서 지칭된다. mRNA와 동일한 서열을 갖는 DNA 가닥은 "코딩 가닥"으로 지칭된다.
용어 "메신저 RNA" 또는 "mRNA"는 인트론이 없고, 폴리펩티드로 번역될 수 있는 RNA를 의미한다.
용어 "cDNA"는 일본쇄 또는 이본쇄 형태로 mRNA와 상보성이거나 동일한 DNA이다.
용어 "앰플리콘"은 핵산 증폭 반응의 증폭 생산물, 예를 들면, RT-PCR를 의미한다.
용어 "하이브리드화하다"는 상보성 핵산과 서열 특이적 비공유결합 상호작용을 의미한다. 하이브리드화는 핵산 서열의 전부 또는 일부에서 발생할 수 있다. 당업자는 핵산 듀플렉스 또는 하이브리드의 안정성이 Tm에 의해 결정될 수 있음을 인식할 것이다. 하이브리드화 조건에 대한 추가의 지침은 문헌(참조: Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 1989, 6.3.1-6.3.6 및 Sambrook et al., Molecular Cloning, a Laboratory Manual, Cold Spring Harbor Laboratory Press, 1989, Vol. 3)에서 찾을 수 있다.
본원에 사용된 용어 "영역"은 폴리뉴클레오티드의 뉴클레오티드 서열의 연속 부분을 의미한다. 본원에 기재된 영역의 예는 동정 영역, 샘플 동정 영역, 바코드 영역, 결합 영역, cDNA 영역 등을 포함한다. 일부 국면에서, 폴리뉴클레오티드는 하나 이상의 영역을 포함할 수 있다. 일부 국면에서, 폴리뉴클레오티드는 2개 미만, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 이상의 영역을 포함할 수 있다. 일부 국면에서, 영역은 커플링될 수 있다. 일부 국면에서, 영역은 작동적으로 커플링될 수 있다. 일부 국면에서, 영역은 물리적으로 커플링될 수 있다.
본원에 사용된 "바코드" 또는 "바코드 서열"은, 예를 들면, 적어도 하나의 뉴클레오티드 서열의 이후 동정을 위해 적어도 하나의 뉴클레오티드 서열에 커플링될 수 있는 임의의 고유한 서열 표지를 의미한다.
본원에 사용된 "바코드 세트" 또는 "바코드의 세트"는 샘플로부터 뉴클레오티드 서열에 커플링될 수 있는 서열의 임의의 고유한 세트를 의미하고, 여기서 뉴클레오티드 서열은, 예를 들면, 뉴클레오티드 서열의 이후 동정을 위해 세트 중 하나의 바코드 서열에 커플링된다.
용어 "바코드 작제물", "바코드화 작제물" 및 "바코드 작제물 분자"는 고유한 바코드 서열을 포함하는 올리고뉴클레오티드를 의미하기 위해 본원에서 상호교환적으로 사용된다.
용어 "3' 핵산 작제물" 또는 "3' 핵산 바코드 작제물"은 3' 내지 "5' 핵산 바코드 작제물"인 바코드 서열을 포함하는 올리고뉴클레오티드를 의미한다. 3' 핵산 작제물은 핵산 분자, 예를 들면, mRNA의 3' 말단에 혼입될 수 있다. 용어 "3' 바코드" 또는 "3' 바코드 서열"은 3' 핵산 작제물 또는 3' 핵산 바코드 작제물 상에 위치된 바코드를 의미한다. 전형적으로, 3' 핵산 작제물은 핵산 분자의 3' 말단에서의 서열에 상보성인 서열을 함유하고, 예를 들면, 3' 핵산 작제물은 mRNA의 폴리-A 서열에 상보성인 폴리-T 서열을 포함한다. 전형적으로, 3' 작제물은 mRNA 서열의 3' 말단에 결합하고, 역전사되어 이의 5' 말단에서 3' 핵산 작제물을 포함하는 cDNA 분자를 생성한다. 예를 들면, 도 2 및 3 참조. 그것은 또한 5' 말단, 3' 말단 또는 내부적으로 핵산에 혼입될 수 있다(여기서, 그것은 핵산의 3' 말단 및 다른 핵산의 5' 말단에 혼입되어 하나의 더 긴 핵산을 형성한다). 예를 들면, 도 12 참조. 3' 핵산 바코드 작제물은 바코드 서열 이외에, 보편적 프라이밍 서열 또는 보편적 프라이밍 영역, 및 결합 부위를 포함할 수 있다.
용어 "5' 핵산 작제물" 또는 "5 핵산 바코드 작제물"은 5' 내지 "3' 핵산 바코드 작제물"인 바코드 서열을 포함하는 올리고뉴클레오티드를 의미한다. 5' 핵산 작제물은 핵산 분자, 예를 들면, mRNA의 5' 말단 또는 cDNA의 3' 말단에 혼입될 수 있다. 용어 "5' 바코드" 또는 "5' 바코드 서열"은 5' 핵산 작제물 또는 5' 핵산 바코드 작제물 상에 위치된 바코드를 의미한다. 전형적으로, 5' 핵산 작제물은 핵산 분자의 3' 말단에서의 서열에 상보성인 서열을 함유하고, 예를 들면, 5' 핵산 작제물은 cDNA 서열의 3' 말단에 혼입된 폴리-C 서열에 상보성인 폴리-G 서열을 포함한다. 5' 핵산 작제물은 3' 핵산 작제물을 포함하는 cDNA 분자의 3' 말단에 혼입될 수 있다. 예를 들면, 도 2 및 3 참조. 그것은 또한 5' 말단, 3' 말단 또는 내부적으로 핵산에 혼입될 수 있다(여기서, 그것은 핵산의 3' 말단 및 다른 핵산의 5' 말단에 혼입되어 하나의 더 긴 핵산을 형성한다). 예를 들면, 도 12 참조. 5' 핵산 바코드 작제물은 바코드 서열 이외에, 보편적 프라이밍 서열 또는 보편적 프라이밍 영역, 및 결합 부위를 포함할 수 있다.
본원에 사용된 "바코드 작제물 비드"는 하나 이상의 바코드 작제물에 커플링된 비드를 의미한다.
본원에 사용된 "바코드화 혼합물"은 하나 이상의 바코드 작제물을 포함하는 조성물을 의미한다. 상기 혼합물은 세포 용해, 역전사, 제한 효소 소화 및/또는 바코드화 반응을 수행하기 위한 추가의 시약을 포함할 수 있다.
본원에 사용된 "바코드화" 또는 "바코드화 반응"은 비코드 서열 또는 바코드 서열의 상보체를 핵산과 연결하는 반응을 의미한다. 바코드 작제물은 핵산과 반드시 공유 결합될 필요는 없지만, 바코드 서열 정보 그 자체는 핵산과 연결되거나 핵산에 혼입된다. "바코드화 핵산", "바코드화 세포", "세포로부터의 핵산의 바코드화", "반응 용기로부터 핵산의 바코드화" 및 "바코드화 반응 용기"는 상호교환적으로 사용된다.
본원에 사용된 "동정 영역"은, 예를 들면, 적어도 하나의 뉴클레오티드 서열의 이후 동정을 위해 적어도 하나의 뉴클레오티드 서열에 커플링될 수 있는 뉴클레오티드 서열 표지(예: 고유한 바코드 서열)을 의미한다. 일부 국면에서, 바코드 세트는 샘플 동정 영역으로 사용된다.
본원에 사용된 "어댑터 영역" 또는 "어댑터 분자"는 제1 뉴클레오티드를 제2 뉴클레오티드 서열에 연결하는 링커를 의미한다. 일부 국면에서, 어댑터 영역은 링커로서 작용하는 뉴클레오티드 서열의 연속 부분을 포함할 수 있다.
용어 "샘플"은 대상체(예: 포유동물 대상체, 동물 대상체, 인간 대상체, 또는 비인간 동물 대상체)로부터 채취한 RNA, DNA, 단일 세포 또는 다중 세포 또는 세포의 단편 또는 체액의 분취량을 포함할 수 있다. 샘플은 원심분리, 정맥천자, 혈액 추출, 배설, 스와빙(swabbing), 사정, 마사지, 생검, 침상 흡인물, 세척 샘플, 스크래핑, 수술 절개, 레이저 포획 미세해부, 구배 분리, 또는 당해 기술 분야에서 공지된 개입 또는 다른 수단을 포함하여 현재 공지되거나 이후 발견된 임의의 수단을 사용하여 당업자에 의해 선택될 수 있다. 샘플은 또한 관심 있는 샘플과 연관되는 것으로 공지된 하나 이상의 마커를 사용하여 당업자에 의해 선택될 수 있다. 샘플은 또한 세포 분류 및 FACS와 같은 당해 기술 분야에 공지된 방법으로 사용하여 선택될 수 있다.
본 발명의 방법은 임의의 목적하는 샘플로 실시될 수 있다. 일부 구현예에서, 각 샘플은 세포를 포함하고, 예를 들면, 단일 세포일 수 있다. 세포는 미세 유체 액적과 같은 반응 용적에 동봉될 수 있고, 경우에 따라, 용해되어 RNA 분자를 반응 용적으로 방출시킬 수 있다. 이 목적을 위해, 세포는 임의의 편리한 시간에 용해 완충액과 접촉될 수 있다.
헥산 샘플의 기원을 동정하는 방법이 본원에 제공된다. 임의로, 상기 방법은 단일 세포 및 바코드의 세트로부터 핵산 분자를 포함하는 핵산 샘플을 포함하는 반응 혼합물을 형성하는 단계, 상기 바코드의 세트를 샘플의 핵산 분자에 혼입하는 단계, 및 단일 세포의 핵산 분자에 혼입된 상기 바코드의 세트를 동정함으로써 핵산 샘플의 기원을 동정하는 단계를 포함한다. 임의로, 반응 혼합물을 형성하는 단계는 단일 세포를 바코드의 세트와 접촉시키는 단계 및 세포를 용해시켜 단일 세포로부터 핵산 샘플을 제공하는 단계를 포함한다. 임의로, 반응 혼합물을 형성하는 단계는 현탁 완충액에 세포를 제공하는 단계 및 세포를 함유하는 현탁 완충액을 단일 세포와 바코드의 세트를 포함하는 반응 혼합물을 형성하기 위한 조건하에 바코드의 세트를 포함하는 바코드화 완충액과 접촉시키는 단계를 포함한다. 임의로, 반응 혼합물은 액적이다.
본원에 제공된 바와 같이, 바코드의 세트는 적어도 2개의 고유한 바코드의 하나 이상의 카피를 포함한다. 따라서, 예를 들면, 바코드의 세트는 각각 고유한 5' 바코드를 포함하는 하나 이상의 5' 핵산 작제물 및 각각 고유한 3' 바코드를 포함하는 하나 이상의 3' 핵산 작제물을 포함할 수 있다. 임의로, 바코드의 세트는 각 작제물이 고유한 3' 바코드를 포함하는 적어도 2개의 3' 핵산 작제물을 포함한다. 임의로, 바코드의 세트는 1, 2, 3, 4, 5, 6, 7 또는 8개의 5' 핵산 작제물 및 1, 2, 3, 4, 5, 6, 7 또는 8개의 3' 핵산 작제물을 포함한다. 1, 2, 3, 4, 5, 6, 7 또는 8개 유형의 핵산 작제물 각각은 고유한 바코드 서열을 갖고 복수의 카피로 제공될 수 있다. 임의로, 바코드의 세트는 2개의 상이한 5' 바코드를 포함하는 2개의 상이한 5' 핵산 작제물 및 2개의 상이한 3' 바코드를 포함하는 2개의 상이한 3' 핵산 작제물을 포함한다. 임의로, 바코드의 세트는 3개의 상이한 5' 바코드를 포함하는 3개의 상이한 5' 핵산 작제물 및 3개의 상이한 3' 바코드를 포함하는 3개의 상이한 3' 핵산 작제물을 포함한다. 임의로, 바코드의 세트는 2개의 상이한 3' 바코드를 포함하는 2개의 상이한 3' 핵산 작제물 및 3개의 상이한 5' 바코드를 포함하는 3개의 상이한 5' 핵산 작제물을 포함한다. 각 유형의 핵산 작제물의 복수의 카피는 동일한 바코드를 갖는 동일한 유형의 복수의 카피 각각에 제공될 수 있다. 따라서, 예를 들면, 바코드의 세트는 각각의 상이한 유형이 고유한 5' 또는 3' 바코드 서열을 갖는 1, 2, 3, 4, 5, 6, 7 또는 8개의 상이한 유형의 5' 핵산 또는 3' 핵산 작제물의 복수의 카피를 포함할 수 있다. 달리 말하면, 바코드의 세트는 제1, 제2, 제3, 제4, 제5, 제6, 제7 또는 제8 유형의 5' 핵산 작제물 중 하나 이상의 하나 이상의 카피 및 제1, 제2, 제3, 제4, 제5, 제6, 제7 또는 제8 유형의 3' 핵산 작제물 중 하나 이상의 하나 이상의 카피를 포함할 수 있다. 임의로, 바코드의 세트는 제1, 제2, 제3, 제4, 제5, 제6, 제7 또는 제8 유형의 3' 핵산 작제물 중 하나 이상의 하나 이상의 카피를 포함한다. 작제물은 RNA 또는 DNA 분자, 또는 RNA-DNA 하이브리드일 수 있다. 예를 들면, 작제물은 통상적인 올리고뉴클레오티드 가닥에서 DNA 뉴클레오티드에 공유결합된 RNA 뉴클레오티드를 포함할 수 있다. 작제물은 또한 일본쇄 또는 이본쇄일 수 있다. 이본쇄일 경우, 작제물은 하나 이상의 무딘 말단 또는 일본쇄 돌출부를 갖는 말단을 가질 수 있다.
3' 핵산 작제물을 사용하여 핵산 샘플의 기원을 동정하는 방법이 또한 본원에 제공된다. 상기 방법은 각 작제물이 고유한 3' 바코드 서열, 결합 서열 및 바코드 연관 서열을 포함하는 3' 핵산 작제물의 세트를 제공하는 단계, 단일 세포로부터 핵산 분자를 포함하는 핵산 샘플을 제공하는 단계, 핵산 샘플을 3' 핵산 작제물의 세트와 접촉시키는 단계, 바코드 연관 서열로부터 결합 서열 및 3' 바코드 서열을 분리하는 단계, 3' 핵산 작제물로부터 3' 바코드 서열을 핵산 분자에 혼입하는 단계, 및 3' 바코드 서열의 세트를 바코드 연관 서열을 사용하여 동정함으로써 단일 세포로부터 핵산 샘플의 기원을 동정하는 단계를 포함한다. 임의로, 3' 핵산 작제물의 세트는 2, 3, 4, 5, 6, 7 또는 8개의 3' 핵산 작제물을 포함한다. 임의로, 3' 핵산 작제물의 복수의 카피는 고체 표면, 예를 들면, 비드, 마이크로비드, 미세입자, 미소구, 나노비드 또는 하이드로겔에 부착된다. 임의로, 각 비드는 동일한 핵산 작제물을 포함하고, 복수의 비드는 바코드의 세트로 제공될 수 있다. 따라서, 임의로, 각 고체 표면, 예를 들면, 비드는 동일한 형태의 3' 핵산 작제물의 복수의 카피를 함유한다. 따라서, 예를 들면, 바코드의 세트는 고유한 3' 바코드를 포함하는 제1의 3' 핵산 작제물의 복수의 카피를 포함하는 제1 표면 및 제1 작제물 상의 바코드와 상이한 고유한 3' 바코드를 포함하는 제2의 3' 핵산 작제물의 복수의 카피를 포함하는 제2 표면을 포함할 수 있다.
임의로, 반응 혼합물을 형성하는 단계는 현탁 완충액에 세포를 제공하는 단계, 및 현탁 완충액을 단일 세포를 포함하는 반응 혼합물을 형성하기 위한 조건하에 5' 및/또는 3' 핵산 작제물을 포함하는 바코드화 완충액과 접촉시키는 단계를 포함한다. 반응 혼합물은 각 작제물이 고유한 바코드 및 단일 세포를 갖는 적어도 2개의 작제물을 포함한다. 임의로, 반응 혼합물은 적어도 하나의 5' 핵산 작제물 및 적어도 하나의 3' 핵산 작제물을 포함한다. 임의로, 반응 혼합물은 적어도 2개의 3' 핵산 작제물을 포함한다. 임의로, 반응 혼합물을 형성하는 단계는 현탁 완충액에 세포를 제공하는 단계, 및 현탁 완충액을 단일 세포 및 적어도 하나의 5' 핵산 작제물 및 적어도 하나의 3' 핵산 작제물을 포함하는 반응 혼합물을 형성하기 위한 조건하에 5' 핵산 작제물을 포함하는 제1 바코드화 완충액 및 3' 핵산 작제물을 포함하는 제2 바코드화 완충액과 접촉시키는 단계를 포함한다. 임의로, 반응 혼합물은 단일 세포로부터의 핵산 샘플, 5' 핵산 작제물의 복수의 카피를 포함하는 적어도 하나의 비드 및 3' 핵산 작제물의 복수의 카피를 포함하는 적어도 하나의 비드를 포함한다.
세포는 용해 전에 삼투보호제를 포함하는 세포 현탁 완충액에 유리하게 현탁될 수 있다. 삼투보호제는 삼투압 응력으로부터 세포를 보호할 수 있고, 세포 생리학이 바코드화 전에 안정하거나 흔들리지 않게 잔류된다는 것을 보장할 수 있다. 일부 구현예에서, 세포는 바코드 작제물과 함께 세포 현탁 완충액에 현탁된다. 일부 구현예에서, 세포는 역전사, PCR 및/또는 용해를 위한 시작과 접촉되기 전에 세포 현탁 완충액에 현탁된다. 세포 현탁 완충액은 임의의 반응 용적에 포함될 수 있고, 수성 반응 용적을 형성하고 배합하기 위해 본원에 기재된 방법과 양립 가능하다.
세포는 역전사, PCR 및/또는 용해를 위한 시작과 접촉되기 전에 세포 현탁 완충액에 현탁된다. 세포 현탁 완충액은 임의의 반응 용적에 포함될 수 있고, 수성 반응 용적을 형성하고 배합하기 위해 본원에 기재된 방법과 양립 가능하다.
임의로, 각각의 5' 핵산 작제물은 고체 표면에 부착된 복수의 카피로 제공된다. 임의로, 각각의 3' 핵산 작제물은 고체 표면에 부착된 복수의 카피로 제공된다. 본 발명의 방법 및 조성물에 사용될 수 있는 고체 표면을 갖는 고체 지지체의 예는 비드, 크로마토그래피 수지, 다중-웰 플레이트, 미세원심분리관 또는 고체 표면을 갖는 임의의 다른 대상물을 포함한다. 임의로, 고체 표면은 비드, 마이크로비드, 미세입자, 미소구, 나노입자, 나노비드 또는 하이드로겔이다. 따라서, 바코드 작제물은 임의의 목적하는 메카니즘 또는 포획 화학, 예를 들면, 비오틴-아비틴, 비오틴-스트렙타비딘, 또는 금-티올 상호작용을 사용하여 고체 지지체에 결합될 수 있다. 임의로, 바코드 작제물이 부착되는 임의의 고체 표면은 수용액과 접촉되고, 바코드 작제물은 이 용액으로 방출된다. 수용액은, 예를 들면, 바코드 작제물이 첨가되는 단일 세포로부터의 샘플과 연관된 RNA 분자와 동일한 반응 용적에 존재할 수 있다. 대안적으로, 바코드 작제물을 위한 고체 표면과 접촉하는 수용액은 표적 RNA 또는 세포와 상이한 반응 용적에 유지시킬 수 있고, 바코드 작제물은 두 반응 용적의 배합시 이러한 RNA 또는 세포에 첨가되어 바코드의 세트 및 단일 세포 또는 단일 세포로부터의 RNA 샘플을 포함하는 반응 혼합물을 생성할 수 있다.
폴리뉴클레오티드를 고체 지지체에 부착시키는 방법이 제공되고, 여기서 상기 폴리뉴클레오티드는 바코드 서열을 함유한다. 폴리뉴클레오티드는 바코드 작제물일 수 있다. 임의로, 상기 방법은 역 에멀젼의 친수성 구획(즉, 수성 액적)을 생성하는 단계를 포함한다. 구획은, 예를 들면, 수성 담체 유체 중의 수용액을 혼합하고, 임의로 혼합물을 진탕시킴으로써 목적한 바와 같이 생성될 수 있다. 수용액은, 각 구획이 구획이 형성될 때 폴리뉴클레오티드를 고체 지지체에 부착시키기 위한 모든 필요한 성분을 함유하도록 고체 지지체, 올리고뉴클레오티드, 및 내부에 현탁된 시약을 가질 수 있다. 이러한 구현예에서, 고체 지지체를 구획에 첨가하기 전에, 올리고뉴클레오티드는 포획 잔기를 통해 고체 지지체의 표면에 결합된다. 이 올리고뉴클레오티드는 본원에서 "결합된 올리고뉴클레오티드"로서 지칭되고, 바코드 올리고뉴클레오티드의 3' 서열에 상보성인 3' 서열을 함유한다. 따라서, 폴리뉴클레오티드는 결합된 올리고뉴클레오티드 및 바코드 올리고뉴클레오티드를 포함하는 폴리머라제 연장 반응을 통해 고체 지지체 사이에서 형성되고, 이 반응은 구획 내에서 일어난다.
임의로, 친수성 구획이 형성될 경우, 바코드 올리고뉴클레오티드는 낮거나 제한되는 농도(예: 구획당 하나의 분자)로 존재한다. 이러한 농도는 무작위화 서열을 갖는 바코드 올리고뉴클레오티드의 라이브러리를 사용하여 복수의 바코드 작제물 비드를 제조하는 경우에 편리하다. 모든 바코드 올리고뉴클레오티드가 상이한 바코드 서열을 갖는 것으로 가정되고, 각 구획 중 고체 지지체가 하나의 바코드 서열만을 갖도록 목적시되면, 하나의 바코드 올리고뉴클레오티드(최대 또는 평균)가 구획당 존재할 수 있다. 이 조건이 충족되면, 다수의 고체 지지체(예: 복수의 비드)가 구획에 존재할 수 있거나, 결합된 올리고뉴크렐오티드의 다수의 카피가 각 고체 지지체에 결합될 수 있지만, 폴리머라제 연장 반응으로부터 생성된 모든 폴리뉴클레오티드는 동일한 바코드 서열을 함유할 것이다.
본 발명의 방법에 사용하기 위한 고체 지지체는 비드, 예를 들면, 금속 및/또는 중합성 재료로 제조되고, 직경이 약 0.1 내지 10㎛ 범위 내인 구형 비드를 포함한다. 다른 특성을 갖는 비드가 대신에 또는 추가로 사용될 수 있다. 고체 지지체는 포획 잔기로 작용화되어 결합된 올리고뉴클레오티드를 고체에 부착시킬 수 있다. 포획 잔기의 예는 아비딘, 스트렙타비딘, 비오틴, 카복실 그룹, 에폭시 그룹, 하이드록실 그룹, 티올 그룹 및 금을 포함한다. 일부 포획 잔기는 그들이 특이적으로, 그리고 비공유적으로 결합하는 결합 파트너를 갖는다. 예를 들면, 스트렙타비딘은 이의 결합 파트너로서 비오틴을 취한다. 이러한 포획 잔기는 고체 지지체에 직접(예: 공유적으로) 커플링될 수 있고, 결합된 올리고뉴클레오티드는 비공유 상호작용을 통해 고체 지지체에 결합되도록 결합 파트너는 결합된 올리고뉴클레오티드에 결합될 수 있거나, 그 반대일 수 있다. 다른 포획 잔기는 결합된 올리고뉴클레오티드와 고체 지지체 사이에 직접적인 공유 결합을 제공한다.
결합된 올리고뉴클레오티드는 바람직하게는 이의 5' 말단에서 고체 지지체에 결합된 일본쇄 DNA 분자이다. 따라서, 결합된 올리고뉴클레오티드의 3' 말단은 용액에서 자유롭고, 바코드 올리고뉴클레오티드로 하이브리화될 때 DNA 폴리머라제와 같은 효소에 의해 연장될 수 있다. 연장 반응은 바코드 서열이 비드에 결합된 DNA 가닥으로 혼입되도록 바코드 올리고뉴클레오티드를 사용하여 주형화된다. 목적하는 경우, 결합된 올리고뉴클레오티드 및/또는 바코드 올리고뉴클레오티드는 분자내 2차 구조를 최소화하도록 설계된 서열을 가질 수 있다.
폴리뉴클레오티드를 고체 지지체에 부착시키기 위한 본원에 기재된 임의의 방법을 사용하여 바코드화 샘플, 세포 또는 RNA에 사용하기 위한 하나 이상의 고체 지지체를 제조할 수 있다. 각 고체 지지체에 부착된 폴리뉴클레오티드(들)은 바코드 서열을 포함하고, 바코드 작제물로서 작용할 수 있다. 본 방법은 또한 각각 바코드 서열과 연관된 복수의 고체 지지체를 포함하는 바코드 라이브러리를 제조하기 위해 사용될 수도 있다. 임의의 두 개의 고체 지지체(예: 비드)는 전체적으로 또는 부분적으로 서로 상이한 바코드 서열을 가질 수 있다. 임의로, 바코드 라이브러리에서 모든 고체 지지체는 상이한 바코드 서열과 연관된다.
본 방법에 따라 제조된 바코드 작제물 비드는 바코드 작제물에 결합된 비드를 포함한다. 비드는 바코드 작제물의 복수의 카피, 예를 들면, 적어도 10, 30, 100, 300, 1,000, 3,000, 10,000, 30,000, 100,000, 300,000 또는 1,000,000개의 카피에 결합될 수 있다. 임의로, 하나의 비드에 결합된 바코드 작제물의 각각의 카피는 동일한 바코드 서열을 포함한다. 본 방법은 또한 복수의 바코드 작제물 비드를 포함하는 비드화 바코드 라이브러리의 제조를 가능하게 한다. 라이브러리 중 모든 비드는 상이한 바코드 서열과 연관될 수 있고, 각 비드 상의 바코드 작제물의 카피는 동일한 바코드 서열을 포함할 수 있다.
임의로, 본 방법은 바코드 작제물 비드 상의 하나 이상의 샘플(예: 세포)로부터 제조되거나 수득된 cDNA를 물리적으로 포획함으로써 폴리뉴클레오티드 라이브러리를 제조하는데 사용될 수 있다. 각 비드는 3' 말단에 cDNA 결합 부위를 갖는 바코드 작제물을 포함한다. 비드는 효소와 접촉하여 결합 부위가 일본쇄이도록 할 수 있다(예를 들면, 주형 분자의 말단예서 3' 돌출부를 용액에 자유롭게 남긴다). 이어서, 비드를 샘플로부터 하나 이상의 cDNA와 접촉시켜 cDNA가 결합 부위를 통해 주형 분자의 카피에 결합하도록 한다. 바람직한 구현예에서, 결합 부위는 하나 이상의 G 뉴클레오티드, 예를 들면, 폴리-G 관을 포함하고, 역전사효소에 의해 cDNA의 말단에 첨가된 비주형화 폴리-C 관에 상보적이다.
폴리뉴클레오티드 라이브러리의 비드는 목적하는 대로, 예를 들면, 복수의 샘플로부터 cDNA를 서열분석하거나 상이한 샘플로부터 cDNA를 분리하기 위해 사용될 수 있다. 후자의 경우, 상이한 샘플에 상응하는 비드는 원심분리 또는 자기를 사용하여 펠렛화한 다음, 표준 방법을 사용하여 재현탁시키고 분리시킬 수 있다. 목적하는 경우, 비드 상의 주형 분자에 cDNA의 결합 후, 주형 분자는 효소적으로 연장시킴으로써 cDNA 서열을 비드를 결합시킨 DNA 듀플렉스로 혼입하고, 이러한 서열을 바코드 서열과 결합시킬 수 있다. 샘플로부터 cDNA 분자의 카피의 수가 비드 상의 바코드 작제물의 카피의 수에 필적할 만한 경우, 이러한 cDNA 분자는 소수의 비드 상(예를 들면, 샘플당 최대 약 1, 3, 10, 30, 100, 300 또는 1000개의 비드)에서 포획될 수 있다. 샘플로부터 RNA는 표준 방법을 사용하거나 상기 논의된 바와 같이 역전사되어 cDNA를 생성할 수 있다.
핵산 샘플의 핵산에 바코드를 포함하는 작제물을 혼입시킬 수 있도록 고체 표면에 결합될 때 5' 및 3' 핵산 작제물을 방출시키는 다양한 방법이 사용될 수 있다. 예를 들면, 각각의 5' 및 3' 핵산 작제물은 광절단가능한 링커 또는 제한 효소 부위를 포함할 수 있다. 임의로, 각각의 5' 핵산 작제물은 광절단가능한 링커를 추가로 포함하고, 각각의 3' 핵산 작제물은 제한 효소 부위를 추가로 포함한다. 임의로, 각각의 5' 핵산 작제물은 제한 효소 부위를 추가로 포함하고, 각각의 3' 핵산 작제물은 광절단가능한 링커를 추가로 포함한다. 임의로, 상기 방법은 반응 혼합물을 제한 효소와 접촉시키는 단계 및 반응 혼합물을 자외선에 노출시켜 고체 표면으로부터 5' 및 3' 핵산 작제물을 방출시키는 단계를 추가로 포함한다. 임의로, 5' 및 3' 핵산 작제물은 제한 효소 부위를 추가로 포함하고, 상기 방법은 반응 혼합물을 제한 효소와 접촉시켜 고체 표면으로부터 5' 및 3' 핵산 작제물을 방출시키는 단계를 추가로 포함한다. 임의로, 5' 및 3' 핵산 작제물은 광절단가능한 링커를 추가로 포함하고, 상기 방법은 반응 혼합물을 자외선에 노출시켜 고체 표면으로부터 5' 및 3' 핵산 작제물을 방출시키는 단계를 추가로 포함한다.
상기 주시된 바와 같이, 임의로, 3' 핵산 작제물은 고유한 3' 바코드 서열, 결합 서열 및 바코드 연관 서열을 포함한다. 임의로, 3' 핵산 작제물은 헤어핀을 형성할 수 있다. 임의로, 3' 바코드 서열 및 결합 서열은 제한 효소 서열 또는 광절단가능한 링커에 의해 바코드 결합 세그먼트로부터 분리된다. 임의로, 제한 효소는 고체 표면으로부터 3' 바코드 서열을 방출하고, 결합 서열을 바코드 결합 세그먼트로부터 분리한다. 임의로, 자외선은 고체로부터 3' 바코드 서열을 방출시키고, 바코드 결합 세그먼트로부터 결합 서열을 분리한다. 임의로, 3' 핵산 작제물 상의 결합 서열은 폴리-T 서열을 포함한다. 임의로, 3' 핵산 작제물의 결합 서열은 샘플의 핵산 분자 상의 폴리-A 서열에 결합한다. 임의로, 3' 핵산 작제물 상의 바코드 서열은 역전사에 의해 혼입된다. 임의로, 역전사는 3' 바코드 서열을 포함하는 핵산 분자를 생성한다. 임의로, 바코드 결합 세그먼트는 프라이밍 서열을 포함한다. 임의로, 프라이밍 서열은 회문성 서열이다. 임의로, 하나의 바코드 결합 세그먼트의 프라이밍 서열은 핵산 샘플 중의 임의의 다른 바코드 결합 세그먼트의 프라이밍 서열을 결합시킬 수 있다. 임의로, 서로 접촉되는 바코드 결합 세그먼트는 DNA 폴리머라제에 의해 연장되어 두 바코드 결합 세그먼트를 단일 핵산으로 혼입한다.
제한 효소 및 제한 효소 부위는 공지되어 있고, 효소는 시판된다. 제한 효소 소화는 핵산 분자의 특정 위치에서만 기능하는 효소에 의한 핵산 분자의 촉매적 절단을 의미한다. 이러한 효소의 용도는 당업자에 의해 이해된다. 따라서, 5' 및 3' 핵산 작제물은 적합한 효소(예: 제한 엔도뉴클레아제)에 노출시 작제물의 절단을 촉진시키는 엔도뉴클레아제 제한 효소를 함유할 수 있다. 임의로, 제한 효소는 Nb.BsrDI, Nb.BtsI, Nt.BbvCI, Nt.BspQI, Nt.BsmAI, Nt.BstNBI, Nt.AlwI 및 Nt.BsmAI로 이루어진 그룹으로부터 선택된다. 임의로, 고체 표면에 부착된 5' 또는 3' 핵산은 이본쇄이고, 작제물 중 한 가닥만이 고체 표면으로부터 방출된다. 따라서, 임의로, 5' 및/또는 3' 핵산 작제물은 닉킹 엔도뉴클레아제 제한 부위를 포함할 수 있고, 가닥은 하나 이상의 닉킹 엔도뉴클레아제 효소를 사용하여 방출될 수 있다. 닉킹 엔도뉴클레아제 제한 부위는 Nb.BsrDI, Nb.BtsI, Nt.BbvCI, Nt.BspQI, Nt.BsmAI, Nt.BstNBI, Nt.AlwI 및 Nt.BsmAI로 이루어진 그룹으로부터 선택된 효소에 부위 특이적일 수 있다. 임의로, 가닥 변위 DNA 폴리머라제는 제한 효소와 함께 포함될 수 있다. 가닥 변위 폴리머라제는 닉킹 엔도뉴클레아제 효소 이전에, 동시에 또는 이후에 첨가될 수 있다. 가닥 변위 DNA 폴리머라제는 Klenow exo-, Bst Large Fragment 및 Bst Large Fragment의 조작된 변이체로 이루어진 그룹으로부터 선택될 수 있다.
광절단가능한 링커 및 이들의 사용 방법도 또한 공지되어 있다. 본원에 사용된 용어 "광절단가능한 링커"는 두 개의 분자, 예를 들면, 두 개의 핵산 또는 핵산과 고체 표면을 부착시키거나 작동가능하게 연결하는 임의의 화학적 그룹을 의미한다. 임의로, 링커는 2-니트로벤질 잔기를 포함한다. 전문이 본원에 참조로 인용되어 있는 미국 특허 제5,643,722호 참조. 광절단가능한 링커는 또한 알파-치환된 2-니트로벤조일 잔기[예: 1-(2-니트로페닐)에틸 잔기], 3,5-디메톡시벤질 잔기, 티오하이드록삼산, 7-니트로인돌린 잔기, 9-페닐크산틸 잔기, 벤조인 잔기, 하이드록시펜아실 잔기 및 NHS-ASA 잔기를 포함하지만, 이에 제한되지 않는다. 링커는 기질로부터 핵산 분자를 수확하기 위해 적절한 파장의 광, 예를 들면, 자외선에 노출시킴으로써 절단될 수 있다(참조: J. Olejnik and K. Rothschild, Methods Enzymol 291:135-154, 1998).
임의로, 제공된 작제물은 고유한 분자 동정자(UMI) 서열을 포함할 수 있다. 임의로, UMI 서열은 무작위화 뉴클레오티드를 함유하고, 바코드 서열과 독립적으로 바코드 작제물로 혼입된다. 따라서, 동일한 바코드 서열을 함유하는 바코드 작제물의 세트는 상이한 UMI 서열을 함유할 수 있다. 동일한 바코드 서열, 상이한 UMI 서열을 함유하는 바코드 작제물의 세트를 하나의 샘플과 연관된 RNA에 첨가되는 경우, 모든 RNA 서열은 바코드화 동안 상이한 UMI 서열에 연결될 수 있다. UMI 서열을 갖는 바코드 작제물 비드는 각 비드 상의 작제물이 동일한 바코드 서열 및 상이한 UMI 서열의 라이브러리를 함유하는 곳에서 생성될 수 있다.
바코드 작제물은, 바코드 서열 이외에, 보편적 프라이밍 서열 또는 보편적 프라이밍 영역, 및 결합 부위를 포함할 수 있다. 따라서, 임의로, 3' 핵산 작제물 및 5' 핵산 작제물은 전형적으로 결합 서열을 포함한다. 임의로, 5' 및 3' 핵산 작제물은 프라이머 결합 부위 또는 보편적 프라이밍 서열을 포함한다. 임의로, 3' 핵산 작제물은 폴리-T 서열을 포함하는 결합 서열을 갖는다. 폴리-T 서열은 샘플의 핵산 분자 상에서 폴리-A 서열에 결합한다. 핵산 분자에 3' 핵산 작제물의 결합시, 3' 핵산 작제물 상의 바코드는 이어서 역전사에 의해 혼입될 수 있다. 역전사는 3' 바코드 서열을 포함하는 핵산 분자를 생성한다. 따라서, 3' 핵산 작제물은 역전사용 프라이머로서 작용할 수 있다. 여기서, 작제물의 결합 부위는 RNA 결합 부위(예: mRNA 결합 부위)이고, 하나 이상의 RNA 중의 서열 영역에 상보성인 서열 영역을 함유한다. 임의로, 결합 부위는 바코드 작제물이 첨가되는 샘플의 모든 RNA에 공통인 서열 영역에 상보적이다. 예를 들면, 결합 부위는 진핵생물 mRNA의 폴리-A 꼬리에 상보성인 폴리-T 관일 수 있다(도 3). 대안적으로 또는 추가로, 결합 부위는 무작위 서열 관을 포함한다. 샘플과 연관된 RNA에 3' 작제물을 첨가시, 역전사가 일어날 수 있고, cDNA의 제1 가닥이 합성되어 3' 바코드 서열이 cDNA의 제1 가닥에 혼입될 수 있다. 역전사가 적합한 조건, 예를 들면, 적합한 완충액 및 역전사효소 효소의 존재, 및 바코드 작제물의 RNA로의 어닐링에 적합한 온도 및 효소의 활성을 필요로 한다는 것이 인식될 것이다. DNA 프라이머 및 RNA 주형을 포함하는 역전사가 프라이머의 3' 말단이 주형에 대해 상보성일 때 가장 효율적이고, 주형으로 직접 어닐링할 수 있음도 또한 인식될 것이다. 따라서, 3' 핵산 작제물은 결합 부위가 RNA의 3' 말단에서 발생하도록 설계될 수 있다.
상기 논의된 바와 같이, 임의로, 바코드, 결합 서열 및 바코드 연관 서열을 포함하는 3' 핵산 작제물 세트가 사용된다. 임의로, 3' 핵산 작제물은 프라이머 결합 부위 또는 보편적 프라이밍 서열을 포함한다. 각각의 작제물은 헤어핀 구조를 형성하는 일본쇄 DNA 올리고일 수 있다. 임의로, 작제물은 선형이다. 헤어핀의 이본쇄 세그먼트에서 헤어핀을 위한 작제물인 경우, 두 가닥의 제한을 지시하는 제한 부위가 혼입될 수 있다. 이는 바코드뿐만 아니라 "바코드 연관 서열"(BAS)을 함유할 수도 있는 별개의 루프화 세그먼트로부터 바코드 및 결합 영역을 절단하고 분리한다. 예를 들면, 도 8을 참조한다. 또한 비드로부터 절단되는 2개 이상의 세그먼트를 초래하는 다수의 제한 부위를 갖는 선형 올리고가 사용될 수 있다. 바코드 영역은 바코드, 폴리-T 세그먼트 및 임의로 UMI를 포함한다. 이 세그먼트는 액적 내에서 세포에 의해 방출된 mRNA 전사체의 폴리-A 꼬리에 어닐링하고, 그 mRNA 서열의 역전사를 프라이밍하여 바코드를 생성된 cDNA에 혼입시킨다. 예를 들면, 도 9 참조. 별도로, 루프화 세그먼트는 절단되는 바코드와 동일하거나 이에 상응하는 그 자체의 바코드를 포함한다. 다수의 비드가 세포와 함께 공동 캡슐화되면, 두 전사체 바코드화 세그먼트(BC1a & BC2a, 도 10)는 모두 RT 바코드화 반응용 프라이머로서 작용하고, 그 세포로부터의 전사체는 두 바코드를 혼입한다. 별도로, 각각의 바코드를 보유하는 2개의 상응하는 루프화 세그먼트(BC1b & BC2b, 도 10)도 또한 존재할 것이다. BAS 상의 결합 영역은 BC1b 및 BC2b 루프화 세그먼트가 교차 어닐링할 수 있게 하고, DNA 폴리머라제는 반응 혼합물에 포함되어 다른 바코드의 상보체를 혼입하기 위해 각 세그먼트를 연장시킬 수 있다(도 11). 이러한 방식으로, BAS'는 그 세포로부터 전사체를 단일화하기 위한 세트로서 바코드를 연관시키기 위해 이후에 하류 서열분석될 수 있는 단일 앰플리콘으로 물리적으로 연결된다. BAS 상의 결합 서열은 회문성 서열일 수 있거나, 각 BAS는 실시예에서 추가로 기재된 바와 같은 다른 BAS 상의 서열에 대해 상보성인 서열을 포함할 수 있다.
5' 및 3' 핵산 작제물을 사용할 때, 3' 핵산 작제물이 cDNA의 제1 가닥에 혼입되면, 임의로, 역전사효소 효소는 2 내지 5개의 시스테인 잔기를 샘플 중 핵산 분자의 말단에 첨가한다. 2 내지 5개의 시스테인 잔기는 5' 핵산 작제물 상의 결합 서열에 대해 상보성인 결합 서열을 제공한다. 임의로, 5' 핵산 작제물 상의 결합 서열은 폴리-G 서열을 포함한다. 이어서, 5' 핵산 작제물 상의 결합 서열은 샘플의 핵산 분자 상의 폴리-C 서열에 결합할 수 있다. 5' 핵산 작제물은 역전사효소 효소를 사용하여 핵산 샘플에 혼입된다. 예를 들면, 도 3 참조. 이 공정은 전문이 본원에 참조로 인용된 WO 2012/148497에 최소한 기재되어 있다. 간단하게, H-MMLV 역전사효소는 3' dC 꼬리화 활성을 갖고, 비주형화 dC를 제1 가닥 cDNA에 첨가한다. 적어도 1 G에서 종결되는 바코드화 작제물, 예를 들면, 5' 핵산 작제물이 또한 존재하면, 작제물은 제1 가닥 cDNA의 3' dC와 염기쌍을 형성할 수 있고, 역전사효소는 주형-스위칭을 경험하고 전사를 계속한다. 따라서, 역전사효소는 포스포디에스테르 결합을 통해 제1 가닥 cDNA의 3' 말단에 바코드 서열을 공유적으로 첨가한다. 예를 들면, 도 7에 도시된 바와 같이, 생성되는 작제물은 일반적으로 5' 내지 3':5' 바코드- cDNA 서열 -3' 바코드로부터 서열을 포함하는 핵산 분자이다. 임의로, 핵산 샘플은 추가로 증폭되어 각 서열이 5' 바코드 및 3' 바코드를 포함하는 복수의 핵산 서열의 다수의 카피를 생성한다. 임의로, 5' 및 3' 핵산 작제물은 5' 및 3' 바코드를 포함하는 핵산 서열을 증폭시키기 위해 사용되는 보편적 프라이밍 부위를 포함한다.
임의로, 역전사효소는 M-MLV 효소이다. 임의로, 역전사효소는 MMLV H- 역전사효소이다.
상기 주시된 바와 같이, 역전사는 용해 시약이 액적에 존재하여 세포로부터 RNA를 방출시킬 경우, 역전사효소, 프라이머 및 다른 적절한 시약이 존재하는 경우에 발생할 수 있다. 용해 및 역전사를 촉진시키기 위한 효소 및 시약은, 예를 들면, 효소 및 시약을 함유하는 액적을 바코드 및 세포를 함유하는 액적과 병합시킴으로써 모두 한 번에 첨가될 수 있거나, 단계적으로 첨가될 수 있다.
임의로, 5' 핵산 작제물은 프로모터를 포함하는 이본쇄 핵산 작제물이고, 여기서 5' 핵산 작제물은 5' 핵산 작제물의 다수의 카피를 생성하기 위한 주형으로서 작용한다. 임의로, 프로모터는 RNA 폴리머라제 프로모터이다. 예를 들면, 도 7을 참조한다. 따라서, 임의로, 5' 핵산은 다음 서열을 갖는 이본쇄 DNA(dsDNA) 주형 분자이다: 5'-T7 프로모터 - 보편적 프라이밍 서열 - 바코드 서열 - 결합 서열 -3'. T7 프로모터 서열은 T7 RNA 폴리머라제에 의해 주형으로부터 5' 핵산 작제물의 합성을 가능하게 한다. 보편적 프라이밍 서열은 하류에 사용되는 PCT 프라이머에 상보성을 위해 사용된다. 결합 서열은 1개 이상의 구아닌 염기(G's)로 이루어지고, cDNA의 제1 가닥의 3' 말단에 대한 바코드화 작제물의 상보적 염기쌍을 가능하게 한다. 각각 T3 및 SP6 RNA 폴리머라제에 의해 RNA 바코드화 작제물의 합성을 가능하게 하는 T3 및 SP6 프로모터 서열을 포함하지만, 이에 제한되지 않는 다른 프로모터 서열이 사용될 수 있다. 전장 또는 거의 전장 5' 핵산 작제물이 많은 경우에 합성되는 한, 특정 프로모터 서열을 갖지 않는 다른 RNA 폴리머라제도 또한 사용될 수 있다.
제공된 핵산 샘플은 단일 세포로부터 유래되고, 샘플과 연관된 RNA는 mRNA를 포함할 수 있다. 샘플은, 예를 들면, 적어도 1, 3, 10, 30, 100, 300, 1,000, 3,000, 10,000, 30,000, 100,000, 300,000 또는 1,000,000개의 mRNA 분자를 포함할 수 있고, 이는 임의의 수의 유전자, 대립유전자, 판독 프레임 또는 별개의 서열을 나타낼 수 있다. 임의로, 샘플과 연관된 RNA는 샘플로부터의 모든 mRNA, 세포의 완전 또는 부분 전사체, 또는 세포로부터의 전체 RNA를 포함한다.
임의의 이론에 결부시키지 않고, 본 발명은 샘플당 바코드화될 수 있는 RNA의 수를 제한하지 않는다. 따라서, 샘플당 생성되는 관심 있는 폴리뉴클레오티드의 수는 적어도 10, 30, 100, 300, 1,000, 3,000, 10,000, 30,000, 100,000, 300,000 또는 1,000,000개일 수 있다. 관심 있는 각각의 폴리뉴클레오티드는 다수의 카피로 존재할 수 있다. 또한, 방법의 1회 실행에서 바코드화될 수 있는 세포 또는 샘플의 수는 바코드 서열의 고유한 조합으로 여러 세트의 바코드를 제조하려는 문제(상기 논의된)에 의해서만 제한된다. 일부 구현예에서, 하나 이상의 샘플은 적어도 10, 30, 100, 300, 1,000, 3,000, 10,000, 30,000, 100,000, 300,000, 또는 1,000,000 세포를 포함한다. 샘플(예: 각각 단일 세포)은 동일하거나 상이한 대상체로부터 입수될 수 있다. 예를 들면, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100개의 상이한 대상체가 샘플을 제공할 수 있다.
핵산 샘플에서 5' 및 3' 바코드의 조합은 단일 세포로부터 핵산 샘플의 기원을 동정한다. 임의로, 핵산 샘플 중의 바코드는 서열분석에 의해 동정된다. 각각의 바코드 서열은 바코드 서열이 고유한 바코드 세트에서 재사용됨에 따라 상이한 샘플의 조립된 콘틱과 연관될 것으로 예상된다. 본원에 사용된 용어 콘틱은 중첩 서열 데이터(판독치)를 의미한다. 동일한 콘틱은 바코드 서열 a, b 및 c를 사용하는 것으로 관찰될 수 있다. 그리고, 바코드 서열 a, b 및 d는 다른 콘틱과 연관되는 것으로 관찰될 수 있다. 이로부터, a, b 및 c는 바코드 세트 1을 포함하고, a, b 및 d는 바코드 세트 2를 포함한다고 결론지을 수 있다. 바코드 세트 1은 하나의 세포로부터의 핵산 샘플과 연관되는 반면, 바코드 세트 2는 제2의 상이한 세포로부터의 핵산 샘플과 연관된다. 세트 중 모든 5' 바코드가 세트 중 모든 3' 바코드와 연관되기 때문에, 그들은 그래프 이론에서 최대 이분할 클리크로서 나타낼 수 있다(참조: 도 13). 최대 이분할 클리크는 바코드 세트 및 핵산을 단일 세포와 연관시킨다.
본원에 개시된 방법을 사용하여 생성된 조성물도 또한 제공된다. 따라서, 본원은 그들의 생성을 위한 RNA 및 DNA 작제물의 조성물을 제공한다. 특히, 바코드 작제물 비드 라이브러리, RNA 바코드 작제물이 적재된 에멀젼 액적 라이브러리, 세포를 갖는 바코드 작제물 라이브러리를 함유하는 에멀젼, 바코딩된 cDNA 라이브러리 및 미세 유체 액적 생성 장치도 또한 제공된다.
바코드화 비드의 집단을 포함하는 조성물이 제공된다. 상기 조성물은 각 비드의 표면에 5' 또는 3' 핵산 작제물의 다수의 카피가 부착된 다수의 비드를 포함한다. 따라서, 각 비드의 표면에 5' 핵산 작제물의 다수의 카피가 부착된 다수의 비드를 갖는 조성물이 제공된다. 각 비드의 표면에 3' 핵산 작제물의 다수의 카피가 부착된 다수의 비드를 포함하는 조성물도 또한 제공된다. 임의로, 조성물은 단세포를 포함하는 현탁 완충액에 적절하게 첨가될 때, 5' 핵산 작제물을 포함하는 적어도 하나의 비드, 3' 핵산 작제물을 포함하는 적어도 하나의 비드 및 단일 세포를 포함하는 반응 혼합물을 생성시키는 바코드화 혼합물이다. 바람직하게는, 반응 혼합물은 적어도 3개의 상이한 핵산 작제물, 예를 들면, 2개의 5' 핵산 작제물 및 1개의 3' 핵산 작제물 또는 2개의 3' 핵산 작제물 및 1개의 5' 핵산 작제물을 포함한다.
본원에 기재된 제공된 작제물을 포함하는 키트가 본원에 추가로 개시된다. 키트는 본원에 기재된 바코드 작제물에 커플링된 복수의 고체 지지체를 포함할 수 있다. 임의로, 키트는 각 라이브러리가 동일한 바코드를 갖는 복수의 바코드 작제물을 포함하는 하나 이상의 바코드 작제물을 포함한다. 예를 들면, 1, 2, 3, 4, 5, 6, 7, 8개 이상의 유형의 5' 및/또는 3' 핵산 작제물을 포함하는 5' 및 3' 핵산 작제물을 포함하는 바코드 비드의 라이브러리를 포함하는 키트가 제공된다. 임의로, 키트는 본원에 기재된 바코드화 혼합물 및/또는 세포 현탁 완충액을 포함한다. 키트는 사용 지침을 포함할 수 있다. 키트는 적합한 용기에 본원에 개시된 바와 같은 비드, 작제물 또는 라이브러리, 하나 이상의 대조군, 및 당해 기술 분야에 익히 공지된 다양한 완충액, 시약, 효소 및 다른 표준 성분을 포함할 수 있다. 따라서, 키트는 효소 또는 세포 용해, 제한 효소 소화 및 바코드화 반응을 수행하기 위한 임의의 다른 시약을 추가로 포함할 수 있다.
용기는 하나 이상의 웰을 포함하는 플레이트 상에 적어도 하나의 웰을 포함할 수 있다. 용기는 제공된 시약, 핵산 작제물, 비드, 라이브러리 또는 세포가 놓일 수 있고, 일부 경우에, 적절하게 분액화되는 적어도 하나의 바이알, 시험관, 플라스크, 보틀, 주사기, 액적 또는 다른 용기 수단을 포함할 수 있다. 추가의 성분이 제공되는 경우, 키트는 이 성분이 놓일 수 있는 추가의 용기를 함유할 수 있다. 키트는 또한 시약, 핵산 작제물, 비드, 라이브러리 또는 세포 및 임의의 기타 사약 용기를 상업적 판매를 위해 엄격히 감추어 함유하는 수단을 포함할 수 있다. 이러한 용기는 목적하는 바이알이 보유되는 사출 또는 취입 성형 플라스틱 용기를 포함할 수 있다. 용기는 사용 및/또는 경고에 대한 지침을 갖는 표지를 포함할 수 있다.
전문이 본원에 참조로 인용된 U.S.S.N. 14/586,857에 기재된 것들과 같은 반응 용적을 생성하고 수송하기 위한 장치도 또한 제공된다. 이러한 용적은 미세 유체 규모에서 발생할 수 있고, 담체 유체로부터 상분리될 수 있다. 장치에 의해 처리될 수 있는 반응 용적의 예는 역 에멀젼 중 수성 액적(즉, 물/오일 에멀젼)을 포함한다. 장치는 바코드 작제물, 샘플(예: 세포) 및/또는 이러한 샘플로부터 수득된 RNA가 액적에 별도로 또는 함께 캡슐화되도록 한다. 장치는 또한 시약이 액적에 혼입되어 바코드 작제물 분자가 효소적으로 생성될 수 있고 개별 샘플의 RNA가 바코드화될 수 있도록 한다.
장치는 일반적으로 각각이 압력 공급원 및 유동 센서에 커플링된 3개의 미세 유체 경로를 포함한다. 미세 유체 경로의 압력 공급원은 경로를 통해 유체를 구동하고, 압력 공급원의 하류에서 발생하는 유동 센서는 경로를 통과하는 유속을 측정하는데 사용될 수 있다. 일부 구현예에서, 제1 경로 및 제2 경로를 제1 접합부에서 병합되어 배합된 경로를 형성한다. 예를 들면, 도 1을 참조한다.
본원에 기재된 장치는 IDEX Corporation(Lake Forest, Illinois, U.S.A.)으로부터 입수 가능한 튜빙 및 유동성 성분으로부터 Dolomite Microfluidics(Charlestown, Massachusetts, U.S.A.)로부터 입수 가능한 미세 유체 액적 칩을 사용하여 조립될 수 있다. 미세 유체 액적 칩의 일부 특징은 본원에 참조로 인용된 미국 특허 제7,268,167호, 제7,375,140호, 제7,717,615호, 제7,772,287호, 제8,741,192호 및 제8,883,864호에 기재되어 있다. 적합한 압력 공급원은 주사기 펌프 및 압력 펌프를 포함한다. 압력 펌프는 Dolomite Microfluidics로부터 입수 가능하다. 압력 공급원은 독립적으로 조절될 수 있다.
임의로, 제1 및 제2 미세 유체 경로는 수용액을 수송한다. 각 경로는 주입 포트 및 상기 경로와 일직선으로 주입 포트에 혼입된 용액을 가져 오는 밸브(예: 4원 밸브)를 포함할 수 있다. 임의로, 수성 담체 유체를 보유하는 저장소가 각각의 4원 밸브의 상류에 배치된다. 담체 유체가 하류로 구동되거나, 수용액의 플러그를 제1 접합부를 향해 하류로 가압할 때 수성 담체 유체는 4원 밸브에서 수용액과 혼합될 수 있다. 임의로, 유동 레지스터가 각각의 미세 유체 경로에 배치된다.
일단 수용액이 제1 또는 제2 미세 유체 경로에 혼입되면, 용액의 유동을 제1 접합부로 계량 혼입하는 샘플 루프를 통해 통과할 수 있다. 계량 혼입은, 예를 들면, 유체 저항 또는 샘플 루프를 따라서 배치된 밸브를 사용하여 목적하는 바와 같이 달성될 수 있다. 임의로, 하나의 샘플 루프는 제1 및 제2 미세 유체 경로 각각과 연관되고, 샘플 루프는 열 냉각 유닛과 접촉된다. 열 냉각 유닛은 수용액에서 효소, 핵산 또는 다른 생물학적 성분의 열 변성을 억제하거나 효소 반응을 위한 최적 온도를 설정하기 위해 포함될 수 있다. 제1 및 제2 미세 유체 경로를 위한 샘플 루프와 접촉하는 열 냉각 유닛의 부분은 독립적으로 또는 공동으로 조절될 수 있다. 샘플 루프를 통과하는 수용액의 온도가 주위 온도에서 벗어날 수 있는 한 임의의 물질 또는 장치가 열 냉각 단위로서 사용될 수 있다. 적합한 열 냉각 장치의 예는 펠티에 장치 및 얼음 상자이다.
임의로, 제1 미세 유체 경로를 통해 수송된 수용액은 세포 및 바코드 작제물 비드를 함유한다. 일부 구현예에서, 제2 미세 유체 경로를 통해 수송된 수용액은 세포 용해를 위한 시약 및 관심 있는 폴리뉴클레오티드를 생성하기 위한 시약(예: 바코드 작제물 분자를 생성하는 효소)을 함유한다. 각각의 미세 유체 경로와 연관된 주입 포트, 밸브 및/또는 샘플 루프는 그 경로를 통과하는 수용액의 내용물을 수용하도록 구성되거나 맞춤화될 수 있다. 예를 들면, 제1 미세 유체 경로와 연관된 샘플 루프는 세포 및 비드를 수용하기 위해 확장된 내부 직경을 가질 수 있다. 이들 성분 모두가 제1 접합부에서 배합되도록 제1 및 제2 미세 유체 경로 사이에 세포, 비드 및 시약을 할당하기 위한 많은 다른 옵션이 존재한다는 것이 인식될 것이다. 예를 들면, 세포는 제1 미세 유체 경로를 통해 수송될 수 있고, 비드는 제2 미세 유체 경로를 통해 수송될 수 있다. 각 경로는 운반하는 수용액의 함량을 고려하여 목적하는 바와 같이 구성될 수 있다.
배합된 경로의 병합으로 인해 생성되는 액적을 함유하는 유체 경로는 샘플 경로를 구성한다. 샘플 경로는 제2 접합부의 하류에서 발생하는 샘플 수집 용기로 전달된다. 샘플 수집 용기에서, 액적은 열 사이클링에 적용될 수 있다. 액적은 또한 파괴되어 개방될 수 있고, 바코드화 핵산은 수확될 수 있다.
작동시, 장치는 수성 미세 유체 액적으로 바코드 작제물 비드 및 세포를 캡슐화하여 각 액적이 평균 대략 2개의 비드 및 1개의 세포를 함유하도록 사용될 수 있다. 각 액적 내의 비드 및 세포의 수는, 예를 들면, 장치에 적재된 용액 중 비드 또는 세포의 농도를 조정하거나, 3개의 미세 유체 경로에서 유속을 조정함으로써 목적하는 바와 같이 조정될 수 있다. 각 액적에 포함된 시약은 바코드 작제물 분자가 액적 내의 하나의 비드로부터 효소적으로 생성되도록 한다. 이러한 시약은 또한 하나의 세포가 용해되고, 세포로부터의 RNA가 바코드화 반응을 수행하도록 한다. 따라서, 세포로부터의 RNA는 액적 내에서 바코드화될 수 있고, 이러한 RNA로부터 유도된 (바코드 서열을 함유하는) 핵산은 나중에 여러 세포의 핵산이 혼합될 때 하나의 세포로 추적될 수 있다.
개시된 방법 및 조성물을 위해 사용될 수 있거나, 이와 함께 사용될 수 있거나, 이의 제조에 사용될 수 있거나, 이의 생성물인 재료, 조성물 및 성분이 개시된다. 이들 및 다른 물질이 본원에 개시되어 있고, 이들 물질의 조합, 서브세트, 상호작용, 그룹 등이 개시될 경우, 이러한 화합물의 각각의 다양한 개체 및 총체적 조합 및 순열의 특정 참조가 명시적으로 개시되지 않을 수 있지만, 각각은 본원에서 구체적으로 예상되고 기재되는 것으로 이해된다. 예를 들면, 방법이 개시되고 논의되고, 그 방법을 포함하는 다수의 분자에 행해질 수 있는 다수의 변형이 논의되면, 그 방법의 각각 및 모든 조합 및 순열, 및 가능한 변형은 특히 반대로 명시되지 않는 한 구체적으로 예상된다. 마찬가지로, 이들의 임의의 서브세트 또는 조합도 또한 구체적으로 예상되고 개시된다. 이 개념은 개시된 조성물을 사용하는 방법의 단계를 포함하지만, 이에 제한되지 않는 본 개시의 모든 국면에 적용된다. 따라서, 수행될 수 있는 다양한 추가 단계가 존재하는 경우, 이들 추가 단계 각각은 개시된 방법의 임의의 특정 방법 단계 또는 방법 단계의 조합으로 수행될 수 있고, 이러한 조합 또는 조합의 서브세트 각각이 구체적으로 예상되고 개시된 것으로 간주되어야 하는 것으로 이해된다.
본원에 인용된 공보 및 그들이 인용된 자료는 이로써 전문이 구체적으로 참조로 인용된다.
다수의 구현예가 기재되어 있다. 그럼에도 불구하고, 다양한 변형이 수행될 수 있는 것으로 이해될 것이다. 따라서, 다른 구현예는 이하 청구범위의 범위 내에 있다.
실시예
실시예 1. 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 세트.
각 세포의 전사체는, 바코드화 비드 라이브러리의 2개의 별개의 세트(5' 세트 및 3' 세트)를 사용하여 바코드화한다. 도 2 참조. 각각의 3' 바코드는, 제한 부위, 고유한 분자 동정자, 바코드 서열, 및 mRNA 전사체의 폴리-A 꼬리를 특이적으로 표적화하는 폴리-T 서열로 이루어진다(따라서, 각 진핵생물 세포에서 전체 RNA의 상당한 부분을 포함하는 리보솜 및 tRNA를 회피함). 각각의 5' 바코드는, 3' 비드 세트 상의 제한 부위와 동일할 수 있는 제한 부위(RE), 최종 바코드 서열의 상보체, 및 3개 구아닌 잔기를 포함한다. 이들 2개 비드 세트는 관심 있는 세포와 함께 액적 내에 캡슐화된다. 도 1에 제시된 것과 같은 액적 장치를 사용할 수 있다.
각 비드 세트(3' 및 5')의 농도는 액적의 목적하는 비율이 각 세트의 적어도 하나의 비드를 수용하도록 조정한다. 예를 들면, 액적당 각 유형의 3개 비드의 평균치의 경우, 액적의 90% 이상은 각 유형의 적어도 하나의 비드를 수용할 것이다. 세포 농도는 처리량 및 단일-세포 캡슐화 사이의 최적 균형을 위해 유사하게 조정된다. 본 실시예의 목적을 위해, 평균치는 액적당 0.1개 세포이고, 이 경우에 세포를 수용하는 액적의 95% 초과는 하나의 세포를 정확하게 수용할 것이다. 생산성 액적은 세포, 및 5' 및 3' 세트 각각으로부터 적어도 하나의 비드를 수용할 것이다. 성공적인 캡슐화 사상 후, 반응은 도 3에 설명된 바와 같이 진행시킬 수 있다.
mRNA를 완전히 역전사시키고, cDNA의 각 말단 상의 바코드 서열의 혼입을 생성한다. 각 유형의 정확하게 1개 비드가 세포와 함께 공동-캡슐화되는 경우, 완전히 역전사되는 mRNA 전사체는, 그 세포에 고유한 바코드 세트를 포함하는 5' 및 3' 바코드의 동일한 쌍을 나타낼 것이다. 비드 세트 중의 어느 하나 또는 둘 다의 복수가 세포와 공동-캡슐화되는 경우, 모든 5'/3' 조합은 생성되는 cDNA 라이브러리에서 표현될 것으로 예상되고, 이러한 세트의 5'/3' 조합은 그 세포에 고유한 바코드 세트이다. 모든 cDNA는 3' 바코드를 최소한으로 포함할 것이다. 역전사가 불완전한 경우, 5' 바코드는 cDNA 내로 혼입되지 않을 것이다. 3' 바코드만이 혼입되는 이러한 경우에도, 해당 바코드가 해당 바코드 세트의 일부로서 이를 확립하기 위해 해당 액적 중의 충분한 수의 5' 바코드와 연관되는 한, 불완전 cDNA는 여전히 잠재적으로 하류 분석에서 이의 적절한 전사체에 할당될 수 있다.
도 4는 각 바코드 세트의 복수의 바코드 비드가 세포와 함께 단일 액적에서 공동-캡슐화되는 경우를 설명한다. 각 세포 내의 다수의 mRNA 전사체에 기인하여, 모든 3' 바코드는 상기 기재된 바코드화 도식에 의해 액적 중의 모든 5' 바코드와 정합할 기회를 가질 것이다. 이들 바코드는 세포로부터 기원하는 모든 전사체를 동정하는 고유한 바코드를 형성한다.
다수의 경우, 바코드화 반응은 완료까지 작동하지 않을 수도 있고, 전사체 서열 중의 일부만이 전사될 것이다. 불완전하지만, 이는 잠재적으로 유용한 정보이다. 도 5는, 5' 바코드를 혼입할 수 없는 비-전장 cDNA의 경우에도, 이들 cDNA가 적절한 바코드 세트에 할당될 수 있음을 설명한다. 따라서, 단지 하나의 바코드만을 갖는 핵산은 고도의 신뢰성으로 정확한 전사체에 할당될 수 있다(동일한 것이 반대의 경우에도 유지된다). 이에 대한 요건은 3' 바코드 코드 공간(고유한 3' 바코드의 총 수)이 충분히 크고, 임의의 하나의 3' 바코드가 복수의 세포로 충분히 공동-캡슐화될 가능성이 낮다는 것이다. 이것이 발생하는 경우에도, 이의 중복을 검출할 수 있고, 특정 공유된 3' 바코드를 갖는 비-전장 cDNA를 안전하게 폐기할 수 있다. 대조적으로, 단일 바코드 시스템의 경우에, 동일한 바코드를 수용하는 2개 세포의 프로파일을 분석 동안 병합할 수 있다.
도 6은, 동일한 개개 바코드의 일부 중복이 있는 경우에도, 바코드의 세트는 하나의 고유한 바코드를 포함하는 것에 의해 구별할 수 있음을 입증한다.
5' 및 3' 세트 각각에 대한 요구된 코드 공간(고유 바코드의 수)을 결정해야 한다. 바코드는 또한 서열분석 에러의 존재하에 이들이 구별될 수 있다는 점에서 또한 충분히 고유해야 하고, 즉 소수의 잘못된 염기에서, 하나의 바코드는 또 다른 바코드로 전환되지 않아야 한다. 바코드 세트의 확립은 서열분석 에러가 바코드 사이에서 모호함을 생성할 수 있는 경우를 해결하는 것을 도울 수 있다.
한 가지 대안적인 구현예는, 이것이 주형-스위칭을 수반하지만, 이 경우에 5' 바코드 비드 세트가 도 7에 제시된 바와 같이 상이한 조성을 갖는다는 점에서 상기 기재된 바코드화 도식과 유사하다. 이는, mRNA 전사체로부터 완전히 역전사되는 cDNA의 각 말단 내로 바코드를 혼입하는 "주형-스위칭" 바코드화 도식에 대한 복수의 접근법이 있음을 입증한다.
실시예 2. 단일 세포-비-주형 스위칭과 연관된 핵산의 분석을 위한 핵산 바코드의 세트
본 실시예는 비-주형-스위칭 방법을 기재한다. 바코드화 비드의 단일 세트만이 있다. 각 비드는 헤어핀 구조를 형성하는 일본쇄 DNA 올리고를 갖는다. 헤어핀의 이본쇄 세그먼트에는, 양 가닥의 제한을 지시하는 제한 부위가 혼입된다. 이는 전사체 바코드화 세그먼트, 및 "바코드 연관 서열"(BSA) 뿐만 아니라 바코드를 또한 함유하는 별개의 루프화 세그먼트 둘 다를 절단한다. 도 8 참조.
전사체 바코드 세그먼트는 UMI, 바코드 및 폴리-T 세그먼트를 포함한다. 이 세그먼트는 액적 내의 세포에 의해 방출된 mRNA 전사체의 폴리-A 꼬리에 어닐링하고, 해당 mRNA 서열의 역전사를 프라이밍하고, 따라서 바코드를 생성된 cDNA 내로 혼입한다(도 9).
별개로, 루프화 세그먼트는, 절단되는 바코드와 동일하거나 이에 상응하는 자체의 바코드를 포함한다. 이는 또한 프라이밍 서열을 포함한다. BSA, 즉 회문성 서열.
복수의 비드가 세포와 공동-캡슐화되는 경우, 2개의 전사체 바코드화 세그먼트(BC1a & BC2a, 도 10)는 둘 다 RT 바코드화 반응을 위한 프라이머로서 작용할 것이고, 그 세포로부터의 전사체가 양 바코드를 혼입할 것이다. 별개로, 이들의 각각의 바코드를 포함하는 2개의 상응하는 루프화 세그먼트(BC1b & BC2b, 도 10)도 또한 존재할 것이다.
회문성 BAS는 BC1b 및 BC2b 루프화 세그먼트를 교차-어닐링시킬 수 있고, DNA 폴리머라제는 다른 바코드의 상보체를 혼입하기 위해 각 세그먼트를 연장시키키 위해 반응 혼합물에 포함된다(도 11). 이러한 방식으로, BAS는 단일 앰플리콘에서 물리적으로 연결시키고, 이어서 그 세포로부터 전사체를 통일시키기 위한 세트로서 바코드를 연관시키기 위해 하류에서 서열분석할 수 있다.
회문성 서열이 바람직하지 않은 경우, BAS가 2개의 상보성 서열을 포함하고 각각의 비드가 대개 동등한 비율로 양 BAS 서열 포함하는 시스템이 또한 설계될 수 있다. "루프화" 세그먼트로서 기재된 것은 루프보다는 선형일 수 있다. 이는 사용되는 제한 효소에 의존한다. 유사하게는, 헤어핀을 사용하기보다는, 선형 올리고는 비드로부터 절단되는 2개 이상의 세그먼트를 또한 제공하는 복수의 제한 부위와 함께 사용될 수 있다. 또한, "루프화" 세그먼트는 루프화될 수 없지만, 대신에 선형일 수 있다.
실시예 3. 복수의 바코드를 사용하여, 바코드가 어느 용기에 위치되어 있는지의 선험적 지식 없이 어떠한 핵산이 동일한 샘플과 연관되는지를 동정한다.
바코드 세포에 대한 PBMC 제조. 동결건조된 PBMC를 해동시키고, 세포 펠렛을 인산염 완충 염수(Corning, Manassas, VA)에서 3회 세척하고, 96-웰 플레이트에 단일 FACS-분류하거나, 25mM NaCl 및 153mM 베타인을 포함하는 등장성 세포 현탁 완충액(CSB)에 재현탁시켰다. 이어서, 세포를 계수하고, 역전사를 위해 웰당 1개 세포의 평균으로 CSB로 희석시켰다.
올리고 플레이트 제조. 바코드화 올리고DT 올리고(3' 바코드, 이하 "oDT BC"로서 지칭됨) 및 바코드화 주형-스위칭 올리고(5' 바코드, 이하 "wID BC"로서 지칭됨)를 인테그레이티드 DNA 테크놀로지스(Coralville, IA)로부터 주문했다. 도착하면, oDT BC 및 wID BC를 10μM로 희석시키고, 사용할 때까지 -20℃에서 유지시킨다. 이들은 하기 서열을 갖는다:
표 2. 올리고 서열
Figure pct00002
서로 적어도 2 편집 거리 떨어져 있는 바코드를 설계했고, 즉 이는 하나의 바코드를 또 다른 바코드로 전환시키기 위해 적어도 2개 돌연변이(치환, 삽입 또는 결실)을 필요로 한다. 이는, 바코드가 이들 에러에 기인하여 또 다른 바코드로서 잘못 할당될 기회를 갖도록 적어도 2개의 서열분석 에러일 필요가 있기 때문에 바코드 할당 에러를 크게 감소시킨다.
역전사 및 바코드화. 2의 람다를 갖는 무작위 포아송 분포를 통해 각 웰에 분포된 oDT BC 및 wID BC를 함유하는 96-웰 플레이트를 제조했다. 이러한 분포와 함께, 일부 웰은 올리고를 수용하지 않을 것이고, 다른 웰은 복수의 올리고를 수용할 것이고, 평균적으로 각 웰은 2개 올리고를 수용할 것이다. 무작위 포아송 분포 스크립트를 R로 작성하여, 어떠한 올리고가 각 웰에 배치되는지를 결정하고, 액체 핸들러(FeliX, Cybio, Germany)를 사용하여 바코드를 웰에 분포시켰다. 반응은 6mM Mg2+, 0.3% 트윈20, RNase 억제제, 맥시마 H - 역전사효소 및 소 혈청 알부민(BSA)을 각 웰에 포함하는 RT 완충액에서 수행했다. 각 웰에서, 샘플은 FACS를 통해 침전된 단일 세포였다. 반응 혼합물을 역전사시키고, 바코드화 올리고를 55℃에서 3분 동안, 42℃에서 1시간 동안 및 85℃에서 10분 동안 cDNA 내로 혼입했다. 이어서, 플레이트를 -20℃에서 밤새 동결시켰다.
샘플 풀링, 라이브러리 제조 및 서열분석. 동결된 플레이트를 샘플 풀링을 위해 아이스 상에서 해동시켰다. 각 플레이트로부터의 RT 생성물을 2개의 반분(96-웰 플레이트의 좌측 및 우측 반분)에 풀링하고, 300bp보다 짧은 물질을 제거하기 위해 제조업자의 지침에 따라 셀렉트-a-사이즈 DNA 클린 & 컨센트레이터(Zymo Research, Irvine, CA)를 사용하여 하향 농축시켰다. 요약하면, 500μL의 셀렉트-a-사이즈 DNA 결합 완충액을 100μL의 cDNA에 첨가하고, 10,000g에서 30초 동안 원심분리 전에 온화한 피펫팅에 의해 혼합했다. cDNA를 함유하는 컬럼을 DNA 세척 완충액으로 2회 세척하고, DNA 용출 완충액을 사용하여 15μL에서 용출시켰다. 1μL의 각 샘플은 Q5 DNA 폴리머라제(New England Biosciences) 및 0.2μM의 프라이머 pltwll_LibPCR_Fw 및 pltwll_LibPCR_RV를 사용하는 PCR을 위해 사용했다. 하기 PCR 열사이클링 조건을 사용했다: 95℃에서 5분 동안 변성; 하기의 10 사이클; 98℃에서 30초, 60℃에서 30초, 및 68℃에서 1분 동안; 및 에펜도르프 마스터사이클러 넥서스 써멀 사이클러(Eppendorf Mastercycler Nexus Thermal Cycler)(Hauppauge, NY)를 사용하여 68℃에서 5분 동안 최종 연장. PCR 생성물은 또한, 300bp보다 짧은 생성물을 제거하기 위해 상기 기재된 바와 같이 셀렉트-a-사이즈 DNA 클린 앤드 컨센트레이터(select-a-Size DNA Clean & Concentrator)(Zymo Research, Irvine, CA)를 사용하여 하향 농축시켰다. 이어서, 제2 PCR은 0.2μM의 프라이머 pltwell_PCR2_Fw 및 pltwell_PCR2_Rv를 사용하여 수행했다. 300bp 내지 1200bp의 크기를 갖는 생성물은 피핀 프렙 DNA 사이즈 셀렉션 시스템(Pippin Prep DNA Size Selection System)(Beverly, MA)을 사용하여 크기-선별하고, 일루미나 미세크 시스템(Illumina MiSeq system)(San Diego, CA)에 의해 서열분석했다.
분석 및 결과. 라이브러리의 MiSeq 서열분석 후, 48개 웰의 세트로부터 수득되는 판독 쌍은 파이톤(Python) 스크립트를 사용하여 분석했다. 포아송 분포에 따라 바코드의 무작위 분포의 결과로써, 이들 웰 중의 39개는 적어도 하나의 wID 및 적어도 하나의 wID를 함유했다. 9개(9) 웰은 제로 wID 바코드 또는 제로 odT 바코드를 함유했다. 공지된 구조의 판독치(5'-wID-ACGGG-mRNA-BdA16-N8-oDT)를 사용하여, oDT BC를 역 판독치로부터 동정하고, wID BC를 전방 판독치로부터 동정했다. 바코드의 공지된 서열은 다음과 같은 분석에 사용하지 않았고, 이 방법은 어떤 바코드가 어떤 샘플과 연관되는지에 대한 선행 지식 없이 핵산 기원의 샘플을 결정할 수 있고, 데이터 분석 접근법이 서열분석기에 의해 도입된 에러에 대해 강력하다는 것을 입증한다.
"이중 바코드화 전사 판독치"의 세트는 oDT BC 및 wID BC가 머드 동정된 판독 쌍으로부터 생성했다. 상기 세트는 6,964개의 별개의 바코드 쌍을 포함하는 총 107,795개 판독 쌍으로 이루어졌다. 이중 바코드화 전사체로부터 관찰된 바코드 쌍의 빈도의 히스토그램은 도 15에 제시되어 있다.
낮은 수준의 교차-오염은 올리고의 합성으로부터 예상되었다(참조: IDT DNA Technologies, Reduced Barcode Contamination Using Oligonucleotides With TruGradeTM Processing, Decoded 2(4), 2012). 바코드 올리고는 세트에서 함께 합성되었다. 함께 합성된 N 바코드와 함께, 전달된 각 올리고가 각각의 다른 N-1 올리고의 동등한 혼합물을 함유하여, 각각의 목적하는 생성물 올리고가 생성된 올리고의 분획 1-p만을 포함하는 경우, 예상된 바코드 쌍 대 오염으로부터 발생하는 쌍을 갖는 판독치의 분획을 추산할 수 있다. 예상된 쌍을 갖는 판독치의 분획은 (1-p)*(1-p)로서 추산될 수 있다. 오염물인 분획은 (1-(1-p)*(1-p))로서 추산될 수 있다. 이어서, 오염에 기인하여 (N-1) 상이한 올리고 바코드가 있으면, N*N-1 오염물 쌍의 합계가 존재한다. 이어서, 오염물 쌍의 비율은 f=(1-p*p)/{p*p*(N*N-1)}로서 추산될 수 있고, 판독치의 소정 수 R에 대한 오염물당 판독 쌍의 수는 f*R이다.
소정 시간에서 24개의 플레이트 중의 288개 전체 바코드를 주문했다. 몰 수준에서 최대 10%의 올리고 교차-오염을 보존적으로 허용하면, 40개 미만의 별개의 판독 쌍을 갖는 바코드 쌍이 오염될 가능성이 높은 것으로 추산되었다. 따라서, 역치가 설정되고, 이는 바코드의 소정 쌍이 본 분석에서 추가 고려를 위해 최소 50개 판독 쌍에서 관찰되는 것을 필요로 한다.
웰 및 세포에 대한 데이터의 할당. 출력 판독은 어떤 바코드가 각 웰에 분포되었는지에 대한 사전 지식을 사용하지 않고 단일 세포 및 웰에 할당했다. 이 분석의 출발점은 적어도 50개 판독 쌍에 의해 데이터 내에서 지지되는 wID BC 및 oDT BC의 183개 쌍의 세트였다. BC의 이들 183개 쌍은 합계 94,712개 판독 쌍에 의해 지지되었다. 이들 쌍 중 각각 하나는 정점이 관찰된 wID BC 및 oDT BC인 그래프에서 엣지(wID BC, oDT BC)로서 관찰되었고, 적어도 50개 판독치를 갖는 엣지에 할당했다. 본 데이터 세트를 나타내는 이러한 그래프는 한 그룹의 노드를 구성하는 wID BC, 및 다른 그룹의 노드를 구성하는 oDT BC로 이분할되었다. 하나 이상의 wID BC 및 하나 이상의 oDT BC를 갖는 세포/웰은 데이터 중의 모든 엣지로 이루어진 그래프의 완전한 이분할 서브-그래프를 형성하는 엣지의 세트를 생성해야 함에 주의해야 한다(또한, 도 13 및 14 참조). 따라서, 그래프의 엣지는 모든 데이터-세트의 그래프를 완전한 이분할 그래프로 분해하는 알고리즘을 개발함으로써 세포/웰에 할당했다.
알고리즘의 단계는 다음과 같았다:
1. 그래프의 연결 성분을 모두 계산한다.
2. 완전한 이분할 그래프(바이-클리크)인 연결된 성분을 각각 웰/세포에 할당했다.
3. 다른 연결된 성분을 다음과 같이 바이-클리크의 조합으로 분해했다.
a. 성분의 서브-그래프인 모든 바이-클리크를 결정했다(하기 설명된 알고리즘).
b. 3.a.의 그래프의 세트 중에서, 최대인 바이-클리크(임의의 기타 바이-클리크에 포함되지 않음)를 선택했다.
c. "프루닝(pruning)" 단계를 데이터에 존재할 가능성이 없는 바이-클리크를 제거하기 위해 적용했다.
상기 알고리즘의 단계 3a는 다음과 같이 수행했다:
1. 세트 O 및 I를 다음과 같이 생성했다:
a. 연결 성분 중의 각 wID BC에 대해, 엣지에 의해 이것에 연결되고 출력(wID BC)으로 불리우는 oDT BC의 세트를 결정하고, 이어서 O 양방 발신(wID BC) 및 모든 이의 서브세트에 추가했다.
b. a.와 유사한 방식으로, 세트 I를 다음과 같이 생성했다: 연결 성분 중의 각 oDT BC에 대해, 엣지에 의해 이것에 연결되고 이를 수신(oDT BC)으로 불리우는 wID BC의 세트를 측정하고, 이어서, I 양방 발신(oDT BC) 및 모든 이의 서브세트에 추가했다.
2. 이제, I 중의 각 세트 i 및 O 중의 각 세트 o에 대해, i 중의 wID BC 및 o 중의 oDT BC 사이의 모든 엣지가 데이터에 존재하는지, 및 이것이 바이-클리크가 해당 성분의 서브-그래프인 모든 바이-클리크의 세트에 추가된 경우인지를 결정했다.
상기 알고리즘의 단계 3c는 다음과 같이 수행했다:
1. λ=2의 경우, 세포의 분획 0.0166은 소정 유형의 5개 이상의 바코드를 가질 것이다. 따라서, 5개 이상의 wID BC 또는 5개 이상의 oDT BC를 갖는 알고리즘에 의해 작제된 임의의 바이-클리크는 유효한 작제물로서 거절되고, 여과 제거했다.
2. 단일 wID BC 및 4개 이상의 oDT BC(또는 그 반대)를 갖는 클리크는 보다 작은 바이-클리크로 구성된 모호한 작제물일 가능성이 높았다. 이러한 모호성의 측면에서, 이들 바이-클리크를 또한 여과했다.
단계 3b 및 3c의 휴리스틱(heuristics)는, 각 성분을 이것이 포함할 가능성이 가장 높은 이분할 클리크로 분해하는 최대 가능한 접근법으로 치환할 수 있고, 이는 결과를 추가로 개선시킬 것으로 예상된다. 가능성은 본 휴리스틱 3c에서 논의된 바와 같이 파라미터 λ에 의존하고, 또한 성분을 구성하는 다양한 바이-클리크 사이의 wID BC 및 oDT BC에서 중복량에 의존한다.
표 3. 분석 결과
Figure pct00003
표 2는, 이러한 데이터 세트에 기여하는 39개 웰로부터의 데이터가 15개 성분을 생성했음을 나타낸다(48개 웰 중의 39개만이 wID 및 odT BC를 갖는 것에 유의한다. 9개 웰은 wID 바코드만 또는 odT 바코드만을 갖고, 따라서 바코드 쌍을 생성할 수 없다). wID BC 및 oDT BC의 수, 및 분해 알고리즘으로부터 기인하는 프루닝된 최대 바이-클리크의 수가 제시되어 있다. 또한, 표 2는, 예상된 클리크와 정확하게 일치하고 예상된 바이-클리크의 적절한 서브세트이거나 1 또는 2개의 예상된 그래프와 교차하는 바이-클리크의 수를 나타낸다.
34개 완전 이분할 그래프는 15개의 연결된 성분으로부터 생성되었다. 이들 34개 중에서, 23개는 예상된 그래프와 완전히 일치했다. 추가의 4개 그래프는 예상된 그래프의 적절한 서브세트였다. 따라서, 수득되는 클리크의 23/34=67%는 완전히 생성되었고, 27/34=79%는 적어도 부분적으로 재구성되었고, 이들에 할당된 에러 엣지는 없었다. 실험에 포함된 웰의 전체 27/48=56%는 연관된 바코드 및 mRNA가 성공적으로 할당되었다. 이들 성공적 재구성은, 바코드 올리고 제조 동안 교차-오염에 기인하여 의사 판독 쌍의 데이터 세트 중의 존재에도 불구하고 가능했고, 이는 데이터 처리에서 제외할 수 있다.
이러한 다중-바코드화 도식은, 목표가 단일 바코드를 각 웰에 할당하는 것인 모노-바코드화 도식보다 매우 우수하다. 포아송 적재를 사용한 모노-바코드화 도식에서, λ=0.1 이하의 사용은 자연 선택이다(참조: Macosko et al., ll, 161:5 (2015), 이는 0.06의 람다를 사용한다). λ=0.1의 경우, 세포의 대략 90.4%는 바코드를 수용하지 않고, 대략 9.0%는 정확하게 하나의 바코드를 수용하고, 대략 0.5%는 하나 이상의 바코드를 수용한다. 본원에 기재된 실험에서, 56%/(100-90.4)%는 모노-바코드화 도식을 사용하여 성공적으로 분석할 수 있는 세포 수의 5.8배에 동등하다.
SEQUENCE LISTING <110> Atreca, Inc. <120> COMBINATORIAL SETS OF NUCLEIC ACID BARCODES FOR ANALYSIS OF NUCLEIC ACIDS ASSOCIATED WITH SINGLE CELLS <130> 097519-1028178-001010PC <150> 62,250,900 <151> 2015-11-04 <160> 6 <170> PatentIn version 3.5 <210> 1 <211> 51 <212> DNA <213> artificial sequence <220> <223> synthetic construct <220> <221> misc_feature <222> (27)..(34) <223> n is a, c, g, or t <400> 1 ggctcggaga tgtgtataag agacagnnnn nnnntttttt tttttttttt v 51 <210> 2 <211> 30 <212> DNA <213> artificial sequence <220> <223> synthetic construct <400> 2 ggaagatagg gataacaggg taatgacggg 30 <210> 3 <211> 65 <212> DNA <213> artificial sequence <220> <223> synthetic construct <400> 3 aatgatacgg cgaccaccga gatctacact cgtcggcagc ggaagatagg gataacaggg 60 taatg 65 <210> 4 <211> 55 <212> DNA <213> artificial sequence <220> <223> synthetic construct <400> 4 caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agaga 55 <210> 5 <211> 17 <212> DNA <213> artificial sequence <220> <223> synthetic construct <400> 5 aatgatacgg cgaccac 17 <210> 6 <211> 19 <212> DNA <213> artificial sequence <220> <223> synthetic construct <400> 6 caagcagaag acggcatac 19

Claims (64)

  1. 핵산 샘플의 기원을 동정하는 방법으로서,
    (a) 단일 세포로부터의 핵산 분자 및 바코드의 세트를 포함하는 핵산 샘플을 포함하는 반응 혼합물을 형성하는 단계;
    (b) 상기 바코드의 세트를 상기 샘플의 핵산 분자에 혼입하는 단계; 및
    (c) 상기 단일 세포의 핵산 분자에 혼입된 바코드의 세트를 동정함으로써 상기 핵산 샘플의 기원을 동정하는 단계를 포함하는, 방법.
  2. 청구항 1에 있어서, 상기 반응 혼합물을 형성하는 단계가 상기 단일 세포를 상기 바코드의 세트와 접촉시키는 단계 및 상기 세포를 용해시켜 상기 단일 세포로부터의 핵산 샘플을 제공하는 단계를 포함하는, 방법.
  3. 청구항 1에 있어서, 상기 반응 혼합물을 형성하는 단계가 세포를 현탁 완충액에 제공하는 단계 및 상기 세포를 포함하는 현탁 완충액을 상기 단일 세포 및 상기 바코드의 세트를 포함하는 반응 혼합물을 형성하기 위한 조건하에 상기 바코드 세트를 포함하는 바코드화 완충액과 접촉시키는 단계를 포함하는, 방법.
  4. 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 바코드의 세트가 각 작제물이 고유한 5' 바코드를 포함하는 하나 이상의 5' 핵산 작제물 및 각 작제물이 고유한 3' 바코드를 포함하는 하나 이상의 3' 핵산 작제물을 포함하는, 방법.
  5. 청구항 4에 있어서, 상기 반응 혼합물을 형성하는 단계가 세포를 현탁 완충액에 제공하는 단계 및 상기 현탁 완충액을, 상기 단일 세포 및 적어도 하나의 5' 핵산 작제물 및 적어도 하나의 3' 핵산 작제물을 포함하는 반응 혼합물을 형성하기 위한 조건하에 상기 5' 및 3' 핵산 작제물을 포함하는 바코드화 완충액과 접촉시키는 단계를 포함하는, 방법.
  6. 청구항 4에 있어서, 상기 반응 혼합물을 형성하는 단계가 세포를 현탁 완충액에 제공하는 단계 및 상기 현탁 완충액을, 상기 단일 세포 및 적어도 하나의 5' 핵산 작제물 및 적어도 하나의 3' 핵산 작제물을 포함하는 반응 혼합물을 형성하기 위한 조건하에 상기 5' 핵산 작제물을 포함하는 제1 바코드화 완충액 및 상기 3' 핵산 작제물을 포함하는 제2 바코드화 완충액과 접촉시키는 단계를 포함하는, 방법.
  7. 청구항 4 내지 6 중 어느 한 항에 있어서, 상기 작제물이 고유한 분자 동정자(UMI) 서열을 추가로 포함하는, 방법.
  8. 청구항 4 내지 7 중 어느 한 항에 있어서, 각각의 5' 핵산 작제물이 고체 표면에 부착된 다수의 카피로 제공되는, 방법.
  9. 청구항 4 내지 8 중 어느 한 항에 있어서, 각각의 3' 핵산 작제물이 고체 표면에 부착된 다수의 카피로 제공되는, 방법.
  10. 청구항 8 또는 9에 있어서, 상기 고체 표면이 비드, 마이크로비드, 미세입자, 미소구, 나노입자, 나노비드 또는 하이드로겔인, 방법.
  11. 청구항 4 내지 10 중 어느 한 항에 있어서, 상기 반응 혼합물이 상기 단일 세포로부터의 핵산 샘플, 상기 5' 핵산 작제물의 다수의 카피를 포함하는 하나 이상의 비드, 및 상기 3' 핵산 작제물의 다수의 카피를 포함하는 하나 이상의 비드를 포함하는, 방법.
  12. 청구항 4 내지 11 중 어느 한 항에 있어서, 각각의 5' 및 3' 핵산 작제물이 광절단가능한 링커 또는 제한 효소 부위를 추가로 포함하는, 방법.
  13. 청구항 4 내지 11 중 어느 한 항에 있어서, 각각의 5' 핵산 작제물이 광절단가능한 링커를 추가로 포함하고, 각각의 3' 핵산 작제물이 제한 효소 부위를 추가로 포함하는, 방법.
  14. 청구항 4 내지 11 중 어느 한 항에 있어서, 각각의 5' 핵산 작제물이 제한 효소 부위를 추가로 포함하고, 각각의 3' 핵산 작제물이 광절단가능한 링커를 추가로 포함하는, 방법.
  15. 청구항 13 또는 14에 있어서, 상기 방법이 상기 반응 혼합물을 제한 효소와 접촉시키는 단계 및 상기 반응 혼합물을 자외선에 노출시켜 상기 고체 표면으로부터 상기 5' 및 3' 핵산 작제물을 방출시키는 단계를 추가로 포함하는, 방법.
  16. 청구항 12에 있어서, 상기 5' 및 3' 핵산 작제물이 제한 효소 부위를 추가로 포함하고, 상기 방법이 상기 반응 혼합물을 제한 효소와 접촉시켜 상기 고체 표면으로부터 상기 5' 및 3' 핵산 작제물을 방출시키는 단계를 추가로 포함하는, 방법.
  17. 청구항 12에 있어서, 상기 5' 및 3' 핵산 작제물이 광절단가능한 링커를 추가로 포함하고, 상기 방법이 상기 반응 혼합물을 자외선에 노출시켜 상기 고체 표면으로부터 상기 5' 및 3' 핵산 작제물을 방출시키는 단계를 추가로 포함하는, 방법.
  18. 청구항 4 내지 17 중 어느 한 항에 있어서, 상기 5' 핵산 작제물이 프로모터를 포함하는 이본쇄 핵산 작제물이고, 상기 5' 핵산 작제물이 상기 5' 핵산 작제물의 다수의 카피를 생성하기 위한 주형으로서 작용하는, 방법.
  19. 청구항 1 내지 18 중 어느 한 항에 있어서, 상기 바코드의 세트가 1, 2, 3, 4, 5, 6, 7 또는 8개의 5' 핵산 작제물 및 1, 2, 3, 4, 5, 6, 7 또는 8개의 3' 핵산 작제물을 포함하는, 방법.
  20. 청구항 1 내지 19 중 어느 한 항에 있어서, 상기 핵산 샘플 중의 5' 및 3' 바코드의 조합이 상기 핵산 샘플의 기원을 동정하는, 방법.
  21. 청구항 1 내지 20 중 어느 한 항에 있어서, 상기 3' 핵산 작제물이 결합 서열을 추가로 포함하는, 방법.
  22. 청구항 21에 있어서, 상기 결합 서열이 폴리-T 서열을 포함하는, 방법.
  23. 청구항 22에 있어서, 상기 폴리-T 서열이 상기 샘플의 핵산 분자 상의 폴리-A 서열에 결합하는, 방법.
  24. 청구항 1 내지 23 중 어느 한 항에 있어서, 상기 3' 핵산 작제물 상의 바코드가 역전사에 의해 혼입되는, 방법.
  25. 청구항 24에 있어서, 상기 역전사가 상기 3' 바코드 서열을 포함하는 핵산 분자를 생성하는, 방법.
  26. 청구항 25에 있어서, 상기 역전사효소 효소가 2 내지 5개의 시스테인 잔기를 상기 샘플 중의 핵산 분자의 말단에 첨가하는, 방법.
  27. 청구항 26에 있어서, 상기 2 내지 5개의 시스테인 잔기가 상기 5' 핵산 작제물 상의 결합 서열에 대해 상보성인 결합 서열을 제공하는, 방법.
  28. 청구항 27에 있어서, 상기 5' 핵산 작제물 상의 결합 서열이 폴리-G 서열을 포함하는, 방법.
  29. 청구항 28에 있어서, 상기 5' 핵산 작제물 상의 결합 서열이 상기 샘플의 핵산 분자 상의 폴리-C 서열에 결합하는, 방법.
  30. 청구항 1 내지 29 중 어느 한 항에 있어서, 상기 5' 핵산 작제물이 역전사효소 효소를 사용하여 상기 핵산 샘플로 혼입되는, 방법.
  31. 청구항 24 내지 30 중 어느 한 항에 있어서, 상기 역전사효소가 M-MLV 효소인, 방법.
  32. 청구항 31에 있어서, 상기 역전사효소가 MMLV H-역전사효소인, 방법.
  33. 청구항 1 내지 32 중 어느 한 항에 있어서, 상기 핵산 샘플이 추가로 증폭되어 각 서열이 5' 바코드 및 3' 바코드를 포함하는 다수의 핵산 서열의 다수의 카피를 생성하는, 방법.
  34. 청구항 1 내지 33 중 어느 한 항에 있어서, 상기 핵산 분자가 mRNA를 포함하는, 방법.
  35. 청구항 34에 있어서, 상기 mRNA가 적어도 1, 3, 10, 30, 100, 300, 1,000, 3,000, 10,000, 30,000, 100,000, 300,000 또는 1,000,000개의 mRNA를 포함하는, 방법.
  36. 청구항 1 내지 35 중 어느 한 항에 있어서, 상기 핵산 샘플 중의 바코드가 서열분석에 의해 동정되는, 방법.
  37. 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 바코드의 세트가 각 작제물이 고유한 5' 바코드를 포함하는 적어도 2개의 5' 핵산 작제물을 포함하는, 방법.
  38. 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 바코드의 세트가 각 작제물이 고유한 3' 바코드를 포함하는 적어도 2개의 3' 핵산 작제물을 포함하는, 방법.
  39. 청구항 1에 있어서, 상기 하나 이상의 핵산 분자가 둘 이상의 고유한 바코드를 포함하는, 방법.
  40. 청구항 39에 있어서, 상기 고유한 바코드가 상기 핵산 분자의 5' 말단, 3' 말단 또는 5' 말단 및 3' 말단 둘 다에 위치되는, 방법.
  41. 청구항 1 내지 40 중 어느 한 항에 있어서, 상기 방법이 복수의 반응 혼합물을 형성하는 단계를 포함하는, 방법.
  42. 청구항 41에 있어서, 둘 이상의 고유한 바코드가 상기 반응 혼합물의 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%에 존재하는, 방법.
  43. 청구항 41에 있어서, 상기 복수의 반응 혼합물을 형성하는 단계가 상기 바코드의 세트를 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 2.0, 3.0, 4.0 또는 5.0보다 큰 람다에서 상기 복수의 반응 혼합물에 첨가하는 단계를 포함하는, 방법.
  44. 청구항 1 내지 40 중 어느 한 항에 있어서, 상기 반응 혼합물이 액적인, 방법.
  45. 핵산 샘플의 기원을 동정하는 방법으로서,
    (a) 각 작제물이 고유한 3' 바코드 서열, 결합 서열 및 바코드 연관 서열을 포함하는 3' 핵산 작제물의 세트를 제공하는 단계;
    (b) 단일 세포로부터의 핵산 분자를 포함하는 핵산 샘플을 제공하는 단계;
    (c) 상기 핵산 샘플을 상기 3' 핵산 작제물의 세트와 접촉시키는 단계;
    (d) 상기 3' 바코드 서열 및 결합 서열을 상기 바코드 연관 서열로부터 분리하는 단계;
    (e) 상기 핵산 분자에 상기 3' 핵산 작제물로부터의 3' 바코드 서열을 혼입하는 단계; 및
    (f) 상기 3' 바코드 서열의 세트를 상기 바코드 연관 서열을 사용하여 동정함으로써 상기 단일 세포로부터의 핵산 샘플의 기원을 동정하는 단계를 포함하는, 방법.
  46. 청구항 45에 있어서, 상기 3' 핵산 작제물의 세트가 2, 3, 4, 5, 6, 7 또는 8개의 3' 핵산 작제물을 포함하는, 방법.
  47. 청구항 45 또는 46에 있어서, 상기 3' 핵산 작제물이 고유한 분자 동정자(UMI) 서열을 추가로 포함하는, 방법.
  48. 청구항 45 내지 47 중 어느 한 항에 있어서, 상기 3' 핵산 작제물이 헤어핀을 형성할 수 있는, 방법.
  49. 청구항 45 내지 48 중 어느 한 항에 있어서, 상기 3' 바코드 서열 및 결합 서열이 제한 효소 서열 또는 광절단가능한 링커에 의해 상기 바코드 연관 세그먼트로부터 분리되는, 방법.
  50. 청구항 45 내지 49 중 어느 한 항에 있어서, 상기 3' 핵산 작제물의 복수의 카피가 고체 표면에 부착되는, 방법.
  51. 청구항 50에 있어서, 상기 고체 표면이 비드, 마이크로비드, 미세입자, 미소구, 나노입자, 나노비드 또는 하이드로겔인, 방법.
  52. 청구항 51에 있어서, 제한 효소가 상기 고체 표면으로부터 상기 3' 바코드 서열을 방출하고, 상기 결합 서열을 상기 바코드 연관 세그먼트로부터 분리하는, 방법.
  53. 청구항 51에 있어서, 자외선이 상기 고체 표면으로부터 상기 3' 바코드 서열을 방출하고, 상기 결합 서열을 상기 바코드 연관 세그먼트로부터 분리하는, 방법.
  54. 청구항 45 내지 53 중 어느 한 항에 있어서, 상기 3' 핵산 작제물 상의 결합 서열이 폴리-T 서열을 포함하는, 방법.
  55. 청구항 54에 있어서, 상기 3' 핵산 작제물의 결합 서열이 상기 샘플의 핵산 분자 상의 폴리-A 서열에 결합하는, 방법.
  56. 청구항 45 내지 55 중 어느 한 항에 있어서, 상기 3' 핵산 작제물 상의 바코드 서열이 역전사에 의해 혼입되는, 방법.
  57. 청구항 56에 있어서, 상기 역전사가 상기 3' 바코드 서열을 포함하는 핵산 분자를 생성하는, 방법.
  58. 청구항 45 내지 57 중 어느 한 항에 있어서, 상기 바코드 연관 세그먼트가 프라이밍 서열을 포함하는, 방법.
  59. 청구항 58에 있어서, 상기 프라이밍 서열이 회문성 서열인, 방법.
  60. 청구항 58에 있어서, 상기 하나의 바코드 연관 세그먼트의 프라이밍 서열이 상기 핵산 샘플 중 임의의 다른 바코드 연관 세그먼트의 프라이밍 서열을 결합시킬 수 있는, 방법.
  61. 청구항 59에 있어서, 서로 접촉되는 상기 바코드 연관 세그먼트가 DNA 폴리머라제에 의해 연장되어 두 바코드 연관 세그먼트를 단일 핵산으로 혼입하는, 방법.
  62. 청구항 45 내지 61 중 어느 한 항에 있어서, 상기 방법이 상기 핵산 분자에 혼입된 상기 바코드 서열을 동정하는 단계를 추가로 포함하는, 방법.
  63. 청구항 62에 있어서, 상기 핵산 샘플 중의 바코드 서열이 서열분석에 의해 동정되는, 방법.
  64. 청구항 62에 있어서, 상기 바코드 연관 세그먼트가 서열분석에 의해 동정되는, 방법.
KR1020187015881A 2015-11-04 2016-11-04 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트 KR20180097536A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562250900P 2015-11-04 2015-11-04
US62/250,900 2015-11-04
PCT/US2016/060576 WO2017079593A1 (en) 2015-11-04 2016-11-04 Combinatorial sets of nucleic acid barcodes for analysis of nucleic acids associated with single cells

Publications (1)

Publication Number Publication Date
KR20180097536A true KR20180097536A (ko) 2018-08-31

Family

ID=57396822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187015881A KR20180097536A (ko) 2015-11-04 2016-11-04 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트

Country Status (9)

Country Link
US (2) US11098304B2 (ko)
EP (1) EP3371309B1 (ko)
JP (1) JP7064439B2 (ko)
KR (1) KR20180097536A (ko)
CN (1) CN108473984A (ko)
AU (1) AU2016348439B2 (ko)
CA (1) CA3004310A1 (ko)
SG (1) SG11201803646YA (ko)
WO (1) WO2017079593A1 (ko)

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
JP6375230B2 (ja) 2012-02-27 2018-08-15 セルラー リサーチ, インコーポレイテッド 分子計数のための組成物およびキット
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10584381B2 (en) 2012-08-14 2020-03-10 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
CA2881685C (en) 2012-08-14 2023-12-05 10X Genomics, Inc. Microcapsule compositions and methods
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10829816B2 (en) 2012-11-19 2020-11-10 Apton Biosystems, Inc. Methods of analyte detection
WO2014078855A1 (en) 2012-11-19 2014-05-22 Apton Biosystems, Inc. Digital analysis of molecular analytes using single molecule detection
WO2014093676A1 (en) 2012-12-14 2014-06-19 10X Technologies, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
KR102190198B1 (ko) 2013-02-08 2020-12-14 10엑스 제노믹스, 인크. 폴리뉴클레오티드 바코드 생성
KR20230074639A (ko) 2013-08-28 2023-05-30 벡톤 디킨슨 앤드 컴퍼니 대량의 동시 단일 세포 분석
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
JP6838969B2 (ja) 2014-06-26 2021-03-03 10エックス ジェノミクス, インコーポレイテッド 個々の細胞または細胞集団由来の核酸の分析方法
WO2016114970A1 (en) 2015-01-12 2016-07-21 10X Genomics, Inc. Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
EP4286516A3 (en) 2015-02-24 2024-03-06 10X Genomics, Inc. Partition processing methods and systems
CN107208158B (zh) 2015-02-27 2022-01-28 贝克顿迪金森公司 空间上可寻址的分子条形编码
EP4180535A1 (en) 2015-03-30 2023-05-17 Becton, Dickinson and Company Methods and compositions for combinatorial barcoding
WO2016172373A1 (en) 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
EP3347467B1 (en) 2015-09-11 2021-06-23 The General Hospital Corporation Full interrogation of nuclease dsbs and sequencing (find-seq)
JP6940484B2 (ja) 2015-09-11 2021-09-29 セルラー リサーチ, インコーポレイテッド ライブラリー正規化のための方法および組成物
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
KR102638006B1 (ko) 2016-09-26 2024-02-20 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
WO2018140966A1 (en) 2017-01-30 2018-08-02 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
EP3577232A1 (en) 2017-02-01 2019-12-11 Cellular Research, Inc. Selective amplification using blocking oligonucleotides
WO2018170518A1 (en) 2017-03-17 2018-09-20 Apton Biosystems, Inc. Sequencing and high resolution imaging
CA3064709A1 (en) * 2017-05-23 2018-11-29 President And Fellows Of Harvard College Multiplex end-tagging amplification of nucleic acids
CN116064732A (zh) 2017-05-26 2023-05-05 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
US10844372B2 (en) 2017-05-26 2020-11-24 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
KR102438495B1 (ko) 2017-06-05 2022-09-01 백톤 디킨슨 앤드 컴퍼니 단일 세포를 위한 샘플 인덱싱
WO2019040650A1 (en) 2017-08-23 2019-02-28 The General Hospital Corporation GENETICALLY MODIFIED CRISPR-CAS9 NUCLEASES HAVING MODIFIED PAM SPECIFICITY
US20200217850A1 (en) * 2017-09-15 2020-07-09 Apton Biosystems, Inc. Heterogeneous single cell profiling using molecular barcoding
WO2019075197A1 (en) 2017-10-11 2019-04-18 The General Hospital Corporation METHODS OF DETECTION OF INDIVIDUAL SITE-SPECIFIC PARASITE GENOMIC DEAMINATION BY BASE EDITING TECHNOLOGIES
WO2019099751A1 (en) 2017-11-15 2019-05-23 10X Genomics, Inc. Functionalized gel beads
SG11201906717SA (en) * 2017-11-17 2019-08-27 10X Genomics Inc Methods and systems for associating physical and genetic properties of biological particles
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11946095B2 (en) 2017-12-19 2024-04-02 Becton, Dickinson And Company Particles associated with oligonucleotides
WO2019191321A1 (en) * 2018-03-28 2019-10-03 10X Genomics, Inc. Nucleic acid enrichment within partitions
CN112262218A (zh) 2018-04-06 2021-01-22 10X基因组学有限公司 用于单细胞处理中的质量控制的***和方法
US11466313B2 (en) 2018-04-13 2022-10-11 The Board Of Trustees Of The Leland Stanford Junior University Nucleic acid quantification using concentration-specific barcodes
JP7460539B2 (ja) 2018-04-17 2024-04-02 ザ ジェネラル ホスピタル コーポレイション 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ
WO2019213237A1 (en) 2018-05-03 2019-11-07 Becton, Dickinson And Company Molecular barcoding on opposite transcript ends
EP3788171B1 (en) 2018-05-03 2023-04-05 Becton, Dickinson and Company High throughput multiomics sample analysis
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
JP2021531750A (ja) * 2018-07-12 2021-11-25 ボード オブ リージェンツ, ザ ユニバーシティ オブ テキサス システムBoard Of Regents, The University Of Texas System オリゴヌクレオチドによる分子近傍検出
WO2020046833A1 (en) * 2018-08-28 2020-03-05 Cellular Research, Inc. Sample multiplexing using carbohydrate-binding and membrane-permeable reagents
JP2022502029A (ja) * 2018-09-24 2022-01-11 ブリストル−マイヤーズ スクイブ カンパニーBristol−Myers Squibb Company バーコード化ペプチド−mhc複合体およびその使用
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
WO2020097315A1 (en) 2018-11-08 2020-05-14 Cellular Research, Inc. Whole transcriptome analysis of single cells using random priming
US11492660B2 (en) 2018-12-13 2022-11-08 Becton, Dickinson And Company Selective extension in single cell whole transcriptome analysis
UY38538A (es) * 2019-01-07 2020-06-30 Pivot Bio Inc Ensayos de colonización de plantas con códigos de barras microbianos naturales
WO2020154247A1 (en) 2019-01-23 2020-07-30 Cellular Research, Inc. Oligonucleotides associated with antibodies
EP3938537A1 (en) 2019-03-11 2022-01-19 10X Genomics, Inc. Systems and methods for processing optically tagged beads
WO2020214642A1 (en) 2019-04-19 2020-10-22 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
EP3980536A4 (en) * 2019-06-07 2023-11-15 Bio-Rad Laboratories, Inc. DISSOLUTION OF SEVERAL BEADS PER DROP
CN114051534A (zh) 2019-07-22 2022-02-15 贝克顿迪金森公司 单细胞染色质免疫沉淀测序测定
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
WO2021128036A1 (zh) * 2019-12-25 2021-07-01 苏州绘真生物科技有限公司 用于构建人单细胞tcr测序文库的试剂盒及其应用
EP4090763A1 (en) 2020-01-13 2022-11-23 Becton Dickinson and Company Methods and compositions for quantitation of proteins and rna
CN115698284A (zh) * 2020-01-13 2023-02-03 福路伦特生物科学公司 模板乳化期间的逆转录
CN115516109A (zh) * 2020-02-17 2022-12-23 通用测序技术公司 条码化核酸用于检测和测序的方法
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
WO2021241721A1 (ja) * 2020-05-29 2021-12-02 国立研究開発法人理化学研究所 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
CN116635533A (zh) 2020-11-20 2023-08-22 贝克顿迪金森公司 高表达的蛋白和低表达的蛋白的谱分析
WO2023048300A1 (ja) * 2021-09-27 2023-03-30 国立大学法人東京大学 細胞標識分子及び細胞の分析方法
GB202211182D0 (en) * 2022-08-01 2022-09-14 Univ Oxford Innovation Ltd Bead-hashing

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5643722A (en) 1994-05-11 1997-07-01 Trustees Of Boston University Methods for the detection and isolation of proteins
US5962271A (en) 1996-01-03 1999-10-05 Cloutech Laboratories, Inc. Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end
DE60211857T2 (de) 2001-02-23 2006-12-21 Japan Science And Technology Agency, Kawaguchi Verfahren zur herstellung einer emulsion und vorrichtung dafür
US20030175749A1 (en) 2001-12-08 2003-09-18 Jong-Yoon Chun Annealing control primer and its uses
CA2560272C (en) 2004-03-23 2012-05-08 Japan Science And Technology Agency Method and apparatus for producing microdroplets
DK1924704T3 (da) 2005-08-02 2011-09-05 Rubicon Genomics Inc Sammensætninger og fremgangsmåder til bearbejdning og mangfoldiggørelse af DNA, herunder ved anvendelse af flere enzymer i en enkelt reaktion
WO2008157696A2 (en) * 2007-06-19 2008-12-24 Stratos Genomics Inc. High throughput nucleic acid sequencing by expansion
US9249457B2 (en) 2008-06-18 2016-02-02 Riken Method of manufacturing a mixture of amplified double-stranded nucleic acids comprising unknown sequence
EP3495498B1 (en) 2009-03-30 2021-10-27 Illumina, Inc. Gene expression analysis in single cells
US8691509B2 (en) * 2009-04-02 2014-04-08 Fluidigm Corporation Multi-primer amplification method for barcoding of target nucleic acids
CN101864477A (zh) * 2009-04-15 2010-10-20 上海聚类生物科技有限公司 一种利用高通量测序单通道复用技术进行microRNA表达谱测定的方法
US9080210B2 (en) 2010-06-09 2015-07-14 Keygene N.V. High throughput screening using combinatorial sequence barcodes
US9902950B2 (en) 2010-10-08 2018-02-27 President And Fellows Of Harvard College High-throughput single cell barcoding
WO2012083225A2 (en) * 2010-12-16 2012-06-21 Gigagen, Inc. System and methods for massively parallel analysis of nycleic acids in single cells
SI2702146T1 (sl) * 2011-04-28 2019-06-28 The Board Of Trustees Of The Leland Stanford Junior University Identifikacija polinukleotidov, povezanih z vzorcem
SG194745A1 (en) * 2011-05-20 2013-12-30 Fluidigm Corp Nucleic acid encoding reactions
IN2014MN00974A (ko) * 2011-12-16 2015-04-24 Targetgene Biotechnologies Ltd
AU2013214771B2 (en) * 2012-02-01 2017-09-07 Synthetic Genomics, Inc. Materials and methods for the synthesis of error-minimized nucleic acid molecules
CA2869481A1 (en) * 2012-04-13 2013-10-17 Sequenta, Inc. Detection and quantitation of sample contamination in immune repertoire analysis
AU2013293240A1 (en) * 2012-07-24 2015-03-05 Adaptive Biotechnologies Corp. Single cell analysis using sequence tags
EP2912197B1 (en) 2012-10-24 2019-08-07 Takara Bio USA, Inc. Template switch-based methods for producing a product nucleic acid
WO2014071361A1 (en) * 2012-11-05 2014-05-08 Rubicon Genomics Barcoding nucleic acids
EP2971105B1 (en) * 2013-03-15 2018-08-01 Adaptive Biotechnologies Corporation Method of identifying adaptive immune receptor pairs
US10119134B2 (en) * 2013-03-15 2018-11-06 Abvitro Llc Single cell bar-coding for antibody discovery
WO2014201273A1 (en) * 2013-06-12 2014-12-18 The Broad Institute, Inc. High-throughput rna-seq
KR102212234B1 (ko) * 2013-06-27 2021-02-05 10엑스 제노믹스, 인크. 샘플 처리를 위한 조성물 및 방법
US9708657B2 (en) * 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
JP6336080B2 (ja) 2013-08-23 2018-06-06 ルードヴィッヒ インスティテュート フォー キャンサー リサーチLudwig Institute For Cancer Research 鋳型切り替え反応を用いるcDNA合成および単一細胞トランスクリプトームプロファイリングのための方法および組成物
KR20230074639A (ko) * 2013-08-28 2023-05-30 벡톤 디킨슨 앤드 컴퍼니 대량의 동시 단일 세포 분석
US10941397B2 (en) 2013-10-17 2021-03-09 Takara Bio Usa, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
US9719136B2 (en) 2013-12-17 2017-08-01 Takara Bio Usa, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
PL3089822T3 (pl) * 2013-12-30 2022-09-19 Atreca, Inc. Analiza kwasów nukleinowych powiązanych z pojedynczymi komórkami z użyciem kodów kreskowych kwasów nukleinowych
LT3134536T (lt) * 2014-04-21 2020-05-11 President And Fellows Of Harvard College Sistemos ir būdai, skirti nukleorūgščių brūkšniniam kodavimui
EA035092B1 (ru) 2014-05-14 2020-04-27 Барбара Бурвинкель Синтез двухцепочечных нуклеиновых кислот
JP6838969B2 (ja) * 2014-06-26 2021-03-03 10エックス ジェノミクス, インコーポレイテッド 個々の細胞または細胞集団由来の核酸の分析方法
ES2727656T3 (es) 2014-09-15 2019-10-17 Abvitro Llc Secuenciación de alto rendimiento de banco de nucleótidos
CN107250445A (zh) * 2015-02-27 2017-10-13 富鲁达公司 用于高通量研究的单个细胞核酸
EP4180535A1 (en) 2015-03-30 2023-05-17 Becton, Dickinson and Company Methods and compositions for combinatorial barcoding
WO2016172373A1 (en) * 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification

Also Published As

Publication number Publication date
US20210380974A1 (en) 2021-12-09
JP2018538006A (ja) 2018-12-27
AU2016348439B2 (en) 2023-03-09
EP3371309A1 (en) 2018-09-12
SG11201803646YA (en) 2018-05-30
EP3371309B1 (en) 2023-07-05
CN108473984A (zh) 2018-08-31
US11098304B2 (en) 2021-08-24
WO2017079593A1 (en) 2017-05-11
US20180320171A1 (en) 2018-11-08
CA3004310A1 (en) 2017-05-11
AU2016348439A1 (en) 2018-05-10
JP7064439B2 (ja) 2022-05-10

Similar Documents

Publication Publication Date Title
KR20180097536A (ko) 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트
US11161087B2 (en) Methods and compositions for tagging and analyzing samples
US11021749B2 (en) Methods and systems for processing polynucleotides
US20230087127A1 (en) Methods and systems for processing polynucleotides
US10760124B2 (en) Methods and systems for processing polynucleotides
US20190136316A1 (en) Methods and systems for processing polynucleotides
US20180346979A1 (en) Methods and systems for processing polynucleotides
WO2021168015A1 (en) Methods of barcoding nucleic acid for detection and sequencing
EP3980537A2 (en) Methods of barcoding nucleic acid for detection and sequencing
US20150133310A1 (en) Nucleic acid sequencing systems and methods
US20220098659A1 (en) Methods and systems for processing polynucleotides
WO2022256612A1 (en) Compositions, methods, and systems for single cell barcoding and sequencing
EP4351788A1 (en) Compositions, methods, and systems for single cell barcoding and sequencing
WO2024050331A2 (en) Methods of barcoding nucleic acids for detection and sequencing

Legal Events

Date Code Title Description
E902 Notification of reason for refusal