KR102683229B1 - 고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템 - Google Patents

고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템 Download PDF

Info

Publication number
KR102683229B1
KR102683229B1 KR1020207001760A KR20207001760A KR102683229B1 KR 102683229 B1 KR102683229 B1 KR 102683229B1 KR 1020207001760 A KR1020207001760 A KR 1020207001760A KR 20207001760 A KR20207001760 A KR 20207001760A KR 102683229 B1 KR102683229 B1 KR 102683229B1
Authority
KR
South Korea
Prior art keywords
sequencing
region
umi
target
molecules
Prior art date
Application number
KR1020207001760A
Other languages
English (en)
Other versions
KR20200059208A (ko
Inventor
재커리 압테
제시카 리치맨
다니엘 알모나시드
후안 히메네즈
로드리고 오티즈
에두아르도 모랄레스
파울로 코바루비아스
에두아르도 올리바레스
니콜라스 오르데네스
루이스 레온
Original Assignee
소마젠 인크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소마젠 인크 filed Critical 소마젠 인크
Publication of KR20200059208A publication Critical patent/KR20200059208A/ko
Application granted granted Critical
Publication of KR102683229B1 publication Critical patent/KR102683229B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

미생물과 관련된 시퀀싱(서열 분석)을 위한 방법(100) 및/또는 시스템(200)의 구현 또는 라이브러리 제조는 하기를 포함할 수 있다: 하나 이상의 표적과 관련된 고유 분자 식별자(UMI)-기반 분자 세트를 준비하는 단계; 시퀀싱-기반 프라이머 세트를 준비하는 단계; UMI-기반 분자 세트 및 하나 이상의 표적과 관련된 하나 이상의 샘플에 기초하여 태그된 표적 분자 세트를 생성하는 단계; 및/또는 태그된 표적 분자 및 시퀀싱-기반 프라이머 세트에 기초하여 시퀀싱-준비된 태그된 표적 분자 세트를 생성하는 단계.

Description

고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템
본 출원은 2017년 6월 20일에 출원된 미국 가출원 번호 62/522,293 및 2017년 11월 6일에 출원된 미국 가출원 번호 62/582,162에 대한 우선권을 주장하며, 이들은 각각 전체적으로 본 명세서에 편입된다.
본 발명은 개괄적으로 게놈 및 분자 생물학에 관한 것이다.
차세대 시퀀싱(NGS) 기술(예를 들어, NGS 플랫폼)은 DNA 및/또는 다른 핵산 시퀀싱의 비용을 감소시키고, 획득된 정보의 품질을 개선하고, 및/또는 시퀀싱 프로세스의 확장성을 향상시킬 수 있다. NGS 기술은 정밀한 표적 DNA 서열 및/또는 다른 적합한 서열의 검출 및 판독을 허용할 수 있는 높은 심도의 분석으로 소량에서 다수의 DNA 및/또는 다른 핵산 샘플의 서열 분석을 용이하게 할 수 있다. 상이한 핵산(예를 들어, 상이한 DNA 핵산 등)의 혼합물을 동시에 분석할 수 있으며, 이는 복잡한 혼합물(예를 들어, 미생물 등을 포함하는 복잡한 생태 공동체로부터 추출된 DNA 및/또는 다른 핵산) 및/또는 보존 서열의 풀(pool)로부터 희귀 DNA 서열 변이체(예를 들어, 큰 조직의 작은 세포 내 희귀 돌연변이의 발생 등) 조성의 분석을 촉진할 수 있다. 그러나, NGS 및/또는 다른 시퀀싱 접근법을 위한 시퀀싱 라이브러리의 구축은 다양한 편향(bias)(예를 들어, DNA 표적과 같은 다른 표적에 대한, 표적 사이의 비율에 대한)이 도입될 수 있는 라이브러리 제조 공정(예를 들어, DNA 조작, 증폭 등)을 포함 할 수 있다. 추가적으로, 시퀀싱된 리드(reads)의 수는 라이브러리 또는 원래 혼합물 내에 존재하는 핵산 분자(예를 들어, DNA 분자)의 직접적인 비율을 반드시 나타내지 않을 수 있으며, 이는 절대 정량적 데이터(예를 들어, 정확한 수 또는 분석된 원래의 생물학적 샘플의 조성 추정 등)를 도출하는데 어려움이 나타날 수 있다.
또한, NGS 기술 및/또는 다른 적합한 시퀀싱 기술은 앰플리콘(amplicon)-관련 시퀀싱(예를 들어, 생물학적 샘플 내의 하나 이상의 미생물 분류군의 확인과 같은, 단일 또는 소수의 유전자 영역과 관련된 분석을 위해) 또는 메타게놈-관련 시퀀싱 (예를 들어, 단일 유전자 앰플리콘의 분석과 대조적으로 DNA의 전체 커뮤니티를 포함하는 것과 같은 생물학적 샘플의 미생물 커뮤니티 및/또는 다른 적절한 생태 커뮤니티와 관련된 분석 등)에 사용될 수 있다. 그러나, 앰플리콘-관련 시퀀싱 또는 메타게놈-관련 시퀀싱은 각각 고유의 장점 및 단점을 포함한다
그러나, 앰플리콘-관련 시퀀싱 또는 메타게놈-관련 시퀀싱은 각각 고유의 장점 및 단점을 포함한다.
일 예에서, 본 발명의 방법(100) 및/또는 시스템(200)은 종래의 접근법들에 비하여 개선을 제공할 수 있다. 상기 방법(100) 및/또는 시스템(200)의 특정 예는 적어도 종래의 접근법과 관련된 도전에 대한 기술적-기반의 해결책을 부여할 수 있다.
일 예에서, 상기 기술은 개체(예를 들어 생물학적 샘플, 핵산 표적, 프라이머, UMI-기반 분자, 사용자 등의 표적)를 다른 상태 또는 사물로 변환할 수 있다. 특정 예에서, 핵산 표적은 개선된 시퀀싱(예를 들어, 감소된 편향, 개선된 정량화와 같은 개선된 분석 관련 등) 등에 적합하도록, 시퀀싱-준비된 표적 분자 및/또는 시퀀싱-준비된 태그된 표적 분자로 변환될 수 있다. 특정 예에서, 개선된 시퀀싱 라이브러리가 제조될 수 있으며, 예를 들어 하나 이상의 미생물-관련 컨디션과 관련된 개선된 진단 및/또는 요법을 촉진하여 하나 이상의 사용자를 변형시키는 것과 같은, 개선된 마이크로바이옴 특성화를 유도할 수 있다. 그러나, 실시예에서, 상기 기술은 임의의 적절한 방식으로 실체를 변환할 수 있다.
도 1은 방법의 일 구현예의 변형의 흐름도를 포함하고;
도 2는 방법의 일 구현예의 변형의 흐름도를 포함하고;
도 3은 방법의 일 구현예의 변형의 흐름도를 포함하고;
도 4는 방법의 일 구현예의 변형의 흐름도를 포함하고;
도 5는 방법의 일 구현예의 변형의 흐름도를 포함하고;
도 6은 클래식(고전적인) 시퀀싱 프라이머 또는 4N UMI 영역을 포함하는 UMI-기반 프라이머와 조합된 16S 시퀀싱 라이브러리에 대해 할당된 리드 비교의 특정 구현예를 포함한다;
도 7은 4N UMI 영역 또는 8N UMI 영역을 포함하는 UMI-기반 프라이머로 조립 된 16S 시퀀싱 라이브러리에 대한 할당 된 리드 비교의 특정 구현예를 포함한다.
도 8은 8N UMI 영역을 포함하는 UMI-기반 프라이머를 사용하는 PCR 공정을 위해 태깅 촉진 분자를 첨가함으로써 표적 증폭을 개선하는 특정 구현예를 포함한다;
도 9a 내지 9b는 4N UMI 영역, 8N UMI 영역 및 태깅 촉진 분자(tagging facilitation molecules)를 사용할 때 샘플 당 할당된 UMI의 총 수 비교의 특정 구현예를 포함한다;
도 10a-10b는 4N UMI 영역, 5N UMI 영역 및 태깅 촉진 분자를 사용할 때 샘플 당 할당된 시퀀싱 리드의 총 수 비교의 특정 구현예를 포함한다;
도 11a-11b는 4N UMI 영역, 8N UMI 영역 및 태깅 촉진 분자를 사용할 때 샘플 당 할당된 고유한(unique) UMIs의 백분율 비교의 특정 구현예를 포함한다;
도 12는 8N UMI 영역을 포함하는 UMI-기반 프라이머로 16S 증폭을 위한 링커 영역의 효과의 특정 구현예를 포함한다.
이하의 구현예에 대한 설명은 본 발명을 이들 구현예로 제한하려는 것이 아니라, 당업자가 만들고 사용할 수 있도록 하기 위한 것이다.
1. 개요.
도 1 및 도 4에 도시된 바와 같이, 미생물에 관한 시퀀싱을 위한 라이브러리 준비(예를 들어, 차세대 시퀀싱(NGS) 등)를 위한 방법(100)의 구현예는: 하나 이상의 표적(예를 들어, 핵산 표적 세트; 미생물과 관련된 표적; 등)과 관련된 고유 분자 식별자(UMI)-기반 분자 세트(예를 들어, UMI-기반 프라이머, 등)를 준비하는 단계(예를 들어, 결정(determining), 생성(generating) 등) S110; 시퀀싱-기반 프라이머 세트를 준비하는 단계(예를 들어, 미생물과 관련된 차세대 시퀀싱과 같은 시퀀싱을 용이하게 하도록 맞추어짐) S120; UMI-기반 분자 세트 및 하나 이상의 표적과 관련된 하나 이상의 생물학적 샘플(예를 들어, 적어도 하나의 생물학적 샘플)에 기초하여 태그된 표적 분자 세트를 생성하는 단계(예를 들어, 하나 이상의 핵산 표적과 관련된 핵산을 포함하는 하나 이상의 생물학적 샘플; 등) S130; 및/또는 태그된 표적 분자 및 시퀀싱-기반 프라이머 세트에 기초하여 시퀀싱-준비된 태그된 표적 분자 세트(예를 들어, NGS-준비된 태그된 표적 분자; 등)를 생성하는 단계를 포함할 수 있다.
특정 구현예에서, 상기 방법(100)(예를 들어, 미생물과 관련된 NGS를 위한 등)은 핵산 표적 세트(예를 들어, 핵산 표적 세트의 하나 이상의 핵산 표적의 서열에 상보적인 서열의 유전자를 포함하는 UMI-기반 프라이머; 등)와 관련된 UMI-기반 프라이머 세트를 준비하는 단계를 포함할 수 있고, 여기서 상기 UMI-기반 프라이머 세트의 각각의 UMI-기반 프라이머는 "N" 염기가 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택되는, 랜덤 "N" 염기 세트를 포함하는 UMI 영역; 핵산 표적 세트의 적어도 하나의 핵산 표적과 관련된 표적-관련 영역(예를 들어, 적어도 하나의 핵산 표적의 서열에 상보적인 유전자 서열을 포함하는 표적-관련 영역 등); 링커 영역 (예를 들어, UMI 영역과 타겟-관련 영역 사이에 위치된; 등); 및/또는 어댑터 영역(예를 들어, 시퀀싱-준비된 분자를 제조하기 위한 후속 공정을 촉진하도록 구성된 외부 어댑터 영역을 포함하는 등)을 포함하며; 시퀀싱-기반 프라이머 세트의 시퀀싱-기반 프라이머 각각은 NGS(예를 들어, 하나 이상의 NGS 기술로 NGS를 촉진(facilitate, 용이하게)하도록 구성된 시퀀싱 어댑터를 포함하는 어댑터 영역, 및/또는 UMI-기반 프라이머 어댑터 영역의 외부 어댑터 영역과 관련된 외부 어댑터 영역을 포함하는; 등)와 관련된 어댑터 영역(예를 들어, UMI-기반 프라이머의 어댑터 영역과 구별되거나, 유사하거나 또는 동일한) 및/또는 인덱스 영역(예를 들어, 다중화(multiplexing) 촉진을 위한; 상이한 샘플의 조합 태깅(combinatorial tagging)을 촉진하기 위한 등의 시퀀싱 인덱스 영역)을 포함하는 시퀀싱-기반 프라이머 세트 제조 단계; UMI-기반 프라이머 세트 및 핵산 표적 세트와 관련된 적어도 하나의 생물학적 샘플을 이용한 제1 증폭 공정(예를 들어, 제 1 폴리머라제 연쇄 반응 (PCR) 프로세스 등)에 기초하여 태그된 표적 분자 세트를 생성하는 단계; 및 태그된 표적 분자 및 시퀀싱-기반 프라이머 세트를 이용한 제2 증폭 공정(예를 들어, 제2 PCR 공정 등)에 기초하여 NGS-준비된 태그된 표적 분자 세트를 생성하는 단계를 포함한다.
추가적으로 또는 대안적으로, 도 2, 3 및 5에 도시된 바와 같이, 방법(100)의 구현예는 미생물과 관련된 앰플리콘-관련 시퀀싱 및 메타게놈-관련된 시퀀싱과 관련된 조합 시퀀싱 라이브러리(combined sequencing library)를 준비하는 단계 S150를 포함할 수 있다. 구현예에서, 상기 방법(100)(예를 들어, 조합 시퀀싱 라이브러리를 준비하는 단계를 포함하는 방법(100)의 구현예의 일부 등)은 앰플리콘-생성 프라이머 세트(예를 들어, UMI-기반 프라이머 등) 및 미생물과 관련된 적어도 하나의 생물학적 샘플로부터의 표적 세트를 이용한 증폭 공정(예를 들어, 제1 PCR 공정; 등)에 기초한 표적-관련 앰플리콘 세트를 생성하는 단계 S152; 적어도 하나의 생물학적 샘플로부터의 전체 핵산 세트의 가공(예를 들어, mRNA를 cDNA로 형질전환; 표적-포획 공정 수행; 단편화 등)에 기초하여 미생물 군집(예를 들어, 미생물에 대해 상응하는 등)과 관련된 메타게놈-관련 단편 세트를 생성하는 단계 S154; 및/또는 표적-관련 앰플리콘 세트, 메타게놈-관련 단편 세트 및 시퀀싱-기반 프라이머 세트(예를 들어, 표적-관련 앰플리콘 및/또는 메타게놈-관련 단편을 이용한 제2 PCR 공정과 같은 제2 증폭 공정 등에 기초하여)에 기초하여 시퀀싱-준비된 표적 분자 세트를 생성하는 단계 S158를 포함할 수 있다.
추가적으로 또는 대안적으로, 방법(100)의 구현예는 하나 이상의 사용자로부터(예를 들어, 대상(subjects); 인간; 동물; 환자; 식물 등), 예를 들어 하나 이상의 소화관(gut) 부위(예를 들어 대변 샘플에 기초한 분석 등), 피부 부위, 코 부위, 입 부위, 생식기 부위 및/또는 다른 적적한 생리학적 부위를 포함할 수 있는 하나 이상의 수집 부위로부터 수집된 하나 이상의 생물학적 샘플을 처리(예를 들어, 수집; 방법(100)의 구현예의 일부를 촉진하기 위한 샘플 준비; 방법(100)의 구현예의 일부를 수행하는 등)하는 단계; 미생물 서열 데이터세트(예를 들어, 방법(100)의 구현예의 일부로부터 생성된 시퀀싱 라이브러리를 이용한 시퀀싱에 기초하여 생성된 미생물 서열 데이터세트; 서열-준비된 태그된 표적 분자의 UMI 영역과 같은 시퀀싱된(sequenced) UMI 영역과 관련된 생물 정보 분석으로부터 생성된 미생물 서열 데이터세트; 등)에 기초하여 미생물군집의 특성(예를 들어, 미생물 조성 특성; 미생물 기능 특성; 진단 및/또는 요법과 관련하여서와 같이 미생물-관련된 조건과 관련된 특성; 등)을 결정하는 단계를 포함할 수 있다. 그러나, 방법(100)의 구현예는 임의의 적절한 공정을 추가로 또는 대안적으로 포함할 수 있다.
방법(100) 및/또는 시스템(200)의 구현예는 시퀀싱 기술과 관련된 편향 (예를 들어, DNA 라이브러리 제조의 통상적인 접근법과 관련된 편향; 하나 이상의 원래 생물학적 샘플로부터의 개별 분자의 원래 비율에 영향을 주는 편향; NGS 기술과 관련된 편향; 등)를 감소, 핵산(예를 들어, DNA 분자; 하나 이상의 원래 샘플 내의 DNA 분자; 등) 및/또는 다른 적절한 성분(예를 들어, 샘플에서 정의된 카피 수의 유전자에 대해 할당된 수의 UMI에 기초한 시퀀싱 데이터의 정규화를 통해서 등)의 정량 분석(예를 들어, 절대량 분석; 분자, 대립 유전자, 유전자 변이체 및/또는 다른 성분의 절대 정량화; 등)의 개선; RNA 전사의 정규화(예를 들어, RNA에서 DNA로의 변환 후; 등)와 관련된 과정의 개선; 저주파 돌연변이의 검출 개선; 정량적 단일-세포 RNA 시퀀싱 개선; 면역 레퍼토리 세포 조성의 정량 분석 개선; 및/또는 예컨대 UMIs(예를 들어, UMI-기반 분자; UMI-기반 분자의 UMI-영역 등)를 시퀀싱 라이브러리(예를 들어, 시퀀싱될 표적 분자 및/또는 다른 적합한 분자 내로; 등)로 제조하는 단계를 개선함으로써(예를 들어, 통합(incorporation); 통합과 관련된 효율성 개선; 통합과 관련하여 다양성(versatility) 향상; 준비; 결정; 등) 시퀀싱을 위한 라이브러리 제조의 개선을 통해 시퀀싱 기술과 관련된 다른 애플리케이션의 개선 작용을 할 수 있다. 특정 실시예에서, 방법(100)은 태깅(예를 들어, UMI 영역 등) 및 표적 분자의 증폭을 위해 제1 및 제2 PCR 공정(예를 들어, 고효율 2-단계 PCR 접근법 등)를 수행하는 단계를 포함할 수 있다. 특정 실시예에서, 통합된(incorporated) UMI 영역은 복잡한 혼합물(예를 들어, 미생물 군집을 포함하는 복잡한 혼합물 등)에서 개별 표적 분자 및/또는 다른 적합한 분자(예를 들어, 메타게놈-관련 단편 등)의 추적을, NGS 기술, 컴퓨팅 시스템 및/또는 다른 적절한 구성 요소를 사용하여 UMI 영역에 대한 시퀀싱 및/또는 생물정보학(bioinformatics) 분석 수행과 같은 것을 통해, 용이하게 할 수 있다.
추가로 또는 대안적으로, 방법(100) 및/또는 시스템(200)의 구현예는, 예를 들어 앰플리콘-관련 시퀀싱 및 메타게놈-관련 시퀀싱 양자(예를 들어, 표적 유전자 및/또는 다른 표적을 포함하는 미생물 군집에서 유기체의 큰 분획(large fraction of organisms)의 분석을 가능하게 하는 것과 같은 앰플리콘-관련 시퀀싱의 장점; 미생물 군집 조성, 미생물 군집 기능, 관련 다양성(associated diversity) 및/또는 다른 적합한 특성 등 모두와 관련하여 미생물 군집의 특성화를 가능하게 하는 것과 같이, 전체 군집 DNA에 기초한 미생물 군집의 편향없는 분석을 가능하게 하는 것과 같은 메타게놈-관련 시퀀싱의 이점; 등)의 장점(예를 들어, 단점의 균형을 맞출 수 있는 점; 미생물 군집의 풍부한 미생물에 대한 분석 편향을 줄이고, 예를 들어 16S rRNA, rpoB 및/또는 다른 마커와 같은 분류학적 마커와 관련된, 표적에 대한 보존된 영역 및 상이한 분류군으로부터의 구별을 위한 가변 영역을 포함하는 프라이머 설계 등을 위한 표적의 특성화 정도에 대한 요구 조건을 감소시키는 새로운 이점을 촉진할 수 있는 점; 등)을 활용하는 것과 같이, 앰플리콘-관련 시퀀싱 및 메타게놈-관련 시퀀싱(예를 들어, 조합(combination of) 등)의 성능을 동시에(예를 들어, NGS 기술 및/또는 다른 적합한 시퀀싱 기술 등을 사용한 시퀀싱; 등을 위해) 용이하게 하기 위해, 조합된 시퀀싱 라이브러리의 준비를 가능하게 하도록 작용할 수 있다.
특정 실시예에서, 방법(100)은 조합된 앰플리콘(예를 들어, 16S, 18S, ITS 등과 같은 분류학-관련 유전자에 대한) 및 메타게놈 DNA 라이브러리(예를 들어, 항생제 유전자, 독성 유전자, 인간 유전자 마커와 같은 기능-관련 유전자의 메타게노믹 검출을 가능하게 하기 위한; 바이러스와 같은 복수의 RNA 유기체의 검출을 가능하게 하기 위한; 생물학적 샘플로부터 mRNA를 통해 숙주 및 미생물 전사된 유전자의 검출을 가능하게 하기 위한; 등)를 생성하는 단계를 포함할 수 있다. 특정 실시예에서, 방법(100)은 광범위한 표적 핵산(예를 들어, DNA) 라이브러리를 생성하는 단계를 포함할 수있다.
추가로 또는 대안적으로, 방법(100) 및/또는 시스템(200)의 구현예는 하나 이상의 생물학적 샘플 내의 유기체의 지시된 분류학적 프로파일링(및/또는 다른 적합한 조성물-관련 분석)을 위한 데이터(예를 들어, 미생물 서열 데이터 등)의 제공을 촉진하는 기능을 할 수 있을 뿐만 아니라, 또한 유기체(예를 들어, 메타게놈-관련 시퀀싱 등과 같은 메타게놈-관련 접근법을 통해)의 유전자 기능 프로파일링(및/또는 다른 적절한 기능-관련 분석)을 위한 데이터(예를 들어, 미생물 서열 데이터 등)의 제공을, 표준 또는 공지된 게놈에 기초하여 기능-관련 분석(예를 들어, 마이크로바이옴(Microbiome) 기능적 특징 결정 등)을 수행하기 위한 추가적 또는 대안적인 방식으로, 용이하게 할 수 있다.
추가적으로 또는 대안적으로, 방법(100) 및/또는 시스템(200)의 구현예는 미생물-관련 검출(예를 들어, 샘플 유기체의 분류학적 검출뿐만 아니라 동일한 샘플 내에 존재하거나 발현된 유전자의 검출; 지시된 방식으로 보존된 분류학적 유전자를 갖는 유기체의 검출 및/또는 다른 진핵 생물, 원핵 생물, 바이러스 유기체 및/또는 하나 이상의 생물학적 샘플에서 특징지어진 또는 이전에 특징지어진바 없는(non-previously characterized) DNA를 갖는 다른 적절한 미생물의 편향 없는 검출; 새로운, 미지의 및/또는 미확인된 잠재적 핵산 표적, 예를 들어 16S, 18S, ITS와 같은 특정 표적 또는 영역의 증폭 또는 임의의 다른 부위-지정(site-directed) 기반 기술의 증폭과 같은 농축 기반 프로토콜을 보완함으로써, 편향되지 않은 메타게노믹(metagenomic) 및/또는 메타트랜스크립토믹(metatranscriptomic) 시퀀싱으 검출; 항생제 내성, 독성 인자(virulence factors) 분자 마커 및 농축 기반(enrichment based) 프로토콜을 보완하는 것과 같은 다른 적절한 관심 표적과 관련된 알려진 또는 확인된 핵산 표적의, 편향없는 방식으로의 검출; 등)을 용이하게 할 수 있다. 그러나, 방법(100) 및/또는 시스템 200)의 구현예는 임의의 적절한 기능을 포함할 수 있다.
방법(100) 및/또는 시스템(200)의 구현예는 바람직하게는 NGS(예를 들어, NGS 기술)와 관련된 라이브러리 제조를 용이하게 한다. NGS는 고-처리량(high-throughput) 시퀀싱(예를 들어, 고-처리량 시퀀싱 기술을 통해 촉진; MPSS(massively parallel signature sequencing), 폴로니(Polony) 시퀀싱, 454 파이로시퀀싱, 일루미나(Illumina) 시퀀싱, SOLiD 시퀀싱, 이온 토렌트 반도체(Ion Torrent semiconductor) 시퀀싱, DNA 나노볼 시퀀싱, 헬리스코프(Heliscope) 단일 분자 시퀀싱, 단일 분자 실시간(SMRT) 시퀀싱, 나노포어(Nanopore) DNA 시퀀싱 등), 모든 세대의 시퀀싱 기술의 모든 세대 번호(generation number)(예를 들어, 2세대 시퀀싱 기술, 3세대 시퀀싱 기술, 4세대 시퀀싱 기술 등), 앰플리콘-관련 시퀀싱(예를 들어, 표적된 앰플리콘 시퀀싱), 메타게놈-관련 시퀀싱(예를 들어, 메타트랜스크립토믹(metatranscriptomic) 시퀀싱, 메타게노믹(metagenomic) 시퀀싱 등), 합성에-의한-시퀀싱(sequencing-by-synthesis), 터널링 전류(tunnelling currents) 시퀀싱, 하이브리드화(hybridization)에 의한 시퀀싱, 질량 분석 시퀀싱, 현미경-기반(microscopy-based) 기술 및/또는 임의의 적절한 NGS 기술의 하나 또는 그 이상을 포함할 수 있다.
추가적으로 또는 대안적으로, 방법(100) 및/또는 시스템(200)의 구현예는 라이브러리 제조 및/또는 임의의 적절한 시퀀싱(예를 들어, 임의의 적절한 시퀀싱 기술 등)와 관련한 다른 적절한 프로세스를 용이하게 할 수 있으며, 이는 하기의 임의의 하나 또는 그 이상을 포함할 수 있다: 모세관(capillary) 시퀀싱, Sanger 시퀀싱(예를 들어, 미세 유체 Sanger 시퀀싱 등), 파이로시퀀싱, 나노포어 시퀀싱 (옥스포드 나노포어 시퀀싱 등) 및/또는 적절한 시퀀싱 기술에 의해 촉진되는 다른 적합한 유형의 시퀀싱.
방법(100) 및/또는 시스템(200)의 구현예는 특성화(characterizations) 및/또는 질병, 증상, 원인(예를 들어, 계기(triggers) 등), 장애, 관련 위험(예를 들어, 성향 스코어 등), 관련 중증도, 행동(예를들어, 카페인 소비, 습관, 식이(diet), 등) 및/또는 미생물-관련 컨디션과 관련된 어떠한 다른 적절한 측면 중 하나 이상을 포함할 수 있는 하나 이상의 미생물-관련 컨디션(conditions)에 대한 요법(예를 들어, 시퀀싱 라이브러리의 시퀀싱으로부터 유래된 미생물 서열 데이터세트 등에 기초하여) 촉진을 위한 시퀀싱 라이브러리 제조를 개선할 수 있다. 미생물-관련 컨디션은 하나 이상의 질병-관련 컨디션을 포함할 수 있으며, 이는 하기 중 임의의 하나 또는 그 이상을 포함할 수 있다: 위장-관련 컨디션(예를 들어, 과민성 장 증후군, 염증성 장 질환, 궤양성 대장염, 셀리악 병(celiac disease), 크론 병, 블로우팅(bloating), 치질 질환, 변비, 역류(reflux), 혈변, 설사 등); 알레르기-관련 컨디션(예를 들어, 밀, 글루텐, 유제품(dairy), 콩, 땅콩, 갑각류, 각과류(tree nut), 계란 등과 관련된 알레르기 및/또는 과민증); 피부-관련 컨디션(예룰 들어, 여드름, 피부염, 습진, 장미증(rosacea), 건조 피부, 건선, 비듬, 광민감성(photosensitivity) 등); 운동(locomotor)-관련 컨디션(예를 들어, 통풍, 류마티스 관절염, 골관절염, 반응성 관절염, 다발성 경화증, 파킨슨 병 등); 암-관련 컨디션(예를 들어, 림프종; 백혈병; 아세포종; 생식세포종; 암종; 육종; 유방암; 전립선암; 기저 세포 암; 피부암; 결장암; 폐암; 임의의 적절한 생리학적 영역과 관련된 암 컨디션; 등), 심혈관-관련 컨디션(예를 들어, 관동맥성 심장병, 염증성 심장 질환, 판막 심장 질환, 비만, 뇌졸중 등), 빈혈 컨디션(예를 들어, 지중해 빈혈; 겸상 적혈구; 악성; 판코니(fanconi); 용혈성(haemolyitic); 재생불량성; 철분 결핍 등), 신경-관련 컨디션(예를 들어, ADHD, ADD, 불안, 아스퍼거 증후군, 자폐증, 만성 피로 증후군, 우울증 등), 자가면역-관련 컨디션(예를 들어, 스르푸(Sprue), AIDS, 쇼그렌증후군(Sjogren 's), 루프스(Lupus) 등), 내분비-관련 컨디션(예를 들어, 비만, 그레이브스 병, 하시모토 갑상선염, 대사 질환, I형 당뇨병, II형 당뇨병, 등), 라임병 컨디션, 의사소통-관련 컨디션, 수면-관련 컨디션, 대사-관련 컨디션, 체중-관련 컨디션, 통증-관련 컨디션, 유전-관련 컨디션, 만성 질환 및/또는 임의의 다른 적합한 유형의 질병 관련 상태. 추가로 또는 대안적으로, 미생물-관련 컨디션은 하기 중 하나 이상을 포함할 수 있는 하나 이상의 인간 행동 컨디션을 포함할 수 있다: 카페인 소비, 알코올 소비, 다른 식품 소비, 식이 보충제 소비, 프로바이오틱 관련 행위(예를 들어, 소비, 회피), 다른 식이 행동, 습관 행동(예를 들어, 흡연; 낮은, 중간 및/또는 극한 운동 컨디션과 같은 운동 컨디션, 등), 폐경기(menopause), 다른 생물학적 과정, 사회적 행동, 기타 행동 및/또는 다른 적절한 인간 행동 컨디션. 컨디션은 임의의 적합한 표현형(예를 들어, 인간, 동물, 식물, 균체 등에 대해 측정 가능한 표현형)과 관련 될 수 있다.
방법(100) 및/또는 시스템(200)의 구현예는 단일 사용자로부터의 하나 이상의 생물학적 샘플로부터의 시퀀싱 라이브러리를 제조하기 위한 방법(100)의 구현예의 일부를 수행하는 것과 관련된 것과 같이, 단일 사용자로부터의 하나 이상의 생물학적 샘플에 대해 구현될 수 있다. 추가로 또는 대안적으로, 구현예는 사용자 세트(예를 들어, 상기 사용자를 포함하는, 제외하는 대상(subjects) 집단 등)로부터의 생물학적 샘플에 대해 구현될 수 있으며, 여기서 사용자 세트는 어떠한 적절한 유형의 특징(예를 들어, 미생물-관련 컨디션과 관련하여, 인구학적(demographic) 특징 행동, 마이크로바이옴 조성 및/또는 기능 등)에 대하여 어떠한 다른 대상과 유사한 및/또는 비유사한; 사용자의 서브그룹을 위해 구현된(예를 들어, 방법(100)의 구현예의 일부에 영향을 미치는 특성과 같은, 공유 특성 등); 식물, 동물, 미생물(예를 들어, 환경 미생물 군집 등) 및/또는 임의의 다른 적절한 실체(entities)를 위해 구현된 대상을 포함할 수 있다. 따라서, 사용자 세트(예를 들어, 대상의 집단(population), 대상의 세트, 사용자의 서브 그룹 등)로부터 유래된 정보는 후속적인 사용자에 대한 추가적인 통찰력을 제공하기 위해 사용될 수 있다(예를 들어, 방법(100)의 구현예의 일부를 수행하는데 사용된 실험적 파라미터와 관련하여 등). 변형에서, 생물학적 샘플의 집합체 세트(aggregate set)는 하기 중 하나 또는 그 이상의 사용자를 포함하는 것과 같은, 광범위한 사용자들과 관련되거나 처리(processed for, 가공)될 수 있다: 상이한 인구학(demographic)(예를 들어, 성별, 연령, 결혼 상태, 민족성, 국적, 사회경제적 지위, 성적 취향 등), 상이한 미생물-관련 컨디션(예를 들어, 건강 및 질병 상태, 상이한 유전자 성향 등), 상이한 생활 상황(예를 들어 혼자 사는 것, 애완 동물과 동거, 중요한 다른 사람과 동거, 어린이와 동거 등, 상이한 식습관(예를 들어, 잡식성, 채식주의자, 엄격한 채식주의자(vegan), 당 소비, 산 소비, 카페인 소비 등), 다른 행동 경향(예를 들어 신체 활동 수준, 약물 사용, 알코올 사용 등), 상이한 수준의 이동성(예를 들어, 주어진 시간 내에 이동한 거리와 관련) 및/또는 상이한 유형의 사용자에 대하여, 앰플리콘-관련 특성 및 메타게놈-관련 특성(예를 들어, 여기서 상기 앰플리콘-관련 특성 및 메타게놈-관련 특성은 동시 앰플리콘-관련 시퀀싱 및 메타게놈-관련 시퀀싱 등을 위한 결합된 시퀀싱 라이브러리로부터 유래된 미생물 서열 데이터세트에 기초하여 결정될 수 있는)의 비교를 위한, 임의의 다른 적절한 특성(예를 들어, 마이크로바이옴 조성 및/또는 기능에 영향을 미치거나, 상관관계가 있고 및/또는 그렇지 않으면 이와 연관된 특성). 예를 들어, 사용자의 수가 증가함에 따라, 방법(100)의 구현예의 일부에서 실행된 프로세스의 예측력은, 예를 들어 그들의 마이크로바이옴에 기초하여 다양한 사용자를 특성화하는 것과 관련하여(예를 들어, 사용자를 위한 샘플을 위한 상이한 수집 위치와 관련하는 등) 증가할 수 있다. 그러나, 방법(100) 및/또는 시스템(200)의 구현예의 일부는 임의의 적절한 실체(들)에 대해 임의의 적절한 방식으로 수행 및/또는 구성될 수 있다.
본 명세서에 기술된 데이터(예를 들어, PCR 공정과 같은 증폭 공정과 관련된 데이터; UMI-관련 태깅(tagging)과 관련된 데이터; 시퀀싱 리드(reads)와 같은 시퀀싱 관련 데이터, 미생물 서열 데이터세트, 및/또는 다른 적절한 시퀀싱 데이터; 마이크로바이옴 특징(microbiome features); 사용자 데이터; 보충 데이터; 미생물-관련 컨디션과 관련된 데이터 등)는 하기 중 하나 이상의 임의의 적절한 시간 인디케이터(temporal indicators)(예를 들어, 초, 분, 시간, 일, 주 등)와 연관될 수 있다: 데이터가 수집된(예를 들어, 샘플이 수집된 시기를 나타내는 시간 인디케이터, 등), 결정된(예를 들어, 샘플 처리 작업의 시작, 완료 등을 나타내는 시간 인디케이터), 전송, 수신 및/또는 그렇지 않은 경우 처리된(processed) 때를 지시하는 시간 인디케이터; 데이터에 의해 기술된 콘텐츠에 컨텍스트를 제공하는 시간 인디케이터; 시간 인디케이터의 변화(예를 들어, PCR 사이클에 따른 산물(결과물, product)의 변화와 같은, 시간에 따른 샘플 처리 작업의 아웃풋의 변화 등); 및/또는 시간과 관련된 임의의 다른 적절한 인디케이터. 본 명세서에 기재된 분자 및/또는 임의의 적절한 생물학적 성분은 임의의 적절한 크기(예를 들어, 서열 길이 등)를 포함할 수 있다.
추가적으로 또는 대안적으로, 파라미터, 미터법(metrics), 인풋(inputs), 아웃풋(outputs) 및/또는 다른 적절한 데이터가 점수, 개별 값, 총계 값, 이진 값, 상대 값, 분류, 신뢰 수준, 식별자, 스펙트럼에 따른 값 및/또는 다른 적절한 유형의 값 중 하나 이상을 포함하는 값 유형과 관련될 수 있다. 본 명세서에 기술된 임의의 적절한 유형의 데이터, 성분(예를 들어, 생물학적 성분), 산물(예를 들어, 샘플 처리 작업 등)은 인풋(예를 들어, 상이한 샘플 처리 작업; 모델; 혼합물; 시퀀싱 기술; 등), 산출된 아웃풋으로서(예를 들어, 상이한 모델; 모듈; 샘플 처리 작업의 산물 등)사용될 수 있고, 그리고/또는 방법(100) 및/또는 시스템 (200)과 관련된 임의의 적절한 구성 요소에 대해 임의의 적절한 방식으로 조작(manipulated)될 수 있다.
본 명세서에 기술된 방법(100) 및/또는 프로세스의 하나 이상의 사례 및/또는 구현예의 일부는 비동기식(asynchronously)으로(예를 들어, 순차적으로), 동시에(예를 들어, 다중화(multiplexing); 방법(100)의 구현예의 부분들의 복수 샘플의 처리; 방법(100)의 시퀀싱 분석 및/또는 이의 구현예들의 일부들과 관련된 병렬 데이터 처리; 등), 시간 관계로(in temporal relation)(예를 들어, 실질적으로 동시에, 응하여(in response to), 연속적으로, 이전에, 후속적으로, 등) 계기(triggers) 이벤트(예를 들어, 방법(100)의 구현예의 일부의 성능)에 대하여, 및/또는 시스템(200)의 하나 이상의 사례, 및/또는 본 명세서에 기술된 실체를 이용하여 의해 및/또는 임의의 적절한 시간 및 빈도로 임의의 다른 적절한 순서로, 수행될 수 있다.
추가적으로 또는 대안적으로, 방법(100) 및/또는 시스템(200)의 구현예의 일부가 2016년 8월 18일 출원된 미국 특허 출원 15/240,919, 2017년 7월 13일 출원 된 미국 특허 출원 15/649,497, 2017년 11월 6일 출원된 미국 특허 가출원 62/582,191, 2017년 11월 13일자로 출원된 미국 특허 출원 15/811,544 및 2018년 9월 18일자로 출원된 미국 특허 출원 15/707,907에 개시된 기술을 용이하게 할 수 있고(예를 들어, 방법(100) 및/또는 시스템(200)의 구현예의 일부의 아웃풋이 후속 적으로 인풋으로서 사용될 수 있는 경우 등), 이를 개선할 수 있고, 이와 조합하여 사용될 수 있고(예를 들어, 연속적으로, 병렬적으로 등), 사용될 수 있고(예를 들어, 방법(100) 및/또는 시스템(200)의 구현예의 부분들에 대한 인풋으로서 등), 증강, 수정, 포함의 어떠한 적절한 시간적인 관계를 가질 수 있고, 및/또는 그렇지 않다면 관련될 수 있다.
그러나, 방법(100) 및/또는 시스템 (200)은 임의의 어떠한 적절한 방식으로 구성될 수있다.
2.1 UMI -기반 분자 제조.
방법(100)의 구현예는 하나 이상의 표적(예를 들어, 핵산 표적 세트; 미생물과 관련된 표적; 등)과 관련된 UMI-기반 분자 세트(예를 들어, UMI 기반 프라이머 등)를 제조(예를 들어, 결정, 생성 등)하는 단계 S110를 포함할 수 있으며, 이는 하나 이상의 표적의 태깅 촉진(예를 들어, UMI-기반 분자로; UMI 영역; 어댑터 영역; 링커 영역; 색인 영역 등), 증폭 및/또는 적합한 다른 처리를 위해 사용되는 분자를 준비하는 것으로 기능할 수 있다.
표적(예를 들어, 관심 표적; 공지 또는 식별된 표적; 미지 또는 이전에 미확인된 표적 등)은 바이오마커; 유전자(예를 들어, 유전자 발현 마커, 등); 서열 영역(예를 들어, 유전자 서열; 유전자, 염색체, 미생물-관련 컨디션, 보존된 서열, 돌연변이, 다형성을 식별하는 서열; 아미노산 서열; 뉴클레오티드 서열 등); 핵산 (예를 들어, 게놈 DNA, 염색체 DNA, 염색체 외 DNA, 미토콘드리아 DNA, 플라스티드 DNA, 플라스미드 DNA, 코스미드 DNA, 파지미드 DNA, 합성 DNA, RNA로부터 획득한 cDNA, 단일 및 이중 가닥 DNA 등) 세포; 소분자; 단백질; 펩티드; 하나 이상의 미생물-관련 컨디션과 관련된 표적(예를 들어, 하나 이상의 미생물-관련 상태와 관련된 진단, 예후, 예측 및/또는 요법을 알려주는 표적 등); 미생물 조성과 관련된 표적(예를 들어, 샘플에 존재하는 미생물의 분류학적 분류를 지시하는 표적; 임의의 적합한 분류군의 미생물의 존재, 풍부성(abundance) 및/또는 부재를 지시하는 마커 등) 및/또는 미생물 기능(예를 들어, 미생물과 관련된 기능적 특징을 나타내는 표적 등); 지질; 총 핵산; 전체 미생물; 대사 산물; 탄수화물; 및/또는 임의의 적합한 유형의 표적 중 임의의 하나 이상을 포함할 수 있다. 방법(100)의 구현예의 일부는 개선된 시퀀싱(예를 들어, NGS) 및/또는 임의의 적합한 표적(예를 들어, UMI의 사용 등을 통한)의 분석을 용이하게 하는 표적을 이용하여 라이브러리 제조를 용이하게 할 수 있다.
UMI-기반 분자는 바람직하게는 하나 이상의 표적(예를 들어, 미생물-관련 핵산 표적 등)과 관련되어 있으나(예를 들어, 하나 이상의 표적(예를 들어, 핵산 표적 등)의 하나 이상의 서열 영역에 상보적인 하나 이상의 서열 영역을 포함하는 표적-관련 영역을 포함; 표적화(targeting); 이와 함께 증폭가능한; 이와 함께 가공가능한; 이에 태그 가능한), 그러나 추가로 또는 대안적으로 어떠한 적합한 구성과 함께 결합될 수 있다. UMI-기반 분자는 바람직하게는 UMI-기반 프라이머를 포함하지만(예를 들어, 하나 이상의 PCR 공정 등과 같은 하나 이상의 증폭 공정에 사용하기 위해), 그러나 추가로 또는 대안적으로 어떠한 적합한 유형의 UMI-기반 분자를 어떠한 적합한 목적을 위해 포함할 수 있다.
UMI-기반 분자(및/또는 본 명세서에 기술된 프라이머 및/또는 다른 분자와 같은 다른 적합한 분자)는 바람직하게는 하나 이상의 UMI 영역(예를 들어, UMI-기반 분자가 단일 UMI 영역을 포함할 수 있는 경우; UMI-기반 분자가 복수의 UMI 영역을 포함할 수 있는 경우 등)을 포함한다. 일 예에서, UMI 영역은, 랜덤 "N" 염기 세트(예를 들어, N 데옥시뉴클레오티드 염기)를 포함하는 UMI 영역을 포함할 수 있으며, 여기서 각각의 랜덤 "N" 염기는 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 로부터 선택될 수 있다. "N" 염기는 연속적인(예를 들어, 강한 "N" 염기 등), 분리된(예를 들어, 정의된 염기에 의해; 임의의 적합한 서열 영역 등에 의해) 및/또는 UMI-기반 분자의 임의의 적합한 서열 위치에 위치할 수 있다. UMI 영역은 임의의 적절한 서열 길이(예를 들어, 적어도 2개의 "N" 염기; 21개 미만의 "N" 염기; 임의의 적절한 수의 "N" 염기 등)를 포함할 수 있다. UMI 영역 서열 길이는 처리될 타겟의 양 및/또는 유형(예를 들어, 정량화, 차별화 등)에 기초하여 결정될 수 있으며, 예를 들어, 보다 긴 UMI 영역이 더 많은 수의 랜덤 염기 조합 및 큰 세트의 고유 식별자(unique identifiers)(예를 들어, 많은 수의 구별될 타겟 유형을 분석하기 위해 사용되고; 다수의 주형 및/또는 유전자 변이체를 포함하는 샘플을 분석하기 위해 사용되는 등)를 용이하게 할 수 있다. 일 예에서, 상기 UMI 영역은 4N UMI 영역(예를 들어, 4개의 "N" 염기를 포함하는 UMI 영역 등)을 포함 할 수 있다. 특정 예에서, UMI 영역은 하나 이상의 MgCl2, 디메틸 설폭사이드(DMSO), 열안정성 핵산 결합 단백질(예를 들어, 극도의 열안정성(extreme thermostable) 단일-가닥 DNA 결합 단백질 등) 및/또는 다른 적합한 성분과 같은 하나 이상의 태깅 촉진 분자의 첨가와 같은, 16S 유전자의 증폭 과정과 같은, 8N UMI 영역을 포함 할 수 있다. 그러나, UMI 영역은 임의의 적절한 방식으로 구성 될 수 있다.
UMI-기반 분자(및/또는 본 명세서에 기술된 프라이머 및/또는 다른 분자와 같은 다른 적합한 분자)는 바람직하게는 하나 이상의 표적-관련 영역을 포함한다. 표적-관련 영역은 바람직하게는 서열 영역(예를 들어, 유전적 서열 등)을 포함하지만, 어떠한 적합한 유형의 성분(예를 들어, 표적과 관련된 임의의 적합한 성분, 예를 들어 표적에 결합 가능, 커플링 가능, 연결 가능, 영향을 미치고, 정보를 주고, 변형시키거나 및/또는 표적과의 임의의 적절한 관계를 갖는 등)을 추가적으로 또는 대안적으로 포함할 수 있다. 표적-관련 영역은 바람직하게는 하나 이상의 표적(예를 들어, 핵산 표적의 서열 영역; 핵산 표적의 다른 적합한 성분; 등)과 관련되어 있다(예를 들어, 이에 대한 서열 상보성을 가지며; 표적화; 함께 증폭 가능; 처리 가능 등). 일 예에서, 표적-관련 영역은 상보적인 표적 DNA 서열(예를 들어, 핵산 표적)과 어닐링 가능한 DNA 서열을 포함할 수 있다. 표적-관련 영역은 바람직하게는 폴리머라제(예를 들어, DNA 폴리머라제)가 핵산 표적 및/또는 다른 적합한 성분을 복사 및 증폭시키도록 할 수 있지만, 표적-관련 영역은 임의의 적합한 기능성(functionality)을 포함할 수 있다. 표적-관련 영역은 임의의 적합한 길이(예를 들어, 적어도 15 염기 길이; 임의의 적절한 수의 염기 등)를 포함 할 수 있다. 대안적으로, UMI-기반 분자는 표적-관련 영역을 배제할 수 있다. 그러나, 표적-관련 영역(및/또는 다른 적합한 분자)은 임의의 적합한 방식으로 구성 될 수 있다.
UMI-기반 분자(및/또는 본 명세서에 기술된 프라이머 및/또는 다른 분자와 같은 다른 적합한 분자)는 하나 이상의 링커 영역을 포함할 수 있다. 링커 영역은 바람직하게는 하나 이상의 핵산 표적(예를 들어, 표적-관련 영역과 관련된 핵산 표적 등)에 대한 완전한 상보성(full complementarity)이 없다(예를 들어, 상보성이 없는, 부분 상보성인, 등). 링커 영역은 임의의 적합한 길이를 포함할 수 있다(예를 들어, 링커 영역은 21개의 염기 미만, 예컨대 UMI-기반 프라이머 세트의 각 UMI-기반 프라이머; 임의의 적절한 수의 염기의 길이 등을 포함한다). 링커 영역은 바람직하게는 UMI 영역과 표적-관련 영역 사이에 위치되지만(예를 들어, UMI 서열 영역과 표적-관련 서열 영역을 분리하는 등), 임의의 적합한 위치 (예를 들어, 임의의 적합한 서열 위치)에 위치 할 수 있으며, 예를 들어, 각각의 UMI-기반 분자 (예를 들어, UMI-기반 프라이머 세트의 각 UMI-기반 프라이머 등)에 대해, 링커 영역이 UMI 영역과 UMI-기반 분자의 표적-관련 영역 사이에 위치한다. 특정 예에서, UMI-기반 분자는 표적-관련 영역(예를 들어, 어닐링 영역)과 UMI 영역 사이에 위치 된 7개의 염기의 길이를 포함하는 링커 영역을 포함할 수 있으며, 여기서 UMI-기반 분자는 대장균 게놈으로부터의 16S 세그먼트 증폭에 사용될 수 있으며, 여기서 링커 영역의 존재가 16S 증폭의 효율을 향상시킬 수 있다(예를 들어, 8N UMI 영역을 포함하고 링커 영역을 제외한 UMI-기반 프라이머를 사용하는 경우 16S 영역의 증폭이 더 작은 경우). 대안적으로, UMI-기반 분자(및/또는 다른 적합한 분자)는 링커 영역을 배제할 수 있다. 그러나, 링커 영역은 임의의 적합한 방식으로 구성될 수 있다.
UMI-기반 분자(및/또는 본 명세서에 기술된 프라이머 및/또는 다른 분자와 같은 다른 적합한 분자)는 하나 이상의 어댑터 영역을 포함할 수 있다. 어댑터 영역은 바람직하게는 외부 어댑터 영역을 포함하며(예를 들어, 어댑터 영역이 하나 이상의 외부 어댑터 영역 등을 포함할 수 있는), 이는 바람직하게는 시퀀싱 라이브러리 준비를 용이하게 하도록 구성된(예를 들어, NGS 라이브러리의 구성 및 시퀀싱을 용이하게 하도록 구성되는) 서열 영역(예를 들어, 서열 등)을 포함하지만, 그러나 외부 어댑터 영역은 시퀀싱을 용이하게 하기 위한 임의의 적합한 구성을 추가로 또는 대안적으로 포함할 수 있다. 외부 어댑터 영역은 임의의 적합한 길이(예를 들어, 서열 길이; 임의의 적절한 수의 염기 등) 및/또는 임의의 적합한 서열 영역 (예를 들어, 임의의 적합한 염기 조합 등)을 포함 할 수 있으며, 이는 시퀀싱 유형(예를 들어, 사용된 시퀀싱 기술 유형 등)에 기초하여 결정될 수 있다. 대안적으로, UMI-기반 분자(및/또는 다른 적합한 분자)는 어댑터 영역을 배제할 수 있다. 그러나, 어댑터 영역은 임의의 적절한 방식으로 구성될 수 있다.
특정 예에서, UMI-기반 분자(예를 들어, UMI-기반 프라이머)는 "5'- 외부 어댑터-고유 분자 식별자-링커-표적 DNA 서열 -3 '(5'-EXTERNAL ADAPTER-UNIQUE MOLECULAR IDENTIFIER-LINKER-TARGET DNA SEQUENCE-3')"을 포함하지만 UMI-기반 분자는 임의의 적합한 구성을 포함할 수 있다.
UMI-기반 분자는 임의의 적합한 크기(예를 들어, 임의의 적합한 서열 길이 등)를 포함할 수 있으며, 임의의 적합한 수 및/또는 유형의 UMI-기반 분자는 본 발명 방법(100)의 구현예의 일부에서 제조 및/또는 사용될 수 있다.
UMI-기반 분자를 제조하는 단계는 방법(100)의 구현의 임의의 적합한 부분의 전 및/또는 후에(예를 들어, 시퀀싱-기반 프라이머 세트를 준비하기 전 또는 후에; 태그된 표적 분자를 생성하기 전 또는 생성하는 동안; 태깅된 표적 분자의 반복 생성을 위한 태깅된 표적 분자의 생성 이후) 및/또는 임의의 적절한 시간 및 빈도에 수행할 수 있다.
그러나, UMI-기반 분자의 제조는 임의의 적합한 방식으로 수행될 수 있다.
2.2 시퀀싱 기반 프라이머 제조.
방법(100)의 구현예는 시퀀싱-기반 프라이머 세트를 제조하는 단계(S120)를 포함할 수 있으며, 이는 미생물과 관련된 시퀀싱을 개선하는 것과 관련된, 시퀀싱-준비된(예를 들어, NGS-준비된) 분자의 생성을 용이하게 하기 위해 사용되는 프라이머를 제조하는 기능을 할 수 있다.
시퀀싱-기반 프라이머(및/또는 본 명세서에 기술된 다른 적합한 분자)는 바람직하게는 하나 이상의 어댑터 영역을 포함한다. 시퀀싱-기반 프라이머의 어댑터 영역은 바람직하게는 NGS를 용이하게 하는 서열 영역을 포함하는 하나 이상의 시퀀싱 어댑터 영역을 포함하나(예를 들어, 시퀀싱을 수행하기 위해 하나 이상의 NGS 기술에 의해 요구되는 서열 영역; 사용된 NGS 기술의 유형에 기초하여 결정된 서열 영역; NGS 기술의 촉진 등), 그러나 시퀀싱 어댑터 영역은 임의의 적절한 방식으로 구성될 수 있다. 추가로 또는 대안적으로, 임의의 적합한 어댑터 영역은 시퀀싱 어댑터 영역을 포함할 수 있다. 시퀀싱-기반 프라이머의 어댑터 영역은 바람직하게는 하나 이상의 외부 어댑터 영역(예를 들어, UMI-기반 분자의 어댑터 영역 등과 같은 다른 어댑터 영역의 외부 어댑터 영역과 동일, 유사, 상이, 상보적인)을 포함하지만, 임의의 적합한 어댑터 영역은 하나 이상의 외부 어댑터 영역을 포함할 수 있다. 시퀀싱-기반 프라이머의 어댑터 영역은 바람직하게는 상이한 샘플(및/또는 샘플의 구성, 서열이 될 구성 요소)의 멀티플렉싱(multiplexing), 조합 태깅(combinatorial tagging)을 용이하게 하도록 구성된 하나 이상의 인덱스 영역 (예를 들어, 시퀀싱 인덱스 영역 등) 및/또는 NGS 및/또는 다른 시퀀싱과 관련된 다른 적절한 기능을 포함한다. 인덱스 영역은 바람직하게는 정의된 바코드 서열 (예를 들어, 적어도 2개 및 11개 미만의 염기 길이를 포함; 임의의 적절한 수의 염기의 길이 등을 포함)을 포함하지만, 추가로 또는 대안적으로 다음을 포함하는 임의의 적합한 구성을 포함할 수 있다. 특정 예에서, 시퀀싱-기반 프라이머는 "5'- 시퀀싱 어댑터-시퀀싱 인덱스-외부 어댑터-3 '(5'-SEQUENCING ADAPTER-SEQUENCING INDEX-EXTERNAL ADAPTER-3')"을 포함하는 구성을 포함할 수 있다. 어댑터 영역은 외부 어댑터 영역으로부터 분리되고, 인접하고 및/또는 그렇지 않다면 다른 방식으로 상대적으로 배치된 시퀀싱 어댑터 영역을 포함할 수 있지만, 임의의 적절한 영역은 다른 영역에 대한 임의의 적절한 위치 및/또는 임의의 적절한 위치를 포함할 수있다. 추가로 또는 대안적으로, 시퀀싱-기반 프라이머는 임의의 적합한 영역(예를 들어, 프라이머 등과 관련하여 본 명세서에 기술된) 및/또는 다른 적합한 구성을 포함할 수 있다. 그러나, 시퀀싱-기반 프라이머는 임의의 적절한 방식으로 구성 될 수 있다.
시퀀싱-기반 프라이머의 제조는 방법(100)의 임의의 적합한 구현예의 전 및/또는 후에(예를 들어, UMI-기반 분자 세트를 제조하기 전 또는 후에, 태그된 표적 분자를 생성하기 전 또는 후, 등), 및/또는 임의의 적절한 시간 및 빈도로 수행될 수 있다. 그러나, 시퀀싱-기반 프라이머 세트를 준비하는 것은 임의의 적합한 방식으로 수행될 수 있다.
2.3 태깅된 표적 분자 생성.
방법(100)의 구현예는 UMI-기반 분자 세트 및 하나 이상의 표적과 관련된 하나 이상의 생물학적 샘플(예를 들어, 하나 이상의 표적을 포함하는 생물학적 샘플; 하나 이상의 표적이 없는 생물학적 샘플 등)에 기초하여 태그된 표적 분자의 세트를 생성하는 단계 S130를 포함 할 수 있으며, 이는 미생물-관련 특성을 결정하기 위한 다운스트림 샘플 처리 및/또는 생물정보학적 분석을 용이하게 하기 위한 태그된 표적을 얻는 기능을 할 수 있다.
태깅된 표적 분자는 바람직하게는 하나 이상의 UMI-기반 분자로 태그된(예를 들어 부착; 연결; 커플링된 등) 표적(예를 들어, 표적을 포함하는 성분, 예를 들어, 총 핵산 및/또는 표적 서열 영역을 포함하는 핵산 단편 등)을 포함하지만, 추가로 또는 대안적으로 하나 이상의 표적과 관련되고 임의의 적합한 분자로 태그된 임의의 적합한 구성을 포함할 수 있다. 태깅된 표적 분자 세트를 생성하는 것은 바람직하게는 UMI-기반 분자 세트(예를 들어, UMI-기반 프라이머 등) 및 하나 이상의 생물학적 샘플(예를 들어, 하나 이상의 생물학적 샘플의 성분을 UMI-기반 분자 세트 및/또는 UMI-기반 분자 세트의 구성으로 태깅하는 등)에 기초하나(예를 들어, 사용; 이용하여 처리; 이용하여 증폭 공정 수행 등), 추가로 또는 대안적으로 임의의 적합한 성분에 기초할 수 있다.
태깅된 표적 분자의 세트를 생성하는 것은 바람직하게는 하나 이상의 증폭 과정에 기초한다(예를 들어, 포함; 이로부터 산출된 산물을 사용). 증폭 공정(예를 들어, 태그된 표적 분자의 세트를 생성하는 것과 관련되고; 방법(100)의 구현예의 임의의 적합한 부분과 관련된 등)은 바람직하게는 하나 이상의 PCR 공정 (예를 들어, 고상 PCR, RT-PCR, qPCR, 멀티플렉스 PCR, 터치다운 PCR, 나노PCR, 네스티드(nested) PCR, 핫 스타트 PCR 등)을 포함하지만, 추가로 또는 대안적으로 하나 이상의 헬리케이즈-의존적 증폭(HDA), 루프 매개 등온 증폭(LAMP), 자가-지속 형 서열 복제(3SR), 핵산 서열 기반 증폭(NASBA), 가닥 변위 증폭(SDA), 롤링 서클 증폭(RCA), 리가아제 연쇄 반응(LCR) 및/또는 임의의 다른 적합한 증폭 과정을 포함 할 수 있다. 특정 예에서, PCR 공정을 수행하는 단계는 UMI-기반 프라이머 세트 (예를 들어, 20 내지 2000 nM을 포함하거나 그 사이의 농도; 임의의 적합한 농도)를 사용하는 열 사이클러에서 PCR에 의해 하나 이상의 표적 DNA 서열을 증폭시키는 단계, 예를 들어 DNA 폴리머라제(예를 들어, DNA 폴리머라제 0.02 내지 0.08 units/uL을 포함하거나 그 사이의 농도; 임의의 적합한 농도 등)를 사용하는 것과 같은 단계를 포함한다. 특정 예에서, PCR 공정을 수행하는 단계는 2 내지 3 사이클 사이의 및/또는 이를 포함하는 PCR을 수행하는 단계를 포함할 수 있다(예를 들어, UMI 영역 및 외부 어댑터 영역에 의해 플랭크된(flanked by) 표적 분자 각각의 단일 카피의 생성; 하나 이상의 태깅 촉진 분자를 이용한 PCR 공정 수행). 그러나, 임의의 적합한 PCR 공정 및/또는 다른 증폭 공정(예를 들어, 태그된 표적 분자의 세트를 생성하는 것과 관련하여; 방법(100)의 구현예의 임의의 적적한 부분과 관련하여; 등)이 임의의 적합한 방식으로 수행될 수 있다.
태그된 표적 분자의 세트를 생성하는 것은 추가로 또는 대안적으로(예를 들어, 사용; 이용하여 처리; 처리; 이용하여 증폭 공정 수행 등) 하나 이상의 태깅 촉진 분자(예를 들어, UMI-기반 분자를 핵산 표적에 혼입하는 것과 같이, 태깅과 관련된 효율 및/또는 다목적성을 개선하기 위해 사용될 수 있는 것; 효율과 관련하여 증폭 프로세스를 개선하기 위해 사용될 수 있는 것; 등)에 기초할 수 있다. 태깅 촉진 분자는 MgCl2, 디메틸 설폭사이드(DMSO), 열안정성 핵산 결합 단백질, 베타 인, 포름아미드, 트윈, 트리톤, NP-40, 테트라메틸 암모늄 클로라이드(TMAC), 소 혈청 알부민(BSA), 유기 및/또는 무기 인핸서 요소, 화합물, 염, 소분자, 생체 분자 및/또는 태깅을 용이하게 하도록 구성된 임의의 다른 적합한 분자를 포함할 수 있다.
일 예에서, 태그된 표적 분자의 세트를 생성하는 단계는 UMI-기반 프라이머 세트, 적어도 하나의 생물학적 샘플, 및 MgCl2, 디메틸 설폭사이드(DMSO) 및 열안정성 핵산 결합 단백질 중 적어도 하나를 포함하는 태깅 촉진 분자 세트를 사용하여 제 1 증폭 공정을 수행하는 단계를 포함할 수 있다. 특정 예에서, 열안정성 핵산 결합 단백질은 열안정성 단일-가닥 DNA 결합 단백질을 포함할 수 있으며, 여기서 태그된 표적 분자의 세트를 생성하는 단계는 UMI-기반 단백질의 세트, 적어도 하나의 생물학적 샘플, 및 MgCl2 및 열안정성 단일-가닥 DNA 결합 단백질을 포함하는 태깅 촉진 분자 세트를 사용한 제1 증폭 공정을 포함할 수 있다.
일 예에서, 열안정성 핵산 결합 단백질은 극도의 열안정성 단일-가닥 DNA 결합 단백질(예를 들어, 초고온성(hyperthermophilic) 미생물로부터 단리된; 임계 시간 동안 예를 들어 증폭 과정에서 관찰되는 온도와 같은 고온에서 인큐베이션 후 활성을 유지할 수 있는 능력을 갖는)을 포함 할 수 있다.
특정 예에서, PCR 공정을 수행하는 것은 MgCl2 및 열안정성 핵산 결합 단백질(예를 들어, 극도의 열안정성(extreme thermostable) 단일-가닥 DNA 결합 단백질)을 포함하는 태깅 촉진 분자 세트, 5N UMI 영역을 포함하는 UMI-기반 프라이머 세트, 및 하나 이상의 생물학적 샘플에 기초할 수 있으며, 이때 예를 들어 태깅 촉진 분자 세트의 사용은 하나 이상의 생물학적 샘플의 성분과 UMI-기반 프라이머의 혼입을 개선시킬 수 있다. PCR 공정을 수행하는 단계는 열 사이클러(thermal cycler)(예를 들어, 통상적인 열 사이클러) 및/또는 PCR 공정을 용이하게 하기 위한 임의의 다른 적절한 시스템과 함께(예를 들어 함께 관련되는 등) 수행될 수 있다.
태그된 표적 분자의 생성(및/또는 임의의 적절한 분자 태깅(tagging))은 임의의 적절한 시간 및 빈도로(예를 들어, 시퀀싱-준비된 태그된 표적 분자를 생성하기 전에; 시퀀싱-준비된 태그된 표적 분자를 생성하는 동안, 예를 들어 반복적인 제품 생성 방식 등에서) 수행될 수 있다.
변형에서, 태그된 표적 분자의 세트를 생성하는 것은 하나 이상의 단편화 공정, 결찰 공정 및/또는 UMI-기반 분자를 갖는 핵산 표적(및/또는 하나 이상의 생물학적 샘플 등의 다른 적합한 성분 등)과 같은 하나 이상의 표적을 태그하기 위한 다른 적합한 공정(예를 들어, PCR 기반 공정에 추가하여 또는 대안적으로 등)을 수행하는 것을 포함할 수 있다. 일 예에서, 태그된 표적 분자 세트를 생성하는 단계는 하나 이상의 생물학적 샘플(예를 들어, 관심 있는 표적에 상응하는 표적 서열과 같은, 하나 이상의 핵산 표적을 포함하는 단편을 생성하는 것; 하나 이상의 생물학적 샘플로부터 단편을 생성하는 것; 등)을 이용하여 효소적 공정 및 기계적 공정(예를 들어, 효소적 및/또는 기계적 단편화 등) 중 적어도 하나에 기초하여 단편을 생성하는 단계; 및 관심있는 표적에 상응하는 표적 서열과 같은 하나 이상의 핵산 표적을 포함하는 단편을 생성하고; 하나 이상의 생물학적 샘플로부터 단편을 생성하는 것; 등); 및 증폭 이전과 같이 UMI-기반 분자 및 단편(예를 들어, UMI-기반 분자를 단편에 결찰하는 것 등)에 대해, 예를 들어 표적 분자(예를 들어, 표적 NDA; 시퀀싱 라이브러리 구축 등을 위해)의 증폭 전에, 결찰을 수행하는 단계(예를 들어, 리가제 효소를 이용한 블런트-엔드 결찰(blunt-end ligation) 등)를 포함할 수 있다. 일 예에서, 태그된 표적 분자 세트를 생성하는 단계는 적어도 하나의 생물학적 샘플로부터 핵산 단편을 생성하는 단계; 및 UMI-기반 분자 세트를 핵산 단편에 결찰시키는 단계를 포함할 수 있다. 일 예에서, 하나 이상의 단편화 공정 및/또는 결찰 공정을 수행하면 이용가능한 모든 분자를(예를 들어, 용액 내) 차별없이 태그하는 결과를 도출할 수 있는 반면, 예를 들어 PCR 공정으로 태그된 표적 분자 세트를 생성하는 경우(예를 들어 본 명세서에 기술 된 공정 등)는 UMI 태깅을 위한 특정한 표적화(예를 들어, 표적 DNA 서열의)를 용이하게 할 수 있다. UMI 태깅에 사용된 결찰 공정은 단편화 과정을 수행하는 태그된 표적 분자를 생성하기 위한 PCR 공정에 사용되는 UMI-기반 분자의 유형과 동일하거나 유사하거나 다른 UMI-기반 분자(예를 들어, 생성된 단편 및/또는 다른 분자 등을 태깅하기 위해)를 사용할 수 있다. 특정 예에서, UMI 영역을 포함하는 DNA 어댑터를 포함하는 UMI-기반 분자 (예를 들어, "외부 어댑터-고유 분자 식별자-링커-표적 DNA 서열(EXTERNAL ADAPTER-UNIQUE MOLECULAR IDENTIFIER-LINKER-TARGET DNA SEQUENCE)" 등을 포함하는 구성을 포함)가 결찰될 수 있다. 추가로 또는 대안적으로, 추가 구성 요소(예를 들어, 영역(regions) 등)가 결찰 공정 전, 공정 동안 및/또는 후에 추가될 수 있다 (예를 들어, PCR 공정 동안 예를 들어, "5'-시퀀싱 어댑터-시퀀싱 인덱스-외부 어댑터-3 '(5'-SEQUENCING ADAPTER-SEQUENCING INDEX-EXTERNAL ADAPTER-3')" 등을 포함하는 구성을 포함하는 프라이머 사용 등에 의해 추가 영역의 추가). 그러나, 하나 이상의 단편화 공정 및/또는 결찰 공정을 수행하는 것은 임의의 적합한 방식으로 수행될 수 있다.
변형에서, 태그된 표적 분자 세트를 생성하는 단계는 적어도 하나의 PCR 공정 및 적어도 하나의 결찰 공정의 조합(예를 들어, 연속 조합; 병렬 조합 등)을 포함 할 수 있다. 예를 들어, 태그된 표적 분자의 세트를 생성하는 단계는, PCR 효율 및 표적 증폭을 증가시키기 위한, 프라이머 세트(예를 들어, 하나 이상의 표적-관련 영역, 링커 영역 및/또는 임의의 다른 적합한 구성 등을 포함)로 PCR 공정을 수행하는 단계; 및 예를 들어 UMI-기반 분자를 PCR 공정의 산물에 추가하기 위해(예를 들어, 증폭된 핵산 표적 등), 하나 이상의 UMI-기반 분자(예를 들어, 하나 이상의 UMI 영역, 어댑터 영역 및/또는 다른 적절한 성분 등을 포함)로 결찰 공정을 수행하는 단계를 포함할 수 있다. 일 예에서, 태그된 표적 분자 세트를 생성하는 단계는 적어도 하나의 생물학적 샘플 및 상기 표적 세트의 적어도 하나의 표적과 관련된 표적-관련 영역을 포함하는 프라이머 세트에 기초하여 PCR 공정을 수행하는 단계; 및 UMI-기반 분자 세트를 PCR 공정의 산물에 결찰시키는 단계를 포함할 수 있다. 특정 예에서, 하나 이상의 UMI-기반 분자로 결찰 공정을 수행하는 단계는 상동성에 기초하고, DNA 단일 가닥, 폴리머라제, 리가제 및/또는 다른 적합한 구성의 표적화된 분해를 위해 엑소뉴클레아제를 사용하는 하나 이상의 결찰 공정을 수행하는 단계를 포함할 수 있다. 특정 예에서, UMI-기반 분자는 어댑터 영역(예를 들어, 외부 어댑터를 포함), UMI 영역, 적어도 하나의 PCR 공정에 의해 생성된 하나 이상의 앰플리콘의 5' 말단과 상동인 임의의 어떠한 길이의 3' 말단 영역 및/또는 결찰 공정을 용이하게 하는 임의의 다른 적합한 영역을 포함하는 올리고뉴클레오티드를 포함할 수 있다. 그러나, 적어도 하나의 PCR 공정 및 적어도 하나의 결찰 공정의 조합을 수행하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
태그된 표적 분자의 세트(및/또는 방법(100)의 구현예의 적절한 부분)를 생성하는 단계는 하나 이상의 정제 공정을 수행하는 단계를 포함할 수 있다(예를 들어, 임의의 적절한 성분을 정제하기 위해; 임의의 적절한 성분을 제거하기 위해 등). 일 예에서, 태그된 표적 분자 세트를 생성하는 단계는 제1 증폭 공정의 산물로부터 UMI-기반 프라이머 세트의 UMI-기반 프라이머를 제거하기 위해(및/또는 다른 적합한 성분 등을 제거하기 위해) 제1 증폭 공정의 산물로 정제 공정을 수행하는 단계를 포함할 수 있다. 일 예에서, 방법(100)은 본 명세서에 기술된 증폭 공정으로부터 수득된 산물(예를 들어, 태그된 표적 분자 산물의 풀을 생성하는데 사용되는 PCR 공정)을 위한 정제 공정을 수행하는 단계, 예를 들어 UMI-기반 프라이머의 제1 세트로 수행된 PCR-기반 증폭 공정으로부터 수득된 정제 산물에 대한 정제 공정 등을 포함할 수 있다. 정제 공정은 하기 중 하나 또는 그 이상을 포함할 수 있다: 실리카-기반 DNA 결합 미니-컬럼, SPRI(Solid Phase Reversible Immobilization) 자기 비드(예를 들어, 업스케일링 및 자동화 등을 위해), 생물학적 샘플로부터의 핵산 침전(예를 들어, 알코올-기반 침전 방법을 사용), 액체-액체 기반 정제 기술(예를 들어, 페놀-클로로포름 추출), 크로마토그래피-기반 정제 기술(예를 들어, 컬럼 흡착), 핵산에 결합하도록 구성되고 용리 환경(elution environment)(예를 들어, 용리 용액을 갖는, pH 이동을 제공하는, 온도 변화를 제공하는 등)의 존재에서 핵산을 방출하도록 구성된 결합 부(moiety)-결합 입자(예를 들어, 자성 비드, 부력(buoyant) 비드, 크기 분포를 갖는 비드, 초음파 반응성 비드 등)의 사용을 포함하는 정제 기술 및/또는 임의의 적합한 정제 공정. 특정 예에서, 자성 비드는 DNA와 카르복실 코팅된 비드의 정전기적 상호 작용에 의하는 등에 의해, 소량의 PCR 공정 산물의 정제를 가능하게 할 수 있다. 특정 예에서(예를 들어, 대안으로서, 등), 자성 비드로 정제 공정을 수행하는 단계는 1 : 1.2 내지 1 : 0.6의 샘플 대 비드 부피비 사용을 포함할 수 있다(예를 들어, 이때 작은 DNA 분자와 비드의 상호작용은 바람직하지 않으며, 100 bp 이하의 크기의 비특이적 산물은 제거되는 것이 바람직하다). 특정 예에서(예를 들어, 대안으로서, 등), 자성 비드로 정제 공정을 수행하는 단계는 5 내지 100 유닛(units)의 엑소뉴클레아 제 I 및/또는 임의의 다른 단일-가닥 DNA 분해 효소의 사용을 포함하여, 예를 들어 임의의 적합한 PCR 공정으로부터 얻어진 산물에 첨가되어, 예를 들어 UMI-기반 분자(예를 들어, DNA 프라이머; 샘플의 분자를 태그하지 않은 UMI-기반 분자 등) 및/또는 다른 적합한 성분(예를 들어, 제1 PCR로부터의)을 선택적으로 분해할 수 있다. 특정 예에서, 자성 비드로 정제 공정을 수행하는 단계는, PCR 주형 DNA를 분해하기 위해, 1 내지 100 유닛의 DpnI 제한 효소를 첨가함으로써 공정을 보충하는 단계를 포함할 수 있다. 특정 예에서, 효소 처리 및/또는 다른 적합한 공정의 조합은 PCR 산물 청소 접근법(cleanup approaches)에 추가적으로 또는 대안으로 사용될 수 있다. 추가적으로 또는 대안적으로, 정제 공정은 임의의 적절한 방식으로 (예를 들어, 방법(100)의 구현예의 임의의 적합한 부분과 관련하여) 수행될 수 있다.
그러나, 태그된 표적 분자를 생성하는 단계는 임의의 적합한 방식으로 수행 될 수 있다.
2.4 시퀀싱-준비된(ready) 태그된 표적 분자 생성.
방법(100)의 구현예는 태그된 표적 분자 세트 및 시퀀싱-기반 프라이머 세트에 기초하여 시퀀싱-준비된 태그된 표적 분자 세트(예를 들어, NGS-준비된 태그된 표적 분자 등)를 생성하는 단계(S140)를 포함할 수 있고, 이는 시퀀싱(예를 들어, NGS 등)을 위한 준비를 위해 표적 분자를 처리하는 기능(예를 들어, 태그된 표적 분자)을 할 수 있다.
시퀀싱을 위한 분자의 제조 단계는 바람직하게 시퀀싱을 위한 태그된 표적 분자를 제조하는 단계(예를 들어, 하나 이상의 어댑터 영역 및/또는 더 많은 인덱스 영역 등을 추가함으로써)를 포함하지만, 추가적으로 또는 대안적으로 시퀀싱을위한 임의의 적합한 분자를 제조하는 단계를 포함할 수 있다.
시퀀싱-준비된 태그된 표적 분자 세트를 생성하는 단계는 바람직하게는 태그된 표적 분자 세트 및 시퀀싱-기반 프라이머 세트(예를 들어, 사용; 이용하여 처리; 이용하여 증폭 공정 수행 등)를 기반으로 하지만(예를 들어, 태그된 표적 분자 세트와 시퀀싱-기반 프라이머의 혼입을 위해; 태그된 표적 분자의 세트에 시퀀싱-기반 프라이머의 영역을 추가하기 위해; 등), 추가적으로 또는 대안적으로 임의의 적합한 성분에 기초할 수 있다. 일 예에서, UMI-기반 프라이머 세트의 각 UMI-기반 프라이머는(예를 들어, 태그된 표적 분자의 세트를 생성하는데 사용되는 등) NGS와 관련된 외부 어댑터 영역을 포함할 수 있고; 이때 태그된 표적 분자의 세트는(예를 들어, UMI-기반 프라이머 등을 기초로 생성된) 외부 어댑터 영역을 포함하고; 그리고 이때 시퀀싱-준비된 태그된 표적 분자(예를 들어, NGS-준비된 태그된 표적 분자 등)의 세트를 생성하는 단계는 시퀀싱-기반 프라이머 세트(예를 들어, 상보적 외부 어댑터 영역 등과 같은, 외부 어댑터 영역을 포함하는 어댑터 영역을 포함)를 태그된 표적 분자의 외부 어댑터 영역에 태그된 표적 분자와 어닐링하는 단계를 포함한다. 일 예에서, 방법(100)은 제1 PCR 공정을 포함하는 제1 증폭 공정에 기초하여 태그된 표적 분자 세트를 생성하는 단계; 태그된 표적 분자 및 시퀀싱-기반 프라이머 세트를 이용한 제2 PCR 공정을 포함하는 제2 증폭 과정에 기초하여 시퀀싱-준비된 태그된 표적 분자(예를 들어, NGS-준비된 태그된 표적 분자)의 세트를 생성하는 단계; 여기서 시퀀싱-기반 프라이머 세트의 각각의 시퀀싱-기반 프라이머는 어댑터 영역(예를 들어, NGS 등과 같은 시퀀싱과 관련됨) 및 NGS와 관련된 멀티플렉싱을 용이하게 하도록 구성된 인덱스 영역을 포함하고; 그리고 여기서 NGS-리드(read) 태그된 표적 분자 세트를 생성하는 단계는 태그된 표적 분자 및 시퀀싱-기반 프라이머 세트를 갖는 제2 PCR 공정에 기초하여, 인덱스 영역 및 어댑터 영역을 태그 된 표적 분자 세트의 태그된 표적 분자에 추가하는 단계를 포함한다. 특정 예에서, PCR 공정(예를 들어, 시퀀싱-준비된 태그된 표적 분자 세트를 생성하기 위한 제2 PCR 공정)을 수행하는 단계는, 24-45 사이클 사이 및/또는 이를 포함하는 PCR에 대하여, 0.02-0.08 units/uL 사이 및/또는 이를 포함하는 DNA 폴리머라제의 사용을 포함할 수 있다. 특정 예에서, PCR 공정(예를 들어, 제2 PCR 공정 등)을 수행하는 단계는 태그된 표적 분자 세트(예를 들어, 제1 PCR 공정 수행으로부터의 산물 등)를 생성하는 단계로부터 순수한(clean) DNA 산물의 증폭을 가능하게 할 수 있고, 이는 핵산 표적(예를 들어, 표적 분자)의 DNA 농도를 시퀀싱에 적합한 수준 (예를 들어, 1 pM 이상과 같은; NGS)으로 증가시킬 수 있다. 특정 예에서, 시퀀싱-준비된 태그된 표적 분자의 세트를 생성하는 단계는 하나 이상의 어댑터 영역, 인덱스 영역(예를 들어, 멀티플렉싱 촉진 등을 위해) 및/또는 태그된 표적 분자 및/또는 다른 적합한 구성에 적합한 다른 영역을 추가하는 단계를 포함할 수 있다. 특정 예에서, 시퀀싱-준비된 태그된 표적 분자 세트를 생성하는 단계는 "5'-시퀀싱 어댑터-시퀀싱 인덱스-외부 어댑터-3'(5'-SEQUENCING ADAPTER-SEQUENCING INDEX-EXTERNAL ADAPTER-3')"을 포함하는 구성을 포함하는 시퀀싱-기반 프라이머 세트로부터 영역을 추가하는 단계를 포함할 수 있다.
시퀀싱-준비된 태그된 표적 분자 세트(및/또는 방법(100)의 구현의 적절한 부분)를 생성하는 단계는 추가로 또는 대안적으로 하나 이상의 보충 증폭 공정(예를 들어, 태그된 표적 분자 및/또는 다른 적절한 구성 등의 농도를 증가시키는 기능을 수행할 수 있음)을 수행하는 단계를 포함할 수 있다. 일 예에서, 방법(100)은 보충적 PCR 공정(예를 들어, 제3 PCR 공정, 여기서 태그된 표적 분자를 생성하는 단계는 제1 PCR 공정을 수행하는 단계를 포함하고, 여기서 시퀀싱-준비된 태그된 표적 분자의 세트를 생성하는 단계는 제2 PCR 공정을 수행하는 단계를 포함; 등)을 수행하는 단계를, 예를 들어 시퀀싱-준비된 태그된 표적 분자세트를 생성하는데 사용된 PCR 공정(예를 들어, 제2 PCR 공정 등)에 의해 추가된 시퀀싱 어댑터 영역에서 어닐링하는 프라이머를 기초로(예를 들어, 이를 사용하는 등) 포함할 수 있다. 특정 예에서, 보충적 PCR 공정을 수행하는 단계는 임계 조건(예를 들어 1 pM 미만의 농도 등)을 만족시키는 농도(예를 들어, 산물 농도; 시퀀싱-준비된 태그된 표적 분자 세트 생성하는 단계로부터의 산물의 농도; 제2 PCR 공정으로부터의 산물; 등)에 기초할 수 있다.
그러나, 시퀀싱-준비된 태그된 표적 분자 세트를 생성하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
2.5 결합된 시퀀싱 라이브러리 제조.
추가로 또는 대안적으로, 도 2, 3 및 5에 도시된 바와 같이, 방법(100)의 구현예는 미생물과 관련된 앰플리콘-관련 시퀀싱 및 메타게놈-관련 시퀀싱과 관련된 조합된 시퀀싱 라이브러리를 제조하는 단계 S150를 포함할 수 있으며, 이는 앰플리콘-관련 시퀀싱 및 메타게놈-관련 시퀀싱 둘 다와 관련된 결합된 시퀀싱 기술을 용이하게 하는 기능을 할 수 있다. 일 예에서, 방법(100)의 구현예의 일부는 시퀀싱-준비된 표적 분자 세트로부터 유래된(예를 들어, 시퀀싱-준비된 표적 분자 세트의 시퀀싱에 기초하여 유래된) 미생물 서열 데이터세트에 기초하여 미생물 군집으로부터 특정 미생물의 식별(및/또는 마이크로바이옴 조성, 기능 및/또는 적합한 미생물-관련 양상과 관련하여 적절한 마이크로바이옴의 특성화 수행) (예를 들어, 하나 이상의 미생물 분류군(taxa)의 풍부도(abundance), 존재, 부재의 결정 등)을 포함 할 수 있다.
조합된 서열 라이브러리는 바람직하게는 앰플리콘-관련 시퀀싱(예를 들어, 앰플리콘을 포함하는 성분; 태그된 앰플리콘과 같은 앰플리콘-관련 성분과 메타게놈-성분 사이의 농도 비율의 균형과 관련하여 가공 처리된 것과 같은, 메타게놈-관련 성분과 관련하여 처리된 것과 같은, 시퀀싱의 제조를 위한 것과 같은 처리된 앰플 리콘; 앰플리콘 생성 및/또는 처리와 관련된 생산량; 등) 및 메타게놈-관련 시퀀싱(총 핵산의 단편을 포함하는 성분; 앰플리콘-관련 성분과 관련하여 처리되는 것과 같이, 시퀀싱을 용이하게 하기 위해, 처리된 단편; 태그된 단편; 총 핵산 자체; 등)과 관련된 성분(예를 들어, 시퀀싱 가능한 성분, 표적, 태그된 분자, 총 핵산의 단편, 앰플리콘-관련 성분, 메타게놈-관련 성분 등)을 포함하지만, 그러나 추가로 또는 대안적으로 임의의 적절한 구성을 포함할 수 있다.
앰플리콘은 바람직하게는 PCR 공정으로부터의 증폭된 산물(예를 들어, 핵산 표적과 같은 하나 이상의 표적을 포함하는 산물)을 포함하지만, 증폭 공정과 관련된 임의의 적합한 산물을 추가로 또는 대안적으로 포함할 수 있다. 앰플리콘-관련 시퀀싱은 바람직하게는 생물학적 샘플에서 하나 이상의 미생물 분류군의 확인을 위한, 단일 또는 소수의 표적(예를 들어, 유전자 영역)의 분석과 관련된 시퀀싱을 포함하지만, 그러나 추가적으로 또는 대안적으로 앰플리콘과 관련된 임의의 시퀀싱을 포함할 수 있다. 메타게놈-관련 시퀀싱은 바람직하게는 단일 유전자 앰플리콘의 분석과는 대조적인 전체 DNA 커뮤니티를 포함하는 것과 같은 미생물 커뮤니티 및/또는 다른 적합한 생태 커뮤니티(예를 들어, 하나 이상의 생물학적 샘플 내에 존재하는)의 분석과 관련된 시퀀싱을 포함하지만, 미생물 커뮤니티(예를 들어, 조성-관련 분석, 기능-관련 분석 등과 관련된), 생태 커뮤니티, 미생물 그룹 및/또는 메타게놈-관련 양상과 관련된 임의의 적합한 시퀀싱을 추가로 또는 대안적으로 포함 할 수 있다.
조합된 시퀀싱 라이브러리를 제조하는 부분은 방법(100)의 구현예의 일부와 함께 임의의 적합한 관계(예를 들어, 전, 후, 동안, 연속적으로, 병렬로와 같은 시간적 관계; 인풋(input) 및/또는 아웃풋(out)으로 생성된 구성 요소와 관련한 관계)로 수행될 수 있다.
변형에서, 하나 이상의 조합된 시퀀싱 라이브러리를 제조하는 부분은 표적 분자를 태깅하는 단계 S130 및/또는 방법(100)의 구현예의 적절한 부분과 관련하여 기술된 임의의 적절한 공정(및/또는 유사한 공정)을 포함할 수 있다.
그러나, 조합된 시퀀싱 라이브러리를 제조하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
2.5.A 표적-관련 증폭 생성.
방법(100)의 구현예(예를 들어, 조합된 시퀀싱 라이브러리를 제조하는 단계를 포함하는 방법(100)의 구현예의 일부)는 앰플리콘-생성 프라이머 세트 및 미생물과 관련된 적어도 하나의 생물학적 샘플로부터의 타겟 세트(예를 들어, 핵산 타겟 등)를 갖는 증폭 공정에 기초하여 타겟-관련 앰플리콘 세트를 생성하는 단계 S152를 포함할 수 있으며, 이는 앰플리콘-관련 시퀀싱을 용이하게 하는 앰플리콘을 생성하는 기능을 할 수 있다.
표적-관련된 앰플리콘 세트를 생성하는 단계는 바람직하게는, 앰플리콘-생성 프라이머 세트의 사용과 같은, PCR 공정(예를 들어, 방법(100)의 구현예에서의 조합된 시퀀싱 라이브러리를 제조하기 위한 3 단계 PCR 공정의 제1 PCR 공정)을 기반으로 하지만(예를 들어, 사용; 이를 이용하여 처리; 등을 포함), 추가로 또는 대안적으로 임의의 적합한 증폭 공정에 기초할 수 있다. 앰플리콘-생성 프라이머는 바람직하게는 하나 이상의 어댑터 영역(예를 들어, 방법(100)의 구현예의 일부의 후속 공정에서, 예를 들어, 후속 PCR 공정 등을 용이하게 하는 단계에서, 후속 프라이머의 결합과 같은, 표적화를 용이하게 하기 위한, 표적-관련 앰플리콘과 관련된 어댑터 영역) 및 하나 이상의 표적-관련 영역(예를 들어, 결합, 어닐링 및/또는 하나 이상의 표적에 대한 다른 적합한 커플링 등을 용이하게 하기 위해)을 포함할 수 있다. 일 예에서, 앰플리콘 생성 프라이머 세트는 앰플리콘 생성 프라이머의 제1 서브세트를 포함할 수 있으며, 제1 서브세트의 각각의 앰플리콘-생성 프라이머는 제1 앰플리콘-관련 어댑터 영역 및 핵산 표적 세트의 적어도 하나의 핵산 표적의 순방향 서열과 관련된 제1 표적-관련 영역; 및 제2 서브세트의 각각의 앰플리콘-생성 프라이머는 제2 앰플리콘-관련 어댑터 영역 및 상기 핵산 표적 세트의 적어도 하나의 핵산 표적의 역방향 서열과 관련된 제2 타겟-관련 영역을 포함하는 앰플리콘-생성 프라이머의 제2 서브세트를 포함하며, 예를 들어 표적-관련 앰플리콘 세트를 생성하는 단계는 앰플리콘-생성 프라이머의 제1 및 제2 서브세트를 이용한 증폭(예를 들어, PCR 공정 등)에 기초하여 표적-관련 앰플리콘 세트를 생성하는 단계를 포함한다. 특정 예에서, 앰플리콘-생성 프라이머 세트는 제1 프라이머 유형에 상응하고 "5'-어댑터 A1-표적 DNA 서열-순방향-3'(5'-ADAPTER A1-TARGET DNA SEQUENCE-FORWARD-3')"을 포함하는 구성을 포함하는 제1 프라이머; 및 제2 프라이머 유형에 상응하고 "5'-어댑터 A2-표적 DNA 서열-역방향-3'(5'-ADAPTER A2-TARGET DNA SEQUENCE-REVERSE-3')"을 포함하는 구성을 포함하는 제2 프라이머를 포함하며; 여기서 "표적 DNA 서열(TARGET DNA SEQUENCE)"는 하나 이상의 핵산 표적(예를 들어 관심 유전자 세그먼트(genetic segment))의 증폭을 가능하게 하는 임의의 서열을 포함할 수 있으며, 이때 "어댑터(ADAPTER) A1" 및 "어댑터(ADAPTER) A2"는 앰플리콘-관련 어댑터 영역을 포함하여 프라이머 및/또는 다른 적합한 분자가, 예를 들어 방법(100)의 구현예의 후속 부분에서, 결합하게 할 수 있다(예를 들어, 시퀀싱-준비된 표적 분자를 생성하는 단계와 관련하여; 시퀀싱-준비된 분자를 생성하는 단계에서 등의; 후속 PCR 공정). 특정 예에서, 앰플리콘-생성 프라이머는 외부 어댑터 영역을 포함하는 어댑터 영역을 포함할 수 있다(예를 들어, 시퀀싱-기반 프라이머의 어댑터 영역 등과 같은, 시퀀싱-기반 프라이머와의 어닐링, 바인딩, 및/또는 다른 적절한 관련을 용이하게 하기 위해). 그러나, 앰플리-생성 프라이머는 임의의 적합한 성분을 포함할 수 있고 임의의 적절한 방식으로 구성될 수 있다.
변형에서, 표적-관련 앰플리콘 세트를 생성하는 단계는 하나 이상의 표적을 하나 이상의 UMI-기반 분자(예를 들어, UMI 영역 및/또는 UMI-기반 분자의 다른 영역 등)로 태깅하는 것과 같은(예를 들어, 증폭 공정 등을 통해), 하나 이상의 표적을 태깅하는 단계를 포함할 수 있다. 일 예에서, 앰플리콘-생성 프라이머 세트는 UMI-기반 프라이머(예를 들어, 상응하는 증폭 공정 등에 사용하기 위해)를 포함할 수 있다. 특정 예에서, 앰플리콘-생성 프라이머 세트는 앰플리콘-생성 프라이머의 제1 서브세트 및 제2 서브세트를 포함할 수 있으며, 여기서 앰플리콘-생성 프라이머의 제1 서브세트는 제1 UMI-기반 프라이머를 포함할 수 있고, 제1 UMI-기반 프라이머들의 각각의 UMI-기반 프라이머는 제1 앰플리콘-관련 어댑터 영역, 제1 표적-관련 영역 및 제1 UMI 영역을 포함하며; 앰플리콘-생성 프라이머의 제2 서브세트는 제2 UMI-기반 프라이머를 포함할 수 있고, 제2 UMI-기반 프라이머들의 각각의 UMI-기반 프라이머는 제2 앰플리콘-관련 어댑터 영역, 제2 표적-관련 영역 및 제2 UMI 영역을 포함한다. 그러나, 하나 이상의 표적(예를 들어, 핵산 표적 등)을 태깅하는 단계 및/또는 표적-관련 앰플리콘을 생성하는 단계와 관련한 UMI-기반 분자 및/또는 UMI 영역을 이용한 임의의 적합한 공정을 수행하는 단계가 임의의 적합한 방식으로 수행 될 수 있다.
앰플리콘은 임의의 적합한 크기(예를 들어, 임의의 적합한 서열 길이 등)를 포함 할 수 있고, 이는 임의의 적합한 수 및/또는 표적의 유형 및/또는 다른 적합한 성분의 증폭으로부터 생성될 수 있다. 그러나, 표적-관련된 앰플리콘 세트를 생성하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
2.5.B 메타게놈 -관련 단편 생성.
방법(100)의 구현예(예를 들어, 조합된 시퀀싱 라이브러리를 제조하는 단계를 포함하는 방법(100)의 구현예의 일부)는 하나 이상의 생물학적 샘플로부터의 총 핵산 세트의 처리에 기초하여, 미생물 군집과 관련된 메타게놈-관련 단편 세트(예를 들어, 메타게놈-관련 핵산 단편 등)를 생성하는 단계 S154를 포함할 수 있으며, 이는 메타게놈-관련 시퀀싱을 용이하게 하는 단편을 생성하는 기능을 할 수 있다.
메타게놈-관련 단편은 전체 핵산의 미가공(raw) 단편(예를 들어, 하나 이상의 생물학적 샘플의 전체 핵산에 대해 단편화 공정을 수행한 산물 등), 전체 핵산의 가공된 단편(예를 들어, 하나 이상의 어댑터 영역, UMI-기반 분자, 어떠한 적절한 영역, 및/또는 임의의 적합한 성분을 포함하는 및/또는 이로 태그된 단편; 전처리된 총 핵산 및/또는 다른 적적한 성분의 단편; 정제된 단편 등) 및/또는 총 핵산의 임의의 적합한 단편 및/또는 하나 이상의 생물학적 샘플의 다른 적절한 성분을 포함할 수 있다.
메타게놈-관련 단편은 바람직하게는 하나 이상의 미생물 군집과 관련된다. 미생물 군집은 바람직하게는 복수의 분류군(예를 들어, 계(kingdoms), 문(phyla), 강(classes), 목(orders), 과(families), 속(genera), 종(species), 아종(subspecies), 균주(strains) 및/또는 다른 적합한 미생물 그룹 등을 포함하는 분류군)으로부터의 미생물(예를 들어, 사용자의 샘플 수집 위치와 같은, 사용자의 생리학적 영역과 같은, 공통의 생활 공간을 공유하는 등)을 포함하지만, 대안적으로, 단일 분류군의 미생물만 포함할 수도 있다. 추가로 또는 대안적으로, 미생물 군집은 미생물 간의 상호 작용, 미생물 간의 상호 작용의 산물, 미생물 간의 관계, 미생물 및/또는 미생물 군집과 관련된 기능적 특징(예를 들어, 기능적 프로파일 등), 미생물 및/또는 미생물 군집, 및/또는 미생물 및/또는 미생물 군집과 관련된 임의의 다른 적합한 성분 및/또는 특징과 관련된 조성 특징(예를 들어, 분류학적 프로파일)을 포함할 수 있다.
메타게놈-관련 단편 세트를 생성하는 단계는 바람직하게는 전체 핵산 세트를 처리하는 단계에 기초하지만, 추가로 또는 대안적으로 임의의 적합한 구성(예를 들어, 핵산 단편, 핵산 표적과 같은 표적, 기타 적합한 구성 등)을 처리하는 단계에 기초할 수 있다.
메타게놈-관련 단편 세트를 생성하는 단계는(예를 들어, 총 핵산 세트를 처리하는 단계) 바람직하게는 전체 핵산 세트(예를 들어, 하나 이상의 생물학적 샘플로부터의 전체 핵산 세트의 전부 또는 서브세트)로부터의 전체 핵산으로 하나 이상의 단편화 공정(예를 들어, 단편화; 이들의 단편을 생성하는 단계 등)을 수행하는 단계를 포함하지만, 추가로 또는 대안적으로 메타게놈-관련 단편 생성을 용이하게 하기 위한 임의의 적합한 공정을 포함할 수 있다. 하나 이상의 단편화 공정을 수행하는 단계는(예를 들어, 방법(100)의 일 구현예의 임의의 적절한 부분과 관련하여; 메타게놈-관련 단편 세트를 생성하는 단계와 관련하여) 임의의 하나 이상의 효소적 가공(enzymatic processes)(예를 들어, 절단 DNA 등과 같은 절단 핵산의 하나 이상의 말단에 정의된 서열을 부가하기 위해 트랜스포사제(transposase)-타입 효소를 사용), 기계적 가공(예를 들어, 전체 핵산의 획득된 DNA 단편의 말단-수리(end-repairing), 및 수리된 DNA 말단에 UMI-기반 분자 및/또는 다른 적합한 태깅 분자를 결찰) 및/또는 임의의 적합한 유형의 단편화 가공을 포함할 수 있다. 단편화 공정(예를 들어, 총 핵산의 단편)의 산출물에 추가된 영역(예를 들어, 서열)은 프라이머 및/또는 다른 적합한 분자의 결합을 가능하게 하는 어댑터 영역과 같은 어댑터 영역(메타게놈-관련 단편-생성 어댑터 영역; 등)을, 예를 들어 방법(100)의 구현예의 후속 부분에서(예를 들어, 후속 PCR 공정; 예를 들어, 서열-준비된 표적 분자를 생성하는 단계와 관련하여 등) 포함할 수 있다. 그러나, 하나 이상의 단편화 공정(예를 들어, 하나 이상의 효소 공정; 하나 이상의 기계적 공정 등)을 수행하는 단계 및/또는 어댑터 영역 및/또는 다른 적합한 구성(예를 들어, 영역 등)을 추가하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
변형에서, 메타게놈-관련 단편 세트를 생성하는 단계는 하나 이상의 단편 (예를 들어, 전체 핵산의 단편 등) 및/또는 메타게놈-관련 단편 및/또는 전체 핵산과 관련된 다른 적합한 성분을 태깅하는 단계를 포함할 수 있으며, 예를 들어 하나 이상의 UMI-기반 분자 및/또는 다른 적합한 성분(예를 들어, 시퀀싱-기반 프라이머로 어닐링하기 위한 어댑터 영역과 같은, 시퀀싱-기반 프라이머로 후속 공정을 용이하게하기위한 어댑터 영역 등)으로 태깅하는 단계를 포함할 수 있다. 일 예에서, 메타게놈-관련 단편 세트를 생성하는 단계는 효소 가공 및 기계적 가공 중 적어도 하나를 사용하여 전체 핵산 세트를 처리하는 단계에 기초하여 단편을 생성하는 단계; 및 UMI-기반 분자를 단편에 결찰시키는 단계에 기초하여 메타게놈-관련 단편 세트를 생성하는 단계를 포함할 수 있다. 일 예에서, 메타게놈-관련 단편 세트를 생성하는 단계는 어댑터 영역(예를 들어, 외부 어댑터 영역, 메타게놈-관련 어댑터 영역 등), UMI 영역 및/또는 단편에 대한 임의의 다른 적합한 성분(예를 들어, 총 핵산 등)을 추가하기 위한 증폭 공정(예를 들어, PCR 공정)을 수행하는 단계를 포함 할 수 있다. 그러나, 하나 이상의 단편을 태깅하는 단계는 임의의 적합한 방식으로(예를 들어, PCR 공정과 같은 증폭 공정 등을 통해) 수행 될 수 있다.
메타게놈-관련 단편 세트를 생성하는 단계는 추가로 또는 대안적으로 전체 핵산 세트를 전처리(pre-processing)하는 단계(예를 들어, 하나 이상의 단편화 프로세스를 수행하기 전에; 단편화 공정을 수행하는 단계와 반복적으로 등)를 포함 할 수 있다. 전처리(예를 들어, 총 핵산 세트; 임의의 적합한 성분)는 임의의 하나 이상의 핵산의 형질전환(예를 들어, mRNA를 cDNA로 형질 전환), 표적-포획 공정 수행(예를 들어, 농축 공정, 배제 공정 등), 정제 공정 수행, 보충 증폭 공정 및/또는 임의의 적합한 전처리 공정을 포함할 수 있다. 일 예에서, 메타게놈-관련 단편 세트를 생성하는 단계는 전체 핵산 세트를 전처리하는 단계(예를 들어, 단편화 전에 등)를 포함할 수 있으며, 여기서 전체 핵산 세트를 전처리하는 단계는 다음 중 하나 이상을 포함한다: 총 핵산 세트로부터 mRNA를 cDNA로 형질전환시키고, 총 핵산 세트의 제1 핵산에 상응하는 제1 서열을 선택적으로 풍부하게 하는 제1 표적-포획 공정의 수행, 및 총 핵산 세트의 제1 핵산에 상응하는 제1 서열을 선택적으로 배제하는(예를 들어 고갈시키는 등) 제1 표적-포획 공정의 수행. 형질전환 핵산은 표적 유전자 및/또는 다른 표적(예를 들어, 하나 이상의 생물학적 샘플 내의 핵산 표적)의 발현의 검출을 용이하게 하고, 및/또는 바이러스(예를 들어, RNA 기반 게놈을 갖는 바이러스 등)의 존재 및/또는 다른 적합한 특성을 검출하기 위해 사용 될 수 있다. 예를 들어, 전처리는 단편화 전에 역전사효소 PCR(RT-PCR)에 의해 전체 핵산의 mRNA를 cDNA로 형질전환시키는 단계(예를 들어, RT-PCR이 샘플 내 mRNA의 전부 또는 실질적으로 전부를 역전사시키기 위해. 랜덤 프라이머를 사용하여 수행될 수 있는 경우; 또는 관심있는 mRNA를 표적으로 하는 프라이머를 사용하는 경우; 등) 및/또는 단편화 공정을 촉진하고 결합된 시퀀싱 라이브러리에 포함시키기 위한 다른 적절한 형질전환 단계를 포함할 수 있다. 표적-포획 공정을 수행하는 단계는 표적 서열에 상응하는 핵산을 농축 또는 배제하는 단계, 및/또는 적합한 유형의 표적을(예를 들어, 단편화 공정 전 등에) 농축 또는 배제(예를 들어, 고갈)하는 단계를 예를 들어 표적-포획 공정이 올리고뉴클레오티드-기반 공정을 포함할 수 있는 경우(예를 들어, 비드 서비스(bead service)에 고정되거나 부착된 올리고 뉴클레오티드를 사용하는 경우, 여기서 올리고뉴클레오티드는 표적 DNA 단편과 같은 표적 핵산의 서열과 혼성화될 수 있음) 포함할 수 있다. 그러나, 총 핵산 세트를 전처리하는 것은 총 핵산 및/또는 다른 적합한 성분을 단편화하는 단계에 추가로 및/또는 대안적으로, 방법(100)의 구현예에서 메타게놈-관련 단편을 생성하는 단계의 임의의 적합한 부분에 추가로 및/또는 대안적으로, 및/또는 임의의 적합한 방식으로 수행될 수 있다.
그러나, 메타게놈-관련 단편의 생성 단계는 임의의 적합한 방식으로 수행될 수 있다.
2.5.C 시퀀싱-준비된 표적 분자 생성.
방법(100)의 구현예(예를 들어, 조합된 시퀀싱 라이브러리를 제조하는 단계를 포함하는 방법(100)의 구현예의 일부)는 표적-관련 앰플리콘 세트에 기초한 시퀀싱-준비된 세트(예를 들어, NGS- 준비) 표적 분자(예를 들어, 핵산 표적 등과 같은 하나 이상의 표적과 관련된), 메타게놈-관련 단편 세트(예를 들어, 메타게놈-관련 핵산 단편 등) 및 시퀀싱-기반 프라이머 세트를 생성하는 단계 S158를 포함할 수 있고, 이는 시퀀싱에 대한 준비를 위한(예를 들어 NGS; 앰플리콘-관련 시퀀싱 및 메타게놈-관련 시퀀싱을 동시에 포함하는 시퀀싱 등) 하나 이상의 표적-관련 앰플리콘 및/또는 메타게놈-관련 단편, 및/또는 다른 적합한 혼합물(예를 들어, 앰플리콘-관련 성분 및 메타게놈-관련 성분 등)을 가공하는 기능을 할 수 있다.
시퀀싱-준비된 표적 분자는 바람직하게는 하나 이상의 표적(예를 들어, 앰플리콘과 관련된) 및 미생물 군집(예를 들어, 메타게놈-관련 단편과 관련된; 표적이 총 핵산을 포함하는; 표적이 미생물의 복수의 분류군과 관련되는 경우 등)이지만, 추가로 또는 대안적으로 미생물 군집과 독립적인 하나 이상의 표적; 하나 이상의 표적과 독립적인 미생물 군집; 및/또는 다른 적합한 관심 대상과 관련될 수 있다. 시퀀싱-준비된 표적 분자를 생성하는 단계는 바람직하게는 표적-관련 앰플리콘 세트, 메타게놈-관련 단편 세트 및 시퀀싱-기반 프라이머 세트를 이용한 증폭 공정(예를 들어, 제2 PCR 공정을 포함하는 제2 증폭 공정, 여기서 표적-관련 앰플리콘을 생성하는 단계는 제1 PCR 공정을 포함하는 제1 증폭 공정 등을 포함할 수 있음)을 기초로 한다. PCR 공정은 바람직하게는 제한된 사이클(예를 들어, 임계량 미만 등)을 포함하지만, 임의의 적합한 사이클 수 등을 포함할 수 있다. 증폭 공정을 수행하는 단계는 바람직하게는 하나 이상의 어댑터 영역 및/또는 하나 이상의 인덱스 영역을(예를 들어, 증폭 공정을 통해) 표적-관련 앰플리콘 및/또는 메타게놈-관련 단편을 포함하는 것과 같은 화합물(예를 들어 혼합물)에 추가하는 단계를 포함할 수 있지만, 그러나 어댑터 영역, 인덱스 영역 및/또는 다른 적절한 영역은 임의의 적절한 방식으로 추가 될 수 있다(예를 들어, 결찰 공정 등). 일 예에서, 시퀀싱-기반 프라이머는 시퀀싱과 관련된 멀티플렉싱(예를 들어, NGS 등)을 용이하게 하도록 구성된 인덱스 영역(예를 들어, 시퀀싱 인덱스 영역 등을 포함) 및 시퀀싱과 관련된 어댑터 영역(예를 들어, NGS 등) 및 하나 이상의 프라이머 및/또는 어댑터 영역(예를 들어, 프라이머의 어댑터 영역과 같은 표적-관련 앰플리콘을 생성하는데 사용되는 프라이머; 표적-관련 앰플리콘의 어댑터 영역; 메타게놈-관련 단편의 어댑터 영역; 시퀀싱-기반 프라이머는 표적-관련 앰플리콘의 어댑터 영역 및/또는 메타게놈-관련된 단편의 어댑터 영역; 및/또는 다른 적합한 구성 등과 상보적이거나, 어닐링 가능하고 및/또는 이와 관련이 있는 어댑터 영역을 포함 할 수 있다)을 포함할 수 있다. 특정 예에서, 시퀀싱-기반 프라이머는 "5'-시퀀싱 어댑터-시퀀싱 인덱스-외부 어댑터-3'(5'-SEQUENCING ADAPTER-SEQUENCING INDEX-EXTERNAL ADAPTER-3')"을 포함하는 구성을 포함할 수 있다. 변형에서, 시퀀싱-기반 프라이머는 표적-관련 앰플리콘 및/또는 메타게놈-관련 단편의 어댑터 영역(예를 들어, 앰플리콘-관련 어댑터 영역; 메타게놈-관련 어댑터 영역; 앰플리콘-생성 어댑터 영역; 메타게놈-관련 단편-생성 어댑터 영역 등)과 어닐링하도록 구성된 영역(예를 들어, 어댑터 영역 등) 및/또는 다른 적합한 성분(예를 들어, 표적-관련 앰플리콘 및 메타게놈-관련 단편 등을 포함하는 혼합물에 포함)을 포함할 수 있다. 일 예에서, 시퀀싱-기반 프라이머는 앰플리콘-생성 어댑터 영역 및/또는 다른 적절한 어댑터 영역 (예를 들어, 메타게놈-관련 단편의 메타게놈-관련 어댑터 영역 등)과 어닐링하도록 구성된 영역을 포함할 수 있다. 추가적으로 또는 대안적으로, S158과 관련된 시퀀싱-기반 프라이머는 S140과 관련된 시퀀싱-기반 프라이머와 동일하거나 유사하거나 또는 상이할 수 있다. 그러나, 시퀀싱-기반 프라이머는 임의의 적합한 방식으로 구성될 수 있고, 시퀀싱-준비된 표적 분자의 생성과 관련된 증폭 공정(예를 들어, PCR 공정)을 수행하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
변형에서, 시퀀싱-준비된 표적 분자를 생성하는 단계는 하나 이상의 전처리 공정 및/또는 후처리 공정을 수행하는 단계를 포함할 수 있다. 일 예로, 시퀀싱-준비된 표적 분자를 생성하는 단계는 표적-관련 앰플리콘, 메타게놈-관련 단편 및 시퀀싱-기반 프라이머 세트로 PCR 공정을 수행하는 단계; 및 상기 PCR 공정의 산물을 이용한 세정, 크기-선택, 보충 증폭 공정 수행, 정제, 농축, 배제 및/또는 임의의 적합한 공정(예를 들어, 임의의 적합한 시퀀싱 기술에 적합한 시퀀싱-준비된 표적 분자를 제조하기 위한 단계 등)을 수행하는 단계를 포함할 수 있다.
변형에서, 표적-관련 앰플리콘, 메타게놈-관련 단편, 및/또는 서열-기반 프라이머에 기초하여 시퀀싱-준비된 표적 분자 세트를 생성하는 단계는 시퀀싱-준비된 태그된 표적 분자를 생성하는 단계(S140)와 관련하여 기술된(예를 들어, 태그된 표적 분자 및/또는 시퀀싱-기반 프라이머에 기초하는 등) 임의의 적합한 공정(및/또는 유사한 공정들)을 포함할 수 있다. 그러나, 시퀀싱-준비된 표적 분자를 생성하는 단계는 임의의 적합한 방식으로 수행될 수 있다.
3.실시예들 .
일 예에서, 방법(100)의 구현예의 일부는 박테리아 16S 리보솜 유전자를 표적으로 하는 시퀀싱 라이브러리를 생성하기 위해 수행될 수 있다. 시퀀싱 라이브러리를 생성하는 단계는 2 개의 박테리아 DNA 풀의 정의된(defined) 혼합물을 포함하는 DNA 주형을 사용하는 것을 포함할 수 있으며, 이는 역 비율로 혼합될 수도 있다 (예를 들어, 도 6에 도시된 바와 같이). 풀의 각 멤버에 할당된 시퀀싱 리드 수를 비교하면, 각각의 조건에서, 그리고 검출된 각각의 유기체에 대하여 UMI-제외(excluding) 프라이머(예를 들어 UMI 영역이 없는 프라이머 등) 및 UMI-기반 프라이머에 대해 비슷한 리드 수를 얻을 수 있음을 알 수 있다.
일 예에서, 4N UMI 영역 또는 8N UMI 영역을 포함하는 UMI-기반 프라이머는 시퀀싱 라이브러리를 생성하기 위해 적용될 수 있으며, 예를 들어 특정 적용을 위해(예를 들어, 도 7에 도시된 바와 같이) 태깅 효율이 "N" 염기의 수와 반비례하는 경우와 같이, "N" 염기의 수가 4N에서 8N으로 증가 될 때(및/또는 일반적으로 증가 할 때) 다수의 할당된 시퀀싱 리드가 감소할 수 있다. 이 예에서, 태깅 효율을 향상시키기 위해 태깅 촉진 분자를 추가할 수 있다(예를 들어, 태그된 표적 분자를 생성하는 PCR 공정과 관련된 효율 등). 특정 예에서, 도 8에 도시된 바와 같이, 8N UMI 영역을 포함하는 UMI-기반 프라이머를 사용하는 PCR 공정에 MgCl2, DMSO 및/또는 극도의 열안정성 극도의 열안정성 단일-가닥 DNA 결합 단백질을 포함하는 태깅 촉진 분자 세트를 첨가하는 것은 증폭 및/또는 태깅 효율을 향상시킬 수 있다(예를 들어, 도 8에 도시된 바와 같이, 아가로스 겔 전기영동에 의해 분석된 바와 같이, 대장균 게놈 DNA의 단일 DNA 주형을 사용한 16S 유전자의 증폭이 다양한 DNA 인풋에 대해 개선될 수 있는 경우 등). 특정 예에서, 도 9a-9b에 도시된 바와 같이, 4N UMI 영역 또는 8N UMI 영역을 포함하는 UMI-기반 프라이머를 사용하는 PCR 공정에 대해 태깅 촉진 분자를 추가하면 태깅 효율을 향상시킬 수 있다(예를 들어, 더 많은 수의 다른 UMI 태그들 등). 특정 예에서, 도 10a-10b에 도시된 바와 같이, 4N UMI 영역 또는 5N UMI 영역(예를 들어, 도 10a-10b에 도시된 바와 같은)을 포함하는 UMI 기반 프라이머를 이용한 PCR 공정에 대해 태깅 촉진 분자를 첨가하면 증가 된 리드 수의 결과를 초래할 수 있으며, 특정 예에서(예를 들어, 도 11a-11b에 도시된 바와 같이) 표적 서열, 예를 들어 30%가, 고유의(unique) UMI를 나타낼 수 있다(예를 들어, 미생물 군집 표준 샘플 등의 경우). 그러나, 태깅 촉진 분자를 추가하면 임의의 적절한 개선 정도를 부여할 수 있다.
일 예에서, 하나 이상의 링커 영역(예를 들어, UMI 영역 및 표적-관련 영역을 분리하는)을 포함하는 UMI-기반 분자를 사용하는 것은 프라이머(예를 들어, "N"길이가 더 큰 UMI 영역이 이용된 경우)를 이용한 증폭 효율을 향상시킬 수 있다. 특정 예에서, 도 12에 도시된 바와 같이, 16S 영역의 증폭은 UMI 영역과 표적-관련 영역을 분리하는 7개 염기-길이 링커 영역을 포함하는 UMI-기반 프라이머를 사용함으로써 개선될 수 있다.
일 예에서, 방법(100)의 구현예의 일부는 인간 대변 생물학적 샘플로부터 조합된 시퀀싱 라이브러리를 제조하는 단계를 포함할 수 있지만, 조합된 서열 라이브러리는 추가로 또는 대안적으로 임의의 적합한 생물학적 샘플(예를 들어, 임의의 적절한 사용자로부터; 임의의 적절한 수집 장소로부터, 등)로부터 제조될 수 있다. 특정 예에서, 조합된 서열 라이브러리는 단일 사용자로부터의 대변 샘플로부터 구축될 수 있으며; 다수(예를 들어, 수백 등)의 시퀀싱 실행(run)으로부터의 샘플의 박테리아 분류군(taxa) 분석은 통계적으로 유의한 재현가능한 다양성(예를 들어, 견고성(robustness) 및 일관성을 나타내는 등)을 나타낼 수 있다. 특정 예에서, 조합된 시퀀싱 라이브러리는 조합된 시퀀싱 라이브러리의 앰플리콘-관련 성분으로 표현된 모든 종(및/또는 다른 적합한 분류군)을 포함하는 것을 나타내는 결과를 초래할 수 있고, 앰플리콘-집중(focused) 접근법(예를 들어 테네리쿠테스문(Tenericutes phylum) 등)만을 이용하는 경우 박테리아 분류군의 높은 표현이 낮게(underrepresented) 나타날 수 있다. 특정 예에서, 조합된 시퀀싱 라이브러리를 제조하는 단계와 관련된 공정은 주어진 미생물의 존재 또는 부재를 확인하기 위해 앰플리콘-관련 공정을 사용함으로써, 그리고 관심있는 핵산 표적(예를 들어, 항생제 내성 유전자, 독성 인자, 분비 시스템 등) 및/또는 적절한 다른 표적을 확인하기 위해 메타게놈-관련 공정을 사용함으로써 상이한 유기체 및 관심있는 특정 핵산 표적의 확인에 사용될 수 있다(예를 들어, 16S 영역, 18S 영역, ITS 등을 기초로 하고, 및/또는 포함하는 등).
일 예에서, 방법(100) 및/또는 시스템(200)은 종래의 접근법들에 비하여 개선을 제공할 수 있다. 방법(100) 및/또는 시스템(200)의 특정 예는 적어도 종래의 접근법과 관련된 도전에 대한 기술적-기반의 해결책을 부여할 수 있다. 일 예에서,상기 기술은 개체(예를 들어 생물학적 샘플, 핵산 표적, 프라이머, UMI-기반 분자, 사용자 등의 표적)를 다른 상태 또는 사물로 변환할 수 있다. 특정 예에서, 핵산 표적은 개선된 시퀀싱(예를 들어, 감소된 편향, 개선된 정량화와 같은 개선된 분석 관련 등) 등에 적합하도록, 시퀀싱-준비된 표적 분자 및/또는 시퀀싱-준비된 태그된 표적 분자로 변환될 수 있다. 특정 예에서, 개선된 시퀀싱 라이브러리가 제조 될 수 있으며, 예를 들어 하나 이상의 미생물-관련 컨디션과 관련된 개선된 진단 및/또는 요법을 촉진하여 하나 이상의 사용자를 변형시키는 것과 같은, 개선된 마이크로바이옴 특성화를 유도할 수 있다. 그러나, 실시예에서, 상기 기술은 임의의 적절한 방식으로 실체를 변환할 수 있다.
방법(100) 및/또는 시스템(200)의 구현예는 임의의 변형(예를 들어, 구현예, 변형, 실시예, 특정 예, 도면 등)을 포함하여 다양한 시스템 구성 및 다양한 방법 공정의 모든 조합 및 순열(치환, permutation)을 포함할 수 있으며, 이때 본 명세서에 기술된 방법(100) 및/ 공정의 구현예의 일부가 하나 이상의 사례, 요소, 구성 및/또는 시스템(200) 및/또는 본 명세서에 기술된 다른 실체의 다른 측면에 의해 및/또는 이의 사용에 의해 비동기적으로(예를 들어, 순차적으로), 동시에(예를 들어, 병렬로), 또는 임의의 다른 적절한 순서로 수행될 수 있다.
본 명세서에 기재된 임의의 변이체(예를 들어, 구현예, 변형, 실시예, 특정 예, 도면 등) 및/또는 본 명세서에 기재된 변이체의 임의의 부분은 추가로 또는 대안적으로 조합, 집합, 배제, 사용, 연속적으로 수행, 병렬로 수행 및/또는 다른 방식으로 적용될 수 있다.
방법(100) 및/또는 시스템(200)의 구현예의 일부는 컴퓨터-판독가능한 명령을 저장하는 컴퓨터-판독가능 매체를 수신하도록 구성된 기계로서 적어도 부분적으로 구현(embodied) 및/또는 이행(implemented)될 수 있다. 상기 명령은 시스템과 통합될 수 있는 컴퓨터-실행가능(executable) 구성 요소에 의해 실행될 수 있다. 상기 컴퓨터-판독가능 매체는 RAMs, ROMs, 플래시 메모리, EEPROMs, 광학 장치(CD 또는 DVD), 하드 드라이브, 플로피 드라이브 또는 임의의 적절한 장치와 같은 임의의 적합한 컴퓨터-판독가능 매체 상에 저장될 수 있다. 상기 컴퓨터-실행가능 구성 요소는 일반적인 또는 애플리케이션 특이적 프로세서(processor)일 수 있지만, 임의의 적합한 전용 하드웨어 또는 하드웨어/펌웨어 조합 장치가 대안적으로 또는 추가적으로 명령을 실행할 수 있다.
당업자는 이전의 상세한 설명 및 도면 및 청구범위로부터 인식할 수 있는 바와 같은 정의된 범위로부터 벗어나지 않고 방법(100), 시스템(200) 및/또는 청구항에 정의된 견지를 벗어나지 않는 변형의 구현예에 대한 수정 및 변경이 이루어질 수있다.

Claims (22)

  1. ● 각각의 프라이머가 하기의 고유 분자 식별자(UMI) 영역 및 표적 영역을 포함하는 제 1 프라이머 세트의 제조 단계:
    o 각각의 랜덤 "N" 염기가 "A" 염기, "G" 염기, "T" 염기 및 "C" 염기 중 어느 하나로부터 선택되는, 랜덤 "N" 염기 세트를 포함하는 UMI 영역; 및
    o 핵산 표적 세트의 적어도 하나의 핵산 표적에 상보적인 표적 영역;
    ● 각각의 프라이머가 NGS 어댑터 영역을 포함하는, 제 2 프라이머 세트를 준비하는 단계;
    ● 제 1 프라이머 세트, 및 핵산 표적 세트를 포함하는 적어도 하나의 샘플을 이용한 제1 증폭 공정에 기초하여 태그된(tagged) 표적 분자의 세트를 생성하는 단계; 및
    ● 태그된 표적 분자 및 제 2 프라이머 세트를 이용한 제2 증폭 공정에 기초하여 NGS 준비된(ready) 태그된 표적 분자 세트를 생성하는 단계
    를 포함하는, 차세대 시퀀싱(NGS)을 위한 라이브러리 제조방법으로서,
    상기 제 1 프라이머 세트는 하나 이상의 핵산 표적에 대한 완전한 상보성(full complementarity)이 없는 링커 영역을 추가로 포함하고,
    상기 링커 영역은 UMI 영역과 표적 영역 사이에 위치하고, 21 염기 미만의 길이인 것을 특징으로 하는, NGS를 위한 라이브러리 제조방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    ● 상기 제 1 프라이머 세트는 외부 어댑터 영역을 더 포함하고,
    ● 상기 태그된 표적 분자의 세트는 상기 외부 어댑터 영역을 포함하고,
    ● 상기 NGS 준비된(ready) 태그된 표적 분자 세트를 생성하는 단계는 태그된 표적 분자의 외부 어댑터 영역에 태그된 표적 분자와 제 2 프라이머 세트를 어닐링하는 단계를 포함하는, 방법.
  6. 제1항에 있어서,
    상기 태그된 표적 분자의 세트를 생성하는 단계는, 상기 제 1 프라이머 세트; 적어도 하나의 생물학적 샘플; 및 MgCl2, 디메틸 설폭사이드(DMSO), 열안정성 핵산 결합 단백질, 베타인, 포름아미드, 트윈, 트리톤, NP-40, 테트라메틸 암모늄 클로라이드(TMAC) 및 소혈청 알부민(BSA) 중 적어도 하나를 포함하는 태깅(tagging) 촉진 분자 세트를 이용하여 상기 제1 증폭 공정을 수행하는 단계를 포함하는, 방법.
  7. 제6항에 있어서,
    상기 열안정성 핵산 결합 단백질은, 열안정성 단일 가닥 DNA 결합 단백질을 포함하고,
    상기 태그된 표적 분자 세트를 생성하는 단계는, 제 1 프라이머 세트; 적어도 하나의 샘플; 및 MgCl2 및 열안정성 단일 가닥 DNA 결합 단백질을 포함하는 태깅 촉진 분자 세트를 이용한 제1 증폭 공정을 수행하는 단계를 포함하는, 방법.
  8. 제1항에 있어서,
    상기 태그된 표적 분자 세트를 생성하는 단계는, 상기 제1 증폭 공정의 산물로 정제 공정을 수행하여 상기 제1 증폭 공정의 산물로부터 제 1 프라이머 세트를 제거하는 단계를 포함하는, 방법.
  9. 제1항에 있어서,
    ● 상기 제1 증폭 공정은 제1 중합효소 연쇄 반응(PCR) 공정을 포함하고,
    ● 상기 제2 증폭 공정은 제2 PCR 공정을 포함하고,
    ● 상기 제 2 프라이머 세트는 NGS 다중화(multiplexing)를 촉진하도록 구성된 인덱스 영역을 추가로 포함하고; 그리고
    ● 상기 NGS 준비된(ready) 태그된 표적 분자 세트를 생성하는 단계는, 태그된 표적 분자 및 제 2 프라이머 세트를 이용한 제2 PCR 공정에 기초하여, 인덱스 영역 및 어댑터 영역을 태그된 표적 분자 세트의 태그된 표적 분자에 첨가하는 단계를 포함하는, 방법.
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
KR1020207001760A 2017-06-20 2018-06-20 고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템 KR102683229B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762522293P 2017-06-20 2017-06-20
US62/522,293 2017-06-20
US201762582162P 2017-11-06 2017-11-06
US62/582,162 2017-11-06
PCT/US2018/038628 WO2018237092A1 (en) 2017-06-20 2018-06-20 METHOD AND SYSTEM FOR LIBRARY PREPARATION WITH UNIQUE MOLECULAR IDENTIFIERS

Publications (2)

Publication Number Publication Date
KR20200059208A KR20200059208A (ko) 2020-05-28
KR102683229B1 true KR102683229B1 (ko) 2024-07-08

Family

ID=62904596

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207001760A KR102683229B1 (ko) 2017-06-20 2018-06-20 고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템

Country Status (8)

Country Link
US (2) US20180362967A1 (ko)
EP (1) EP3642357A1 (ko)
JP (1) JP2020528740A (ko)
KR (1) KR102683229B1 (ko)
CN (1) CN111201323A (ko)
AU (1) AU2018288849A1 (ko)
SG (1) SG11201912798VA (ko)
WO (1) WO2018237092A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022548000A (ja) * 2019-09-11 2022-11-16 パランカ・リミテッド シーケンシングライブラリーの多重製造方法
JP2023513314A (ja) 2020-02-13 2023-03-30 ザイマージェン インコーポレイテッド メタゲノムライブラリーおよび天然物発見プラットフォーム
CN112176032B (zh) * 2020-10-16 2021-10-26 广州市达瑞生物技术股份有限公司 一个呼吸道病原体的纳米孔测序建库的引物组合及其应用
WO2022125939A1 (en) * 2020-12-10 2022-06-16 The United States Government Methods for detecting homogenous targets in a population with next generation sequencing
CN112687339B (zh) * 2021-01-21 2021-12-14 深圳吉因加医学检验实验室 一种统计血浆dna片段测序数据中序列错误的方法和装置
CN113621609A (zh) * 2021-09-15 2021-11-09 深圳泛因医学有限公司 文库构建引物组及其在高通量检测中的应用
WO2023154746A2 (en) * 2022-02-11 2023-08-17 The Broad Institute, Inc. Compositions and methods for characterizing low frequency mutations

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016118719A1 (en) * 2015-01-23 2016-07-28 Qiagen Sciences, Llc High multiplex pcr with molecular barcoding
WO2016138490A1 (en) * 2015-02-27 2016-09-01 Fluidigm Corporation Single-cell nucleic acids for high-throughput studies

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2201143B2 (en) * 2007-09-21 2016-08-24 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
WO2013003489A2 (en) * 2011-06-27 2013-01-03 University Of Florida Research Foundation, Inc Method for genome complexity reduction and polymorphism detection
CA2867293C (en) * 2012-03-13 2020-09-01 Abhijit Ajit PATEL Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
PT2850211T (pt) * 2012-05-14 2021-11-29 Irepertoire Inc Método para aumentar a precisão na deteção quantitativa de polinucleótidos
WO2014138999A1 (en) * 2013-03-14 2014-09-18 University Of Ottawa Methods for the diagnosis and treatment of inflammatory bowel disease
WO2017044574A1 (en) * 2015-09-11 2017-03-16 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016118719A1 (en) * 2015-01-23 2016-07-28 Qiagen Sciences, Llc High multiplex pcr with molecular barcoding
WO2016138490A1 (en) * 2015-02-27 2016-09-01 Fluidigm Corporation Single-cell nucleic acids for high-throughput studies

Also Published As

Publication number Publication date
AU2018288849A1 (en) 2020-02-06
CN111201323A (zh) 2020-05-26
JP2020528740A (ja) 2020-10-01
WO2018237092A1 (en) 2018-12-27
EP3642357A1 (en) 2020-04-29
KR20200059208A (ko) 2020-05-28
SG11201912798VA (en) 2020-01-30
US20200123539A1 (en) 2020-04-23
US20180362967A1 (en) 2018-12-20

Similar Documents

Publication Publication Date Title
KR102683229B1 (ko) 고유 분자 식별자를 갖는 라이브러리 제조 방법 및 시스템
EP3679135B1 (en) Normalization for sequencing libraries
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
Mardis The impact of next-generation sequencing technology on genetics
Stothard et al. Whole genome resequencing of black Angus and Holstein cattle for SNP and CNV discovery
JP6803327B2 (ja) 標的化されたシークエンシングからのデジタル測定値
US20180051320A1 (en) Depletion of abundant sequences by hybridization (dash)
GB2496016A (en) Sequencing methods
Langevin et al. Peregrine: a rapid and unbiased method to produce strand-specific RNA-Seq libraries from small quantities of starting material
US20210388344A1 (en) Methods for determining recombination diversity at a genomic locus
JP2016103999A (ja) ゲノム位置に標的濃縮配列リードを割り当てるための方法
Thies Molecular approaches to studying the soil biota
JP7208230B2 (ja) 核酸配列を特性決定するための単一分子シーケンシング及び固有の分子識別子
Muthappan et al. Biome representational in silico karyotyping
JP2023534882A (ja) キメラアンプリコンアレイ配列決定
CN109385468B (zh) 检测链特异性效率的成套试剂与方法
Fang et al. High-resolution single-molecule long-fragment rRNA gene amplicon sequencing of bacterial and eukaryotic microbial communities
WO2022164893A1 (en) Quantification of cellular proteins using barcoded binding moieties
Leake Human identification through analysis of the salivary microbiome: proof of principle
CN118389700A (en) Method for analyzing body fluid donor in mixed spots based on body fluid specific mRNA cSNP

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant