KR20210059694A - 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약 - Google Patents

게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약 Download PDF

Info

Publication number
KR20210059694A
KR20210059694A KR1020217000422A KR20217000422A KR20210059694A KR 20210059694 A KR20210059694 A KR 20210059694A KR 1020217000422 A KR1020217000422 A KR 1020217000422A KR 20217000422 A KR20217000422 A KR 20217000422A KR 20210059694 A KR20210059694 A KR 20210059694A
Authority
KR
South Korea
Prior art keywords
sequence
cells
genome editing
population
dna
Prior art date
Application number
KR1020217000422A
Other languages
English (en)
Inventor
제시 제이. 솔크
찰스 클린턴 3세 발렌타인
Original Assignee
트윈스트랜드 바이오사이언시스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 트윈스트랜드 바이오사이언시스, 인코포레이티드 filed Critical 트윈스트랜드 바이오사이언시스, 인코포레이티드
Publication of KR20210059694A publication Critical patent/KR20210059694A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/109Characterised by chemical treatment chemical ligation between nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

게놈 편집, 클론 팽창을 규명하는 방법 및 이러한 방법에서 사용하기 위한 연관된 시약이 본원에 개시된다. 본 기술내용의 일부 실시형태는, 일부 실시형태에서 세포 집단의 게놈 내에 의도된 게놈 유전좌위 및 의도되지 않은 게놈 유전좌위 둘 다에서 발생하는 게놈 변경을 규명하는 것을 포함하는, 조작된 게놈 편집 사건 후에 세포 집단을 규명하는 것에 관한 것이다. 다른 실시형태는 게놈 편집 사건 후에 혼합된 세포 집단 및/또는 세포 집단에서 클론 선택을 평가하기 위한 듀플렉스 시퀀싱을 이용하는 것에 관한 것이다. 본 기술내용의 추가의 예는 게놈 편집 사건 후에 세포의 클론 팽창을 검출하고 평가하는 방법에 관한 것이다.

Description

게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약
관련 출원에 대한 상호-참조
본원은 2018년 6월 12일에 출원된 미국 가출원 제62/697,397호의 우선권 및 이익을 주장하고, 이의 개시내용은 그 전체가 본원에 참고로 포함된다.
다양한 분야에서 대해 혼합된 세포 집단에서, 예를 들어 암 유발자 돌연변이를 보유하는 세포의, 클론 팽창 및 초기 단계 신생물성 클론 선택을 위한 가능성의 평가에 대한 필요성이 있다. 그러나, 현재 사용되는 검정은 이러한 초기 단계 선택을 검출할 민감도를 제공하지 않는다. 추가로, 추가의 비표적화된 핵산 변경 없이 게놈 편집의 성공적인 적용을 평가하기 위한 도구를 위한 표적화된 게놈 편집의 분야에서의 필요성이 있다.
본 기술내용은 일반적으로 클론 선택 및/또는 팽창을 검출하고 평가하기 위한 방법, 및 이러한 방법에서 사용하기 위한 연관된 시약에 관한 것이다. 특히, 본 기술내용의 일부 실시형태는 사건(예를 들어, 게놈 편집, 돌연변이유발 등) 후에 혼합된 세포 집단 및/또는 세포 집단에서 클론 선택을 평가하기 위해 듀플렉스 시퀀싱을 이용하는 것에 관한 것이다.
일 실시형태에서, 본 기술내용은 의도된 게놈 유전좌위에 지향된 조작된 게놈 편집 사건 후에 세포 집단을 규명하는 방법을 포함하고, 상기 방법은 (a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자를 포함하는 샘플을 제공하는 단계; (b) 복수의 이중-가닥 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계이되, 복수의 어댑터-DNA 분자를 생성하기 위해 어댑터 분자를 복수의 이중-가닥 DNA 분자에 결찰하는 것; 어댑터-DNA 분자의 원래의 제1 가닥의 카피의 세트 및 어댑터-DNA 분자의 원래의 제2 가닥의 카피의 세트를 생성하는 것; 제1 가닥 서열 및 제2 가닥 서열을 제공하기 위해 원래의 제1 가닥 및 제2 가닥의 하나 이상의 카피를 시퀀싱하는 것; 제1 가닥 서열과 제2 가닥 서열 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 및 제2 가닥 서열을 비교하는 것을 포함하는 단계; 및 (c) 의도된 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기대된 게놈 편집된 DNA 서열과 비교하는 단계; 또는 (d) 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기준 게놈 DNA 서열과 비교하는 단계를 포함한다.
다른 실시형태에서, 본 기술내용은 세포 집단에서 조작된 게놈 편집 사건의 효율을 규명하는 방법을 포함하고, 조작된 게놈 편집 사건은 의도된 게놈 유전좌위에 표적화되고, 상기 방법은 (a) 게놈 편집 사건 후에 세포 집단으로부터 기원한 복수의 이중-가닥 DNA 분자를 포함하는 샘플로부터 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 복수의 어댑터-DNA 분자를 생성하기 위해 비대칭 어댑터 분자를 복수의 이중-가닥 DNA 분자에 결찰하는 것을 포함하는 단계; (b) 어댑터-DNA 분자의 적어도 일부에 대해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 제공하기 위해 어댑터-DNA 분자의 제1 가닥 및 제2 가닥을 시퀀싱하는 단계; (c) 각각의 시퀀싱된 어댑터-DNA 분자에 대해, 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 비교하는 단계; 및 (d) 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 분석하는 것에 의해; 그리고 기대된 게놈 서열과의 관련성을 비교하는 것에 의해 의도된 게놈 유전좌위를 포함하는 복수의 이중-가닥 DNA 분자 중에서 의도된 게놈 유전좌위에서의 기대된 게놈 서열의 빈도를 결정하는 단계를 포함한다.
다른 실시형태에서, 본 기술내용은 게놈-편집된 세포 집단으로부터 추출된 표적 이중-가닥 핵산 분자의 집단의 고정확도 시퀀싱 판독을 생성하는 방법을 포함하고, 상기 방법은 (a) 세포 집단으로부터 추출된 하나 이상의 표적 이중-가닥 핵산 분자를 듀플렉스 시퀀싱하는 단계; 및 (b) 표적화된 이중-가닥 DNA 분자에 대한 고정확도 공통 서열을 생성하는 단계이되, 표적 이중-가닥 핵산 분자는 DNA의 의도된 게놈 편집된 영역 및 DNA의 하나 이상의 의도되지 않은 게놈 영역을 포함하는 단계를 포함한다.
다른 실시형태에서, 본 기술내용은 DNA가 조작된 표적화된 게놈 편집 사건을 이용하여 의도된 유전자 유전좌위에서 성공적으로 게놈 편집되는지를 결정하기 위한 방법을 포함하고, 상기 방법은 (a) 조작된 표적화된 게놈 편집 사건 후에 샘플로부터 추출된 복수의 이중-가닥 DNA 분자에 대해 듀플렉스 오류-정정된 시퀀싱 판독을 제공하는 단계; 및 (b) 기준 게놈에서의 하나 이상의 유전자 유전좌위의 세트에서의 각각의 유전자 유전좌위에 대해, 듀플렉스 오류-정정된 시퀀싱 판독이 예상된 서열과 실질적으로 동일한 서열을 갖는 이중-가닥 DNA 분자를 정량화하는 단계를 포함한다.
다른 실시형태에서, 본 기술내용은 조작된 게놈 편집 사건 후에 세포 집단의 신생물성 가능성을 평가하는 방법을 포함하고, 상기 방법은 (a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자를 포함하는 샘플로부터 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 제1 태그화 가닥 및 제2 태그화 가닥을 갖는 복수의 태그화된 DNA 분자를 생성하기 위해 복수의 이중-가닥 DNA 분자를 태그화하는 것을 포함하는 단계; (b) 농후화된 태그화된 DNA 분자를 제공하기 위해 하나 이상의 암 유발자에 맵핑되는 태그화된 DNA 분자의 하위집단에 대해 제1 태그화 가닥 및 제2 태그화 가닥을 선택적으로 농후화하는 단계; (c) 복수의 농후화된 태그화된 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계이되, 오류-정정된 서열 판독을 생성하는 단계는 제1 가닥 서열 및 제2 가닥 서열을 제공하기 위해 농후화된 태그화된 DNA 분자로부터 유래된 하나 이상의 제1 태그화 가닥 및 제2 태그화 가닥을 시퀀싱하는 것; 제1 가닥 서열과 제2 가닥 서열 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 및 제2 가닥 서열을 비교하는 것을 포함하는 단계; 및 (d) 기준 게놈 서열과의 하나 이상의 관련성을 비교함으로써 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에 존재하는 변이체가 있는지를 결정하는 단계를 포함한다.
다른 실시형태에서, 본 기술내용은 조작된 게놈 편집 사건 후에 세포 집단에서의 세포의 클론 팽창을 검출하고/하거나 정량화하는 방법을 포함하고, 상기 방법은 (a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 하나 이상의 표적 이중-가닥 DNA 분자를 듀플렉스 시퀀싱하는 단계; (b) 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계; (c) 세포 집단으로부터 기원한 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체의 변이 빈도를 결정하는 단계; 및 (d) 하나 이상의 변이체의 각각에 대한 변이 빈도를 예상된 변이 빈도와 비교하는 단계를 포함한다.
본 기술내용의 다른 실시형태, 양태 및 이점은 하기 상세한 설명에 추가로 기재된다.
본 개시내용의 많은 양태는 도면을 함께 구성하는 하기 도면을 참조하여 더 잘 이해될 수 있다. 이 도면은 제한이 아니라 오직 예시 목적을 위한 것이다. 도면의 구성성분은 비율조정될 필요는 없다. 대신에, 본 개시내용의 원칙을 명확히 예시하는 데 강조가 이루어진다.
1a는 본 기술내용의 일부 실시형태와 사용하기 위한 예시적인 핵산 어댑터 분자 및 본 기술내용의 일부 실시형태에 따른 이중-가닥 핵산 단편에 대한 어댑터 분자의 결찰로부터 생긴 예시적인 이중-가닥 어댑터-핵산 복합체를 제공한다.
1b 및 도 1c는 본 기술내용의 일부 실시형태에 따른 다양한 듀플렉스 시퀀싱 방법 단계의 개념적 예시이다.
2는 본 기술내용의 일부 실시형태에 따라 게놈 변경(예를 들어, 지시된 게놈 변경, 변이체, 돌연변이 등)을 확인하고/하거나 정량화하고, 게놈 편집 사건(예를 들어, 조작된 게놈 편집 사건) 후에 클론 선택 및/또는 클론 팽창을 확인하기 위해 유용한 본원에 개시된 방법 및/또는 키트와 사용하기 위한 네트워크 컴퓨터 시스템의 도식적 다이어그램이다.
3은 본 기술내용의 일부 실시형태에 따라 듀플렉스 시퀀싱 공통 서열 데이터를 생성하기 위한 예시적인 루틴을 예시하는 흐름 다이어그램이다.
4는 본 기술내용의 일부 실시형태에 따라 세포 집단에서 게놈 편집 사건으로부터 생긴 의도된 게놈 유전좌위에서의 편집된 서열을 검출하고 확인하기 위한 루틴을 예시하는 흐름 다이어그램이다.
5는 본 기술내용의 일부 실시형태에 따라 세포 집단에서 게놈 편집 사건으로부터 생긴 의도되지 않은 게놈 유전좌위에서의 편집된 서열을 검출하고 확인하기 위한 루틴을 예시하는 흐름 다이어그램이다.
6은 본 기술내용의 일부 실시형태에 따라 게놈 편집 사건 후에 세포 집단 내에 세포의 클론 팽창을 검출하고 확인하기 위한 루틴을 예시하는 흐름 다이어그램이다.
7은 본 기술내용의 일부 실시형태에 따라 듀플렉스 시퀀싱에 의해 검출된 바와 같은 변이체 대립유전자 분획(VAF)의 초기 단계 신생물성 클론 선택을 예시하는 그래프이다.
8a는 본 기술내용의 소정의 실시형태에 따라 암에 유전전 소인이 있는 마우스 균주에서 인간 HRAS 전이유전자의 엑손 3에 정렬하는 단일 뉴클레오타이드 변이체를 예시하는 그래프이다.
8b는 Tg.RasH2 마우스 모델에서 인간 HRAS 전이유전자 유전좌위를 포함하는 소정의 Ras 패밀리 유전자로부터 포획된 엑손에 대한 게놈 간격에 걸쳐 작도된 단일 뉴클레오타이드 변이체(SNV)를 예시하는 그래프이다.
본 기술내용은 적어도 부분적으로 게놈 편집 사건을 겪은 세포의 집단 중에서 변이체(즉, 유전자 변이체)를 검출하고/하거나 평가하고/하거나 정량화하기 위한 방법에 관한 것이다. 예를 들어, 일부 실시형태에서, 본 개시내용은 (예를 들어, 게놈 편집에 의도된 유전좌위에서 또는 오프-타깃의 의도되지 않은 유전좌위에서) 게놈 편집 사건 동안 희귀 및/또는 의도되지 않은 변이를 검출 및/또는 정량화하는 방법 및 이러한 방법에서 사용하기 위한 연관된 시약을 제공한다. 일부 실시형태에서, 본 개시내용은 클론 팽창을 검출하고/하거나 정량화하는 방법 및 이러한 방법에서 사용하기 위한 연관된 시약을 제공한다.
본 개시내용은 고충실도 시퀀싱 기법, 예컨대 듀플렉스 시퀀싱이 저빈도 유전자 변이체를 검출하고/하거나 정량화하기 위해 사용될 수 있다는 인식을 포함한다. 일부 실시형태에서, 본 개시내용은 게놈 편집 사건(예를 들어, 조작된 게놈 편집 사건 또는 자연 게놈 편집 사건) 후에 (시험관내 또는 생체내 중 어느 하나의) 혼합된 세포 집단 및/또는 세포 집단에서 클론 선택을 평가하기 위해 듀플렉스 시퀀싱을 이용하는 것을 기재한다. 예를 들어, 본 기술내용의 다양한 실시형태는 표적 이중-가닥 핵산 분자 중에서 하나 이상의 유전자 변이체를 확인하고 하나 이상의 변이체의 변이 빈도를 결정하기 위해 듀플렉스 시퀀싱 방법을 수행하는 것을 포함한다. 본 기술내용의 추가의 예는 사건 후에 세포의 클론 팽창을 검출하고 평가하는 방법에 관한 것이다. 예를 들어, 일부 실시형태는 암 유발 유전자에서의 돌연변이를 보유하고/하거나 선택압 하에 있는 세포의 클론 팽창을 평가하기 위해 듀플렉스 시퀀싱 방법을 수행하는 것을 포함한다. 다른 실시형태는 선택압 하에 있지 않는 세포 계통의 유전자 마커의 사용에 기초한 세포의 클론 팽창을 평가하기 위해 듀플렉스 시퀀싱 방법을 수행하는 것을 포함한다. 또 추가의 실시형태에서, 본 기술내용은 게놈-편집된 세포 집단으로부터 추출된 이중-가닥 핵산 분자의 집단의 고정확도 시퀀싱 판독을 생성하는 방법을 제공한다. 다양한 배열에서, 방법은 게놈 편집 사건의 성공 및/또는 원치 않는 이의 불리한 결과를 결정하는 단계를 포함한다. 본 기술내용의 다양한 양태는 전임상 치료 및 임상 치료 둘 다에서의 많은 적용, 및 다른 산업전반 영향을 갖는다.
본 기술내용의 여러 실시형태의 구체적인 상세내용이 도면(도 1a-8b)과 관련하여 하기 기재되어 있다. 많은 실시형태가 듀플렉스 시퀀싱과 관련하여 본원에 기재되어 있지만, 본원에 기재된 것 이외에 오류-보정된 시퀀싱 리드를 생성할 수 있는 다른 시퀀싱 양상은 본 기술내용의 범위 내에 있다. 추가적으로, 본 기술내용의 다른 실시형태는 본원에 기재된 것과 상이한 구성, 구성성분 또는 절차를 가질 수 있다. 그러므로, 당업자는 따라서 본 기술내용이 추가 요소를 갖는 다른 실시형태를 가질 수 있고, 본 기술내용이 도 1a-8b과 관련하여 하기 도시되고 기재된 여러 특징이 없는 다른 실시형태를 가질 수 있다는 것을 이해할 것이다.
특정 정의
본 개시내용이 보다 용이하게 이해되도록 하기 위해, 소정의 용어가 처음에 하기에 정의된다. 하기 용어 및 다른 용어에 대한 추가 정의가 본 명세서에 걸쳐 제시된다.
본원에서, 문맥에서 달리 명확하지 않는 한, 용어 "하나"는 "적어도 하나"를 의미하는 것으로 이해될 수 있다. 본원에 사용된 바와 같이, 용어 "또는"은 "및/또는"을 의미하는 것으로 이해될 수 있다. 본원에서, 용어 "포함하는" 및 "함유하는"은 홀로 제시되든 하나 이상의 추가 성분 또는 단계와 함께 제시되든 항목화된 성분 또는 단계를 포괄하는 것으로 이해될 수 있다. 범위가 본원에 제공되는 경우, 종점이 포함된다. 본원에 사용된 바와 같이, 용어 "포함한다" 및 이 용어의 파생어, 예컨대 "포함하는" 및 "포함"은 다른 첨가제, 성분, 정수 또는 단계를 배제하는 것으로 의도되지 않는다.
: 용어 "약"은, 값과 관련하여 본원에 사용될 때, 언급된 값의 맥락에서 유사한 값을 지칭한다. 일반적으로, 그 맥락에 친숙한 당업자는 그 맥락에서 "약"이 포괄하는 변화량의 관련 정도를 이해할 것이다. 예를 들어, 일부 실시형태에서, 용어 "약"은 언급된 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 이하 내의 값의 범위를 포괄할 수 있다. 양 또는 음의 방향의 단일 숫자 값 단계가 그 값의 25%를 초과하는 단일 디지트 정수 값의 변화량에 대해, "약"이 양 또는 음의 방향의 적어도 1, 2, 3, 4 또는 5 정수 값을 포함하는 것으로 당업자에 의해 일반적으로 인정되고, 이는 상황에 따라 0을 가로지르거나 가로지르지 않을 수 있다. 이것의 비제한적인 예는 일부 상황에서 3 센트가 약 5 센트로 생각될 수 있다는 추정인데, 이는 당업자에게는 명확할 것이다.
대립유전자 : 본원에 사용된 용어 "대립유전자"는 특정 게놈 유전자좌의 2개 이상의 기존 유전적 변이체 중 하나를 지칭한다.
유사체 : 본원에 사용된 바와 같이, 용어 "유사체"는 기준 물질과 하나 이상의 특정 구조 특징, 요소, 성분 또는 모이어티를 공유하는 물질을 지칭한다. 통상적으로, "유사체"는 (예를 들어 코어 또는 공통 구조를 공유하는) 기준 물질과 상당한 구조 유사성을 보여주지만, 또한 소정의 별개의 방식에서 다르다. 일부 실시형태에서, 유사체는 예를 들어 기준 물질의 화학 조작에 의해 기준 물질로부터 생성될 수 있는 물질이다. 일부 실시형태에서, 유사체는 기준 물질을 생성하는 합성 공정과 실질적으로 유사한(예를 들어, 이 합성 공정과 복수의 단계를 공유하는) 합성 공정의 수행을 통해 생성될 수 있는 물질이다. 일부 실시형태에서, 유사체는 기준 물질을 생성하기 위해 사용되는 합성 공정과 상이한 합성 공정의 수행을 통해 생성되거나 생성될 수 있다.
동물 : 본원에 사용된 바와 같이 동물계의 임의의 구성원을 지칭한다. 일부 실시형태에서, "동물"은 성별 및 임의의 발달 단계에 있는 인간을 지칭한다. 일부 실시형태에서, "동물"은 임의의 발달 단계에서 인간이 아닌 동물을 지칭한다. 특정 실시형태에서, 비-인간 동물은 포유 동물 (예를 들어, 설치류, 마우스, 쥐, 토끼, 원숭이, 개, 고양이, 양, 소, 영장류 및/또는 돼지, 등). 일부 실시형태에서, 동물은 포유 동물, 새, 파충류, 양서류, 어류, 곤충 및/또는 벌레를 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, 동물은 형질전환 동물, 유전적으로 조작 된 동물 및/또는 클론일 수 있다.
생물학적 샘플 : 본원에 사용된 바와 같이, 용어 "생물학적 샘플" 또는 "샘플"은 통상적으로 본원에 기재된 바와 같은 생물학적 소스(예를 들어, 조직 또는 유기체 또는 세포 또는 세포 배양물)로부터 수득되거나 유래된 샘플을 지칭한다. 본원에 사용된 "생물학적 샘플"은 게놈 편집 사건에 적합하다. 따라서, 본 개시내용의 생물학적 샘플은 게놈 물질을 포함한다. 일부 실시형태에서, 생물학적 관심 소스는 유기체, 예컨대 동물 (예를 들어, 포유동물, 예를 들어, 인간)을 포함한다. 일부 실시형태에서, 관심 소스는 식물 기반 유기체 (예를 들어, 식물, 식물 부분, 종자 등)이다. 다른 실시형태에서, 관심 소스는 미생물, 예컨대 박테리아, 바이러스, 원생동물 또는 진균을 포함한다. 추가의 실시형태에서, 관심 소스는 합성 조직, 유기체, 세포 배양, 핵산 또는 다른 물질일 수 있다. 다른 실시형태에서, 샘플은 다중-유기체 샘플(예를 들어, 혼합 유기체 샘플)일 수 있다. 일부 실시형태에서, 생물학적 샘플은 생물학적 조직 또는 유체이거나 이를 포함한다. 일부 실시형태에서, 생물학적 샘플은 골수; 혈액; 혈액 세포; 복수; 조직 샘플, 생검 샘플 또는 미세침 흡기 샘플; 세포-함유 체액; 자유 부유하는 핵산; 단백질-결합된 핵산, 리보단백질-결합된 핵산; 가래; 혈장, 혈청, 타액; 뇨; 뇌척수액, 복막액; 흉수; 대변; 림프; 부인과학적 유체; 피부 면봉; 질 면봉; 질세포진(pap smear), 구강 면봉; 코 면봉; 세척액 또는 세척물, 예컨대 젖관 세척물 또는 기관지폐포 세척물; 질액, 흡인물; 부스러기; 골수 시편; 조직 생검 시편; 태아 조직 또는 유체; 수술 시편; 대변, 다른 체액, 분비물 및/또는 배설물; 및/또는 이들로부터의 세포 등이거나 이를 포함할 수 있다. 일부 실시형태에서, 생물학적 샘플은 개체로부터 얻은 세포이거나 이를 포함한다. 일부 실시형태에서, 얻은 세포는 샘플이 얻어진 개체로부터의 세포이거나 이를 포함한다. 일부 실시형태에서, 생물학적 샘플은 세포-파생물, 예컨대 세포기관 또는 소낭 또는 엑소좀을 포함할 수 있다. 특정 실시형태에서, 생물학적 샘플은 대상체로부터 얻은 액체 생검이다. 일부 실시형태에서, 샘플은 임의의 적절한 수단에 의해 관심 소스로부터 직접 얻은 "1차 샘플"이다. 예를 들어, 일부 실시형태에서, 1차 생물학적 샘플은 생검(예를 들어, 미세침 흡기 또는 조직 생검), 수술, 체액(예를 들어, 혈액, 림프, 대변 등)의 수집 등으로 이루어진 군으로부터 선택된 방법에 의해 얻어진다. 일부 실시형태에서, 상황에서 명확한 것처럼, 용어 "샘플"은 1차 샘플을 처리하여(예를 들어, 이 샘플의 하나 이상의 성분을 제거함으로써 그리고/또는 하나 이상의 물질을 이 샘플에 첨가함으로써) 얻은 제제를 지칭한다. 예를 들어, 반투과성 막을 사용한 여과. 이러한 "처리된 샘플"은 샘플로부터 추출되거나 1차 샘플을 mRNA의 증폭 또는 역전사, 소정의 성분의 단리 및/또는 정제 등과 같은 기법으로 처리함으로써 얻은 예를 들어 핵산 또는 DNA 분자를 포함할 수 있다.
: 용어 "암", "악성", "신생물", "종양" 및 "암종"은 상대적으로 비정상적이고 조절되지 않고/않거나 자율 성장을 나타내는 세포를 지칭하기 위해 본원에서 사용되며, 그들은 세포 증식 조절의 상당한 손실을 특징으로 하는 비정상적인 성장 표현형을 나타낸다. 암은 일반적으로 전이될 수 있는 비정상 세포의 성장이 조절되지 않는 것을 특징으로 하는 것으로 당업계에 경험된 사람들에게 친숙하다. 암은 많은 것들 중에서, 비제한적인 예로서, 전립선암(예를 들어, 선암, 소세포), 난소암(예를 들어, 난소 선암, 장액성 암종 또는 배아 암종, 난황 주머니 종양, 기형종), 간암(예를 들어, HCC 또는 간세포종, 혈관육종), 혈장 세포 종양(예를 들어, 다발성 골수종, 형질구성 백혈병, 형질세포종, 아밀로이드증, 발덴스트롬 마크로글로불린혈증), 결장직장암(예를 들어, 결장 선암, 결장 점액소 선암, 카르시노이드, 림프종 및 직장 선암, 직장 편평 암종), 백혈병(예를 들어, 급성 골수성 백혈병, 급성 림프구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, 급성 골수아구성 백혈병, 급성 전골수성 백혈병, 급성 골수단핵구성 백혈병, 급성 단핵구성 백혈병, 급성 적백혈병 및 만성 백혈병, T-세포 백혈병, 세자리 증후군(Sezary syndrome), 전신 비만세포증, 모발 세포 백혈병, 만성 골수성 백혈병성 아세포발증), 골수형성이상 증후군, 림프종(예를 들어, 미만성 거대 B-세포 림프종, 피부 T-세포 림프종, 말초 T-세포 림프종, 호지킨 림프종, 비호지킨 림프종, 소포성 림프종, 외투 세포 림프종, MALT 림프종, 변연 세포 림프종, 리히터 형질전환, 이중유전자이상 림프종(double hit lymphoma), 이식 연관된 림프종, CNS 림프종, 림프절외 림프종, HIV-연관된 림프종, 풍토성 림프종, 버킷 림프종, 이식-연관된 림프증식성 신생물 및 림프구성 림프종 등), 자궁경부암(예를 들어, 편평 자궁경부 암종, 투명 세포 암종, HPV 연관된 암종, 자궁경부 육종 등), 식도암(예를 들어, 식도 편평 세포 암종, 선암, 소정의 등급의 바렛 식도, 식도 선암), 흑색종(예를 들어, 진피 흑색종, 포도막 흑색종, 말단 흑색종, 무색소성 흑색종 등), CNS 종양(예를 들어, 핍지교종, 성상세포종, 교모세포종, 뇌수막종, 신경초종, 두개인두종 등), 췌장암(예를 들어, 선암, 선편평 암종, 반지 고리 세포 암종, 간모양선 암종, 콜로이드 암종, 도세포 암종, 췌장 신경내분비 암종 등), 위장 기질 종양, 육종(예를 들어, 섬유육종, 점액육종, 지방육종, 연골육종, 골원성 육종, 혈관육종, 내피종 육종, 림프관육종, 림프혈관내피종 육종, 평활근육종, 유잉 육종 및 횡문근육종, 방추 세포 종양 등), 유방암(예를 들어, 염증성 암종, 대엽성 암종, 유관 암종 등), ER-양성 암, HER-2 양성 암, 방광암(편평 방광암, 소세포 방광암, 요로상피암 등), 두경부암(예를 들어, 두경부의 편평 세포 암종, HPV-연관된 편평 세포 암종, 비인두 암종 등), 폐암(예를 들어, 비소세포 폐암종, 대세포 암종, 기관지성 암종, 편평 세포 암, 소세포 폐암 등), 전이성 암, 구강암, 자궁암(평활근육종, 평활근종 등), 고환암(예를 들어, 정상피종, 비정상피종 및 배아 암종 난황 주머니 종양 등), 피부암(예를 들어, 편평 세포 암종 및 기저 세포 암종, 머켈 세포 암종, 흑색종, 피부 t-세포 림프종 등), 갑상선암(예를 들어, 유두상 암종, 수질성 암종, 미분화 갑상선암 등), 위암, 상피내암, 골암, 담관암, 눈암, 후두암, 신장암(예를 들어, 신장 세포 암종, 윌름스 종양 등), 위암, 아세포종(예를 들어, 신아세포종, 수모세포종, 혈관모세포종, 신경모세포종, 망막아세포종 등), 골수증식성 신생물(진성 다혈구증, 본태성 고혈소판증, 골수섬유증 등), 척삭종, 활막종, 중피종, 선암, 땀샘 암종, 피지선 암종, 낭샘암종, 담도 암종, 융모암종, 상피 암종, 뇌실상의종, 송과체부종양, 속귀 신경집종, 신경초종, 뇌수막종, 뇌하수체 선종, 신경초 종양, 소장의 암, 크롬친화성세포종, 소세포 폐암, 복막 중피종, 부갑상선기능항진 샘종, 부신암, 불명 원발성 암, 내분비계의 암, 음경의 암, 요도의 암, 피부 또는 눈내 흑색종, 부인과학 종양, 소아의 고형 종양, 또는 중추 신경계의 신생물, 원발성 종격동 생식 세포 종양, 부정형 가능성의 클론성 조혈증, 무증상 골수종, 의미 불명 단일클론성 감마글로불린증, 단일클론성 B-세포 림프구증가증, 저등급 암, 클론성 시야 결손, 전신생물성 신생물, 요관암, 자가면역-연관된 암(즉, 궤양성 대장염, 원발성 경화성 담관염, 셀리악병), 유전 소인과 연관된 암(즉, 예컨대 BRCA1, BRCA2, TP53, PTEN, ATM 등에서 유전 결함을 보유하는 것) 및 다양한 유전자 증후군, 예컨대 MEN1, MEN2 삼염색체 21 등) 및 자궁에서 화학물질에 노출될 때 발생하는 것(즉, 디에틸스틸베스트롤[DES]에 노출된 여성의 여자 자손에서 투명 세포 암)을 포함한다. 일부 실시형태에서, 본 개시내용의 맥락에서 검출, 분석 및/또는 정량화된 변이체는 암과 관련된다(예를 들어, 신생물 변이체).
암 유발자 또는 암 유발자 유전자: 본원에 사용된 바와 같이, "암 유발자" 또는 "암 유발자 유전자"는 올바른 상황에서 세포가 악성 형질전환을 겪게 하거나 이를 겪기 시작할 가능성을 갖는 유전자 병변을 지칭한다. 이러한 유전자는 악성종양 변환을 보통 억제하고 소정의 방식으로 돌연변이될 때 더 이상 그렇게 하지 않는 종양 억제자(예를 들어, TP53, BRCA1)를 포함한다. 다른 유발자 유전자는 소정의 방식으로 돌연변이될 때 항시적으로 활성이 되거나 세포가 악성이 되는 것을 용이하게 하도록 새로운 특성을 얻는 종양유전자(예를 들어, KRAS, EGFR)일 수 있다. 게놈의 비암호화 영역에서 발견된 다른 돌연변이는 암 유발자일 수 있다. 예를 들어, 텔로머라아제 유전자(TERT)의 프로모터 영역의 돌연변이는 유전자를 과발현시키고 이로써 암 유발자가 될 수 있다. 비암호화 영역에서의 다른 돌연변이는 비정상 스플라이싱을 용이하게 하거나 소정의 경우에 신생물 성장으로 이어질 수 있는 전사 인자 결합 또는 다른 조절 변화를 조절할 수 있다. 소정의 재배열(예를 들어, BCR-ABL 융합)은 하나의 유전 영역을 과발현, 억제 소실 또는 키메라 융합 유전자와 관련된 기전을 통해 종양발생을 유발하기 위해 다른 것과 병치시킬 수 있다. 대체로, 다른 세포에 비해 증식, 생존 또는 경쟁적 이점을 용이하게 하는 세포에 표현형을 부여하거나, 또는 이의 능력이 보다 강건하게 전개되게 하는 유전자 돌연변이(또는 후생돌연변이)는 유발자 돌연변이라 생각될 수 있다. 이것이 동일한 유전자(즉, 동의 돌연변이)에서 발생할 수 있더라도, 이는 이러한 특징이 결여된 돌연변이와 대조적이어야 한다. 이러한 돌연변이가 종양에서 확인될 때, 이것은 팽창에 유효하게 기여하지 않으면서 클론 팽창과 함께 "히치하이크"하므로 패신저 돌연변이라 흔히 칭해진다. 당업자에 의해 인식되는 것처럼, 유발자 및 패신저의 차이는 절대가 아니고, 그렇게 해석되지 않아야 한다. 일부 유발자는 소정의 상황(예를 들어, 소정의 조직)에서 오직 작용하고, 다른 것은 다른 돌연변이 또는 후생돌연변이 또는 다른 인자의 부재 하에 협동하지 않을 수 있다.
클론 팽창: 본원에 사용된 바와 같이, "클론 팽창"은 공통 파운더 세포로부터 유래된 세포 집단의 클론 생장을 지칭한다. 세포(즉, 딸 세포)의 유도 집단은 단순히 클론이라 칭해질 수 있다. 클론 팽창은 정상의 건강한 생물학적 과정(즉, 수정란은 인간의 파운더 세포이고, 이의 모든 세포는 클론을 포함함)의 결과로서 인공 수단(즉, 배양물에서의 단일 단리된 세포는 성장하고 반복하여 세포 집단으로 분열하도록 허용됨)을 통해서 발생할 수 있다. 클론 팽창은 또한 신체의 세포가 이렇게 하지 않아야 할 때에 점점 더 성장하고 분열하는 능력을 얻고, 이의 딸 세포를 포함하는 종양을 형성할 때와 같은 병원성 과정의 결과로서 생길 수 있다. 클론은 그들의 본질상 하위클론, 즉 원래의 클론성 파운더의 딸 세포로부터 클론으로 유래된 더 작은 세포 집단을 함유한다. 이 하위클론은 이의 특정 파운더 세포와 관련하여 바라볼 때에는 자체가 단순히 클론이지만, 심지어 더 초기의 파운더 세포에 대해 바라볼 때에는 하위클론으로 칭해진다.
용어 "클론" 또는 "클론 팽창"은 자체가 상기 중 어느 것을 반드시 나타낼 필요가 없거나, 다른 과정은 클론 성장으로 이어질 수 있다. 클론 팽창은 관련된 세포의 집단(즉, 건강한 조직 내에 종양을 형성하는 인간에서의 하나의 세포) 또는 비관련된 세포의 집단(즉, 많은 상이한 사람의 세포로부터 확립된 배양에서의 세포 집단) 내에 발생할 수 있다. 일반적으로, 더 큰 세포 집단 내에 클론 팽창을 겪은 세포를 인식하기 위해, 그 세포 및 이의 딸 세포를 구별하기 위해 일부의 적어도 하나의 고유한 계통 마커가 그 집단에서의 다른 세포와 구별될 필요가 보통 있다. 그 계통 마커는 실질적으로 파운더 세포에 고유하고 딸 세포로 증식하는 유전자 변이체일 수 있다. 이러한 유전자 변이체는 핵 게놈에서의 돌연변이, 미토콘드리아 게놈, 후생돌연변이 다른 유전성 변화 또는 상기로부터 생기고 검출될 수 있는 세포에서의 다른 분자(즉, 단백질)에 대한 변화일 수 있다. 클론 팽창/클론의 특정 계통의 마커는 자체가 팽창에 원인이거나 기여할 수 있거나(즉, "유발자"), 단순히 클론을 마킹하고, 특정 기능을 제공할 수 없다(즉, "패신저" 또는 "히치하이커").
불균질한 세포 집단에서의 세포의 클론 팽창은 확률론적 클론 팽창, 성장 속도 증가, 노쇠 감소, 접촉 억제 감소를 포함하는 다양한 이유로 생길 수 있다. 이 후자의 경우에, 클론 팽창은 세포 집단에서의 다른 세포와 비교하여 양성 성장 바이어스(예를 들어, 상대 성장 이점)의 결과로서 생긴다. 단일 세포의 이 증가된 또는 우선적인 재생성은 불균질한 세포 집단에서의 다른 세포보다 더 많은 수의 딸/유도 세포를 생성하여서, 그 세포로부터의 딸 또는 유도 세포는 세포 집단에서 불균등하게 팽창하여서 클론을 형성한다. 예를 들어, 일부 실시형태에서, 클론 팽창을 겪은 세포는 신생물성이다. 일부 실시형태에서, 클론 팽창을 겪은 세포는 불균질한 세포 집단에서 다른 세포보다 더 건강하다(예를 들어, 집단에서의 다른 세포는 음성 성장 바이어스를 갖는다).
클론 선택: 본원에 사용된 바와 같이, "클론 선택"은 집단에서의 특정 세포에 대한 선택 또는 양성 바이어스를 지칭한다. 일반적으로, 클론 선택은 불균질한 세포 집단에서의 다른 세포보다 더 많은 수의 딸/유도 세포를 생성하여서, 그 세포로부터의 딸 또는 유도 세포가 세포 집단에서 불균등하게 팽창하거나 생존하게 하는, 단일 세포의 증가된 또는 우선적인 재생성을 생성시키는 사건 및/또는 신호이다.
결정한다 : 본원에 기재된 많은 방법론은 "결정"의 단계를 포함한다. 본 명세서를 읽는 당업자는 이러한 "결정"이 예를 들어 본원에 명쾌하게 언급된 특정 기법을 포함하여 당업자에게 이용 가능한 임의의 다양한 기법을 사용하거나 이의 사용을 통해 달성될 수 있음을 이해할 것이다. 일부 실시형태에서, 결정은 신체 샘플의 조작을 수반한다. 일부 실시형태에서, 결정은 (예를 들어 관련 분석을 수행하도록 적응된 컴퓨터 또는 다른 프로세싱 유닛을 사용하는) 데이터 또는 정보의 고려 및/또는 조작을 수반한다. 일부 실시형태에서, 결정은 소스로부터의 관련 정보 및/또는 자료를 수신하는 것을 수반한다. 일부 실시형태에서, 결정은 샘플 또는 집합체의 하나 이상의 특징을 필적하는 기준품과 비교하는 것을 수반한다.
듀플렉스 시퀀싱(DS) : 본원에 사용된 바와 같이, "듀플렉스 시퀀싱(DS)"은 이의 광의에서 개별 DNA 분자의 가닥 둘 다로부터의 서열을 비교함으로써 예의적 정확도를 달성하는 오류-보정 방법을 지칭한다.
조작된: 본 개시내용을 읽는 당업자는 본원에 사용된 바와 같이 용어 "조작된"이 사람 손에 의해 조작되고 변경된 양태를 지칭한다는 것을 이해할 것이다. 특히, 용어 "조작된 세포"는 유전적, 후성적 및/또는 표현형적 정체가 적절한 기준 세포, 예컨대 이렇게 조작되지 않은 달리 동일한 세포에 비해 변경되도록 조작으로 처리된 세포를 지칭한다. 일부 실시형태에서, 조작은 유전자 조작, 예컨대 유전자 편집, 염기 편집 및 유전자 치료이거나 이를 포함한다. 일부 실시형태에서, 조작된 세포는 이러한 적절한 기준 세포에 비해 변경된 양으로 및/또는 변경된 시기에 따라 관심 특정 물질(예를 들어, 단백질, 핵산, 및/또는 이의 특정 형태)을 보유하고/하거나 발현하도록 조적된 것이다.
발현 : 본원에 사용된 바와 같이, 핵산 서열의 "발현"은 하기 사건들 중 하나 이상을 지칭한다: (1) (예를 들어, 전사에 의한) DNA 서열로부터의 RNA 주형의 생산; (2) (예를 들어, 스플라이싱, 편집, 5' 캡 형성, 및/또는 3' 말단 형성에 의한) RNA 전사체의 처리; (3) 폴리펩타이드 또는 단백질로의 RNA의 번역; 및/또는 (4) 폴리펩타이드 또는 단백질의 번역후 변형.
유전자: 본원에 사용된 바와 같이, 용어 "유전자"는 산물(예를 들어, RNA 산물 및/또는 폴리펩타이드 산물)을 암호화하는 염색체에서의 DNA 서열을 지칭한다. 일부 실시형태에서, 유전자는 암호화 서열(즉, 특정 산물을 암호화하는 서열)을 포함하고, 일부 실시형태에서, 유전자는 비암호화 서열을 포함한다. 일부 특정 실시형태에서, 유전자는 암호화 서열(예를 들어, 엑손성) 및 비암호화 서열(예를 들어, 인트론성) 둘 다를 포함할 수 있다. 일부 실시형태에서, 유전자는, 예를 들어 유전자 발현의 하나 이상의 양태(예를 들어, 세포-유형-특이적 발현, 유도성 발현 등)를 조절하거나 이에 영향을 미칠 수 있는, 하나 이상의 조절 요소를 포함할 수 있다.
게놈 편집: 본원에 사용된 바와 같이, "게놈 편집", "게놈성 편집" 또는 "게놈 조작"은 살아 있는 유기체(예를 들어, 세포 또는 다중 세포)에서 핵산(예를 들어, 게놈 DNA, 미토콘드리아 DNA 또는 다른 DNA)의 변화를 변경하거나 조작하는 과정을 지칭한다. 게놈 편집은 살아 있는 유기체의 게놈에서 핵산 서열(들)을 삽입하거나 결실시키거나 변형시키거나 대체하거나 수정하거나 간섭하거나 손상시키거나 비기능화적이 되게 하거나 돌연변이하기 위한 시스템의 제공을 포함할 수 있다. 표적화된 게놈 편집은 특정 서열이 예를 들어 의도된 게놈 유전좌위에서 변화(예를 들어, "편집")될 수 있는 방법을 포함한다. 예를 들어, 프로그래밍 가능한 부위-지정 뉴클레아제와 같은 유전자 도구는 생체내 게놈에 원하는 변경을 지시하도록 사용될 수 있다. 게놈 편집은 시험관내 또는 다른 살아 있는 유기체에서 DNA 서열의 유전자 조작, 이어서 관심 게놈에 대한 이 서열의 삽입에 의해 달성될 수 있다.
gRNA: 본원에 사용된 바와 같이, "gRNA" 또는 "가이드 RNA"는 DNA 또는 RNA의 특이적 영역의 절단을 용이하게 하는 실질적으로 표적-특이적 서열에 결합하는 표적화된 엔도뉴클레아제(예를 들어, Cas 효소, 예컨대 Cas9 또는 Cpf1 또는 유사한 특성을 갖는 다른 리보핵단백질 등)에 적합한 스캐폴드 서열을 포함하는 짧은 RNA 분자를 지칭한다.
상동성: 본원에 사용된 바와 같이, 용어 "상동성"은 중합체성 분자 사이의, 예를 들어 핵산 분자(예를 들어, DNA 분자 및/또는 RNA 분자) 사이의 전체 관련성을 지칭한다. 일부 실시형태에서, 중합체성 분자는 이의 서열이 적어도 80%, 85%, 90%, 95% 또는 99% 동일하면 서로에 "상동성"인 것으로 생각된다. 다른 실시형태에서, 유사성의 정도는 30% 미만, 적어도 30% 40%, 50%, 60%, 70% 또는 70% 초과일 수 있다. 당업자에 의해 이해되는 것처럼, 어떤 잔기가 상이한 서열에서 서로에 "상응하는"지를 고려할 때 다른 것에 비해 하나의 서열에서 지정된 길이의 갭의 허용을 포함하여 이의 상동성의 정도를 결정하기 위해 서열의 비교를 허용하는 다양한 알고리즘이 이용 가능하다. 2개의 핵산 서열 사이의 퍼센트 상동성의 계산은, 예를 들어 최적 비교 목적을 위해 2개의 서열을 정렬함으로써 수행될 수 있다(예를 들어, 갭은 최적 정렬을 위한 제1 핵산 서열 및 제2 핵산 서열의 하나 또는 둘 다로 도입될 수 있고, 비상응하는 서열은 비교 목적을 위해 고려되지 않을 수 있다). 소정의 실시형태에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 또는 실질적으로 100%이다. 상응하는 뉴클레오타이드 위치에서의 뉴클레오타이드는 이후 비교된다. 제1 서열에서의 위치가 제2 서열에서 상응하는 위치와 동일한 뉴클레오타이드에 의해 점유될 때, 그 분자는 그 위치에서 동일하고; 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 유사한 뉴클레오타이드에 의해 점유될 때, 그 분자는 그 위치에서 유사하다. 2개의 서열 사이의 퍼센트 상동성은 갭의 수, 및 2개의 서열의 최적 정렬을 위해 도입될 필요가 있는 각각의 갭의 길이를 고려하여 서열이 공유한 동일한 및 유사한 위치의 수의 함수이다. 2개의 뉴클레오타이드 서열 사이의 퍼센트 상동성을 결정하는 데 유용한 알고리즘 및 컴퓨터 프로그램은 당해 분야에 잘 공지되어 있다.
돌연변이: 본원에 사용된 바와 같이, 용어 "돌연변이"는 기준 서열에 비해 핵산 서열 또는 구조의 변경을 지칭한다. 폴리뉴클레오타이드 서열에 대한 돌연변이는 복합한 멀티뉴클레오타이드 변화 중에서 샘플에서의 DNA 서열의 점 돌연변이(예를 들어, 단일 염기 돌연변이), 멀티뉴클레오타이드 돌연변이, 뉴클레오타이드 결실, 서열 재배열, 뉴클레오타이드 삽입 및 중복을 포함할 수 있다. 돌연변이는 상보성 염기 변화(즉, 진정한 돌연변이)로서, 또는 다른 가닥이 아니라 하나의 가닥에서의 돌연변이(즉, 헤테로듀플렉스)로서 듀플렉스 DNA 분자의 가닥 둘 다에서 생길 수 있는데, 이는 복구되거나 파괴되거나 진정한 이중 가닥 돌연변이로 잘못-복구/전환될 가능성을 갖는다. 기준 서열은 데이터베이스(즉, HG38 인간 기준 게놈) 또는 서열이 비교되는 다른 샘플의 서열에 존재할 수 있다. 돌연변이는 또한 유전자 변이체로 공지되어 있다.
돌연변이 빈도: 본원에 사용된 바와 같이, 때때로 "돌연변이 빈도"라고도 칭해지는 용어 "돌연변이 빈도"는 시퀀싱된 염기쌍의 총수당 검출된 고유한 돌연변이의 수를 지칭한다. 일부 실시형태에서, 고유한 돌연변이는 듀플렉스 시퀀싱 검증 돌연변이로서 정의되고, 시퀀싱된 염기쌍의 총수는 듀플렉스 시퀀싱에 의해 검증된 것으로 정의된다. 일부 실시형태에서, 돌연변이 빈도는 오직 특정 유전자, 유전자의 세트 또는 게놈 표적의 세트 내의 돌연변이의 빈도이다. 일부 실시형태에서, 돌연변이 빈도는 돌연변이의 오직 소정의 유형(예를 들어, A 염기의 총수당 A>T 돌연변이의 수로 계산된 A>T 돌연변이의 빈도)을 지칭할 수 있다. 돌연변이가 세포 또는 분자의 집단으로 생기는 빈도는 다른 것들 중에서 시간에 따른 대상체의 연령, 조직 또는 조직화 유형, 게놈 영역, 돌연변이 유형, 트리뉴클레오타이드 상황, 유전된 유전적 배경, 돌연변이성 화학물질에 대한 노출, 방사선에 대한 노출 및 상기 중 어느 것을 포함하는 환경에 대한 노출에 의해 변할 수 있다.
돌연변이 서명: 본원에 사용된 바와 같이, 용어 "돌연변이 서명", "돌연변이 스펙트럼" 또는 돌연변이 스펙트럼들"은 게놈 편집(예를 들어, 천연 게놈 편집 또는 조작된 게놈 편집), DNA 복제 불충, 외인성 및 내인성 유전자독소 노출, 결함성 DNA 복구 경로 및 DNA 효소 편집과 같은 돌연변이유발 과정으로부터 생긴 돌연변이 유형의 특징적인 조합을 지칭한다. 돌연변이성 스펙트럼은 3개의 염기쌍 뉴클레오타이드 서열 상황 중에서 가능한 유형의 돌연변이의 상대 풍부도의 패턴을 포함하는 트리뉴클레오타이드 돌연변이 스펙트럼을 포함할 수 있다. 이러한 스펙트럼은 기준 게놈에서의 서열 상황의 상대 풍부도에 의해 정규화될 수 있다. 돌연변이성 스펙트럼은 임의의 서열 상황에서의 임의의 형태의 돌연변이를 수반할 수 있다. 일 실시형태에서, 돌연변이 스펙트럼은 컴퓨터 패턴 일치(예를 들어, 비지도된 계층적 돌연변이 스펙트럼 클러스터링, 비음성 행렬 분해 등)에 의해 다른 샘플의 돌연변이 스펙트럼 또는 데이터세트와 비교될 수 있다.
핵산 : 본원에 사용된 바와 같이, 이의 광의에서 올리고뉴클레오타이드 사슬로 혼입되거나 혼입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 실시형태에서, 핵산은 포스포디에스테르 연결을 통해 올리고뉴클레오타이드 사슬로 혼입되거나 혼입될 수 있는 화합물 및/또는 물질이다. 문맥에서 명확한 것처럼, 일부 실시형태에서, "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오타이드 및/또는 뉴클레오사이드)를 지칭하고; 일부 실시형태에서, "핵산"은 개별 핵산 잔기를 포함하는 올리고뉴클레오타이드 사슬을 지칭한다. 일부 실시형태에서, "핵산"은 RNA이거나 이를 포함하고; 일부 실시형태에서, "핵산"은 DNA이거나 이를 포함한다. 일부 실시형태에서, 핵산은 하나 이상의 자연 핵산 잔기이거나 이를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 핵산은 하나 이상의 핵산 유사체이거나 이를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 핵산 유사체는 포스포디에스테르 골격을 사용하지 않는다는 점에서 핵산과 다르다. 예를 들어, 일부 실시형태에서, 핵산은 당해 분야에 알려지고 골격에서 포스포디에스테르 결합 대신에 펩타이드 결합을 갖는 하나 이상의 "펩타이드 핵산"이거나 이를 포함하거나 이것으로 이루어지고, 본 기술내용의 범위 내에 고려된다. 대안적으로, 또는 추가적으로, 일부 실시형태에서, 핵산은 포스포디에스테르 결합보다 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미디트 연결을 갖는다. 일부 실시형태에서, 핵산은 하나 이상의 자연 뉴클레오사이드(예를 들어, 아데노신, 티미딘, 구아노신, 사이티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신 및 데옥시사이티딘)이거나 이를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 핵산은 하나 이상의 뉴클레오사이드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸사이티딘, C-5 프로피닐-사이티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-사이티딘, C5-메틸사이티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오사이티딘, 메틸화 염기, 인터칼레이팅 염기, 및 이들의 조합)이거나 이를 포함하거나 이것으로 이루어진다. 일부 실시형태에서, 핵산은 자연 핵산에서의 것과 비교하여 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스 및 헥소스)을 포함한다. 일부 실시형태에서, 핵산은 RNA 또는 단백질과 같은 기능적 유전자 산물을 암호화하는 뉴클레오타이드 서열을 갖는다. 일부 실시형태에서, 핵산은 하나 이상의 인트론을 포함한다. 일부 실시형태에서, 핵산은 자연 소스로부터의 단리, 상보성 주형에 기초한 중합에 의한 효소 합성(생체내 또는 시험관내), 재조합 세포 또는 시스템에서의 생식 및 화학 합성 중 하나 이상에 의해 제조된다. 일부 실시형태에서, 핵산은 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 110개, 120개, 130개, 140개, 150개, 160개, 170개, 180개, 190개, 200개, 225개, 250개, 275개, 300개, 325개, 350개, 375개, 400개, 425개, 450개, 475개, 500개, 600개, 700개, 800개, 900개, 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개, 5000개 이상의 길이의 잔기이다. 일부 실시형태에서, 핵산은 부분적으로 또는 완전히 단일 가닥이고; 일부 실시형태에서, 핵산은 부분적으로 또는 완전히 이중-가닥이다. 일부 실시형태에서, 핵산은 2차 구조를 가지며 분지될 수 있다. 일부 실시형태에서, 핵산은 폴리펩타이드를 암화하거나 이를 암화하는 서열의 보체인 적어도 하나의 요소를 포함하는 뉴클레오타이드 서열을 갖는다. 일부 실시형태에서, 핵산은 효소 활성을 갖는다. 일부 실시형태에서, 핵산은 예를 들어 리보핵단백질 복합체 또는 운반 RNA에서 기계적 기능을 한다.
패신저 돌연변이 : 본원에 사용된 용어 "패신저 돌연변이"는 클론에서 확인되지만 클론 확장 자체에 기여한 것으로 여겨지지 않는 돌연변이를 지칭한다. 이것은 클론 확장 자체에 기능적으로 기여했다고 합리적으로 믿어지는 "유발자 돌연변이"와 대조된다.
폴리뉴클레오타이드 손상 : 본원에 사용된 바와 같이, 용어 "폴리뉴클레오타이드 손상" 또는 "핵산 손상"은 생체 외 또는 생체 내 요인에 의해 침전(예 : 유전 독소 노출, 노화, 대사 과정 등)에 의해 직접적으로 또는 간접적으로(예를 들어, 대사물질, 또는 손상을 주거나 돌연변이성인 과정의 유도) 생긴 대상체의 데옥시리보핵산(DNA) 서열("DNA 손상") 또는 리보핵산(RNA) 서열에 대한 손상("RNA 손상")을 지칭한다. 손상된 핵산은 질병 또는 장애, 예를 들어 대상체의 유전 독소 노출, 노화 또는 기타 돌연변이 유발 과정과 관련된 질병 또는 장애의 발병을 유발할 수 있다. 일부 실시형태에서, 대상체에서 손상된 핵산의 검출은 유전독소 노출의 표시일 수 있다. 폴리뉴클레오타이드 손상은 세포에서 화학적 및/또는 물리적 DNA 변형을 추가로 포함할 수 있다. 일부 실시형태에서, 그 손상은 비제한적인 예로서 산화, 알킬화, 탈아미노화, 메틸화, 가수분해, 하이드록실화, 닉킹, 가닥내 가교, 가닥간 가교, 무딘 말단 가닥 절단, 엇갈린 말단 이중 가닥 절단, 포스포릴화, 탈포스포릴화, 수모일화, 글라이코실화, 탈글라이코실화, 푸트레시닐화, 카복실화, 할로겐화, 포밀화, 단일-가닥 갭, 열에 의한 손상, 건조에 의한 손상, UV 노출에 의한 손상, X-방사선으로부터의 감마 방사선 손상에 의한 손상, 이온화 방사선에 의한 손상, 비이온화 방사선에 의한 손상, 중입자 방사선에 의한 손상, 핵 붕괴에 의한 손상, 베타-방사선에 의한 손상, 알파 방사선에 의한 손상, 중성자 방사선에 의한 손상, 양성자 방사선에 의한 손상, 은하 방사선에 의한 손상, 높은 pH에 의한 손상, 낮은 pH에 의한 손상, 반응성 산화성 종에 의한 손상, 자유 라디칼에 의한 손상, 퍼옥사이드에 의한 손상, 차아염소산염에 의한 손상, 포르말린 또는 폼알데하이드와 같은 조직 고정에 의한 손상, 반응성 철에 의한 손상, 낮은 이온성 조건에 의한 손상, 높은 이온성 조건에 의한 손상, 비완충 조건에 의한 손상, 뉴클레아제에 의한 손상, 환경 노출에 의한 손상, 화재에 의한 손상, 기계적 스트레스에 의한 손상, 효소 분해에 의한 손상, 미생물에 의한 손상, 예비적 기계적 전단에 의한 손상, 예비적 효소 단편화에 의한 손상, 생체내 자연적으로 생긴 손상, 핵산 추출 동안 생긴 손상, 시퀀싱 라이브러리 제조 동안 생긴 손상, 중합효소에 의해 도입된 손상, 핵산 복구 동안 도입된 손상, 핵산 말단-꼬리화 동안 생긴 손상, 핵산 결찰 동안 생긴 손상, 시퀀싱 동안 생긴 손상, DNA의 기계적 취급에서 생긴 손상, 나노기공을 통한 통과 동안 생긴 손상, 유기체에서의 노화의 일부로 생긴 손상, 개체의 화학적 노출의 결과로서 생긴 손상, 돌연변이원에 의해 생긴 손상, 발암물질에 의해 생긴 손상, 클라스토젠(clastogen)에 의해 생긴 손상, 산소 노출로 인해 생체내 염증 손상에 의해 생긴 손상, 하나 이상의 가닥 파괴로 인한 손상, 및 임의의 이들의 조합 중 적어도 하나이거나 이를 포함한다.
기준품 : 본원에 사용된 바와 같이 "기준품"은 비교가 수행되는 표준품 또는 대조군을 기술한다. 예를 들어, 일부 실시형태에서, 관심이 있는 물질, 동물, 개체, 집단, 샘플, 서열 또는 값은 한 위치에 존재하거나 전자 수단을 통해 원격으로 접근될 수 있는 물리적 또는 컴퓨터 데이터베이스에서 기준품 또는 대조군 물질, 동물, 개체, 집단, 샘플, 서열 또는 값 또는 이의 표시와 비교된다. 일부 실시형태에서, 기준품 또는 대조군은 관심이 있는 시험 또는 결정과 실질적으로 동시에 시험되고/되거나 결정된다. 일부 실시형태에서, 기준품 또는 대조군은 선택적으로 실감형 매체에서 구현되는 계층적 기준품 또는 대조군이다. 통상적으로, 당업자가 이해하는 것처럼, 기준품 또는 대조군은 평가되는 것과 필적하는 조건 또는 상황 하에 결정되거나 규명된다. 당업자는 특정한 가능한 기준품 또는 대조군에 대한 의존 및/또는 비교를 정당화하기 위해 충분한 유사성이 존재할 때를 이해할 것이다.
기준 샘플: 본원에 사용된 바와 같이, "기준 샘플"은 기준 샘플이 게놈 편집 사건을 겪지 않음을 제외하고는 이것이 비교되는 샘플과 달리 동일한 샘플을 지칭한다. 예를 들어, 기준 샘플은 기준 샘플이 게놈 편집 사건(예를 들어, 조작된 게놈 편집 사건)을 겪도록 유도되지 않음을 제외하고는 이것이 비교되는 샘플(예를 들어, 시험 샘플)과 동일한 방식으로 단리될 수 있다.
안전 역치 변이 빈도: 본원에 사용된 바와 같이, 때때로 "안전 역치 돌연변이 빈도"라고도 칭해지는 용어 "안전 역치 변이 빈도"는 게놈 편집 사건 또는 과정 또는 다른 돌연변이성 과정에 의해 야기된 허용 가능한 돌연변이 또는 변이체 생성률 및/또는 전체 풍부도를 지칭하고, 이것 아래에서는 신생물성 가능성의 허용 가능한 위험 또는 세포에서의 다른 유전적 혼란이 있다. 변이체 생성의 생성된 돌연변이율의 허용 가능한 위험의 관용은 세포 유형, 게놈 편집 사건의 적용, 대상체, 연령, 성별, 조직 유형, 환자의 건강 상태 등에 따라 다를 수 있다.
단일 뉴클레오타이드 다형(SNP): 본원에 사용된 바와 같이, 용어 "단일 뉴클레오타이드 다형" 또는 "SNP"는 대안적인 염기가 하나의 대립유전자로부터 다른 대립유전자를 구별하는 것으로 알려진 특정 염기 위치를 지칭한다. SNP는 멀티뉴클레오타이드 변이체를 지칭하는 MNV와 반대로 자연에서 단일 뉴클레오타이드인 변이를 지칭한다. "카피수 다형" 또는 "카피수 변이체"(CNP 또는 CNV라 칭함)는 DNA 내의 서열의 카피의 수의 변이를 지칭한다. 일부 실시형태에서, 하나의 또는 적은 SNP 및/또는 CNP는, 분석 목적을 위해 SNP 및/또는 CNP의 하나 또는 세트가 특정 변이체, 형질, 세포 유형, 개체, 종 등 또는 이의 세트에 특징적인 것으로 생각될 수 있도록, 복합 유전자 변이체를 서로 구별하기에 충분하다. 일부 실시형태에서, SNP 및/또는 CNP의 하나 또는 세트는 특정 변이체, 형질, 세포 유형, 개체, 종 등 또는 이의 세트를 정의하는 것으로 고려될 수 있다. 가장 흔한 용법에서, SNP는 일반적으로 해당 변이체가 생식선으로부터 유전됨을 함축한다. 더 광의의 용어 단일 뉴클레오타이드 변이체(SNV)는 유전된 SNP 또는 체성 획득 돌연변이를 포함할 수 있다.
단일 분자 식별자(SMI) : 본원에 사용된 바와 같이, 용어 "단일 분자 식별자" 또는 "SMI"(single molecule identifier)(다른 명칭들 중에서 "태그", "바코드", "분자 바코드", "고유 분자 식별자" 또는 "UMI"라 칭해질 수 있음)는 더 큰 불균질한 분자 집단 중에서 개별 분자를 실질적으로 구별할 수 있는 임의의 물질(예를 들어, 뉴클레오타이드 서열, 핵산 분자 특징)을 단독으로 또는 다른 분자 특징과 조합하여 지칭한다. 일부 실시형태에서, SMI는 외인성으로 적용된 SMI이거나 이를 포함할 수 있다. 일부 실시형태에서, 외인성으로 적용된 SMI는 축퇴성 서열 또는 반축퇴성 서열이거나 이를 포함할 수 있다. 일부 실시형태에서, 실질적으로 축퇴성인 SMI는 랜덤 고유 분자 식별자(R-UMI: Random Unique Molecular Identifier)로 알려질 수 있다. 일부 실시형태에서, SMI는 알려진 코드의 풀 내로부터 코드(예를 들어, 핵산 서열)를 포함할 수 있다. 일부 실시형태에서, 미리규정된 SMI 코드는 한정 고유 분자 식별자(D-UMI: Defined Unique Molecular Identifier)로 알려져 있다. 일부 실시형태에서, SMI는 내인성 SMI이거나 이를 포함할 수 있다. 일부 실시형태에서, 내인성 SMI는 표적 서열의 특정 전단점, 표적 서열을 포함하는 개별 분자의 말단 끝에 관한 특징, 또는 개별 분자의 말단으로부터 알려진 거리에서의 또는 이것에 인접한 또는 이것 내의 특정 서열에 관한 정보이거나 이를 포함할 수 있다. 일부 실시형태에서, SMI는 랜덤 또는 반랜덤 손상, 화학 변형, 효소 변형 또는 핵산 분자에 대한 다른 변형에 의해 생긴 핵산 분자의 서열 변이와 관련될 수 있다. 일부 실시형태에서, 그 변형은 메틸사이토신의 탈아미노화일 수 있다. 일부 실시형태에서, 그 변형은 핵산 닉의 부위를 포함할 수 있다. 일부 실시형태에서, SMI는 외인성 요소 및 내인성 요소 둘 다를 포함할 수 있다. 일부 실시형태에서, SMI는 물리적으로 인접한 SMI 요소를 포함할 수 있다. 일부 실시형태에서, SMI 요소는 분자에서 공간상 구별될 수 있다. 일부 실시형태에서 SMI는 비핵산일 수 있다. 일부 실시형태에서, SMI는 2개 이상의 상이한 유형의 SMI 정보를 포함할 수 있다. SMI의 다양한 실시형태는 본원에 그 전문이 참조로 포함된 국제 특허 공보 WO 제2017/100441호에 추가로 개시된다.
가닥 한정 요소(SDE) : 본원에 사용된 바와 같이, 용어 "가닥 한정 요소" 또는 "SDE"는 이중-가닥 핵산 물질의 특정 가닥의 확인 및 이에 따라 다른/상보성 가닥으로부터의 구별이 가능하게 하는 임의의 물질(예를 들어, 표적 이중-가닥 핵산으로부터 생긴 2개의 단일 가닥 핵산의 각각의 증폭 산물이 시퀀싱 또는 다른 핵산 정보획득 후 실질적으로 서로 구별 가능하게 하는 임의의 물질)를 지칭한다. 일부 실시형태에서, SDE는 어댑터 서열 내의 실질적으로 비상보성인 서열의 하나 이상의 분절을 포함할 수 있다. 특정 실시형태에서, 어댑터 서열 내의 실질적으로 비상보성인 서열의 분절은 Y-형상 또는 "루프" 형상을 포함하는 어댑터 분자에 의해 제공될 수 있다. 다른 실시형태에서, 어댑터 서열 내의 실질적으로 비상보성인 서열의 분절은 어댑터 서열 내의 인접한 상보성 서열의 중간에서 쌍을 짓지 않는 "버블"을 형성할 수 있다. 다른 실시형태에서, SDE는 핵산 변형을 포괄할 수 있다. 일부 실시형태에서, SDE는 쌍 지은 가닥이 물리적으로 분리된 반응 구획으로 물리적으로 분리되는 것을 포함할 수 있다. 일부 실시형태에서, SDE는 화학 변형을 포함할 수 있다. 일부 실시형태에서, SDE는 변형된 핵산을 포함할 수 있다. 일부 실시형태에서, SDE는 핵산 분자에 대한 랜덤 또는 반랜덤 손상, 화학 변형, 효소 변형 또는 다른 변형에 의해 생긴 핵산 분자의 서열 변이와 관련될 수 있다. 일부 실시형태에서, 그 변형은 메틸사이토신의 탈아미노화일 수 있다. 일부 실시형태에서, 그 변형은 핵산 닉의 부위를 수반할 수 있다. SDE의 다양한 실시형태는 본원에 그 전문이 참조로 포함된 국제 특허 공보 WO 제2017/100441호에 추가로 개시되어 있다.
대상체 : 본원에 사용된 바와 같이, 용어 "대상체"는 유기체, 통상적으로 포유류, 예컨대 인간(일부 실시형태에서, 태아기 인간 형태를 포함), 비인간 동물(예를 들어, 비제한적인 예로서 비인간 영장류, 말, 양, 개, 고양이, 돼지, 닭, 양서류, 파충류, 해양-생물(일반적으로 바다 원숭이 제외), 다른 모델 유기체, 예컨대 벌레, 파리, 제브라피시 등을 포함하는 포유류 및 비포유류), 및 형질전환 동물(예를 들어, 형질전환 설치류) 등을 지칭한다. 일부 실시형태에서, 대상체는 게놈 편집 사건을 겪은 세포에 치료되거나 노출될 것이다. 일부 실시형태에서, 대상체는 관련 질병, 장애 또는 질환을 겪는다. 일부 실시형태에서, 대상체는 유전독성 연관된 질병 또는 장애를 겪는다. 일부 실시형태에서, 대상체는 질병, 장애 또는 질환에 걸리기 쉽다. 일부 실시형태에서, 대상체는 질병, 장애 또는 질환의 하나 이상의 증상 또는 특징을 나타낸다. 일부 실시형태에서, 대상체는 질병, 장애 또는 질환의 임의의 증상 또는 특징을 나타내지 않는다. 일부 실시형태에서, 대상체는 질병, 장애 또는 질환의 감수성 또는 위험에 특징적인 하나 이상의 특징을 갖는다. 일부 실시형태에서, 대상체는 진단 및/또는 요법이 투여되고/되거나 투여되어지는 개체이다. 또 다른 실시형태에서, 생물학적 샘플은 대상체로부터 단리, 추출 또는 달리 수득된다. 또 다른 실시형태에서, 대상체는 예컨대 생체내 연구를 위해 예를 들어 유기체, 세포, 및/또는 조직, 예를 들어 진균, 식물, 원생동물, 박테리아, 고세균, 바이러스, 배양에서 단리된 세포, 의도적으로(예를 들어, 줄기 세포 이식물, 장기 이식물) 또는 의도하지 않고(즉, 태아 또는 모체 마이크로키메리즘) 있는 세포 또는 편집되거나 단리된 핵산 또는 세포기관(즉, 미토콘드리아, 엽록체, 자유 바이러스 게놈, 자유 플라스미드, 압타머, 리보자임 또는 핵산의 유도체 또는 전구체(즉, 올리고뉴클레오타이드, 디뉴클레오타이드 트리포스페이트 등)를 포함하거나 편집된 게놈일 수 있는 임의의 살아 있는 생물학적 소스 또는 다른 핵산 물질을 지칭한다.
실질적으로 : 본원에 사용된 바와 같이, 용어 "실질적으로"는 관심이 있는 특징 또는 특성의 전체 또는 거의 전체의 규모 또는 정도를 나타내는 정성적 조건을 지칭한다. 생물학적 분야의 당업자는 생물학적 현상 및 화학적 현상이, 설사 그렇더라도, 완전해 지고/지거나 완전성으로 진행하거나 절대 결과를 달성하거나 회피하지 않음을 이해할 것이다. 용어 "실질적으로"는 따라서 본원에서 많은 생물학적 현상 및 화학적 현상에 고유한 완정성의 잠재적인 결여를 포착하도록 사용된다.
치료학적 유효량: 본원에 사용된 바와 같이, 용어 "치료학적 유효량"은 질환, 장애, 및/또는 병태를 치료하기 위해 치료학적 투약 섭생에 따라 질환, 장애, 및/또는 병태로 고통받거나 이에 민감한 집단에게 투여될 때 충분한 양을 의미한다. 일부 실시형태에서, 치료학적 유효량은 질환, 질병 및/또는 병태의 하나 이상의 증상의 발생률 및/또는 중증도를 감소시키고/시키거나, 이의 하나 이상의 특징을 안정화시키고/시키거나, 이의 발생을 지연시키는 것이다. 당업자는 용어 "치료학적 유효량"이 사실 성공적인 치료가 특정 개체에서 달성될 것을 필요로 하지 않는다고 이해할 것이다. 오히려, 치료학적 유효량은 이러한 치료를 필요로 하는 환자에 투여될 때 대상체의 상당한 수에서의 특정한 원하는 약물학적 반응을 제공하는 양일 수 있다.
트리뉴클레오타이드 또는 트리뉴클레오타이드 상황: 본원에 사용된 바와 같이, 용어 "트리뉴클레오타이드" 또는 "트리뉴클레오타이드 상황"은 서열에서 바로 앞의 및 바로 뒤의 뉴클레오타이드 염기의 상황 내에 뉴클레오타이드(예를 들어, 3개-모노뉴클레오타이드 조합 내의 모노뉴클레오타이드)를 지칭한다.
트리뉴클레오타이드 스펙트럼 또는 서명: 본원에서, "트리뉴클레오타이드 스펙트럼", "삼중항 서명" 및 "삼중항 스펙트럼"과 상호 교환되어 사용된 용어 "트리뉴클레오타이드 서명"은 트리뉴클레오타이드 상황에서의 돌연변이 서명을 지칭한다. 소정의 실시형태에서, 게놈 편집 사건은 고유한, 반고유한 및/또는 달리 확인 가능한 삼중항 스펙트럼/서명을 가질 수 있다. 일부 경우에, 돌연변이성 서명으로도 공지된 돌연변이체 서명은 트리뉴클레오타이드 서명을 포함한다.
치료 : 본원에 사용된 바와 같이, 용어 "치료"는 질환, 질환의 증상 또는 질환에 대한 소인을 고치거나 치유하거나 완화하거나 없애거나 변경하거나 구제하거나 경감시키거나 개선하거나 영향을 미칠 목적으로 대상체에 대한 치료제의 도포 또는 투여, 또는 장애, 예를 들어 질환 또는 병태, 질환의 증상, 또는 질환에 대한 소인을 갖는 대상체로부터의 단리된 조직 또는 세포주에 대한 치료제의 도포 또는 투여를 지칭한다. 치료는 또한 질환, 질환의 증상을 고치거나 치유하거나 완화하거나 없애거나 변경하거나 구제하거나 경감시키거나 개선하거나 영향을 미치도록 의도되지 않은 변화를 유도할 목적을 위해 대상체 또는 세포에 대한 노출 또는 과정의 적용을 지칭할 수 있다. 예를 들어, 실험실 동물은 예컨대 인간에 대한 이의 효과를 예측하기 위해 설치류 대상체에 대한 이의 불리한 효과를 평가할 목적을 위해 해로운 화학물질에 의해 치료될 수 있다.
변이체 : 본원에 사용된 바와 같이, 용어 "변이체"는 기준 집합체와 상당한 구조 동일성을 나타내지만, 기준 집합체와 비교하여 하나 이상의 화학 모이어티의 존재 또는 수준이 기준 집합체와 구조적으로 다른 집합체를 지칭한다. 핵산의 상황에서, 변이체 핵산은 선형 또는 3차원 공간에서 다른 핵산에 대해 지정된 위치를 갖는 복수의 뉴클레오타이드 잔기로 이루어진 특징적인 서열 요소를 가질 수 있다. 상동성을 갖는 서열은 하나 이상의 변이체만큼 다르다. 예를 들어, 변이체 폴리뉴클레오타이드(예를 들어, DNA)는 핵산 서열의 하나 이상의 차이의 결과로서 기준 폴리뉴클레오타이드와 다를 수 있다. 일부 실시형태에서, 변이체 폴리뉴클레오타이드 서열은 다른 서열(예를 들어, 샘플에서의 기준 서열 또는 다른 폴리뉴클레오타이드(예를 들어, DNA) 서열)에 비해 삽입, 결실, 치환 또는 돌연변이를 포함한다. 변이체의 예는 SNP, SNV, CNV, CNP, MNV, MNP, 돌연변이, 암 돌연변이, 유발자 돌연변이, 패신저 돌연변이, 유전성 다형을 포함한다.
변이 빈도: 본원에 사용된 바와 같이, 용어 "변이 빈도"는 집단의 분획 또는 백분율로서 표현된 집단에서의 특정 유전좌위에서의 유전자 변이체의 상대 빈도를 지칭한다. 그 집단은 무엇보다도 세포의 집단, 유기체의 집단, 대상체의 집단, 또는 분자의 집단 또는 DNA 분자의 집단일 수 있다.
변이체 대립유전자 빈도 : 본원에 사용된 바와 같이, 용어 "변이체 대립유전자 빈도"는 집단에서의 특정 유전좌위에서 대립유전자(유전자의 변이체)의 상대 빈도, 예를 들어 무엇보다도 세포의 집단, 유기체의 집단, 대상체의 집단, 또는 분자의 집단 또는 DNA 분자의 집단 중에서 특정 대립유전자를 보유하는 집단에서의 모든 염색체의 분수를 지칭한다.
듀플렉스 시퀀싱 방법 및 연관된 어댑터 및 시약의 선택된 실시형태
듀플렉스 시퀀싱은 이중-가닥 핵산 분자로부터의 오류-보정된 DNA 서열을 제조하는 방법이고, 이것은 원래 국제 특허 공보 WO 제2013/142389호 및 미국 특허 제9,752,188호 및 WO 2017/100441, Schmitt 등, PNAS, 2012 [1]; Kennedy 등, PLOS Genetics, 2013 [2]; Kennedy 등, Nature Protocols, 2014 [3]; 및 Schmitt 등, Nature Methods, 2015 [4]에 기재되어 있다. 각각의 상기 언급된 특허, 특허 출원 및 간행물은 그 전체가 본원에 참고로 포함된다. 도 1a 내지 도 1c, 및 본 기술내용의 소정의 양태에 예시된 것처럼, 듀플렉스 시퀀싱은 파생 서열 리드가 일반적으로 차세대 시퀀싱 (NGS)으로도 알려진 대량 병렬 시퀀싱(MPS, massively parallel sequencing) 동안 동일한 이중-가닥 핵산 모 분자로부터 기원한 것으로 인식되지만, 또한 시퀀싱 이후 구별 가능한 집합체로서 서로 구별될 수 있는 방식으로 개별 DNA 분자의 가닥 둘 다를 독립적으로 시퀀싱하도록 사용될 수 있다. 이후, 각각의 가닥으로부터의 생성된 서열 리드는 DCS (Duplex Consensus Sequence)로 알려진 원래의 이중-가닥 핵산 분자의 오류-보정된 서열을 얻을 목적을 위해 비교된다. 듀플렉스 시퀸싱 공정을 통해 원래 이중 가닥 핵산 분자의 두 가닥이 DCS를 형성하는 데 사용되는 생성된 시퀀싱 데이터에 표시되는지 명시적으로 확인할 수 있다.
소정의 실시형태에서, DS를 도입하는 방법은 이중-가닥 표적 핵산 복합체를 제조하기 위해 제1 가닥 표적 핵산 서열 및 제2 가닥 표적 핵산 서열을 포함하는 표적 이중-가닥 핵산 분자에 대한 하나 이상의 시퀀싱 어댑터의 결찰을 포함할 수 있다(예를 들어, 도 1a).
다양한 실시형태에서, 생성된 표적 핵산 복합체는 외인성으로 적용된 축퇴성 서열 또는 반축퇴성 서열(예를 들어, 도 1a에 도시된 무작위화된 듀플렉스 태그, 도 1a에서 α 및 β로 확인된 서열), 표적 이중-가닥 핵산 분자의 특정 전단점과 관련된 내인성 정보, 또는 이들의 조합을 포함할 수 있는 적어도 하나의 SMI 서열을 포함할 수 있다. SMI는 시퀀싱되는 집단에서 표적-핵산 분자가 복수의 다른 분자로부터 단독으로 또는 이것이 결찰된 핵산 단편의 구별 가능한 요소와 조합되어 실질적으로 구별 가능하게 할 수 있다. SMI 요소의 실질적으로 구별 가능한 특징은 이중-가닥 핵산 분자를 형성하는 각각의 단일 가닥에 의해 독립적으로 보유될 수 있어서, 각각의 가닥의 파생 증폭 산물은 시퀀싱 후 동일한 원래의 실질적으로 고유한 이중-가닥 핵산 분자로부터 나온 것으로 인식될 수 있다. 다른 실시형태에서, SMI는 추가 정보를 포함할 수 있고/있거나, 이러한 분자 구별 기능성이 유용한 다른 방법, 예컨대 상기 언급된 공보에 기재된 것에 사용될 수 있다. 다른 실시형태에서, SMI 요소는 어댑터 결찰 후 도입될 수 있다. 일부 실시형태에서, SMI는 본질적으로 이중-가닥이다. 다른 실시형태에서, 그것은 본질적으로 단일-가닥이다(예를 들어, SMI는 어댑터의 단일-가닥 부분(들)에 있을 수 있음). 다른 실시형태에서, 그것은 단일-가닥 및 이중-가닥의 조합이다.
일부 실시형태에서, 각각의 이중-가닥 표적 핵산 서열 복합체는 표적 이중-가닥 핵산 분자를 형성하는 2개의 단일-가닥 핵산의 증폭 산물이 시퀀싱 후 서로 실질적으로 구별 가능하게 하는 요소(예를 들어, SDE)를 추가로 포함할 수 있다. 일 실시형태에서, SDE는 시퀀싱 어댑터 내에 포함된 비대칭적 프라이머 부위를 포함할 수 있거나, 다른 배열에서 서열 비대칭은 프라이머 서열 내가 아닌 어댑터 분자로 도입될 수 있어서, 표적 핵산 서열 복합체의 제1 가닥 및 표적 핵산 서열 복합체의 제2 가닥의 뉴클레오타이드 서열에서의 적어도 하나의 위치는 증폭 및 시퀀싱 후에 서로 상이하다. 다른 실시형태에서, SMI는 정규 뉴클레오타이드 서열 A, T, C, G 또는 U와 상이하지만, 2개의 증폭되고 시퀀싱된 분자에서 적어도 하나의 정규 뉴클레오타이드 서열 차이로 전환되는 2개의 가닥 사이에 다른 생화학적 비대칭을 포함할 수 있다. 또 다른 실시형태에서, SDE는 증폭 전에 2개의 가닥을 물리적으로 분리시키는 수단일 수 있어서, 제1 가닥 표적 핵산 서열 및 제2 가닥 표적 핵산 서열로부터의 파생 증폭 산물은 2개 사이의 구별을 유지시킬 목적을 위해 하나와 다른 것으로부터 실질적인 물리적 이격에서 유지된다. 제1 가닥 및 제2 가닥의 구별을 허용하는 SDE 기능을 제공하기 위한 다른 이러한 배열 또는 방법론, 예컨대 상기 언급된 공보에 기재된 것 또는 기재된 기능 목적을 제공하는 다른 방법을 사용할 수 있다.
적어도 하나의 SMI 및 적어도 하나의 SDE를 포함하는 이중-가닥 표적 핵산 복합체를 생성한 후에, 또는 이들 요소들 중 하나 또는 둘 다가 후속하여 도입되는 경우, 이 복합체는 예컨대 PCR과 같은 DNA 증폭, 또는 DNA 증폭의 임의의 다른 생화학적 방법 (예: 롤링 서클 증폭, 다중 변위 증폭, 등온 증폭, 브리지 증폭 또는 표면 결합 증폭으로 처리될 수 있어서, 제1 가닥 표적 핵산 서열의 하나 이상의 카피 및 제2 가닥 표적 핵산 서열의 하나 이상의 카피가 제조된다(예를 들어, 도 1b). 이후, 제1 가닥 표적 핵산 분자의 하나 이상의 증폭 카피 및 제2 표적 핵산 분자의 하나 이상의 증폭 카피는 바람직하게는 "차세대" 대량 병렬 DNA 시퀀싱 플랫폼을 사용하여 DNA 시퀀싱으로 처리될 수 있다(예를 들어, 도 1b).
원래의 이중-가닥 표적 핵산 분자로부터 유래된 제1 가닥 표적 핵산 분자 및 제2 가닥 표적 핵산 분자 중 어느 하나로부터 제조된 서열 리드는 관련된 실질적으로 고유한 SMI를 공유함에 기초하여 확인되고, SDE에 의해 반대의 가닥 표적 핵산 분자로부터 구별될 수 있다. 일부 실시형태에서, SMI는 수확적으로-기초한 오류 정정 코드(예를 들어, 해밍 코드(Hamming code))에 기초한 서열일 수 있고, 이로써 소정의 증폭 오류, 시퀀싱 오류 또는 SMI 합성 오류는 원래의 듀플렉스(예를 들어, 이중-가닥 핵산 분자)의 상보성 가닥에서 SMI 서열의 서열을 관련시킬 목적을 위해 관용될 수 있다. 예를 들어, SMI가 정규 DNA 염기의 완전히 축퇴성인 서열의 15개의 염기 쌍을 포함하는 이중 가닥 외인성 SMI에 의해, 추정된 4^15 = 1,073,741,824 SMI 변이체는 완전히 축퇴성인 SMI의 집단에 존재할 것이다. 2개의 SMI가 10,000개의 샘플링된 SMI의 집단 중에서 SMI 서열 내에 1개의 뉴클레오타이드가 다른 시퀀싱 데이터의 판독치로부터 회수되면, 이것은 수학적으로 계산할 수 있고, 이의 확률은 랜덤 선택으로 발생하고, 단일 염기 쌍 차이가 상술된 오류 유형 중 하나를 더욱 반영할 것 같은지 및 SMI 서열이 사실 동일한 원래의 듀플렉스 분자로부터 유래되는 것으로 결정될 수 있는지에 대한 결정이 이루어질 수 있다. 일부 실시형태에서, SMI가 적어도 부분적으로 서열 변이체가 서로 완전히 축퇴성이 아닌 외인성으로 적용된 서열이고 적어도 부분적으로 알려진 서열인 경우, 알려진 서열의 정체는 일부 실시형태에서 상술된 유형의 하나 이상의 오류가 하나의 알려진 SMI 서열의 정체를 다른 SMI 서열의 정체로 전환시키지 않는 방식으로 설계될 수 있어서, 하나의 SMI가 다른 SMI의 정체로 잘못 해석될 가능성이 감소한다. 일부 실시형태에서, 이 SMI 설계 전략은 해밍 코드 접근법 또는 이의 도함수를 포함한다. 제1 가닥 표적 핵산 분자로부터 제조된 하나 이상의 서열 리드는 확인되면 제2 가닥 표적 핵산 분자로부터 제조된 하나 이상의 서열 리드와 비교되어 오류-보정된 표적 핵산 분자 서열을 제조한다(예를 들어, 도 1c). 예를 들어, 제1 가닥 및 제2 가닥 표적 핵산 서열 둘 다로부터의 염기가 동의하는 뉴클레오타이드 위치는 진정한 서열인 것으로 간주되는 한편, 2개의 가닥 사이에 비동의하는 뉴클레오타이드 위치는 무시되거나 제거되거나 보정되거나 그렇지 않으면 확인될 수 있는 기술적 오류의 잠재적인 부위로 인식된다. 원래의 이중-가닥 표적 핵산 분자의 오류-보정된 서열이 따라서 제조될 수 있다(도 1c에 도시됨). 일부 실시형태에서, 제1 가닥 표적 핵산 분자 및 제2 가닥 표적 핵산 분자로부터 제조된 각각의 시퀀싱 리드의 별개의 그룹화 후에, 단일-가닥 공통 서열은 각각의 제1 가닥 및 제2 가닥에 생성될 수 있다. 이후, 제1 가닥 표적 핵산 분자 및 제2 가닥 표적 핵산 분자로부터의 단일-가닥 공통 서열은 오류-보정된 표적 핵산 분자 서열을 제조하도록 비교될 수 있다(예를 들어, 도 1c).
대안적으로, 일부 실시형태에서, 2개의 가닥 사이의 서열 비동의의 부위는 원래의 이중 가닥 표적 핵산 분자의 생물학적으로-유래된 미스매치의 잠재적인 부위로 인식될 수 있다. 대안적으로, 일부 실시형태에서, 2개의 가닥 사이의 서열 비동의의 부위는 원래의 이중 가닥 표적 핵산 분자에서의 DNA 합성-유래된 미스매치의 잠재적인 부위로 인식될 수 있다. 대안적으로, 일부 실시형태에서, 2개의 가닥 사이의 서열 비동의의 부위는 손상된 뉴클레오타이드 염기 또는 변형된 뉴클레오타이드 염기가 하나의 가닥 또는 둘 다의 가닥에 존재하고, 효소 과정(예를 들어, DNA 중합효소, DNA 글라이코실라제 또는 다른 핵산 변형 효소 또는 화학 공정)에 의해 미스매치로 전환되는 잠재적인 부위로 인식될 수 있다. 일부 실시형태에서, 이 후자의 발견은 효소 과정 또는 화학 처리 전에 핵산 손상 또는 뉴클레오타이드 변형의 존재를 추론하기 위해 사용될 수 있다.
일부 실시형태에서, 본 기술내용의 양태에 따르면, 본원에 기술된 듀플렉스 시퀀싱 단계로부터 생성된 시퀀싱 리드는 DNA-손상된 분자(예를 들어, 저장 동안, 선적 동안, 조직 또는 혈액 추출 동안 또는 후에, 라이브러리 제조 동안 또는 후에 기타 등등에서 손상된)로부터 시퀀싱 리드를 제거하기 위해 추가로 여과될 수 있다. 예를 들어, DNA 복구 효소, 예컨대 우라실-DNA 글라이코실라제(UDG), 포름아미도피리미딘 DNA 글라이코실라제(FPG) 및 8-옥소구아닌 DNA 글라이코실라제(OGG1)는 DNA 손상(예를 들어, 시험관내 DNA 손상 또는 생체내 손상)을 제거하거나 보정하기 위해 사용될 수 있다. 이 DNA 복구 효소는 예를 들어 DNA로부터 손상된 염기를 제거하는 글라이코실라제이다. 예를 들어, UDG는 (사이토신의 자발적 가수분해에 의해 초래된) 사이토신 탈아미노화로부터 생긴 우라실을 제거하고, FPG는 8-옥소-구아닌(예를 들어, 반응성 산소 종으로부터 생긴 흔한 DNA 병변)을 제거한다. FPG는 또한 비염기성 부위에서 1개 염기 갭을 생성할 수 있는 리가제 활성을 갖는다. 예를 들어, 중합효소가 주형을 카피하지 못하므로, 이러한 비염기성 부위는 일반적으로 후속하여 PCR에 의해 증폭하지 못할 것이다. 따라서, 이러한 DNA 손상 복구/제거 효소의 사용은 진성 돌연변이를 갖지 않는 손상된 DNA를 효과적으로 제거할 수 있고, 그렇지 않으면 시퀀싱 및 듀플렉스 서열 분석 후에 오류로서 검출되지 않을 것이다. 상보성 오류가 가닥 둘 다에서 동일한 위치에서 이론적으로 발생하는 드문 경우에 손상된 염기로 인한 오류는 대개 듀플렉스 시퀀싱에 의해 보정될 수 있지만, 이에 따라 오류-증가 손상의 감소는 인공산물의 개연성을 감소시킬 수 있다. 더욱이, 라이브러리 제조 동안, 시퀀싱되는 DNA의 소정의 단편은 이의 소스 또는 프로세싱 단계(예를 들어, 기계적 DNA 전단)로부터의 단일-가닥일 수 있다. 이 영역은 통상적으로 당해 분야에 알려진 "말단 복구" 단계 동안 이중 가닥 DNA로 전환되고, 이로써 DNA 중합효소 및 뉴클레오사이드 기질은 DNA 샘플에 첨가되어 5' 오목한 말단을 연장시킨다. 카피되는 DNA의 단일-가닥 부분에서의 DNA 손상의 돌연변이성 부위(즉, DNA 듀플렉스 또는 내부 단일-가닥 닉 또는 갭의 하나의 말단 또는 둘 다의 말단에서의 단일-가닥 5' 오버행)는 필인(fill-in) 반응 동안 오류를 야기할 수 있는데, 이 반응은 단일-가닥 돌연변이, 합성 오류 또는 핵산 손상의 부위가 진성 돌연변이로서 최종 듀플렉스 공통 서열에서 잘못 해석되는 이중-가닥 형태가 되게 하여서, 진성 돌연변이는 사실 원래의 이중 가닥 핵산 분자에 존재하지 않을 때 이 핵산 분자에 존재한다. "슈도-듀플렉스"라 불리는 이 시나리오는 이러한 손상 파괴/복구 효소의 사용에 의해 감소되거나 방지될 수 있다. 다른 실시형태에서, 이 발생은 원래의 듀플렉스 분자의 단일-가닥 부분을 파괴하거나 이의 형성을 방지하는 전략의 사용(예를 들어, 기계적 전단보다는 원래의 이중 가닥 핵산 물질을 단편화하기 위해 사용되는 소정의 효소 또는 닉 또는 갭을 남길 수 있는 소정의 다른 효소의 사용)을 통해 감소되거나 제거될 수 있다. 다른 실시형태에서, 원래의 이중-가닥 핵산(예를 들어, 단일-가닥 특이적 뉴클레아제, 예컨대 S1 뉴클레아제 또는 녹두 뉴클레아제)의 단일-가닥 부분을 제거하는 과정의 사용은 유사한 목적에 사용될 수 있다.
추가의 실시형태에서, 본원에 기술된 듀플렉스 시퀀싱 단계로부터 생성된 시퀀싱 리드는 슈도듀플렉스 인공산물에 가장 경향이 있는 리드의 말단을 손질함으로써 거짓 돌연변이를 제거하도록 추가로 여과될 수 있다. 예를 들어, DNA 단편화는 이중-가닥 분자의 말단 단부에서 단일 가닥 부분을 생성할 수 있다. 이 단일-가닥 부분은 말단 복구 동안 (예를 들어, Klenow 또는 T4 중합효소에 의해) 충전될 수 있다. 일부 경우에, 중합효소는 "슈도듀플렉스 분자"를 생성시키는 이 말단 복구된 영역에서 카피 실수를 만든다. 라이브러리 제조의 이 인공산물은 시퀀싱되면 진성 돌연변이인 것으로 부정확하게 나타날 수 있다. 이 오류는 말단 복구 기전의 결과로서 더 높은 위험 영역에서 발생할 수 있는 임의의 돌연변이를 배제하도록 시퀀싱 리드의 말단을 손질하여서 거짓 돌연변이의 수를 감소시킴으로써 시퀀싱 후 분석으로부터 제거되거나 감소될 수 있다. 일 실시형태에서, 시퀀싱 리드의 이러한 손질은 자동적으로 달성될 수 있다(예를 들어, 일반 공정 단계). 다른 실시형태에서, 돌연변이 빈도는 단편 말단 영역에 대해 평가될 수 있고, 돌연변이의 역치 수준이 단편 말단 영역에서 관찰되면, 시퀀싱 리드 손질은 DNA 단편의 이중-가닥 공통 서열 리드를 생성하기 전에 수행될 수 있다.
특정 예로서, 일부 실시형태에서, 이중-가닥 표적 핵산 물질을 적어도 하나의 어댑터 서열에 결찰하여, 어댑터-표적 핵산 물질 복합체를 형성하는 단계를 포함하는 이중-가닥 표적 핵산 물질의 오류-보정된 서열 리드를 생성하는 방법이 본원에 제공되고, 여기서 적어도 하나의 어댑터 서열은 (a) 이중-가닥 표적 핵산 물질의 각각의 분자를 고유하게 표지하는 축퇴성 또는 반축퇴성 단일 분자 식별자(SMI) 서열, 및 (b) 어댑터-표적 핵산 물질 복합체의 각각의 가닥이 이의 상보성 가닥에 대해 명확하게 확인 가능한 뉴클레오타이드 서열을 갖도록 어댑터-표적 핵산 물질 복합체의 제1 가닥을 태그화하는 제1 뉴클레오타이드 어댑터 서열, 및 어댑터-표적 핵산 물질 복합체의 제2 가닥을 태그화하는 제1 뉴클레오타이드 서열에 적어도 부분적으로 비상보성인 제2 뉴클레오타이드 어댑터 서열을 포함한다. 상기 방법은 다음에 어댑터-표적 핵산 물질 복합체의 각각의 가닥을 증폭시켜 복수의 제1 가닥 어댑터-표적 핵산 복합체 앰플리콘 및 복수의 제2 가닥 어댑터-표적 핵산 복합체 앰플리콘을 제조하는 단계를 포함할 수 있다. 상기 방법은 제1 및 제2 가닥 둘 다를 증폭시켜 제1 핵산 산물 및 제2 핵산 산물을 제공하는 단계를 추가로 포함할 수 있다. 상기 방법은 또한 각각의 제1 핵산 산물 및 제2 핵산 산물을 시퀀싱하여 복수의 제1 가닥 서열 리드 및 복수의 제2 가닥 서열 리드를 제조하는 단계, 및 적어도 하나의 제1 가닥 서열 리드 및 적어도 하나의 제2 가닥 서열 리드의 존재를 확증하는 단계를 포함할 수 있다. 상기 방법은 적어도 하나의 제1 가닥 서열 리드를 적어도 하나의 제2 가닥 서열 리드와 비교하는 단계, 및 동의하지 않는 뉴클레오타이드 위치를 무시함으로써 이중-가닥 표적 핵산 물질의 오류-보정된 서열 리드를 생성하거나, 대안적으로 비교된 제1 가닥 서열 리드 및 제2 가닥 서열 리드가 비상보성인 하나 이상의 뉴클레오타이드 위치를 갖는 비교된 제1 가닥 서열 리드 및 제2 가닥 서열 리드를 제거하는 단계를 추가로 포함할 수 있다.
추가 특정 예로서, 일부 실시형태에서, 핵산 물질(예를 들어, 이중-가닥 표적 DNA 분자)의 가닥 둘 다를 적어도 하나의 비대칭적 어댑터 분자에 결찰하여, 이중-가닥 표적 DNA 분자의 제1 가닥과 연관된 제1 뉴클레오타이드 서열(예를 들어, 상부 가닥) 및 이중-가닥 표적 DNA 분자의 제2 가닥과 연관된 제1 뉴클레오타이드 서열에 적어도 부분적으로 비상보성인 제2 뉴클레오타이드 서열(예를 들어, 하부 가닥)을 갖는 어댑터-표적 핵산 물질 복합체를 형성하는 단계, 및 어댑터-표적 핵산 물질의 각각의 가닥을 증폭시켜, 증폭된 어댑터-표적 핵산 산물의 구별되지만 관련된 세트를 생성하는 각각의 가닥을 생성하는 단계를 포함하는, 샘플로부터 DNA 변이체를 확인하는 방법이 본원에 제공된다. 상기 방법은 복수의 제1 가닥 어댑터-표적 핵산 산물 및 복수의 제2 가닥 어댑터-표적 핵산 산물의 각각을 시퀀싱하는 단계, 어댑터-표적 핵산 물질 복합체의 각각의 가닥으로부터 적어도 하나의 증폭된 서열 리드의 존재를 확증하는 단계 및 제1 가닥으로부터 얻은 적어도 하나의 증폭된 서열 리드를 제2 가닥으로부터 얻은 적어도 하나의 증폭된 서열 리드와 비교하여 (예를 들어, 기준 서열과 비교된) 공통 서열 리드에서 특정 위치에서 생긴 변이체가 진정한 DNA 변이체로서 확인되도록 핵산 물질(예를 들어, 이중-가닥 표적 DNA 분자)의 가닥 둘 다의 서열이 동의하는 뉴클레오타이드 염기만을 갖는 핵산 물질의 공통 서열 리드(예를 들어, 이중-가닥 표적 DNA 분자)를 형성하는 단계를 추가로 포함할 수 있다.
일부 실시형태에서, 이중-가닥 핵산 물질로부터 고정확성 공통 서열을 생성하는 방법이 본원에 제공되고, 상기 방법은 개별 듀플렉스 DNA 분자를 어댑터 분자로 태그화하여 태그화된 DNA 물질을 형성하는 단계이되, 각각의 어댑터 분자는 (a) 듀플렉스 DNA 분자를 고유하게 표지하는 축퇴성 또는 반축퇴성 단일 분자 식별자(SMI), 및 (b) 각각의 태그화된 DNA 분자에 대해 표지화된 DNA 물질 내에 각각의 개별 DNA 분자의 원래의 하부 가닥으로부터 원래의 상부 가닥을 구별하는 제1 비상보성 뉴클레오타이드 어댑터 서열 및 제2 비상보성 뉴클레오타이드 어댑터 서열을 포함하는 단계 및 태그화된 DNA 분자의 원래의 상부 가닥의 듀플레케이트의 세트 및 태그화된 DNA 분자의 원래의 하부 가닥의 듀플레케이트의 세트를 생성하여 증폭된 DNA 물질을 형성하는 단계를 포함한다. 상기 방법은 원래의 상부 가닥의 듀플레케이트로부터의 제1 단일 가닥 공통 서열(SSCS: single strand consensus sequence) 및 원래의 하부 가닥의 듀플레케이트로부터의 제2 단일 가닥 공통 서열(SSCS)을 생성하는 단계, 원래의 상부 가닥의 제1 SSCS를 원래의 하부 가닥의 제2 SSCS와 비교하는 단계 및 원래의 상부 가닥의 제1 SSCS 및 원래의 하부 가닥의 제2 SSCS 둘 다의 서열이 상보성인 뉴클레오타이드 염기만을 갖는 고정확성 공통 서열을 생성하는 단계를 추가로 포함할 수 있다.
추가 실시형태에서, 적어도 하나의 비대칭 어댑터 분자에 각각의 이중 가닥 표적 DNA 분자의 두 가닥을 모두에 결찰시키는 단계를 포함하는 이중 가닥 표적 DNA 분자를 포함하는 샘플로부터의 DNA 돌연변이 및/또는 변이체를 검출 및/또는 정량화하여 복수의 어댑터-표적 DNA 복합체를 형성하는 단계이되, 각각의 어댑터-표적 DNA 복합체는 이중-가닥 표적 DNA 분자의 제1 가닥과 연관된 제1 뉴클레오타이드 서열 및 이중-가닥 표적 DNA 분자의 제2 가닥과 연관된 제1 뉴클레오타이드 서열에 적어도 부분적으로 비상보성인 제2 뉴클레오타이드 서열을 갖는 단계 및 각각의 어댑터 표적 DNA 복합체에 대해 어댑터-표적 DNA 복합체의 각각의 가닥을 증폭시켜, 증폭된 어댑터-표적 DNA 앰플리콘의 구별되지만 관련된 세트를 생성하는 각각의 가닥을 생성시키는 단계를 포함한다. 상기 방법은 복수의 제1 가닥 어댑터-표적 DNA 앰플리콘 및 복수의 제2 가닥 어댑터-표적 DNA 앰플리콘의 각각을 시퀀싱하는 단계, 어댑터-표적 DNA 복합체의 각각의 가닥으로부터 적어도 하나의 서열 리드의 존재를 확증하는 단계 및 제1 가닥으로부터 얻은 적어도 하나의 서열 리드를 제2 가닥으로부터 얻은 적어도 하나의 서열 리드와 비교하여 DNA 손상 부위(들)가 검출되고/되거나 정량화될 수 있도록 이중-가닥 DNA 분자의 하나의 가닥의 서열 리드가 이중-가닥 DNA 분자의 다른 가닥의 서열 리드와 비동의하는(예를 들어, 비상보성인) 뉴클레오타이드 염기를 검출하고/하거나 정량화하는 단계를 추가로 포함할 수 있다. 일부 실시형태에서, 상기 방법은 제1 가닥 어댑터-표적 DNA 앰플리콘으로부터의 제1 단일 가닥 공통 서열(SSCS) 및 제2 가닥 어댑터-표적 DNA 앰플리콘으로부터의 제2 단일 가닥 공통 서열(SSCS)을 생성하는 단계, 원래의 제1 가닥의 제1 SSCS를 원래의 제2 가닥의 제2 SSCS와 비교하는 단계 및 제1 SSCS 및 제2 SSCS의 서열이 비상보성인 뉴클레오타이드 염기를 확인하여 샘플의 이중 가닥 표적 DNA 분자와 관련된 DNA 손상을 검출하고/하거나 정량화하는 단계를 추가로 포함할 수 있다.
단일 분자 식별자 서열(SMI)
다양한 실시형태에 따르면, 제공된 방법 및 조성물은 핵산 물질의 각각의 가닥에서 하나 이상의 SMI 서열을 포함한다. SMI는 독립적으로 이중-가닥 핵산 분자로부터 생긴 각각의 단일 가닥에 의해 보유될 수 있어서, 각각의 가닥의 파생 증폭 산물은 시퀀싱 후 동일한 원래의 실질적으로 고유한 이중-가닥 핵산 분자로부터 나온 것으로 인식될 수 있다. 일부 실시형태에서, SMI는 추가 정보를 포함할 수 있고/있거나, 당업자에 의해 인식되는 것처럼 이러한 분자 구별 기능성이 유용한 다른 방법에 사용될 수 있다. 일부 실시형태에서, SMI 요소는 핵산 물질에 대한 어댑터 서열 결찰 전에, 실질적으로 이것과 동시에 또는 이것 후에 혼입될 수 있다.
일부 실시형태에서, SMI 서열은 적어도 하나의 축퇴성 핵산 또는 반축퇴성 핵산을 포함할 수 있다. 다른 실시형태에서, SMI 서열은 비축퇴성일 수 있다. 일부 실시형태에서, SMI는 핵산 분자의 단편 말단(예를 들어, 결찰된 핵산 물질의 무작위로 또는 반무작위로 전단된 말단)과 연관되거나 그 근처인 서열일 수 있다. 일부 실시형태에서, 외인성 서열은 예를 들어 단일 DNA 분자를 서로 구별할 수 있는 SMI 서열을 얻기 위해 결찰된 핵산 물질(예를 들어, DNA)의 무작위로 또는 반무작위로 절단된 말단에 상응하는 서열과 함께 생각될 수 있다. 일부 실시형태에서, SMI 서열은 이중-가닥 핵산 분자에 결찰된 어댑터 서열의 일부이다. 소정의 실시형태에서, SMI 서열을 포함하는 어댑터 서열은 이중-가닥이어서, 이중-가닥 핵산 분자의 각각의 가닥은 어댑터 서열에 대한 결찰 후에 SMI를 포함한다. 다른 실시형태에서, SMI 서열은 이중-가닥 핵산 분자에 대한 결찰 전에 또는 후에 단일-가닥이고, 상보성 SMI 서열은 DNA 중합효소로 반대의 가닥을 연장하여 상보성 이중-가닥 SMI 서열을 생성시킴으로써 생성될 수 있다. 다른 실시형태에서, SMI 서열은 어댑터의 단일-가닥 부분(예를 들어, Y-형상을 갖는 어댑터의 아암)에 있다. 이러한 실시형태에서, SMI는 이중-가닥 핵산 분자의 원래의 가닥으로부터 유래된 서열 리드의 패밀리의 그룹화를 용이하게 할 수 있고, 일부 경우에 이중-가닥 핵산 분자의 원래의 제1 가닥과 제2 가닥 사이에 관계(예를 들어, SMI의 전부 또는 일부는 순람표와 관련될 수 있음)를 부여할 수 있다. 실시형태에서, 제1 가닥 및 제2 가닥이 상이한 SMI로 표지되는 경우, 2개의 원래의 가닥으로부터의 서열 리드는 하나 이상의 내인성 SMI(예를 들어, 단편-특이적 특성, 예컨대 핵산 분자의 단편 단편과 연관되거나 그 근처의 서열)를 사용하여, 또는 2개의 원래의 가닥이 공유하는 추가 분자 태그(예를 들어, 어댑터의 이중-가닥 부분에서의 바코드, 또는 이의 조합)의 사용에 의해 관련될 수 있다. 일부 실시형태에서, 각각의 SMI 서열은 약 1개 내지 약 30개의 핵산(예를 들어, 1개, 2개, 3개, 4개, 5개, 8개, 10개, 12개, 14개, 16개, 18개, 20개 이상의 축퇴성 핵산 또는 반축퇴성 핵산)을 포함할 수 있다.
일부 실시형태에서, SMI는 핵산 물질 및 어댑터 서열의 하나 또는 둘 다에 결찰될 수 있다. 일부 실시형태에서, SMI는 핵산 물질의 T-오버행, A-오버행, CG-오버행, 탈하이드록실화 염기 및 무딘 말단 중 적어도 하나에 결찰될 수 있다.
일부 실시형태에서, SMI의 서열은 단일 핵산 분자를 서로 구별할 수 있는 SMI 서열을 얻기 위해 예를 들어 핵산 물질(예를 들어, 결찰된 핵산 물질)의 무작위로 또는 반무작위로 전단된 말단에 상응하는 서열과 함께 고려(또는 이에 따라 설계)될 수 있다.
일부 실시형태에서, 적어도 하나의 SMI는 내인성 SMI(예를 들어, 전단점 자체를 사용하여 또는 전단점에 바로 인접한 핵산 물질에서의 한정된 수의 뉴클레오타이드[예를 들어, 전단점으로부터의 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개의 뉴클레오타이드]를 사용하여 예를 들어 전단점(예를 들어, 단편 말단)과 관련된 SMI)일 수 있다. 일부 실시형태에서, 적어도 하나의 SMI는 외인성 SMI(예를 들어, 표적 핵산 물질에서 발견되지 않는 서열을 포함하는 SMI)일 수 있다.
일부 실시형태에서, SMI는 영상화 모이어티(예를 들어, 형광 또는 달리 광학적으로 검출 가능한 모이어티)이거나 이를 포함할 수 있다. 일부 실시형태에서, 이러한 SMI는 증폭 단계의 필요 없이 검출 및/또는 정량화를 허용한다.
일부 실시형태에서, SMI 요소는 어댑터-표적 핵산 복합체에서 상이한 위치에 위치한 2개 이상의 별개의 SMI 요소를 포함할 수 있다.
SMI의 다양한 실시형태는 본원에 그 전문이 참조로 포함된 국제 특허 공보 WO 제2017/100441호에 추가로 개시된다.
가닥-한정 요소(SDE)
일부 실시형태에서, 이중-가닥 핵산 물질의 각각의 가닥은 표적 이중-가닥 핵산 물질을 형성하는 2개의 단일-가닥 핵산의 증폭 산물이 시퀀싱 후 서로 실질적으로 구별 가능하게 하는 요소를 추가로 포함할 수 있다. 일부 실시형태에서, SDE는 시퀀싱 어댑터 내에 포함된 비대칭적 프라이머 부위이거나 이를 포함할 수 있거나, 다른 배열에서 서열 비대칭은 어댑터 서열로 도입되고 프라이머 서열 내에 없을 수 있어서, 표적 핵산 서열 복합체의 제1 가닥 및 표적 핵산 서열 복합체의 제2 가닥의 뉴클레오타이드 서열에서의 적어도 하나의 위치는 증폭 및 시퀀싱 후에 서로 다르다. 다른 실시형태에서, SDE는 정규 뉴클레오타이드 서열 A, T, C, G 또는 U와 다르지만, 2개의 증폭되고 시퀀싱된 분자에서 적어도 하나의 정규 뉴클레오타이드 서열 차이로 전환되는 2개의 가닥 사이에 다른 생화학적 비대칭을 포함할 수 있다. 또 다른 실시형태에서, SDE는 증폭 전에 2개의 가닥을 물리적으로 분리시키는 수단이거나 이를 포함할 수 있어서, 제1 가닥 표적 핵산 서열 및 제2 가닥 표적 핵산 서열로부터의 파생 증폭 산물은 2개의 파생 증폭 산물 사이에 구별을 유지시킬 목적을 위해 서로로부터 실질적인 물리적 이격에서 유지된다. 제1 가닥 및 제2 가닥의 구별을 허용하는 SDE 기능을 제공하기 위한 다른 이러한 배열 또는 방법론을 사용할 수 있다.
일부 실시형태에서, SDE는 루프(예를 들어, 헤어핀 루프)를 형성할 수 있다. 일부 실시형태에서, 루프는 적어도 하나의 엔도뉴클레아제 인식 부위를 포함할 수 있다. 일부 실시형태에서, 표적 핵산 복합체는 루프 내에 절단 사건을 용이하게 하는 엔도뉴클레아제 인식 부위를 함유할 수 있다. 일부 실시형태에서, 루프는 비정규 뉴클레오타이드 서열을 포함할 수 있다. 일부 실시형태에서, 함유된 비정규 뉴클레오타이드는 가닥 절단을 용이하게 하는 하나 이상의 효소에 의해 인식 가능할 수 있다. 일부 실시형태에서, 함유된 비정규 뉴클레오타이드는 루프에서 가닥 절단을 용이하게 하는 하나 이상의 화학 공정에 의해 표적화될 수 있다. 일부 실시형태에서, 루프는 루프에서 가닥 절단을 용이하게 하는 하나 이상의 효소적, 화학적 또는 물리적 공정에 의해 표적화될 수 있는 변형된 핵산 링커를 함유할 수 있다. 일부 실시형태에서, 이 변형된 링커는 광 분해 가능한 링커이다.
다양한 다른 분자 도구는 SMI 및 SDE로 작용할 수 있다. 전단점 및 DNA-기반 태그 이외에, 쌍 지은 가닥을 물리적으로 근접하게 유지시키는 단일-분자 구획화 방법 또는 다른 비핵산 태그화 방법은 가닥-관련 기능을 제공할 수 있었다. 유사하게, 물리적으로 분리될 수 있는 방식의 어댑터 가닥의 비대칭적 화학 표지화는 SDE 역할을 제공할 수 있다. 듀플렉스 시퀀싱의 최근에 기재된 변형은 사이토신 메틸화의 형태의 자연 발생 가닥 비대칭을 2개의 가닥을 구별하는 서열 차이로 전환시키도록 바이설파이트 전환을 사용한다. 이 실행이 검출될 수 있는 돌연변이의 유형을 제한하지만, 자연 비대칭에서 자본화의 개념은 변형된 뉴클레오타이드를 직접적으로 검출할 수 있는 떠오르는 시퀀싱의 상황에서 주목할 만하다. SDE의 다양한 실시형태는 그 전문이 참조로 포함된 국제 특허 공보 WO 제2017/100441호에 추가로 개시된다.
어댑터 및 어댑터 서열
다양한 배열에서, SMI(예를 들어, 분자 바코드), SDE, 프라이머 부위, 유세포 서열 및/또는 다른 특징을 포함하는 어댑터 분자는 본원에 개시된 많은 실시형태와 사용하기 위해 고려된다. 일부 실시형태에서, 제공된 어댑터는 하기 특성 중 적어도 하나를 갖는 PCR 프라이머(예를 들어, 프라이머 부위)에 상보성 또는 적어도 부분적으로 상보성인 하나 이상의 서열이거나 이를 포함할 수 있다: 1) 높은 표적 특이성; 2) 다중화 가능함; 및 3) 튼튼하고 최소로 바이어스된 증폭을 나타냄.
일부 실시형태에서, 어댑터 분자는 "Y"-형상, "U"-형상, "헤어핀" 형상이거나, 버블(예를 들어, 비상보성인 서열의 부분), 또는 다른 특징을 가질 수 있다. 다른 실시형태에서, 어댑터 분자는 "Y"-형상, "U"-형상, "헤어핀" 형상 또는 버블을 포함할 수 있다. 소정의 어댑터는 변형된 뉴클레오타이드 또는 비표준 뉴클레오타이드, 제한 부위, 또는 시험관내 구조 또는 기능의 조작을 위한 다른 특징을 포함할 수 있다. 어댑터 분자는 말단 단부를 갖는 다양한 핵산 물질에 결찰할 수 있다. 예를 들어, 어댑터 분자는 T-오버행, A-오버행, CG-오버행, 다중 뉴클레오타이드 오버행, 탈하이드록실화 염기, 핵산 물질의 무딘 말단 및 분자의 말단에 결찰하기에 적합할 수 있고, 표적의 5'는 탈인산화되거나 달리 전통적인 결찰로부터 차단된다. 다른 실시형태에서, 어댑터 분자는 결찰 부위에서 5' 가닥에서 탈인산화되거나 그렇지 않으면 결찰-방지 변형을 함유할 수 있다. 후자의 2개의 실시형태에서, 이러한 전략은 라이브러리 단편 또는 어댑터 분자의 이합체화를 방지하기에 유용할 수 있다.
어댑터 서열은 단일-가닥 서열, 이중-가닥 서열, 상보성 서열, 비상보성 서열, 부분 상보성 서열, 비대칭 서열, 프라이머 결합 서열, 유세포 서열, 결찰 서열 또는 어댑터 분자에 의해 제공된 다른 서열을 의미할 수 있다. 특정 실시형태에서, 어댑터 서열은 올리고뉴클레오타이드에 보체의 방식에 의해 증폭에 사용된 서열을 의미할 수 있다.
일부 실시형태에서, 제공된 방법 및 조성물은 적어도 하나의 어댑터 서열을 포함한다(예를 들어, 2개의 어댑터 서열, 하나는 핵산 물질의 5' 말단 및 3' 말단의 각각에 있음). 일부 실시형태에서, 제공된 방법 및 조성물은 2개 이상(예를 들어, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상)의 어댑터 서열을 포함할 수 있다. 일부 실시형태에서, 적어도 2개의 어댑터 서열은 (예를 들어, 서열이) 서로 다르다. 일부 실시형태에서, 각각의 어댑터 서열은 (예를 들어, 서열이) 각각의 다른 어댑터 서열과 다르다. 일부 실시형태에서, 적어도 하나의 어댑터 서열은 적어도 하나의 다른 어댑터 서열의 적어도 일부에 적어도 부분적으로 비상보성이다(예를 들어, 적어도 하나의 뉴클레오타이드에 의해 비상보성임).
일부 실시형태에서, 어댑터 서열은 적어도 하나의 비표준 뉴클레오타이드를 포함한다. 일부 실시형태에서, 비표준 뉴클레오타이드는 비염기성 부위, 우라실, 테트라하이드로퓨란, 8-옥소-7,8-디하이드로-2'데옥시아데노신(8-옥소-A), 8-옥소-7,8-디하이드로-2'-데옥시구아노신(8-옥소-G), 데옥시이노신, 5'니트로인돌, 5-하이드록시메틸-2'-데옥시사이티딘, 이소-사이토신, 5'-메틸-이소사이토신 또는 이소구아노신, 메틸화 뉴클레오타이드, RNA 뉴클레오타이드, 리보스 뉴클레오타이드, 8-옥소-구아닌, 광 분해 가능한 링커, 바이오티닐화 뉴클레오타이드, 데스티오바이오틴 뉴클레오타이드, 티올 변형된 뉴클레오타이드, 아크리다이트 변형된 뉴클레오타이드 이소-dC, 이소 dG, 2'-O-메틸 뉴클레오타이드, 이노신 뉴클레오타이드 잠김 핵산, 펩타이드 핵산, 5 메틸 dC, 5-브로모 데옥시우리딘, 2,6-디아미노퓨린, 2-아미노퓨린 뉴클레오타이드, 비염기성 뉴클레오타이드, 5-니트로인돌 뉴클레오타이드, 아데닐화 뉴클레오타이드, 아지드 뉴클레오타이드, 디곡시게닌 뉴클레오타이드, I-링커, 5' 헥시닐 변형된 뉴클레오타이드, 5-옥타디닐 dU, 광 절단 가능한 스페이서, 광 절단 불가능한 스페이서, 클릭 화학 적합 변형된 뉴클레오타이드, 및 임의의 이들의 조합으로부터 선택된다.
일부 실시형태에서, 어댑터 서열은 자기 특성을 갖는 모이어티(즉, 자기 모이어티)를 포함한다. 일부 실시형태에서, 이 자기 특성은 상자성이다. 일부 실시형태에서, 어댑터 서열이 자기 모이어티를 포함하는 경우(예를 들어, 자기 모이어티를 포함하는 어댑터 서열에 결찰된 핵산 물질), 자기장이 인가될 때, 자기 모이어티를 포함하는 어댑터 서열은 자기 모이어티를 포함하지 않는 어댑터 서열(예를 들어, 자기 모이어티를 포함하지 않는 어댑터 서열에 결찰된 핵산 물질)로부터 실질적으로 분리된다.
일부 실시형태에서, 적어도 하나의 어댑터 서열은 SMI의 5'에 위치한다. 일부 실시형태에서, 적어도 하나의 어댑터 서열은 SMI의 3'에 위치한다.
일부 실시형태에서, 어댑터 서열은 하나 이상의 링커 도메인을 통해 SMI 및 핵산 물질 중 적어도 하나에 연결될 수 있다. 일부 실시형태에서, 링커 도메인은 뉴클레오타이드로 이루어질 수 있다. 일부 실시형태에서, 링커 도메인은 (예를 들어, 본 개시내용에서 그외 기재된 바대로) 적어도 하나의 변형된 뉴클레오타이드 또는 비뉴클레오타이드 분자를 포함할 수 있다. 일부 실시형태에서, 링커 도메인은 루프이거나 이를 포함할 수 있다.
일부 실시형태에서, 이중-가닥 핵산 물질의 각각의 가닥의 말단 중 어느 하나 또는 말단 둘 다에서의 어댑터 서열은 SDE를 제공하는 하나 이상의 요소를 추가로 포함할 수 있다. 일부 실시형태에서, SDE는 어댑터 서열 내에 포함된 비대칭적 프라이머 부위이거나 이를 포함할 수 있다.
일부 실시형태에서, 어댑터 서열은 적어도 하나의 SDE 및 적어도 하나의 결찰 도메인(즉, 적어도 하나의 리가제의 활성에 수정 가능한 도메인, 예를 들어 리가제의 활성을 통해 핵산 물질에 결찰하기에 적합한 도메인)이거나 이를 포함할 수 있다. 일부 실시형태에서, 5'에서 3'로, 어댑터 서열은 프라이머 결합 부위, SDE 및 결찰 도메인이거나 이를 포함할 수 있다.
듀플렉스 시퀀싱 어댑터를 합성하기 위한 다양한 방법은 이전에 예를 들어 본원에 그 전문이 참조로 포함된 미국 특허 제9,752,188호, 국제 특허 공보 WO 제2017/100441호 및 국제 특허 공보 제PCT/US18/59908호(2018년 11월 8일 제출)에 기재되어 있다.
프라이머
일부 실시형태에서, 1) 높은 표적 특이성; 2) 다중화 가능함; 및 3) 튼튼하고 최소로 바이어스된 증폭을 나타냄의 특성 중 적어도 하나를 갖는 하나 이상의 PCR 프라이머는 본 기술내용의 양태에 따라 다양한 실시형태에 사용하기에 고려된다. 다수의 이전의 연구 및 상업 제품은 종래의 PCR-CE에 대해 특정 수의 이들 기준을 만족시키는 설계된 프라이머 혼합물을 갖는다. 그러나, 이 프라이머 혼합물이 MPS와 사용하기에 항상 최적이 아님에 주의한다. 실제로, 고도로 다중화된 프라이머 혼합물의 개발은 도전적이고 시간 소모적인 공정일 수 있다. 편리하게는, Illumina 및 Promega 둘 다는 최근에 다양한 표준 및 비표준 STR 및 SNP 유전좌위의 튼튼하고 효율적인 증폭을 나타낸 Illumina 플랫폼에 대한 다중화 적합 프라이머 혼합물을 개발하였다. 이 키트가 시퀀싱 전에 이의 표적 영역을 증폭시키기 위해 PCR을 사용하므로, 쌍 지은-말단 시퀀싱 데이터에서의 각각의 리드의 5'-말단은 DNA를 증폭시키기 위해 사용된 PCR 프라이머의 5'-말단에 상응한다. 일부 실시형태에서, 제공된 방법 및 조성물은 변하는 반응 농도, 융점 및 2차 구조 및 프라이머내/프라이머간 상호작용의 최소화를 수반할 수 있는 균일한 증폭을 보장하기 위해 설계된 프라이머를 포함한다. 많은 기법은 MPS 분야에 대해 고도로 다중화된 프라이머 최적화에 대해 기술되어 있다. 특히, 이러한 기법은 당해 분야에 잘 기재된 앰플리세크(ampliseq) 방법으로 대개 알려져 있다.
증폭
제공된 방법 및 조성물은 다양한 실시형태에서 적어도 하나의 증폭 단계를 사용하거나 이의 사용에 있고, 여기서 핵산 물질(또는 이의 부분, 예를 들어 특이적 표적 영역 또는 유전좌위)은 증폭된 핵산 물질(예를 들어, 약간의 수의 앰플리콘 산물)을 형성하도록 증폭된다.
일부 실시형태에서, 핵산 물질의 증폭은 SMI 서열이 적어도 부분적으로 유지되도록 제1 어댑터 서열에 존재하는 서열에 적어도 부분적으로 상보성인 적어도 하나의 단일-가닥 올리고뉴클레오타이드를 사용하여 원래의 이중-가닥 핵산 물질로부터 각각의 제1 핵산 가닥 및 제2 핵산 가닥으로부터 유래된 핵산 물질을 증폭시키는 단계를 포함한다. 증폭 단계는 각각의 관심 가닥을 증폭시키기 위해 제2 단일-가닥 올리고뉴클레오타이드를 추가로 포함하고, 이러한 제2 단일-가닥 올리고뉴클레오타이드는 적어도 하나의 단일-가닥 올리고뉴클레오타이드 및 제2 단일-가닥 올리고뉴클레오타이드가 핵산 물질을 효과적으로 증폭시키는 방식으로 배향되도록 (a) 관심 표적 서열에 적어도 부분적으로 상보성이거나, (b) 제2 어댑터 서열에 존재하는 서열에 적어도 부분적으로 상보성일 수 있다.
일부 실시형태에서, 샘플에서의 핵산 물질의 증폭은 "관"(예를 들어, PCR 관), 에멀션 액적, 마이크로챔버 및 상기에 기재된 다른 예 또는 다른 알려진 용기에서 핵산 물질의 증폭을 포함할 수 있다.
일부 실시형태에서, 적어도 하나의 증폭 단계는 적어도 하나의 비표준 뉴클레오타이드이거나 이를 포함하는 적어도 하나의 프라이머를 포함한다. 일부 실시형태에서, 비표준 뉴클레오타이드는 우라실, 메틸화 뉴클레오타이드, RNA 뉴클레오타이드, 리보스 뉴클레오타이드, 8-옥소-구아닌, 바이오티닐화 뉴클레오타이드, 잠김 핵산, 펩타이드 핵산, 높은-Tm 핵산 변이체, 대립유전자 구별 핵산 변이체, 본원에 그외 기재된 임의의 다른 뉴클레오타이드 또는 링커 변이체 및 임의의 이들의 조합으로부터 선택된다.
임의의 분야-적절한 증폭 반응이 일부 실시형태와 적합한 것으로 고려되지만, 특정 예로서, 일부 실시형태에서, 증폭 단계는 중합효소 연쇄 반응(PCR: polymerase chain reaction), 회전 환 증폭(RCA: rolling circle amplification), 다중 변위 증폭(MDA: multiple displacement amplification), 등온 증폭, 에멀션 내의 폴로니 증폭, 비드의 또는 하이드로겔 내의 표면인 표면에서의 브리지 증폭, 및 임의의 이들의 조합이거나 이를 포함할 수 있다.
일부 실시형태에서, 핵산 물질의 증폭은 핵산 물질의 각각의 가닥의 5' 말단 및 3' 말단에서 어댑터 서열의 영역에 적어도 부분적으로 상보성인 단일-가닥 올리고뉴클레오타이드의 사용을 포함한다. 일부 실시형태에서, 핵산 물질의 증폭은 관심 표적 영역 또는 표적 서열(예를 들어, 게놈 서열, 미토콘드리아 서열, 플라스미드 서열, 합성으로 제조된 표적 핵산 등)에 적어도 부분적으로 상보성인 적어도 하나의 단일-가닥 올리고뉴클레오타이드 및 어댑터 서열(예를 들어, 프라이머 부위)의 영역에 적어도 부분적으로 상보성인 단일-가닥 올리고뉴클레오타이드의 사용을 포함한다.
일반적으로, 튼튼한 증폭(예를 들어 PCR 증폭)은 반응 조건에 고도로 의존적일 수 있다. 다중 PCR은 예를 들어 완충액 조성물, 1가 또는 2가 양이온 농도, 세제 농도, 크라우딩제(즉, PEG, 글리세롤 등) 농도, 프라이머 농도, 프라이머 Tm, 프라이머 설계, 프라이머 GC 함량, 프라이머 변형된 뉴클레오타이드 특성 및 사이클링 조건(즉, 온도 및 연장 시간 및 온도 변화 속도)에 민감할 수 있다. 완충액 조건의 최적화는 어렵고 시간 소모적인 공정일 수 있다. 일부 실시형태에서, 증폭 반응은 이전에 알려진 증폭 프로토콜에 따라 완충액, 프라이머 풀 농도 및 PCR 조건 중 적어도 하나를 사용할 수 있다. 일부 실시형태에서, 새로운 증폭 프로토콜이 생성될 수 있고/있거나 증폭 반응 최적화가 사용될 수 있다. 특정 예로서, 일부 실시형태에서, PCR 최적화 키트, 예컨대 다중, 실시간, GC-농후, 및 억제제-내성 증폭과 같은 다양한 PCR 분야에 부분적으로 최적화된 다수의 미리 제제화된 완충액을 함유하는 Promega®로부터의 PCR Optimization Kit를 사용할 수 있다. 이 미리 제제화된 완충액은 상이한 Mg2+ 및 프라이머 농도, 및 프라이머 풀 비율로 신속히 보충될 수 있다. 또한, 일부 실시형태에서, 다양한 사이클링 조건(예를 들어, 열 사이클링)이 평가되고/되거나 사용될 수 있다. 특정 실시형태가 원하는 특정 분야에 적절한지를 평가하는 데 있어서, 다른 양태들 중에서 특이성, 이형접합성 유전좌위에 대한 대립유전자 커버리지 비율, 유전좌위간 균형 및 깊이 중 하나 이상이 평가될 수 있다. 증폭 성공의 측정은 산물의 DNA 시퀀싱, 겔 또는 모세관 전기영동에 의한 산물의 평가 또는 HPLC 또는 다른 크기 분리 방법, 이어서 단편 시각화, 이중-가닥 핵산 결합 염료 또는 형광 프로브를 사용한 용융 곡선 분석, 질량 분석법 또는 당해 분야에 알려진 다른 방법을 포함할 수 있다.
다양한 실시형태에 따르면, 임의의 다양한 인자는 특정 증폭 단계의 길이(예를 들어, PCR 반응에서의 사이클의 수 등)에 영향을 미칠 수 있다. 예를 들어, 일부 실시형태에서, 제공된 핵산 물질은 손상되거나 그렇지 않으면 준최적(예를 들어, 분해된 및/또는 오염된)일 수 있다. 이러한 경우에, 원하는 산물이 허용 가능한 정도로 증폭되게 보장하기 위해 보다 긴 증폭 단계가 도움이 될 수 있다. 일부 실시형태에서, 증폭 단계는 각각의 출발 DNA 분자로부터 평균 3개 내지 10개의 시퀀싱된 PCR 카피를 제공할 수 있지만, 다른 실시형태에서, 각각의 제1 가닥 및 제2 가닥의 오직 단일 카피가 필요하다. 특정 이론에 구속되고자 바라지 않으면서, 너무 많거나 너무 적은 PCR 카피가 검정 효율을 감소시키고 궁극적으로 깊이를 감소시킬 수 있다. 일반적으로, 증폭(예를 들어, PCR) 반응에 사용된 핵산(예를 들어, DNA) 단편의 수는 동일한 SMI/바코드 서열을 공유하는 리드의 수를 기술할 수 있는 1차의 조정 가능한 변수이다.
핵산 물질
유형
다양한 실시형태에 따르면, 임의의 다양한 핵산 물질을 사용할 수 있다. 일부 실시형태에서, 핵산 물질은 정규 당-포스페이트 골격 내에 폴리뉴클레오타이드에 대한 적어도 하나의 변형을 포함할 수 있다. 일부 실시형태에서, 핵산 물질은 핵산 물질에서 임의의 염기 내에 적어도 하나의 변형을 포함할 수 있다. 예를 들어, 비제한적인 예로서, 일부 실시형태에서, 핵산 물질은 이중-가닥 DNA, 단일-가닥 DNA, 이중-가닥 RNA, 단일-가닥 RNA, 펩타이드 핵산(PNA: peptide nucleic acid), 잠금 핵산(LNA: locked nucleic acid) 중 적어도 하나이거나 이를 포함한다.
변형
다양한 실시형태에 따르면, 핵산 물질은 특정한 제공된 방법 또는 조성물이 사용되는 분야에 따라 임의의 특정 단계 전에, 이외 실질적으로 동시에 또는 이에 후속하여 하나 이상의 변형을 수용할 수 있다.
일부 실시형태에서, 변형은 핵산 물질의 적어도 일부의 복구이거나 이를 포함할 수 있다. 임의의 분야-적절한 핵산 복구 방식이 일부 실시형태와 적합한 것으로 고려되지만, 소정의 예시적인 방법 및 조성물은 따라서 하기에 및 실시예에 기재되어 있다.
비제한적인 예로서, 일부 실시형태에서, DNA 복구 효소, 예컨대 우라실-DNA 글라이코실라제(UDG), 포름아미도피리미딘 DNA 글라이코실라제(FPG) 및 8-옥소구아닌 DNA 글라이코실라제(OGG1)는 DNA 손상(예를 들어, 시험관내 DNA 손상)을 보정하기 위해 사용될 수 있다. 상기에 기술된 것처럼, 이 DNA 복구 효소는 예를 들어 DNA로부터 손상된 염기를 제거하는 글라이코실라제이다. 예를 들어, UDG는 (사이토신의 자발적 가수분해에 의해 생긴) 사이토신 탈아미노화로부터 생긴 우라실을 제거하고, FPG는 8-옥소-구아닌(예를 들어, 반응성 산소 종으로부터 생긴 가장 흔한 DNA 병변)을 제거한다. FPG는 또한 비염기성 부위에서 1개 염기 갭을 생성할 수 있는 리가제 활성을 갖는다. 예를 들어, 중합효소가 주형을 카피하지 못하므로, 이러한 비염기성 부위는 후속하여 PCR에 의해 증폭하지 못할 것이다. 따라서, 이러한 DNA 손상 복구 효소의 사용은 진성 돌연변이를 갖지 않는 손상된 DNA를 효과적으로 제거할 수 있고, 그렇지 않으면 시퀀싱 및 듀플렉스 서열 분석 후에 오류로서 검출되지 않을 것이다.
상기에 기술된 것처럼, 추가의 실시형태에서, 본원에 기술된 프로세싱 단계로부터 생성된 시퀀싱 리드는 인공산물에 가장 경향이 있는 리드의 말단을 손질함으로써 거짓 돌연변이를 제거하도록 추가로 여과될 수 있다. 예를 들어, DNA 단편화는 이중-가닥 분자의 말단 단부에서 단일-가닥 부분을 생성할 수 있다. 이 단일-가닥 부분은 말단 복구 동안 (예를 들어, Klenow에 의해) 충전될 수 있다. 일부 경우에, 중합효소는 "슈도듀플렉스 분자"를 생성시키는 이 말단-복구된 영역에서 카피 실수를 만든다. 이 인공산물은 시퀀싱되면 진성 돌연변이인 것으로 나타날 수 있다. 이 오류는 말단 복구 기전의 결과로서 발생할 수 있는 임의의 돌연변이를 배제하도록 시퀀싱 리드의 말단을 손질하여서 거짓 돌연변이의 수를 감소시킴으로써 시퀀싱 후 분석으로부터 제거될 수 있다. 일부 실시형태에서, 시퀀싱 리드의 이러한 손질은 자동적으로 달성될 수 있다(예를 들어, 일반 공정 단계). 일부 실시형태에서, 돌연변이 빈도는 단편 말단 영역에 대해 평가될 수 있고, 돌연변이의 역치 수준이 단편 말단 영역에서 관찰되면, 시퀀싱 리드 손질은 DNA 단편의 이중-가닥 공통 서열 리드를 생성하기 전에 수행될 수 있다.
듀플렉스 시퀀싱의 가닥-비교 기술에 의해 제공된 높은 정도의 오류 정정은 표준 차세대 시퀀싱 방법과 비교하여 여러 차수의 규모로 이중-가닥 핵산 분자의 시퀀싱 오류를 감소시킨다. 이 오류 감소는 거의 모든 유형의 서열에서 시퀀싱의 정확도를 개선하지만, 특히 오류 유발인 것으로 당해 분야에서 잘 알려진 생화학적으로 도전하는 서열에 특히 잘 맞을 수 있다. 이러한 유형의 서열의 하나의 비제한적인 예는 동종중합체 또는 다른 미세부수체/짧은-탠덤 반복부이다. 듀플렉스 시퀀싱 오류 정정으로부터 이익인 오류 유발 서열의 다른 비제한적인 예는 예를 들어 가열, 방사선, 기계적 스트레스, 또는 하나 이상의 뉴클레오타이드 중합효소에 의한 카피 동안 오류 유발인 화학 부가물을 생성하고, 분자의 끝이나 틈과 틈새에 단일 가닥 DNA를 생성하는 다양한 화학적 노출에 의해 손상된 분자이다. 추가의 실시형태에서, 듀플렉스 시퀀싱은 또한 이중-가닥 핵산 분자의 집단 중에서 소수의 서열 변이체의 정확한 검출에 사용될 수 있다. 이 분야의 하나의 비제한적인 예는 더 많은 수의 DNA 분자 중에서 (예를 들어, 게놈 편집 사건 동안 유도되고/되거나 획득되고/되거나 선택된 변이체에 의한) 적은 수의 변이체 DNA 분자의 검출이다. 듀플렉스 시퀀싱에 의한 희귀 변이체 검출을 위한 다른 비제한적인 분야는 게놈 편집 사건으로부터 생긴 DNA 손상의 조기 검출이다. 듀플렉스 시퀀싱의 추가의 비제한적인 분야는 세포(예를 들어, 양성 성장 바이어스를 갖는 세포, 예를 들어 선택압 하에 돌연변이를 함유하는 세포, 예를 들어 신생물 돌연변이)의 클론 팽창의 검출 및 정량화를 위한 것이다. 듀플렉스 시퀀싱의 다른 비제한적인 분야는 표적 게놈 게놈 활성의 성공 또는 비정상 게놈 편집 사건의 검출을 평가하기 위한 것이다.
게놈 편집을 평가하기 위한 선택된 실시형태
다른 명칭 중에서 유전자 편집 및 조작된 게놈 편집으로도 공지된 게놈 편집은 다른 용도 중에서 유전자 침묵화 또는 전사적 억제, 내인성 유전자의 일시적 활성화, 배아 줄기 세포의 유전자 변형, 질환을 치료하기 위한 세포 치료의 생성, 형질전환 유기체의 생성, 다른 농업 분야 중에서 작물 개선을 위한 식물의 유전자 조작, 및 생체내 유전자 넉아웃 스크리닝, 우성-음성 유전자 유전좌위의 파괴와 같은 분야에 널리 사용된다. 의도된 분야에 따라, 게놈 편집 기법은 살아 있는 유기체의 게놈에서 핵산 서열(들)을 삽입하거나 결실시키거나 변형시키거나 대체하거나 수정하거나 돌연변이하기에 효과적일 수 있다. 특정 분야에서, (의도된 또는 의도되지 않은, 원하는 또는 원하지 않는) 게놈 서열에 대한 정확한 변형은 게놈 편집을 이용하여 확인될 수 있다.
DNA의 표적화된(예를 들어, 의도된 게놈 부위) 영역 또는 유전좌위에서의 원하는 변화가 달성되는지를 결정하기 위해, 과정의 효율을 결정하기 위해(예를 들어, 의도된 게놈 부위에서 정확히 변경된 세포의 비율을 결정하기 위해), 그리고 게놈의 하나 이상의 의도되지 않은 또는 "오프-타깃" 유전좌위에서의 세포의 게놈에 임의의 변화가 이루어지는지를 평가하기 위해 게놈 편집 과정 후의 게놈의 규명이 중요할 수 있다. 게놈 시퀀싱 방법(예를 들어, NGS)은 게놈의 하나 이상의 부위에서 뉴클레오타이드 서열을 결정하기 위한 도구를 제공하지만, 분자별 기준으로 세포 집단에서 유전자 편집 사건을 확인하고 정량화하는 데 필요한 DNA 시퀀싱의 정확성의 민감도의 수준은 종래의 NGS 방법에 의해 달성 불가능하다. 본원에 기재된 바와 같은 듀플렉스 시퀀싱은 민감도의 수준을 제공하고, 시퀀싱 오류-정정은 의도된 분야에 대해 게놈 편집 사건, 방법 또는 시약의 성공(및 지속성 및 안전성)을 효과적으로 규명하고 결정하는 데 필요하다.
게놈 편집 사건 후에 세포 집단에서의 세포에서 생긴 게놈 변경의 결정 이외에, 이러한 게놈 변경은 세포 집단에서의 하나 이상의 세포에 선택압을 생성할 수 있고, 이는 세포 집단에서의 다른 세포와 관련하여 세포가 양성 성장 바이어스 또는 음성 성장 바이어스를 갖도록 할 수 있다. 이러한 성장 바이어스는 (세포 집단에서의 다른 세포와 비교하여) 이러한 성장 이점을 포함하는 세포의 클론 팽창을 발생시킬 수 있다. 본 개시내용의 양태는 클론 팽창의 평가 및 특히 이러한 세포의 신생물성 가능성의 평가에 관한 것이다.
게놈 편집 규명을 위해 듀플렉스 시퀀싱 방법의 선택된 예
본 개시내용은 게놈 편집 사건 및/또는 게놈 편집 사건 후에 세포 집단을 규명하는 데 유용한 방법을 제공한다. 본 개시내용은 고도로 정확한 시퀀싱 방법, 예컨대 상기 기재된 듀플렉스 시퀀싱 방법이 게놈 편집을 겪은 세포의 고해상도 특징이 가능하게 할 수 있다는 인식을 포함한다. 본 개시내용은 게놈 편집 사건의 정확성을 규명하는 방법, 및 시간에 걸쳐(예를 들어, 세포 배양 기간에 걸쳐 및/또는 세포에 의한 치료의 기간에 걸쳐) 세포 집단의 특징을 규명하는, 예컨대 세포 집단에서의 특정 세포의 클론 팽창이 있는지를 결정하는 방법을 제공한다.
본 개시내용은 게놈 편집 사건, 예를 들어 조작된 게놈 편집 사건 후에 세포를 규명하는 방법을 제공한다. 부정확한 게놈 편집 사건 및/또는 게놈 편집으로부터 생긴 오프-타깃 변이를 정확히 검출할 수 있는 것이 중요하다. 예를 들어, 조작된 부위-특이적 결합의 불완전한 특이성은 게놈 편집 사건 동안 게놈 유전좌위의 의도되지 않은 삽입, 변형 또는 결실로 이어질 수 있다. 이러한 오프타깃 또는 비정상 게놈 변경의 결과는 임상 결과를 가질 수 있다. 분자의 집단에서 하나 이상의 의도된 유전좌위에서 생기는 게놈 편집 사건의 분포를 규명할 수 있다는 것이 유사하게 중요하다 - 예를 들어, 표적화된 리보핵단백질, 예컨대 Cas9에 의한 절단 후, 오류-민감 비상동성 말단 연결은 다양한 상이한 길이 결실, 삽입 또는 다른 돌연변이성 사건으로 이어질 수 있다.
일부 실시형태에서, 제공된 방법은 게놈 편집 사건(예를 들어, 의도된 게놈 유전좌위에 관한 조작된 게놈 편집 사건)이 정확하게 진행하는지를 평가하는 데 유용하다. 일부 실시형태에서, 제공된 방법은 하나 이상의 의도되지 않은 돌연변이가 게놈 편집 사건 동안 도입되는지를 평가하는 데 유용하다. 일부 실시형태에서, 제공된 방법은 (예를 들어, 세포 집단 중에서 적은 수의 세포에서 발생하는) 돌연변이가 도입되는지 또는 부정확한 게놈 편집 사건이 집단의 하나 이상의 세포에서 발생하였는지를 결정하기 위해 사용될 수 있다. 일부 실시형태에서, 제공된 방법은 분자의 집단에서 하나 이상의 의도된 유전좌위에서 생기는 게놈 편집 사건의 유형의 분포를 규명하기 위해 사용될 수 있다.
일부 실시형태에서, 게놈 편집 사건(예를 들어, 의도된 게놈 유전좌위에 지향된 조작된 게놈 편집 사건) 후에 세포 집단을 규명하는 방법이 제공되고, 이러한 방법은 일반적으로 이중-가닥 DNA 분자의 집단을 포함하는 샘플을 제공하는 단계를 포함한다. 이러한 이중-가닥 DNA 분자는 분석되는 세포 집단(예를 들어, 게놈 편집 사건, 예를 들어 조작된 게놈 편집 사건을 겪은 세포 집단)으로부터 추출되거나 기원할 수 있다. 일부 실시형태에서, 이중-가닥 DNA 분자는 분석되는 세포 집단으로부터 엑소좀 또는 다른 세포외 소포로부터의 DNA의 무세포 DNA와 같은 비세포 DNA로부터 단리될 수 있다. 일부 실시형태에서, 제공된 방법은 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 적어도 하나의 제1 가닥 서열 판독 및 적어도 하나의 제2 가닥 서열 판독을 비교함으로써 원래의 이중-가닥 DNA 분자의 오류-정정된 서열 판독을 생성하기 위해 듀플렉스 서열을 사용하는 단계를 포함한다. 특정 예에서, 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이에 부합하는 뉴클레오타이드 위치는 정확한 뉴클레오타이드 기저 세포로서 확인될 수 있다.
일부 실시형태에서, 게놈-편집된 세포 집단으로부터 추출된 표적 이중-가닥 핵산 분자의 집단의 고정확도 시퀀싱 판독을 생성하는 방법이 제공된다. 이러한 방법은 세포 집단으로부터 추출된 하나 이상의 표적 이중-가닥 핵산 분자의 듀플렉스 시퀀싱 및 표적화된 이중-가닥 DNA 분자에 대해 고정확도 공통 서열을 생성하는 단계를 포함한다. 일부 실시형태에서, 표적 이중-가닥 핵산 분자는 DNA의 의도된 게놈 편집된 영역 및 DNA의 하나 이상의 의도되지 않은 게놈 영역을 포함한다.
일부 실시형태에서, 제공된 방법은 의도된 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기대된 게놈 편집된 DNA 서열과 비교하는 단계; 및/또는 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기준 게놈 DNA 서열과 비교하는 단계를 포함한다.
일부 실시형태에서, 복수의 이중 가닥 DNA 분자의 각각에 대한 오류-정정된 서열 판독의 생성은 복수의 농후화된 어댑터-DNA 분자를 제공하기 위해 시퀀싱 전에 하나 이상의 표적화된 게놈 영역을 선택적으로 농후화하는 단계를 추가로 포함한다. 일부 실시형태에서, 제공된 방법은 세포 집단의 이중-가닥 DNA 분자(예를 들어, 게놈 편집 사건을 겪은 세포 집단으로부터 기원하고/하거나 추출된 이중-가닥 DNA 분자) 중에서 하나 이상의 변이체를 확인하기 위해 유용하다. 일부 실시형태에서, 제공된 방법은 세포 집단의 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계를 포함한다.
일부 실시형태에서, 듀플렉스 시퀀싱 방법에 의해 분석되는 하나 이상의 표적화된 게놈 영역은 게놈에서의 의도된 게놈 유전좌위(즉, 게놈 편집에 의도된 유전좌위)이거나 이를 포함하다. 일부 실시형태에서, 제공된 방법은 하나 이상의 오류-정정된 서열 판독이 의도된 게놈 유전좌위에서 기대된 편집된 DNA 서열을 포함하는지를 결정하는 단계를 포함한다. 따라서, 제공된 방법은 게놈 편집 사건의 성공을 평가하는 데 유용할 수 있다.
일부 실시형태에서, 조작된 게놈 편집 사건의 원하는 결과를 얻는 것의 성공 및/또는 효율을 평가하는 방법이 본원에 제공된다. 일부 실시형태에서, 제공된 방법은 의도된 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독 중에서 기대된 게놈 편집된 DNA 서열의 빈도를 결정하는 단계를 포함한다.
일부 실시형태에서, 집단의 세포의 게놈으로 DNA 서열(예를 들어, 암호화 서열 유전자의 부분, 유전자의 비암호화 서열의 부분, 유전자 등)을 도입하는 단계를 포함하는 조작된 게놈 편집 사건의 정확성을 평가하는 방법이 본원에 제공된다. 일부 실시형태에서, 집단의 세포의 게놈으로부터 DNA 서열(예를 들어, 암호화 서열 유전자의 부분, 유전자의 비암호화 서열의 부분, 유전자 등)을 결실시키는 단계를 포함하는 조작된 게놈 편집 사건의 정확성을 평가하는 방법이 본원에 제공된다. 일부 실시형태에서, 도입된 및/또는 결실된 유전자는 기능적 RNA 또는 폴리펩타이드를 암호화한다.
일부 실시형태에서, 세포 집단에서 조작된 게놈 편집 사건의 효율을 규명하는 방법이 본원에 제공되고, 여기서 조작된 게놈 편집 사건은 의도된 게놈 유전좌위에 표적화된다. 일부 실시형태에서, 이러한 방법은 듀플렉스 시퀀싱을 포함한다. 예를 들어, 일부 실시형태에서, 제공된 방법은 게놈 편집 사건 후에 세포 집단으로부터 기원한 복수의 이중-가닥 DNA 분자를 포함하는 샘플로부터 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 복수의 어댑터-DNA 분자를 생성하기 위해 비대칭 어댑터 분자를 복수의 이중-가닥 DNA 분자에 결찰하는 것을 포함하는 단계; 어댑터-DNA 분자의 적어도 일부에 대해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 제공하기 위해 어댑터-DNA 분자의 제1 가닥 및 제2 가닥을 시퀀싱하는 단계; 및 각각의 시퀀싱된 어댑터-DNA 분자에 대해, 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 비교하는 단계를 포함한다. 일부 실시형태에서, 제공된 방법은 의도된 게놈 유전좌위를 포함하는 복수의 이중-가닥 DNA 분자 중에서 의도된 게놈 유전좌위에서의 기대된 게놈 서열의 빈도를 결정하는 단계를 포함한다. 일부 실시형태에서, 의도된 게놈 유전좌위에서의 기대된 게놈 서열의 빈도는 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 분석하고 기대된 게놈 서열과의 관련성을 비교함으로써 결정된다.
일부 실시형태에서, 조작된 게놈 편집 사건의 효율을 규명하기 위한 제공된 방법은 복수의 농후화된 어댑터-DNA 분자를 제공하기 위해 시퀀싱 전에 하나 이상의 표적화된 게놈 영역을 선택적으로 농후화하는 단계를 선택적으로 포함한다. 일부 실시형태에서, 제공된 방법은 하나 이상의 표적화된 게놈 영역을 규명하는 단계를 포함한다. 일부 실시형태에서, 하나 이상의 표적화된 게놈 영역은 게놈에서의 의도된 게놈 유전좌위; 게놈에서의 적어도 하나의 의도되지 않은 게놈 유전좌위; 또는 의도된 게놈 유전좌위 및 의도되지 않은 게놈 유전좌위 둘 다를 포함한다.
일부 실시형태에서, DNA가 조작된 표적화된 게놈 편집 사건을 이용하여 의도된 유전자 유전좌위에서 성공적으로 게놈 편집되는지를 결정하는 방법이 본원에 제공된다. 이러한 방법은 조작된 표적화된 게놈 편집 사건 후에 샘플로부터 추출된 복수의 이중-가닥 DNA 분자에 대해 듀플렉스 오류-정정된 시퀀싱 판독을 제공하는 단계; 및 기준 게놈에서의 하나 이상의 유전자 유전좌위의 세트에서의 각각의 유전자 유전좌위에 대해, 듀플렉스 오류-정정된 시퀀싱 판독이 예상된 서열과 실질적으로 동일한 서열을 갖는 이중-가닥 DNA 분자를 정량화하는 단계를 포함할 수 있다.
일부 실시형태에서, 제공된 방법은 하나 이상의 의도되지 않은 게놈 유전좌위로부터의 서열을 포함하는 이중-가닥 DNA 분자로부터 유래된 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 분석하는 단계; 및 기준 게놈 서열과의 관련성을 비교하는 단계; 및 하나 이상의 의도되지 않은 게놈 유전좌위를 포함하는 복수의 이중-가닥 DNA 분자 중에서 하나 이상의 변이체의 변이 빈도를 결정하는 단계를 포함한다. 일반적으로, 예상된 서열(예를 들어, 기준 서열)은 부정확한 편집 사건 또는 돌연변이, 또는 다른 실시형태에서 게놈에서 그 외(예를 들어, 의도되지 않은 게놈 유전좌위)에서 발생할 수 있는 "오프-타깃" 편집 사건을 확인하도록 사용될 수 있다. 일부 실시형태에서, 제공된 방법은 변경되지 않은 서열(예를 들어, 성공적으로 편집되지 않은 게놈)을 확인하기 위해 사용될 수 있다.
일부 실시형태에서, 게놈 편집 사건이 비성공적인 경우를 검출하고/하거나 정량화하는 방법이 본원에 제공된다(예를 들어, 의도된 게놈 유전좌위는 비변경된 서열을 포함하고, 의도된 게놈 유전좌위는 원치 않는 또는 의도하지 않은 변경된 서열을 포함하고, 의도되지 않은 게놈 유전좌위는 게놈 편집 사건의 결과로서 변경된 서열을 포함한다). 일부 실시형태에서, 집단에서 비편집된 세포의 비율을 평가하는 방법이 본원에 제공된다. 예를 들어, 게놈 편집 사건을 겪은 세포 집단에서의 세포의 부분은 의도된 게놈 유전좌위에서 변경되지 않은 채 있을 수 있다. 게놈 편집 사건의 효율의 결정은 변경되지 않은 채 있는 의도된 게놈 유전좌위에서의 서열을 포함하는 원래의 이중-가닥 DNA 분자의 비율을 결정하는 것을 포함할 수 있다. 마찬가지로, 방법은 의도된 게놈 유전좌위에서 원하는 변경된 서열을 포함하는 원래의 이중-가닥 DNA 분자의 수 또는 비율을 정량화하는 것을 포함할 수 있다.
일부 실시형태에서, 조작된 게놈 편집 사건이 부정확한 경우의 발생률을 검출하고/하거나 정량화하는 방법이 본원에 제공된다. 일부 실시형태에서, 제공된 방법은 의도된 게놈 유전좌위의 서열에서의 하나 이상의 변이체의 존재를 검출하고/하거나 정량화하는 단계를 포함한다. 일부 실시형태에서, 하나 이상의 변이체는 의도된 게놈 유전좌위의 서열에서의 부정확한 돌연변이를 포함한다. 예를 들어, 일부 실시형태에서, 게놈 편집을 위한 의도된 게놈 유전좌위의 서열에서의 부정확한 돌연변이는 비상동성 말단 연결(NHEJ) 사건으로 인한다. 일부 실시형태에서, NHEJ에 의해 초래된 돌연변이가 원해지고, 의도된 돌연변이이다. 일부 실시형태에서, 제공된 방법은 의도된 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독 중에서 원치 않는 DNA 서열의 빈도를 결정하는 단계를 포함한다.
일부 실시형태에서, 조작된 게놈 편집 사건은 복수의 의도된 게놈 유전좌위(예를 들어, 멀티플렉스 게놈 조작)에 관한 것이다. 일부 실시형태에서, 게놈 편집에 의해 표적화된 복수의 게놈 유전좌위를 규명하는 방법이 본원에 제공된다. 일부 실시형태에서, 2개 이상(예를 들어, 2개, 3개, 4개, 5개, 6개, 7개 이상)의 의도된 유전좌위에서의 조작된 게놈 편집의 성공을 평가하는 방법이 본원에 제공된다. 일부 실시형태에서, 복수의 게놈 편집 사건 중 적어도 하나가 비성공적이거나 부정확한 경우의 발생률을 검출하고/하거나 정량화하는 방법이 본원에 제공된다.
일부 실시형태에서, 제공된 방법은 또한 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독이 변이체를 포함하는지를 결정하는 단계를 포함할 수 있다.
일부 실시형태에서, 듀플렉스 시퀀싱 방법에 의해 분석되는 하나 이상의 표적화된 게놈 영역은 게놈에서의 적어도 하나의 의도되지 않은 게놈 유전좌위이거나 이를 포함하다. 일부 실시형태에서, 하나 이상의 변이체는 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독에서 확인된다. 이러한 변이체는 기능적 파괴 돌연변이(예를 들어, 단백질 기능을 파괴하고 암을 야기할 가능성을 갖는 것 등)를 포함할 수 있다.
일부 실시형태에서, 제공된 방법은 복수의 이중 가닥 DNA 분자 중에서 의도되지 않은 게놈 유전좌위에서의 하나 이상의 변이체의 빈도를 결정하는 단계를 포함한다. 일부 실시형태에서, 제공된 방법은 복수(예를 들어, 2개 이상)의 상이한 의도되지 않은 게놈 유전좌위에서의 하나 이상의 변이체의 빈도를 결정하는 단계를 포함한다. 일부 실시형태에서, 오류-정정된 서열 판독의 이러한 비교는 복수의 의도되지 않은 게놈 유전좌위에서의 서열을 기준 게놈 DNA 서열과 비교하는 단계를 포함할 수 있다.
일부 실시형태에서, 의도되지 않은 게놈 유전좌위는 돌연변이-민감 부위, 미세부수체 유전좌위, 의도된 게놈 유전좌위와 서열 상동성을 갖는 서열, 및/또는 암 유발자 중 하나 이상을 포함한다.
일부 실시형태에서, 의도되지 않은 유전좌위는 게놈 내에 돌연변이-민감 부위인 서열이거나 이를 포함한다.
일부 실시형태에서, 의도되지 않은 유전좌위는 미세부수체 유전좌위인 서열이거나 이를 포함한다. 일반적으로, 미세부수체는 오류 또는 돌연변이에 민감한 짧은 반복적 DNA 서열이다. 신생물 세포에서, 미세부수체 돌연변이는 미세부수체 서열이 짧아지거나 길어지게 하여, 미세부수체 불안정성(미세부수체 불안정성, MSI)을 야기할 수 있다.
일부 실시형태에서, 의도되지 않은 유전좌위는 의도된 게놈 유전좌위에서의 서열과 적어도 부분적으로 유사한 서열이거나 이를 포함한다. 일부 실시형태에서, 의도되지 않은 유전좌위는 편집을 위해 의도된 게놈과 상동성을 갖는 서열이거나 이를 포함한다. 일부 실시형태에서, 의도되지 않은 유전좌위는 편집을 위해 의도된 게놈 유전좌위의 적어도 일부와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 유사성을 갖는 서열을 포함한다. 일부 실시형태에서, 의도되지 않은 유전좌위는 편집을 위해 의도된 게놈 유전좌위의 적어도 일부와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 의도된 게놈 유전좌위의 적어도 일부는 적어도 10개의 염기, 적어도 15개의 염기, 적어도 20개의 염기, 적어도 25개의 염기, 적어도 30개의 염기, 적어도 40개의 염기, 적어도 50개의 염기 또는 초과이다. 일부 실시형태에서, 의도되지 않은 유전좌위는 게놈 편집 과정에 사용된 가이드 폴리뉴클레오타이드(예를 들어, 합성 가이드 RNA(gRNA) 분자)의 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%. 적어도 98% 또는 적어도 99%의 유사성을 갖는 서열을 포함한다. 일부 실시형태에서, 의도되지 않은 유전좌위는 게놈 편집 과정에 사용된 가이드 폴리뉴클레오타이드(예를 들어, 합성 가이드 RNA(gRNA) 분자)의 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%. 적어도 98% 또는 적어도 99%의 동일성을 갖는 서열을 포함한다.
일부 실시형태에서, 의도되지 않은 유전좌위는 종양 억제자 유전자, 종양유전자, 원종양유전자, 및/또는 암 유발자이거나 이를 포함한다. 일부 실시형태에서, 암 유발자는 Cancer Gene Census(CGC) 또는 COSMIC 데이터베이스(암에 원인상 연루된 유전자)로부터의 공지된 암 유발자이다. 일부 실시형태에서, 암 유발자 유전자는 ABL, ACC, BCR, BLCA, BRCA, CESC, CHOL, COAD, DLBC, DNMT3A, EGFR, ESCA, GBM, HNSC, KICH, KIRC, KIRP, LAML, LGG, LIHC, LUAD, LUSC, MESO, OV, PAAD, PCPG, PI3K, PIK3CA, PRAD, PTEN, READ, SARC, SKCM, STAD, TGCT, THCA, THYM, UCEC, UCS, 및/또는 UVM이거나 이를 포함한다. 일부 실시형태에서, 암 유발자 유전자는 TP53이거나 이를 포함한다. 일부 실시형태에서, 암 유발자 유전자는 HRAS, NRAS 또는 KRAS이거나 이를 포함한다.
일부 실시형태에서, 변이체가 분자의 집단에서의 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에서 검출되면, 상기 방법은 복수의 농후화된 태그화된 DNA 분자 중에서 변이체의 변이 빈도를 결정하는 단계를 추가로 포함할 수 있다.
클론 선택 및 클론 팽창을 평가하기 위해 듀플렉스 시퀀싱 방법의 선택된 예
선택압 하에 돌연변이를 함유하는 세포의 클론 팽창을 검출하고 정량화하는 능력은 암 위험의 평가, 발암물질의 확인 및 인간에서의 노출의 영향의 예측, 임상 치료의 성공의 결정, 표적화된 게놈 편집의 성공의 결정 등에 중요할 수 있다. 그러나, 현재의 도구는 느리고/느리거나 번거롭고/번거롭거나 이것이 제공하는 정보에서 제한된다. 많은 도구는 압력 하에 선택된 클론의 초기 단계 신생물 팽창을 검출하는 민감도가 결여된다.
많은 사건은 삽입, 결실, 절단 및/또는 재배열과 같은 세포 게놈의 변경을 발생시킬 수 있고, 이들은 그 손상이 세포사로 바로 이어지지 않으면 암으로 이어질 수 있다. 소정의 세포 집단에서, 암 유발자 유전자(예를 들어, 종양 억제자 유전자 또는 원종양유전자)에서의 돌연변이를 보유하는 세포는 세포 집단의 상황 및 이웃하는 세포의 클론 성장에 의해 마스킹될 수 있다. 그러나, 일부 세포의 클론 성장을 파괴할 수 있는 사건(예를 들어, 세포 주기 정지, 세포사 등을 야기하는 해로운 DNA 손상)은 성장 이점을 갖는 세포의 선택적 성장에 대한 기회를 제공하고, 이러한 클론은 사건 후에 세포 팽창을 통해 불균등하게 증식할 수 있다. 선택압을 야기하는 사건은 이웃을 조정하고/하거나 능가할 수 있는 세포에서 진화압을 제공하는 임의의 사건, 변화, 치료, 과정 또는 다른 노출(화학적, 생물학적, 물리적)일 수 있다. 이러한 선택압은 생체내 또는 시험관내 환경에 존재할 수 있다. 예를 들어, 인간 또는 동물 대상체에서의 이종이식은 다른 것에 비해 일부 세포의 선택적 팽창을 나타낼 수 있다. 다른 예에서, 표적화된 게놈 편집 후에, 진화 이점을 보유하는 일부 세포는 세포 배양에서 다른 이웃하는 세포를 능가할 수 있다. 이러한 경우에, 이들이 팽창하면서 세포 클론의 변이체 대립유전자 빈도는 각각의 성장률을 나타내고, 나타난 상이한 변이체의 선택적 이점 또는 단점에 대한 통찰을 제공할 수 있다. 따라서, 듀플렉스 시퀀싱에 의해 검출된 바와 같은 대표적인 분자의 변이체 대립유전자 빈도는 선택압 하에 다른 세포를 능가하는 돌연변이를 보유하는 세포 클론을 밝히도록 사용될 수 있다. 소정의 이들 돌연변이는 임상 환경 및 세포가 환자로 도입되는 치료에서 문제일 것이다.
일부 실시형태에서, 제공된 방법은 하나 이상의 변이체의 빈도 및/또는 풍부도의 변화를 평가하기 위해 다수의 시점에서 수행된다. 일부 실시형태에서, 제공된 방법은 제1 시점에서 그리고 제2의 나중의 시점에서 수행된다. 일부 실시형태에서, 제2 시점은 제1 시점 후 적어도 2일, 3일, 4일, 5일, 6일, 7일, 10일, 15일, 20일, 30일, 60일, 90일 또는 180일이다. 일부 실시형태에서, 제1 시점 및 제2 시점 둘 다는 조작된 게놈 편집 사건 후에 약 30일 내, 약 45일 내, 약 60일 내, 약 75일 내 또는 약 90일 내이다. 다수의 시점에서의 분석은 신생물성 가능성 또는 신생물성 가능성의 증가를 평가하는 데 유용할 수 있다. 예를 들어, 제2 시점으로부터의 변이 빈도가 제1 시점으로부터의 변이 빈도보다 높으면 세포 집단이 신생물성 가능성을 갖는 것으로 결정된다.
일부 실시형태에서, 제공된 방법은 하나 이상의 변이체의 빈도 및/또는 풍부도의 변화를 평가하기 위해 다수의 시점에서 수행된다. 일부 실시형태에서, 제공된 방법은 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에서의 변이체의 검출 및/또는 정량화를 포함한다. 일부 실시형태에서, 제공된 방법은 제1 시점 및 또한 나중의 제2 시점에서 복수의 농후화된 태그화된 DNA 분자 중에서 변이체의 변이 빈도를 결정하는 단계를 포함한다.
일부 실시형태에서 제1 시점은 게놈 편집 단계 전이고, 제2 시점은 게놈 편집 단계 후이다. 일부 실시형태에서, 제공된 방법은 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에서의 변이체의 검출 및/또는 정량화, 및 복수의 농후화된 태그화된 DNA 분자 중에서 변이체의 변이 빈도를 결정하는 단계를 포함한다.
게놈 편집
제공된 방법이 "게놈 편집"을 지칭할 때, 본원에 개시된 바와 같은 "게놈 편집"이 숙주 세포 내에 표적화된 임의의 DNA 분자 또는 이중-가닥 DNA의 막-결합 조각, 예를 들어 자연적 염색체, 합성 염색체, 자연-발생 또는 합성 에피솜 분자, 바이러스 작제물 등의 생체내 편집(예를 들어, 미스-복구, 삽입, 또는 다른 표적 부위 변경)을 포함하는 것으로 이해되어야 한다. 일부 실시형태에서, 게놈 편집 활성은 조작되거나 천연이다. 예를 들어, CRISPR(일정한 간격을 두고 주기적으로 분포하는 짧은 회문 반복서열: Clustered Regularly Interspaced Short Palindromic Repeats)/Cas(CRISPR-연관) 시스템은 바이러스 공격에 대해 방어하도록 적응 면역 시스템으로서 박테리아 및 고세균에서 진화되었다. 자연 게놈 편집은 바이러스 또는 바이러스 요소, 가동성 또는 이동성 유전자 요소 등에 의해 매개될 수 있다. 이동성 유전자 요소는 절단 및 페이스트(DNA 트랜스포손; 클래스 II 요소) 또는 카피 및 페이스트(레트로포손; 클래스 I 요소) 과정에 의해 복제하는 상호작용 유전 물질이다. 이동성 유전자 요소는 일반적으로 반복 서열에 의해 측접된다.
일부 실시형태에서, 게놈 편집 활성은 조작된다. 일부 실시형태에서, 조작된 게놈 편집 사건은 표적화된 엔도뉴클레아제를 사용한다. 예시적인 표적화된 엔도뉴클레아제 및 이를 사용하는 방법은 하기 제공된다. 일부 실시형태에서, 조작된 게놈 편집 사건은 폴리뉴클레오타이드 기질-매개된 상동성 재조합 사건이다. 일부 실시형태에서, 조작된 게놈 편집 사건은 DNA 절단, DNA 부가물, DNA 산화적 손상, DNA 손상의 다른 형태, DNA 닉, DNA 탈아미드화를 도입한다. 일부 실시형태에서, 유전자 변화는 표적화된 엔도뉴클레아제에 의한 절단 및 변이체가 상동성 재조합을 통해 도입되는 재조합 주형이 제공된 상동성 재조합의 조합에 의해 도입된다. 일부 실시형태에서, 조작된 게놈 편집 사건은 레트로바이러스 또는 다른 바이러스에 의해 수행된다.
제한 없이, 게놈 편집은, 유전자의 발현을 감소시키거나 기능적 단백질로의 번역을 감소시키는, 유전자를 "넉아웃"하거나 비암호화 서열을 파괴시키는, 공여자 단편의 삽입에 의해 하나 이상의 유전자 또는 비유전자성 유전좌위를 파괴할 수 있다. 대안적으로 또는 또한, 게놈 편집은 유전자 발현 요소, 예컨대 프로모터, 유전자의 발현을 증가시킬 수 있는 인핸서 등 또는 억제자 또는 유전자 또는 다른 전사체(예컨대, 마이크로RNA 또는 조절 위유전자)의 발현을 감소시키는 다른 요소를 도입할 수 있다. 본원에 개시된 바와 같은 게놈 편집은 유전자, 예컨대 외인성 유전자를 유전좌위로 도입하도록 추가로 사용될 수 있다. 본원에서 게놈 편집 방법을 사용하여, 다수의 유전자는 공여자 단편 상의 게놈 표적 부위로 도입될 수 있다. 공여자 단편은 본원에 제공된 방법을 사용하여 검출 가능한 마커 유전자, 예를 들어 도입된 유전자의 침투를 평가하기 위해 사용될 수 있는 형광 단백질 유전자 또는 검출 가능한 마커 유전자에 물리적으로 연결된 유전자를 선택적으로 포함할 수 있다.
표적화된 엔도뉴클레아제
일련의 분자 도구는 특히 진핵생물 게놈의 특정 유전자 조작을 허용하도록 최근에 개발되었다. 초기에 징크-핑거 뉴클레아제(ZFN), 이어서 전사 활성자-유사 효과기 뉴클레아제(TALEN)가 개발되었다. CRISPR/Cas9 시스템의 개발에 의해, 표적화된 게놈 편집은 진핵생물 종에 걸쳐 달성되었다. CRISPR/Cas9 시스템은 일반적으로 (예를 들어, 스트렙토코커스 피요게네스의) Cas9 엔도뉴클레아제 및 CRISPR RNA(cRNA) 및 전사촉진 cRNA(tracrRNA)의 기능을 조합한 합성 가이드 RNA(gRNA) 분자를 포함한다. gRNA는 Cas9 엔도뉴클레아제를 Cas9 활성에 필요한 프로토스페이서-연관된 모티프(PAM) NGG 서열에 앞선 20개의 뉴클레오타이드에 상보성인 표적 서열로 지시한다. 일부 실시형태에서, cRNA 및 tracrRNA는 뉴클레오타이드 변형을 함유할 수 있는 단일 RNA로 조합될 수 있다.
본 개시내용의 맥락에서, 임의의 수의 표적화된 엔도뉴클레아제(예를 들어, CRISPR-연관 리보핵단백질 복합체, 예컨대 Cas9 또는 Cpf1, 호밍 뉴클레아제, 징크-핑거 뉴클레아제, TALEN, 메가TAL 뉴클레아제, 아르고너트 뉴클레아제, 및/또는 이의 유도체)는 다양한 유기체에서 의도된 돌연변이유발(예를 들어, 게놈 편집)을 도입하도록 사용될 수 있다. 일부 실시형태에서, 표적화된 엔도뉴클레아제는 DNA 가닥을 따라 선택된 위치에서 이중 가닥 절단(DSB)을 생성할 수 있는 부위-특이적 뉴클레아제이다. 일부 실시형태에서, 표적화된 엔도뉴클레아제는 DNA 가닥을 따라 선택된 위치에서 단일 가닥 닉을 생성할 수 있는 부위-특이적 뉴클레아제이다.
일부 실시형태에서, 표적화된 엔도뉴클레아제는 제공된, 예를 들어 향상된 열안정성, 염 공차 및/또는 pH 공차에 대해 아미노산 치환을 가지는 것처럼 변형될 수 있다. 다른 실시형태에서, 표적화된 엔도뉴클레아제는 비오티닐화되고, 스트렙타비딘으로 융합되고/되거나, 다른 친화도-기반(예를 들어, 미끼/프레이) 기술을 혼입할 수 있다. 소정의 실시형태에서, 표적화된 엔도뉴클레아제는 변경된 인식 부위 특이성을 가질 수 있다(예를 들어, 변경된 PAM 부위 특이성을 갖는 SpCas9 변이체).
일부 실시형태에서, 조작된 게놈 편집 사건은 CAS 또는 CPF-1 매개된 편집 사건이다. 일부 실시형태에서, 조작된 게놈 편집 사건은 Cas9-매개된 편집 사건이다. 일부 실시형태에서, 조작된 게놈 편집 사건은 CPF1-매개된 편집 사건이다. 일부 실시형태에서, 조작된 게놈 편집 사건은 TALEN, 메가TAL, 징크-핑거 뉴클레아제, 호밍 엔도뉴클레아제, 제한 엔도뉴클레아제에 의해 수행된다.
CRISPR-기반 표적화된 엔도뉴클레아제는 표적화된 엔도뉴클레아제의 사용의 추가의 자세한 비제한적인 예를 제공하도록 본원에 추가로 기재되어 있다. 본 발명자들은 이러한 표적화된 뉴클레아제에 대한 명명이 변한다는 것에 주목한다. 본원에서의 목적을 위해, 본 발명자들은 일반적으로 핵산 서열을 포함하는 엔도뉴클레아제를 의미하도록 용어 "CRISPER-기반"을 사용하고, 이의 서열은 절단되는 핵산 서열을 재정의하기 위해 변형될 수 있다. Cas9 및 CPF1은 현재 사용 중인 이러한 표적화된 엔도뉴클레아제의 예이지만, 많은 것은 자연 세계에서 상이한 위치에 존재하는 것으로 더 보이고, 이러한 표적화되고 용이하게 조율 가능한 뉴클레아제의 상이한 변종의 이용 가능성은 다가오는 해에 신속히 성장하는 것으로 예상된다. 유사하게, 이의 특성을 향상시키거나 변경하기 위한 이들 효소의 다수의 조작된 변이체가 이용 가능해진다. 본원에서, 본 발명자들은 내에 기재된 개시내용과 유사한 목적을 달성하기 위해 본원에 명확히 기재되지 않거나 아직 발견되지 않은 실질적으로 기능적으로 유사한 표적화된 엔도뉴클레아제의 사용을 명확히 고려한다.
게놈 편집을 위한 세포 및 벡터
게놈 편집 시스템 및/또는 방법은 바이러스 벡터, 예를 들어 아데노바이러스 또는 아데노-연관 바이러스(AAV)를 포함할 수 있다. 전형적으로, 발현 벡터 DNA는 형질전환, 전기천공 또는 바이러스(AAV)에 의해 세포에 전달될 수 있다. 또한, RNA는 주사 또는 전기천공에 의해 세포로 전달될 수 있다. 단백질은 전기천공, 펩타이드(HIV) 태그를 통해 세포에 전달될 수 있다.
본 개시내용은 게놈이 편집될 세포 및/또는 편집된 세포를 제공한다. 제공된 방법은 원핵생물 세포(박테리아 및 고세균) 및 제한 없이 식물 세포, 동물 세포 및 원생동물, 진균 및 조류를 포함하는 진핵생물 세포를 포함하는 배양될 수 있는 임의의 세포에 의해 수행될 수 있다. 일부 실시형태에서, 본 개시내용의 맥락에서 편집되고/되거나 분석되는 세포 집단은 다능성 줄기 세포, 배아 줄기 세포, 면역 세포 또는 식물 세포이다.
일부 실시형태에서, 본 개시내용의 맥락에서 편집되고/되거나 분석되는 세포 집단은 동물 세포(예를 들어, 포유류 세포, 예를 들어 인간 세포)이거나 이를 포함한다. 일부 실시형태에서, 세포 집단은 포유류 줄기 세포이거나 이를 포함한다. 일부 실시형태에서, 본 개시내용의 맥락에서 편집되는 세포 집단은 식물 세포이거나 이를 포함한다.
시약을 갖는 키트
본 기술내용의 양태는 듀플렉스 시퀀싱 방법의 다양한 양태를 수행하기 위한 키트(본원에서 "DS 키트"라고도 칭함)를 추가로 포함한다. 일부 실시형태에서, 키트는 핵산 추출, 핵산 라이브러리 준비, 증폭(예를 들어, PCR을 통해) 및 시퀀싱을 위해 본원에 개시된 방법 또는 방법 단계의 하나 이상을 수행하기 위한 설명서와 함께 다양한 시약을 포함할 수 있다. 일 실시형태에서, 키트는 본 기술내용의 양태에 따라 샘플과 연관된 예를 들어 성공적인 게놈 편집 사건, 부정확한 게놈 편집 사건, 의도되지 않은(예를 들어, 오프표적) 게놈 편집 사건, 클론 선택, 클론 팽창 등을 결정하기 위해 시퀀싱 데이터(예를 들어, 원시 시퀀싱 데이터, 시퀀싱 판독 등)를 분석하기 위한 컴퓨터 프로그램 제품(예를 들어, 컴퓨터에서 실행하기 위한 코딩된 알고리즘, 하나 이상의 알고리즘을 실행하기 위해 클라우드-기반 서버에 대한 접근 코드 등)을 추가로 포함할 수 있다. 키트는 DNA 표준품 및 양성 제어 및 음성 제어의 다른 형태를 포함할 수 있다.
일부 실시형태에서, DS 키트는 샘플 준비(예를 들어, 조직 조작, DNA 추출, DNA 단편화), 핵산 라이브러리 준비, 증폭 및 시퀀싱의 다양한 양태를 수행하기에 적합한 시약 또는 시약의 조합을 포함할 수 있다. 예를 들어, DS 키트는 하나 이상의 DNA 추출 시약(예를 들어, 완충액, 칼럼 등) 및/또는 조직 추출 시약을 선택적으로 포함할 수 있다. 선택적으로, DS 키트는 예컨대 물리적 수단(예를 들어, 청각 전단 또는 음파처리를 용이하게 하는 관, 뉴블라이저 유닛 등) 또는 효소 수단(예를 들어, 랜덤 또는 반랜덤 게놈 전단을 위한 효소 및 적절한 반응 효소)에 의해 이중-가닥 DNA를 단편화하기 위한 하나 이상의 시약 또는 도구를 추가로 포함할 수 있다. 예를 들어, 키트는 표적화된 분해에 대한 효소(예를 들어, 제한 엔도뉴클레아제, CRISPR/Cas 엔도뉴클레아제(들) 및 RNA 가이드, 및/또는 다른 엔도뉴클레아제), 이중-가닥 프레그멘타아제 칵테일, DNA의 단편이 주로 이중-가닥이게 하고/하거나, 단일-가닥 DNA를 파괴하기 위한 단일-가닥 DNase 효소(예를 들어, 녹두 뉴클레아제, S1 뉴클레아제), 및 적절한 완충액 및 이러한 효소 반응을 용이하게 하는 용액 중 하나 이상을 포함하는 이중-가닥 DNA를 효소적으로 단편화하기 위한 DNA 단편화 시약을 포함할 수 있다.
일 실시형태에서, DS 키트는 샘플에서 이중-가닥 핵산 분자의 오류-정정된 (예를 들어, 고정확도) 서열을 생성하기 위해 듀플렉스 시퀀싱 공정 단계를 수행하기에 적합한 샘플로부터 핵산 서열 라이브러리를 준비하기 위한 프라이머 및 어댑터를 포함한다. 예를 들어, 키트는 사용자가 이것을 생성하기 위해 단일 분자 식별자(SMI) 서열 또는 도구(예를 들어, 단일-가닥 올리고뉴클레오타이드)를 포함하는 어댑터 분자의 적어도 하나의 풀을 포함할 수 있다. 일부 실시형태에서, 어댑터 분자의 풀은 샘플에서의 복수의 핵산 분자가 단독으로 또는 이들이 결찰된 단편의 고유한 특징과 조합되어 어댑터 분자의 부착 후에 실질적으로 고유하게 표지될 수 있도록 실질적으로 고유한 SMI 서열의 적합한 수를 포함할 것이다. 분자 태그화의 분야의 당업자는 "적합한" 수의 SMI 서열을 포함하는 것이 다양한 특정 인자(유입 DNA, DNA 단편화의 유형, 단편의 평균 크기, 게놈 내에 시퀀싱되는 서열의 복합성 대 반복성 등)에 따라 다수의 규모 차수로 변할 것이라는 것을 인식할 것이다. 선택적으로, 어댑터 분자는 하나 이상의 PCR 프라이머 결합 부위, 하나 이상의 시퀀싱 프라이머 결합 부위, 또는 둘 다를 추가로 포함한다. 다른 실시형태에서, DS 키트는 SMI 서열 또는 바코드를 포함하는 어댑터 분자를 포함하지 않고, 대신에 종래의 어댑터 분자(예를 들어, Y-형상 시퀀싱 어댑터 등)를 포함하고, 다양한 방법 단계는 분자 서열 판독과 관련되도록 내인성 SMI를 사용할 수 있다. 일부 실시형태에서, 어댑터 분자는 인덱싱 어댑터이고/이거나 인덱싱 서열을 포함한다. 다른 실시형태에서, 인덱스는 키트에 제공된 프라이머를 사용하여 PCR에 의한 "트레일링 인(tailing in)"을 통해 특정 샘플에 첨가된다.
일 실시형태에서, DS 키트는 비상보성 영역 및/또는 일부 다른 가닥 한정 요소(SDE), 또는 사용자가 이것을 생성하기 위한 도구(예를 들어, 단일-가닥 올리고뉴클레오타이드)를 각각 갖는 어댑터 분자의 세트를 포함한다. 다른 실시형태에서, 키트는 어댑터 분자의 적어도 하나의 세트를 포함하고, 여기서 어댑터 분자의 적어도 하위집단은 각각 적어도 하나의 SMI 및 적어도 하나의 SDE, 또는 이를 생성하기 위한 도구를 포함한다. 듀플렉스 시퀀싱 공정 단계를 수행하기에 적합한 샘플로부터 핵산 시퀀싱 라이브러리를 준비하기 위한 프라이머 및 어댑터에 대한 추가의 특징은 상기에 기재될 뿐만 아니라 미국 특허 제9,752,188호, 국제공보 WO2017/100441호 및 국제출원 PCT/US18/59908호(2018년 11월 8일 출원)에 개시되어 있고, 이들 모두는 본원에서 그 전체가 인용되어 포함된다.
추가로, 키트는 예를 들어 DNA 결합 염료, 예컨대 SYBR™ 그린 또는 SYBR™ 골드(Thermo Fisher Scientific(매사추세츠주 왈탐)으로부터 입수 가능) 또는 Qubit 형광기(예를 들어, Thermo Fisher Scientific(매사추세츠주 왈탐)으로부터 입수 가능)와 사용하기 위한 기타, 또는 적합한 형광 분광기 또는 실시간 PCR 기계 또는 디지털-액적 PCR 기계에서 사용하기 위한 PicoGreen™ 염료(예를 들어, Thermo Fisher Scientific(매사추세츠주 왈탐)으로부터 입수 가능)와 같은 DNA 정량화 재료를 추가로 포함할 수 있다. 다른 플랫폼에서 DNA 정량화에 적합한 다른 시약이 또한 고려된다. 추가의 실시형태는 핵산 크기 선택 시약(예를 들어, 고상 가역적 부동화(SPRI) 자기 비드, 겔, 칼럼), 미끼/프레이 혼성화를 사용한 표적 DNA 포획을 위한 칼럼, qPCR 시약(예를 들어, 카피수 결정을 위한) 및/또는 디지털 액적 PCR 시약 중 하나 이상을 포함하는 키트를 포함한다. 일부 실시형태에서, 키트는 라이브러리 준비 효소(리가제, 중합효소(들), 엔도뉴클레아제(들), 예를 들어 RNA 질의를 위한 역전사효소), dNTP, 완충액, 포획 시약(예를 들어, 비드, 표면, 코팅된 관, 칼럼 등), 인덱싱 프라이머, 증폭 프라이머(PCR 프라이머) 및 시퀀싱 프라이머 중 하나 이상을 선택적으로 포함할 수 있다. 일부 실시형태에서, 키트는 오류-민감 DNA 중합효소 및/또는 고충실도 DNA 중합효소와 같은 DNA 손상의 유형을 평가하기 위한 시약을 포함할 수 있다. 추가의 첨가제 및 시약은 특정 조건(예를 들어, 고 GC 농후 게놈/표적)에서 PCR 또는 결찰 반응에 고려된다.
일 실시형태에서, 키트는 (질병을 초래하는 돌연변이의 복원에 대한) 중합효소 연쇄 반응(PCR) 공정을 방해하는 DNA 서열 오류를 복원하는 DNA 오류 정정 효소와 같은 시약을 추가로 포함한다. 비제한적인 예로서, 효소는 다른 글리코시리라제, 리가제, 엔도뉴클레아제 및 엑소뉴클레아제 등 중에서 단일작용성 우라실-DNA 글리코시리라제(hSMUG1), 우라실-DNA 글리코시리라제(UDG), N-글리코시리라제/AP-리가제 NEIL 1 단백질(hNEIL1), 포름아미도피리미딘 DNA 글리코시리라제(FPG), 8-옥소구아닌 DNA 글리코시리라제(OGG1), 인간 아푸린/아피리미딘 엔도뉴클레아제(APE 1), 엔도뉴클레아제 III(엔도 III), 엔도뉴클레아제 IV(엔도 IV), 엔도뉴클레아제 V(엔도 V), 엔도뉴클레아제 VIII(엔도 VIII), T7 엔도뉴클레아제 I(T7 엔도 I), T4 피리미딘 이합체 글리코시리라제(T4 PDG), 인간 단일-가닥-선택적 인간 알킬아데닌 DNA 글리코시리라제(hAAG) 등 중 하나 이상을 포함하고; DNA 손상(예를 들어, 시험관내 또는 생체내 DNA 손상)을 정정하도록 사용될 수 있다. 이러한 DNA 복원 효소의 일부는 예를 들어 DNA로부터 손상된 염기를 제거하는 글리코스리가제이다. 예를 들어, UDG는 사이토신 탈아미드화로부터 생긴(사이토신의 자발적 가수분해에 의해 초래된) 우라실을 제거하고, FPG는 8-옥소-구아닌(예를 들어, 반응성 산소 종으로부터 생긴 가장 흔한 DNA 병변)을 제거한다. FPG는 또한 비염기성 부위에서 1개의 염기 갭을 생성할 수 있는 리가제 활성을 갖는다. 예를 들어, 중합효소가 주형을 카피하지 못하므로, 이러한 비염기성 부위는 후속하여 PCR에 의해 증폭하지 못할 것이다. 따라서, 이러한 DNA 손상 복원 효소, 및/또는 여기 기재되고 당해 분야에 공지된 바와 같은 다른 것의 사용은 진정한 돌연변이를 갖지 않고 오류로서 달리 검출되지 않는 손상된 DNA를 효과적으로 제거할 수 있다.
키트는 적절한 대조군, 예컨대 DNA 증폭 대조군, 핵산(주형) 정량화 대조군, 시퀀싱 대조군, 게놈 편집 사건 후에 게놈 편집 사건 또는 클론 팽창을 겪은 생물학적 원천으로부터 유래된 핵산 분자를 추가로 포함할 수 있다. 일부 실시형태에서, 키트는 세포의 대조군 집단을 포함할 수 있다. 일부 실시형태에서, 키트는 조작된 게놈 편집을 위한 하나 이상의 성분, 예를 들어 벡터, gRNA, 편집 효소 및/또는 시약을 포함할 수 있다. 따라서, 키트는 편집 사건에 대한 프로토콜 진본성을 결정하는 예상된 듀플렉스 시퀀싱 결과를 생성시키는 대조군을 제공하기 위해 적합한 시약(시험 화합물, 핵산, 대조군 시퀀싱 라이브러리 등)을 포함할 수 있다. 일부 실시형태에서, 키트는 게놈 편집 사건 후에 게놈 편집 사건 또는 클론 팽창을 규명하기 위한 기준 서열 정보를 포함할 수 있다. 일부 실시형태에서, 키트는 편집된 세포의 집단에서 하나 이상의 DNA 변이체를 확인하는 데 유용한 서열 정보를 포함할 수 있다. 이러한 서열 정보는 편집된 세포의 신생물성 가능성을 결정하고/결정하거나 게놈 편집 공정 자체의 효율을 평가하는 데 유용할 수 있다. 일 실시형태에서, 키트는 대상체 샘플에서 또는 조작된 세포 집단에서 DNA 변이체를 검출하기 위한 분석을 위해 샘플, 샘플을 안정화하기 위한 저장 재료, 세포 샘플과 같은 샘플을 동결하기 위한 재료를 선적하기 위한 용기를 포함한다. 다른 실시형태에서, 키트는 핵산 오염 대조군 표준품(예를 들어, 시험 또는 대상체 유기체와 다른 유기체 에서 게놈 영역에 친화도를 갖는 혼성화 포획 프로브)을 포함할 수 있다.
키트는 PCR 및 시퀀싱 완충액, 희석제, 대상체 샘플 추출 도구(예를 들어, 주사기, 면봉 등), 및 사용 설명서와 함께 패키지 인서트를 포함하는 상업적 및 사용자 관점으로부터 바람직한 물질을 포함하는 하나 이상의 다른 용기를 추가로 포함할 수 있다. 또한, 라벨은 상기 기재된 것과 같은 사용에 대한 지시를 갖는 용기에 제공될 수 있고/있거나, 그 지시 또는 다른 정보는 또한 키트에 포함된 인서트 상에; 및/또는 여기 제공된 웹사이트 주소를 통해 포함될 수 있다. 키트는 또한 예를 들어 샘플 관, 플레이트 실러, 미세원심분리 관 오프너, 라벨, 자기 입자 세퍼레이터, 폼 인서트, 아이스 팩, 드라이아이스 팩, 절연재 등과 같은 실험실 도구를 포함할 수 있다.
키트는 전자 컴퓨팅 장치(예를 들어, 랩탑/데스크탑 컴퓨터, 태블릿 등)에서 설치 가능하거나 네트워크(예를 들어, 원격 서버)를 통해 접근 가능한 컴퓨터 프로그램 제품을 추가로 포함할 수 있고, 컴퓨팅 장치 또는 원격 서버는 듀플렉스 시퀀싱 분석 단계를 포함하는 연산을 수행하도록 명령을 실행하도록 구성된 하나 이상의 프로세서를 포함한다. 예를 들어, 프로세서는 듀플렉스 시퀀싱 데이터를 생성하기 위해 원시 또는 비분석된 시퀀싱 판독을 처리하기 위한 명령을 실행하도록 구성될 수 있다. 추가의 실시형태에서, 컴퓨터 프로그램 제품은 대상체 또는 샘플 기록을 포함하는 데이터베이스(예를 들어, 특정 대상체 또는 샘플 또는 샘플 그룹에 관한 정보) 및 DNA의 의도된 게놈 편집 표적화된 영역 또는 비표적화된 게놈 영역에 관한 경험적으로-도출된 정보를 포함할 수 있다. 컴퓨터 프로그램 제품은, 컴퓨터에서 실행될 때, 본원에 개시된 방법의 단계를 수행하는 비일시적 컴퓨터 판독 가능한 매체에서 구현된다(예를 들어, 도 3-6 참조).
키트는 데이터(예를 들어, 시퀀싱 데이터, 보고, 다른 데이터)를 업로드하고 다운로드하기 위한 원격 서버(들)(클라우드-기반 서버를 포함)를 평가하기 위한 명령 및/또는 접근 코드/패스워드 등 또는 로컬 장치에 설치되는 소프트웨어를 추가로 포함할 수 있다. 모든 컴퓨터 작업은 원격 서버에 이루어지고, 인터넷 연결 등을 통해 사용자/키트 사용자에 의해 접근될 수 있다.
적용의 선택된 예
본원에 기재된 것처럼, 제공된 방법은 임의의 다양한 목적 및/또는 임의의 다양한 시나리오에 사용될 수 있다. 오직 특정 예시의 목적을 위해 비제한적인 적용 및/또는 시나리오의 기재된 예가 하기에 있다.
게놈 편집된 세포의 품질 평가
본 개시내용은 게놈 편집이 신생물 돌연변이를 유도하고/하거나 선택할 수 있다는 인식을 포함한다. 따라서, 본 개시내용은 조작된 게놈 편집 사건 후에 세포 집단의 신생물성 가능성을 평가하는 방법을 제공한다. 이러한 방법은 게놈 편집을 위한 품질 관리 분석에서 그리고/또는 게놈 편집을 겪은 세포-기반 치료의 안전성의 보장에서 유용하다.
본 개시내용은 게놈 편집 사건이 증가된 또는 하향조절된 세포 주기 돌연변이(예를 들어, 신생물 돌연변이)를 갖는 세포에 대한 바이어스를 선택적으로 부여할 수 있다는 인식을 포함한다. 따라서, 게놈 편집된 세포가 이의 신생물성 가능성에 대해 평가되고/되거나 모니터링되는 것이 중요하다.
일부 실시형태에서, 본 개시내용은 듀플렉스 시퀀싱 및 기준 게놈 서열과의 하나 이상의 관련성을 비교함으로써 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에 존재하는 변이체가 있는지를 결정하는 단계를 포함하는, 조작된 게놈 편집 사건 후에 세포 집단의 신생물성 가능성을 평가하는 방법을 제공한다. 일부 실시형태에서, 상기 방법은 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자를 포함하는 샘플로부터 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 제1 태그화 가닥 및 제2 태그화 가닥을 갖는 복수의 태그화된 DNA 분자를 생성하기 위해 복수의 이중-가닥 DNA 분자를 태그화하는 것을 포함하는 단계; 농후화된 태그화된 DNA 분자를 제공하기 위해 하나 이상의 암 유발자에 맵핑되는 태그화된 DNA 분자의 하위집단에 대해 제1 태그화 가닥 및 제2 태그화 가닥을 선택적으로 농후화하는 단계; 복수의 농후화된 태그화된 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계이되, 오류-정정된 서열 판독을 생성하는 단계는 제1 가닥 서열 및 제2 가닥 서열을 제공하기 위해 농후화된 태그화된 DNA 분자로부터 유래된 하나 이상의 제1 태그화 가닥 및 제2 태그화 가닥을 시퀀싱하는 것; 제1 가닥 서열과 제2 가닥 서열 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 및 제2 가닥 서열을 비교하는 것을 포함하는 단계; 및 기준 게놈 서열과의 하나 이상의 관련성을 비교함으로써 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에 존재하는 변이체가 있는지를 결정하는 단계를 포함한다.
기능적으로 파괴적인 돌연변이를 포함하는 하나 이상의 변이체의 검출이 특히 관심 있다. 일부 실시형태에서, 제공된 방법은 하나 이상의 암 유발자 유전자에서의 하나 이상의 변이체의 검출에 유용하다. 일부 실시형태에서, 암 유발자는 Cancer Gene Census(CGC) 또는 COSMIC 데이터베이스(암에 원인상 연루된 유전자)로부터의 공지된 암 유발자이다. 일부 실시형태에서, 암 유발자 유전자는 ABL, ACC, BCR, BLCA, BRCA, CESC, CHOL, COAD, DLBC, DNMT3A, EGFR, ESCA, GBM, HNSC, KICH, KIRC, KIRP, LAML, LGG, LIHC, LUAD, LUSC, MESO, OV, PAAD, PCPG, PI3K, PIK3CA, PRAD, PTEN, READ, SARC, SKCM, STAD, TGCT, THCA, THYM, UCEC, UCS, 및/또는 UVM이거나 이를 포함한다. 일부 실시형태에서, 암 유발자 유전자는 TP53이거나 이를 포함한다. 일부 실시형태에서, 암 유발자 유전자는 HRAS, NRAS 또는 KRAS이거나 이를 포함한다.
일부 실시형태에서, 변이체가 분자의 집단에서의 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에서 검출되면, 상기 방법은 복수의 농후화된 태그화된 DNA 분자 중에서 변이체의 변이 빈도를 결정하는 단계를 추가로 포함할 수 있다.
일부 실시형태에서, 제공된 방법은 하나 이상의 변이체의 빈도 및/또는 풍부도의 변화를 평가하기 위해 다수의 시점에서 수행된다. 일부 실시형태에서, 제공된 방법은 제1 시점에서 그리고 제2의 나중의 시점에서 수행된다. 일부 실시형태에서, 제2 시점은 제1 시점 후 적어도 2일, 3일, 4일, 5일, 6일, 7일, 10일, 15일, 20일, 30일, 60일, 90일 또는 180일이다. 일부 실시형태에서, 제1 시점 및 제2 시점 둘 다는 조작된 게놈 편집 사건 후에 약 30일 내, 약 45일 내, 약 60일 내, 약 75일 내 또는 약 90일 내이다. 다수의 시점에서의 분석은 신생물성 가능성 또는 신생물성 가능성의 증가를 평가하는 데 유용할 수 있다. 예를 들어, 제2 시점으로부터의 변이 빈도가 제1 시점으로부터의 변이 빈도보다 높으면 세포 집단이 신생물성 가능성을 갖는 것으로 결정된다. 일부 실시형태에서, 제공된 방법은 게놈 편집 사건을 겪은 세포 집단 및 게놈 편집 사건을 겪지 않는 달리 동일한 세포의 부분에 수행된다. 일부 실시형태에서, 제공된 방법은 편집된 세포 집단과 조작된 게놈 편집 사건을 겪지 않은 필적하는 세포 집단 사이의 변이 빈도를 평가하고 비교하는 단계를 포함한다.
세포 치료의 모니터링
게놈 편집된 세포는 다수의 분야에 사용될 수 있다. 예를 들어, 일부 실시형태에서, 의학 장애는 특정 면역 반응을 유발하는 게놈-편집된 면역 효과기 세포(예를 들어, T 세포)의 투여에 의해 치료된다. 일부 실시형태에서, 치료학적 분야에 사용하기 위한 세포는 게놈 편집 사건 후에 약 1일, 2일, 3일, 4일, 5일 이상 내에 벌크 집단으로서 생체외 일, 주 또는 기간 동안 증식할 수 있다. 일부 실시형태에서, 게놈 편집된 세포는 투여 후에 대상체로부터 얻어지고 분석될 수 있다. 예를 들어, 조작된 면역 세포의 경우에, 이러한 편집된 세포는 치료된 대상체의 혈액으로부터 얻어지고 본 개시내용의 방법을 사용하여 규명될 수 있다. 일부 실시형태에서, 세포 집단에서의 하나 이상의 변이체의 풍부도는 시간에 따라 모니터링된다. 일부 실시형태에서, 세포 집단에서의 하나 이상의 변이체의 클론 팽창은 시간에 따라 모니터링된다.
게놈 편집 후에 핵산의 규명을 위한 시스템 및 컴퓨팅 환경의 실시형태
적합한 컴퓨팅 환경
하기 논의는 적합한 컴퓨팅 환경의 일반 설명을 제공하고, 여기서 본 개시내용의 양태가 실행될 수 있다. 본 개시내용의 양태 및 실시형태는 컴퓨터-실행 가능한 명령, 예컨대 범용 컴퓨터, 예를 들어 서버 또는 개인용 컴퓨터에 의해 실행되는 루틴의 일반적인 상황에서 기재될 필요는 없지만 기재될 것이다. 당업자는 본 개시내용이 인터넷 어플라이언스, 휴대용 장치, 착용식 컴퓨터, 휴대폰 또는 이동 전화, 멀티-프로세서 시스템, 마이크로프로세서-기반 또는 프로그래밍 가능한 소비자 전자용품, 셋톱 박스, 네트워크 PC, 미니-컴퓨터, 메인프레임 컴퓨터 등을 포함하는 다른 컴퓨터 시스템 구성과 실행될 수 있다는 것을 이해할 것이다. 본 개시내용은 하기 자세히 설명되는 하나 이상의 컴퓨터-실행 가능한 명령을 수행하도록 특별히 프로그래밍되거나 구성되거나 구축된 특수 목적 컴퓨터 또는 데이터 프로세서에서 구현될 수 있다. 실제로, 본원에서 일반적으로 사용된 바와 같은 용어 "컴퓨터"는 임의의 상기 장치, 및 임의의 데이터 프로세서를 지칭한다.
본 개시내용은 근거리 통신망("LAN")(Local Area Network), 광역 통신망("WAN")(Wide Area Network) 또는 인터넷과 같은 통신 네트워크를 통해 연결된 원격 프로세싱 장치에 의해 작업 또는 모듈이 수행되는 분산 컴퓨팅 환경에서 또한 실행될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈 또는 하위루틴은 근거리 및 원격 기억 저장 장치 둘 다에 위치할 수 있다. 하기에 기술된 본 개시내용의 양태는 자기 및 광학 판독 가능하고 제거 가능한 컴퓨터 디스크를 포함하는 컴퓨터 판독 가능한 매체에 저장되거나 분산되고, 칩(예를 들어, EEPROM 칩)에서 펌웨어로 저장될 뿐만 아니라, 인터넷 또는 다른 네트워크(무선 네트워크를 포함)에 전자로 분산될 수 있다. 당업자는 본 개시내용의 부분이 서버 컴퓨터에 있을 수 있지만, 상응하는 부분이 클라이언트 컴퓨터에 있다는 것을 인식할 것이다. 본 개시내용의 양태에 특정한 데이터 구조 및 데이터의 전송은 또한 본 개시내용의 범위 내에 포괄된다.
개인용 컴퓨터 또는 워크스테이션과 같은 컴퓨터의 실시형태는 하나 이상의 사용자 입력 장치 및 데이터 저장 장치에 연결된 하나 이상의 프로세서를 포함할 수 있다. 컴퓨터는 또한 적어도 하나의 출력 장치, 예컨대 디스플레이 장치 및 하나 이상의 선택적인 추가 출력 장치(예를 들어, 프린터, 플로터, 스피커, 촉각 또는 후각 출력 장치 등)에 연결될 수 있다. 컴퓨터는 예컨대 선택적인 네트워크 연결, 무선 트랜시버 또는 둘 다를 통해 외부 컴퓨터에 연결될 수 있다.
다양한 입력 장치는 키보드 및/또는 포인팅 장치, 예컨대 마우스를 포함할 수 있다. 다른 입력 장치, 예컨대 마이크로폰, 조이스틱, 펜, 터치 스크린, 스캐너, 디지털 카메라, 비디오 카메라 등이 가능하다. 추가의 입력 장치는 시퀀싱 기계(들)(예를 들어, 대량 병렬 시퀀서), 형광투시경 및 다른 실험실 설비 등을 포함할 수 있다. 적합한 데이터 저장 장치는 컴퓨터에 의해 접근 가능한 데이터를 저장할 수 있는 임의의 유형의 컴퓨터 판독 가능한 매체, 예컨대 자기 하드 및 플로피 디스크 드라이브, 광학 디스크 드라이브, 자기 카세트, 테이프 드라이브, 플래시 메모리 카드, 디지털 비디오 디스크(DVD: digital video disk), 베르누이 카트리지(Bernoulli cartridge), RAM, ROM, 스마트 카드 등을 포함할 수 있다. 실제로, 근거리 통신망(LAN), 광역 통신망(WAN) 또는 인터넷과 같은 네트워크에 대한 연결 포트 또는 이것 위의 노드를 포함하는 컴퓨터 판독 가능한 명령 및 데이터를 저장하거나 전송하기 위한 임의의 매체를 사용할 수 있다.
본 개시내용의 양태는 다양한 다른 컴퓨팅 환경에서 실행될 수 있다. 예를 들어, 네트워크 인터페이스를 갖는 분산된 컴퓨팅 환경은 시스템에서 하나 이상의 사용자 컴퓨터를 포함할 수 있고, 이 시스템에서 이들은 컴퓨터가 인터넷의 월드 와이드 웹(World Wide Web) 부분 내의 웹 사이트를 포함하는 인터넷에 접근하고 인터넷과 데이터를 교환하게 하는 브라우저 프로그램 모듈을 포함할 수 있다. 사용자 컴퓨터는 운영 시스템, 하나 이상의 어플리케이션 프로그램(예를 들어, 워드 프로세싱 또는 스프레드 시트 어플리케이션) 등과 같은 다른 프로그램 모듈을 포함할 수 있다. 컴퓨터는 다양한 유형의 어플리케이션을 실행하도록 프로그래밍될 수 있는 범용 장치일 수 있거나, 특정 기능 또는 기능 종류로 최적화되거나 제한된 단일 목적 장치일 수 있다. 보다 중요하게는, 네트워크 브라우저와 기재되어 있지만, 사용자에게 그래픽 사용자 인터페이스를 제공하기 위한 임의의 어플리케이션 프로그램을 하기 자세히 기재된 것처럼 사용할 수 있고; 웹 브라우저 및 웹 인터페이스의 사용은 여기서 친숙한 예로서 오직 사용된다.
인터넷 또는 월드 와이드 웹("웹(Web)")에 연결된 적어도 하나의 서버 컴퓨터는 본원에 기재된 웹 페이지, 데이터 스트림, 오디오 신호 및 전자 영상과 같은 전자 메시지를 수신하고 라우팅하고 저장하기 위한 더 많은 또는 모든 기능을 수행할 수 있다. 인터넷이 기재되어 있지만, 인터넷과 같은 전용 네트워크가 일부 어플리케이션에서 사실 바람직할 수 있다. 네트워크는 클라이언트-서버 구성을 가질 수 있고, 여기서 컴퓨터는 다른 클라이언트 컴퓨터의 서빙에 전용이거나, 피어투피어식(peer-to-peer)과 같은 다른 구성을 가질 수 있고, 여기서 하나 이상의 컴퓨터는 서버 및 클라이언트로서 동시에 작용한다. 서버 컴퓨터(들)에 연결된 데이터베이스 또는 데이터베이스들은 더 많은 웹 페이지를 저장하고, 사용자 컴퓨터 사이에 컨텐츠 교환될 수 있다. 데이터베이스(들)를 포함하는 서버 컴퓨터(들)는 시스템에서 악성 공격을 저해하고 여기에 저장된 메시지 및 데이터의 통합성을 보존하기 위한 보안 조치(예를 들어, 방화벽 시스템, 보안 소켓 계층(SSL: secure socket layer), 패스워드 보호 체계, 부호 매김 등)를 사용할 수 있다.
적합한 서버 컴퓨터는 다른 특징들 중에서 서버 엔진, 웹 페이지 관리 구성성분, 컨텐츠 관리 구성성분 및 데이터베이스 관리 구성성분을 포함할 수 있다. 서버 엔진은 기본 프로세싱 및 운영 시스템 수준 작업을 수행한다. 웹 페이지 관리 구성성분은 웹 페이지의 생성 및 디스플레이 또는 라우팅을 다룬다. 사용자는 서버 컴퓨터와 연관된 URL에 의해 서버 컴퓨터에 접근할 수 있다. 컨텐츠 관리 구성성분은 본원에 기재된 실시형태에서 대부분의 기능을 다룬다. 데이터베이스 관리 구성성분은 데이터베이스와 관련한 저장 및 검색 작업, 데이터베이스에 대한 쿼리, 데이터베이스에 대한 리드 및 라이트 기능 및 비디오, 그래픽 및 오디오 신호와 같은 데이터의 저장을 포함한다.
본원에 기재된 많은 기능적 유닛은 보다 구체적으로 이의 실행 독립성을 강조하기 위해 모듈로서 표지되었다. 예를 들어, 모듈은 다양한 유형의 프로세서에 의한 실행을 위해 소프트웨어에서 실행될 수 있다. 실행 가능한 코드의 확인된 모듈은 예를 들어 객체, 절차 또는 함수로 체계화될 수 있는 예를 들어 컴퓨터 명령의 하나 이상의 물리적 블록 또는 논리적 블록을 포함할 수 있다. 컴퓨터 명령의 확인된 블록은 물리적으로 함께 배치될 필요는 없고, 논리적으로 함께 연결될 때 모듈을 포함하고 모듈에 대한 기술된 목적을 달성하는, 상이한 위치에 저장된 별개의 명령을 포함할 수 있다.
모듈은 또한 커스텀 VLSI 회로 또는 게이트 어레이, 재고품 반도체, 예컨대 로직 칩, 트랜지스터 또는 다른 별개의 성분을 포함하는 하드웨어 회로로서 실행될 수 있다. 모듈은 또한 필드 프로그래밍 가능한 게이트 어레이, 프로그래밍 가능한 어레이 로직, 프로그래밍 가능한 로직 장치 등과 같은 프로그래밍 가능한 하드웨어 장치에서 실행될 수 있다.
실행 가능한 코드의 모듈은 단일 명령 또는 많은 명령일 수 있고, 몇몇 메모리 장치에 걸쳐 상이한 프로그램들 중에서 몇몇 상이한 코드 세그먼트 위로 심지어 분포될 수 있다. 유사하게, 운영 데이터는 모듈 내에서 본원에서 확인되고 예시될 수 있고, 임의의 적합한 형태로 구현되고 임의의 적합한 유형의 데이터 구조 내에 체계화될 수 있다. 운영 데이터는 단일 데이터세트로서 수집될 수 있거나, 상이한 저장 장치를 포함하여 상이한 위치 위로 분포될 수 있고, 적어도 부분적으로 시스템 또는 네트워크에서 단순히 전자 신호로 존재할 수 있다.
게놈 편집 및 클론 확장 특성화 시스템
본 기술은 핵산 혼합물을 포함하는 생물학적 샘플을 가공하고, 샘플의 오류-정정된 서열 판독(예를 들어, 듀플렉스 서열 판독, 듀플렉스 공통 서열 등), 의도 된 게놈 유전자좌에서의 서열 판독, 의도하지 않은 유전자성 유전자좌에서의 서열 판독, 암 유발 유전자좌에서의 서열 판독, 예상 서열, 예상 게놈 편집 서열, 참조 서열, 변이체 확인, 변이 빈도, 개별/기여 가능한 유전자형의 정량화 등을 결정하기 위해 유선 또는 무선 네트워크를 통해 시퀀싱 데이터를 서버에 전송하기 위한 시스템(예를 들어, 네트워킹 컴퓨터 시스템, 고속 자동화 시스템 등)을 추가로 포함한다.
하기 추가로 자세히 기재된 것처럼, 도 2에 예시된 실시형태와 관련하여, 세포 집단의 게놈 편집 후 핵산의 규명을 위한 컴퓨터화 시스템은 (1) 서버(예를 들어, 원격 서버 또는 국소 저장 서버); (2) 시퀀싱 데이터를 생성하고/하거나 전송할 수 있는 복수의 사용자 전자 컴퓨팅 장치; (3) 선택적으로, 기준 서열 (예 : 예상 게놈 서열, 예상 게놈 편집 서열 등) 및 연관 정보 (선택사항)가있는 데이터베이스; 및 (4) 전자 컴퓨팅 장치, 데이터베이스와 서버 간의 전자 통신을 전송하기 위한 유선 또는 무선 네트워크를 포함한다. 서버는 (a) 게놈 편집 기록 결과, 및 변이체 프로필(예를 들어, 돌연변이 프로필, 변이 빈도 결과 등)의 기록을 저장하기 위한 데이터베이스; (b) 메모리에 통신으로 연결된 하나 이상의 프로세서; 및 프로세서(들)에 대한 명령을 포함하는 하나 이상의 비일시적 컴퓨터-판독 가능한 저장 장치 또는 매체를 추가로 포함하고, 여기서 상기 프로세서는 도 3 내지 도 6에 기재된 단계 중 하나 이상을 포함하는 연산을 수행하기 위해 상기 명령을 실행하도록 구성된다.
일 실시형태에서, 본 기술내용은, 하나 이상의 프로세서에 의해 실행될 때, 하나 이상의 의도된 게놈 유전좌위에서의 기대된 게놈 편집된 서열의 존재, 하나 이상의 의도된 게놈 유전좌위에서의 원치 않는 게놈 편집된 서열의 존재, 하나 이상의 의도되지 않은 게놈 유전좌위에서의 원치 않는 게놈 편집된 서열의 존재, 암 유발자 또는 비암 유발자 유전좌위에서의 하나 이상의 변이체의 존재, 집단 중에서 의도된 게놈 유전좌위에서의 온-타깃 게놈 변경의 빈도, 하나 이상의 의도되지 않은 게놈 유전좌위에서의 오프-타깃 게놈 변경의 빈도, 핵산 혼합물에 존재하는 하나 이상의 변이체의 변이 빈도, 게놈 편집 사건 후에 시간에 걸쳐 혼합물에서의 각각의 변이체의 정량화 등을 결정하기 위한 방법을 수행하는 명령을 포함하는 비일시적 컴퓨터-판독 가능한 저장 매체를 추가로 포함한다. 특정 실시형태에서, 상기 방법은 도 3-6에 기재된 단계 중 하나 이상을 포함할 수 있다.
본 기술내용의 추가의 양태는 하나 이상의 의도된 게놈 유전좌위에서의 기대된 게놈 편집된 서열의 존재, 하나 이상의 의도된 게놈 유전좌위에서의 원치 않는 게놈 편집된 서열의 존재, 하나 이상의 의도되지 않은 게놈 유전좌위에서의 원치 않는 게놈 편집된 서열의 존재, 암 유발자 또는 비암 유발자 유전좌위에서의 하나 이상의 변이체의 존재, 집단 중에서 의도된 게놈 유전좌위에서의 온-타깃 게놈 변경의 빈도, 하나 이상의 의도되지 않은 게놈 유전좌위에서의 오프-타깃 게놈 변경의 빈도, 핵산 혼합물에 존재하는 하나 이상의 변이체의 변이 빈도, 게놈 편집 사건 후에 시간에 걸쳐 혼합물에서의 각각의 변이체의 정량화 등을 결정하기 위한 컴퓨터화 방법에 관한 것이다. 특정 실시형태에서, 상기 방법은 도 3-6에 기재된 단계 중 하나 이상을 포함할 수 있다.
2는 세포 집단의 게놈 편집 후에 핵산을 규명하기 위해 본원에 개시된 방법과 사용하기 위한 컴퓨터 프로그램 제품(250)이 설치된 컴퓨터 시스템(400)의 블록 다이어그램이다. 도 2가 다양한 컴퓨팅 시스템 성분을 예시하지만, 당업자에게 공지된 다른 또는 상이한 구성성분, 예컨대 상기 기재된 것이 본 개시내용의 양태가 실행될 수 있는 적합한 컴퓨팅 환경을 제공할 수 있다고 고려된다. 도 3은 본 기술내용의 일부 실시형태에 따라 듀플렉스 시퀀싱 공통 서열 데이터를 제공하기 위한 예시적인 루틴을 예시하는 흐름 다이어그램이다. 도 4-6은 게놈 편집된 세포 집단으로부터 기원한 핵산으로부터 게놈 편집 사건 후에 세포 집단에서의 세포의 게놈 변경(예를 들어, 지시된 게놈 변경, 변이체, 돌연변이 등) 및 클론 팽창을 확인하고/하거나 정량화하기 위한 다양한 루틴을 예시하는 흐름 다이어그램이다. 본 기술내용의 양태에 따르면, 도 4-6과 관련하여 기재된 방법은, 샘플에 존재하는 정확한/원하는 게놈 편집된 서열, 샘플에 존재하는 부정확한/원치 않는 게놈 편집된 서열, 샘플에 존재하는 게놈의 의도되지 않은 영역에서의 원치 않는 게놈 편집된 서열, 샘플에 존재하는 성장 이점 또는 바이어스를 부여하는 암 유발자에서의 변이체, 샘플에 존재하는 예상치 못한 및/또는 원치 않는 변이 빈도, 샘플 내의 변이체 및/또는 게놈 편집의 정량화, 및 샘플 데이터와 기준 서열의 데이터세트의 비교로부터 도출된 정보(기대된 게놈 편집된 서열, 예상된 서열, 변이 빈도의 배경 수준 등을 포함하는 데이터베이스를 포함)를 포함하는, 게놈 편집 후에 예를 들어 세포 집단의 유전자 프로필을 포함하는 샘플 데이터를 제공할 수 있다.
2에 예시된 것처럼, 컴퓨터 시스템(200)은 복수의 사용자 컴퓨팅 장치(202, 204); 유선 또는 무선 네트워크(210) 및 게놈 편집된 서열을 분석하고 게놈 편집 사건 후 세포 집단으로부터 유래된 핵산을 규명하기 위한 프로세서를 포함하는 서버("DupSeq™" 서버)(240)를 포함할 수 있다. 실시형태에서, 사용자 컴퓨팅 장치(202, 204)는 시퀀싱 데이터를 생성하고/하거나 전송하도록 사용될 수 있다. 일 실시형태에서, 컴퓨팅 장치(202, 204)의 사용자는 세포 집단의 게놈 편집 후 핵산을 규명하기 위한 생물학적 샘플의 듀플렉스 시퀀싱 방법 단계와 같은 본 기술내용의 다른 양태를 수행하기 위한 것일 수 있다. 일례에서, 컴퓨팅 장치(202, 204)의 사용자는 생물학적 샘플을 질의하기 위해, 본 기술내용의 실시형태에 따른, 시약 및/또는 어댑터를 포함하는 키트(1, 2)에 의한 소정의 듀플렉스 시퀀싱 방법 단계를 함유한다.
예시된 것처럼, 각각의 사용자 컴퓨팅 장치(202, 204)는 적어도 하나의 중앙 처리 장치(206), 메모리(207) 및 사용자 및 네트워크 인터페이스(208)를 포함한다. 일 실시형태에서, 사용자 장치(202, 204)는 데스크탑, 랩탑 또는 태블릿 컴퓨터를 포함한다.
2개의 사용자 컴퓨팅 장치(202, 204)가 도시되어 도시되어 있지만, 임의의 수의 사용자 컴퓨팅 장치가 시스템(200)의 다른 구성성분에 포함되거나 연결될 수 있음이 고려된다. 추가로, 컴퓨팅 장치(202, 204)는 또한 샘플을 증폭시키고 시퀀싱하기 위해 사용자(1) 및 사용자(2)에 의해 사용되는 복수의 장치 및 소프트웨어을 대표할 수 있다. 예를 들어, 컴퓨팅 장치는 시퀀싱 기계(예를 들어, Illumina HiSeq™, Ion Torrent™ PGM, ABI SOLiD™ 서열분석기, PacBio RS, Helico Heliscope™ 등), 실시간 PCR 기계(예를 들어, ABI 7900, Fluidigm BioMark™ 등), 마이크로어레이 기구 등일 수 있다.
상기 기재된 구성성분 이외에, 시스템(200)은 기준 서열 및 연관된 정보를 포함하는 게놈 편집 프로필(232)을 저장하기 위한 데이터베이스(230)를 추가로 포함할 수 있다. 예를 들어, 서버(240)에 의해 접근 가능할 수 있는 데이터베이스(230)는 예상된 게놈 서열, 기대된 게놈 편집된 서열, 공지된 암 유발자 돌연변이, 게놈 돌연변이성 핫스팟 또는 돌연변이-민감 부위, 공지된 미세부수체 유전좌위, 상동성 서열의 공지된 영역, 배경 변이 빈도 수준, 출발 재료(예를 들어, 세포의 혼합물)의 공지된 유전자형 프로필 등의 기록 또는 집합을 포함할 수 있다. 특정 예에서, 데이터베이스(230)는 기준 서열 및 연관된 정보를 포함하는 게놈 편집 프로필(232)을 포함하는 제3자 데이터베이스일 수 있다. 예를 들어, 게놈 기준 서열, 건강한(예를 들어, 비이환된 또는 돌연변이된) 생물학적 원천으로부터의 게놈 서열, 암 유발자의 서열, 암 유발자 돌연변이의 카탈로그 및 서열 상동성의 영역을 포함하는 다양한 데이터베이스는 특정 분야에 질의될 수 있다. 다른 실시형태에서, 데이터베이스는 서버(240)로부터 독립적으로 호스팅된 독립형 데이터베이스(230)(개인용 또는 비개인용)일 수 있거나, 예상된 게놈 서열 및 변이체 프로필을 포함하는 경험적으로-도출된 게놈 편집 프로필(272)을 포함하는 데이터베이스(270)와 같은 데이터베이스는 서버(240)에 호스팅될 수 있다. 일부 실시형태에서, 상기 시스템(200)이 하나 이상의 세포 집단으로부터 새로운 게놈 편집 프로필을 생성하도록 사용되므로, 상기 시스템(200)의 사용으로부터 생성된 데이터 및 연관된 방법(예를 들어, 본원에 그리고 예를 들어 도 3-6에 기재된 방법)은 추가의 게놈 편집 프로필(232, 272)이 미래의 비교 활동을 위해 생성될 수 있도록 데이터베이스(230 및/또는 270)에 업로딩될 수 있다.
서버(240)는 네트워크(210)를 통해 사용자 컴퓨팅 장치(202, 204)로부터 시퀀싱 데이터(예를 들어, 원시 시퀀싱 파일) 및 관련된 정보를 수신하고 컴퓨팅하고 분석하도록 구성될 수 있다. 샘플-특이적 원시 시퀀싱 데이터는 장치(202, 204)에 설치되거나 네트워크(210)를 통해 원격 서버(240)로부터 접근 가능한 컴퓨터 프로그램 제품/모듈(서열 모듈(205))을 사용하여, 또는 당해 분야에서 잘 알려진 다른 시퀀싱 소프트웨어를 사용하여 근거리에서 컴퓨팅될 수 있다. 이후, 원시 서열 데이터는 네트워크(210)를 통해 원격 서버(240)로 전송될 수 있고, 사용자 결과(274)는 데이터베이스(270)에 저장될 수 있다. 서버(240)는 또한 데이터베이스(270)로부터 원시 시퀀싱 데이터를 수신하도록 구성되고, 예를 들어 본원에 개시된 듀플렉스 시퀀싱 기법을 사용하여 오류 정정된 이중-가닥 서열 리드를 컴퓨터 사용하여 생성하도록 구성된 프로그램 제품/모듈 "DS 모듈"(212)을 포함한다. 서버(240)에 DS 모듈(212)이 도시되어 있지만, 당업자는 DS 모듈(212)이 대안적으로 장치(202, 204)에서 조작되어 호스팅되거나 다른 원격 서버(비도시)에서 호스팅될 수 있다는 것을 인식할 것이다.
원격 서버(240)는 적어도 하나의 중앙 처리 장치(CPU: central processing unit)(260), 사용자 및 네트워크 인터페이스(262)(또는 인터페이스가 서버에 연결된 서버-전용 컴퓨팅 장치), 상기에 기재된 것과 같은 데이터베이스(270)와 게놈 편집 프로파일(272)을 저장하기 위한 복수의 컴퓨터 파일/기록, 및 시험된 샘플에 대한 결과(예를 들어, 원시 시퀀싱 데이터, 듀플렉스 시퀀싱 데이터, 의도된 게놈 유전자좌 분석, 의도되지 않은 게놈 유전자좌 분석, 변이체 분석, 변이 빈도 분석 등)(274)를 저장하기 위한 파일/기록을 포함할 수 있다. 서버(240)는 본 기술내용의 양태에 따라 게놈 편집 컴퓨터 프로그램 제품(Genome Editing Genotype Computer Program Product)(게놈 편집 모듈)(250)이 저장되는 저장된 컴퓨터 메모리(211)를 추가로 포함한다.
컴퓨터 프로그램 제품/모듈(250)은, 컴퓨터(예를 들어, 서버(240))에서 실행될 때, 세포 집단의 게놈 편집 후에 핵산의 규명을 위해 본원에 개시된 방법의 단계(예를 들어, 게놈 변경의 검출 및 확인, 배경 변이체의 검출 및 확인, 게놈 편집 사건 후에 클론 팽창의 검출 및 확인, 및/또는 이들의 정량화)를 수행하는 비일시적 컴퓨터 판독 가능한 매체에서 구현된다. 본 개시내용의 다른 양태는 프로세서가 게놈 편집 분석을 수행하는 것(예를 들어, 의도된 게놈 유전좌위 및 의도되지 않은 게놈 유전좌위에서의 게놈 변경을 규명하는 것, 게놈 편집 사건 후에 게놈에 대한 원하는 변경 및 원치 않는 변경을 정량화하는 것, 변이체를 확인하는 것, 확인된 변이체를 정량화하는 것, 세포 집단, 게놈 편집 비교 보고 등 내에 변이 빈도를 결정하는 것)이 가능하게 하도록 컴퓨터-판독 가능한 프로그램 코드 또는 여기서 구현된 명령을 갖는 비일시적 컴퓨터-사용 가능한 매체를 포함하는 컴퓨터 프로그램 제품/모듈(250)을 포함한다. 이 컴퓨터 프로그램 명령은 기계를 제조하기 위해 컴퓨터 또는 다른 프로그래밍 가능한 장치에 로딩될 수 있어서, 컴퓨터 또는 다른 프로그래밍 가능한 장치에서 실행하는 명령은 본원에 기재된 기능 또는 단계를 실행하기 위한 수단을 생성한다. 이 컴퓨터 프로그램 명령은 또한 컴퓨터 또는 다른 프로그래밍 가능한 장치가 특정 방식으로 작용하도록 지시할 수 있는 컴퓨터 판독 가능한 메모리 또는 매체에 저장될 수 있어서, 컴퓨터 판독 가능한 메모리 또는 매체에 저장된 명령은 분석을 실행하는 지시 수단을 포함하는 제조 물품을 제조한다. 컴퓨터 프로그램 명령은 또한 일련의 연산 단계가 컴퓨터 또는 다른 프로그래밍 가능한 장치에서 수행되게 하여 컴퓨터 실행된 프로세스를 생성시키는 컴퓨터 또는 다른 프로그래밍 가능한 장치에 로딩될 수 있어서, 컴퓨터 또는 다른 프로그래밍 가능한 장치에서 실행하는 명령은 상기에 기재된 기능 또는 단계를 실행하기 위한 단계를 제공한다.
더욱이, 컴퓨터 프로그램 제품/모듈(250)은 임의의 적합한 언어 및/또는 브라우저에서 실행될 수 있다. 예를 들어, 이것은 바람직하게는 Visual Basic, SmallTalk, C++ 등과 같은 객체-지향 고수준 프로그래밍 언어를 사용하여 Python, C 언어로 실행될 수 있다. 어플리케이션은 Windows™ 98, Windows™ 2000, Windows™ NT 등을 포함하는 Microsoft Windows™ 환경과 같은 환경에 맞도록 쓰여질 수 있다. 또한, 어플리케이션은 MacIntosh™, SUN™, UNIX 또는 LINUX 환경에 대해 또한 쓰여질 수 있다. 또한, 기능적 단계는 범용 또는 플랫폼-독립적 프로그래밍 언어를 사용하여 또한 실행될 수 있다. 이러한 멀티-플랫폼 프로그래밍 언어의 예는 하이퍼텍스트 마크업 언어(HTML: hypertext markup language), JAVA™, JavaScript™, 플래시 프로그래밍 언어, 공통 게이트웨이 인터페이스/구조화 질의 언어(CGI/SQL: common gateway interface/structured query language), 실용적인 추출 및 보고 언어(PERL: practical extraction report language), AppleScript™ 및 다른 시스템 스크립트 언어, 프로그래밍 언어/구조화 질의 언어(PL/SQL: programming language/structured query language) 등을 포함하지만, 이들로 제한되지는 않는다. HotJava™, Microsoft™ Explorer™ 또는 Netscape™과 같은 Java™- 또는 JavaScript™-지원 브라우저를 사용할 수 있다. 액티브 컨텐츠 웹 페이지가 사용될 때, 이것은 Java™ 애플릿 또는 ActiveX™ 컨트롤 또는 다른 액티브 컨텐츠 기술을 포함할 수 있다.
이 시스템은 다수의 루틴을 호출한다. 일부 루틴이 본원에 기재되어 있지만, 당업자는 이 시스템이 수행하는 다른 루틴을 확인할 수 있다. 게다가, 본원에 기재된 루틴은 다양한 방식으로 변경될 수 있다. 일례로서, 예시된 로직의 순서가 재배열될 수 있고, 하위단계는 병렬로 수행될 수 있고, 예시된 로직은 생략될 수 있고, 다른 로직이 포함될 수 있고, 기타 등등이다.
3은 샘플(예를 들어, 생물학적 혼합물로부터의 샘플)에서 이중-가닥 핵산 분자에 대한 듀플렉스 시퀀싱 데이터를 제공하기 위한 루틴(300)을 예시하는 흐름 다이어그램이다. 루틴 (300)은 컴퓨터 네트워크에 연결된 클라이언트 컴퓨터 또는 서버 컴퓨터와 같은 컴퓨팅 장치에 의해 호출될 수 있다. 일 실시형태에서, 컴퓨팅 장치는 서열 데이터 생성장치 및/또는 서열 모듈을 포함한다. 일례로서, 컴퓨팅 장치는 운영자가 컴퓨팅 장치와 통신하는 사용자 인터페이스를 연동시킨 후 루틴 (300)을 호출할 수 있다.
루틴(300)은 블록 (302)에서 시작하고, 서열 모듈은 사용자 컴퓨팅 장치로부터 원시 서열 데이터를 수신(블록 304)하고, 샘플에서 복수의 핵산 분자로부터 도출된 복수의 원시 서열 리드를 포함하는 샘플-특정 데이터세트를 생성(블록 306)한다. 일부 실시형태에서, 서버는 차후의 프로세싱을 위해 데이터베이스에서 샘플-특정 데이터세트를 저장할 수 있다. 다음에, DS 모듈은 샘플-특정 데이터세트에서 원시 서열 데이터로부터 듀플렉스 공통 시퀀싱(Duplex Consensus Sequencing) 데이터를 생성하기 위한 요청을 수신(블록 308)한다. DS 모듈은 (예를 들어, SMI 서열에 기초하여) 원래의 이중-가닥 핵산 분자를 나타내는 패밀로부터 서열 리드를 그룹화하고, 개별 가닥으로부터의 대표적인 서열을 서로 비교(블록 310)한다. 일 실시형태에서, 대표적인 서열은 각각의 원래의 핵산 분자로부터의 하나 또는 하나 초과의 서열 리드일 수 있다. 다른 실시형태에서, 대표적인 서열은 대표적인 가닥 내의 정렬 및 오류-보정으로부터 생성된 단일-가닥 공통 서열(SSCS)일 수 있다. 이러한 실시형태에서, 제1 가닥으로부터의 SSCS는 제2 가닥으로부터의 SSCS와 비교될 수 있다.
블록 (312)에서, DS 모듈은 비교된 대표적인 가닥들 사이에 상보성의 뉴클레오타이드 위치를 확인한다. 예를 들어, DS 모듈은 뉴클레오타이드 염기 콜이 동의하는 비교된(예를 들어, 정렬된) 서열 리드를 따라 뉴클레오타이드 위치를 확인한다. 추가적으로, DS 모듈은 비교된 대표적인 가닥들 사이에 비상보성의 위치를 확인(블록 314)한다. 따라서, DS 모듈은 뉴클레오타이드 염기 콜이 동의하지 않는 비교된(예를 들어, 정렬된) 서열 리드를 따라 뉴클레오타이드 위치를 확인할 수 있다.
다음에, DS 모듈은 샘플에서 이중-가닥 핵산 분자에 대한 듀플렉스 시퀀싱 데이터를 제공(블록 316)할 수 있다. 이러한 데이터는 각각의 처리된 서열 리드에 대한 듀플렉스 공통 서열의 형태일 수 있다. 듀플렉스 공통 서열은 일 실시형태에서 원래의 핵산 분자의 각각의 가닥으로부터 대표적인 서열이 동의하는 뉴클레오타이드 위치만을 포함할 수 있다. 따라서, 일 실시형태에서, 비동의의 위치는 제거되거나 그렇지 않으면 무시될 수 있어서, 듀플렉스 공통 서열은 오류-보정된 고정확성 서열 리드이다. 다른 실시형태에서, 듀플렉스 시퀀싱 데이터는 (예를 들어, DNA 손상이 평가될 수 있는 경우에) 비동의의 뉴클레오타이드 위치가 추가로 분석될 수 있도록 이러한 위치에서 리포팅 정보를 포함할 수 있다. 이후, 루틴 (300)은 블록 (318)에 계속 이어질 수 있고, 여기서 이것은 종료한다.
4는 세포 집단에서 게놈 편집 사건으로부터 생긴 의도된 게놈 유전좌위에서의 편집된 서열을 검출하고 확인하기 위한 루틴(400)을 예시하는 흐름 다이어그램이다. 루틴(400)은 도 2의 컴퓨팅 장치에 의해 호출될 수 있다. 루틴(400)은 블록(402)에서 시작하고, 게놈 편집 모듈은 (예를 들어, 블록 316 후에) 도 3으로부터의 듀플렉스 시퀀싱 데이터를 기준 서열 정보과 비교(블록 404)하고, 의도된 게놈 유전좌위에서의 서열 관련성 및/또는 변이(예를 들어, 여기서 대상 서열이 기준 서열에 상응하고, 대상 서열은 기대된 게놈 편집된 서열과 상응하고, 대상 서열은 기준 서열 등으로부터 변함)를 확인(블록 406)한다. 예를 들어, 기준 서열은 기대된 게놈 서열(예를 들어, 원하는 조작된 게놈 편집된 서열을 포함)일 수 있고, 비교 단계는 대상 서열이 기대된 게놈 서열을 포함하는지를 확인할 수 있다. 다른 예에서, 기준 서열은 비편집된 게놈 서열을 포함할 수 있고, 비교 단계는 대상 서열이 편집되지 않은 게놈 서열로부터 변이를 포함하는지를 확인할 수 있다.
다음에, 게놈 편집 모듈은 대상 서열의 집단 중에서 기대된 게놈 편집된 서열의 빈도를 결정(블록 408)하고, 샘플에 대한 게놈 편집된 스펙트럼을 생성(블록 410)한다. 그러므로, 게놈 편집된 세포 집단 분석은 샘플로부터 분석된 핵산 분자에서 각각의 편입 사건의 게놈 편집(들)의 유형(예를 들어, 원하는, 원치 않는 또는 무의 게놈 편집), (각각의 의도된 게놈 유전좌위 내의) 위치 및 빈도에 관한 정보가 제공될 수 있다. 선택적으로, 게놈 편집 모듈은 게놈 편집 사건의 성공률을 산출(블록 412)하고, 추가로 선택적으로 미래의 게놈 편집 사건의 성공률을 증가시키기 위한 정보를 제공(비기재)할 수 있다.
다음에, 게놈 편집 모듈은 데이터베이스에서 샘플-특이적 데이터세트에 저장될 수 있는 게놈 편집 데이터를 제공(블록 414)할 수 있다. 비도시되어 있는 일부 실시형태에서, 게놈 편집 데이터는 미래의 비교 활동을 위해 데이터베이스에 저장될 게놈 편집 프로필을 생성하도록 사용될 수 있다. 이후, 루틴(400)은 블록(416)에 이어질 수 있고, 여기서 이것은 종료한다.
5는 세포 집단에서 게놈 편집 사건으로부터 생긴 의도되지 않은 게놈 유전좌위에서의 편집된 서열을 검출하고 확인하기 위한 루틴(500)을 예시하는 흐름 다이어그램이다. 루틴(500)은 도 2의 컴퓨팅 장치에 의해 호출될 수 있다. 루틴(500)은 블록(502)에서 시작하고, 게놈 편집 모듈은 (예를 들어, 블록(316) 후에) 도 3으로부터의 듀플렉스 시퀀싱 데이터를 기준 서열 정보과 비교(블록 504)하고, 의도되지 않은 게놈 유전좌위에서 서열 관련성 및/또는 변이(예를 들어, 여기서 대상 서열은 기준 서열과 상응하고, 대상 서열은 기준 서열 등으로부터 변함)를 확인(블록 506)한다. 예를 들어, 의도되지 않은 유전좌위는 돌연변이-민감 부위, 미세부수체 유전좌위, 의도된 게놈 유전좌위와 서열 상동성을 갖는 서열, 및/또는 암 유발자 중 하나 이상을 포함할 수 있고, 비교 단계는 대상 서열이 기준 서열(예를 들어, 비편집된 게놈 서열)의 변경 또는 변이체를 포함하는지를 확인할 수 있다.
결정 블록(508)에서, 루틴(500)은 대상 서열이 게놈 편집 사건 후에 의도되지 않은 유전좌위에서 변이체를 포함하는지를 결정한다. 의도되지 않은 게놈 유전좌위가 변이체를 포함하면, 게놈 편집 모듈은 변이 빈도를 결정(블록 510)한다. 의도되지 않은 게놈 유전좌위가 변이체를 포함하지 않으면, 게놈 편집 모듈은 추가의 의도되지 않은 게놈 유전좌위를 평가할 수 있다(결정 블록(508)은 모든 의도되지 않은 게놈 유전좌위가 평가될 때까지 반복한다). 임의의 변이체가 임의의 의도되지 않은 게놈 유전좌위에서 확인되면, 게놈 편집 모듈은 각각의 변이 빈도를 결정(블록 510)하고, 샘플 내의 독립적인 변이체의 수를 결정(블록 512)한다. 의도되지 않은 게놈 유전좌위에서의 대상 서열이 기준 서열로부터 변하지 않는 경우에 블록(512) 및 결정 블록(508) 후에, 루틴(500)은 게놈 편집 모듈이 샘플에 대한 게놈 편집된 스펙트럼을 생성할 때 계속(블록 514)될 수 있다. 그러므로, 게놈 편집된 세포 집단 분석은 샘플로부터 분석된 핵산 분자에서 각각의 편입 사건의 의도되지 않은 유전좌위에서의 게놈 편집(들)의 유형(예를 들어, 원치 않는 또는 무의 게놈 편집), (예를 들어, 의심된 또는 민감한 의도되지 않은 게놈 유전좌위에서의) 위치 및 빈도에 관한 정보가 제공될 수 있다. 선택적으로, 게놈 편집 모듈은 게놈 편집 사건의 성공률을 산출(블록 516)하고, 추가로 선택적으로 미래의 게놈 편집 사건의 성공률을 증가시키기 위한 정보를 제공(비도시)할 수 있다.
다음에, 게놈 편집 모듈은 데이터베이스에서 샘플-특이적 데이터세트에 저장될 수 있는 게놈 편집 데이터를 제공(블록 518)할 수 있다. 비도시되어 있는 일부 실시형태에서, 게놈 편집 데이터는 미래의 비교 활동을 위해 데이터베이스에 저장될 게놈 편집 프로필을 생성하도록 사용될 수 있다. 이후, 루틴(500)은 블록(520)에 이어질 수 있고, 여기서 이것은 종료한다.
6은 게놈 편집 사건 후 세포 집단에서의 세포의 클론 팽창을 검출하고 확인하기 위한 루틴(600)을 예시하는 흐름 다이어그램이다. 루틴(600)은 도 2의 컴퓨팅 장치에 의해 호출될 수 있다. 루틴(600)은 블록(602)에서 시작하고, 게놈 편집 모듈은 (예를 들어, 블록 316 후에) 도 3으로부터의 듀플렉스 시퀀싱 데이터를 수신(블록 604)하고, 선택적으로 (예를 들어, 각각 블록(414) 및 (518) 후에) 도 45로부터의 게놈 편집 데이터를 수신하고(블록 606), 세포 집단이 게놈 편집되었는지를 확증(블록 608)한다. 다음에, 게놈 편집 모듈은 표적 게놈 영역(예를 들어, 유전자 또는 다른 게놈 영역)의 서열에서의 변이체를 확인(블록 610)한다. 예를 들어, 게놈 편집 모듈은 특정 유전자 유전좌위(예를 들어, 암 유발자 유전자, 종양유전자, 원종양유전자, 종양 억제자 유전자, 다른 암 유발자 게놈 유전좌위 등)에서 듀플렉스 시퀀싱 데이터 및 선택적으로 게놈 편집 데이터를 분석할 수 있다. 이후, 게놈 편집 모듈은 변이체 대립유전자 빈도(VAF)를 계산(블록 612)한다.
결정 블록(614)에서, 루틴(600)은 VAF가 대조군 그룹에서보다 시험 그룹에서 더 높은지를 결정한다. 대조군 그룹은 일부 실시형태에서 게놈 편집 사건을 겪지 않은 세포 집단(예를 들어, 필적하는 세포 집단)으로부터 유래된 듀플렉스 시퀀싱 데이터일 수 있다. 다른 실시형태에서, 대조군 그룹은 기준 집단의 예상된 배경 VAF일 수 있다. 다른 실시형태에서, 대조군 그룹은 제1 시점에서 세포 집단에 존재하는 특정 변이체의 계산된 VAF일 수 있고, 시험 그룹은 나중의 제2 시점에서 동일한 세포 집단에 존재하는 특정 변이체의 계산된 VAF일 수 있다. 일 예에서, 제1 시점은 게놈 편집 사건 전의 시간 전일 수 있고, 제2 시점은 게놈 편집 사건 후의 시간(예를 들어, 게놈 편집 사건 후 일, 주, 달, 게놈 편집 사건 후 1일 내지 약 30일, 게놈 편집 사건 후 30일 초과 등)일 수 있다. 다른 예에서, 제1 시간 및 제2 시간은 게놈 편집 사건 후의 시간일 수 있다. 시험 그룹의 VAF가 대조군 그룹보다 높지 않으면, 유전자 편집 모듈은 편집된 세포 집단을 클론 팽창을 겪을 의심이 감소된 것으로 표지(블록 616)한다. 이후, 루틴(600)은 블록(618)에 이어질 수 있고, 여기서 이것은 종료한다. VAF가 대조군 그룹에서보다 시험 그룹에서 높으면, 루틴(600)은 결정 블록(620)에 이어지고, 여기서 루틴(600)은 변이체가 비일중항인지를 결정한다.
변이체가 일중항이면, 유전자 편집 모듈은 편집된 세포 집단을 클론 팽창을 겪을 중간 의심 수준으로 규명(블록 622)한다. 돌연변이가 비일중항(즉, 다중항)인 것으로 결정되면, 루틴(600)은 편집된 세포 집단을 클론 팽창을 겪을 높은 의심으로 규명(블록 624)한다. 선택적으로, 게놈 편집 모듈은 표적 게놈 영역에서 검출된 변이체가 유발자 돌연변이(예를 들어, 암 성장/형질전환을 유발하는 것으로 공지된 돌연변이)와 일치하거나 가능한 패신저 돌연변이와 일치하는지를 결정(블록 626)한다.
선택적으로, 중간 의심 수준(블록 622에서) 또는 높은 의심 수준(블록 624에서)으로 규명된 세포 집단(예를 들어, 세포 치료로서 사용되는 세포 집단, 환자로부터 얻은 세포 집단 등)에 대해, 게놈 편집 모듈은 세포 집단에 대한 안전성 역치를 평가하고/하거나, 신생물 병태 또는 암 질환을 발생시키는 것과 연관된 위험을 결정(블록 628)할 수 있다. 이후, 루틴(600)은 블록(618)에 이어질 수 있고, 여기서 이것은 종료한다.
다른 단계 및 루틴은 또한 본 기술내용에 의해 고려된다. 예를 들어, 상기 시스템(예를 들어, 게놈 편집 모듈 또는 다른 모듈)은 세포 집단이 게놈 편집되는지, 게놈 편집 과정이 효과적이고/이거나 성공적인지를 결정하기 위해, 어떤 특징 하에 게놈 편집 사건이 돌연변이성 또는 발암물질성 및 기타인지를 결정하기 위해 게놈 편집 데이터를 분석하도록 구성될 수 있다. 다른 단계는 대상체가 게놈 편집 사건 후에 세포 집단으로부터 유래된 세포 치료를 사용하여 그리고 특정 세포 집단의 샘플로부터 도출된 게놈 편집 데이터에 기초하여 예방학적으로 또는 치료학적으로 치료되는지를 결정하는 것을 포함할 수 있다. 추가의 단계는 대상체가 특정 대상체의 생물학적 샘플로부터 도출된 게놈 편집 데이터에 기초하여 암에 대해 치료학적으로 치료되어야 하는지를 결정하는 것을 포함할 수 있다. 예를 들어, 게놈 편집된 세포 집단의 클론 팽창 또는 신생물성 가능성이 상기 시스템을 이용하여 확인되면, 서버는 이후 대상체가 게놈 편집된 세포 집단의 신생물성 가능성의 안전 역치 수준보다 더 노출되는지를 결정할 수 있다. 이렇게 하여서, 이후 예방학적 또는 억제제 질환 치료가 개시될 수 있다.
실험 실시예
하기 부문은 듀플렉스 시퀀싱을 이용하여 사건 후에 세포의 클론 팽창을 검출하고 평가하는 방법 및 연관된 시약의 일부 제한적인 예를 제공한다.
실시예 1
일 실시예에서, 초기 세포 집단은 CRISPR/Cas9 엔도뉴클레아제 시스템을 이용하여 표적화된 게놈 편집으로 처리된다. Cas9는 게놈 DNA에서 이중-가닥 절단을 야기하고, 이는 일부 분야에서 TP53 경로(즉, PMID 29892062, PMID 29892067)를 통해 세포 주기 정지를 유도하는 것으로 나타났다. 게놈 편집은 TP53에 의해 매개된 이중-가닥 절단 반응에 의해 유도된 세포 주기 정지로 인한 배아 줄기 세포에서와 같은 일부 경우에 낮은 효율을 갖는 것으로 이론화되었다. 게놈 편집 과정 후 정지하지 않는 이 세포는 각각의 기능을 파괴하고 덜 제한된 세포 성장을 야기하는 TP53(또는 다른 암 유발자 유전자)의 불활성화 돌연변이 또는 결실 또는 손실을 보유할 수 있다. 이 돌연변이를 보유하는 세포의 클론 팽창은 이웃하는 세포를 능가할 것이다. 이 실시예에서, 듀플렉스 시퀀싱은 표적화된 이중-가닥 DNA 분자의 오류-정정된 공통 서열 판독을 생성하고, Cas9-매개된 게놈 편집 후에 세포 집단으로부터 취해진 샘플에 대해 변이 빈도(예를 들어, 돌연변이 대립유전자 빈도)를 결정하기 위해 사용될 것이다. 표적화된 이중-가닥 DNA 분자는 TP53의 영역 또는 다른 암 유발자 유전자 또는 이의 일부를 포함할 수 있다. 클론 팽창에 대한 선택압은 암 유발자 돌연변이에 대한 돌연변이체 대립유전자 빈도가 역치 수준(예를 들어, 미리 결정된 수준, 배경 수준, 게놈의 비선택 가능한 기준 부분보다 높은 상대 변이체 대립유전자 빈도 등)을 초과하는지를 결정함으로써 평가될 것이다. 일부 실시형태에서, 표적화된 이중-가닥 DNA 분자는 또한 비암 유발자 유전좌위를 포함할 수 있다. 이러한 비암 유발자 유전좌위에 존재하는 하나 이상의 변이체는 듀플렉스 시퀀싱을 이용하여 검출 가능하고 정량화 가능하다. 게놈 편집 사건 후의 변이 빈도(예를 들어, 패신저 돌연변이)의 증가(예를 들어, 제1 시점 및 나중의 제2 시점에서 대한 증가, 배경 수준 초과의 빈도의 증가 등)는 암 유발자에서의 돌연변이가 존재할 수 있어서 이러한 변이체를 보유하는 세포에서 클론 선택을 제공할 수 있다는 것을 나타낼 수 있다. 패신저 돌연변이는 임의의 또는 모든 게놈 중에서 선택될 수 있지만, 일부 경우에 바람직하게는 단독중합체성 영역과 같은 고빈도 돌연변이이다. 클론 확인에 사용될 수 있는 상이한 형태의 유전자 계통 마커는 문헌[Salk et al 2010PMID 20951806]에서 발견될 수 있다.
실시예 2
이 실시예는 암 유발자 유전자에서의 초기 돌연변이가 시험 발암물질의 종양원성 가능성을 반영하는지를 결정하기 위한 듀플렉스 시퀀싱의 이용을 기재한다. 모델 돌연변이 유도제를 사용하여, 본 실시예는 듀플렉스 시퀀싱이 집단 중에서 개별 DNA 분자에서 돌연변이를 해결할 수 있다는 것을 보여준다. 본 실시예는 본 개시내용의 방법이 세포 집단 중에서 세포의 이러한 초기 단계 신생물성 클론 선택을 검출할 필요한 민감도, 및 이러한 세포의 후속하는 클론 팽창을 제공한다는 것을 나타낸다.
이 실시예에서, 우레탄에 대한 영향은 FDA 승인 암-소인 마우스 모델: Tg.rasH2에서 상이한 마우스 조직 유형(폐, 비장, 혈액)에서 실험된다(Saitoh et al. Oncogene 1990. PMID 2202951). 이 마우스는 하나의 반접합체 대립유전자에서 발현을 부스트하기 위해 활성화 인핸서 돌연변이를 갖는 인간 HRAS의 약 3개의 탠덤 카피를 함유한다. 이 마우스는 비장 혈관육종 및 폐 선암의 소인이 있고, 2년 야생형 동물 연구 동안 치환하기 위해 6개월 발암성 연구에 일상적으로 사용된다. 마우스에서 발견된 종양은 보통 인간 HRAS 원암유전자에서 하나의 카피에서 획득된 활성화 돌연변이를 갖는다. 따라서, 인간 HRAS 전이유전자는 이 동물에서 모델 표적 암 유발자 유전자로서 작용한다. 서열 분석 및 돌연변이 검출은 미경험 마우스 Hras, Kras, Nras 및 인간 HRAS 전이유전자와 함께 4개의 미경험 마우스 유전자 (Rho, Hp, Ctnnb1, Polr1c)에 대해 수행되었다.
이 실시예에서, Tg.rasH2 마우스(n=5/그룹)는 비히클 또는 모델 돌연변이-유도제(예를 들어, 우레탄의 발암물질 용량)가 투약되고(1일, 3일, 5일), 표적 조직(폐, 비장) 및 전혈에서 듀플렉스 시퀀싱에 의해 돌연변이 검출에 대해 29일에 희생되었다. 표적 내인성 유전자(Rho, Hp, Ctnnb1, Polr1c) 및 미경험 마우스 Hras 및 인간 HRAS (트랜스) 유전자가 또한 시퀀싱되었다.
종양(비장 혈관내피육종; 폐 선암)은 우레탄이 투약된 동물(n=5/그룹)로부터 11주에 수집되고, 이 종양에서 특징적인 암 유발자 돌연변이(CDM)를 확인하기 위해 전장 게놈 시퀀싱(WES)으로 처리되었다.
7은 듀플렉스 시퀀싱에 의해 검출된 바와 같은 변이체 대립유전자 분획(VAF)의 초기 단계 신생물성 클론 선택을 예시하는 그래프이다. 확인된 거의 대부분의 돌연변이는 예를 들어 1/10,000의 차수로 매우 낮은 변이체 대립유전자 분획(VAF)에서 단일 분자에서 나타났다. 약간의 변이체는 샘플에서 다수의 분자에서 발견되었고, 상당히 더 높은 VAF를 갖는 것으로 확인되었다.
8a는 인간 HRAS 전이유전자의 엑손 3에 정렬하는 단일 뉴클레오타이드 변이체(SNV)를 예시하는 그래프이다. HRAS 암-유발 핫스팟인 이 부위 내에 일치하는 인간 HRAS의 엑손 3에서 코돈 번호 61에서의 앙 잔기가 강조된다. 5개의 우레탄 치료된 폐 샘플 중 4개는 0.1% 내지 1.8%의 변이체 대립유전자 빈로 이 돌연변이를 보유하였다. 모든 4개의 SNV는 상황 CTG에서 T→A 전좌이다. 또한, 2개의 치료된 비장 샘플은 이 코돈에서 돌연변이를 갖는데: 하나는 이 동일한 위치에 있고, 하나는 인접한 염기쌍에 있다. 5개의 치료된 폐 샘플 중 4개가 오직 29일에 클론성으로 확장된 병원성 돌연변이를 갖지만, 패널에서 그 외 보인 매우 적은 돌연변이가 1 초과 구성원 클론으로서 보이거나 다수의 샘플에서 반복하여 보인다는 사실은 노출 직후에 실질적인 양성 선택의 강한 증거를 입증한다. 더욱이, 본 기술내용의 실시형태에 따른 듀플렉스 시퀀싱 방법은 이러한 초기 저장 신생물성 클론 선택을 제공하기 위한 필요한 민감도를 제공한다.
표 1
Figure pct00001
표 1을 참조하면, 돌연변이의 97.5%는 오직 단일 분자에서 확인되고, 1%는 2개의 분자에서 보이고, 약 0.5%는 2개 초과의 분자에서 보였다. 4의 최고 수준 클론은 모두 인간 HRAS에서 반복적 종양 핫스팟인 AA 61에서 종양형성 돌연변이로 발생했다. 최고-수준 클론이 또한 암 핫스팟에서 보인다는 것은 강한 선택압의 규모를 추가로 강조한다.
시퀀싱된 듀플렉스 분자로 전환되기보다 훨씬 더 많은 양의 DNA가 샘플마다 추출되었다. 추출된 조직 샘플의 일부는 거의 5 μg의 게놈 DNA를 생성하였다. 이것을 게놈 당량으로 전환하고 3을 곱해 추출에서의 tg.HRAS 카피의 수가 생성된다. 거의 300배 더 많은 돌연변이체가 검출되는 것보다 샘플링된 조직의 원래의 부분에 존재하므로, 이의 불과 약 1/3%가 시퀀싱되었다.
표 2
Figure pct00002
이 실시예에서, 선택된 클론은 최고 대립유전자 분획 클론에서 90,000개 초과의 세포를 포함하였다. 그 결과, 계산에 의하면, 돌연변이 노출의 시간으로부터 연구 29일 내에 및 세포사가 없음을 추정하여, 이 세포의 배가 시간은 거의 1.8일마다 2^(29/1.8) ~ 90,000이었다. 이론에 의해 구속됨이 없이, 세포 배가의 이 계산된 비율은 아마도 짧은 시간 기간에(예를 들어, 2주만큼 적게) 이 선택된 돌연변이를 검출하는 능력을 제시한다.
이 실시예의 실험 분석의 이 결과는 듀플렉스 시퀀싱이 돌연변이의 유도를 극도로 강건하게 그리고 엄격한 반복실험 신뢰도 간격으로 정량화한다는 것을 나타낸다. 추가로, 듀플렉스 서열은 돌연변이 유도의 정도에서의 조직-특이적 변이를 해상할 수 있었고, 폐는 비장 및 혈액보다 더 돌연변이 민감한 것으로 관찰되었다. 우레탄 노출의 단순한 돌연변이성 스펙트럼은 깨끗하고, 비바이어싱된 클러스터링은 그룹들 사이에 구별될 수 있다. 우레탄의 삼중항 돌연변이 스펙트럼은 "NTG" 및 돌연변이 스펙트럼의 맥락 내에 T→A 및 T→C 돌연변이에 대한 강한 경향이 비히클 대조군으로부터 구별 가능하다는 것을 보여준다.
추가로, 말초 혈액에서의 돌연변이 유도는 비장에서 보인 것을 밀접하게 반영하고, 말초 혈액의 살아 있는 샘플링이 일부 돌연변이원에 대해 괴사(또는 생검)를 치환할 수 있다는 것을 제시한다. 더욱이, 본 실시예는 종래의 연구가 검출할 수 있는 것(예를 들어, 설치류 종양 발생)보다 더 이른 시점(예를 들어, 29일)에서도 듀플렉스 시퀀싱을 이용하여 인간 HRAS 전이유전자에서의 종양형성 돌연변이에 대한 선택의 명확한 증거를 제공하였다. 따라서, 본 실시예는 표적 암 유발자 유전자(또는 다른 암 유발자 유전좌위)에서의 돌연변이의 스펙트럼을 분석하는 것이 공지된 모델 돌연변이원의 효과를 정확히 반영할 수 있다는 것을 나타낸다. 그러므로, 듀플렉스 시퀀싱은 미래의 암 위험의 바이오마커로서 조기 암 유발자 돌연변이를 평가하는 것과 관련하여 조기 및 정확한 데이터를 제공할 수 있다. 교차-종 오염은 극도로 낮은 수준에서 지속하지만, 외래 종 오염의 제거는 자동적으로 및 신뢰도 있게 수행되었다.
8b는 (도 8a에 도시된) Tg.RasH2 마우스 모델에서 인간 형질전환 유전좌위를 포함하는 유전자의 Ras 패밀리로부터 포획된 엑손에 대한 게놈 간격에 걸쳐 작도된 단일 뉴클레오타이드 변이체(SNV)를 보여준다. 일중항은 단일 분자에서 발견된 돌연변이이다. 다중항은 동일한 샘플러 내에 다수의 분자 내에 확인된 동일한 돌연변이이고, 클론 팽창 사건을 나타낼 수 있다. 각각의 점의 높이는 각각의 SNV의 변이체 대립유전자 빈도(VAF)에 상응하고, 점의 크기는 오직 다중항 관찰에 상응한다. COSMIC에서의 Ras 패밀리 인간 암 돌연변이성 핫스팟의 위치 및 상대 빈도는 각각의 유전자 아래에서 나타난다. T>A 전좌의 클러스터는 인간 종양형성 HRAS 코돈 61개의 핫스팟에서 5개의 우레탄-치료된 폐 샘플 중 4개 및 5개의 우레탄-치료된 비장 샘플 중 1개에서 관찰되었다. 잘-확립된 암 유발자에서의 높은 VAF 다중항으로서의 독립적인 샘플에서의 동일한 돌연변이의 관찰은 양성 선택의 강한 표시이다. 특히 이 클론은 우레탄 돌연변이유발의 특징인 상황 NTG에서 전좌 T>A이다.
본 실시예는 변이체 대립유전자 빈도, 돌연변이 유형(들)의 스펙트럼 및 게놈 상황 데이터에 관한 자세한 정보를 제공하면서 선택압 하에 있는 잠재적인 돌연변이를 보유하는 세포의 클론 팽창을 빨리 검출하고 평가하기 위한 방법을 기재한다. 예를 들어, 일부 실시형태에서, 본 기술내용은 게놈 편집 사건 후에 세포 집단으로부터 DNA를 추출하는 단계를 포함하는 방법 단계를 포함한다. DNA는 게놈 편집 사건 후에 다양한 시점에서 추출될 수 있다. 예를 들어, DNA는 사건 후에 몇일 또는 몇주 또는 몇개월 추출될 수 있다. 일부 실시형태에서, DNA는 사건 후에 30일 이하 내에 세포 집단으로부터 추출될 수 있다. DNA 추출 후에, DNA 라이브러리가 준비될 수 있다. 일 실시형태에서, 추출된 게놈 DNA는 복수의 이중-가닥 DNA 단편으로 단편화될 수 있고, 각각의 이중 가닥 DNA 단편은 하나 이상의 원하는 어댑터 분자(예를 들어, 도 1a에 도시된 어댑터 분자)에 결찰될 수 있다.
DNA 라이브러리 준비 후에, 이중-가닥 어댑터-DNA 복합체는 자세한 돌연변이 위치 및 빈도를 제공하는 직접 고정확도 DNA 시퀀싱 판독(예를 들어, 백만에 하나 미만의 선택-매개된 돌연변이의 해상)을 생성시키도록 듀플렉스 시퀀싱 방법 단계로 증폭되고 시퀀싱될 수 있다. 따라서, 듀플렉스 시퀀싱 분석은 임의의 유기체로부터 임의의 조직에서 임의의 유전자 유전좌위에서 게놈 변이체의 민감한 검출을 제공할 수 있다.
추가의 예
1. 의도된 게놈 유전좌위에 지향된 조작된 게놈 편집 사건 후에 세포 집단을 규명하는 방법으로서, 상기 방법은,
(a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자를 포함하는 샘플을 제공하는 단계;
(b) 복수의 이중-가닥 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계이되,
복수의 어댑터-DNA 분자를 생성하기 위해 어댑터 분자를 복수의 이중-가닥 DNA 분자에 결찰하는 것;
어댑터-DNA 분자의 원래의 제1 가닥의 카피의 세트 및 어댑터-DNA 분자의 원래의 제2 가닥의 카피의 세트를 생성하는 것;
제1 가닥 서열 및 제2 가닥 서열을 제공하기 위해 원래의 제1 가닥 및 제2 가닥의 하나 이상의 카피를 시퀀싱하는 것;
제1 가닥 서열과 제2 가닥 서열 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 및 제2 가닥 서열을 비교하는 것을 포함하는 단계; 및
(c) 의도된 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기대된 게놈 편집된 DNA 서열과 비교하는 단계; 또는
(d) 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기준 게놈 DNA 서열과 비교하는 단계를 포함하는, 방법.
2. 예 1에 있어서, 상기 방법은 단계 (c) 및 단계 (d) 둘 다를 포함하는, 방법.
3. 예 1 또는 예 2에 있어서, 복수의 이중-가닥 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계는 복수의 농후화된 어댑터-DNA 분자를 제공하기 위해 시퀀싱 전에 하나 이상의 표적화된 게놈 영역을 선택적으로 농후화하는 단계를 추가로 포함하는, 방법.
4. 예 4에 있어서, 하나 이상의 표적화된 게놈 영역은 게놈에서의 의도된 게놈 유전좌위를 포함하는, 방법.
5. 예 4에 있어서, 하나 이상의 표적화된 게놈 영역은 게놈에서의 적어도 하나의 의도되지 않은 게놈 유전좌위를 포함하는, 방법.
6. 예 1 내지 5 중 어느 하나에 있어서, 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계를 추가로 포함하는, 방법.
7. 예 6에 있어서, 하나 이상의 변이체는 의도된 게놈 유전좌위의 서열에서의 부정확한 돌연변이를 포함하는, 방법.
8. 예 7에 있어서, 게놈 편집을 위한 의도된 게놈 유전좌위의 서열에서의 부정확한 돌연변이는 비상동성 말단 연결(NHEJ: non-homologous end joining) 사건으로 인한, 방법.
9. 예 6에 있어서, 하나 이상의 변이체는 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독에서 확인되는, 방법.
10. 예 6 내지 9 중 어느 하나에 있어서, 하나 이상의 변이체는 기능적으로 파괴적인 돌연변이를 포함하는, 방법.
11. 예 6 또는 예 9에 있어서, (e) 복수의 이중 가닥 DNA 분자 중에서 하나 이상의 변이체의 빈도를 결정하는 단계를 추가로 포함하는, 방법.
12. 예 1 내지 11 중 어느 하나에 있어서, 의도된 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독이 기대된 게놈 편집된 DNA 서열을 포함하는지를 결정하는 단계를 추가로 포함하는, 방법.
13. 예 12에 있어서, 의도된 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독 중에서 기대된 게놈 편집된 DNA 서열의 빈도를 결정하는 단계를 추가로 포함하는, 방법.
14. 예 12에 있어서, 의도된 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독 중에서 원치 않는 DNA 서열의 빈도를 결정하는 단계를 추가로 포함하는, 방법.
15. 예 1 내지 14 중 어느 하나에 있어서, 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독이 변이체를 포함하는지를 결정하는 단계를 추가로 포함하는, 방법.
16. 예 1 내지 15 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 복수의 의도된 게놈 유전좌위에 지향된, 방법.
17. 예 1 내지 16 중 어느 하나에 있어서, 단계 (d)는 복수의 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독을 기준 게놈 DNA 서열과 비교하는 단계를 포함하는, 방법.
18. 예 17에 있어서, 의도되지 않은 게놈 유전좌위는 돌연변이-민감 부위, 미세부수체 유전좌위, 의도된 게놈 유전좌위와 서열 상동성을 갖는 서열, 및/또는 암 유발자 중 하나 이상을 포함하는, 방법.
19. 예 1 내지 18 중 어느 하나에 있어서, 의도되지 않은 게놈 유전좌위는 의도된 게놈 유전좌위에서의 서열과 적어도 부분적으로 유사한 핵산 서열을 갖는, 방법.
20. 예 1 내지 19 중 어느 하나에 있어서, 의도되지 않은 게놈 유전좌위는 종양 억제자 유전자, 종양유전자, 원종양유전자, 및/또는 암 유발자의 서열을 포함하는, 방법.
21. 세포 집단에서 조작된 게놈 편집 사건의 효율을 규명하는 방법으로서, 조작된 게놈 편집 사건은 의도된 게놈 유전좌위에 표적화되고, 상기 방법은,
(a) 게놈 편집 사건 후에 세포 집단으로부터 기원한 복수의 이중-가닥 DNA 분자를 포함하는 샘플로부터 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 복수의 어댑터-DNA 분자를 생성하기 위해 비대칭 어댑터 분자를 복수의 이중-가닥 DNA 분자에 결찰하는 것을 포함하는 단계;
(b) 어댑터-DNA 분자의 적어도 일부에 대해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 제공하기 위해 어댑터-DNA 분자의 제1 가닥 및 제2 가닥을 시퀀싱하는 단계;
(c) 각각의 시퀀싱된 어댑터-DNA 분자에 대해, 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 비교하는 단계; 및
(d) 의도된 게놈 유전좌위를 포함하는 복수의 이중-가닥 DNA 분자 중에서
제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 분석하는 것에 의해; 그리고
기대된 게놈 서열과의 관련성을 비교하는 것에 의해
의도된 게놈 유전좌위에서의 기대된 게놈 서열의 빈도를 결정하는 단계를 포함하는, 방법.
22. 예 21에 있어서, 복수의 농후화된 어댑터-DNA 분자를 제공하기 위해 시퀀싱 전에 하나 이상의 표적화된 게놈 영역을 선택적으로 농후화하는 단계를 추가로 포함하는, 방법.
23. 예 22에 있어서, 하나 이상의 표적화된 게놈 영역은 게놈에서의 의도된 게놈 유전좌위를 포함하는, 방법.
24. 예 22에 있어서, 하나 이상의 표적화된 게놈 영역은 게놈에서의 적어도 하나의 의도되지 않은 게놈 유전좌위를 포함하는, 방법.
25. 예 21 내지 24 중 어느 하나에 있어서,
의도되지 않은 게놈 유전좌위에서의 하나 이상의 변이체를
하나 이상의 의도되지 않은 게놈 유전좌위로부터의 서열을 포함하는 이중-가닥 DNA 분자로부터 유래된 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 분석하는 것에 의해; 그리고
기준 게놈 서열과의 관련성을 비교하는 것에 의해
확인하는 단계; 및
하나 이상의 의도되지 않은 게놈 유전좌위를 포함하는 복수의 이중-가닥 DNA 분자 중에서 하나 이상의 변이체의 변이 빈도를 결정하는 단계를 포함하는, 방법.
26. 예 21 내지 25 중 어느 하나에 있어서, 기대된 게놈 서열과의 관련성을 비교하는 것은 게놈 편집에 대해 의도된 유전좌위의 서열에서 부정확한 돌연변이를 확인하는 것을 포함하는, 방법.
27. 예 21 내지 25 중 어느 하나에 있어서, 기대된 게놈 서열과의 관련성을 비교하는 것은 비변경된 서열을 확인하는 것을 포함하는, 방법.
28. 게놈-편집된 세포 집단으로부터 추출된 표적 이중-가닥 핵산 분자의 집단의 고정확도 시퀀싱 판독을 생성하는 방법으로서, 상기 방법은,
(a) 세포 집단으로부터 추출된 하나 이상의 표적 이중-가닥 핵산 분자를 듀플렉스 시퀀싱하는 단계; 및
(b) 표적화된 이중-가닥 DNA 분자에 대한 고정확도 공통 서열을 생성하는 단계를 포함하고,
표적 이중-가닥 핵산 분자는 DNA의 의도된 게놈 편집된 영역 및 DNA의 하나 이상의 의도되지 않은 게놈 영역을 포함하는, 방법.
29. 예 28에 있어서, DNA의 의도되지 않은 게놈 영역은 DNA의 의도된 게놈 편집된 영역과 적어도 부분적으로 유사한 핵산 서열을 갖는, 방법.
30. 예 28 또는 예 29에 있어서, DNA의 의도된 게놈 편집된 영역에 맵핑된 고정확도 공통 서열을 기대된 게놈 편집된 DNA 서열과 비교하는 단계를 추가로 포함하고, 표적화된 게놈 편집 과정은 의도된 게놈 편집된 영역에 맵핑된 하나 이상의 고정확도 공통 서열이 기대된 게놈 편집된 DNA 서열과 실질적으로 동일하면 성공적이라고 생각되는, 방법.
31. 예 30에 있어서, 표적화된 게놈 편집 과정은 의도된 게놈 편집된 영역에 맵핑된 대부분의 고정확도 공통 서열이 기대된 게놈 편집된 DNA 서열과 실질적으로 동일하면 성공적이라고 생각되는, 방법.
32. 예 28 내지 31 중 어느 하나에 있어서, 의도되지 않은 게놈 영역에 맵핑된 고정확도 공통 서열을 게놈 편집 사건을 겪지 않은 세포로부터 유래된 기준 게놈 서열과 비교하는 단계를 추가로 포함하고, 표적화된 게놈 편집 과정은 의도되지 않은 게놈 영역에 맵핑된 고정확도 공통 서열이 기준 게놈 서열과 실질적으로 동일하면 성공적이라고 생각되는, 방법.
33. DNA가 조작된 표적화된 게놈 편집 사건을 이용하여 의도된 유전자 유전좌위에서 성공적으로 게놈 편집되는지를 결정하는 방법으로서, 상기 방법은,
a) 조작된 표적화된 게놈 편집 사건 후에 샘플로부터 추출된 복수의 이중-가닥 DNA 분자에 대해 듀플렉스 오류-정정된 시퀀싱 판독을 제공하는 단계; 및
b) 기준 게놈에서의 하나 이상의 유전자 유전좌위의 세트에서의 각각의 유전자 유전좌위에 대해, 듀플렉스 오류-정정된 시퀀싱 판독이 예상된 서열과 실질적으로 동일한 서열을 갖는 이중-가닥 DNA 분자를 정량화하는 단계를 포함하는, 방법.
34. 예 33에 있어서, 기준 게놈에서의 하나 이상의 유전자 유전좌위의 세트는 의도된 유전자 유전좌위를 포함하고, 예상된 서열은 기대된 게놈 편집된 DNA 서열을 포함하는, 방법.
35. 예 33 또는 예 34에 있어서, 기준 게놈에서의 하나 이상의 유전자 유전좌위의 세트는 의도되지 않은 유전자 유전좌위를 포함하고, 예상된 서열은 게놈 편집 사건을 겪지 않은 세포로부터 유래된 게놈 서열을 포함하는, 방법.
36. 예 35에 있어서, 의도되지 않은 유전자 유전좌위는 돌연변이-민감 부위, 미세부수체 유전좌위, 의도된 유전자 유전좌위와 서열 상동성을 갖는 서열, 및/또는 암 유발자를 포함하는, 방법.
37. 조작된 게놈 편집 사건 후에 세포 집단의 신생물성 가능성을 평가하는 방법으로서,
(a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자를 포함하는 샘플로부터 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 제1 태그화 가닥 및 제2 태그화 가닥을 갖는 복수의 태그화된 DNA 분자를 생성하기 위해 복수의 이중-가닥 DNA 분자를 태그화하는 것을 포함하는 단계;
(b) 농후화된 태그화된 DNA 분자를 제공하기 위해 하나 이상의 암 유발자에 맵핑되는 태그화된 DNA 분자의 하위집단에 대해 제1 태그화 가닥 및 제2 태그화 가닥을 선택적으로 농후화하는 단계;
(c) 복수의 농후화된 태그화된 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계이되, 오류-정정된 서열 판독을 생성하는 단계는
제1 가닥 서열 및 제2 가닥 서열을 제공하기 위해 농후화된 태그화된 DNA 분자로부터 유래된 하나 이상의 제1 태그화 가닥 및 제2 태그화 가닥을 시퀀싱하는 것;
제1 가닥 서열과 제2 가닥 서열 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 및 제2 가닥 서열을 비교하는 것을 포함하는 단계; 및
(d) 기준 게놈 서열과의 하나 이상의 관련성을 비교함으로써 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에 존재하는 변이체가 있는지를 결정하는 단계를 포함하는, 방법.
38. 예 37에 있어서, 하나 이상의 변이체는 기능적으로 파괴적인 돌연변이를 포함하는, 방법.
39. 예 37 또는 예 38에 있어서, 하나 이상의 암 유발자는 ABL, ACC, BCR, BLCA, BRCA, CESC, CHOL, COAD, DLBC, DNMT3A, EGFR, ESCA, GBM, HNSC, KICH, KIRC, KIRP, LAML, LGG, LIHC, LUAD, LUSC, MESO, OV, PAAD, PCPG, PI3K, PIK3CA, PRAD, PTEN, 판독, SARC, SKCM, STAD, TGCT, THCA, THYM, UCEC, UCS, 및/또는 UVM이거나 이를 포함하는, 방법.
40. 예 37 또는 예 38에 있어서, 암 유발자는 TP53이거나 이를 포함하는, 방법.
41. 예 37 또는 예 38에 있어서, 암 유발자는 HRAS, NRAS 또는 KRAS이거나 이를 포함하는, 방법.
42. 예 37 내지 41 중 어느 하나에 있어서, 복수의 농후화된 태그화된 DNA 분자 중에서 하나 이상의 암 유발자에 존재하는 변이체가 있으면, 상기 방법은 (e) 복수의 농후화된 태그화된 DNA 분자 중에서 변이체의 변이 빈도를 결정하는 단계를 추가로 포함하는, 방법.
43. 예 42에 있어서, 상기 방법 단계 (a) 내지 (e)는 사건 후 제1 시점에서 및 사건 후 제2 시점에서 수행되고, 제2 시점은 제1 시점 후이고, 제1 시점으로부터의 변이 빈도는 제2 시점으로부터의 변이 빈도와 비교되는, 방법.
44. 예 43에 있어서, 제2 시점은 제1 시점 후 2일 내지 90일인, 방법.
45. 예 43에 있어서, 제1 시점 및 제2 시점 둘 다는 조작된 게놈 편집 사건 후에 약 30일 내, 약 45일 내, 약 60일 내, 약 75일 내 또는 약 90일 내인, 방법.
46. 예 43 내지 45 중 어느 하나에 있어서, 제2 시점으로부터의 변이 빈도가 제1 시점으로부터의 변이 빈도보다 높으면 세포 집단이 신생물성 가능성을 갖는 것으로 결정되는, 방법.
47. 예 42에 있어서, 상기 방법 단계 (a) 내지 (e)는 조작된 게놈 편집 사건 후에 약 30일 내에 수행되고, 변이 빈도는 조작된 게놈 편집 사건을 겪지 않는 필적하는 세포 집단으로부터 결정된 사건전 변이 빈도와 비교되는, 방법.
48. 조작된 게놈 편집 사건 후에 세포 집단에서의 세포의 클론 팽창을 검출하고/하거나 정량화하는 방법으로서,
(a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 하나 이상의 표적 이중-가닥 DNA 분자를 듀플렉스 시퀀싱하는 단계;
(b) 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계;
(c) 세포 집단으로부터 기원한 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체의 변이 빈도를 결정하는 단계; 및
(d) 하나 이상의 변이체의 각각에 대한 변이 빈도를 예상된 변이 빈도와 비교하는 단계를 포함하는, 방법.
49. 예 48에 있어서, 듀플렉스 시퀀싱하는 단계는
(i) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자로부터의 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 복수의 어댑터-DNA 분자를 생성하기 위해 어댑터 분자를 복수의 이중-가닥 DNA 단편에 결찰하는 것을 포함하는 단계;
(ii) 각각의 어댑터-DNA 분자에 대해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 제공하기 위해 어댑터-DNA 분자의 제1 가닥 및 제2 가닥을 시퀀싱하는 단계; 및
(iii) 각각의 어댑터-DNA 분자에 대해, 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 비교하는 단계를 포함하는, 방법.
50. 예 48 또는 예 49에 있어서, 하나 이상의 변이체의 변이 빈도는 관심 게놈 유전좌위에 맵핑된 듀플렉스 시퀀싱된 표적 이중-가닥 DNA 분자의 총수마다 관심 게놈 유전좌위에 맵핑된 규정된 변이체를 갖는 듀플렉스 시퀀싱된 표적 이중-가닥 DNA 분자의 수를 계산함으로써 결정되는, 방법.
51. 예 48 내지 50 중 어느 하나에 있어서, 하나 이상의 변이체의 변이 빈도는 역치 변이 빈도보다 높은, 방법.
52. 예 48 내지 51 중 어느 하나에 있어서, 하나 이상의 변이체는 기준 세포 집단으로부터의 서열에 대하여 확인되는, 방법.
53. 예 48 내지 52 중 어느 하나에 있어서, 상기 방법 단계 (a) 내지 (c)는 사건 후 제1 시점에서 및 사건 후 제2 시점에서 수행되고, 제2 시점은 제1 시점 후이고, 제1 시점으로부터의 변이 빈도는 예상된 변이 빈도인, 방법.
54. 예 53에 있어서, 제2 시점은 제1 시점 후 2일 내지 90일인, 방법.
55. 예 53에 있어서, 제1 시점 및 제2 시점 둘 다는 조작된 게놈 편집 사건 후에 약 30일 내, 약 45일 내, 약 60일 내, 약 75일 내 또는 약 90일 내인, 방법.
56. 예 53 내지 55 중 어느 하나에 있어서, 제2 시점으로부터의 변이 빈도가 제1 시점으로부터의 변이 빈도보다 높으면 세포 집단에서의 세포의 클론 팽창이 발생하는 것으로 결정되는, 방법.
57. 예 48 내지 56 중 어느 하나에 있어서, 변이 빈도가 예상된 변이 빈도보다 높으면 세포 집단에서의 세포의 클론 팽창이 발생하는 것으로 결정되는, 방법.
58. 예 56 또는 예 57에 있어서, 세포의 클론 팽창은 비정상 세포 증식성 상태, 암 유사 상태, 전암성 상태 또는 현장 효과(field effect)를 나타내는, 방법.
59. 예 48에 있어서, 예상된 변이 빈도는 조작된 게놈 편집 사건을 겪지 않는 필적하는 세포 집단으로부터 결정되는, 방법.
60. 예 48 내지 59 중 어느 하나에 있어서, 하나 이상의 변이체는 게놈 편집에 대한 의도된 유전좌위 밖의 하나 이상의 위치에 있는, 방법.
61. 예 48 내지 60 중 어느 하나에 있어서, 하나 이상의 변이체는 종양 억제자 유전자, 종양유전자, 원종양유전자, 및/또는 암 유발자의 서열에 있는, 방법.
62. 예 48 내지 61 중 어느 하나에 있어서, 하나 이상의 변이체는 기능적으로 파괴적인 돌연변이를 포함하는, 방법.
63. 예 48 내지 62 중 어느 하나에 있어서, 적어도 하나의 변이체는 TP53에 있는, 방법.
64. 예 47 내지 63 중 어느 하나에 있어서, 적어도 하나의 변이체는 HRAS, NRAS 또는 KRAS에 있는, 방법.
65. 예 48 내지 64 중 어느 하나에 있어서, 적어도 하나의 변이체는 패신저 돌연변이인, 방법.
66. 예 48 내지 65 중 어느 하나에 있어서, 적어도 하나의 변이체는 비암 유발자 변이체인, 방법.
67. 예 1 내지 66 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단은 다능성 줄기 세포, 배아 줄기 세포, 면역 세포 또는 식물 세포이거나 이를 포함하는, 방법.
68. 예 1 내지 67 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단은 인간 환자로부터 유래된, 방법.
69. 예 68에 있어서, 인간 환자로부터 얻은 이중-가닥 DNA 분자는 조직, 순환 세포, 혈장에서의 무세포 DNA, 다른 체액에서의 무세포 DNA, 엑소좀 DNA, 조직에 의해 분비된 세포, 및/또는 생검으로부터 얻어지는, 방법.
70. 예 1 내지 68 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단은 세포 배양에서 성장하는, 방법.
71. 예 1 내지 68 및 70 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단은 인간 또는 동물 대상체로부터 유래된, 방법.
72. 예 1 내지 71 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단은 이종이식으로부터 유래된, 방법.
73. 예 1 내지 72 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 표적 엔도뉴클레아제-매개된 편집 사건인, 방법.
74. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 Cas9-매개된 편집 사건인, 방법.
75. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 CPF1-매개된 편집 사건인, 방법.
76. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 변형된 CAS 또는 CPF-1 매개된 사건인, 방법.
77. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 TALON, MEGATAL, 징크-핑거 뉴클레아제, 호밍 엔도뉴클레아제 또는 제한 엔도뉴클레아제에 의해 수행되는, 방법.
78. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 폴리뉴클레오타이드 기질-매개된 상동성 재조합 사건인, 방법.
79. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 레트로바이러스 또는 다른 바이러스에 의해 수행되는, 방법.
80. 예 1 내지 73 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 DNA 절단, DNA 부가물, DNA 산화적 손상의 부위, DNA 닉 또는 DNA 탈아미드화의 부위 중 하나 이상을 도입하는, 방법.
81. 예 1 내지 72 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단은 CRISPR/Cas9 시스템을 사용하여 편집되는, 방법.
82. 예 11, 25, 42 및 48 중 어느 하나에 있어서, 하나 이상의 변이체의 변이 빈도는 조작된 게놈 편집 사건을 겪지 않은 세포의 기준 집단으로부터 추출된 이중-가닥 DNA 분자의 기준 집단의 배경 변이 빈도보다 높은, 방법.
83. 예 1 내지 82 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 세포의 집단 또는 세포 집단에서 세포의 하위집단을 사멸하거나 손상시키는, 방법.
84. 예 1 내지 82 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단에서의 세포의 하위집단은 하나 이상의 이미 존재하는 유전자 돌연변이를 갖고, 조작된 게놈 편집 사건 후에, 세포의 하위집단은 세포의 집단 또는 세포 집단에서의 다른 세포보다 높은 정도로 선택적으로 증식하는, 방법.
85. 예 1 내지 82 중 어느 하나에 있어서, 세포의 집단 또는 세포 집단에서의 세포의 하위집단은 상기 세포에 고유한 이미 존재하는 후성적 상태를 갖고, 조작된 게놈 편집 사건 후에, 세포의 하위집단은 세포의 집단 또는 세포 집단에서의 다른 세포보다 높은 정도로 선택적으로 증식하는, 방법.
86. 예 1 내지 85 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 DNA에 돌연변이를 야기하는, 방법.
87. 예 1 내지 86 중 어느 하나에 있어서, 조작된 게놈 편집 사건은 게놈 DNA에서 돌연변이를 복원하는, 방법.
88. 조작된 게놈 편집 사건 후에 세포 집단의 신생물성 가능성을 모니터링하는 방법으로서,
(a) 제1 시점에서 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 하나 이상의 표적 이중-가닥 DNA 분자를 듀플렉스 시퀀싱하는 단계;
(b) 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계;
(c) 제1 시점에서 세포 집단으로부터 기원한 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체의 변이 빈도를 결정하는 단계;
(d) 제2 시점에서 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 하나 이상의 표적 이중-가닥 DNA 분자를 듀플렉스 시퀀싱하는 단계;
(e) 제2 시점에서 세포 집단으로부터 기원한 표적 이중-가닥 DNA 분자 중에서 동일한 하나 이상의 변이체의 변이 빈도를 결정하는 단계; 및
(f) 제1 시점으로부터의 하나 이상의 변이체의 각각에 대한 변이 빈도를 제2 시점으로부터의 하나 이상의 변이체의 각각에 대한 변이 빈도와 비교하는 단계를 포함하는, 방법.
89. 예 88에 있어서, 듀플렉스 시퀀싱하는 단계는 각각
(i) 세포 집단으로부터 기원한 이중-가닥 DNA 분자로부터의 시퀀싱 라이브러리를 준비하는 단계이되, 서열 라이브러리를 준비하는 단계는 복수의 어댑터-DNA 분자를 생성하기 위해 어댑터 분자를 복수의 이중-가닥 DNA 단편에 결찰하는 것을 포함하는 단계;
(ii) 각각의 어댑터-DNA 분자에 대해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 제공하기 위해 어댑터-DNA 분자의 제1 가닥 및 제2 가닥을 시퀀싱하는 단계; 및
(iii) 각각의 어댑터-DNA 분자에 대해, 제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 비교하는 단계를 포함하는, 방법.
90. 예 88 또는 예 89에 있어서, 게놈 편집된 세포의 집단은 게놈-편집된 면역 세포이거나 이를 포함하는, 방법.
91. 예 88 내지 90 중 어느 하나에 있어서, 게놈 편집된 세포의 집단은 제1 시점과 제2 시점 사이에 대상체에게 투여되는, 방법.
92. 예 91에 있어서, 제2 시점으로부터의 변이 빈도가 제1 시점으로부터의 변이 빈도보다 높으면 세포 집단에서의 세포의 클론 팽창이 발생하는 것으로 결정되는, 방법.
93. 예 92에 있어서, 하나 이상의 변이체는 종양 억제자 유전자, 종양유전자, 원종양유전자, 및/또는 암 유발자의 서열에 있는, 방법.
94. 예 92에 있어서, 하나 이상의 변이체는 기능적으로 파괴적인 돌연변이를 포함하는, 방법.
95. 예 92 내지 94 중 어느 하나에 있어서, 적어도 하나의 변이체는 TP53에 있는, 방법.
96. 예 92 내지 95 중 어느 하나에 있어서, 적어도 하나의 변이체는 HRAS, NRAS 또는 KRAS에 있는, 방법.
97. 예 92 내지 96 중 어느 하나에 있어서, 적어도 하나의 변이체는 패신저 돌연변이인, 방법.
98. 예 92 내지 97 중 어느 하나에 있어서, 적어도 하나의 변이체는 비암 유발자 변이체인, 방법.
99. 조작된 게놈 편집 사건 후에 세포 집단을 규명하기 위한 이중 가닥 폴리뉴클레오타이드의 오류 정정된 듀플렉스 시퀀싱에 사용될 수 있는 키트로서, 상기 키트는,
중합효소 연쇄 반응(PCR) 프라이머의 적어도 하나의 세트 및 어댑터 분자의 적어도 하나의 세트이되, 프라이머 및 어댑터 분자는 오류 정정된 듀플렉스 시퀀싱 실험에서 사용될 수 있는 적어도 하나의 세트들; 및
설명서이되,
의도된 게놈 유전좌위에서의 기대된 게놈 서열;
의도되지 않은 게놈 유전좌위에서의 변이체;
암 유발자에서의 돌연변이; 및
하나 이상의 변이체의 변이 빈도
중 하나 이상을 확인하기 위해 세포 집단으로부터 유래된 샘플로부터 추출된 DNA의 오류 정정된 듀플렉스 시퀀싱을 수행하는 데 있어서 키트의 사용 방법에 대한 설명서를 포함하는, 키트.
100. 예 99에 있어서, 시약은 DNA 복구 효소를 포함하는, 키트.
101. 예 99에 있어서, 어댑터 분자의 세트에서의 각각의 어댑터 분자는 적어도 하나의 단일 분자 식별자(SMI) 서열 및 적어도 하나의 가닥 한정 요소를 포함하는, 키트.
102. 예 99에 있어서, 컴퓨터에서 실행될 때, 샘플에서의 하나 이상의 이중-가닥 DNA 분자에 대한 오류-정정된 듀플렉스 시퀀싱 판독을 결정하는 단계 및 오류-정정된 듀플렉스 시퀀싱 판독을 이용하여 게놈 편집 사건 후에 의도된 게놈 유전좌위에서의 서열, 하나 이상의 의도되지 않은 게놈 유전좌위에서의 서열, 변이체, 변이 빈도, 및/또는 게놈 편집된 스펙트럼을 결정하는 단계를 수행하는, 비일시적 컴퓨터 판독 가능한 매체에서 구현된 컴퓨터 프로그램 제품을 추가로 포하하는, 키트.
103. 조작된 게놈 편집 사건 후에 세포 집단을 규명하고/하거나, 세포 집단 내에 세포의 클론 팽창을 검출하기 위한 시스템으로서,
시퀀싱 데이터 및 게놈 편집 데이터에 관한 정보를 전송하기 위한 컴퓨터 네트워크이되, 정보는 원시 시퀀싱 데이터, 듀플렉스 시퀀싱 데이터, 샘플 정보 및 게놈 편집 정보 중 하나 이상을 포함하는 컴퓨터 네트워크;
하나 이상의 사용자 컴퓨팅 장치와 연관되고 컴퓨터 네트워크와 통신하는 클라이언트 컴퓨터;
복수의 게놈 편집 프로필 및 사용자 결과 기록을 저장하기 위한 컴퓨터 네트워크에 연결된 데이터베이스;
컴퓨터 네트워크와 통신하고, 듀플렉스 시퀀싱 데이터를 생성하기 위해 클라이언트 컴퓨터로부터의 원시 시퀀싱 데이터 및 요청을 수신하고, 원래의 이중-가닥 핵산 분자를 나타내는 패밀리로부터의 서열 판독을 그룹화하고, 듀플렉스 시퀀싱 데이터를 생성하기 위해 개별 가닥으로부터의 대표적인 서열을 서로 비교하도록 구성된 듀플렉스 시퀀싱 모듈, 및
컴퓨터 네트워크와 통신하고, 변이체를 확인하기 위해 듀플렉스 시퀀싱 데이터를 기준 서열 정보와 비교하고, 의도된 및/또는 의도되지 않은 게놈 유전좌위에서의 게놈 변경 중 적어도 하나를 포함하는 게놈 편집 데이터를 생성하도록 구성된 게놈 편집 모듈을 포함하는, 시스템.
104. 예 103에 있어서, 게놈 편집 프로필은 하나 이상의 의도된 게놈 유전좌위로부터의 서열 정보를 포함하는, 방법.
105. 예 103에 있어서, 게놈 편집 프로필은 하나 이상의 의도되지 않은 게놈 유전좌위로부터의 서열 정보를 포함하는, 방법.
106. 예 103에 있어서, 게놈 편집 프로필은 세포 집단의 게놈에서의 하나 이상의 변이체에 대한 변이 빈도를 포함하는, 방법.
107. 비일시적 컴퓨터-판독 가능한 저장 매체로서, 하나 이상의 프로세서에 의해 실행될 때, 조작된 게놈 편집 사건 후에 세포 집단을 규명하고/하거나, 세포 집단 내에 세포의 클론 팽창을 검출하기 위해 예 1 내지 98 중 어느 하나의 방법을 수행하는 명령을 포함하는, 비일시적 컴퓨터-판독 가능한 저장 매체.
108. 조작된 게놈 편집 사건 후에 세포 집단을 규명하고/하거나, 세포 집단 내에 세포의 클론 팽창을 검출하기 위해 예 1 내지 98 중 어느 하나의 방법을 수행하기 위한 컴퓨터 시스템으로서, 상기 시스템은 프로세서, 메모리, 데이터베이스 및 프로세(들)에 대한 명령을 포함하는 비일시적 컴퓨터 판독 가능한 저장 매체를 갖는 적어도 하나의 컴퓨터를 포함하고, 상기 프로세서(들)는 예 1 내지 98 중 어느 하나의 방법을 포함하는 연산을 수행하기 위해 상기 명령을 실행하도록 구성된, 컴퓨터 시스템.
109. 예 108에 있어서,
a. 유선 또는 무선 네트워크;
b. 샘플의 폴리뉴클레오타이드 서열을 추출하고 증폭시키고 생성하기 위해 그리고 폴리뉴클레오타이드 서열을 네트워크를 통해 원격 서버로 전송하기 위해 시약을 포함하는 키트의 사용으로부터 도출된 데이터를 수신할 수 있는 복수의 사용자 전자 컴퓨팅 장치; 및
c. 프로세서, 메모리, 데이터베이스, 및 프로세서(들)에 대한 명령을 포함하는 비일시적 컴퓨터 판독 가능한 저장 매체를 포함하는 원격 서버이되, 상기 프로세서(들)는 예 1 내지 98 중 어느 하나의 방법을 포함하는 조작을 수행하기 위해 상기 명령을 실행하도록 구성된 원격서버
를 포함하는 네트워킹 컴퓨터 시스템을 추가로 포함하고;
d. 상기 원격 서버는 게놈 편집 사건으로부터 생긴 변이체 및/또는 클론 팽창 사건을 검출하고 확인할 수 있는, 시스템.
110. 예 109에 있어서, 네트워크를 통해 접근 가능한 데이터베이스 및/또는 제3자 데이터베이스는 하나 이상의 시점에서 세포 집단의 게놈 편집 프로필, 기준 서열, 기대된 게놈 편집된 서열 및 변이 빈도 중 하나 이상을 포함하는 복수의 기록을 추가로 포함하는, 시스템.
111. 비일시적 컴퓨터-판독 가능한 매체로서, 이의 컨텐츠가 적어도 하나의 컴퓨터가 게놈 편집된 세포 집단으로부터의 샘플에서 이중-가닥 핵산 분자에 대한 듀플렉스 시퀀싱 데이터를 제공하기 위해 방법을 수행하게 하고, 상기 방법은,
사용자 컴퓨팅 장치로부터 원시 서열 데이터를 수신하는 단계; 및
샘플에서 복수의 핵산 분자로부터 유래된 복수의 원시 서열 판독을 포함하는 샘플-특정 데이터세트를 생성하는 단계;
원래의 이중-가닥 핵산 분자를 나타내는 패밀리로부터의 서열 판독을 그룹화하는 단계이되, 그룹화는 공유된 단일 분자 식별자 서열에 기초하는 단계;
제1 가닥 서열 판독과 제2 가닥 서열 판독 사이의 하나 이상의 관련성을 확인하기 위해 원래의 이중-가닥 핵산 분자로부터의 제1 가닥 서열 판독 및 제2 가닥 서열 판독을 비교하는 단계; 및
샘플에서 이중-가닥 핵산 분자에 대해 듀플렉스 시퀀싱 데이터를 제공하는 단계를 포함하는, 비일시적 컴퓨터-판독 가능한 매체.
112. 예 111에 있어서, 비교된 제1 서열 판독과 제2 서열 판독 사이의 비상보성의 뉴클레오타이드 위치를 확인하는 단계를 추가로 포함하고, 상기 방법은 비상보성의 위치에서 과정 오류를 확인하고 제거하거나 무시하는 단계를 추가로 포함하는, 컴퓨터-판독 가능한 매체.
113. 비일시적 컴퓨터-판독 가능한 매체로서, 이의 컨텐츠가 적어도 하나의 컴퓨터가 세포 집단에서의 게놈 편집 사건으로부터 생긴 의도된 게놈 유전좌위에서의 편집된 서열을 검출하고 확인하기 위해 방법을 수행하게 하고, 상기 방법은,
복수의 대상 서열을 포함하는 듀플렉스 서열 데이터를 기준 서열 정보와 비교하는 단계;
듀플렉스 서열 데이터에서의 서열 관련성 및/또는 변이를 확인하는 단계이되, 변이는 의도된 게놈 유전좌위에서의 기준 정보과의 비동의의 영역으로서 확인되는 단계;
듀플렉스 서열 데이터에서 복수의 대상 서열 중에서 기대된 게놈 편집된 서열의 빈도를 결정하는 단계;
듀플렉스 서열 데이터로부터 게놈 편집된 스펙트럼을 생성하는 단계; 및
게놈 편집 데이터를 제공하는 단계를 포함하는, 비일시적 컴퓨터-판독 가능한 매체.
114. 비일시적 컴퓨터-판독 가능한 매체로서, 이의 컨텐츠가 적어도 하나의 컴퓨터가 세포 집단에서의 게놈 편집 사건으로부터 생긴 의도되지 않은 게놈 유전좌위에서의 편집된 서열을 검출하고 확인하기 위해 방법을 수행하게 하고, 상기 방법은,
복수의 대상 서열을 포함하는 듀플렉스 서열 데이터를 기준 서열 정보와 비교하는 단계;
듀플렉스 서열 데이터에서의 서열 관련성 및/또는 변이를 확인하는 단계이되, 변이는 의도되지 않은 게놈 유전좌위에서의 기준 정보과의 비동의의 영역으로서 확인되는 단계;
대상 서열이 의도되지 않은 게놈 유전좌위에서의 변이체를 포함하는지를 결정하는 단계;
변이체가 존재하면, 듀플렉스 서열 데이터 내의 변이체의 변이 빈도를 결정하는 단계;
듀플렉스 서열 데이터로부터 게놈 편집된 스펙트럼을 생성하는 단계; 및
게놈 편집 데이터를 제공하는 단계를 포함하는, 비일시적 컴퓨터-판독 가능한 매체.
115. 비일시적 컴퓨터-판독 가능한 매체로서, 이의 컨텐츠가 적어도 하나의 컴퓨터가 게놈 편집 사건 후에 세포 집단에서의 세포의 클론 팽창을 검출하고 확인하기 위해 방법을 수행하게 하고, 상기 방법은,
게놈 편집된 세포 집단으로부터 기원한 샘플로부터 생성된 듀플렉스 시퀀싱 데이터를 사용하여 표적 게놈 영역에서의 서열 변이체를 확인하는 단계;
시험 샘플 및 대조군 샘플의 변이체 대립유전자 빈도(VAF)를 계산하는 단계;
VAF가 대조군 그룹에서보다 시험 그룹에서 더 높은지를 결정하는 단계;
VAF가 더 높은 샘플에서, 서열 변이체가 비일중항인지를 결정하는 단계;
VAF가 더 높은 샘플에서, 서열 변이체가 유발자 돌연변이인지를 결정하는 단계; 및
비일중항 및/또는 유발자 돌연변이를 갖는 샘플을 클론 팽창을 겪을 것으로 의심되는 것으로서 규명하는 단계를 포함하는, 비일시적 컴퓨터-판독 가능한 매체.
116. 예 115에 있어서, 게놈 편집된 세포 집단에 대한 안전성 역치를 평가하는 단계 및/또는 게놈 편집된 세포 집단에 의해 대상체를 치료하는 것과 연관된 위험을 결정하는 단계를 추가로 포함하는, 비일시적 컴퓨터-판독 가능한 매체.
결론
본 기술내용의 실시형태의 상기 상세한 설명은 배타적이거나 본 기술내용을 상기 개시된 정확한 형태로 제한하도록 의도되지 않는다. 본 기술내용의 특정 실시형태 및 본 기술내용에 대한 예가 예시적인 목적을 위해 상기에 기재되어 있지만, 당업자가 인식하는 것처럼 본 기술내용의 범위 내에 다양한 동등한 변형이 가능하다. 예를 들어, 단계가 소정의 순서로 제시되지만, 대안적인 실시형태는 상이한 순서로 단계를 수행할 수 있다. 본원에 기재된 다양한 실시형태는 또한 추가의 실시형태를 제공하도록 조합될 수 있다. 본원에서 인용된 모든 참고문헌은 본원에 완전히 기재된 것처럼 참조로 포함된다.
상기로부터, 본 기술내용의 특정 실시형태가 예시의 목적을 위해 본원에 기재되어 있지만, 잘 알려진 구조 및 기능이 본 기술내용의 실시형태의 설명을 불필요하게 모호하게 하는 것을 피하도록 자세히 도시되거나 기재되지 않는다고 이해될 것이다. 상황이 허용하는 경우, 단수 용어 또는 복수 용어는 또한 각각 복수 용어 또는 단수 용어를 포함할 수 있다.
더구나, 단어 "또는"이 2개 이상의 항목의 목록과 관련하여 다른 항목을 배제한 단일 항목을 오직 의미하는 것으로 명확히 제한되지 않는 한, 이러한 목록에서의 "또는"의 사용은 (a) 목록에서의 임의의 단일 항목, (b) 목록에서의 모든 항목 또는 (c) 목록에서의 항목의 임의의 조합을 포함하는 것으로 해석되어야 한다. 추가적으로, 용어 "포함하는"은 임의의 더 많은 수의 동일한 특징 및/또는 추가 유형의 다른 특징이 불가능하지 않도록 적어도 인용된 특징(들)을 포함함을 의미하는 것으로 도처에 사용된다. 특정 실시형태가 예시의 목적을 위해 본원에 기재되어 있지만, 본 기술내용으로부터 벗어나지 않으면서 다양한 변형이 이루어질 수 있는 것으로 또한 이해될 것이다. 추가로, 본 기술내용의 소정의 실시형태와 연관된 이점이 이 실시형태의 상황에서 기재되어 있지만, 다른 실시형태가 또한 이러한 이점을 나타낼 수 있고, 모든 실시형태는 본 기술내용의 범위 내에 해당하는 이러한 이점을 반드시 나타낼 필요는 없다. 따라서, 본 개시내용 및 연관된 기술내용은 본원에 명확히 도시되거나 기재되지 않은 다른 실시형태를 포괄할 수 있다.

Claims (55)

  1. 의도된 게놈 유전좌위에 지향된 조작된 게놈 편집 사건 후에 세포 집단을 규명하는 방법으로서, 상기 방법은,
    (a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 이중-가닥 DNA 분자를 포함하는 샘플을 제공하는 단계;
    (b) 복수의 이중-가닥 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계이되,
    복수의 어댑터-DNA 분자를 생성하기 위해 어댑터 분자를 복수의 이중-가닥 DNA 분자에 결찰하는 것;
    어댑터-DNA 분자의 원래의 제1 가닥의 카피의 세트 및 어댑터-DNA 분자의 원래의 제2 가닥의 카피의 세트를 생성하는 것;
    제1 가닥 서열 및 제2 가닥 서열을 제공하기 위해 원래의 제1 가닥 및 제2 가닥의 하나 이상의 카피를 시퀀싱하는 것;
    제1 가닥 서열과 제2 가닥 서열 사이의 하나 이상의 관련성을 확인하기 위해 제1 가닥 서열 및 제2 가닥 서열을 비교하는 것을 포함하는 단계; 및
    (c) 의도된 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기대된 게놈 편집된 DNA 서열과 비교하는 단계; 또는
    (d) 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독을 기준 게놈 DNA 서열과 비교하는 단계를 포함하는, 방법.
  2. 청구항 1에 있어서, 상기 방법은 단계 (c) 및 단계 (d) 둘 다를 포함하는, 방법.
  3. 청구항 1 또는 청구항 2에 있어서, 복수의 이중-가닥 DNA 분자의 각각에 대한 오류-정정된 서열 판독을 생성하는 단계는 복수의 농후화된 어댑터-DNA 분자를 제공하기 위해 시퀀싱 전에 하나 이상의 표적화된 게놈 영역을 선택적으로 농후화하는 단계를 추가로 포함하는, 방법.
  4. 청구항 4에 있어서, 상기 하나 이상의 표적화된 게놈 영역은 게놈에서의 의도된 게놈 유전좌위를 포함하는, 방법.
  5. 청구항 4에 있어서, 상기 하나 이상의 표적화된 게놈 영역은 게놈에서의 적어도 하나의 의도되지 않은 게놈 유전좌위를 포함하는, 방법.
  6. 청구항 1 내지 5 중 어느 한 항에 있어서, 상기 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계를 추가로 포함하는, 방법.
  7. 청구항 6에 있어서, 상기 하나 이상의 변이체는 의도된 게놈 유전좌위의 서열에서의 부정확한 돌연변이를 포함하는, 방법.
  8. 청구항 7에 있어서, 게놈 편집을 위한 의도된 게놈 유전좌위의 서열에서의 부정확한 돌연변이는 비상동성 말단 연결(NHEJ: non-homologous end joining) 사건으로 인한, 방법.
  9. 청구항 6에 있어서, 하나 이상의 변이체는 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독에서 확인되는, 방법.
  10. 청구항 6 내지 9 중 어느 한 항에 있어서, 상기 하나 이상의 변이체는 기능적으로 파괴적인 돌연변이를 포함하는, 방법.
  11. 청구항 6 또는 청구항 9에 있어서, (e) 복수의 이중 가닥 DNA 분자 중에서 하나 이상의 변이체의 빈도를 결정하는 단계를 추가로 포함하는, 방법.
  12. 청구항 1 내지 11 중 어느 한 항에 있어서, 상기 의도된 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독이 기대된 게놈 편집된 DNA 서열을 포함하는지를 결정하는 단계를 추가로 포함하는, 방법.
  13. 청구항 12에 있어서, 상기 의도된 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독 중에서 기대된 게놈 편집된 DNA 서열의 빈도를 결정하는 단계를 추가로 포함하는, 방법.
  14. 청구항 12에 있어서, 상기 의도된 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독 중에서 원치 않는 DNA 서열의 빈도를 결정하는 단계를 추가로 포함하는, 방법.
  15. 청구항 1 내지 14 중 어느 한 항에 있어서, 상기 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 하나 이상의 오류-정정된 서열 판독이 변이체를 포함하는지를 결정하는 단계를 추가로 포함하는, 방법.
  16. 청구항 1 내지 15 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 복수의 의도된 게놈 유전좌위에 지향된, 방법.
  17. 청구항 1 내지 16 중 어느 한 항에 있어서, 단계 (d)는 복수의 의도되지 않은 게놈 유전좌위에서의 서열을 포함하는 오류-정정된 서열 판독을 기준 게놈 DNA 서열과 비교하는 단계를 포함하는, 방법.
  18. 청구항 17에 있어서, 상기 의도되지 않은 게놈 유전좌위는 돌연변이-민감 부위, 미세부수체 유전좌위, 의도된 게놈 유전좌위와 서열 상동성을 갖는 서열, 및/또는 암 유발자 중 하나 이상을 포함하는, 방법.
  19. 청구항 1 내지 18 중 어느 한 항에 있어서, 상기 의도되지 않은 게놈 유전좌위는 의도된 게놈 유전좌위에서의 서열과 적어도 부분적으로 유사한 핵산 서열을 갖는, 방법.
  20. 청구항 1 내지 19 중 어느 한 항에 있어서, 상기 의도되지 않은 게놈 유전좌위는 종양 억제자 유전자, 종양유전자, 원종양유전자, 및/또는 암 유발자의 서열을 포함하는, 방법.
  21. 조작된 게놈 편집 사건 후에 세포 집단에서의 세포의 클론 팽창을 검출하고/하거나 정량화하는 방법으로서,
    (a) 조작된 게놈 편집 사건 후에 세포 집단으로부터 기원한 하나 이상의 표적 이중-가닥 DNA 분자를 듀플렉스 시퀀싱하는 단계;
    (b) 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체를 확인하는 단계;
    (c) 세포 집단으로부터 기원한 표적 이중-가닥 DNA 분자 중에서 하나 이상의 변이체의 변이 빈도를 결정하는 단계; 및
    (d) 하나 이상의 변이체의 각각에 대한 변이 빈도를 예상된 변이 빈도와 비교하는 단계를 포함하는, 방법.
  22. 청구항 21에 있어서, 상기 하나 이상의 변이체의 변이 빈도는 관심 게놈 유전좌위에 맵핑된 듀플렉스 시퀀싱된 표적 이중-가닥 DNA 분자의 총수마다 관심 게놈 유전좌위에 맵핑된 규정된 변이체를 갖는 듀플렉스 시퀀싱된 표적 이중-가닥 DNA 분자의 수를 계산함으로써 결정되는, 방법.
  23. 청구항 21 또는 22 중 어느 한 항에 있어서, 상기 하나 이상의 변이체의 변이 빈도는 역치 변이 빈도보다 높은, 방법.
  24. 청구항 21 내지 23 중 어느 한 항에 있어서, 상기 하나 이상의 변이체는 기준 세포 집단으로부터의 서열에 대하여 확인되는, 방법.
  25. 청구항 21 내지 24 중 어느 한 항에 있어서, 상기 방법 단계 (a) 내지 (c)는 사건 후 제1 시점에서 및 사건 후 제2 시점에서 수행되고, 제2 시점은 제1 시점 후이고, 제1 시점으로부터의 변이 빈도는 예상된 변이 빈도인, 방법.
  26. 청구항 25에 있어서, 상기 제1 시점 및 제2 시점 둘 다는 조작된 게놈 편집 사건 후에 약 30일 내, 약 45일 내, 약 60일 내, 약 75일 내 또는 약 90일 내인, 방법.
  27. 청구항 25 내지 26 중 어느 한 항에 있어서, 상기 제2 시점으로부터의 변이 빈도가 제1 시점으로부터의 변이 빈도보다 높으면 세포 집단에서의 세포의 클론 팽창이 발생하는 것으로 결정되는, 방법.
  28. 청구항 21 내지 27 중 어느 한 항에 있어서, 상기 변이 빈도가 예상된 변이 빈도보다 높으면 세포 집단에서의 세포의 클론 팽창이 발생하는 것으로 결정되는, 방법.
  29. 청구항 27 또는 청구항 28에 있어서, 상기 세포의 클론 팽창은 비정상 세포 증식성 상태, 암 유사 상태, 전암성 상태 또는 현장 효과(field effect)를 나타내는, 방법.
  30. 청구항 21에 있어서, 상기 예상된 변이 빈도는 조작된 게놈 편집 사건을 겪지 않는 필적하는 세포 집단으로부터 결정되는, 방법.
  31. 청구항 21 내지 30 중 어느 한 항에 있어서, 상기 하나 이상의 변이체는 게놈 편집에 대한 의도된 유전좌위 밖의 하나 이상의 위치에 있는, 방법.
  32. 청구항 21 내지 31 중 어느 한 항에 있어서, 상기 하나 이상의 변이체는 종양 억제자 유전자, 종양유전자, 원종양유전자, 및/또는 암 유발자의 서열에 있는, 방법.
  33. 청구항 21 내지 32 중 어느 한 항에 있어서, 상기 하나 이상의 변이체는 기능적으로 파괴적인 돌연변이를 포함하는, 방법.
  34. 청구항 21 내지 33 중 어느 한 항에 있어서, 적어도 하나의 변이체는 TP53에 있는, 방법.
  35. 청구항 21 내지 34 중 어느 한 항에 있어서, 적어도 하나의 변이체는 HRAS, NRAS 또는 KRAS에 있는, 방법.
  36. 청구항 21 내지 35 중 어느 한 항에 있어서, 적어도 하나의 변이체는 패신저 돌연변이인, 방법.
  37. 청구항 21 내지 36 중 어느 한 항에 있어서, 적어도 하나의 변이체는 비암 유발자 변이체인, 방법.
  38. 청구항 1 내지 37 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단은 다능성 줄기 세포, 배아 줄기 세포, 면역 세포 또는 식물 세포이거나 이를 포함하는, 방법.
  39. 청구항 1 내지 38 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단은 인간 환자로부터 유래된, 방법.
  40. 청구항 39에 있어서, 상기 인간 환자로부터 얻은 이중-가닥 DNA 분자는 조직, 순환 세포, 혈장에서의 무세포 DNA, 다른 체액에서의 무세포 DNA, 엑소좀 DNA, 조직에 의해 분비된 세포, 및/또는 생검으로부터 얻어지는, 방법.
  41. 청구항 1 내지 39 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단은 세포 배양에서 성장하는, 방법.
  42. 청구항 1 내지 39 또는 41 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단은 인간 또는 동물 대상체로부터 유래된, 방법.
  43. 청구항 1 내지 42 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단은 이종이식으로부터 유래된, 방법.
  44. 청구항 1 내지 43 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 표적 엔도뉴클레아제-매개된 편집 사건인, 방법.
  45. 청구항 1 내지 44 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 Cas9-매개된 편집 사건인, 방법.
  46. 청구항 1 내지 44 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 CPF1-매개된 편집 사건인, 방법.
  47. 청구항 1 내지 44 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 변형된 CAS 또는 CPF-1 매개된 사건인, 방법.
  48. 청구항 1 내지 44 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 TALON, MEGATAL, 징크-핑거 뉴클레아제, 호밍 엔도뉴클레아제 또는 제한 엔도뉴클레아제에 의해 수행되는, 방법.
  49. 청구항 1 내지 73 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 폴리뉴클레오타이드 기질-매개된 상동성 재조합 사건인, 방법.
  50. 청구항 1 내지 73 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 레트로바이러스 또는 다른 바이러스에 의해 수행되는, 방법.
  51. 청구항 1 내지 72 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단은 CRISPR/Cas9 시스템을 사용하여 편집되는, 방법.
  52. 청구항 21에 있어서, 상기 하나 이상의 변이체의 변이 빈도는 조작된 게놈 편집 사건을 겪지 않은 세포의 기준 집단으로부터 추출된 이중-가닥 DNA 분자의 기준 집단의 배경 변이 빈도보다 높은, 방법.
  53. 청구항 1 내지 52 중 어느 한 항에 있어서, 상기 조작된 게놈 편집 사건은 세포의 집단 또는 세포 집단에서 세포의 하위집단을 사멸하거나 손상시키는, 방법.
  54. 청구항 1 내지 52 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단에서의 세포의 하위집단은 하나 이상의 이미 존재하는 유전자 돌연변이를 갖고, 조작된 게놈 편집 사건 후에, 세포의 하위집단은 세포의 집단 또는 세포 집단에서의 다른 세포보다 높은 정도로 선택적으로 증식하는, 방법.
  55. 청구항 1 내지 52 중 어느 한 항에 있어서, 상기 세포의 집단 또는 세포 집단에서의 세포의 하위집단은 상기 세포에 고유한 이미 존재하는 후성적 상태를 갖고, 조작된 게놈 편집 사건 후에, 세포의 하위집단은 세포의 집단 또는 세포 집단에서의 다른 세포보다 높은 정도로 선택적으로 증식하는, 방법.
KR1020217000422A 2018-07-12 2019-07-12 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약 KR20210059694A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862697397P 2018-07-12 2018-07-12
US62/697,397 2018-07-12
PCT/US2019/041735 WO2020014693A1 (en) 2018-07-12 2019-07-12 Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications

Publications (1)

Publication Number Publication Date
KR20210059694A true KR20210059694A (ko) 2021-05-25

Family

ID=69142886

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217000422A KR20210059694A (ko) 2018-07-12 2019-07-12 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약

Country Status (11)

Country Link
US (3) US20210269873A1 (ko)
EP (1) EP3821004A4 (ko)
JP (1) JP2021530219A (ko)
KR (1) KR20210059694A (ko)
CN (1) CN112673099A (ko)
AU (1) AU2019300172A1 (ko)
BR (1) BR112021000409A2 (ko)
CA (1) CA3105659A1 (ko)
IL (1) IL280019A (ko)
SG (1) SG11202100141SA (ko)
WO (1) WO2020014693A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109971852A (zh) 2014-04-21 2019-07-05 纳特拉公司 检测染色体片段中的突变和倍性
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
CA3006792A1 (en) 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
CA3050247A1 (en) 2017-01-18 2018-07-26 Illumina, Inc. Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
CN110799653A (zh) 2017-05-01 2020-02-14 伊鲁米那股份有限公司 用于多重大规模平行测序的最佳索引序列
US11028436B2 (en) 2017-05-08 2021-06-08 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
CA3081027A1 (en) 2017-11-08 2019-05-16 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
JP7420388B2 (ja) * 2018-02-13 2024-01-23 ツインストランド・バイオサイエンシズ・インコーポレイテッド 遺伝毒性を検出し、評価するための方法および試薬
US20210292836A1 (en) * 2018-05-16 2021-09-23 Twinstrand Biosciences, Inc. Methods and reagents for resolving nucleic acid mixtures and mixed cell populations and associated applications
WO2020014693A1 (en) 2018-07-12 2020-01-16 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
EP4256051A1 (en) * 2020-12-04 2023-10-11 University of Copenhagen Crispr/cas screening system materials and methods

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US5308751A (en) 1992-03-23 1994-05-03 General Atomics Method for sequencing double-stranded DNA
JP3456703B2 (ja) 1992-07-06 2003-10-14 プレジデント アンド フェローズ オブ ハーバード カレッジ リポーター遺伝子に融合した細菌のストレスプロモーターを用いる毒性を測定するための方法および診断用キット
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6087099A (en) 1997-09-08 2000-07-11 Myriad Genetics, Inc. Method for sequencing both strands of a double stranded DNA in a single sequencing reaction
US6361947B1 (en) 1998-10-27 2002-03-26 Affymetrix, Inc. Complexity management and analysis of genomic DNA
US6958225B2 (en) 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
EP1238105A2 (en) 1999-12-02 2002-09-11 Molecular Staging Inc. Generation of single-strand circular dna from linear self-annealing segments
US7300751B2 (en) 2000-06-30 2007-11-27 Syngenta Participations Ag Method for identification of genetic markers
US6632611B2 (en) 2001-07-20 2003-10-14 Affymetrix, Inc. Method of target enrichment and amplification
US7297778B2 (en) 2001-07-25 2007-11-20 Affymetrix, Inc. Complexity management of genomic DNA
JP4377689B2 (ja) 2001-10-15 2009-12-02 バイオアレイ ソリューションズ リミテッド 同時尋問及び酵素仲介検出による多型遺伝子座の複合分析
US7406385B2 (en) 2001-10-25 2008-07-29 Applera Corporation System and method for consensus-calling with per-base quality values for sample assemblies
US7459273B2 (en) 2002-10-04 2008-12-02 Affymetrix, Inc. Methods for genotyping selected polymorphism
WO2004065582A2 (en) 2003-01-15 2004-08-05 Dana-Farber Cancer Institute, Inc. Amplification of dna in a hairpin structure, and applications
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
JP2007524410A (ja) 2004-01-23 2007-08-30 リングヴィテ エーエス ポリヌクレオチドライゲーション反応の改良
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
WO2006113422A2 (en) 2005-04-13 2006-10-26 The Government Of The Usa As Represented By The Secretary Of The Dept. Of Health And Human Services Human sweet and umami taste receptor variants
CN105039313B (zh) 2005-06-23 2018-10-23 科因股份有限公司 用于多态性的高通量鉴定和检测的策略
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
JP5237099B2 (ja) 2005-09-29 2013-07-17 キージーン ナムローゼ フェンノートシャップ 変異させた集団のハイスループットスクリーニング
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
PT2963127T (pt) 2006-04-04 2017-10-06 Keygene Nv Detecção de alto rendimento de marcadores moleculares com base em fragmentos de restrição
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2009036525A2 (en) 2007-09-21 2009-03-26 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
CN104862383B (zh) 2008-03-28 2019-05-28 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
WO2010056728A1 (en) 2008-11-11 2010-05-20 Helicos Biosciences Corporation Nucleic acid encoding for multiplex analysis
AU2010209528B2 (en) 2009-01-30 2015-10-01 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
US20100331204A1 (en) 2009-02-13 2010-12-30 Jeff Jeddeloh Methods and systems for enrichment of target genomic sequences
GB0905410D0 (en) 2009-03-28 2009-05-13 Gentronix Ltd Genotoxicity testing
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
US20120165202A1 (en) 2009-04-30 2012-06-28 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
EP2248914A1 (en) 2009-05-05 2010-11-10 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. The use of class IIB restriction endonucleases in 2nd generation sequencing applications
WO2010148115A1 (en) 2009-06-18 2010-12-23 The Penn State Research Foundation Methods, systems and kits for detecting protein-nucleic acid interactions
ES2562159T3 (es) 2009-08-20 2016-03-02 Population Genetics Technologies Ltd. Composiciones y métodos para el reordenamiento de ácido nucleico molecular
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP4242327A3 (en) 2010-06-09 2023-11-29 Keygene N.V. Combinatorial sequence barcodes for high throughput screening
US20120238738A1 (en) 2010-07-19 2012-09-20 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
US20120244525A1 (en) 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
CN110878345A (zh) 2010-09-21 2020-03-13 安捷伦科技有限公司 通过分子计数提高等位基因调用的置信度
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
WO2012061832A1 (en) 2010-11-05 2012-05-10 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
DK2652155T3 (en) 2010-12-16 2017-02-13 Gigagen Inc Methods for Massive Parallel Analysis of Nucleic Acids in Single Cells
US9150852B2 (en) 2011-02-18 2015-10-06 Raindance Technologies, Inc. Compositions and methods for molecular labeling
WO2012129242A2 (en) 2011-03-23 2012-09-27 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US9476095B2 (en) 2011-04-15 2016-10-25 The Johns Hopkins University Safe sequencing system
DK2729580T3 (en) 2011-07-08 2015-12-14 Keygene Nv SEQUENCE BASED genotyping BASED ON OLIGONUKLEOTIDLIGERINGSASSAYS
US10767208B2 (en) 2011-09-06 2020-09-08 Gen-Probe Incorporated Closed nucleic acid structures
AU2012304328B2 (en) 2011-09-09 2017-07-20 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
SG11201404243WA (en) 2012-01-26 2014-08-28 Nugen Technologies Inc Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US20160153039A1 (en) 2012-01-26 2016-06-02 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
LT3363901T (lt) 2012-02-17 2021-04-12 Fred Hutchinson Cancer Research Center Kompozicijos ir būdai, skirti tiksliam mutacijų nustatymui
ES2776673T3 (es) 2012-02-27 2020-07-31 Univ North Carolina Chapel Hill Métodos y usos para etiquetas moleculares
US9670529B2 (en) 2012-02-28 2017-06-06 Population Genetics Technologies Ltd. Method for attaching a counter sequence to a nucleic acid sample
EP2825675B1 (en) 2012-03-13 2017-12-27 Patel, Abhijit Ajit Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
ES2828661T3 (es) 2012-03-20 2021-05-27 Univ Washington Through Its Center For Commercialization Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
US9487828B2 (en) 2012-05-10 2016-11-08 The General Hospital Corporation Methods for determining a nucleotide sequence contiguous to a known target nucleotide sequence
AU2013267609C1 (en) 2012-05-31 2019-01-03 Board Of Regents, The University Of Texas System Method for accurate sequencing of DNA
CN110872617A (zh) 2012-09-04 2020-03-10 夸登特健康公司 检测稀有突变和拷贝数变异的***和方法
CN102877136B (zh) 2012-09-24 2014-03-12 上海交通大学 基于基因组简化与二代测序dna文库构建方法及试剂盒
WO2014071070A1 (en) 2012-11-01 2014-05-08 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
AU2013337616B2 (en) 2012-11-05 2019-03-21 Gmdx Co Pty Ltd Methods for determining the cause of somatic mutagenesis
ES2724824T3 (es) 2013-03-13 2019-09-16 Illumina Inc Métodos para la secuenciación de ácidos nucleicos
US10087481B2 (en) 2013-03-19 2018-10-02 New England Biolabs, Inc. Enrichment of target sequences
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
WO2015100427A1 (en) 2013-12-28 2015-07-02 Guardant Health, Inc. Methods and systems for detecting genetic variants
ES2908644T3 (es) 2014-01-31 2022-05-03 Swift Biosciences Inc Procedimientos mejorados para el procesamiento de sustratos de ADN
WO2016040901A1 (en) 2014-09-12 2016-03-17 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acids
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US10465241B2 (en) 2015-06-15 2019-11-05 The Board Of Trustees Of The Leleand Stanford Junior University High resolution STR analysis using next generation sequencing
GB201515557D0 (en) 2015-09-02 2015-10-14 14M Genomics Ltd Method of sequencing
WO2017079428A1 (en) * 2015-11-04 2017-05-11 President And Fellows Of Harvard College Site specific germline modification
WO2017087702A1 (en) 2015-11-18 2017-05-26 Pacific Biosciences Of California, Inc. Loading nucleic acids onto substrates
CN108291253A (zh) * 2015-11-25 2018-07-17 综合基因技术公司 用于变体检测的方法
CA3006792A1 (en) * 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
US11821028B2 (en) 2016-07-12 2023-11-21 QIAGEN Sciences, LLP Single end duplex DNA sequencing
WO2018031588A1 (en) 2016-08-09 2018-02-15 Takara Bio Usa, Inc. Nucleic acid adaptors with molecular identification sequences and use thereof
CN106367485B (zh) 2016-08-29 2019-04-26 厦门艾德生物医药科技股份有限公司 一种用于检测基因突变的多定位双标签接头组及其制备方法和应用
CA3057867A1 (en) 2017-03-23 2018-09-27 University Of Washington Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing
EP3601610A1 (en) * 2017-03-30 2020-02-05 Pioneer Hi-Bred International, Inc. Methods of identifying and characterizing gene editing variations in nucleic acids
US11584958B2 (en) 2017-03-31 2023-02-21 Grail, Llc Library preparation and use thereof for sequencing based error correction and/or variant identification
CA3081027A1 (en) 2017-11-08 2019-05-16 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
JP7420388B2 (ja) 2018-02-13 2024-01-23 ツインストランド・バイオサイエンシズ・インコーポレイテッド 遺伝毒性を検出し、評価するための方法および試薬
SG11202008929WA (en) 2018-03-15 2020-10-29 Twinstrand Biosciences Inc Methods and reagents for enrichment of nucleic acid material for sequencing applications and other nucleic acid material interrogations
EP3768853A4 (en) 2018-03-23 2021-04-28 Board Of Regents The University Of Texas System EFFICIENT SEQUENCING OF DSDNA WITH EXTREMELY LOW ERROR RATE
JP2021520816A (ja) * 2018-04-14 2021-08-26 ナテラ, インコーポレイテッド 循環腫瘍dnaの個別化された検出を用いる癌検出およびモニタリングの方法
US20210292836A1 (en) 2018-05-16 2021-09-23 Twinstrand Biosciences, Inc. Methods and reagents for resolving nucleic acid mixtures and mixed cell populations and associated applications
WO2020014693A1 (en) 2018-07-12 2020-01-16 Twinstrand Biosciences, Inc. Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
EP4114978A4 (en) 2020-03-06 2024-07-03 Singular Genomics Systems Inc SEQUENCING OF LINKED PAIRED STRANDS

Also Published As

Publication number Publication date
JP2021530219A (ja) 2021-11-11
US11845985B2 (en) 2023-12-19
IL280019A (en) 2021-03-01
SG11202100141SA (en) 2021-02-25
BR112021000409A2 (pt) 2021-04-06
US20240209436A1 (en) 2024-06-27
AU2019300172A1 (en) 2021-01-28
CA3105659A1 (en) 2020-01-16
US20230002820A1 (en) 2023-01-05
EP3821004A1 (en) 2021-05-19
WO2020014693A1 (en) 2020-01-16
US20210269873A1 (en) 2021-09-02
CN112673099A (zh) 2021-04-16
EP3821004A4 (en) 2022-04-20

Similar Documents

Publication Publication Date Title
US11845985B2 (en) Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
US12006532B2 (en) Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing
JP7420388B2 (ja) 遺伝毒性を検出し、評価するための方法および試薬
KR20210013061A (ko) 핵산 혼합물 및 혼합된 세포 집단을 해상하기 위한 방법 및 시약 및 관련 응용
CN108220392A (zh) 富集和确定靶核苷酸序列的方法
JP2017522866A (ja) 核酸配列の分析
JP2022505050A (ja) プーリングを介した多数の試料の効率的な遺伝子型決定のための方法および試薬
JP2020536509A (ja) 体細胞および生殖細胞系統バリアントを鑑別するための方法およびシステム
KR20210052501A (ko) 샘플 사이의 오염을 검출하기 위한 방법 및 시스템
Shoura et al. Beyond the linear genome: Comprehensive determination of the endogenous circular elements in C. elegans and human genomes via an unbiased genomic-biophysical method