KR20180053748A - 시퀀싱(circle-seq)에 의한 절단 반응의 포괄적인 시험관내 보고 - Google Patents

시퀀싱(circle-seq)에 의한 절단 반응의 포괄적인 시험관내 보고 Download PDF

Info

Publication number
KR20180053748A
KR20180053748A KR1020187011550A KR20187011550A KR20180053748A KR 20180053748 A KR20180053748 A KR 20180053748A KR 1020187011550 A KR1020187011550 A KR 1020187011550A KR 20187011550 A KR20187011550 A KR 20187011550A KR 20180053748 A KR20180053748 A KR 20180053748A
Authority
KR
South Korea
Prior art keywords
dna
seq
target
sequencing
nuclease
Prior art date
Application number
KR1020187011550A
Other languages
English (en)
Inventor
제이. 키쓰 종
쉔다르 차이
Original Assignee
더 제너럴 하스피탈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 제너럴 하스피탈 코포레이션 filed Critical 더 제너럴 하스피탈 코포레이션
Publication of KR20180053748A publication Critical patent/KR20180053748A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1031Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

세포 유형-특이적 게놈 DNA 샘플로부터 잠재적인 CRISPR-Cas9 오프-타겟 절단 부위를 게놈-와이드 탐지하기 위한 민감하고 편향되지 않은 방법.

Description

시퀀싱(CIRCLE-SEQ)에 의한 절단 반응의 포괄적인 시험관내 보고
우선권 주장
본 출원은 2015년 9월 30일자로 출원된 미국 특허출원 일련번호 제62/235,154호의 이익을 주장한다. 상기 내용의 전체 내용은 본 명세서에 참고로 포함된다.
연방 후원 연구 또는 개발
본 발명은 국립 보건원(National Institutes of Health)에 의해 부여된 허가번호 DP1 GM105378에 따른 정부 지원으로 이루어졌다. 정부는 본 발명에 대해 특정 권리를 가진다.
기술분야
본원에 기술된 것은 CRISPR-Cas9 뉴클레아제와 같은 조작된 뉴클레아제의 게놈-와이드 절단 특이성을 정의하는 시험관내 방법이다.
징크 핑거, TALENs, 및 CRISPR-Cas9 뉴클레아제를 포함한 조작된 뉴클레아제 기술은 생물의학 연구에 혁명을 일으키고, 유전자 기반 질병의 치료에 중요한 새로운 양상을 제공한다. 이러한 방법을 인간 치료법으로 해석하기 위해서는 오프-타겟(off-target) 효과의 민감한 탐지가 중요하다. 오프-타겟을 발견하기 위한 시험관내 생화학적 방법은 살아있는 세포의 배양 및 조작을 필요로 하는 전략과 관련된 한계를 피하면서 더 큰 재현성 및 확장성의 잠재적인 잇점을 제공한다.
적어도 부분적으로, 본 발명은 세포 유형-특이적 게놈 DNA 샘플로부터 잠재적으로 조작된 뉴클레아제(예를 들어, CRISPR-Cas9) 오프-타겟 절단 부위의 게놈-와이드 탐지를 위한 민감하고, 비-편향적인 방법의 개발에 기초한다. 본 방법은 절단-특이적 농축 및 시퀀싱(sequencing)을 위한 출발 집단으로서, 매우 적은 유리(free) DNA 말단을 갖는 게놈 DNA 분자 집단을 생성하기 위해 공유결합으로 닫힌 DNA 분자의 엑소뉴클레아제 선택을 사용한다. 인간 게놈 DNA로부터 > 500,000X인 것으로 추정되는, 이들 절단된 단편들의 풍부화는 전체-게놈 시퀀싱에 의존하고 훨씬 높은 배경을 가지고있는 Digenome-Seq와 같은 방법(Kim et al., Nat Methods. 2015 Mar;12(3):237-43)과 대조적으로, 시험관내에서 절단된 DNA 단편의 매우 시퀀싱-효율적인 발견을 가능하게 한다. 최적화 후, 본 시험관내 분석은 인간 U2OS 세포에서 수행되고 Tsai et al., Nat Biotechnol. 2015 Feb;33(2):187-97에 기술된 VEGFA 부위 1EMX1 타겟 부위 뿐만 아니라 GUIDE-seq 실험에서 발견되지 않은 추가의 새로운 오프-타겟 부위에서의 세포내 GUIDE-seq 분석에 의해 탐지된 오프-타겟 절단 부위의 100%를 탐지하였다(즉, 본 시험관내 분석은 GUIDE-seq 탐지된 절단 부위의 상위 집합을 탐지함).
스템-루프 또는 헤어핀 어댑터의 결찰, 엑소뉴클레아제 선택, 스템-루프의 효소적 개방 및 말단 수선, 및 분자내 결찰에 의한 최소화된 수의 DNA 이중-가닥 절단(DSB, double strand breaks)를 갖는 공유결합으로 닫힌 완전히 환형화된 DNA 단편의 라이브러리를 효소적으로 제조하는 방법이 본원에 기술된다. 그런 다음, 공유결합으로 닫힌 완전히 환형화된 DNA 단편의 상기 효소적으로 정제된 라이브러리의 뉴클레아제-유도된 절단을 탐지하기 위해, 상기 원형물들이 시퀀싱에 의해 조작될 수 있다. 함께, 상기 두 가지 방법은 DNA의 복합 혼합물에서 뉴클레아제-유도된 절단 부위를 효율적으로 채취하기 위한 전략을 포함한다. 따라서, 상기 방법은 말단이 없는 DNA 분자의 집단을 생성하는 단계, 그 집단을 뉴클레아제로 처리하는 단계, 및 뉴클레아제-유도된 절단의 결과로서 새로 생성된 말단을 갖는 이 집단에서 DNA 분자를 발견하는 단계를 포함할 수 있다.
따라서, 공유결합으로 닫힌 원형 이중-가닥 DNA 단편의 라이브러리를 제조하는 방법이 본원에 제공된다. 본 방법은 dsDNA, 예를 들어, 관심있는 세포 유형 또는 유기체로부터의 게놈 DNA(gDNA) 또는 합성 DNA를 제공하는 단계; 상기 DNA를 소정의 평균 길이, 예를 들어 평균 길이 약 200 내지 500 bps, 예를 들어 약 300 bps로 무작위 전단(shearing)하여 DNA 단편의 집단을 제공하는 단계; 상기 전단된 DNA를 말단-결찰, 예를 들어 말단-수선 및/또는 A-테일링(tailing)하기 위한 단편을 선택적으로 제조하는 단계; 회문식 서열을 포함하는 루프 서열에 인접한 또는 루프 서열내 적어도 하나의 단일 데옥시우리딘을 포함하는 스템-루프 어댑터를 상기 단편의 말단에 결찰시켜, 결찰된 선형 dsDNA 단편의 집단을 제조하는 단계; 상기 라이브러리를 엑소뉴클레아제(예를 들어, 칵테일, 예컨대 람다 엑소뉴클레아제 및/또는 E.coli 엑소뉴클레아제 I)와 접촉시켜서, 결찰되지 않은 말단을 갖는 임의의 나머지 선형 단편을 분해하여, 결찰된 선형 dsDNA 단편의 정제된 집단을 생성하는 단계; 상기 라이브러리를 데옥시우리딘에서 상기 결찰된 dsDNA 단편을 닉킹(nicking)하는 효소와 접촉시켜서, 3' 말단 포스페이트를 제거하고, 예를 들어 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII, DNA 글리코실라아제-리아제와 접촉시켜서, 데옥시우리딘 및 T4 폴리뉴클레오타이드 키나아제에서 DNA를 닉킹하여, 3' 말단 포스페이트를 제거하는 단계; 분자내 결찰 및 원형 DNA 분자의 형성을 촉진시키기에 충분한 조건하에 상기 닉킹된 선형 dsDNA 단편을 배양하는 단계; 및 엑소뉴클레아제를 사용하여 상기 결찰된 단편을 정제함으로써 공유결합으로 닫힌 완전히 원형인 이중-가닥 DNA 단편의 라이브러리를 제조하는 단계를 포함할 수 있다.
일부 구현예에서, 상기 방법은 공유 결합으로 닫힌 완전히 원형인 dsDNA 단편의 라이브러리를 뉴클레아제(예를 들어, 본원에 기술된 조작된 뉴클레아제)와 접촉시켜 부위-특이적 절단을 유도하는 단계; 선택적으로, 예를 들어, 적어도 하나의(바람직하게는 단 하나의) 단일 데옥시우리딘 및, PCR 프라이밍 및/또는 절단 부위에서의 시퀀싱에 사용하기에 적합한 프라이머 부위를 포함하는 시퀀싱 어댑터를 결찰하는 전단된 DNA의 말단-수선 및/또는 A-테일링에 의한 말단-결찰을 위한 절단된 단편을 제조하는 단계; 데옥시우리딘에서 닉킹하는 효소, 예를 들어, 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII, DNA 글리코실라아제-리아제와 라이브러리를 접촉시키는 단계; 및 시퀀싱 어댑터를 사용하여 상기 단편을 시퀀싱하는 단계를 포함한다.
또한, dsDNA, 예를 들어, 게놈 DNA(gDNA)에서 뉴클레아제-유도된 이중 가닥 절단(break)을 포함하는 단편의 라이브러리를 제조하는 방법이 제공된다. 상기 방법은 dsDNA, 예를 들어 관심있는 세포 유형 또는 유기체로부터의 gDNA를 제공하는 단계; dsDNA를 정의된 평균 길이, 예를 들어 약 200 내지 500 bps, 예를 들어 약 300 bps의 평균 길이로 무작위 전단하는 단계; 전단된 DNA를 임의로 말단-수선 및/또는 A-테일링하는 단계; 바람직하게는 예를 들어 약 10 내지 15개, 예를 들어 약 12개 뉴클레오타이드의 제1 영역; 하나 이상의 루프를 형성하고 분자내 결찰을 위한 회문 서열에 인접한 단일 데옥시우리딘 뉴클레오타이드를 포함하는 바람직하게는 약 5개 뉴클레오타이드의 제2 영역; 및 하나의 추가 뉴클레오타이드, 예를 들어, 약 13개 뉴클레오타이드로 상기 제1 영역에 상보적인 제3 영역을 포함하는 제1 스템-루프 어댑터를 결찰하는 단계; 라이브러리를 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII, DNA 글리코실라아제-리아제와 접촉시켜, 결찰에 의해 분자적으로 양립할 수 없는 말단 3' 포스페이트를 제거하기 위해 데옥시우리딘 및 T4 폴리뉴클레오타이드 키나아제에서 dsDNA를 닉킹하는 단계; 원형 dsDNA 분자를 포함하는 샘플의 분자내 결찰 및 형성을 촉진시키기에 충분한 조건하에 닉킹된 dsDNA를 배양하는 단계; 원형이 아닌 임의의 dsDNA 분자를 분해하기에 충분한 하나 이상의 엑소뉴클레아제(예를 들어, 박테리오파지 람다 엑소뉴클레아제, E. coli ExoI, PlasmidSafe™ ATP-의존성 엑소뉴클레아제)와 샘플을 접촉시키는 단계; (예를 들어, 예를 들어 평활(blunt) 또는 점착(staggered)/돌출(overhanging) 말단을 유도하기 위한 온-타겟 및/또는 오프-타겟 부위의) 부위-특이적 절단을 유도하기 위해, 샘플을 뉴클레아제로 처리하고, 선택적으로 말단-수선하고, 그후 얻은 말단을 A-테일링하는 단계; 약 12개 뉴클레오타이드의 제1 영역; 루프, 예를 들어 하나 이상의 헤어핀 루프를 형성하고 PCR 프라이밍 및/또는 시퀀싱, 예를 들어 차세대 시퀀싱(NGS)에 사용하기에 적합한 제2 프라이머를 포함하는 약 40개 뉴클레오타이드의 제2 영역; 및 상기 제1 영역에 상보적인 약 13개 뉴클레오타이드(예를 들어, 상기 제1 영역보다 하나 더 긴)의 제3 영역; 및 제2 영역과 제3 영역 사이의 단일 데옥시우리딘 뉴클레오타이드를 포함하는 시퀀싱 어댑터를 결찰시켜, 뉴클레아제에 의해 절단된 DNA 단편이 말단에 결찰된 시퀀싱 어댑터를 갖는 집단을 생성시키는 단계; 이에 의해 뉴클레아제-절단된 어댑터-결찰된 단편에 대해 강화된 단편의 라이브러리를 제조한 후, 예를 들어, 각각의 말단은 dsDNA의 뉴클레아제-유도된 이중-가닥 브레이크에 의해 생성되고, 그후 어댑터에 의해 결찰되는 단계를 포함할 수 있다.
일부 구현예에서, 본 방법은 라이브러리를 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII, DNA 글리코실라제-리아제와 접촉시켜 데옥시우리딘에서 DNA를 닉킹하는 단계; 및 시퀀싱 어댑터를 갖는 상기 단편을 시퀀싱하는 단계를 포함한다.
일부 구현예에서, 결찰되지 않은 말단을 갖는 임의의 나머지 선형 단편을 분해하는데 사용되는 엑소뉴클레아제는 박테리오파지 람다 엑소뉴클레아제, E. coli 엑소뉴클레아제 I 및 ATP-의존성 엑소뉴클레아제 중 하나 이상을 포함하는 뉴클레아제의 칵테일이다.
일부 구현예에서, 조작된 뉴클레아제는 메가뉴클레아제, MegaTAL, 징크-핑거 뉴클레아제, 전사 활성제 이펙터-유사 뉴클레아제(TALEN), 클러스터링된 규칙적 간격의 짧은 회문 반복서열(CRISPR)/Cas RNA-가이드된 뉴클레아제(CRISPR/Cas RGNs), 및 FokI-dCas9 융합 단백질로 구성된 그룹으로부터 선택된다.
본원에 기술된 방법의 일부 구현예에서, 예를 들어, 온-타겟 및 오프-타겟 부위에서 부위-특이적 절단을 유도하기 위해 뉴클레아제로 샘플을 처리하는 단계는 특정 가이드 RNA(gRNA)에 의해 복합체화된 Cas9 뉴클레아제와 샘플을 접촉시키는 단계를 포함한다.
일부 구현예에서, 헤어핀 내의 프라이머 부위는 차세대 시퀀싱 프라이머 부위, 무작위 DNA 바코드 또는 고유 분자 식별자(UMI)를 포함한다.
일부 구현예에서, 본 방법은 라이브러리를 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII, DNA 글리코실라제-리아제와 접촉시켜 데옥시우리딘에서 DNA를 닉킹하는 단계; 및 제1 및 제2 헤어핀 어댑터를 갖는 상기 단편을 시퀀싱하는 단계를 포함한다.
일부 구현예에서, 조작된 뉴클레아제는 메가뉴클레아제, MegaTAL, 징크-핑거 뉴클레아제, 전사 활성제 이펙터-유사 뉴클레아제(TALEN), 클러스터링된 규칙적 간격의 짧은 회문 반복서열(CRISPR)/Cas RNA-가이드된 뉴클레아제(CRISPR/Cas RGNs), 및 FokI-dCas9 융합체(RNA-가이드된 FokI 뉴클레아제)로 구성된 그룹으로부터 선택된다.
일부 구현예에서, 예를 들어, 온-타겟 및 오프-타겟 부위에서 부위-특이적 절단을 유도하기 위해 뉴클레아제로 샘플을 처리하는 단계는 샘플을 특정 가이드 RNA(gRNA)와 복합체화된 Cas9 뉴클레아제와 접촉시키는 단계를 포함한다.
일부 구현예에서, DNA는 포유류, 식물, 세균 또는 진균 세포로부터 분리된다(예를 들어, gDNA).
일부 구현예에서, DNA는 합성이다.
일부 구현예에서, 조작된 뉴클레아제는 TALEN, 징크 핑거, 메가뉴클레아제, 메가TAL, FokI-dCas9 융합체 또는 Cas9 뉴클레아제 또는 Cpf1 뉴클레아제, 예를 들어 야생형 또는 이의 변이체이다.
조작된 뉴클레아제가 Cas9 뉴클레아제인 일부 구현예에서, 이 방법은 Cas9 뉴클레아제를 게놈 내의 타겟 서열로 유도하는 가이드 RNA를 이용하는 단계를 또한 포함한다. 일부 구현예에서, 상기 조작된 뉴클레아제는 Cas9 뉴클레아제이며, 이 방법은 게놈내 타겟 서열에 Cas9 뉴클레아제를 유도하는 가이드 RNA를 세포내에서 발현시키는 단계를 또한 포함한다.
일부 구현예에서, 헤어핀 내의 프라이머 부위는 차세대 시퀀싱 프라이머 부위, 무작위 DNA 바코드 또는 고유 분자 식별자(UMI)를 포함한다.
본 방법은 조작된 뉴클레아제의 오프-타겟 부위를 발견하기 위한 상기 기술된 접근법에 비해 몇 가지 장점을 갖는다. 예를 들어, 본 방법은 시험관내에 있으며; 대조적으로, 세포-기반 방법(예컨대, GUIDE-seq(WO 2015/200378 및 Tsai et al., Nature Biotechnology 33:187-197 (2015) 참조))은 이중 가닥 올리고데옥시뉴클레오타이드(dsODN)의 도입 뿐만 아니라 뉴클레아제 또는 뉴클레아제-인코딩 성분의 세포로의 도입 또는 발현을 필요로 한다. 모든 세포들이 dsODN 및/또는 뉴클레아제 또는 뉴클레아제-인코딩 성분의 도입을 허용하는 것은 아닐 것이며, 이들 제제는 일부 경우 독성을 가질 수 있다. 특정 관심의 세포 유형이 dsODNs, 뉴클레아제 또는 뉴클레아제-인코딩 성분의 도입이 가능하지 않을 경우, 대리 세포 유형이 사용될 수 있지만, 세포-특이적 효과는 탐지되지 않을 수 있다. 본 방법은 dsODNs, 뉴클레아제 또는 뉴클레아제-인코딩 성분의 세포로의 전달을 필요로하지 않으며, 크로마틴 상태에 의해 영향을 받지 않으며, 독성 문제를 일으키지 않으며, 세포주의 성장과 증식을 필요로 하지 않으며, 관심있는 세포-유형에서 얻어지는 게놈 DNA의 절단에 의해 특정 세포 게놈의 조사(interrogation)를 가능하게한다. 또한, 엑소뉴클레아제는 이중-가닥 선형 DNA에 대한 활성을 가지지만, 원형 DNA에 대해서는 본질적으로 아무런 영향을 미치지 않기 때문에, 배경이 매우 낮아서 신호 대 노이즈 비가 매우 높다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 방법 및 재료는 본 발명에서 사용하기 위해 본 명세서에 기술되어있지만; 당 분야에 공지된 다른 적절한 방법 및 재료도 또한 사용될 수 있다. 상기 재료, 방법 및 실시예는 단지 예시적인 것이며, 제한하려는 것은 아니다. 본 명세서에 언급된 모든 공보, 특허 출원, 특허, 서열, 데이터베이스 기재 및 기타 참고문헌은 그 전체가 참고로 포함된다. 분쟁이 있는 경우, 정의를 포함한 본 명세서가 우선할 것이다.
본 발명의 다른 특징 및 이점은 이하의 상세한 설명 및 도면, 및 청구항으로부터 명백해질 것이다.
도 1a-1d. CRISPR - Cas9 뉴클레아제 오프 - 타겟 절단의 게놈- 와이드 탐지를 위한 시험관내 Digenome - seq 및 CIRCLE- seq 방법의 개요. 도1a는 소화된 게놈 시퀀싱(Digenome-seq) 방법의 도식적 개요. 게놈 DNA는 시험관내에서 Cas9 뉴클레아제로 절단되고, 정제되고, 전단된 후, 전체 게놈 시퀀싱을 위한 어댑터에 결찰된다. 균일한 개시 매핑 위치가 풍부한 후보 오프-타겟 부위는 채점 알고리즘에 의해 동정된다. 도1b는 시퀀싱에 의한 절단 효과의 시험관내 보고를 위한 원형화(circularization for i n vitro reporting of cleavage effects by sequencing, CIRCLE-seq) 방법의 도식적 개요. 게놈 DNA는 전단되고, 원형화되고, 바람직하지 않은 선형 DNA 분자는 엑소뉴클레아제 처리에 의해 분해된다. Cas9 절단 부위(음영처리됨)를 함유하는 원형 DNA 분자는 Cas9로 선형화될 수 있으며, 어댑터 결찰, PCR 증폭 및 쌍-말단 대용량 시퀀싱을 위한 상기 DNA 말단을 방출한다. Cas9 절단에 의해 생성된 각 리드 쌍이 단일 오프-타겟 부위에 대한 완전한 서열 정보를 함유하는 방법에 주목한다. 도1c는 예시적인 CIRCLE-seq 방법의 상세 도식적 개요. 게놈 DNA는 300 bp 이하의 평균으로 무작위 전단되어, 말단이 수선되고, A-테일링되고, 우라실-함유 스템-루프 어댑터에 결찰된다. 양쪽 말단에 결찰된 스템-루프 어댑터와 함께 공유결합으로 닫힌 DNA 분자는 람다 엑소뉴클레아제 및 E. coli 엑소뉴클레아제 I의 혼합물로 처리함으로써 선택된다. 4 bp 오버행(overhang)은 USER 효소와 T4 PNK의 혼합물과 함께 방출되고, DNA 분자는 분자내 결찰을 선호하는 저농도에서 원형화된다. 원치않는 선형 DNA는 플라스미드-안전한(Plasmid-Safe) ATP 의존성 DNase로 분해된다. 원형 DNA가 Cas9-gRNA 복합체로 처리되고, 절단되며, 선형화된 DNA를 시퀀싱 어댑터에 결찰하고, 대용량 시퀀싱을 위해 증폭된다. 도1d는 CIRCLE-seq 리드 카운트(read count)는 독립적인 CIRCLE-seq 실험들 사이에서 매우 재현가능했다. 게놈 DNA(인간 U2OS 세포)의 동일한 공급원으로부터 제조된 2개의 독립적인 CIRCLE-seq 라이브러리들 사이에서 CIRCLE-seq 리드 카운트의 산점도. CIRCLE-seq 리드 카운트는 크게 상관 관계가 있다.
도 2a-2d. CIRCLE- seq와 Digenome - seq의 비교. 도2a는 CIRCLE-seq 및 Digenome-seq에 의해 탐지된 HBB 유전자를 타겟으로하는 Cas9 및 gRNA의 오프-타겟 부위의 교차점을 보여주는 벤 다이어그램. 도2b는 뉴클레아제-처리된(음영처리된 막대) 및 대조군(열린 막대) HAP1 게놈 DNA에 대해서, Digenome-seq이 아닌 CIRCLE-seq에 의해 발견된 오프-타겟 절단 위치에서 Digenome-seq 리드 카운트의 막대그래프. 도2c는 HBB 유전자좌로 타겟팅된 gRNA의 온-타겟 부위에서 CIRCLE-seq 및 Digenome-seq에 대한 시퀀싱 리드의 매핑을 비교하는 도표. 뉴클레아제-처리된 샘플 및 대조군 샘플 모두가 도시된다. 얇은 회색 선은 예상 절단 부위 위치를 나타내며; 순방향 리드에 대한 리드 범위는 검정색으로 표시되고, 역방향 리드는 흰색으로 표시된다. 도2d는 도2c에서 사용된 HBB gRNA에 대한 온-타겟 부위에서 CIRCLE-seq 시작 매핑 위치도. (+) 가닥 매핑 리드는 흰색 막대로 표시되고, (-) 가닥 매핑 리드는 음영 막대로 채색된다.
도 3a-3e. CIRCLE- seq와 세포-기반 GUIDE- seq의 비교 및 HTGTS 방법. 도3a는 CIRCLE-seq(흰색 막대) 및 CIRCLE-seq와 GUIDE-seq 모두(음영처리된 막대)에 의해 독점적으로 동정된 부위의 수를 보여주는 히스토그램. 도3b는 CIRCLE-seq 탐지된 오프-타겟 부위의 맨하탄 도표, 막대 높이는 CIRCLE-seq 리드 카운트를 나타내며(가장 높은 리드 카운트를 가진 부위로 표준화됨), 염색체 위치별로 구성된다. 도3c는 CIRCLE-seq와 GUIDE-seq 탐지된 게놈 오프-타겟 절단 부위의 교차를 보여주는 벤 다이어그램. 도3d는 CIRCLE-seq 또는 CIRCLE-seq와 HTGTS 모두에 의해 독점적으로 탐지된 부위의 수를 보여주는 히스토그램. 도3e는 CIRCLE-seq, GUIDE-seq 및 HTGTS 사이에서 탐지된 오프-타겟 절단 부위 세트 사이의 오버랩을 나타내는 벤 다이어그램. CIRCLE-seq는 GUIDE-seq 및 HTGT) 모두에 의해 탐지된 거의 모든 오프-타겟 절단 부위를 탐지한다.
도 4a-4g. CIRCLE-seq 탐지된 오프-타겟 절단 부위는 또한 인간 세포에서 절단될 수 있다. 도4a는 GUIDE-seq에 의해 사전 분석된 10 gRNA에 대한 CIRCLE-seq 리드 카운트의 줄기-잎 도표. 온-타겟 및 오프-타겟 부위가 도시되어 있다. 도4b는 타겟팅된 태그 시퀀싱 접근법의 도식적 개요. 프라이머는 뉴클레아제와 이중-가닥 올리고데옥시뉴클레오타이드(dsODN) 태그로 처리된 세포의 게놈 DNA로부터 게놈 영역 플랭킹 뉴클레아제-유도된 DSB를 증폭하도록 설계된다. 도4c-d는 CIRCLE-seq 및 GUIDE-seq 모두에 의해 탐지된 대조군 오프-타겟 부위(패널의 상부) 및 EMX1VEGFA 부위 1로 타겟팅된 gRNA에 대해 (GUIDE-seq가 아닌) CIRCLE-seq에 의해 탐지된 오프-타겟 부위에서 타겟팅된 태그 통합 빈도. 오프-타겟 부위는 표시된 의도된 타겟 서열과의 미스매치로 CIRCLE-seq 리드 카운트에 의해 위에서 아래로 정렬된다. 대조군 및 뉴클레아제-처리된 세포에 대해 관찰된, 관찰된 태그 통합 빈도가 로그 스케일로 플롯팅된다. 도4e는 타겟팅된 태그 시퀀싱에 의해 또한 탐지된, 분석된 CIRCLE-seq 부위의 분율을 보여주는 원형 차트. 도4f는 타겟팅된 태그 시퀀싱에 의해 관찰된 통합 위치의 플롯. PAM 염기는 오른쪽의 마지막 3개 뉴클레오타이드이다. 통합은 예측된 DSB의 위치에 근접한 포지션에서 발생한다(PAM으로부터 3개의 염기쌍 떨어져 있음). 도4g는 HEK293, K562 및 U2OS 게놈 DNA에서 반복되지 않는 부위를 타겟팅하는 gRNA로 수행된 CIRCLE-seq 실험의 경우, 기준-독립적인 부위 발견 알고리즘을 사용하여 발견될 수 있는 고유한 절단 부위의 백분율.
도 5a-5e. CIRCLE-seq를 사용하여 오프-타겟 부위 분석에 대한 맞춤형 SNP의 영향을 평가한다. 도5a는 2개의 다른 세포 유형의 게놈 DNA에 대해 수행된 실험에서 CIRCLE-seq 리드 카운트의 산점도. 오직 하나의 세포 유형에서 비-기준 유전적 변이가 있는 부위는 검정색이며, 두 세포 유형에서 비-기준 변이가 있는 부위는 음영처리된다. 도5b는 비-기준 유전적 변이가 있는 오프-타겟 부위에서 대립 유전자-특이적 CIRCLE-seq 리드 카운트의 예. 의도된 타겟 서열과의 미스매치는 유색 뉴클레오타이드로 표시되고, 매칭하는 염기는 점으로 표시된다. 세포 유형들 사이의 차등적 유전적 변화를 포함하는 염기 위치는 작은 화살표로 표시된다. 도5c는 1000 게놈 프로젝트(Genomes Project): 아프리카인(AFR), 혼혈 미국인(AMR), 동아시아인(EAS), 유럽인(EUR) 및 동남아시아인(SAS) 초모집단 및 합산 인구 평균의 유전자형 개인에서 비-기준 유전적 변이가 동정된 CIRCLE-seq 오프-타겟 부위의 비율. 도5d는 기준 인간 게놈 서열(빗금친 막대) 및 1000 게놈 프로젝트 데이터-유도된 오프-타겟 부위 하플로타입(흰색 막대)에서의 미스매치의 수에 의한 CIRCLE-seq 오프-타겟 부위의 분포를 보여주는 히스토그램. 도5e는 CIRCLE-seq에 의해 동정된 오프-타겟 부위내 증가된, 감소된, 또는 같은 수의 미스매치가 있는 1000 게놈 프로젝트-유도된 하플로타입의 비율.
조작된 게놈-편집 뉴클레아제는 과학 연구와 인간 의학 둘다를 위한 변형 기술이다. 이 기술의 사용과 관련하여 중요한 문제는 살아있는 세포 게놈내 의도하지 않은 타겟 부위에서 오프-타겟 절단반응이 발생하는 정도이다10,24-27. 이것은 특히, 거의 모든 세포 유형에서 비-균일한 말단-결합에 의한 뉴클레아제-유도된 절단의 수선이 삽입 또는 결실 돌연변이(indels)를 효율적으로 도입할 수 있기 때문에 중요하다. 수백만 내지 수십억개의 세포가 이 뉴클레아제들로 치료될 수 있는 연구 및 치료 응용 분야 모두의 경우, 낮은 빈도 돌연변이조차도 원하지않는 세포 표현형이나 바람직하지 않은 임상 결과를 초래할 수 있다.
게놈-편집 뉴클레아제에 의해 유도된 오프-타겟 절단 현상의 풍경을 정의하기 위해 최근 많은 게놈-와이드 접근법이 개발되었다. 예를 들어, 이러한 돌연변이의 게놈-와이드 탐지를 위한 다양한 세포-기반 방법이 기술되어있다28-32. 이들은 시퀀싱(GUIDE-seq) 및 대용량, 게놈-와이드 전위 시퀀싱(HTGTS)에 의해 가능하게 된 DSB의 게놈-와이드 비편향 동정을 포함한다. 예를 들어, 살아있는 세포에서 뉴클레아제-유도된 DSB에 짧은 이중-가닥 올리고뉴클레오타이드 "태그"의 활용에 의존하는 GUIDE-seq 방법은 세포집단에서 시간의 0.1%만큼 낮은 빈도로 돌연변이 유발되는 부위를 동정하는, 오프-타겟 부위를 게놈-와이드 규모로 정의하는 것으로 나타났다(Tsai et al., Nat Biotechnol. 2015). 뉴클레아제-유도된 오프-타겟 절단을 정의하는 다른 세포-기반 방법은 온-타겟 부위에 대한 전위 융합을 매핑하는 방법과 DSB 부위로 통합-결핍 렌티바이러스(IDLV) 게놈을 활용하는 것에 의존하는 방법을 포함한다. 그러나, 세포를 효율적으로 조작하기 위한 상기 방법들의 요건은 특히 치료에 가장 적합하고 유용할 수 있는, 보다 도전적인 비-형질전환 세포 유형으로 작업할 때 실행 가능성, 확장성 및 재현성을 제한할 수 있다.
이러한 최근의 진전에도 불구하고, 오프-타겟 측정을 위한 세포-기반 방법은 하기를 포함하는 다수의 제약이 있다: (1) 뉴클레아제 성분 및 태그, 예컨대 dsODN 또는 IDLV 게놈을 세포 내로 도입할 수 있는 요건; (2) 특정 유형의 오프-타겟 돌연변이가 있는 세포의 성장을 선호하거나 선호하지 않을 수 있는 생물학적 선택 압력; (3) 크로마틴, DNA 메틸화, 유전자 발현 및 핵 구조와 같은 세포-유형-특이적인 매개변수가 뉴클레아제 오프-타겟 활성/효과에 미치는 잠재적 교란 효과; 및/또는 (4) 배양물에서 관심 세포를 성장시킬 수 있는 요건.
정제된 게놈 DNA를 사용하는 시험관내 방법은 세포-기반 접근법의 이러한 다양한 제약을 회피하기 때문에 매력적인 대안을 제공한다. (이 설명에서 시험관내는 무세포 반응에서 정제된 성분으로 수행된 실험을 의미함). 오프-타겟 절단 부위를 탐지하기 위한 시험관내 방법은: a) 정제된 무-단백질 DNA 상에서 수행되기 때문에 크로마틴 컨텍스트(context), 유전자 발현 수준 또는 핵내 정위에 의해 영향을 받지 않는다는 점, b) a)에 나열된 요소들 뿐만 아니라 서열-의존적 효과에 의해 영향을 받을 수 있는 부위의 탐지를 위해 오류가 발생하기 쉬운 세포 DNA 복구에 의존하지 않는다는 점, 및 c) 뉴클레아제의 농도, 게놈 DNA 및 절단 시간의 길이가 모두 변화될 수 있기 때문에, 낮은 빈도 절단 반응의 탐지에 매우 민감한 잠재성을 제공한다는 점을 포함할 수 있는 세포-기반 방법에 비해 잠재적인 이점을 갖는다. 정의되고 정제된 성분을 사용하는 생화학적 분석법은 재현성을 향상시키고, 효율적인 세포 형질도입 또는 형질감염에 대한 필요성을 우회하고, 세포 적합성에 대한 긍정적 또는 부정적 영향으로 유발되는 잠재적인 편향을 피한다. 중요하게는, 활성 뉴클레아제 및 게놈 DNA의 농도는 시험관내에서 매우 높은 수준으로 상승될 수 있으며, 세포내에서 매우 드문 빈도 및/또는 세포에서 발현될 수 있는 가장 높은 농도의 뉴클레아제로 절단될 수 있는 서열의 확인을 잠재적으로 가능하게 할 수 있다. 특정 타겟 DNA 부위에 편향된 부분적으로 약화된 DNA 라이브러리의 Cas9 절단 특이성을 특성화하기 위한 시험관내 방법은 이전에 기술되었지만, Cas9 뉴클레아제 및 다양한 gRNA와 함께 사용하는 경우, 동정된 부위의 대부분이 실제로 인간 게놈에서 발생하지 않았다33.
그러나 시험관내 방법은 분리된 게놈 DNA가 실험적 필요성에 따라 무작위로 작은 조각으로 전단(또는 절단)된다는 문제에 직면해있다. 시험관내에서 뉴클레아제로 게놈 DNA를 처리함으로써 유도된 DSB로부터의 전단에 의해 유도된 DSB를 차등적으로 동정하는 것이 쉽지 않기 때문에, 이것은 어려운 과제이다. 현재까지 Digenome-seq34로 알려진 유일한 시험관내 게놈-와이드 오프-타겟 동정 방법이 인간 게놈 DNA와 함께 사용되는 것으로 기술되어있다. 이 접근법은 대량 게놈 DNA의 뉴클레아제 절단, (뉴클레아제-유도된 및 비-뉴클레아제-유도된) 모든 자유 말단에 대한 시퀀싱 어댑터의 결찰, 대용량 시퀀싱 및 특징 균일한 매핑 말단을 갖는 뉴클레아제-절단 부위의 생물정보학적 동정에 의존한다. 그러나 Digenome-seq에 의해 시퀀싱된 무작위 전단된 게놈 DNA 단편의 극히 높은 배경은 더 낮은 빈도 뉴클레아제-유도된 절단 반응을 확인하는 것을 매우 어렵게 만들고, 필요한 리드 수(> 4억)를 생성할 수 있는, 생산-규모의 인간 게놈 재시퀀싱에 사용되는 HiSeq 또는 HiSeq X10 기계에 대한 액세스를 필요로 한다.
Digenome-seq 방법은 시퀀싱 리소스에 관해 비효율적이며, 따라서 오프-타겟 부위를 탐지하는 능력에 덜 민감하게 만드는, 뉴클레아제 오프-타겟 활성에 관한 정보가 없는 시퀀싱 리드의 높은 배경을 겪고 있다. Digenome-seq을 사용하여 무작위 전단된 게놈 DNA를 조작된 뉴클레아제에 의해 소화시킨 다음, 상기 단편을 전체 게놈 재-시퀀싱한다. 무작위 전단된 단편은 게놈에 무작위로 정렬될 반면, 뉴클레아제에 의해 소화된 상기 단편은 게놈으로 다시 매핑될 때 동일한 게놈 염기 위치에 정렬될 균일한 말단을 가질 것이다. 이 방법의 초기 확인(validation)은 CRISPR-Cas9 뉴클레아제에 대한 오프-타겟 절단 부위를 탐지할 수 있는 능력이 있음을 보여 주었다. 그러나 Digenome-seq을 사용하면 백만분의 1 미만의 시퀀싱 리드가 뉴클레아제 오프-타겟 부위에 매핑된다. 이 높은 배경 때문에 이 방법에는 몇 가지 단점이 있다: (A) 시퀀싱과 관련하여 상기 방법이 매우 비용 효과가 떨어지며, HiSeq 또는 HiSeqx10 플랫폼과 같은 방법을 사용해야하며; (B) 게놈에 매핑되는 무작위 절단된 DNA 단편의 높은 배경은 낮은 빈도의 뉴클레아제-유도된 절단, 신호 대 노이즈 문제를 확인하는 것을 어렵게 만들며; (C) 정보의 낮은 수율은 HiSeqx10 플랫폼과 같은 최첨단 방법으로 얻어질 수 있는 많은 수의 시퀀싱 리드에도 불구하고 낮은 빈도의 뉴클레아제 오프-타겟 부위를 찾는 것을 어렵게 만든다. 실제로 Digenome은 특정 gRNA에 대해 GUIDE-seq에 의해 발견된 다수의 오프-타겟 부위를 동정하지 못했다(두 가지 실험이 서로 다른 세포주의 게놈 DNA로 수행되었음을 주의해야한다).
관심있는 임의의 게놈 DNA상의 뉴클레아제에 의해 유도된 DSB의 포괄적인 측정을 가능하게 하는 시험관내 방법이 본원에 기술되어있다. 이 방법은 게놈 DNA의 전단에 의해 유도된 무작위 DSBs에 대해 뉴클레아제-유도된 DSB의 풍부화를 가능하게한다.
시퀀싱에 의한 절단 효과의 시험관내 보고를 위한 원형화(Circularization for In vitro Reporting of CLeavage Effects by sequencing, CIRCLE-seq)로서 본원에 기술된 예시적인 방법은 뉴클레아제 절단된 게놈 DNA의 고효율 선택적 풍부화를 가능하게 하는 신규 무세포 전략이며, 그후 대용량 시퀀스 및 게놈 오프-타겟 절단 부위 발견을 위해 사용될 수 있다. 시퀀싱에 의한 뉴클레아제 DSB의 완전한 심문(Full Interrogation of Nuclease DSBs by sequencing, FIND-seq) 방법과 유사하게(USSN 62/217,690에 기술되어 있음), CIRCLE-seq은 시퀀싱 어댑터의 임의의 후속 결찰을 방지하는 방법으로 DNA 말단이 보호되는, 무작위 전단된 게놈 DNA 단편의 개시 라이브러리를 생성하는 원리에 기초한다. 그러나 CIRCLE-seq에서, 이 분자 집단은 임의의 남은 잔류 선형 단편을 분해하기 위해 새로운 비-편향 분자내 원형화 방법 후 엑소뉴클레아제 처리에 의해 생성된다(도 2). 그후, 공유결합으로 닫힌 원형 게놈 DNA 분자의 상기 효소적으로 정제된 집단을 선택된 조작된 뉴클레아제에 의해 처리한다. 이 뉴클레아제로 절단된 부위를 갖는 임의의 DNA 단편은 선형화되어, 시퀀싱 어댑터가 결찰될 수 있는 2개의 이용가능한 DNA 말단을 방출할 것이다. 선형화된 어댑터-결찰된 단편은 이후에 대용량 시퀀싱을 위한 PCR로 증폭된다(도 2 참조). 따라서 CIRCLE-Seq은 Digenome-seq으로 관찰된 무작위 게놈 리드의 매우 높은 배경을 실질적으로 제거한다.
낮은 농도의 DNA에서 gDNA 분자의 효율적인 분자내 원형화를 위한 시험관내 조건이 최적화되었는데, 이 과정은 이 방법의 성공과 낮은 배경에 중요하다. (CRISPR-Cas9 뉴클레아제를 이용한 실험을 기반으로 한) 뉴클레아제-절단된 단편의 CIRCLE-seq 농축은 배경보다 약 106배 정도 높았으며, 이로 인해 Digenome-seq와 같은 주먹구구식 시험관내 오프-타겟 절단 부위 발견 방법으로 시퀀싱된 무작위 전단된 DNA 단편의 높은 배경을 실질적으로 감소시켰다(도 1a). 농축 인자는 예측된 브레이크 포인트로부터 기인하는 리드 수를 실험의 시퀀싱 깊이에서 우연히 예상되는 위치에서의 리드 수로 나눔으로써 (단편의 거의 100%가 시험관내에서 절단될 것으로 예상되는) 온-타겟 부위에서 계산되었다.
중요하게는, 배경을 줄이면 CIRCLE-seq 방법으로 인한 신호 대 노이즈 비가 크게 증가하고, Digenome-seq으로 우연히 발생할 수 있는 균일한 말단에 의한 리드 회복으로 인해 잘못된 양성 요청(positive call) 확률이 감소된다. 게놈 DNA 단편의 초기 원형화는 단일 DNA 분자(및 따라서 단일 DNA 시퀀싱 리드)에서 DSB의 양 말단을 동시에 회수할 수 있게 해 주며, 이는 게놈 서열이 사전에 알려졌는지 여부에 관계없이 어떤 유기체의 게놈 DNA와 함께 사용되도록 접근할 수 있게 해주는 뉴클레아제-유도된 오프-타겟 효과를 확인하기 위한, 이전에 기술된 모든 방법에 대한 개선이 종종 차례대로 오프-타겟 절단 부위의 기준-독립적 발견을 가능하게한다. 또한, (DNA 복구 경로가 말단을 절제하거나 분해할 수 있는 세포와는 대조적으로) 시험관내에서 말단을 최소한으로 처리하기 때문에, 이 방법은 또한 뉴클레아제-유도된 절단 위치를 지정할 수 있는 뉴클레오타이드 수준의 정확도를 크게 향상시킨다.
CRISPR-Cas9 뉴클레아제를 사용하는 CIRCLE-seq의 초기 입증 실험에서, Cas9 뉴클레아제-절단된 단편에 대한 농축은 FIND-seq 방법과 비교하여 CIRCLE-seq에 대해 거의 20배 더 많았다(USSN 62/217,690 및 도 1에 기술됨). 이 두 방법 사이의 근본적인 차이점은 FIND-seq이 스템-루프 어댑터와 공유결합으로 닫힌 선형 DNA 기질을 기반으로 하는 반면, CIRCLE-seq이 공유결합으로 닫힌 완전 원형화된 DNA 기질을 기반으로 한다는 점이다(도 1a). 바람직한 엑소뉴클레아제 중 하나(Epicentre제 상업적으로 입수할 수 있는 PlasmidSafe ATP-의존성 DNase)는 FIND-seq 스템-루프 결찰된 DNA 기질의 노출된 ssDNA 부분에 대해 약간의 활성을 보유할 수 있는데, 이는 CIRCLE-seq 방법이 선형 및 공유결합으로 닫힌 DNA 단편 사이의 효소 확인이 더 높고, 전체적인 배경이 낮은 이유를 설명할 수 있다.
따라서, 제공된 결과는 CIRCLE-seq 방법이 CRISPR-Cas9 뉴클레아제의 게놈-와이드 오프-타겟 절단 부위를 결정하기 위해 현재까지 기술된 가장 민감하고 시퀀싱-효율적인 시험관내 접근법임을 보여준다. CIRCLE-seq은 Digenome-seq에 비해 관찰된 배경 리드 속도가 실질적으로 감소하여, Digenome-seq에 의해 요구되는 총 시퀀싱 리드 수의 작은 분율(~1.7%)을 사용하여 오프-타겟 부위를 민감하게 동정할 수 있게 된다. 더 적은 수의 리드(예를 들어, Illumina MiSeq과 같은 벤치탑 시퀀싱 장비로 얻은 것)에 대한 필요성 때문에 이 방법은 대부분의 실험실에서 액세스할 수 있으며, 비용 관점에서 자동화 및 스케일링에 보다 적합하다.
CIRCLE-seq을 사용하면 Cas9 오프-타겟 절단에 대한 보다 정확한 예측 알고리즘을 교육할 수 있는 더 큰 데이터세트를 제작할 수 있게 된다. 이 방법은 비용-효율적으로 자동화되고 확장될 수 있으므로, 수천개의 gRNA의 오프-타겟 절단 부위와 상대적 시험관내 절단 효율(CIRCLE-seq 리드 카운트에 의해 측정됨)을 확인하는 데이터를 생산하는 것이 실현가능해야 한다. GUIDE-seq와 같은 방법으로 ENCODE-특성화 세포주39에서 결정된 대규모 세포-기반 오프-타겟 데이터세트와 결합된 경우, DNA DSBs를 유도할 수 있는 뉴클레아제의 능력에 대한 크로마틴 및 후성 변형의 영향을 더 잘 이해하고 정량화할 수 있다.
치료 용도를 위해, CIRCLE-seq은 GUIDE-seq 및 HTGTS와 같은 가장 민감한 세포-기반 게놈-와이드 오프-타겟 탐지 방법을 능가하기 때문에, 이 방법을 이후 실제 뉴클레아제-변형된 세포에서 직교 접근법으로 검증될 수 있는, 잠재적 오프-타겟 부위를 확인하기 위한 초기 화면으로 사용될 수 있다. 이 연구에서는 차세대 시퀀싱과 관련된 indel 오류율(전형적으로 ~0.1%)로 인해 표준 앰플리콘 시퀀싱에 의해 동정하기가 어려울 수 있는 저-빈도 부위(<0.1%)를 검증하기 위해 GUIDE-seq dsODN 태그를 검색하기 위해 타겟팅된 시퀀싱을 사용하였다. 그러나, 이 접근법은 GUIDE-seq dsODN 태그로 형질감염될 수 있는 세포에만 국한되어, 모든 세포에서 가능하지는 않다. 따라서, 앞으로의 연구를 위한 중요하고 긴급한 영역은 현재의 대용량 시퀀싱 기술의 오류율 이하의 오프-타겟 돌연변이유발을 보다 민감하게 측정할 수 있는 대안적인 직교 세포-기반 방법의 개발일 것이다. CIRCLE-seq은 또한 조작된 징크 핑거 뉴클레아제(ZFNs) 및 전사 활성제-유사 이펙터 뉴클레아제(TALENs)와 같은 인간 치료제에 이미 사용되는 다른 뉴클레아제 플랫폼의 오프-타겟 효과를 분석하도록 확장될 수 있다.
본원의 CIRCLE-seq 데이터는 다른 사람에 의해 처음 제기된 개념인, 오프-타겟 절단에 대한 인간 유전적 변이의 잠재적 영향에 대한 더 큰 지원을 제공한다36. 본원의 연구결과는 오프-타겟 위험성을 평가할 때 유전자형을 고려하는 중요성을 강조하고, 뉴클레아제의 안전성 평가는 환자-특이적 방법으로 수행된 특이성 프로파일을 포함해야한다고 주장한다. 대안적으로, 유전적으로 다양한 세포의 대형 패널로부터의 게놈 DNA에서 수행되는 CIRCLE-seq은 임의의 주어진 뉴클레아제에 대한 대다수의 공통 및 SNP-특이적 오프-타겟 효과를 정의하기 위한 효과적인 방법을 제공할 수 있다. 이와 관련하여, CIRCLE-seq은 피부 생검으로부터 얻어진 일차 섬유아세포로부터 분리된 게놈 DNA에 대해 수행되었으며, 표준 혈액 추출법으로 얻은 버피 코트(buffy coat)는 충분한 양의 DNA를 제공하여 분석을 수행한다. CIRCLE-seq의 단순성, 확장성 및 재현성으로 인해 일련의 게놈 DNA 샘플에서 게놈-와이드 오프-타겟 프로파일을 정의하는데 이상적으로 적합하게 된다.
스템-루프 어댑터 및 시퀀싱 어댑터
본 방법은 분자내 결찰에 의해 단편을 원형화하기 위한 자연적으로 발생하지 않는 스템-루프 어댑터의 사용을 포함한다. 스템-루프 어댑터는 (5'에서 3'까지) 예를 들어, 약 10 내지 15개, 예를 들어 12개 뉴클레오타이드의 제1 영역; 하나 이상의 (및 바람직하게는 오로지 하나의) 헤어핀 루프를 형성하고, 분자내 결찰에 적합한 회문 서열을 포함하며, 하나 이상의 (및 바람직하게는 오로지 하나의) 우라실에 의해 플랭크된, 예를 들어 약 4 내지 6개, 예를 들어 5개 뉴클레오타이드의 제2 영역; 및 제1 영역에 상보적인 예를 들어, 약 10 내지 15개, 예를 들어 13개 뉴클레오타이드의 제3 영역을 포함한다.
본 방법은 또한, 프라이밍 PCR 또는 시퀀싱에 사용하기 위한 뉴클레오타이드의 서열을 포함하는 시퀀싱 어댑터의 용도를 포함한다. 시퀀싱 어댑터는 전형적으로, (5'에서 3'까지) 예를 들어, 약 10 내지 15개, 예를 들어 12개 뉴클레오타이드의 제1 영역; 하나 이상의 (및 바람직하게는 오로지 하나의) 헤어핀 루프를 형성하고, PCR 프라이밍 및/또는 시퀀싱, 예를 들어 차세대 시퀀싱(NGS)에 사용하기에 적합한 서열을 포함하며, 하나 이상의 (및 바람직하게는 오로지 하나의) 우라실에 의해 플랭크된, 예를 들어 약 20 내지 60개, 예를 들어 40개 뉴클레오타이드의 제2 영역; 및 제1 영역에 상보적인 예를 들어, 약 10 내지 15개, 예를 들어 13개 뉴클레오타이드의 제3 영역을 포함한다. 제1, 제2 및 제3 영역의 길이는 선택된 NGS 플랫폼에 의해 사용하기 위한 프라이밍에 필요한 서열에 의존하기 때문에, 선택된 NGS 방법에 따라 변할 수 있다. 일부 구현예에서, 표준 어댑터(예를 들어, Illumina 또는 NEB)의 변형인 상업적으로 사용가능한 어댑터가 사용될 수 있다.
스템-루프 및 시퀀싱 어댑터는 우라실 DNA 글리코실라제(UDG)와 엔도뉴클레아제 VIII, DNA 글리코실라제-리아제, 예를 들어 USER(우라실-특이적 절제 제제) 효소 혼합물(New England BioLabs)에 의해 어댑터가 열리도록 하는 적어도 하나의, 바람직하게는 오로지 하나의 우라실을 포함한다. UDG는 우라실 염기의 절제를 촉매하여 무염기 부위를 형성하지만, 포스포디에스테르 백본을 그대로 남긴다(예를 들어, Lindhal et al., J. Biol. Chem.. 252:3286-3294 (1977); Lindhal, Annu. Rev. Biochem. 51:61-64 (1982) 참조). 엔도뉴클레아제 VIII은 무염기 부위의 3' 및 5'측에서 포스포디에스테르 백본을 파괴한다(예를 들어, Melamede et al., Biochemistry 33:1255-1264 (1994); Jiang et al., J. Biol. Chem. 272:32230-32239 (1997) 참조). 이 조합은 우라실의 위치에서 단일 뉴클레오타이드 갭을 생성한다. 일부 구현예에서, 우라실은 PCR 프라이밍 및/또는 시퀀싱에서의 사용에 양립할 수 있는 서열 또는 회문 서열의 3' 또는 5' 말단의 1, 2, 3 또는 4개의 뉴클레오타이드에 또는 그 안에 위치한다.
본 방법에서, 어댑터의 모든 부분은 세포의 게놈에 직교하는 것이 바람직하다(즉, 존재하는 서열에 존재하지 않거나, 존재하는 서열에 대하여 상보적인, 즉 세포 게놈내에 존재하는 서열에 대하여 10%, 20%, 30%, 40%, 또는 50% 미만의 동일성을 가짐).
시퀀싱 어댑터는 바람직하게는 PCR 프라이밍 및/또는 시퀀싱에 사용하기에 적합한 서열, 예를 들어 무작위적 DNA 바코드인 프라이머 부위(예를 들어, SHAPE-SEQ, Lucks et al., Proc Natl Acad Sci U S A 108: 11063-11068 참조), 고유한 분자 식별자(UMI)(예를 들어, Kivioja et al., Nature Methods 9, 72-74 (2012); Islam et al., Nature Methods 11, 163-166 (2014); Karlsson et al., Genomics. 2015 Mar;105(3):150-8 참조), 또는 시퀀싱(예를 들어, NGS)에서 사용하기에 적합한 고유한 PCR 프라이밍 서열 및/또는 고유 서열을 포함해야 한다. 시퀀싱에서 사용하기에 적합한 서열은 원하는 시퀀싱 방법, 예를 들어 차세대 시퀀싱 방법, 예를 들어 Illumina, Ion Torrent 또는, Roche/454, lllumina Solexa 게놈 분석기, Applied Biosystems SOLiD™ 시스템, Ion Torrent™ 반도체 서열 분석기, PacBio® 실시간 시퀀싱 및 Helicos™ 단일 분자 시퀀싱(SMS)과 같은 라이브러리 제조 방법과 함께 사용하기 위해 선택될 수 있다. 예를 들어, WO2014020137, Voelkerding et al., Clinical Chemistry 55:4 641-658 (2009) 및 Metzker, Nature Reviews Genetics 11:31-46 (2010))를 참조한다. 다수의 키트들은 ThruPLEX DNA-seq 키트(Rubicon, 미국특허 제7,803,550호; 제8,071,312호; 제8,399,199호; 제8,728,737호 참조) 및 NEBNext®(New England BioLabs; 예를 들어, 미국특허 제8,420,319호 참조)를 포함하는, NGS용 DNA를 제조하기 위해 상업적으로 입수가능하다. 예시적인 스템 루프 어댑터 서열은 /5Phos/CGGTGGACCGATGATC/ideoxyU/ATCGGTCCACCG*T(SEQ ID NO:1; 별표는 포스포로티오에이트 결합을 나타냄)이다. 일부 구현예에서, 시퀀싱 어댑터는 예를 들어 NEBNext 키트로부터의 상업적으로 입수가능한 시퀀싱 어댑터이다.
일부 구현예에서, 어댑터는 제한 효소 인식 부위, 바람직하게는 세포의 게놈에서 비교적 드문 부위를 포함한다.
어댑터는 바람직하게 변형되며; 일부 구현예에서, 헤어핀 어댑터의 5' 말단은 인산화되고, 및/또는 3' 말단은 포스포로티오에이트 결합을 포함한다. 일부 구현예에서, 어댑터는 평활 말단이다. 일부 구현예에서, 어댑터는 5' 또는 3' 말단에 1, 2, 3, 4개 또는 그 이상의 뉴클레오타이드 오버행을 무작위로 다양하게 포함하거나, 5' 또는 3' 말단에 단일 T를 포함한다.
어댑터는 또한 당 분야에 공지되거나, PCT/US2011/060493에 기술된 바와 같은 하나 이상의 추가 변형을 포함할 수 있다. 예를 들어, 일부 구현예에서, 헤어핀 어댑터는 비오틴결합된다. 비오틴은 5' 또는 3' 말단에서가 아니라, 헤어핀 어댑터 내부 어디에나 있을 수 있다(예를 들어, 변형된 티미딘 잔기(Biotin-dT) 또는 비오틴 아지드 사용). 이것은 결찰된 시퀀싱 어댑터를 함유하는 단편을 회수하는 대체 방법을 제공한다. 반면 일부 구현예에서, 상기 서열은 PCR에 의해 회수되고 증폭되지만, 이 접근법에서는, 예를 들어 스트렙타비딘-코팅된 자성 비드에 결합시킴으로써, 또는 용액 하이브리드 캡쳐를 사용하여, 비오틴을 사용함으로써 물리적으로 이들을 끌어내고 농축시키며; 예를 들어, Gnirke et al., Nature Biotechnology 27, 182 - 189 (2009)를 참조한다.
조작된 뉴클레아제
현재 4가지 주요 종류의 조작된 뉴클레아제: 1) 메가뉴클레아제, 2) 징크-핑거 뉴클레아제, 3) 전사 활성제 이펙터-유사 뉴클레아제(TALEN), 및 4) 클러스터링된 규칙적 간격의 짧은 회문 반복서열(CRISPR) Cas RNA-가이드된 뉴클레아제(RGNs)가 있다. 이러한 플랫폼의 다양한 구성요소를 함께 융합하여 Mega-TAL 및 FokI-dCas9 융합과 같은 추가 뉴클레아제를 생성할 수도 있다. 예를 들어, Gaj et al., Trends Biotechnol. 2013 Jul;31(7):397-405를 참조한다. 뉴클레아제는 당 분야에 공지된 방법을 사용하여 세포내에서 일시적으로 또는 안정하게 발현될 수 있으며; 전형적으로, 발현을 얻기 위해, 단백질을 코딩하는 서열은 전사를 지시하는 프로모터를 함유하는 발현 벡터 내로 서브클로닝된다. 적합한 진핵 발현 시스템은 당 분야에 잘 공지되어 있으며, 예를 들어 Sambrook et al., Molecular Cloning, A Laboratory Manual (4th ed. 2013); Kriegler, Gene Transfer and Expression: A Laboratory Manual (2006); 및 Current Protocols in Molecular Biology (Ausubel et al., eds., 2010)를 참조한다. 진핵 세포 및 원핵 세포의 형질전환은 표준 기술에 따라 수행된다(예를 들어, 상기 문헌 및 Morrison, 1977, J. Bacteriol.132:349-351, Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362(Wu et al., eds, 1983 참조).
회귀성(homing) 메가뉴클레아제
메가뉴클레아제는 박테리아, 효모, 조류 및 식물 세포소기관과 같은 다양한 유기체에서 유래하는 서열-특이성 엔도뉴클레아제이다. 내인성 메가뉴클레아제는 12 내지 30 염기쌍의 인식 부위를 가지며; 18bp 및 24bp 길이의 메가뉴클레아제 인식 부위를 갖는 맞춤화된 DNA 결합 부위가 기술되어 있으며, 어느 것이든 본 발명의 방법 및 구조물에서 사용될 수 있다. 예를 들어, Silva, G., et al., Current Gene Therapy, 11:11-27, (2011); Arnould et al., Journal of Molecular Biology, 355:443-58 (2006); Arnould et al., Protein Engineering Design & Selection, 24:27-31 (2011); and Stoddard, Q. Rev. Biophys. 38, 49 (2005); Grizot et al., Nucleic Acids Research, 38:2006-18 (2010)을 참조한다.
CRISPR-Cas 뉴클레아제
최근의 연구는 클러스터링된 규칙적 간격의 짧은 회문 반복서열(CRISPR)/CRISPR-관련(Cas) 시스템(Wiedenheft et al., Nature 482, 331-338 (2012); Horvath et al., Science 327, 167-170 (2010); Terns et al., Curr Opin Microbiol 14, 321-327 (2011))이 박테리아, 효모 및 인간 세포에서 뿐만 아니라 초파리, 제브라피쉬 및 마우스와 같은 전체 유기체내 생체내에서 게놈 편집을 수행하기 위한 간단하고 매우 효율적인 방법의 기초로서 제공할 수 있다(Wang et al., Cell 153, 910-918 (2013); Shen et al., Cell Res (2013); Dicarlo et al., Nucleic Acids Res (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Elife 2, e00471 (2013); Hwang et al., Nat Biotechnol 31, 227-229 (2013); Cong et al., Science 339, 819-823 (2013); Mali et al., Science 339, 823-826 (2013c); Cho et al., Nat Biotechnol 31, 230-232 (2013); Gratz et al., Genetics 194(4):1029-35 (2013)). 스트렙토코커스 피오게네스(S. pyogenes)의 Cas9 뉴클레아제(이하, 간단히 Cas9)는 조작된 가이드 RNA(gRNA), 예를 들어 단일 가이드 RNA 또는 crRNA/tracrRNA 쌍의 17 내지 20개 뉴클레오타이드의 단순 염기쌍 상보성, 및 프로토스페이서 인접 모티프(PAM), 예를 들어 서열 NGG 또는 NAG와 매칭하는 PAM 다음에 놓이는 관심의 타겟 게놈 DNA 서열의 상보적 가닥을 통해 가이드될 수 있다(Shen et al., Cell Res (2013); Dicarlo et al., Nucleic Acids Res (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Elife 2, e00471 (2013); Hwang et al., Nat Biotechnol 31, 227-229 (2013); Cong et al., Science 339, 819-823 (2013); Mali et al., Science 339, 823-826 (2013c); Cho et al., Nat Biotechnol 31, 230-232 (2013); Jinek et al., Science 337, 816-821 (2012)). 프레보텔라(Prevotella) 및 프란시셀라(Francisella) 1(Cpf1) 뉴클레아제로부터의 조작된 CRISPR은 또한 예를 들어 Zetsche et al., Cell 163, 759-771 (2015); Schunder et al., Int J Med Microbiol 303, 51-60 (2013); Makarova et al., Nat Rev Microbiol 13, 722-736 (2015); Fagerlund et al., Genome Biol 16, 251 (2015)에 기술된 바와 같이 사용될 수 있다. SpCas9와는 달리, Cpf1은 단 하나의 42-nt crRNA를 필요로 하는데, 이것은 타겟 DNA 서열의 프로토스페이서와 상보적인 3' 말단에서 23개의 nt를 가진다(Zetsche et al., 2015). 또한, SpCas9가 프로토스페이서의 3'인 NGG PAM 서열을 인식하는 반면, AsCpf1 및 LbCp1은 프로토스페이서의 5'에서 발견된 TTTN PAM을 인식한다(Id.).
일부 구현예에서, 본 시스템은 포유류 세포에서의 발현을 위해 박테리아내 인코딩되거나, 코돈-최적화된 것으로 및/또는 PAM 인식 특이성 및/또는 그의 게놈-와이드 특이성에서 변형된 것으로서, 스트렙토코커스 피오게네스(S. pyogenes) 또는 스타필로코커스 아우레우스(Staphylococcus aureus)로부터의 야생형 또는 변이체 Cas9 단백질, 또는 아시다미노코커스 (Acidaminococcus sp .) BV3L6 또는 라크노스피라세(Lachnospiraceae) 박테리아 ND2006으로부터의 야생형 Cpf1 단백질을 사용한다. 다수의 변이체들이 기술되어 있으며; 예를 들어, 그중에서도 WO 2016/141224, PCT/US2016/049147, Kleinstiver et al., Nat Biotechnol. 2016 Aug;34(8):869-74; Tsai and Joung, Nat Rev Genet. 2016 May;17(5):300-12; Kleinstiver et al., Nature. 2016 Jan 28;529(7587):490-5; Shmakov et al., Mol Cell. 2015 Nov 5;60(3):385-97; Kleinstiver et al., Nat Biotechnol. 2015 Dec;33(12):1293-1298; Dahlman et al., Nat Biotechnol. 2015 Nov;33(11):1159-61; Kleinstiver et al., Nature. 2015 Jul 23;523(7561):481-5; Wyvekens et al., Hum Gene Ther. 2015 Jul;26(7):425-31; Hwang et al., Methods Mol Biol. 2015;1311:317-34; Osborn et al., Hum Gene Ther. 2015 Feb;26(2):114-26; Konermann et al., Nature. 2015 Jan 29;517(7536):583-8; Fu et al., Methods Enzymol. 2014;546:21-45; 및 Tsai et al., Nat Biotechnol. 2014 Jun;32(6):569-76을 참고한다. 가이드 RNA는 Cas9 또는 Cpf1과 함께 세포 내에서 발현되거나 존재한다. 가이드 RNA 또는 뉴클레아제 중 하나 또는 양자는 세포에서 일시적으로 또는 안정적으로 발현되거나, 정제된 단백질 또는 핵산으로 도입될 수 있다.
일부 구현예에서, 뉴클레아제는 FokI-dCas9 융합체, Cas9 뉴클레아제가 돌연변이에 의해 촉매적으로 불활성화된 RNA-가이드된 FokI 뉴클레아제, 및, 선택적으로 개재 링커와 함께, dCas9에 프레임내 융합된 FokI 뉴클레아제(예를 들어, dCas9)이다. 예를 들어, WO 2014/144288 및 WO 2014/204578을 참조한다.
TAL 이펙터 반복 어레이
크산토모나스(Xanthomonas) 속의 식물 병원성 박테리아의 TAL 이펙터는 숙주 DNA에 결합하고 이펙터-특이적 숙주 유전자를 활성화시킴으로써, 질병에서 중요한 역할을 하거나 방어를 유발한다. 특이성은 이펙터-가변적인 수의 불완전한, 전형적으로 33 내지 35개 이하의 아미노산 반복에 의존한다. 다형성은 주로 반복 위치 12 및 13에 존재하며, 여기서는 반복 가변-이잔기(repeat variable diresidue, RVD)로 언급된다. TAL 이펙터의 RVD는 일부 퇴행성으로, 및 명백한 컨텍스트 의존성 없이, 직접적이고 선형인 방식으로, 하나의 뉴클레오타이드에 대한 하나의 RVD로 그들의 타겟 부위의 뉴클레오타이드에 상응한다. 일부 구현예에서, 뉴클레오타이드 특이성을 부여하는 다형성 영역은 3잔기 또는 3중 결합으로 표현될 수 있다.
각각의 DNA 결합 반복은 타겟 DNA 서열에서 염기쌍의 인식을 결정하는 RVD를 포함할 수 있으며, 여기서 각 DNA 결합 반복은 타겟 DNA 서열에서 하나의 염기쌍을 인식하는 역할을 한다. 일부 구현예에서, RVD는: C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; T를 인식하기 위한 YG; 및 G를 인식하기 위한 NK 중 하나 이상, 및 C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N*(여기에서, *는 RVD의 제2 위치에서의 갭을 나타냄); T를 인식하기 위한 HG; T를 인식하기 위한 H*(여기에서, *는 RVD의 제2 위치에서의 갭을 나타냄); 및 T를 인식하기 위한 IG 중 하나 이상을 포함할 수 있다.
TALE 단백질은 (예를 들어, 식물에서 바이오연료 또는 바이오재생물질(biorenewable)에 유용한 형질을 추가 또는 증진시키기 위해) 게놈 기술에서 상동성 재조합을 용이하게 할 수 있는 타겟팅된 키메라 뉴클레아제로서 연구 및 생물공학에서 유용할 수 있다. 이들 단백질은 또한 예를 들어 전사 인자로서, 및 비-제한적인 예로서, 특히 병원체(예를 들어, 바이러스)에 대한 치료제와 같은 매우 높은 수준의 특이성을 요하는 치료적 용도에 유용할 수 있다.
조작된 TALE 어레이를 생성하는 방법은 당 분야에 공지되어 있으며, 예를 들어, USSN 61/610,212, 및 Reyon et al., Nature Biotechnology 30,460-465 (2012)에 기술된, 빠른 결찰-기반 자동 고형-상 대용량(fast ligation-based automatable solid-phase high-throughput, FLASH) 시스템; 뿐만 아니라 Bogdanove & Voytas, Science 333, 1843-1846 (2011); Bogdanove et al., Curr Opin Plant Biol 13, 394-401 (2010); Scholze & Boch, J. Curr Opin Microbiol (2011); Boch et al., Science 326, 1509-1512 (2009); Moscou & Bogdanove, Science 326, 1501 (2009); Miller et al., Nat Biotechnol 29, 143-148 (2011); Morbitzer et al., T. Proc Natl Acad Sci U S A 107, 21617-21622 (2010); Morbitzer et al., Nucleic Acids Res 39, 5790-5799 (2011); Zhang et al., Nat Biotechnol 29, 149-153 (2011); Geissler et al., PLoS ONE 6, e19509 (2011); Weber et al., PLoS ONE 6, e19722 (2011); Christian et al., Genetics 186, 757-761 (2010); Li et al., Nucleic Acids Res 39, 359-372 (2011); Mahfouz et al., Proc Natl Acad Sci U S A 108, 2623-2628 (2011); Mussolino et al., Nucleic Acids Res (2011); Li et al., Nucleic Acids Res 39, 6315-6325 (2011); Cermak et al., Nucleic Acids Res 39, e82 (2011); Wood et al., Science 333, 307 (2011); Hockemeye et al. Nat Biotechnol 29, 731-734 (2011); Tesson et al., Nat Biotechnol 29, 695-696 (2011); Sander et al., Nat Biotechnol 29, 697-698 (2011); Huang et al., Nat Biotechnol 29, 699-700 (2011); 및 Zhang et al., Nat Biotechnol 29, 149-153 (2011)에 기술된 방법을 참조하며, 이들 모두는 그 전체가 본 명세서에 참고로 포함된다.
또한, TAL 이펙터와 메가뉴클레아제의 융합체인, MegaTALs가 본 방법에 사용하기에 적합하며; 예를 들어 Boissel et al., Nucl. Acids Res. 42(4):2591-2601 (2014); Boissel and Scharenberg, Methods Mol Biol. 2015;1239:171-96을 참조한다.
징크 핑거(Zinc Fingers)
징크 핑거 단백질은 하나 이상의 징크 핑거, 독립적으로 접혀진 아연-함유 미니-도메인을 함유하는 DNA-결합 단백질이며, 그의 구조는 당 분야에 잘 공지되어 있으며, 예를 들어, Miller et al., 1985, EMBO J., 4:1609; Berg, 1988, Proc. Natl. Acad. Sci. USA, 85:99; Lee et al., 1989, Science. 245:635; and Klug, 1993, Gene, 135:83에 정의되어 있다. 징크 핑거 단백질 Zif268의 결정 구조와 DNA에 결합된 그의 변이체는 반-보존된 상호작용 패턴을 보여 주며, 징크 핑거의 알파-헬릭스로부터의 일반적으로 3개의 아미노산이 인접한 3개의 염기쌍 또는 DNA내 "부속위치"와 접촉한다(Pavletich et al., 1991, Science, 252:809; Elrod-Erickson et al., 1998, Structure, 6:451). 따라서, Zif268의 결정 구조는 징크 핑거 DNA-결합 도메인이 DNA 서열에서 징크 핑거와 3-염기쌍 "부속위치" 사이의 일대일 상호작용을 통해 모듈 방식으로 기능할 수 있음을 시사했다. 자연적으로 발생하는 징크 핑거 전사 인자에서, 다중 징크 핑거는 인접한 DNA 서열의 서열-특이적 인식을 달성하기 위해 일반적으로 직렬(tandem) 배열로 함께 연결된다(Klug, 1993, Gene 135:83).
DNA 결합에 관여하는 알파-나선형 위치에서 아미노산을 무작위화하고 파지 디스플레이와 같은 선택 방법론을 사용하여 관심있는 DNA 타겟 부위에 결합할 수 있는 원하는 변이체를 확인함으로써, 개별 징크 핑거의 DNA 결합 특성을 인위적으로 조작할 수 있음을 여러 연구결과 보여주었다(Rebar et al., 1994, Science, 263:671; Choo et al., 1994 Proc. Natl. Acad. Sci. USA, 91:11163; Jamieson et al., 1994, Biochemistry 33:5689; Wu et al., 1995 Proc. Natl. Acad. Sci. USA, 92: 344). 상기 재조합 징크 핑거 단백질은 유전자 발현을 조절하고, DNA 메틸화를 변경하고, 모델 생물체, 식물 및 인간 세포의 게놈으로 타겟팅된 변형을 도입하기 위해, 전사 활성제, 전사 억제제, 메틸화 도메인 및 뉴클레아제와 같은 기능성 도메인에 융합될 수 있다(Carroll, 2008, Gene Ther., 15:1463-68; Cathomen, 2008, Mol. Ther., 16:1200-07; Wu et al., 2007, Cell. Mol. Life Sci., 64:2933-44) .
"모듈러 어셈블리(modular assembly)"로 알려진 징크 핑거 어레이를 설계하기 위한 기존의 방법 중 하나는 사전-선택된 징크 핑거 모듈을 어레이로 간단하게 결합하는 것을 지지한다(Segal et al., 2003, Biochemistry, 42:2137-48; Beerli et al., 2002, Nat. Biotechnol., 20:135-141; Mandell et al., 2006, Nucleic Acids Res., 34:W516-523; Carroll et al., 2006, Nat. Protoc. 1:1329-41; Liu et al., 2002, J. Biol. Chem., 277:3850-56; Bae et al., 2003, Nat. Biotechnol., 21:275-280; Wright et al., 2006, Nat. Protoc., 1:1637-52). 최근의 보고에 의하면, 연구원이 직접 수행할 수 있을 정도로 간단하지만, 특히 징크 핑커 뉴클레아제의 문맥과 관련하여 이 방법에 대한 높은 실패율(Ramirez et al., 2008, Nat. Methods, 5:374-375; Kim et al., 2009, Genome Res. 19:1279-88), 주어진 임의의 타겟 유전자에 대해 매우 많은 징크 핑거 단백질의 구축 및 세포-기반 시험을 전형적으로 필요로 하는 한계(Kim et al., 2009, Genome Res. 19:1279-88)를 입증하였다.
무작위화 라이브러리에서 징크 핑거 어레이를 동정하는 조합 선택-기반 방법은 모듈 어셈블리보다 성공률이 더 높은 것으로 나타났다(Maeder et al., 2008, Mol. Cell, 31:294-301; Joung et al., 2010, Nat. Methods, 7:91-92; Isalan et al., 2001, Nat. Biotechnol., 19:656-660). 바람직한 구현예에서, 징크 핑거 어레이는 WO 2011/017293 및 WO 2004/099366에 기술되어 있거나, 이에 기술된 바와 같이 생성된다. 추가의 적당한 징크 핑거 DBD는 미국특허 제6,511,808호, 제6,013,453호, 제6,007,988호 및 제6,503,717호 및 미국특허출원 제2002/0160940호에 기술되어있다.
DNA
본원에 기술된 방법은 시험관내에서 수행되는 바와 같이 DNA, 예를 들어 임의의 세포로부터 분리된 게놈 DNA, 인위적으로 생성된 DNA 집단, 또는 임의의 다른 DNA 풀에 적용될 수 있다.
시퀀싱
본원에 사용된 바와 같이, "시퀀싱"은 핵산 서열을 결정하는 임의의 방법을 포함한다. 사슬 종결제(Sanger) 시퀀싱 및 염료 종결제 시퀀싱을 포함하는 임의의 시퀀싱 방법이 본 방법에서 사용될 수 있다. 바람직한 구현예에서, 수천 또는 수백만번의 시퀀싱 반응을 동시에 수행하는 대용량 시퀀싱 기술인, 차세대 시퀀싱(NGS)이 사용된다. 다른 NGS 플랫폼은 다양한 분석 화학을 사용하지만, 이들은 모두 많은 수의 템플릿에서 동시에 실행되는 많은 수의 시퀀싱 반응으로부터 시퀀스 데이터를 생성한다. 전형적으로, 서열 데이터는 스캐너를 사용하여 수집된 다음, 생물정보학적으로 조립되고 분석된다. 따라서, 시퀀싱 반응은 동시에 수행되고, 리드되고(read), 조립되고, 분석되며; 예를 들어, US 20140162897, 뿐만 아니라 Voelkerding et al., Clinical Chem., 55: 641-658, 2009; 및 MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)를 참조한다. 일부 NGS 방법은 템플릿 증폭이 필요하고, 일부는 그렇지 않다. 증폭-요구 방법은 파이로시퀀싱(pyrosequencing)(예를 들어, Roche에 의해 상업화된 미국특허 제6,210,89 호 및 제6,258,568호 참조); Solexa/Illumina 플랫폼(예를 들어, 미국특허 제6,833,246호, 제7,115,400호 및 제6,969,488호 참조); 및 지지된 올리고뉴클레오타이드 결찰 및 탐지(SOLiD) 플랫폼(Applied Biosystems; 예를 들어, 미국특허 제5,912,148호 및 제6,130,073호 참조)을 포함한다. 증폭을 필요로 하지 않는 방법, 예를 들어 단일-분자 시퀀싱 방법은 나노포어 시퀀싱, HeliScope(미국특허 제7,169,560호; 제7,282,337호; 제7,482,120호, 제7,501,245호, 제6,818,395호, 제6,911,345호 및 제7,501,245호); 합성에 의한 실시간 시퀀싱(예를 들어, 미국특허 제7,329,492호 참조); 제로-모드 도파관(ZMWs)을 이용한 단일 분자 실시간(SMRT) DNA 시퀀싱 방법; 및 미국특허 제7,170,050호; 제7,302,146호; 제7,313,308호; 및 제7,476,503호에 기술된 것을 포함하는 다른 방법을 포함한다. 예를 들어, US 20130274147; US20140038831; Metzker, Nat Rev Genet 11(1): 31-46 (2010)을 참조한다.
대안적으로, 잡종화-기반 서열 방법 또는 다른 대용량 방법, 예를 들어, 마이크로어레이 분석, NANOSTRING, ILLUMINA, 또는 다른 시퀀싱 플랫폼이 또한 사용될 수 있다.
키트
또한, 본원에 기술된 방법에 사용하기 위한 키트가 제공된다. 키트는 다음 중 하나 이상을 포함할 수 있다: 헤어핀 어댑터; 말단 수선 및 A 테일링을 위한 제제 및/또는 효소(예를 들어, T4 폴리머라제, Klenow 단편, T4 폴리뉴클레오타이드 키나아제(PNK) 및/또는 Taq DNA 폴리머라제); 엑소뉴클레아제; 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII, DNA 글리코실라제-리아제, 예를 들어 USER(우라실-특이적 절제 제제) 효소 혼합물(New England BioLabs); 정제된 뉴클레아제, 예를 들어, cas9 단백질; 가이드RNA(예를 들어, 대조군 gRNA); gDNA 주형(예를 들어, 대조군 gDNA 주형); 및/또는 본 명세서에서 설명된 방법에서 사용하기 위한 명령들.
실시예
본 발명은 청구범위에 기술된 본 발명의 범주를 제한하지 않는, 하기의 실시 예에서 추가로 기술된다.
재료 및 방법
하기 물질 및 방법을 하기 실시예 1 내지 6에서 사용하였다.
세포 배양 및 형질감염
인간 U2OS(T. Cathomen의 기증품), HEK293(Thermo-Fisher), K562 및 PGP1 섬유아세포(G. Church의 기증품)에서 세포 배양 실험을 수행하였다. 5% CO2와 함께 10% FBS, 2 mM GlutaMax(Life Technologies) 및 페니실린/스트렙토마이신이 보충된 어드밴스드 DMEM(Life Technologies)에서 U2OS 및 HEK293 세포들을 37℃에서 배양하였다. 5% CO2와 함께 10% FBS, 2mM GlutaMax 및 페니실린/스트렙토마이신이 보충된 RPMI 1640(Life Technologies)에서 K562 세포를 37℃에서 배양하였다. 5% CO2와 함께 10% FBS, 2 mM GlutaMax 및 페니실린/스트렙토마이신을 갖는 Eagle's DMEM(ATCC)에서 인간 PGP1 섬유아세포를 37℃에서 배양하였다. CIRCLE-seq 실험을 위해, Gentra Puregene 조직 키트(Tissue Kit)(Qiagen)를 사용하여 게놈 DNA를 분리하고, Qubit(Thermo Fisher)에 의해 정량화했다. 타겟팅된 태그-통합 딥-시퀀싱 실험을 위해, U2OS 세포(프로그램 DN-100), HEK293 세포(프로그램 CM-137) 및 K562 세포(프로그램 FF-120)를 제조사의 지침에 따라 Lonza Nucleofector 4-D 상에서 20 ㎕ 용액 SE(Lonza)에 형질감염시켰다. U2OS 세포에서, 500 ng의 pCAG-Cas9(pSQT817), 250 ng의 gRNA 인코딩 플라스미드 및 100 pmol의 GUIDE-seq 말단-보호된 dsODN을 함께 형질감염시켰다. 타겟팅된 태그 통합 시퀀싱을 위한 게놈 DNA는 Agencourt DNA어드밴스드 게놈 DNA 분리 키트(dvanced Genomic DNA Isolation Kit)(Beckman Coulter Genomics)를 사용하여 형질감염 후 약 72시간 후에 수확했다.
gRNA의 시험관내 전사
gRNA 타겟 부위를 포함하는 어닐링된 올리고뉴클레오타이드를 T7 RNA 폴리머 라제 프로모터 부위를 함유하는 플라스미드 NW59에 클로닝하였다. gRNA 발현 플라스미드를 HindIII 제한 효소(NEB)로 선형화시키고, MinElute PCR 정제 키트(Qiagen)로 정제하였다. 선형화된 플라스미드는 MEGAshortscript 키트를 사용하여 제조사(Thermo Fisher)의 지침에 따라 gRNA의 시험관내 전사를 위한 DNA 주형으로 사용되었다.
CIRCLE-seq 라이브러리 제조
GUIDE-seq에 의해 사전 평가된 gRNA를 사용한 실험의 경우, CIRCLE-seq 실험은 GUIDE-seq에 의해 평가된 동일한 세포(U2OS 또는 HEK293 세포 중 하나)의 게놈 DNA에서 수행하였다. 정제된 게놈 DNA를 Covaris S200 장비를 사용하여 300 bp의 평균 길이로 전단하고, 말단-수선하고, A-테일링하고, 우라실(데옥시우리딘)-함유 스템-루프 어댑터 oSQT1288 5'-P-CGGTGGACCGATGATCUATCGGTCCACCG*T-3'(SEQ ID NO: 1)에 결찰시켰으며, 여기에서 *는 포스포로티오에이트 결합을 나타낸다. 어댑터-결찰된 DNA를 람다 엑소뉴클레아제(NEB)와 E.coli 엑소뉴클레아제 I(NEB)의 혼합물에 의해 처리한후, USER 효소(NEB) 및 T4 폴리뉴클레오타이드 키나아제(NEB)의 혼합물에 의해 처리하였다. DNA를 T4 DNA 리가아제로 5 ng/㎕의 농도로 원형화시키고, 나머지 선형 DNA 분자를 분해하기 위해 플라스미드-세이프(Plasmid-Safe) ATP-의존성 DNase(Epicentre)로 처리하였다. 시험관내 절단 반응은 Cas9 뉴클레아제 완충액(NEB), 90 nM SpCas9 단백질, 90 nM 시험관내 전사된 gRNA, 및 250 ng의 플라스미드-세이프-처리된 원형화(Plasmid-Safe-treated circularized) DNA로 100 μl에서 수행되었다. 소화된 생성물을 A-테일링시키고, 헤어핀 어댑터와 결찰하고, USER 효소(NEB)로 처리하고, Kapa HiFi 폴리머라제(Kapa Biosystems)를 사용하여 PCR에 의해 증폭시켰다. 완성된 라이브러리는 액적 디지털 PCR(Bio-Rad)로 정량화하고, Illumina MiSeq 장비에서 150 bp의 쌍 말단 리드로 시퀀싱하였다. CIRCLE-seq 라이브러리 구성에 대한 상세한 사용자 프로토콜은 실시예 7에서 제공된다.
타겟팅된 딥-시퀀싱
상기 설명된 GUIDE-seq dsODN에 추가하여, Cas9 및 gRNA 발현 플라스미드로 U2OS 세포를 형질감염시켰다. CIRCLE-seq에 의해 확인된 오프-타겟 부위는 Phusion Hot Start Flex DNA 폴리머라제(New England Biolabs)를 사용하여 분리된 U2OS 게놈 DNA로부터 증폭시켰다. 각 PCR의 입력으로서 100 ng의 게놈 DNA를 사용하여 각 형질감염 조건에서 3배의 PCR 산물을 생성했다. PCR 산물을 농도를 표준화하고, 상이한 형질감염 조건에 상응하는 상이한 라이브러리에 풀링하고, Ampure XP 자성 비드(Agencourt)로 정제하였다. Illumina Tru-seq 딥-시퀀싱 라이브러리는 500 ng의 각 풀링된 샘플(KAPA Biosystems)을 사용하여 구성하고, 실시간 PCR(KAPA Biosystems)에 의해 정량화하고, Illumina MiSeq 장비로 시퀀싱했다.
CIRCLE-seq 데이터 분석
페어드-엔드 리드(Paired-end read)를 병합한 다음, bwa 40 mem을 사용하여 기본 매개변수로 매핑하였다. 매핑 품질이 50 이상인 기대 방향으로 매핑되는 리드의 시작 매핑 위치를 표로 작성하고, 뉴클레아제-처리된 샘플이 풍부한 게놈 간격을 확인하였다. 양쪽 측면의 간격 및 20 bp의 인접한 기준 서열을 이용하여 잠재적 뉴클레아제-유도된 오프-타겟 부위를 6개 이하의 편집 거리로 탐색하여 갭을 허용하였다.
samtools 41 ,42 mpileup은 동정된 오프-타겟 부위의 유전적 변이를 참조하지 않는데 사용되었다. 평균 품질 점수가 20점을 넘은 위치를 가능한 변형으로 간주하고, 육안 검사로 확인했다.
오프-타겟 절단 부위의 기준-독립적 발견은 한쌍의 한 리드의 서열을 역 보완하고, 다른 리드와 연쇄결합시킴으로써 수행되었다. 접합부의 양측에서 개시하는 20-bp의 간격을 편집 거리가 ≤6인 잠재적인 오프-타겟 절단 부위에 대해 직접 검색하여, 동정된 부위에 해당하는 간격 및 리드 카운트를 표로 작성했다.
CIRCLE-seq 오픈-소스 분석 소프트웨어
뉴클레아제 오프-타겟 부위의 게놈-와이드 탐지를 위한 CIRCLE-seq의 광범위한 사용을 가능하게 하기 위해, 본 발명자들은 CIRCLE-seq 실험 데이터 분석을 위해 자유롭게 사용할 수 있는 오픈-소스 Python 패키지 circleseq를 개발했다. 간단한 샘플 목록을 제공하여, circleseq 소프트웨어는 단일 명령을 사용하여 CIRCLE-seq 시퀀싱 데이터의 전체 말단 간 분석을 수행하고, 오프-타겟 절단 부위 위치의 후보 표뿐만 아니라 오프-타겟 서열의 시각적 정렬을 복귀한다.
Digenome-seq 데이터 분석
CIRCLE-seq에 의해 확인된 절단 부위 주변의 좁은 윈도우(+/-3 bp)에서의 매핑 위치의 리드 카운트는 원래의 Digenome-seq 시퀀싱 정렬로부터 표로 작성되었다. 0.01 유의 수준에서 절단의 중요한 증거는 음 이항 분포를 맞추어 평가하였으며, 이 기준에 의한 통계적으로 유의한 부위가 도 2b에 포함되었다.
실시예 1. CIRCLE-seq 방법의 개요 및 최적화
본 발명자들은 Digenome-seq(도 1a)에 의해 발생하는 무작위 게놈 DNA의 혼란스러운(confounding) 배경 리드가 Cas9 뉴클레아제-절단된 게놈 DNA 단편의 선택적 농축에 의해 실질적으로 감소될 것이라고 추론했다. 이를 달성하기 위해, 본 발명자들은 무작위 전단된 선형 게놈 DNA를 순환시켜, 이후 잔류 비-원형 DNA를 효소 분해하는 제한 효소-독립적인 전략을 설계했다(도 1b-1c). 본 발명자들은 온-타겟 및 오프-타겟 부위에서 부위-특이적 뉴클레아제에 의한 상기 게놈 DNA 원형 집단의 절단이 차세대 시퀀싱 어댑터가 결찰될 수 있는 선형 DNA 말단을 방출할 것이라고 예상했다. 본 발명자들은 집단적으로 이 단계들이 뉴클레아제-유도된 DNA 말단의 선택적 농축 및 시퀀싱을 가능하게 하고, 무작위로 분포된 말단 전단된 게놈 DNA 제조물의 바람직하지 않은 시퀀싱을 억제해야 한다고 가설을 세웠다. 중요하게는, 뉴클레아제 오프-타겟 절단 부위 발견을 위한 다른 모든 게놈-와이드 방법과 대조적으로, 본 발명자들의 전략은 하나의 DNA 분자에서 페어드-엔드 시퀀싱을 사용하여 단일 절단 부위의 쌍방향 시퀀싱을 유일하게 가능하게 할 것이다.
CIRCLE-seq라고 불리는 이 방법의 최적화와 기술적 재현성의 특성화(도 1d)는 다음과 같이 수행되었다. 게놈 DNA의 제한-효소 독립적 원형화를 달성하기 위해, 우라실-함유 스템 루프 어댑터와 말단-수선된 A-테일링된 PCR 앰플리콘의 결찰에 기초한 전략을 시험하였다. 본 발명자들은 람다 엑소뉴클레아제와 E. coli 엑소뉴클레아제 I의 혼합물로 양측에 스템-루프 어댑터가 결찰되어있는 공유결합으로-닫힌 DNA 분자를 효소적으로 선택했다. USER 효소와 T4 PNK의 혼합물을 사용하여 4 bp 오버행을 해제하고, 분자내 결찰에 유리한 조건 하에 T4 DNA 리가아제로 결찰을 수행하고, 모세관 전기영동에 의해 성공적인 원형화를 측정하였다. 가장 높은 원형화 효율을 얻는 조건(400 U T4 DNA 리가아제, 5 ng/ul DNA 농도)을 후속 실험에 사용하였다. CIRCLE-seq의 기술적 재현성을 특성화하기 위해, 본 발명자들은 U2OS 게놈 DNA의 동일한 소스로부터 독립적인 라이브러리 제조를 수행했다. 본 발명자들은 독립적인 기술적 복제물에서 강한 CIRCLE-seq 리드 카운트 상관관계를 관찰하였다(도 1d).
실시예 2. CIRCLE-seq은 CRISPR-Cas9 게놈-와이드 오프-타겟 절단 부위의 매우 민감한 시험관내 탐지를 가능하게한다
CIRCLE-seq의 효능과 민감도를 시험하기 위해, 본 발명자들은 지금까지 Digenome-seq의 가장 최신 버전 및 정확한 버전으로 프로파일링된 단일 공개된 gRNA로 유도된 Cas9의 오프-타겟 절단 부위를 동정하기 위해 그것을 사용하였다35. 인간 K562 세포 게놈 DNA에서 이 gRNA(인간 HBB 유전자로 타겟팅됨)를 이용한 SpCas9의 CIRCLE-seq 평가는 GUIDE-seq에 의해 이전에 동정된 29개의 오프-타겟 부위 중 26개뿐 아니라 156개의 새로운 오프-타겟 부위를 동정했다(도 2a). CIRCLE-seq가 아닌 Digenome-seq에 의해 발견된 3개의 오프-타겟 부위에 대해 본 발명자들은 CIRCLE-seq 데이터에서 지원되는 리드를 관찰하여 이러한 부위들이 상기 특정 실험에서 단순히 언더샘플링된 것임을 입증했다. 본 발명자들은 CIRCLE-seq에 의해서만 탐지된 156개의 새로운 오프-타겟 절단 부위 중 29개가 원래의 Digenome-seq 데이터34내 절단의 증거이며(도 2b); Digenome-seq이 상기 부위를 호출할 수 없다는 것은 이 방법으로 생성된 풍부한 게놈-와이드 배경 리드와 맞서기 위해 요구되는 엄격한 정보과학 득점 기준때문일 가능성이 크다는 것을 발견하였다. 이와는 대조적으로, 본 발명자들은 CIRCLE-seq에 의해 배경 리드가 드문 것을 발견하였다(도 2c). 실제로, 본 발명자들은 무작위 배경 리드에 대한 뉴클레아제-절단된 서열 리드를 위한 CIRCLE-seq의 농축 인자가 두 가지 방법에 의한 온-타겟 부위의 검사 및 시퀀싱 깊이 조정을 기반으로 한 Digenome-seq의 것보다 약 180,000배 우수하다고 추정한다(도 2c). 양방향 CIRCLE-seq 리드의 시작 매핑 위치는 SpCas9의 예상 절단 부위(PAM 서열 이전 3bp)와 일치하며(도 2d), 이 방법으로 절단 위치를 뉴클레오타이드-수준 정밀도로 정확하게 매핑할 수 있음을 보여준다. 종합하면, 이 결과는 CIRCLE-seq이 Digenome-seq에 비해 더 높은 신호-대-노이즈를 보유하고 있음을 보여주는데, 이는 게놈-와이드 오프-타겟 부위를 동정하는데 있어 더 높은 민감도를 설명할 가능성이 높다.
실시예 3. CIRCLE-seq과 세포-기반 오프-타겟 측정 방법의 직접 비교
다음으로 본 발명자들은 CIRCLE-seq의 성능을 현재 게놈-와이드 오프-타겟 돌연변이 확인을 위해 사용할 수 있는 가장 민감한 세포-기반 접근법 중 하나인 GUIDE-seq와 비교했다30. 초기 비교에서, 본 발명자들은 CIRCLE-seq을 사용하여 SpCas9를 표준 비-반복 서열로 타겟팅된 6개의 다른 gRNA로 평가했으며, 2개의 다른 인간 세포주에서 GUIDE-seq에 의해 이미 특성화했다. CIRCLE-seq는 상기 6개의 다른 gRNA에 대한 오프-타겟 절단 부위의 가변 수를 21에서 최대 124까지의 숫자 범위로 확인했으며(도 3a; EMX1 타겟팅 실험의 일 복제본에 대한 예시 데이터는 하기 표 2에 도시되어 있으며; EMX1 타겟 부위 서열: GAGTCCGAGCAGAAGAAGAANGG(SEQ ID NO:2)), 인간 게놈 전체에 분포되어 있다(도 3b). 중요하게는, 6개의 모든 gRNA에 대해 CIRCLE-seq은 이전에 GUIDE-seq를 사용하여 오프-타겟 부위를 동정할 수 없었던 RNF2로 타겟팅된 gRNA를 포함하여, GUIDE-seq에 의해 이전에 발견된 것보다 더 많은 오프-타겟 부위를 동정했다. 6개의 gRNA 중 4개에 대해, CIRCLE-seq는 GUIDE-seq에 의해 동정된 모든 오프-타겟 부위를 탐지하였으며(도 3c), 및 다른 2개 gRNA에 대해, CIRCLE-seq는 각각에 대해 1개의 오프-타겟외 모든 부위를 탐지했다(도 3c). 이 실험에 대한 CIRCLE-seq 데이터를 면밀히 조사한 결과 실제로 상기 2개의 오프-타겟 부위에 대한 일부 지지 리드 증거를 나타냈지만, 이 실험에서 탐지를 위한 통계적 임계값을 충족하는데 필요한 충분한 수치가 아니라는 사실이 밝혀졌다. 또한 예상대로, 이러한 2개의 탐지되지않은 부위는 GUIDE-seq 실험에서 탐지 가장자리에 있었다. 종합하여 보면, 이러한 결과는 CIRCLE-seq 시퀀싱 깊이를 약간 증가시키면 상기 2개의 오프-타겟 부위가 탐지될 것이라고 다시 제안한다.
CIRCLE-seq에 대한 보다 까다로운 테스트를 제공하기 위해, 본 발명자들은 또한, 반복적인 서열로 타겟팅되고, GUIDE-seq에 의해 사전 특성화된 4개의 추가 gRNA에 의해 SpCas9를 프로파일링했다. 타겟의 반복적인 특성으로 인해, 상기 4개의 gRNA는 인간 게놈에서 비교적 많은 수의 밀접하게 매치된 부위를 가지고 있으며(표 1), 놀랍지 않게 인간 세포에서 GUIDE-seq에 의해 많은 수의 오프-타겟 효과를 유도하는 것으로 나타났다30. 예상대로 CIRCLE-seq은 4개의 gRNA(도 3a 표 2) 각각에 대해 496 내지 2503의 수의 범위에 있고, 인간 게놈 전체에 걸쳐 분포된, 훨씬 많은 수의 오프-타겟 부위를 동정했다(도 3b). 이 중에는 GUIDE-seq 실험에 의해 이전에 동정된 364개의 오프-타겟 부위 중 353개가 포함되었다(도 3c). GUIDE-seq에 의해 발견되었지만 CIRCLE-seq에 의해 동정되지 않은 11개 부위 중 9개 부위에 대해, CIRCLE-seq 데이터에는 지지 리드의 증거가 발견될 수 있었지만, 통계적 기준에는 충분히 많은 수가 없었으며, 큰 시퀀싱 리드 깊이가 상기 부위를 탐지할 수 있었음을 다시 한번 더 제시한다.
본 발명자들은 다음에 CIRCLE-seq를 사용하여 SpCas9와, 이전에 세포 기반 HTGTS 방법으로 사전에 특성화되었던 2개의 gRNA를 프로파일링했다. 이 실험은 두 gRNA(EMX1VEGFA 유전자의 부위로 타겟팅됨)에 대해, CIRCLE-seq가 HTGTS에 의해 사전 동정된 53개의 오프-타겟 부위 중 50개(94%)를 발견했음을 나타냈다(도 3e). CIRCLE-seq에 의해 탐지되지 않은 3개의 HTGTS 부위 중 2개는 추가 실험 복제가 수행되고 3번째 HTGTS 점수가 낮은 경우, 상기 3개의 부위가 더 큰 CIRCLE-seq 시퀀싱 깊이로 탐지된다는 것을 알 수 있다. 중요하게는, CIRCLE-seq은 또한, 이전에 HTGTS에 의해 이전에 동정되었던 것보다 훨씬 더 많은 수의 오프-타겟 부위를 발견했다(도 3d).
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
실시예 4. 인간 세포에서 CIRCLE-seq에 의해 동정된 오프-타겟 부위의 돌연변이
본 실험에서 제기된 중요한 질문은 (GUIDE-seq 또는 HTGTS에 의해서가 아닌) CIRCLE-seq에 의해 시험관내에서 동정된 새로운 오프-타겟 절단 부위가 Cas9/gRNA 복합체에 의해 실제로 세포내에서 돌연변이되었는지 여부이다. CIRCLE-seq 및 GUIDE-seq 모두에 의해 탐지된 많은 오프-타겟 부위가 높은 수의 CIRCLE-seq 시퀀싱 리드 카운트를 가진다면(도 4a), 이 사실은 시험관내에서 효과적으로 절단되는 부위들을 GUIDE-seq가 대부분 탐지함을 강하게 시사한다. 대조적으로, CIRCLE-seq에서만 발견되는 오프-타겟 부위들은 더 낮은 CIRCLE-seq 리드 카운트를 가지며(도 4a), 이 사실은 상기 부위들이 더 낮은 빈도로 절단되기 때문에 이들이 GUIDE-seq에 의해 미싱될 수도 있음을 시사한다. 이것이 정확하다면, 차세대 시퀀싱의 오류율이 약 0.1%의 indel 돌연변이 탐지를 위한 플로어를 제공하기 때문에 표준 타겟팅된 앰플리콘 시퀀싱을 사용하여 세포내 상기 부위를 검증하는 것이 어려울 것으로 예상된다.
CIRCLE-seq에 의해 밝혀진 새로운 오프-타겟 부위(그러나 본 발명의 원래 GUIDE-seq 실험에서는 아님)가 인간의 세포에서 절단될 수 있는지 여부를 확인하기 위해, 본 발명자들은 우리가 세포-기반 GUIDE-seq 실험에서 얻은 게놈 DNA를 사용하여 높은 깊이의 타겟팅된 앰플리콘 시퀀싱을 수행할 수 있었음을 추론하였으며, 오프-타겟 Cas9 절단에 대한 증거로 태그 통합을 찾는다(도 4b). 이 전략은 태그 통합이 무시할 수 있는 배경 빈도로 발생하기 때문에 딥 시퀀싱과 관련된 indel 오류율의 문제를 회피한다. 이 타겟팅된 태그 통합 시퀀싱 접근법을 사용하여, 본 발명자들은 EMX1VEGFA 부위 1 gRNA에 대해 SpCas9를 사용하여 CIRCLE-seq에 의해 (그러나 GUIDE-seq에 의해서는 아님) 발견된 총 98개의 오프-타겟 부위를 조사했다. 본 발명자들은 온-타겟 부위와 관련하여 CIRCLE-seq 리드 카운트 및/또는 미스매치 수의 범위가 있는 부위를 선택했다. 태그 통합 분석을 위한 양성 대조군으로서, 본 발명자들은 또한 가변성 CIRCLE-seq 리드 카운트를 나타내고, 및 CIRCLE-seq 및 GUIDE-seq 모두에 의해 발견된 더 적은 세트의 오프-타겟 부위를 선택하였다. 타겟팅된 앰플리콘 시퀀싱은 GUIDE-seq 리드 카운트와 상관 관계가 있는 빈도로, 모든 대조군 오프-타겟 부위에서 dsODN 태그의 탐지를 나타내었다(도 4c4d). 특히, 본 발명자들은 또한 예상되는 바와 같이 낮은 범위의 빈도(0.003-0.2%)로, CIRCLE-seq에 의해서만 동정되는 98개의 새로운 오프-타겟 부위 중 24개에서 dsODN 태그 통합을 탐지하였다(도 4c-4e). PAM 서열로부터 3 bps 떨어진, 프로토스페이서 상보성 영역내 예상되는 위치에 대한 상기 태그 통합 맵 중 24개 모두의 위치는 진짜 오프-타겟 절단 부위를 나타내는 상기 부위와 일치한다(도 4f).
실시예 5. CIRCLE-seq에 의한 기준 게놈-독립적 오프-타겟 부위 발견
단일 DNA 분자로부터의 CIRCLE-seq 리드의 각 쌍이 CRISPR-Cas9 뉴클레아제 절단 부위의 양측으로부터 서열을 생성하기 때문에, 본 발명자들은 본 방법이 기준 게놈 서열 없이도 오프-타겟 부위를 동정하는데 사용될 수 있다고 추론했다. 이를 위해 본 발명자들은 말단 간 방향에서 페어드-엔드 리드를 병합하고, 온-타겟 부위와 유사한 오프-타겟 절단 부위를 직접 검색하는 매핑-독립적인 오프-타겟 부위 발견 알고리즘을 개발했다(재료 및 방법 참조). 이 알고리즘을 사용하여, 본 발명자들은 본 발명의 표준 기준-기반 매핑 알고리즘(도 4g)에 의해 탐지된 10개 이상의 CIRCLE-seq 리드로 CIRCLE-seq 부위의 평균 ~99.5%를 동정했다. 이 결과는 CIRCLE-seq이 기준-독립적인 방식으로 사용되어 게놈 서열이 잘 규명되지 않았거나 및/또는 높은 유전적 다양성(예를 들어, 야생의 비-근친종)을 보이는 유기체에 대한 오프-타겟 절단 부위를 동정할 수 있음을 입증한다.
실시예 6. CIRCLE-seq 오프-타겟 부위와 SNPs의 연관성
CIRCLE-seq과 같은 시험관내 방법은 높은 처리량과 재현 용이성으로 임의의 주어진 Cas9/gRNA 뉴클레아제에 대한 환자-특이적 오프-타겟 프로파일을 정의할 수 있는 기회를 제공한다. 이전의 연구는 오프-타겟 절단에 영향을 주는 SNP의 단일 예를 확인했다36. 유전적 차이가 뉴클레아제-유도된 오프-타겟 절단에 영향을 미칠 수 있는지를 보다 광범위하게 시험하기 위해, 본 발명자들은 6개의 gRNA를 가진 인간 K562 게놈 DNA에 대한 추가의 CIRCLE-seq 실험을 수행하였으며, 인간 HEK293 및 U2OS 게놈 DNA(HEK293 상에 3개 gRNA 및 U2OS 상에 3개)에 대해 이미 평가하였다. 이 gRNA에 대한 많은 오프-타겟 부위가 테스트한 두 가지 세포 유형으로부터의 DNA에 대한 상관된 CIRCLE-seq 리드 카운트를 보여주었지만, 본 발명자들은 또한 하나의 세포 유형에서만 또는 다른 하나의 유형에서만 우선적으로 절단된 55개의 부위를 관찰했다(도 5a). 검사 결과, 8개의 오프-타겟 절단 부위가 비-기준 단일-뉴클레오타이드 다형성(SNPs)을 가지며, 이는 절단 효능에 있어서 이러한 관찰된 세포-유형 특이적 차이 중 일부로 설명되는 것으로 나타났다(도 5b). 흥미롭게도, 이러한 SNPs는 PAM 내에서 뿐만 아니라 프로토스페이서 상보성의 영역에서 관찰되었고, 기준 게놈 서열에 비해 부위의 절단을 증가 또는 감소시킬 것으로 예측되었다(도 5b).
SNP가 오프-타겟 부위에서 절단 효율에 영향을 미치는 것으로 나타나는 추가 예를 확인한 다음, 본 발명자들은 오프-타겟 절단 효능에 영향을 줄 것으로 예상되는 SNP 빈도를 추정하고자 했다. 이를 위해, 본 발명자들은 CIRCLE-seq에 의해 평가한 6개의 gRNA(표준 비-반복성 서열로 타겟팅됨)에 대해 본 발명자들이 탐지한 1247개의 모든 오프-타겟 부위에서 1000 게놈 프로젝트(Genomes Project)37로부터 2504명의 개인의 유전자형을 조사했다. 본 발명자들은 평균적으로 상기 오프-타겟 부위의 ~2.5%에서 비-기준 유전적 변이를 발견했다(도 5c). 집단 수준에서, 본 발명자들은 초모집단이 상기 오프-타겟 부위의 평균 ~20%의 유전적 변이를 포함한다는 것을 발견했다(도 5c). 또한, 상기 오프-타겟 부위의 50%는 1000 게놈 프로젝트에서 시퀀싱된 하나 이상의 개체에 대해 비-기준 유전적 변이를 함유하였다(도 5c). 상기 빈도는 dbSNP38의 가장 최신 버전에 ~1억개 이상의 유효성이 입증된 인간 SNP가 존재할 경우, 인간 게놈내 SpCas9 오프-타겟 부위의 ~69%에서 SNP를 찾을 것으로 기대할 수 있다는 예상과 일치한다. 예상한 바와 같이, 1000 게놈 프로젝트에서 다양한 개별 유전자형을 고려할 때, 본 발명자들이 조사한 오프-타겟 부위에서 관찰된 미스매치 범위가 증가한다(도 5d). 흥미롭게도, 오프-타겟 부위 하플로타입의 약 9%에 대해, 기준 게놈에 대한 미스매치의 수가 감소되어, 상기 부위에서의 오프-타겟 절단 위험의 잠재적 증가를 예측할 수 있다(도 5e). 종합하면, 이러한 결과는 오프-타겟 분석을 위한 개별 유전적 변이의 중요성을 강조하고, CIRCLE-seq이 어떻게 개인화된 게놈-와이드 오프-타겟 프로파일을 생성하는데 사용될 수 있는지를 강조한다.
실시예 7. 예시적인 CIRCLE-Seq 프로토콜
본원에 기술된 것은 복합 게놈 DNA 혼합물로부터 CRISPR/Cas9 뉴클레아제의 절단 부위를 발견하기 위한 시험관내 분석을 위한 예시적인 프로토콜이다.
재료
프로토콜 1에서 하기의 재료들이 사용되었다.
Figure pct00008
Figure pct00009
20℃에서 30분간 배양한다.
120 ul Ampure XP 비드를 사용하여 1.7X SPRI 세척(cleanup)한다.
Figure pct00010
30℃에서 30분간 배양한다.
90 ul의 SPRI 용액을 첨가하여 세척한다.
Figure pct00011
20℃에서 1시간동안 배양한다.
50 ul의 SPRI 용액을 첨가하여 세척한다.
1 ug의 5' 어댑터-결찰된 DNA에 의해 다음 단계로 진행한다.
Figure pct00012
37℃에서 1시간동안, 75℃에서 10분동안 배양한다.
90 ul의 1X Ampure XP 비드를 첨가하여 세척한다.
Figure pct00013
37℃에서 1시간동안 배양한다.
90 ul의 SPRI 용액을 첨가하여 세척한다.
Figure pct00014
16℃에서 하룻밤동안(16시간) 배양한다.
100 ul의 Ampure XP 비드를 첨가하여 세척한다.
Figure pct00015
37℃에서 1시간동안, 70℃에서 30분동안 배양한다.
50 ul의 1X Ampure XP 비드를 첨가하여 세척한다.
Figure pct00016
실온에서 10분간 배양한다.
DNA(~400 bp, 250 ng) 15
37℃에서 1시간동안 배양한다.
1X SPRI 비드 세척(100 ul)에 의해 정제한다.
Figure pct00017
30℃에서 30분동안 배양한다.
90 ul의 SPRI 용액을 첨가하여 세척한다.
Figure pct00018
20℃에서 30분동안 배양한다.
50 ul의 SPRI 용액을 첨가하여 세척한다.
Figure pct00019
1X SPRI 용액(50 ul)에 의해 정제한다.
Figure pct00020
제제 제조사
Gentra Puregene 조직 키트 Qiagen
Qubit dsDNA BR 분석 키트 Thermo Fisher
Agencourt AMPure XP 자성 비드 Beckman Coulter
높은 처리량, "비드를 갖는",
무 PCR 라이브러리 제조 키트 KAPA Biosystems
효소 및 완충액 New England Biolabs
- 람다 엑소뉴클레아제
- 엑소뉴클레아제 I (E. coli)
- USER 효소
- T4 폴리뉴클레오타이드 키나아제
- T4 DNA 리가아제
- Cas9 뉴클레아제, 스트렙토코커스 피오게네스(S. pyogenes)
Plasmid-SafeTM ATP-의존성 DNase Epicentre
MEGAshortscriptTM 키트 Thermo Fisher
NEBNext® Multiplex Oligos for Illumina®
(이원 지수 프라이머 세트 1) New England Biolabs
KAPA HiFi HotStart ReadyMix KAPA Biosystems
Illumina TruSeq용
ddPCRTM 라이브러리 정량화 키트 Bio-Rad
NGS를 위한 KAPA 라이브러리 정량화 키트
(Universal) KAPA Biosystems
CIRCLE-seq 헤어핀 어댑터
Figure pct00021
어닐링 프로그램: 95℃ 5분, 70주기동안 -1℃/분, 4℃에서 유지.
투입 정량화 및 전단
1. Covaris S2의 경우 표준 작동 프로토콜에 따라 게놈 DNA를 300 bp의 평균 길이로 전단한다.
2. 제조사의 프로토콜에 따라 전단 DNA를 1.8X Ampure XP SPRI 비드로 세척하고, 1X TE 완충액 35 μl로 용출시킨다.
말단-수선
1. 각 말단-수선 반응의 경우:
Figure pct00022
말단 수선 프로그램: 20℃에서 30분 동안, 4℃에서 유지.
2. 1.7X SPRI 세척하고(Agencourt Ampure XP 비드 120 μl), 42 μl의 1X TE 완충액에서 용리한다.
A-테일링
1. 각 A-테일링 반응의 경우:
Figure pct00023
A- 테일링 프로그램: 30℃에서 30분간, 4℃에서 유지.
2. 1.8X SPRI 세척하고(PEG/NaCl SPRI 용액 90 μl), 30 μl의 1X TE 완충액에서 용리한다.
어댑터 결찰
1. 어닐링된 어댑터 oSQT1288에 대한 각각의 결찰 반응의 경우:
Figure pct00024
결찰 프로그램: 20℃에서 1시간 동안, 4℃에서 유지.
2. 1X SPRI 세척하고(50 μl의 PEG/NaCl SPRI 용액), 1X TE 완충액 30 μl에서 용리한다.
효소적 처리
람다 엑소뉴클레아제/엑소뉴클레아제 I( E.coli ) 처리
1.
Figure pct00025
배양 프로그램: 37℃에서 1시간, 75℃에서 10분, 4℃에서 유지.
2. 1.8X SPRI 세척하고(Agencourt Ampure XP 비드 90 μl), 1X TE 완충액 40 μl에서 용리한다.
USER/T4 PNK 처리
1.
Figure pct00026
배양 프로그램: 37℃에서 1시간, 4℃에서 유지.
2. 1.8X SPRI 세척하고(PEG/NaCl SPRI 용액 90 μl), 1X TE 버퍼 35 μl에서 용리한다.
분자내 원형화
1.
Figure pct00027
원형화 프로그램: 16℃에서 16시간
2. 1X SPRI 세척하고(Agencourt Ampure XP 비드 100 μl), 1X TE 완충액 38 μl에서 용리한다.
플라스미드-Safe ATP-의존성 DNase 처리
1.
Figure pct00028
배양 프로그램: 37℃ 1시간 동안, 70℃에서 30분 동안, 4℃에서 유지.
2. 1X SPRI 세척하고(Agencourt Ampure XP 비드 50 μl), 1X TE 완충액 15 μl에서 용리한다.
Cas9 gRNA에 의한 시험관내 분해
1.
Figure pct00029
실온에서 10분간 배양한다.
Figure pct00030
소화 프로그램: 37℃에서 1시간 동안, 4℃에서 유지.
2. 1X SPRI 세척하고(Agencourt Ampure XP 비드 100 μl), 1X TE 완충액 42 μl에서 용리한다.
A-테일링
1.
Figure pct00031
A- 테일링 프로그램: 30℃에서 30분, 4℃에서 유지.
2. 1.8X SPRI 세척하고(PEG/NaCl SPRI 용액 90 μl), 30 μl의 1X TE 완충액에서 용리한다.
어댑터 결찰
1.
Figure pct00032
결찰 프로그램: 20℃에서 1시간 동안, 4℃에서 유지.
2. 1X SPRI 세척하고(PEG/NaCl SPRI 용액 50 μl), 1X TE 완충액 47 μl에서 용리한다.
USER 효소 처리
1. 비드를 갖는 어댑터 결찰된 DNA에 3 μl의 USER 효소(1 U/μl)를 첨가한다(단계 22로부터).
2. 0.7X SPRI 세척하고(PEG/NaCl SPRI 용액 35 μl), 20 μl의 1X TE 완충액에서 용리한다.
PCR
1.
Figure pct00033
PCR 프로그램: 98℃에서 45초, (98℃에서 15초 동안, 65℃에서 30초 동안, 72℃에서 30초 동안)의 22주기, 72℃에서 1분, 4℃에서 유지.
2. 0.7X SPRI 세척하고(Agencourt Ampure XP 비드 35 μl), 30 μl의 1X TE 완충액에서 용리한다.
라이브러리 정량화
1. 제조사의 지침에 따라, QX200 드롭렛 디지털(Droplet Digital) PCR 장비 상에서 Illumina TruSeq(Bio-Rad)용 ddPCR 라이브러리 정량화 키트를 사용하여 라이브러리를 정량화한다. 대안적인 정량화 방법은 차세대 시퀀싱을 위한 KAPA 라이브러리 정량화 키트(KAPA Library Quantification Kit for Next-Generation Sequencing, KAPA Biosystems)를 제조사의 지침에 따라 사용하는 것이다.
참고문헌
1. Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823(2013).
2. Hwang, W. Y. et al. Efficient genome editing in zebrafish using a CRISPR-Cas system. Nat Biotechnol 31, 227-229(2013).
3. Jinek, M. et al. RNA-programmed genome editing in human cells | eLife. Elife 2, e00471(2013).
4. Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826(2013).
5. Jinek, M. et al. A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity. Science 337, 816-821(2012).
6. Doudna, J. A. & Charpentier, E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science 346, 1258096(2014).
7. Bolukbasi, M. F., Gupta, A. & Wolfe, S. A. Creating and evaluating accurate CRISPR-Cas9 scalpels for genomic surgery. Nat Meth 13, 41-50(2016).
8. Mali, P., Esvelt, K. M. & Church, G. M. Cas9 as a versatile tool for engineering biology. Nat Meth 10, 957-963(2013).
9. Sander, J. D. & Joung, J. K. CRISPR-Cas systems for editing, regulating and targeting genomes. Nat Biotechnol 32, 347-355(2014).
10. Maeder, M. L. & Gersbach, C. A. Genome-editing Technologies for Gene and Cell Therapy. Mol Ther 24, 430-446(2016).
11. Lin, J. & Musunuru, K. Genome Engineering Tools for Building Cellular Models of Disease. FEBS J(2016). doi:10.1111/febs.13763
12. Hsu, P. D., Lander, E. S. & Zhang, F. Development and applications of CRISPR-Cas9 for genome engineering. Cell 157, 1262-1278(2014).
13. Brandsma, I. & Gent, D. C. Pathway choice in DNA double strand break repair: observations of a balancing act. Genome Integr 3, 9(2012).
14. Symington, L. S. & Gautier, J. Double-strand break end resection and repair pathway choice. Annu. Rev. Genet. 45, 247-271(2011).
15. Kass, E. M. & Jasin, M. Collaboration and competition between DNA double-strand break repair pathways. FEBS Letters 584, 3703-3708(2010).
16. Wyman, C. & Kanaar, R. DNA double-strand break repair: all's well that ends well. Annu. Rev. Genet. 40, 363-383(2006).
17. Rouet, P., Smih, F. & Jasin, M. Introduction of double-strand breaks into the genome of mouse cells by expression of a rare-cutting endonuclease. Mol Cell Biol 14, 8096-8106(1994).
18. Sternberg, S. H., LaFrance, B., Kaplan, M. & Doudna, J. A. Conformational control of DNA target cleavage by CRISPR-Cas9. Nature 527, 110-113(2015).
19. Kiani, S. et al. Cas9 gRNA engineering for genome editing, activation and repression. Nat Meth 1-6(2015). doi:10.1038/nmeth.3580
20. Dahlman, J. E. et al. Orthogonal gene knockout and activation with a catalytically active Cas9 nuclease. Nat Biotechnol 1-4(2015). doi:10.1038/nbt.3390
21. Fu, Y., Sander, J. D., Reyon, D., Cascio, V. M. & Joung, J. K. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs. Nat Biotechnol(2014). doi:10.1038/nbt.2808
22. Anders, C., Niewoehner, O., Duerst, A. & Jinek, M. Structural basis of PAM-dependent target DNA recognition by the Cas9 endonuclease. Nature(2014). doi:10.1038/nature13579
23. Shah, S. A., Erdmann, S., Mojica, F. J. M. & Garrett, R. A. Protospacer recognition motifs: mixed identities and functional diversity. RNA Biol 10, 891-899(2013).
24. Tsai, S. Q. & Joung, J. K. Defining and improving the genome- wide specificities of CRISPR-Cas9 nucleases. Nature 17, 300-312(2016).
25. Bolukbasi, M. F., Gupta, A. & Wolfe, S. A. Creating and evaluating accurate CRISPR-Cas9 scalpels for genomic surgery. Nat Meth 13, 41-50(2015).
26. Gori, J. L. et al. Delivery and Specificity of CRISPR-Cas9 Genome Editing Technologies for Human Gene Therapy. Hum Gene Ther 26, 443-451(2015).
27. Cox, D. B. T., Platt, R. J. & Zhang, F. Therapeutic genome editing: prospects and challenges. Nat Med 21, 121-131(2015).
28. Gabriel, R. et al. An unbiased genome-wide analysis of zinc-finger nuclease specificity. Nat Biotechnol 29, 816-823(2011).
29. Ran, F. A. et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191(2015).
30. Tsai, S. Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases. Nat Biotechnol 33, 187-197(2015).
31. Frock, R. L. et al. Genome-wide detection of DNA double-stranded breaks induced by engineered nucleases. Nat Biotechnol 33, 179-186(2015).
32. Crosetto, N. et al. Nucleotide-resolution DNA double-strand break mapping by next-generation sequencing. Nat Meth 10, 361-365(2013).
33. Pattanayak, V. et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity. Nat Biotechnol 31, 839-843(2013).
34. Kim, D. et al. Digenome-seq: genome-wide profiling of CRISPR-Cas9 off-target effects in human cells. Nat Meth(2015). doi:10.1038/nmeth.3284
35. Kim, D., Kim, S., Kim, S., Park, J. & Kim, J.-S. Genome-wide target specificities of CRISPR-Cas9 nucleases revealed by multiplex Digenome-seq. Genome Res gr.199588.115(2016). doi:10.1101/gr.199588.115
36. Yang, L. et al. Targeted and genome-wide sequencing reveal single nucleotide variations impacting specificity of Cas9 in human stem cells. Nature Communications 5, 5507(2014).
37. 1000 Genomes Project Consortium et al. A global reference for human genetic variation. Nature 526, 68-74(2015).
38. Sherry, S. T. et al. dbSNP: the NCBI database of genetic variation. Nucleic Acids Res 29, 308-311(2001).
39. ENCODE Project Consortium. An integrated encyclopedia of DNA elements in the human genome. Nature 489, 57-74(2012).
40. Li, H. & Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics 26, 589-595(2010).
41. Li, H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics 27, 2987-2993(2011).
42. Li, H. et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics 25, 2078-2079(2009).
다른 구현예들
본 발명은 그 상세한 설명과 관련하여 설명되었지만, 상기 설명은 예시하기 위한 것이지 첨부된 청구범위의 범주에 의해 정의되는 본 발명의 범주를 제한하는 것은 아니다. 다른 양태, 이점 및 변형은 하기 청구범위의 범주 내에 있다.
SEQUENCE LISTING <110> The General Hospital Corporation <120> Comprehensive In vitro Reporting of Cleavage Events by Sequencing (CIRCLE-seq) <130> 40978-0014WO1 <150> US 62/235,154 <151> 2015-09-30 <160> 136 <170> PatentIn version 3.5 <210> 1 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> stem loop adapter sequence <220> <221> misc_feature <222> (17)..(17) <223> can be U or ideoxyU <220> <221> misc_feature <222> (29)..(30) <223> g and t are linked with a phosphorothioate linkage <400> 1 cggtggaccg atgatcuatc ggtccaccgt 30 <210> 2 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> EMX1 target site <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 2 gagtccgagc agaagaagaa ngg 23 <210> 3 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> FANCF Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 3 ggaatccctt ctgcagcacc ngg 23 <210> 4 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> RNF2 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 4 gtcatcttag tcattacctg ngg 23 <210> 5 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Site_1 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 5 gggaaagacc cagcatccgt ngg 23 <210> 6 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Site_2 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 6 gaacacaaag catagactgc ngg 23 <210> 7 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Site_3 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 7 ggcccagact gagcacgtga ngg 23 <210> 8 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Site_4 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 8 ggcactgcgg ctggaggtgg ngg 23 <210> 9 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> VEGFA_site_1 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 9 gggtgggggg agtttgctcc ngg 23 <210> 10 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> VEGFA_site_2 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 10 gaccccctcc accccgcctc ngg 23 <210> 11 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> VEGFA_site_3 Target Site Sequence <220> <221> misc_feature <222> (21)..(21) <223> n is a, c, g, or t <400> 11 ggtgagtgag tgtgtgcgtg ngg 23 <210> 12 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 12 gagtccgagc agaagaagaa ggg 23 <210> 13 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 13 aaggccaagc agaagagtaa tgg 23 <210> 14 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 14 gagtcctagc aggagaagaa gag 23 <210> 15 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 15 gaggccgagc agaagaaaga cgg 23 <210> 16 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 16 gaatccaagc aggagaagaa gga 23 <210> 17 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 17 tcatccaagc agaagaagaa gag 23 <210> 18 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 18 gagtctaagc aggagaataa agg 23 <210> 19 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 19 aagtccgagg agaggaagaa agg 23 <210> 20 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 20 gaagtagagc agaagaagaa gcg 23 <210> 21 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 21 gagcctgagc agaaggagaa ggg 23 <210> 22 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 22 aagcccgagc aaaggaagaa agg 23 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 23 aagtccatgc agaagaggaa ggg 23 <210> 24 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 24 gagttagagc agaagaagaa agg 23 <210> 25 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 25 tcttccaagc agaggaagaa agg 23 <210> 26 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 26 gagtacaagc agatgaaaaa cgg 23 <210> 27 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 27 gaggccaagc agaaaaaaaa tgg 23 <210> 28 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 28 gaagtagagc agaagaagaa gcg 23 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 29 aagtccagac agaagaagaa gga 23 <210> 30 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 30 aaatccaacc agaagaagaa agg 23 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 31 gagtctaagc agaagaagaa gag 23 <210> 32 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 32 aagtccgggc aaaagaggaa agg 23 <210> 33 <211> 23 <212> DNA <213> Artificial Sequnece <220> <223> Off-target Sequence <400> 33 gaggccaagc agaaagaaaa agg 23 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 34 aggtcagagc agaagaaaag agg 23 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 35 gagtcccagc aaaagaagaa aag 23 <210> 36 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 36 cactccaagt agaagaagaa aag 23 <210> 37 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 37 atgtccaagc agaagaagtc tgg 23 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 38 aaggcagagc agaggaagag agg 23 <210> 39 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 39 aagtcccggc agaggaagaa ggg 23 <210> 40 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 40 ttctccaagc agaagaagaa gag 23 <210> 41 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 41 gaagtagagc agaagaagaa gcg 23 <210> 42 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 42 gagtccaagc agtagaggaa ggg 23 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 43 gagttagagc agaaaaaaaa tgg 23 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 44 gaatccaagc agaagaagag aag 23 <210> 45 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 45 agttccaagc agaggaagaa ggg 23 <210> 46 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 46 gagcacgagc aagagaagaa ggg 23 <210> 47 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 47 aagtcagaga gaagaagaag ag 22 <210> 48 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 48 cagtctgagt agaagaaaaa ggg 23 <210> 49 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 49 aagtctgagc acaagaagaa tgg 23 <210> 50 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 50 gagccggagc agaagaagga ggg 23 <210> 51 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 51 acgtctgagc agaagaagaa tgg 23 <210> 52 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 52 cgctccgagc agaagaaaag tgg 23 <210> 53 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 53 ccatccgagc aggagattaa tgg 23 <210> 54 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 54 gagcccaagc acaaaaagaa tgg 23 <210> 55 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 55 gagtaagaga agaagaagaa ggg 23 <210> 56 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 56 aagtcctagc agaaggaaag ggg 23 <210> 57 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 57 aagtccaggc aggagaaaaa tgg 23 <210> 58 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 58 aaggccgagc aggaggaaga agg 23 <210> 59 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 59 aagtctgaga agaagaagaa aga 23 <210> 60 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 60 tattccaagc aaaagaaaaa ggg 23 <210> 61 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 61 aagcccaagc agaagaaaaa tga 23 <210> 62 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 62 gagcccgtgc agaggaagaa gga 23 <210> 63 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 63 gagtccacac agaagaagaa aga 23 <210> 64 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 64 ctgtccaagc acaagaacaa tgg 23 <210> 65 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 65 gagtttgagt agaagaagaa gag 23 <210> 66 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 66 aggtctgagc agaagaaaga agg 23 <210> 67 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 67 atgtccaagc acaagaggaa tgg 23 <210> 68 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 68 gagcccaaga agaagaagaa gga 23 <210> 69 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 69 aagtctgagt aggagaaaaa ggg 23 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 70 aggtctgagc agaagaggaa gag 23 <210> 71 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 71 tgatccaagc aggagaaaaa tgg 23 <210> 72 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 72 cattcctagc agaggaagaa agg 23 <210> 73 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 73 taatccaatc agaagaagaa ggg 23 <210> 74 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 74 aaatccaacc agaagaagag ggg 23 <210> 75 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 75 caatcagagc agaggaagaa gag 23 <210> 76 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 76 gaagccaagc agaagaaaaa cag 23 <210> 77 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 77 gaggctgagc agaagaggaa gga 23 <210> 78 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 78 tgttccaagc agaagagtaa tgg 23 <210> 79 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 79 tagtctaagc agcagaagaa tgg 23 <210> 80 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 80 ccctccaagc agaagaagat gag 23 <210> 81 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 81 aggcccgagc aggagaaaat agg 23 <210> 82 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 82 agctccgagc agaggaagga ggg 23 <210> 83 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 83 gagtcagagc aaaagaagta gtg 23 <210> 84 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 84 gagtttaagc agaagaagag agg 23 <210> 85 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 85 tcttccaagc aaaagaagaa aga 23 <210> 86 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 86 gaggcccagc agaggaagaa gag 23 <210> 87 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 87 aagcccaagc aaatgaagaa tgg 23 <210> 88 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 88 tcttccgagc tgaagaagaa aag 23 <210> 89 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 89 gactccgagc agcagaagga tgg 23 <210> 90 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 90 gagaccaaac agaggaagaa ggg 23 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 91 gagtcctaga aaaagaagag agg 23 <210> 92 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 92 gaatcagagc aaaaggagaa agg 23 <210> 93 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 93 ttatccgaga agaagaagta agg 23 <210> 94 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 94 aattccaagc agaagaaaaa gga 23 <210> 95 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 95 agttccaagc agaagaagca tgg 23 <210> 96 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 96 aagtccaagc acaagaaaca tgg 23 <210> 97 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 97 gagtcccagg agaagaagag agg 23 <210> 98 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 98 agttcagagc aggagaagaa tgg 23 <210> 99 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 99 aagcccgagc agaagaagtt gag 23 <210> 100 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 100 gagttagagc agaggaagag agg 23 <210> 101 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 101 cagtccaaac agaagaggaa tgg 23 <210> 102 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 102 gagtccggga aggagaagaa agg 23 <210> 103 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 103 aaggcaaagc aaaagaagag ggg 23 <210> 104 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 104 gaggtagagc agaagaagaa gcg 23 <210> 105 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 105 aagtcccagc aacagaagaa agg 23 <210> 106 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 106 gactcctagc aaaagaagaa tgg 23 <210> 107 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 107 gaggccttgc agaagaagaa ggc 23 <210> 108 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 108 gaatcccagc aggagaggaa tgg 23 <210> 109 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 109 caatccgggc agaagaagga gag 23 <210> 110 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 110 aagtccaaaa agaagaaaaa agg 23 <210> 111 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 111 taggctgagc agaagaaaaa gga 23 <210> 112 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 112 aagtctgaga agaagaagac atg 23 <210> 113 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 113 tagtcctagc aaaagcagaa ggg 23 <210> 114 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 114 gaatccaaga gaagaagaat gg 22 <210> 115 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 115 gagtctaagc agaagaggac tgg 23 <210> 116 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 116 gagtcccagc aggagaagaa aga 23 <210> 117 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 117 aagttggagc aggagaagaa ggg 23 <210> 118 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 118 gaagtggagc aggagaagaa ggg 23 <210> 119 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 119 gagtccatac aggagaagaa aga 23 <210> 120 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 120 gagtcgagaa gaagaaaaaa gg 22 <210> 121 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 121 gaatcccagc aggagaagac agg 23 <210> 122 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 122 gagtaggagc aggagaagaa gga 23 <210> 123 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 123 gagtagagca gaggaggaag gg 22 <210> 124 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 124 ctctccaagc agaagaagaa gaa 23 <210> 125 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 125 gaggccgggc aggagaagga ggg 23 <210> 126 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 126 gcatccaagc aggaggagaa ggg 23 <210> 127 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 127 aagcccaagg agaagaagaa agg 23 <210> 128 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 128 aagtcaaagc aggagaagaa aga 23 <210> 129 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 129 gagagagagc aaaaaaagaa ggg 23 <210> 130 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 130 aagcccgggc agaagaagca cag 23 <210> 131 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 131 gtgtcagagc agaaaaagag tgg 23 <210> 132 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 132 cattccaagc agcagaagaa gag 23 <210> 133 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 133 aagtccaagc ataagaaaac agg 23 <210> 134 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 134 gagagagagc aggagaggaa agg 23 <210> 135 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 135 gagtcagagc agaagaaaga gga 23 <210> 136 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Off-target Sequence <400> 136 atctccaagc agaagaaaaa tgg 23

Claims (20)

  1. 공유결합으로 닫힌 원형 이중-가닥 DNA(dsDNA) 단편의 라이브러리를 제조하는 방법으로서, 상기 방법은:
    dsDNA를 포함하는 샘플을 제공하는 단계;
    상기 dsDNA를 소정의 평균 길이로 무작위 전단(shearing)하여 dsDNA 단편의 집단을 제공하는 단계;
    말단-결찰을 위한 단편을 선택적으로 제조하는 단계;
    회문식 서열을 포함하는 루프 서열에 인접한 또는 루프 서열내 적어도 하나의 단일 데옥시우리딘을 포함하는 스템-루프 어댑터를 상기 단편의 말단에 결찰시켜, 결찰된 선형 dsDNA 단편의 집단을 제조하는 단계;
    결찰된 선형 dsDNA 단편의 집단을 엑소뉴클레아제와 접촉시켜 결찰되지 않은 말단을 갖는 임의의 나머지 선형 단편을 분해하여, 결찰된 선형 dsDNA 단편의 정제된 집단을 생성하는 단계;
    결찰된 선형 dsDNA 단편의 상기 정제된 집단을 데옥시우리딘에서 상기 결찰된 dsDNA 단편을 닉킹하는 효소와 접촉시켜서, 3' 말단 포스페이트를 제거하는 단계;
    분자내 결찰 및 원형 DNA 분자의 형성을 촉진시키기에 충분한 조건하에 상기 닉킹된 선형 dsDNA 단편을 배양하는 단계; 및
    엑소뉴클레아제를 사용하여 상기 결찰된 원형 dsDNA 단편을 정제함으로써 공유결합으로 닫힌 완전히 원형인 dsDNA 단편의 라이브러리를 제조하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서,
    공유 결합으로 닫힌 완전히 원형인 dsDNA 단편의 라이브러리를 조작된 뉴클레아제와 접촉시켜 부위-특이적 절단을 유도하는 단계;
    선택적으로, 말단-결찰을 위한 절단된 단편을 제조하는 단계;
    적어도 하나의 단일 데옥시우리딘 및, PCR 프라이밍 또는, 절단 부위에서의 시퀀싱에 사용하기에 적합한 프라이머 부위를 포함하는 시퀀싱 어댑터를 결찰하는 단계;
    상기 라이브러리를 데옥시우리딘에서 닉킹하는 효소와 접촉시키는 단계; 및
    시퀀싱 어댑터에 결합하는 프라이머를 사용하여 상기 얻은 단편을 시퀀싱하는 단계를 추가로 포함하는, 방법.
  3. 이중-가닥 DNA(dsDNA) 분자내에 조작된 뉴클레아제-유도된 이중 가닥 절단(break) 부위를 포함하는 단편의 라이브러리를 제조하는 방법으로서, 상기 방법은:
    dsDNA를 제공하는 단계;
    dsDNA를 소정의 평균 길이로 무작위 전단하는 단계;
    상기 전단된 dsDNA를 임의로 말단-수선 및/또는 A-테일링하는 단계;
    바람직하게는 약 12개 뉴클레오타이드의 제1 영역;
    하나 이상의 루프를 형성하고 분자내 결찰을 위한 회문 서열에 인접한 단일 데옥시우리딘 뉴클레오타이드를 포함하는 바람직하게는 약 5개 뉴클레오타이드의 제2 영역; 및
    하나의 추가 뉴클레오타이드로 상기 제1 영역에 상보적인 제3 영역
    을 포함하는 스템-루프 어댑터를 결찰하는 단계;
    라이브러리를 데옥시우리딘에서 dsDNA를 닉킹하는 효소와 접촉시키고, 말단 3' 포스페이트를 제거하는 단계;
    원형 dsDNA 분자를 포함하는 샘플의 분자내 결찰 및 형성을 촉진시키기에 충분한 조건하에 상기 닉킹된 dsDNA를 배양하는 단계;
    상기 샘플을 원형이 아닌 임의의 DNA 분자를 분해하기에 충분한 하나 이상의 엑소뉴클레아제와 접촉시키는 단계;
    부위-특이적 절단을 유도하기 위해, 샘플을 조작된 뉴클레아제로 처리하는 단계;
    선택적으로 말단-수선하고, 그후 얻은 말단을 A-테일링하는 단계;
    약 12개 뉴클레오타이드의 제1 영역;
    하나 이상의 헤어핀 루프를 형성하고 PCR 프라이밍 및/또는 시퀀싱에 사용하기에 적합한 프라이머 부위를 포함하는 제2 영역;
    하나의 추가의 뉴클레오타이드와 함께 상기 제1 영역에 상보적인 약 13개 뉴클레오타이드의 제3 영역; 및
    제2 영역과 제3 영역 사이의 단일 데옥시우리딘 뉴클레오타이드
    를 포함하는 시퀀싱 어댑터를 결찰시켜, 뉴클레아제에 의해 절단된 DNA 단편이 말단에 결찰된 시퀀싱 어댑터를 갖는 집단을 생성시키는 단계;
    이에 의해 뉴클레아제-절단된 어댑터-결찰된 단편이 농축된 단편의 라이브러리를 제조하는 단계
    를 포함하는, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 dsDNA를 무작위 전단하는 단계는 dsDNA를 평균 길이 약 200 내지 500 bps, 바람직하게는 약 300 bps로 무작위 전단하는 단계를 포함하는, 방법.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서,
    결찰되지 않은 말단을 갖는 임의의 나머지 선형 단편을 분해하는데 사용되는 엑소뉴클레아제는 박테리오파지 람다 엑소뉴클레아제, E. coli 엑소뉴클레아제 I 및 ATP-의존성 엑소뉴클레아제 중 하나 이상을 포함하는 뉴클레아제의 칵테일인, 방법.
  6. 제1항 내지 제3항 중 어느 한 항에 있어서,
    말단-결찰을 위한 단편을 제조하는 단계는 상기 전단된 DNA를 말단-수선 및/또는 A-테일링(tailing) 중 하나 또는 둘다 하는 단계를 포함하는, 방법.
  7. 제1항 내지 제3항 중 어느 한 항에 있어서,
    데옥시우리딘에서 DNA를 닉킹(nicking)하는 효소는 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII 중 하나 또는 둘다를 포함하며, 3' 말단 포스페이트를 제거하는 효소는 T4 폴리뉴클레오타이드 키나아제를 포함하는, 방법.
  8. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 DNA가 게놈 DNA(gDNA) 또는 합성 DNA인, 방법.
  9. 제2항 또는 제3항에 있어서,
    상기 조작된 뉴클레아제가 온-타겟 및/또는 오프-타겟 부위에서 절단하는, 방법.
  10. 제2항 또는 제3항에 있어서,
    상기 조작된 뉴클레아제가 평활(blunt) 또는 점착(staggered)/돌출(overhanging) 말단을 유도하는, 방법.
  11. 제3항에 있어서,
    시퀀싱 어댑터내 데옥시우리딘에서 닉킹하는 효소와 상기 라이브러리를 접촉시키는 단계;
    어댑터-결찰된 단편을 강화하고, 완전 시퀀싱 어댑터를 첨가하도록 PCR 증폭을 선택적으로 사용하는 단계; 및
    시퀀싱 어댑터를 포함하는 상기 단편을 시퀀싱하는 단계
    를 추가로 포함하는, 방법.
  12. 제11항에 있어서,
    DNA를 닉킹하는 효소는 우라실 DNA 글리코실라제(UDG) 및/또는 엔도뉴클레아제 VIII를 포함하는, 방법.
  13. 제2항 또는 제3항에 있어서,
    상기 조작된 뉴클레아제는 메가뉴클레아제, MegaTAL, 징크-핑거 뉴클레아제, 전사 활성제 이펙터-유사 뉴클레아제(TALEN), 클러스터링된 규칙적 간격의 짧은 회문 반복서열(CRISPR)/Cas RNA-가이드된 뉴클레아제(CRISPR/Cas RGNs), 및 FokI-dCas9 융합 단백질로 구성된 그룹으로부터 선택되는, 방법.
  14. 제13항에 있어서,
    상기 CRISPR/Cas RGN은 Cas9 또는 Cpf1인, 방법.
  15. 제2항 또는 제3항에 있어서,
    상기 샘플을 상기 조작된 뉴클레아제로 처리하여 부위-특이적 절단을 유도하는 단계는 상기 샘플을 특정 가이드 RNA(gRNA)와 복합체화된 Cas9 뉴클레아제와 접촉시키는 단계를 포함하는, 방법.
  16. 제15항에 있어서,
    상기 조작된 뉴클레아제가 Cas9 뉴클레아제이며, 상기 방법은 또한, Cas9 뉴클레아제를 게놈 내의 타겟 서열로 유도하는 가이드 RNA를 이용하는 단계를 포함하는, 방법.
  17. 제2항 또는 제3항에 있어서,
    상기 프라이머 부위는 차세대 시퀀싱 프라이머 결합 서열, 무작위 DNA 바코드 또는 고유 분자 식별자(UMI)를 포함하는, 방법.
  18. 제1항에 있어서,
    상기 단편은 말단-결찰을 위해 제조되는, 방법.
  19. 제2항에 있어서,
    상기 절단된 단편은 말단-결찰을 위해 제조되는, 방법.
  20. 제3항에 있어서,
    상기 생성된 말단을 말단-수선한후, A-테일링하는 단계를 추가로 포함하는, 방법.
KR1020187011550A 2015-09-30 2016-09-30 시퀀싱(circle-seq)에 의한 절단 반응의 포괄적인 시험관내 보고 KR20180053748A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562235154P 2015-09-30 2015-09-30
US62/235,154 2015-09-30
PCT/US2016/054912 WO2017059313A1 (en) 2015-09-30 2016-09-30 Comprehensive in vitro reporting of cleavage events by sequencing (circle-seq)

Publications (1)

Publication Number Publication Date
KR20180053748A true KR20180053748A (ko) 2018-05-23

Family

ID=58408546

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187011550A KR20180053748A (ko) 2015-09-30 2016-09-30 시퀀싱(circle-seq)에 의한 절단 반응의 포괄적인 시험관내 보고

Country Status (7)

Country Link
US (2) US9850484B2 (ko)
EP (1) EP3356526B1 (ko)
JP (1) JP2018529353A (ko)
KR (1) KR20180053748A (ko)
AU (1) AU2016331185A1 (ko)
CA (1) CA3000762A1 (ko)
WO (1) WO2017059313A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180043369A (ko) 2015-09-11 2018-04-27 더 제너럴 하스피탈 코포레이션 뉴클레아제 dsb의 완전한 호출 및 시퀀싱(find-seq)
WO2018035062A1 (en) * 2016-08-16 2018-02-22 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (flash)
CN110785497A (zh) 2017-04-23 2020-02-11 伊鲁米纳剑桥有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
WO2018200386A1 (en) 2017-04-23 2018-11-01 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
DK3615671T3 (da) * 2017-04-23 2021-10-18 Illumina Cambridge Ltd Sammensætninger og fremgangsmåder til forbedring af prøveidentificering i indekserede nukleinsyrebiblioteker
DK3872187T3 (da) 2017-04-23 2022-12-05 Illumina Cambridge Ltd Sammensætninger og fremgangsmåder til forbedring af prøveidentificering i indekserede nukleinsyrebiblioteker
CN111356795B (zh) * 2017-05-23 2024-04-26 哈佛学院董事及会员团体 核酸的多重末端标记扩增
CN109136272A (zh) * 2017-06-15 2019-01-04 中山大学 用于特异性修复人hbb基因突变的碱基编辑***、方法、试剂盒及其在人生殖系中的应用
CN108823202A (zh) * 2017-06-15 2018-11-16 中山大学 用于特异性修复人hbb基因突变的碱基编辑***、方法、试剂盒及其应用
US11286468B2 (en) 2017-08-23 2022-03-29 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases with altered PAM specificity
EP3694993A4 (en) 2017-10-11 2021-10-13 The General Hospital Corporation METHOD OF DETECTING A SITE-SPECIFIC AND UNDESIRED GENOMIC DESAMINATION INDUCED BY BASE EDITING TECHNOLOGIES
AU2019256287A1 (en) 2018-04-17 2020-11-12 The General Hospital Corporation Sensitive in vitro assays for substrate preferences and sites of nucleic acid binding, modifying, and cleaving agents
WO2019217785A1 (en) 2018-05-10 2019-11-14 St. Jude Children's Research Hospital, Inc. High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro
CN108753923A (zh) * 2018-06-04 2018-11-06 广州微芯生物科技有限公司 一种构建甲基化测序文库的方法及相应的接头序列和试剂盒
CN108753922A (zh) * 2018-06-04 2018-11-06 广州微芯生物科技有限公司 一种构建转录组测序文库的方法及相应的接头序列和试剂盒
EP3884064A4 (en) * 2018-11-19 2022-08-10 The Regents of The University of California METHODS FOR DETECTING AND SEQUENCING A TARGET NUCLEIC ACID
EP3990659A4 (en) * 2019-06-25 2023-07-26 The Translational Genomics Research Institute DETECTION AND TREATMENT OF RESIDUAL DISEASE USING CIRCULATING TUMOR DNA ANALYSIS
WO2021007177A1 (en) * 2019-07-08 2021-01-14 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
EP3812472B1 (en) 2019-10-21 2022-11-23 Albert-Ludwigs-Universität Freiburg A truly unbiased in vitro assay to profile off-target activity of one or more target-specific programmable nucleases in cells (abnoba-seq)
CN111893170B (zh) * 2020-08-07 2022-08-19 珠海舒桐医疗科技有限公司 一种在全基因组范围内体外检测CRISPR-Cas脱靶效应的方法
CN111979226B (zh) * 2020-09-01 2022-11-08 广州鼓润医疗科技有限公司 一种可批量进行体外脱靶检测及sgRNA筛选的方法
EP4365303A1 (en) * 2022-11-02 2024-05-08 4basebio, S.L.U. Purification of linear dna products
WO2024094793A1 (en) * 2022-11-02 2024-05-10 4Basebio, S.L.U. Purification of linear dna products

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE226983T1 (de) 1994-08-19 2002-11-15 Pe Corp Ny Gekoppeltes ampflikation- und ligationverfahren
EP0781331B1 (en) 1994-08-20 2008-09-03 Gendaq Limited Improvements in or relating to binding proteins for recognition of dna
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
AU7537200A (en) 1999-09-29 2001-04-30 Solexa Ltd. Polynucleotide sequencing
AU776576B2 (en) 1999-12-06 2004-09-16 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
WO2001083819A2 (en) 2000-04-28 2001-11-08 Sangamo Biosciences, Inc. Methods for designing exogenous regulatory molecules
CN100462433C (zh) 2000-07-07 2009-02-18 维西根生物技术公司 实时序列测定
WO2004099366A2 (en) 2002-10-23 2004-11-18 The General Hospital Corporation Context sensitive parallel optimization of zinc finger dna binding domains
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
WO2005090607A1 (en) 2004-03-08 2005-09-29 Rubicon Genomics, Inc. Methods and compositions for generating and amplifying dna libraries for sensitive detection and analysis of dna methylation
CA2579150C (en) 2004-09-17 2014-11-25 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
US7601499B2 (en) 2005-06-06 2009-10-13 454 Life Sciences Corporation Paired end sequencing
EP1924704B1 (en) 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
EP3284833B1 (en) 2005-08-26 2021-12-01 DuPont Nutrition Biosciences ApS Use of crispr associated genes (cas)
BRPI0618473A2 (pt) 2005-11-11 2011-08-30 Pfizer combinações e métodos de uso de um oligodeoxinucleotìdeo imunomodulador
US7282337B1 (en) 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
DK2860267T3 (en) 2007-03-02 2019-04-23 Dupont Nutrition Biosci Aps CULTURES WITH IMPROVED PROFESS RESISTANCE
WO2009027978A1 (en) 2007-08-30 2009-03-05 Hadasit Medical Research Services & Development Ltd. NUCLEIC ACID SEQUENCES COMPRISING NF-&kappav;B BINDING SITE WITHIN O(6)-METHYLGUANINE-DNA-METHYLTRANSFERASE (MGMT) PROMOTER REGION AND USES THEREOF FOR THE TREATMENT OF CANCER AND IMMUNE-RELATED DISORDERS
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
WO2010011961A2 (en) 2008-07-25 2010-01-28 University Of Georgia Research Foundation, Inc. Prokaryotic rnai-like system and methods of use
CA2734762C (en) 2008-08-19 2015-07-14 Telefonaktiebolaget L M Ericsson (Publ) Harq process continuation after cqi-only report
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
ES2499032T3 (es) 2008-12-12 2014-09-26 Dupont Nutrition Biosciences Aps Grupo genético de cepas de Streptococcus thermophilus que tiene propiedades reológicas únicas para fermentación láctica
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
JP5387839B2 (ja) 2009-09-04 2014-01-15 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置、ナビゲーション方法、及びナビゲーションプログラム
US9023769B2 (en) * 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
US9493827B2 (en) 2010-01-14 2016-11-15 Deutsches Krebsforschungszentrum Determination of in vivo DNA double-strand break localization and application thereof
CA2788850C (en) 2010-02-09 2019-06-25 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
US10087431B2 (en) 2010-03-10 2018-10-02 The Regents Of The University Of California Methods of generating nucleic acid fragments
AU2011249913B2 (en) 2010-05-06 2014-09-11 Ibis Biosciences, Inc. Integrated sample preparation systems and stabilized enzyme mixtures
ES2590343T3 (es) 2010-05-10 2016-11-21 The Regents Of The University Of California Composiciones de endorribonucleasas y métodos de uso de las mismas
WO2012065143A1 (en) 2010-11-12 2012-05-18 The General Hospital Corporation Polycomb-associated non-coding rnas
WO2012164565A1 (en) 2011-06-01 2012-12-06 Yeda Research And Development Co. Ltd. Compositions and methods for downregulating prokaryotic genes
WO2013078470A2 (en) 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
CA2873176C (en) 2012-05-10 2024-02-27 The General Hospital Corporation Methods for determining a nucleotide sequence
EP4289948A3 (en) 2012-05-25 2024-04-17 The Regents of the University of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
US20140024542A1 (en) 2012-07-17 2014-01-23 Counsyl, Inc. Methods and compositions for enrichment of target polynucleotides
US10155941B2 (en) 2012-08-01 2018-12-18 Bernhard Suter High throughput yeast two-hybrid screening method and reagent kit
EP2880182B1 (en) 2012-08-02 2017-07-26 Qiagen GmbH Recombinase mediated targeted dna enrichment for next generation sequencing
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
ES2786193T3 (es) 2012-12-12 2020-10-09 Broad Inst Inc Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20140179770A1 (en) 2012-12-12 2014-06-26 Massachusetts Institute Of Technology Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
PL2784162T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Opracowanie systemów, metod oraz zoptymalizowanych kompozycji przewodnikowych do manipulacji sekwencyjnej
PL2921557T3 (pl) 2012-12-12 2017-03-31 Broad Inst Inc Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
US9493844B2 (en) 2012-12-13 2016-11-15 Dow Agrosciences Llc DNA detection methods for site specific nuclease activity
NZ629569A (en) 2013-01-14 2018-07-27 Recombinetics Inc Hornless livestock
US20140212869A1 (en) 2013-01-25 2014-07-31 Agilent Technologies, Inc. Nucleic Acid Proximity Assay Involving the Formation of a Three-way junction
WO2014130955A1 (en) 2013-02-25 2014-08-28 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
EP3620534B1 (en) 2013-03-14 2021-10-13 Caribou Biosciences, Inc. Crispr-cas compositions of nucleic acid-targeting nucleic acids
US20140349400A1 (en) 2013-03-15 2014-11-27 Massachusetts Institute Of Technology Programmable Modification of DNA
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
WO2014204578A1 (en) 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
KR20230157540A (ko) * 2013-03-15 2023-11-16 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
WO2014165612A2 (en) 2013-04-05 2014-10-09 Dow Agrosciences Llc Methods and compositions for integration of an exogenous sequence within the genome of plants
HUE040575T2 (hu) 2013-04-16 2019-03-28 Regeneron Pharma A patkány genom célzott módosítása
WO2014182700A1 (en) 2013-05-10 2014-11-13 Sangamo Biosciences, Inc. Delivery methods and compositions for nuclease-mediated genome engineering
EP3022304B1 (en) 2013-07-19 2018-12-26 Larix Biosciences LLC Methods and compositions for producing double allele knock outs
ES2888976T3 (es) 2014-06-23 2022-01-10 Massachusetts Gen Hospital Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.)
EP3265559B1 (en) 2015-03-03 2021-01-06 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
AU2016316845B2 (en) 2015-08-28 2022-03-10 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases

Also Published As

Publication number Publication date
EP3356526A4 (en) 2019-03-20
AU2016331185A1 (en) 2018-04-26
US9850484B2 (en) 2017-12-26
CA3000762A1 (en) 2017-04-06
US10738303B2 (en) 2020-08-11
WO2017059313A1 (en) 2017-04-06
EP3356526A1 (en) 2018-08-08
US20170088833A1 (en) 2017-03-30
EP3356526B1 (en) 2021-08-25
US20180245071A1 (en) 2018-08-30
JP2018529353A (ja) 2018-10-11

Similar Documents

Publication Publication Date Title
US10738303B2 (en) Comprehensive in vitro reporting of cleavage events by sequencing (CIRCLE-seq)
AU2021212165B2 (en) Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
US11028429B2 (en) Full interrogation of nuclease DSBs and sequencing (FIND-seq)
EP3812472B1 (en) A truly unbiased in vitro assay to profile off-target activity of one or more target-specific programmable nucleases in cells (abnoba-seq)