CN117487776A - Casz组合物和使用方法 - Google Patents

Casz组合物和使用方法 Download PDF

Info

Publication number
CN117487776A
CN117487776A CN202310721532.3A CN202310721532A CN117487776A CN 117487776 A CN117487776 A CN 117487776A CN 202310721532 A CN202310721532 A CN 202310721532A CN 117487776 A CN117487776 A CN 117487776A
Authority
CN
China
Prior art keywords
casz
protein
cases
sequence
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310721532.3A
Other languages
English (en)
Inventor
J·A·都纳
D·博尔斯泰因
J·S·陈
L·B·哈灵顿
D·帕埃斯-艾斯皮诺
J·F·班菲尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of CN117487776A publication Critical patent/CN117487776A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

提供包括以下一项或多项的组合物和方法:(1)“CasZ”蛋白(也称为CasZ多肽)、编码所述CasZ蛋白的核酸和/或包含所述CasZ蛋白(和/或编码所述CasZ蛋白的核酸)的修饰的宿主细胞;(2)与所述CasZ蛋白结合并提供针对所述CasZ蛋白的序列特异性的CasZ指导RNA、编码所述CasZ指导RNA的核酸和/或包含所述CasZ指导RNA(和/或编码所述CasZ指导RNA的核酸)的修饰的宿主细胞;以及(3)CasZ反式激活非编码RNA(trancRNA)(在本文中称为“CasZ trancRNA”)、编码所述CasZ trancRNA的核酸和/或包含所述CasZ trancRNA(和/或编码所述CasZ trancRNA的核酸)的修饰的宿主细胞。

Description

CASZ组合物和使用方法
本申请是申请日为2018年10月31日、发明名称为“CASZ组合物和使用方法”的中国发明专利申请No.201880084919.X的分案申请。
交叉引用
本申请要求2017年11月1日提交的美国临时专利申请号62/580,395的权益,所述申请以引用方式整体并入本文。
以引用方式并入以文本文件提供的序列表
特此提供呈文本文件“BERK-374WO_SEQ_LISTING_ST25.txt”的序列表,所述序列表于2018年10月30日创建并且大小为536KB。文本文件的内容以引用方式整体并入本文。
引言
CRISPR-Cas***是DNA测序时代之前科学界未知的路径的一个实例,现已被认为赋予细菌和古细菌对噬菌体和病毒的获得性免疫力。深入研究已揭示了此***的生物化学性。CRISPR-Cas***由Cas蛋白和CRISPR阵列组成,所述Cas蛋白参与外源DNA或RNA的获取、靶向和切割,所述CRISPR阵列包括将Cas蛋白引导至其靶标的侧接短间隔序列的正向重复序列。2类CRISPR-Cas是精简型式,其中与RNA结合的单个Cas蛋白负责结合和切割靶向序列。这些最小***的可编程性质有利于它们用作一种多功能技术,这种技术正在彻底变革基因组操纵领域。
发明内容
本公开提供包括以下一项或多项的组合物和方法:(1)“CasZ”蛋白(也称为CasZ多肽)、编码CasZ蛋白的核酸和/或包含CasZ蛋白(和/或编码所述CasZ蛋白的核酸)的修饰的宿主细胞;(2)与CasZ蛋白结合并提供针对CasZ蛋白的序列特异性的CasZ指导RNA、编码CasZ指导RNA的核酸和/或包含CasZ指导RNA(和/或编码所述CasZ指导RNA的核酸)的修饰的宿主细胞;以及(3)CasZ反式激活非编码RNA(trancRNA)(在本文中称为“CasZ trancRNA”)、编码CasZ trancRNA的核酸和/或包含CasZ trancRNA(和/或编码所述CasZ trancRNA的核酸)的修饰的宿主细胞。
附图说明
图1描绘天然存在的CasZ蛋白序列的实例。
图2描绘CasZ基因座的示意图,所述CasZ基因座除CasZ蛋白之外还包括Cas1蛋白。
图3描绘与其他2类CRISPR/Cas效应蛋白序列有关的CasZ序列的***发育树。
图4描绘与来自其他2类CRISPR/Cas基因座的Cas1序列有关的来自CasZ基因座的Cas1序列的***发育树。
图5描绘转录组学RNA作图数据,该数据证明了来自CasZ基因座的trancRNA的表达。trancRNA与CasZ重复序列阵列相邻,但不包含重复序列且不与重复序列互补。显示的是以下基因座的RNA作图数据:CasZa3、CasZb4、CasZc5、CasZd1和CasZe3。小重复对齐箭头表示CRISPR阵列的重复序列(指示存在编码指导RNA的序列);重复阵列外部和附近的峰表示高度转录的trancRNA。图5(续1)核苷酸序列(从上到下:SEQ ID NO.:312-331)。图5(续3)核苷酸序列(从上到下:SEQ ID No.:161-177)。
图6描绘如使用PAM消耗测定对CasZc(顶部)和CasZb(底部)进行测定的PAM偏好结果。
图7描绘本文所述的Cas14蛋白的序列。
图8,图A-图D描绘CRISPR-Cas14基因组基因座的架构和***发育。
图9描绘Cas14直系同源物的***发育分析。
图10描绘来自已知CRISPR***的Cas1的最大似然树。
图11,图A-图B描绘CRISPR-Cas14***的新间隔序列的获取。
图12,图A-图D描绘CRISPR-Cas14a主动适应并编码tracrRNA。
图13,图A-图B描绘CRISPR-Cas14基因座的宏转录组学。
图14,图A-图B描绘CRISPR-Cas14的RNA加工和异源表达。
图15,图A-图D描绘Cas14a1和SpCas9的质粒消耗。
图16,图A-图D描绘CRISPR-Cas14a是RNA指导的DNA内切核酸酶。
图17,图A-图E描绘Cas14a1对ssDNA的降解。
图18描绘在各种指导RNA组分下Cas14a1切割ssDNA的动力学。
图19,图A-图F描绘Cas14a1指导RNA组分的优化。
图20,图A-E描绘通过CRISPR-Cas14a进行的高保真ssDNA DNP检测。图20,图C提供核苷酸序列(从上到下:SEQ ID NO:367-370)。
图21,图A-图F描绘各种激活剂对Cas14a1切割速率的影响。
图22,图A-图B描绘CRISPR-Cas14***的多样性。
图23,图A-图C描绘异源宿主中Cas14a1介导的干扰的测试。Cas14a1和LbCas12a构建体的图,用于测试大肠杆菌中的干扰。
图24描绘本发明中使用的质粒的Cas14核苷酸序列。
图25,图A-图E描绘图24中公开的每个质粒的序列图谱。
定义
如本文所用,“异源的”意指分别不存在于天然核酸或蛋白质中的核苷酸或多肽序列。例如,相对于CasZ多肽,异源多肽包含来自除CasZ多肽之外的蛋白质的氨基酸序列。在一些情况下,将来自一个物种的CasZ蛋白的一部分与来自不同物种的CasZ蛋白的一部分融合。因此,可认为来自每个物种的CasZ序列相对于彼此是异源的。作为另一个实例,CasZ蛋白(例如,dCasZ蛋白)可与来自非CasZ蛋白(例如,组蛋白脱乙酰酶)的活性结构域融合,并且所述活性结构域的序列可被认为是异源多肽(它对CasZ蛋白是异源的)。
在本文中可互换使用的术语“多核苷酸”和“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核苷酸)的聚合形式。因此,此术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体或包含嘌呤碱基和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。术语“多核苷酸”和“核酸”应理解为包括如可适用于所描述的实施方案的单链(诸如有义链或反义链)和双链多核苷酸。
在本文中可互换使用的术语“多肽”、“肽”和“蛋白质”是指具有任何长度的氨基酸的聚合形式,其可包括遗传编码和非遗传编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸以及具有修饰的肽骨架的多肽。所述术语包括:融合蛋白,其包括但不限于具有异源氨基酸序列的融合蛋白;具有异源和同源前导序列、具有或不具有N末端甲硫氨酸残基的融合体;免疫标记蛋白;等。
如本文所用,适用于核酸、蛋白质、细胞或生物体的术语“天然存在的”是指存在于自然界中的核酸、细胞、蛋白质或生物体。
如本文所用,术语“分离的”意在描述处于与多核苷酸、多肽或细胞天然存在的环境不同的环境中的多核苷酸、多肽或细胞。分离的遗传修饰的宿主细胞可存在于遗传修饰的宿主细胞的混合群体中。
如本文所用,术语“外源核酸”是指在自然界中不是正常或天然存在的核酸和/或不是由给定细菌、生物体或细胞产生的核酸。如本文所用,术语“内源核酸”是指在自然界中正常存在的核酸和/或由给定细菌、生物体或细胞产生的核酸。“内源核酸”也称为“天然核酸”或对于给定细菌、生物体或细胞“天然”的核酸。
如本文所用,“重组”意指特定核酸(DNA或RNA)是克隆、限制和/或连接步骤的各种组合的产物,所述步骤产生具有可与天然***中存在的内源核酸区别开的结构编码序列或非编码序列的构建体。一般来讲,编码结构编码序列的DNA序列可由cDNA片段和短寡核苷酸接头或由一系列合成寡核苷酸组装,以提供能够由包含在细胞中或无细胞转录和翻译***中的重组转录单元表达的合成核酸。此类序列可以不被内部非翻译序列或内含子中断的开放阅读框形式提供,所述内部非翻译序列或内含子通常存在于真核基因中。包含相关序列的基因组DNA还可用于形成重组基因或转录单元。非翻译DNA的序列可存在于开放读码框的5'端或3'端,其中此类序列不干扰编码区的操纵或表达,并且实际上可通过各种机制起到调节所需产物的产生的作用(参见下文的“DNA调控序列”)。
因此,例如术语“重组”多核苷酸或“重组”核酸是指非天然存在的多核苷酸或核酸,例如通过人干预由序列的两个另外分开的区段的人工组合制成的多核苷酸或核酸。这种人工组合常常通过化学合成手段或通过人工操纵核酸的分离区段(例如,通过遗传工程化技术)来完成。通常进行这种操作以用编码相同或保守氨基酸的冗余密码子替换密码子,同时通常引入或移除序列识别位点。可替代地,执行这种操作以将具有所需功能的核酸区段连接在一起以产生所需的功能组合。这种人工组合常常通过化学合成手段或通过人工操纵核酸的分离区段(例如,通过遗传工程化技术)来完成。
类似地,术语“重组”多肽是指非天然存在的多肽,例如通过人干预由氨基酸序列的两个另外分开的区段的人工组合制成的多肽。因此,例如,包含异源氨基酸序列的多肽是重组的。
“构建体”或“载体”意指重组核酸,一般是重组DNA,其是出于表达和/或增殖一个或多个特定核苷酸序列的目的而生成的,或者用于构建其他重组核苷酸序列。
在本文中可互换使用的术语“DNA调控序列”、“控制元件”和“调控元件”是指转录和翻译控制序列,诸如启动子、增强子、聚腺苷酸化信号、终止子、蛋白质降解信号等,所述转录和翻译控制序列在宿主细胞中提供和/或调控编码序列的表达和/或编码的多肽的产生。
术语“转化”与“遗传修饰”在本文中可互换使用,并且是指在向细胞中引入新核酸(即,对于所述细胞外源的DNA)之后,在所述细胞中诱导的永久或瞬时的遗传变化。遗传变化(“修饰”)可通过向宿主细胞的基因组中引入新核酸或者通过作为游离基因元件的新核酸的瞬时的或稳定的维持来完成。当细胞为真核细胞时,永久的遗传变化一般通过向所述细胞的基因组中引入新DNA来完成。在原核细胞中,可将永久的变化引入染色体中或经由染色体外元件(诸如质粒和表达载体)引入染色体中,所述染色体外元件可含有一种或多种可选择标记物以帮助它们在重组宿主细胞中的维持。遗传修饰的合适方法包括病毒感染、转染、缀合、原生质体融合、电穿孔、粒子枪技术、磷酸钙沉淀、直接微注射等。方法的选择一般取决于被转化的细胞类型和发生转化所在的环境(即体外、离体或体内)。这些方法的一般讨论可见于Ausubel等人,Short Protocols in Molecular Biology,第3版,Wiley&Sons,1995中。
“可操作地连接”是指其中所述组分处于允许它们以其预期的方式起作用的关系的并置。例如,如果启动子影响编码序列的转录或表达,则启动子可操作地连接至所述编码序列。如本文所用,术语“异源启动子”和“异源控制区”是指通常与自然界中的特定核酸不相关的启动子和其他控制区。例如,“对编码区异源的转录控制区”是通常与自然界中的编码区不相关的转录控制区。
如本文所用,“宿主细胞”指代体内或体外真核细胞、原核细胞或作为单细胞实体培养的来自多细胞生物体的细胞(例如,细胞系),所述真核细胞或原核细胞可用作或已用作核酸(例如,表达载体)的受体,并且包括已通过核酸遗传修饰的原始细胞的子代。应理解由于天然、偶然或有意突变,单细胞的子代可不必在形态或在基因组或总DNA互补序列方面与原始亲本完全相同。“重组宿主细胞”(也称为“遗传修饰的宿主细胞”)是已向其中引入异源核酸(例如,表达载体)的宿主细胞。例如,主题原核宿主细胞是通过将异源核酸引入合适的原核宿主细胞中的遗传修饰的原核宿主细胞(例如,细菌),所述异源核酸是例如对原核宿主细胞外源(通常在自然界中不存在)的外源核酸或通常在原核宿主细胞中不存在的重组核酸;并且主题真核宿主细胞是通过将异源核酸引入合适的真核宿主细胞中的遗传修饰的真核宿主细胞,所述异源核酸是例如对真核宿主细胞外源的外源核酸或通常在真核宿主细胞中不存在的重组核酸。
术语“保守氨基酸取代”是指蛋白质中具有相似侧链的氨基酸残基的可互换性。例如,具有脂肪族侧链的一组氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;具有脂肪族-羟基侧链的一组氨基酸由丝氨酸和苏氨酸组成;具有含酰胺侧链的一组氨基酸由天冬酰胺和谷氨酰胺组成;具有芳香族侧链的一组氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;具有碱性侧链的一组氨基酸由赖氨酸、精氨酸和组氨酸组成;并且具有含硫侧链的一组氨基酸由半胱氨酸和甲硫氨酸组成。示例性保守氨基酸取代基团是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。
多核苷酸或多肽与另一种多核苷酸或多肽具有一定的“序列同一性”百分比,这意味着当比对时碱基或氨基酸的百分数为相同的,并且当比较两个序列时所述碱基或氨基酸处于相同的相对位置上。可以许多不同方式确定序列相似性。为了确定序列同一性,可使用包括可通过万维网ncbi.nlm.nih.gov/BLAST获得的BLAST在内的方法和计算机程序来比对序列。参见例如Altschul等人(1990),J.Mol.Biol.215:403-10.另一种比对算法是FASTA,可从Madison,Wisconsin,USA的一家Oxford Molecular Group,Inc.的全资子公司的遗传计算组(GCG)程序包中获得。用于比对的其他技术描述于Methods in Enzymology,第266卷:Computer Methods for Macromolecular Sequence Analysis(1996),Doolittle编,Academic Press,Inc.,a division of Harcourt Brace&Co.的一个部门,San Diego,California,USA。特别感兴趣的是允许序列中存在空位的比对程序。Smith-Waterman是允许序列比对中存在空位的一种算法类型。参见Meth.Mol.Biol.70:173-187(1997)。另外,使用Needleman和Wunsch比对方法的GAP程序可用于比对序列。参见J.Mol.Biol.48:443-453(1970)。
如本文所用,术语“治疗(treatment)、治疗(treating)”等是指获得所需的药理学和/或生理学效果。就完全或部分预防疾病或其症状而言,所述效果可以是预防性的,并且/或者就部分或完全治愈疾病和/或可归因于所述疾病的副作用而言,所述效果可以是治疗性的。如本文所用,“治疗”涵盖对哺乳动物(例如,人)的疾病的任何治疗,并且包括:(a)在可能易患疾病但还未诊断患有所述疾病的受试者中预防疾病发生;(b)抑制疾病,即阻止其发展;以及(c)缓解疾病,即引起疾病消退。
在本文中可互换使用的术语“个体”、“受试者”、“宿主”和“患者”是指个体生物体,例如哺乳动物,包括但不限于鼠类、猿、非人灵长类动物、人、哺乳类农场动物、哺乳类运动动物和哺乳动物宠物。
在进一步描述本发明之前,应理解本发明不限于所述的具体实施方案,因此,当然也可有所变化。还应理解,本文所用的术语仅出于描述具体实施方案的目的,并且不意图具有限制性,因为本发明的范围将仅受所附权利要求限制。
在提供值的范围的情况下,应理解此范围的上限与下限之间的各介入值(除非上下文另外清楚地指出,否则准确到下限的单位的十分之一),以及此所述范围内的任何其他所述值或介入值涵盖在本发明内。这些较小范围的上限和下限可独立地包括在较小的范围内,并且也涵盖在本发明内,从属于所述范围内的任何特定排除的限值。在所述范围包括所述限值中的一个或两个的情况下,排除那些所包括的限值中的任一个或两个的范围也包括在本发明内。
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域中的普通技术人员通常所理解相同的含义。虽然与本文所述的那些相似或等同的任何方法和材料也可用于实践或测试本发明中,但是现在描述优选的方法和材料。本文提及的所有出版物以引用方式并入本文,以结合所引用的出版物公开并描述方法和/或材料。
必须指出,如在本文和所附权利要求中所用,单数形式“一个(a)/一种(an)”和“所述(the)”包括复数指示物,除非上下文另外清楚地指出。因此,例如,提及“CasZ多肽”包括多个此类多肽,并且提及“指导RNA”包括提及本领域的技术人员已知的一种或多种指导RNA及其等效物,等。还应注意,权利要求可拟订成排除任何任选的要素。因而,这种陈述意图充当结合权利要求要素的叙述来使用诸如“仅仅”、“仅”等排他性术语或使用“否定”限制的前提基础。
应理解,出于清晰目的而在单独的实施方案的上下文中描述的本发明的某些特征也可在单个实施方案中组合提供。相反,为了简明而在单个实施方案的上下文中描述的本发明的各种特征也可分开地或以任一合适的子组合来提供。属于本发明的实施方案的所有组合确切地涵盖在本发明中并且在本文中公开如同每个和每一种组合均单独地且明确地公开一样。另外,各种实施方案及其要素的所有子组合也确切地涵盖在本发明中并且在本文中公开如同每个和每一种此类子组合均单独地且明确地在本文中公开一样。
本文中讨论的出版物仅仅提供它们在本申请的提交日期之前的公开内容。本文中的任何内容均不应解释为承认本发明无权借助在先发明而先于此类出版物。此外,所提供的出版日可能不同于可能需要独立确认的实际出版日期。
具体实施方式
本公开提供包括以下一项或多项的组合物和方法:(1)“CasZ”蛋白(也称为CasZ多肽)、编码CasZ蛋白的核酸和/或包含CasZ蛋白(和/或编码所述CasZ蛋白的核酸)的修饰的宿主细胞;(2)与CasZ蛋白结合并提供针对CasZ蛋白的序列特异性的CasZ指导RNA、编码CasZ指导RNA的核酸和/或包含CasZ指导RNA(和/或编码所述CasZ指导RNA的核酸)的修饰的宿主细胞;以及(3)CasZ反式激活非编码RNA(trancRNA)(在本文中称为“CasZ trancRNA”)、编码CasZ trancRNA的核酸和/或包含CasZ trancRNA(和/或编码所述CasZ trancRNA的核酸)的修饰的宿主细胞。
组合物
CRISPR/CASZ蛋白、指导RNA和TRANCRNA
2类CRISPR-Cas***的特征在于包括单个多结构域蛋白的效应模块。在CasZ***中,CRISPR/Cas内切核酸酶(例如,CasZ蛋白)与对应的指导RNA(例如,CasZ指导RNA)相互作用(结合)以形成核糖核蛋白(RNP)复合物,所述复合物通过指导RNA与靶核酸分子内的靶序列之间的碱基配对被靶向至靶核酸中的特定位点。指导RNA包括与靶核酸的序列(靶位点)互补的核苷酸序列(指导序列)。因此,CasZ蛋白与CasZ指导RNA形成复合物,并且指导RNA通过指导序列为RNP复合物提供序列特异性。复合物的CasZ蛋白提供位点特异性活性。换句话讲,CasZ蛋白由于其与指导RNA的缔合而被导向至靶核酸(例如靶染色体核酸内的靶核苷酸序列;或靶染色体外核酸内的靶核苷酸序列,例如游离型核酸、微环核酸、线粒体核酸、叶绿体核酸等)内的靶位点(例如,稳定在靶位点)。
本公开提供包含CasZ多肽(和/或编码CasZ多肽的核酸)的组合物(例如,其中CasZ多肽可以是天然存在的CasZ蛋白、切口酶CasZ蛋白、dCasZ蛋白、嵌合CasZ蛋白等)(CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白)。本公开提供包含CasZ指导RNA(和/或编码CasZ指导RNA的核酸)的组合物。例如,本公开提供包含(a)CasZ多肽(和/或编码CasZ多肽的核酸)和(b)CasZ指导RNA(和/或编码CasZ指导RNA的核酸)的组合物。本公开提供一种核酸/蛋白质复合物(RNP复合物),所述核酸/蛋白质复合物包含:(a)CasZ多肽;和(b)CasZ指导RNA。本公开提供包含CasZ trancRNA的组合物。本公开提供包含CasZ trancRNA和以下一项或多项的组合物:(a)CasZ蛋白和(b)CasZ指导RNA(例如,包含CasZ trancRNA和CasZ蛋白,CasZ trancRNA和CasZ指导RNA,或CasZ trancRNA和CasZ蛋白和CasZ指导RNA。本公开提供一种核酸/蛋白质复合物(RNP复合物),所述核酸/蛋白质复合物包含:(a)CasZ多肽;(b)CasZ指导RNA;和(c)CasZ trancRNA。本公开提供包含CasZ蛋白和以下一项或多项的组合物:(a)CasZ trancRNA和(b)CasZ指导RNA。
CasZ蛋白
CasZ多肽(此术语与术语“CasZ蛋白”、“Cas14”、“Cas14多肽”或“Cas14蛋白”可互换使用)可结合和/或修饰(例如,切割、切口、甲基化、脱甲基化等)靶核酸和/或与靶核酸相关联的多肽(例如,组蛋白尾的甲基化或乙酰化)(例如,在一些情况下,CasZ蛋白包括具有活性的融合配偶体,并且在一些情况下,CasZ蛋白提供核酸酶活性)。在一些情况下,CasZ蛋白是天然存在的蛋白质(例如,天然存在于原核细胞中)。在其他情况下,CasZ蛋白不是天然存在的多肽(例如,CasZ蛋白是变体CasZ蛋白、嵌合蛋白等)。CasZ蛋白包括3个部分RuvC结构域(RuvC-I、RuvC-II和RuvC-III,在本文中也称为亚结构域),它们相对于CasZ蛋白的一级氨基酸序列是不连续的,但一旦蛋白质产生并折叠,就形成RuvC结构域。天然存在的CasZ蛋白起内切核酸酶的作用,其在所靶向核酸(例如,双链dsDNA)中的特定序列处催化切割。序列特异性由相关联的指导RNA提供,所述指导RNA与靶DNA内的靶序列杂交。天然存在的CasZ指导RNA是crRNA,其中crRNA包括(i)与靶DNA中的靶序列杂交的指导序列和(ii)与CasZ蛋白结合的蛋白结合区段。
在一些实施方案中,主题方法和/或组合物的CasZ蛋白是(或衍生自)天然存在的(野生型)蛋白。天然存在的CasZ蛋白的实例(例如,CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZk、CasZl)描绘于图1中。在一些情况下,主题CasZ蛋白是CasZa蛋白。在一些情况下,主题CasZ蛋白是CasZb蛋白。在一些情况下,主题CasZ蛋白是CasZc蛋白。在一些情况下,主题CasZ蛋白是CasZd蛋白。在一些情况下,主题CasZ蛋白是CasZe蛋白。在一些情况下,主题CasZ蛋白是CasZf蛋白。在一些情况下,主题CasZ蛋白是CasZg蛋白。在一些情况下,主题CasZ蛋白是CasZh蛋白。在一些情况下,主题CasZ蛋白是CasZi蛋白。在一些情况下,主题CasZ蛋白是CasZj蛋白。在一些情况下,主题CasZ蛋白是CasZk蛋白。在一些情况下,主题CasZ蛋白是CasZl蛋白。在一些情况下,主题CasZ蛋白是CasZe、CasZf、CasZg或CasZh蛋白。在一些情况下,主题CasZ蛋白是CasZj、CasZk或CasZl蛋白。
重要的是要注意,与先前鉴定的CRISPR-Cas内切核酸酶相比,这种新发现的蛋白质(CasZ)较短,并且因此使用此蛋白质作为替代方案提供了编码蛋白质的核苷酸序列相对较短的优点。例如,在其中需要编码CasZ蛋白的核酸的情况下,例如在采用病毒载体(例如,AAV载体)的情况下,这可用于递送至诸如真核细胞的细胞(例如,哺乳动物细胞、人细胞、小鼠细胞、体外、离体、体内)用于研究和/或临床应用。另外,在其自然环境中,编码CasZ的DNA序列存在于也具有Cas1蛋白的基因座中。
在一些情况下,主题CasZ蛋白具有900个氨基酸或更少(例如,850个氨基酸或更少、800个氨基酸或更少、750个氨基酸或更少,或700个氨基酸或更少)的长度。在一些情况下,主题CasZ蛋白具有850个氨基酸或更少(例如,850个氨基酸或更少)的长度。在一些情况下,主题CasZ蛋白具有800个氨基酸或更少(例如,750个氨基酸或更少)的长度。在一些情况下,主题CasZ蛋白具有700个氨基酸或更少的长度。在一些情况下,主题CasZ蛋白具有650个氨基酸或更少的长度。
在一些情况下,主题CasZ蛋白具有在350-900个氨基酸(例如,350-850个、350-800个、350-750个、350-700个、400-900个、400-850个、400-800个、400-750个或400-700个氨基酸)的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZa)具有在350-750个氨基酸(例如,350-700个、350-550个、450-550个、450-750个、450-650个或450-550个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在450-750个氨基酸(例如,500-700个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在350-700个氨基酸(例如,350-650个、350-600个或350-550个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在500-700个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在450-550个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZa)具有在350-550个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZb)具有在350-700个氨基酸(例如,350-650个或350-620个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZb)具有在450-700个氨基酸(例如,450-650个、500-650个或500-620个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZb)具有在500-650个氨基酸(例如,500-620个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZb)具有在500-620个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZc)具有在600-800个氨基酸(例如,600-650个或700-800个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZc)具有在600-650个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZc)具有在700-800个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZd)具有在400-650个氨基酸(例如,400-600个、400-550个、500-650个、500-600个或500-550个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZd)具有在500-600个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZd)具有在500-550个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZd)具有在400-550个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZe)具有在450-700个氨基酸(例如,450--650个、450-615个、475-700个、475-650个或475-615个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZe)具有在450-675个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZe)具有在475-675个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZf)具有在400-550个氨基酸(例如,400-520个、400-500个、400-475个、415-550个、415-520个、415-500个或415-475个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZf)具有在400-475个氨基酸(例如,400-450个氨基酸)的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZg)具有在500-750个氨基酸(例如,550-750个或500-700个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZg)具有在700-750个氨基酸的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZg)具有在550-600个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZh)具有在380-450个氨基酸(例如,380-420个、400-450个或400-420个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZh)具有在400-420个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZi)具有在700-800个氨基酸(例如,700-750个、720-800个或720-750个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZi)具有在720-780个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZj)具有在600-750个氨基酸(例如,600-700个或650-700个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZj)具有在400-420个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZk)具有在450-600个氨基酸(例如,450-580个、480-600个、480-580个或500-600个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZk)具有在480-580个氨基酸的范围内的长度。
在一些情况下,主题CasZ蛋白(例如,CasZl)具有在350-500个氨基酸(例如,350-450个、380-450个、350-420个或380-420个氨基酸)的范围内的长度。在一些情况下,主题CasZ蛋白(例如,CasZl)具有在380-420个氨基酸的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZa蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZa氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZa氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的一个或多个氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-800个氨基酸(例如,350-800个、350-750个、350-700个、350-550个、450-550个、450-750个、450-650个或450-550个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZb蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZb蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZb蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZb蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZb氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZb氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZb蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-700个氨基酸(例如,350-650个或350-620个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZc蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZc蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZc蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZc蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZc氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZc氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZc蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在600-800个氨基酸(例如,600-650个或700-800个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZd蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZd蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZd蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZd蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZd氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZd氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZd蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在400-650个氨基酸(例如,400-600个、400-550个、500-650个、500-600个或500-550个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZe蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZe氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZe氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在450-700个氨基酸(例如,450--650个、450-615个、475-700个、475-650个或475-615个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZf蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZf蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZf蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZf蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZf氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZf氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZf蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在400-750个氨基酸(例如,400-700个、700-650个、400-620个、400-600个、400-550个、400-520个、400-500个、400-475个、415-550个、415-520个、415-500个或415-475个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZg蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZg蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZg蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZg蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZg氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZg氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZg蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在500-750个氨基酸(例如,500-750个氨基酸(例如,550-750个氨基酸))的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZh蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZh蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZh蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZh氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZh氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在380-450个氨基酸(例如,380-420个、400-450个或400-420个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZi蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZi蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZi蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZi蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZi氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZi氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZi蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在700-800个氨基酸(例如,700-750个、720-800个或720-750个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZj蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZj氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZj氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZj蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在600-750个氨基酸(例如,600-700个或650-700个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZk蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZk蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZk蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZk蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZk氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZk氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZk蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在450-600个氨基酸(例如,450-580个、480-600个、480-580个或500-600个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZl蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZl蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZl蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZl氨基酸序列。在一些情况下,主题CasZ蛋白包含图1或图7的CasZl氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)(例如,在一些情况下,使得CasZ蛋白是dCasZ)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在450-600个氨基酸(例如,450-580个、480-600个、480-580个或500-600个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的CasZe、CasZf、CasZg或CasZh蛋白序列的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的CasZe、CasZf、CasZg或CasZh蛋白序列的氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZe、CasZf、CasZg或CasZh蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-900个氨基酸(例如,350-850个、350-800个、400-900个、400-850个或400-800个氨基酸)的范围内的长度。
在一些情况下,(主题组合物和/或方法的)主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有20%或更高的序列同一性(例如,30%或更高、40%或更高、50%或更高、60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。例如,在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有50%或更高的序列同一性(例如,60%或更高、70%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有80%或更高的序列同一性(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白序列的氨基酸序列。在一些情况下,主题CasZ蛋白包含具有图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白序列的氨基酸序列,不同的是所述序列包含降低蛋白质的天然存在的催化活性的氨基酸取代(例如,1、2或3个氨基酸取代)(例如像,在一个或多个催化氨基酸位置处)。在一些情况下,主题CasZ蛋白包含与图1或图7的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh、CasZi、CasZj、CasZK或CasZl蛋白具有90%或更高的序列同一性(例如,95%或更高、97%或更高、98%或更高、99%或更高或100%的序列同一性)的氨基酸序列并且具有在350-900个氨基酸(例如,350-850个、350-800个、400-900个、400-850个或400-800个氨基酸)的范围内的长度。
CasZ变体
当与对应的野生型CasZ蛋白的氨基酸序列相比时,变体CasZ蛋白具有至少一个氨基酸不同的氨基酸序列(例如,具有缺失、***、取代、融合)。切割双链靶核酸的一条链但不切割另一条链的CasZ蛋白在本文中被称为“切口酶”(例如,“切口酶CasZ”)。基本上不具有核酸酶活性的CasZ蛋白在本文中被称为死CasZ蛋白(“dCasZ”)(需要注意的是,核酸酶活性可由异源多肽(融合配偶体)在嵌合CasZ蛋白的情况下提供,这在下文更详细地描述)。对于本文所述的任何CasZ变体蛋白(例如,切口酶CasZ、dCasZ、嵌合CasZ),CasZ变体可包括具有上述相同参数(例如,存在的结构域、同一性百分比等)的CasZ蛋白序列。
变体–催化活性
在一些情况下,CasZ蛋白是变体CasZ蛋白,例如相对于天然存在的催化活性序列突变的蛋白,并且在与对应的天然存在的序列相比时,表现出降低的切割活性(例如,表现出90%或更低、80%或更低、70%或更低、60%或更低、50%或更低、40%或更低,或30%或更低的切割活性)。在一些情况下,这种变体CasZ蛋白是催化‘死’蛋白(基本上没有切割活性)并且可被称为‘dCasZ’。在一些情况下,变体CasZ蛋白是切口酶(仅切割双链靶核酸(例如,双链靶DNA)的一条链)。如本文更详细描述的,在一些情况下,CasZ蛋白(在一些情况下,是具有野生型切割活性的CasZ蛋白并且在一些情况下,是具有降低的切割活性的变体CasZ,例如dCasZ或切口酶CasZ)与具有目标活性(例如,目标催化活性)的异源多肽融合(缀合)以形成融合蛋白(嵌合CasZ蛋白)。
当根据CasZi.1编号时,CasZ的催化残基包括D405、E586和D684(例如,参见图1)。因此,在一些情况下,CasZ蛋白具有降低的活性,并且一种或多种上述氨基酸(或任何CasZ蛋白的一种或多种对应的氨基酸)发生突变(例如,被丙氨酸取代)。在一些情况下,变体CasZ蛋白是催化‘死’蛋白(无催化活性)并且被称为‘dCasZ’。dCasZ蛋白可与提供活性的融合配偶体融合,并且在一些情况下,dCasZ(例如,没有提供催化活性的融合配偶体,但在真核细胞中表达时可具有NLS的dCasZ)可结合靶DNA并且可用于成像(例如,可给蛋白质加标签/进行标记),并且/或者可阻止RNA聚合酶从靶DNA转录。在一些情况下,变体CasZ蛋白是切口酶(仅切割双链靶核酸(例如,双链靶DNA)的一条链)。
变体–嵌合CasZ(即,融合蛋白)
如上所指出,在一些情况下,CasZ蛋白(在一些情况下,是具有野生型切割活性的CasZ蛋白并且在一些情况下,是具有降低的切割活性的变体CasZ,例如dCasZ或切口酶CasZ)与具有目标活性(例如,目标催化活性)的异源多肽融合(缀合)以形成融合蛋白(嵌合CasZ蛋白)。CasZ蛋白可与之融合的异源多肽在本文中被称为‘融合配偶体’。
在一些情况下,融合配偶体可调节靶DNA的转录(例如,抑制转录、增加转录)。例如,在一些情况下,融合配偶体是抑制转录的蛋白质(或来自蛋白质的结构域)(例如,转录阻遏物,一种通过转录抑制蛋白的募集、靶DNA的修饰诸如甲基化、DNA修饰物的募集、与靶DNA相关联的组蛋白的调节、组蛋白修饰物(诸如修饰组蛋白的乙酰化和/或甲基化的那些组蛋白修饰物)的募集等起作用的蛋白质)。在一些情况下,融合配偶体是增加转录的蛋白质(或来自蛋白质的结构域)(例如,转录激活因子,一种通过转录激活蛋白的募集、靶DNA的修饰诸如甲基化、DNA修饰物的募集、与靶DNA相关联的组蛋白的调节、组蛋白修饰物(诸如修饰组蛋白的乙酰化和/或甲基化的那些组蛋白修饰物)的募集等起作用的蛋白质)。
在一些情况下,嵌合CasZ蛋白包括具有修饰靶核酸的酶活性(例如,核酸酶活性(诸如FokI核酸酶活性)、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性或糖基化酶活性)的异源多肽。
在一些情况下,嵌合CasZ蛋白包括具有修饰与靶核酸相关联的多肽(例如,组蛋白)的酶活性(例如,甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性或脱豆蔻酰化活性)的异源多肽。
可用于增加转录的蛋白质(或其片段)的实例包括但不限于:转录激活因子,诸如VP16、VP64、VP48、VP160、p65亚结构域(例如,来自NFkB)以及EDLL的激活结构域和/或TAL激活结构域(例如,针对植物中的活性);组蛋白赖氨酸甲基转移酶,诸如SET1A、SET1B、MLL1至5、ASH1、SYMD2、NSD1等;组蛋白赖氨酸脱甲基酶,诸如JHDM2a/b、UTX、JMJD3等;组蛋白乙酰转移酶,诸如GCN5、PCAF、CBP、p300、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、SRC1、ACTR、P160、CLOCK等;以及DNA脱甲基酶,诸如10-11易位(TET)双加氧酶1(TET1CD)、TET1、DME、DML1、DML2、ROS1等。
可用于减少转录的蛋白质(或其片段)的实例包括但不限于:转录阻遏物,诸如Krüppel相关盒(KRAB或SKD);KOX1阻遏结构域;Mad mSIN3相互作用结构域(SID);ERF阻遏物结构域(ERD)、SRDX阻遏结构域(例如,针对植物中的阻遏)等;组蛋白赖氨酸甲基转移酶,诸如Pr-SET7/8、SUV4-20H1、RIZ1等;组蛋白赖氨酸脱甲基酶,诸如JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCY等;组蛋白赖氨酸脱乙酰酶,诸如HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等;DNA甲基化酶,诸如HhaIDNA m5c-甲基转移酶(M.HhaI)、DNA甲基转移酶1(DNMT1)、DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等;以及外周募集元件,诸如核纤层蛋白A、核纤层蛋白B等。
在一些情况下,融合配偶体具有修饰靶核酸(例如,ssRNA、dsRNA、ssDNA、dsDNA)的酶活性。可由融合配偶体提供的酶活性的实例包括但不限于:核酸酶活性,诸如由限制性酶(例如,FokI核酸酶)提供的活性;甲基转移酶活性,诸如由甲基转移酶(例如,HhaIDNA m5c-甲基转移酶(M.HhaI)、DNA甲基转移酶1(DNMT1)、DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)等)提供的活性;脱甲基酶活性,诸如由脱甲基酶(例如;10-11易位(TET)双加氧酶1(TET1CD)、TET1、DME、DML1、DML2、ROS1等)提供的活性;DNA修复活性;DNA损伤活性;脱氨基活性,诸如由脱氨酶(例如,胞嘧啶脱氨酶,诸如大鼠APOBEC1)提供的活性;歧化酶活性;烷基化活性;脱嘌呤活性;氧化活性;嘧啶二聚体形成活性;整合酶活性,诸如由整合酶和/或解离酶(例如,Gin转化酶诸如Gin转化酶的过度活跃突变体GinH106Y、人免疫缺陷病毒1型整合酶(IN)、Tn3解离酶等)提供的活性;转座酶活性;重组酶活性,诸如由重组酶(例如,Gin重组酶的催化结构域)提供的活性;聚合酶活性;连接酶活性;解旋酶活性;光裂合酶活性和糖基化酶活性)。
在一些情况下,融合配偶体具有修饰与靶核酸(例如,ssRNA、dsRNA、ssDNA、dsDNA)相关联的蛋白质(例如,组蛋白、RNA结合蛋白、DNA结合蛋白等)的酶活性。可由融合配偶体提供的酶活性(修饰与靶核酸相关联的蛋白质)的实例包括但不限于:甲基转移酶活性,诸如由组蛋白甲基转移酶(HMT)(例如,花斑抑制因子3-9同源物1(SUV39H1,也称为KMT1A)、常染色体组蛋白赖氨酸甲基转移酶2(G9A,也称为KMT1C和EHMT2)、SUV39H2、ESET/SETDB1等、SET1A、SET1B、MLL1至5、ASH1、SYMD2、NSD1、DOT1L、Pr-SET7/8、SUV4-20H1、EZH2、RIZ1)提供的活性;脱甲基酶活性,诸如由组蛋白脱甲基酶(例如,赖氨酸脱甲基酶1A(KDM1A,也称为LSD1)、JHDM2a/b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCY、UTX、JMJD3等)提供的活性;乙酰转移酶活性,诸如由组蛋白乙酰转移酶(例如,人乙酰转移酶p300、GCN5、PCAF、CBP、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、HBO1/MYST2、HMOF/MYST1、SRC1、ACTR、P160、CLOCK等的催化核心/片段)提供的活性;脱乙酰酶活性,诸如由组蛋白脱乙酰酶(例如,HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11等)提供的活性;激酶活性;磷酸酶活性;泛素连接酶活性;去泛素化活性;腺苷酸化活性;脱腺苷酸化活性;SUMO化活性;脱SUMO化活性;核糖基化活性;脱核糖基化活性;豆蔻酰化活性和脱豆蔻酰化活性。
合适的融合配偶体的另外的实例是二氢叶酸还原酶(DHFR)去稳定化结构域(例如,以产生化学可控的嵌合CasZ蛋白)和叶绿体转运肽。合适的叶绿体转运肽包括但不限于:
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKV NTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA(SEQ ID NO:101);
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(SEQ ID NO:102);
MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC(SEQ ID NO:103);
MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(SEQ ID NO:104);
MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIGSELRPLKVMSSVSTAC(SEQ ID NO:105);
MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLFCSFRISASVATAC(SEQ ID NO:106);
MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPHRFDRRCLSMVV(SEQ ID NO:107);
MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC(SEQ ID NO:108);
MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(SEQ ID NO:109);
MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVISRSAAAA(SEQID NO:110);和
MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(SEQ ID NO:111)。
在一些情况下,本公开的CasZ融合多肽包含:a)本公开的CasZ多肽;和b)叶绿体转运肽。因此,例如,CRISPR-CasZ复合物可被靶向至叶绿体。在一些情况下,这种靶向可通过N末端延伸的存在来实现,所述N末端延伸称为叶绿体转运肽(CTP)或质体转运肽。如果表达的多肽要在植物质体(例如,叶绿体)中区室化,则来自细菌来源的染色体转基因必须具有编码CTP序列的序列,所述CTP序列与编码表达的多肽的序列融合。因此,外源多肽到叶绿体的定位通常1通过将编码CTP序列的多核苷酸序列与编码外源多肽的多核苷酸的5'区可操作地连接来实现。在易位到质体的过程中,在加工步骤中去除CTP。然而,加工效率可能受到CTP的氨基酸序列和肽的NH 2末端附近的序列的影响。已经描述的用于靶向叶绿体的其他选择是玉米cab-m7信号序列(美国专利号7,022,896、WO 97/41228)、豌豆谷胱甘肽还原酶信号序列(WO 97/41228)和US2009029861中描述的CTP。
在一些情况下,本公开的CasZ融合多肽可包含:a)本公开的CasZ多肽;和b)内体逃逸肽。在一些情况下,内体逃逸多肽包含氨基酸序列GLFXALLXLLXSLWXLLLXA(SEQ ID NO:112),其中每个X独立地选自赖氨酸、组氨酸和精氨酸。在一些情况下,内体逃逸多肽包含氨基酸序列GLFHALLHLLHSLWHLLLHA(SEQ ID NO:113)。
对于在与Cas9蛋白、锌指蛋白和/或TALE蛋白融合的情况(用于位点特异性靶核酸修饰、转录调节和/或靶蛋白修饰,例如组蛋白修饰)中使用的一些上述融合配偶体(和更多)的实例,参见例如:Nomura等人,J Am Chem Soc.2007年7月18日;129(28):8676-7;Rivenbark等人,Epigenetics.2012年4月;7(4):350-60;Nucleic Acids Res.2016年7月8日;44(12):5615-28;Gilbert等人,Cell.2013年7月18日;154(2):442-51;Kearns等人,NatMethods.2015年5月;12(5):401-3;Mendenhall等人,Nat Biotechnol.2013年12月;31(12):1133-6;Hilton等人,Nat Biotechnol.2015年5月;33(5):510-7;Gordley等人,ProcNatl Acad Sci U S A.2009年3月31日;106(13):5053-8;Akopian等人,Proc Natl AcadSci U S A.2003年7月22日;100(15):8688-91;Tan等人,J Virol.2006年2月;80(4):1939-48;Tan等人,Proc Natl Acad Sci U S A.2003年10月14日;100(21):11997-2002;Papworth等人,Proc Natl Acad Sci U S A.2003年2月18日;100(4):1621-6;Sanjana等人,Nat Protoc.2012年1月5日;7(1):171-92;Beerli等人,Proc Natl Acad Sci U SA.1998年12月8日;95(25):14628-33;Snowden等人,Curr Biol.2002年12月23日;12(24):2159-66;Xu等人,Xu等人,Cell Discov.2016年5月3日;2:16009;Komor等人,Nature.2016年4月20日;533(7603):420-4;Chaikind等人,Nucleic Acids Res.2016年8月11日;Choudhury等人,Oncotarget.2016年6月23日;Du等人,Cold Spring Harb Protoc.2016年1月4日;Pham等人,Methods Mol Biol.2016;1358:43-57;Balboa等人,Stem CellReports.2015年9月8日;5(3):448-59;Hara等人,Sci Rep.2015年6月9日;5:11221;Piatek等人,Plant Biotechnol J.2015年5月;13(4):578-89;Hu等人,Nucleic Acids Res.2014年4月;42(7):4375-90;Cheng等人,Cell Res.2013年10月;23(10):1163-71;以及Maeder等人,Nat Methods.2013年10月;10(10):977-9。
另外适合的异源多肽包括但不限于直接和/或间接提供靶核酸的增加的转录和/或翻译的多肽(例如,转录激活因子或其片段、募集转录激活因子的蛋白质或其片段、小分子/药物响应性转录和/或翻译调控因子、翻译调控蛋白等)。实现增加或降低的转录的异源多肽的非限制性实例包括转录激活因子结构域和转录阻遏物结构域。在一些此类情况下,嵌合CasZ多肽通过指导核酸(指导RNA)被靶向靶核酸中的特定位置(即,序列)并且发挥基因座特异性调控的作用,诸如阻断RNA聚合酶与启动子(所述启动子选择性抑制转录激活因子功能)的结合和/或修饰局部染色质状态(例如,在使用融合序列时,修饰靶核酸或修饰与靶核酸相关联的多肽)。在一些情况下,变化是瞬时的(例如,转录阻遏或激活)。在一些情况下,变化是可遗传的(例如,在对靶核酸或与靶核酸相关联的蛋白质(例如,核小体组蛋白)进行表观遗传修饰时)。
当靶向ssRNA靶核酸时,使用的异源多肽的非限制性实例包括(但不限于):剪接因子(例如,RS结构域);蛋白质翻译组分(例如,翻译起始因子、延伸因子和/或释放因子;例如,eIF4G);RNA甲基化酶;RNA编辑酶(例如,RNA脱氨酶,例如作用于RNA的腺苷脱氨酶(ADAR),包括A至I和/或C至U编辑酶);解旋酶;RNA结合蛋白等。应理解,异源多肽可包括整个蛋白质,或者在一些情况下,可包括蛋白质的片段(例如,功能结构域)。
主题嵌合CasZ多肽的异源多肽可以是能够与ssRNA(出于本公开的目的,其包括分子内和/或分子间二级结构,例如双链RNA双链体,诸如发夹、茎环等)相互作用的任何结构域,无论是瞬时的还是不可逆的,直接的还是间接的,所述结构域包括但不限于选自由以下组成的组的效应结构域;内切核酸酶(例如RNA酶III、CRR22 DYW结构域、来自诸如SMG5和SMG6的蛋白质的Dicer和PIN(PilT N末端)结构域);负责刺激RNA切割的蛋白质和蛋白质结构域(例如CPSF、CstF、CFIm和CFIIm);外切核酸酶(例如XRN-1或外切核酸酶T);脱腺苷酶(例如HNT3);负责无义介导的RNA衰变的蛋白质和蛋白质结构域(例如UPF1、UPF2、UPF3、UPF3b、RNP S1、Y14、DEK、REF2和SRm160);负责稳定RNA的蛋白质和蛋白质结构域(例如PABP);负责阻遏翻译的蛋白质和蛋白质结构域(例如Ago2和Ago4);负责刺激翻译的蛋白质和蛋白质结构域(例如Staufen);负责(例如能够)调节翻译的蛋白质和蛋白质结构域(例如翻译因子,诸如起始因子、延伸因子、释放因子等,例如eIF4G);负责RNA的聚腺苷酸化的蛋白质和蛋白质结构域(例如PAP1、GLD-2和Star-PAP);负责RNA的聚尿苷酸化的蛋白质和蛋白质结构域(例如CID1和末端尿苷酸转移酶);负责RNA定位的蛋白质和蛋白质结构域(例如来自IMP1、ZBP1、She2p、She3p和Bicaudal-D);负责RNA的核保留的蛋白质和蛋白质结构域(例如Rrp6);负责RNA的核输出的蛋白质和蛋白质结构域(例如TAP、NXF1、THO、TREX、REF和Aly);负责阻遏RNA剪接的蛋白质和蛋白质结构域(例如PTB、Sam68和hnRNP A1);负责刺激RNA剪接的蛋白质和蛋白质结构域(例如富含丝氨酸/精氨酸(SR)结构域);负责降低转录效率的蛋白质和蛋白质结构域(例如FUS(TLS));以及负责刺激转录的蛋白质和蛋白质结构域(例如CDK7和HIV Tat)。可替代地,效应结构域可选自包括以下的组:内切核酸酶;能够刺激RNA切割的蛋白质和蛋白质结构域;外切核酸酶;脱腺苷酶;具有无义介导的RNA衰变活性的蛋白质和蛋白质结构域;能够稳定RNA的蛋白质和蛋白质结构域;能够阻遏翻译的蛋白质和蛋白质结构域;能够刺激翻译的蛋白质和蛋白质结构域;能够调节翻译的蛋白质和蛋白质结构域(例如,翻译因子,诸如起始因子、延伸因子、释放因子等,例如eIF4G);能够进行RNA的聚腺苷酸化的蛋白质和蛋白质结构域;能够进行RNA的聚尿苷酸化的蛋白质和蛋白质结构域;具有RNA定位活性的蛋白质和蛋白质结构域;能够进行RNA的核保留的蛋白质和蛋白质结构域;具有RNA核输出活性的蛋白质和蛋白质结构域;能够阻遏RNA剪接的蛋白质和蛋白质结构域;能够刺激RNA剪接的蛋白质和蛋白质结构域;能够降低转录效率的蛋白质和蛋白质结构域;以及能够刺激转录的蛋白质和蛋白质结构域。另一种合适的异源多肽是PUFRNA结合结构域,其在WO2012068627中更详细地描述,所述文献以引用方式整体并入本文。
可作为嵌合CasZ多肽的异源多肽(整体或作为其片段)使用的一些RNA剪接因子具有模块化结构,具有分开的序列特异性RNA结合模块和剪接效应结构域。例如,富含丝氨酸/精氨酸(SR)的蛋白质家族的成员含有N末端RNA识别基序(RRM),其结合前mRNA和C末端RS结构域中的外显子剪接增强子(ESE),所述外显子剪接增强子促进外显子包含。作为另一个实例,hnRNP蛋白hnRNP Al通过其RRM结构域与外显子剪接沉默子(ESS)结合,并通过C末端富含甘氨酸的结构域抑制外显子包含。一些剪接因子可通过结合两个替代位点之间的调控序列来调控剪接位点(ss)的替代使用。例如,ASF/SF2可识别ESE并有助于使用内含子近侧位点,而hnRNP Al可结合ESS并将剪接转到使用内含子远侧位点。此类因子的一个应用是生成调节内源基因(特别是疾病相关基因)的替代剪接的ESF。例如,Bcl-x前mRNA产生两种剪接同种型,这两种剪接同种型具有两个替代的5'剪接位点以编码具有相反功能的蛋白质。长剪接同种型Bcl-xL是在长寿命的有丝***后细胞中表达的有效凋亡抑制因子,并且在许多癌细胞中上调,从而保护细胞免于凋亡信号。短同种型Bcl-xS是促凋亡同种型,并且在具有高周转率的细胞(例如,发育中的淋巴细胞)中以高水平表达。两种Bcl-x剪接同种型之比由位于核心外显子区或外显子延伸区(即,两个替代5'剪接位点之间)中的多个元件调控。对于更多实例,参见WO2010075303,其特此以引用方式整体并入。
另外的合适的融合配偶体包括但不限于作为边界元件(例如,CTCF)的蛋白质(或其片段)、提供外周募集的蛋白质及其片段(例如,核纤层蛋白A、核纤层蛋白B等)、蛋白质对接元件(例如,FKBP/FRB、Pil1/Aby1等)。
用于主题嵌合CasZ多肽的各种另外的合适的异源多肽(或其片段)的实例包括但不限于在以下申请中描述的那些(所述公布涉及其他CRISPR内切核酸酶(诸如Cas9),但是描述的融合配偶体也可与CasZ一起使用):PCT专利申请:WO2010075303、WO2012068627和WO2013155555,并且可见于例如以下美国专利和专利申请:8,906,616;8,895,308;8,889,418;8,889,356;8,871,445;8,865,406;8,795,965;8,771,945;8,697,359;20140068797;20140170753;20140179006;20140179770;20140186843;20140186919;20140186958;20140189896;20140227787;20140234972;20140242664;20140242699;20140242700;20140242702;20140248702;20140256046;20140273037;20140273226;20140273230;20140273231;20140273232;20140273233;20140273234;20140273235;20140287938;20140295556;20140295557;20140298547;20140304853;20140309487;20140310828;20140310830;20140315985;20140335063;20140335620;20140342456;20140342457;20140342458;20140349400;20140349405;20140356867;20140356956;20140356958;20140356959;20140357523;20140357530;20140364333;和20140377868;所述专利全部特此以引用方式整体并入。
在一些情况下,异源多肽(融合配偶体)提供亚细胞定位,即异源多肽含有亚细胞定位序列(例如,用于靶向细胞核的核定位信号(NLS)、用于将融合蛋白保持在细胞核外的序列(例如核输出序列(NES))、用于将融合蛋白保留在细胞质中的序列、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、ER保留信号等)。在一些实施方案中,CasZ融合多肽不包含NLS,使得蛋白质不靶向细胞核(这可能是有利的,例如,在靶核酸是存在于胞质溶胶中的RNA时)。在一些实施方案中,异源多肽可提供便于追踪和/或纯化的标签(即,异源多肽是可检测标记)(例如,荧光蛋白,例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;组氨酸标签,例如6XHis标签;血凝素(HA)标签;FLAG标签;Myc标签等)。
在一些情况下,CasZ蛋白(例如,野生型CasZ蛋白、变体CasZ蛋白、嵌合CasZ蛋白、dCasZ蛋白、其中CasZ部分具有降低的核酸酶活性的嵌合CasZ蛋白-诸如与融合配偶体融合的dCasZ蛋白等)包含(融合至)核定位信号(NLS)(例如,在一些情况下,2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)。因此,在一些情况下,CasZ多肽包含一个或多个NLS(例如,2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端和/或C末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在C末端处或附近(例如,在50个氨基酸内)。在一些情况下,一个或多个NLS(3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端和C末端二者处或附近(例如,在50个氨基酸内)。在一些情况下,NLS定位在N末端,并且NLS定位在C末端。
在一些情况下,CasZ蛋白(例如,野生型CasZ蛋白、变体CasZ蛋白、嵌合CasZ蛋白、dCasZ蛋白、其中CasZ部分具有降低的核酸酶活性的嵌合CasZ蛋白-诸如与融合配偶体融合的dCasZ蛋白等)包含(融合至)1与10个之间的NLS(例如,1-9个、1-8个、1-7个、1-6个、1-5个、2-10个、2-9个、2-8个、2-7个、2-6个或2-5个NLS)。在一些情况下,CasZ蛋白(例如,野生型CasZ蛋白、变体CasZ蛋白、嵌合CasZ蛋白、dCasZ蛋白、其中CasZ部分具有降低的核酸酶活性的嵌合CasZ蛋白-诸如与融合配偶体融合的dCasZ蛋白等)包含(融合至)2与5个之间的NLS(例如,2-4个或2-3个NLS)。
NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV(SEQ ID NO:114);来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:115)的核质蛋白二分NLS);c-myc NLS,具有氨基酸序列PAAKRVKLD(SEQ ID NO:116)或RQRRNELKRSP(SEQ ID NO:117);hRNPA1 M9 NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:118);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:119);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:120)和PPKKARED(SEQ ID NO:121);人p53的序列PQPKKKPL(SEQID NO:122);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:123);流感病毒NS1的序列DRLRR(SEQ ID NO:124)和PKQKKRK(SEQ ID NO:125);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:126);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:127);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:128);以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:129)。一般来讲,NLS(或多个NLS)具有足够的强度来驱动CasZ蛋白在真核细胞的细胞核中以可检测的量积累。可通过任何合适的技术执行细胞核中的积累的检测。例如,可检测标记物可与CasZ蛋白融合,使得细胞内的位置可被可视化。也可从细胞中分离细胞核,然后可通过任何合适的检测蛋白质的方法(诸如免疫组织化学、蛋白质印迹或酶活性测定)分析细胞核的内容物。也可间接确定细胞核中的积累。
在一些情况下,CasZ融合多肽包含“蛋白转导结构域”或PTD(又称为CPP–细胞穿透肽),其是指促进横穿脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机化合物或无机化合物。连接至另一个分子(所述分子可在小极性分子至大的高分子和/或纳米颗粒的范围内)的PTD促进分子横穿膜,例如从细胞外空间进入细胞内空间或从胞质溶胶进入细胞器内。在一些实施方案中,PTD与多肽的氨基末端共价连接(例如,与野生型CasZ连接以生成融合蛋白,或与变体CasZ蛋白(诸如dCasZ、切口酶CasZ或嵌合C asX蛋白)连接以生成融合蛋白)。在一些实施方案中,PTD与多肽的羧基末端共价连接(例如,与野生型CasZ连接以生成融合蛋白,或与变体CasZ蛋白(诸如dCasZ、切口酶CasZ或嵌合CasZ蛋白)连接以生成融合蛋白)。在一些情况下,PTD在合适的***位点处内插在CasZ融合多肽中(即,不在CasZ融合多肽的N末端或C末端)。在一些情况下,主题CasZ融合多肽包含(缀合至、融合至)一个或多个PTD(例如,两个或更多个、三个或更多个、四个或更多个PTD)。在一些情况下,PTD包含核定位信号(NLS)(例如,在一些情况下,2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)。因此,在一些情况下,CasZ融合多肽包含一个或多个NLS(例如,2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)。在一些情况下,PTD与核酸(例如,CasZ指导核酸、编码CasZ指导核酸的多核苷酸、编码CasZ融合多肽的多核苷酸、供体多核苷酸等)共价连接。PTD的实例包括但不限于最小十一氨基酸多肽蛋白转导结构域(对应于包含YGRKKRRQRRR;SEQ ID NO:130的HIV-1TAT的残基47-57);包含足以直接进入细胞中的数量的精氨酸(例如,3个、4个、5个、6个、7个、8个、9个、10个或10-50个精氨酸)的聚精氨酸序列;VP22结构域(Zender等人(2002)Cancer Gene Ther.9(6):489-96);果蝇触角足基因(Antennapedia)蛋白转导结构域(Noguchi等人(2003)Diabetes52(7):1732-1737);截短的人降钙素肽(Trehin等人(2004)Pharm.Research 21:1248-1256);聚赖氨酸(Wender等人(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008);RRQRRTSKLMKR(SEQ IDNO:131);运输蛋白(Transportan)GWTLNSAGYLLGKINLKALAALAKKIL(SEQ ID NO:132);KALAWEAKLAKALAKALAKHLAKALAKALKCEA(SEQ ID NO:133);和RQIKIWFQNRRMKWKK(SEQ ID NO:134)。示例性PTD包括但不限于:YGRKKRRQRRR(SEQ ID NO:130);RKKRRQRRR(SEQ ID NO:135);具有3个精氨酸残基至50个精氨酸残基的精氨酸均聚物;示例性PTD结构域氨基酸序列包括但不限于以下序列中的任一个:YGRKKRRQRRR(SEQ ID NO:130);RKKRRQRR(SEQ IDNO:136);YARAAARQARA(SEQ ID NO:137);THRLPRRRRRR(SEQ ID NO:138);和GGRRARRRRRR(SEQ ID NO:139)。在一些实施方案中,PTD是可激活的CPP(ACPP)(Aguilera等人(2009)Integr Biol(Camb)6月;1(5-6):371-381)。ACPP包括经由可切割接头连接至匹配聚阴离子(例如,Glu9或“E9”)的聚阳离子CPP(例如,Arg9或“R9”),这使净电荷减小至接近零并由此抑制粘附和吸收到细胞中。当切割接头时,释放聚阴离子,局部暴露聚精氨酸和其固有的粘附性,从而“激活”ACPP以横穿膜。
接头(例如,用于融合配偶体)
在一些情况下,主题CasZ蛋白经由接头多肽(例如,一个或多个接头多肽)与融合配偶体融合。接头多肽可具有多种氨基酸序列中的任一种。蛋白质可通过间隔肽连接,间隔肽通常具有柔性性质,但不排除其他化学键。合适的接头包括长度在4个氨基酸与40个氨基酸之间或者长度在4个氨基酸与25个氨基酸之间的多肽。这些接头可通过使用合成的编码接头的寡核苷酸来产生以偶联蛋白质,或者可由编码融合蛋白的核酸序列编码。可使用具有一定程度柔性的肽接头。连接肽实际上可具有任何氨基酸序列,应记住优选的接头将具有产生总体上柔性的肽的序列。小氨基酸(诸如甘氨酸和丙氨酸)的用途用于产生柔性肽。对于本领域技术人员来说,产生此类序列是常规的。多种不同的接头是可商购获得的并且被认为是适合使用的。
接头多肽的实例包括甘氨酸聚合物(G)n、甘氨酸-丝氨酸聚合物(包括例如(GS)n、GSGGSn(SEQ ID NO:140)、GGSGGSn(SEQ ID NO:141)和GGGSn(SEQ ID NO:142),其中n是至少为1的整数)、甘氨酸-丙氨酸聚合物、丙氨酸-丝氨酸聚合物。示例性接头可包含氨基酸序列,所述氨基酸序列包括但不限于GGSG(SEQ ID NO:143)、GGSGG(SEQ ID NO:144)、GSGSG(SEQ ID NO:145)、GSGGG(SEQ ID NO:146)、GGGSG(SEQ ID NO:147)、GSSSG(SEQ ID NO:148)等。普通技术人员将认识到,与任何所需元件缀合的肽的设计可包括全部或部分柔性的接头,使得接头可包括柔性接头以及赋予较少柔性结构的一个或多个部分。
可检测标记
在一些情况下,本公开的CasZ多肽包含(例如,可连接/融合至)可检测标记。可提供可检测信号的合适的可检测标记和/或部分可包括但不限于酶、放射性同位素、特异性结合对的成员、荧光团、荧光蛋白、量子点等。
合适的荧光蛋白包括但不限于绿色荧光蛋白(GFP)或其变体、GFP的蓝色荧光变体(BFP)、GFP的青色荧光变体(CFP)、GFP的黄色荧光变体(YFP)、增强型GFP(EGFP)、增强型CFP(ECFP)、增强型YFP(EYFP)、GFPS65T、Emerald、Topaz(TYFP)、Venus、Citrine、mCitrine、GFPuv、去稳定化EGFP(dEGFP)、去稳定化ECFP(dECFP)、去稳定化EYFP(dEYFP)、mCFPm、Cerulean、T-Sapphire、CyPet、YPet、mKO、HcRed、t-HcRed、DsRed、DsRed2、DsRed-单体、J-Red、二聚体2、t-二聚体2(12)、mRFP1、pocilloporin、海肾GFP(Renilla GFP)、MonsterGFP、paGFP、Kaede蛋白和点燃蛋白(kindling protein)、藻胆蛋白和藻胆蛋白缀合物(包括B-藻红蛋白、R-藻红蛋白和别藻蓝蛋白)。荧光蛋白的其他实例包括mHoneydew、mBanana、mOrange、dTomato、tdTomato、mTangerine、mStrawberry、mCherry、mGrape1、mRaspberry、mGrape2、mPlum(Shaner等人(2005)Nat.Methods 2:905-909)等。如在例如Matz等人(1999)Nature Biotechnol.17:969-973中所述的来自珊瑚虫物种的多种荧光蛋白和有色蛋白中的任一种是适合使用的。
合适的酶包括但不限于辣根过氧化物酶(HRP)、碱性磷酸酶(AP)、β-半乳糖苷酶(GAL)、葡萄糖-6-磷酸脱氢酶、β-N-乙酰氨基葡糖苷酶、β-葡糖醛酸糖苷酶、转化酶、黄嘌呤氧化酶、萤火虫荧光素酶、葡萄糖氧化酶(GO)等。
原间隔序列相邻基序(PAM)
天然CasZ蛋白在由靶向DNA的RNA与靶DNA之间的互补性区域限定的靶序列处与靶DNA结合。与许多CRISPR内切核酸酶的情况一样,双链靶DNA的位点特异性结合(和/或切割)发生在由以下二者确定的位置处:(i)指导RNA与靶DNA之间的碱基配对互补性;和(ii)靶DNA中的短基序[称为原间隔序列相邻基序(PAM)]。
在一些情况下,CasZ蛋白的PAM直接位于靶DNA的非互补链的靶序列的5'端(也称为非靶链;互补链与指导RNA的指导序列杂交,而非互补链不直接与指导RNA杂交并且是非互补链的反向互补物)。在一些情况下(例如,对于CasZc),非互补链的PAM序列为5'-TTA-3'。在一些情况下(例如,对于CasZb),非互补链的PAM序列为5'-TTTN-3'。在一些情况下(例如,对于CasZb),非互补链的PAM序列为5'-TTTA-3'。
在一些情况下,不同的CasZ蛋白(即,来自各种物种的CasZ蛋白)可有利地用于各种所提供的方法中以便利用不同的CasZ蛋白的各种酶特征(例如,用于不同PAM序列偏好;用于增加的或降低的酶活性;用于增加的或降低的细胞毒性水平;用于改变NHEJ、同源定向修复、单链断裂、双链断裂等之间的平衡;利用短的总序列等)。来自不同物种的CasZ蛋白可能需要靶DNA中的不同的PAM序列。因此,对于所选择的具体CasZ蛋白,PAM序列偏好可与上述一个或多个序列不同。用于鉴定适当的PAM序列的各种方法(包括计算机模拟方法和/或湿实验室方法(wet lab methods))是本领域已知且常规的,并且可使用任何便利的方法。
CasZ指导RNA
与CasZ蛋白结合形成核糖核蛋白复合物(RNP)并将复合物靶向靶核酸(例如,靶DNA)内的特定位置的核酸分子在本文中称为“CasZ指导RNA”或者简称为“指导RNA”。应理解,在一些情况下,可制备杂交体DNA/RNA,使得CasZ指导RNA除RNA碱基外还包含DNA碱基,但术语“CasZ指导RNA”仍然用于涵盖本文的这种分子。
可以说CasZ指导RNA包含两个区段,即靶向区段和蛋白质结合区段。CasZ指导RNA的靶向区段包含与靶核酸(例如,靶ssRNA、靶ssDNA、双链靶DNA的互补链等)内的特定序列(靶位点)互补(并因此杂交)的核苷酸序列(指导序列)。蛋白质结合区段(或“蛋白质结合序列”)与CasZ多肽相互作用(结合)。主题CasZ指导RNA的蛋白质结合区段包含彼此杂交以形成双链RNA双链体(dsRNA双链体)的两段互补核苷酸。靶核酸(例如,基因组DNA)的位点特异性结合和/或切割可发生在由CasZ指导RNA(CasZ指导RNA的指导序列)与靶核酸之间的碱基配对互补性确定的位置(例如,靶基因座的靶序列)处。
CasZ指导RNA和CasZ蛋白(例如,融合CasZ多肽)形成复合物(例如,通过非共价相互作用结合)。CasZ指导RNA通过包含靶向区段为复合物提供靶特异性,所述靶向区段包含指导序列(与靶核酸序列互补的核苷酸序列)。复合物的CasZ蛋白提供位点特异性活性(例如,由CasZ蛋白提供的切割活性和/或在嵌合CasZ蛋白的情况下由融合配偶体提供的活性)。换句话讲,CasZ蛋白由于其与CasZ指导RNA的缔合而被导向至靶核酸序列(例如,靶序列)。
可修饰“指导序列”,也称为CasZ指导RNA的“靶向序列”,使得CasZ指导RNA可将CasZ蛋白(例如,天然存在的CasZ蛋白、融合CasZ多肽(嵌合CasZ)等)靶向任何所需的靶核酸的任何所需序列,除了(例如,如本文所述)可考虑PAM序列之外。因此,例如,CasZ指导RNA可具有与真核细胞中的核酸中的序列互补(例如,可与其杂交)的指导序列,所述核酸例如是病毒核酸、真核核酸(例如,真核染色体、染色体序列、真核RNA等)等。
在一些情况下,CasZ指导RNA具有30个核苷酸(nt)或更多个(例如,35个nt或更多个、40个nt或更多个、45个nt或更多个、50个nt或更多个、55个nt或更多个或者60个nt或更多个)的长度。在一些实施方案中,CasZ指导RNA具有40个核苷酸(nt)或更多个(例如,45个nt或更多个、50个nt或更多个、55个nt或更多个或者60个nt或更多个)的长度。在一些情况下,CasZ指导RNA具有30个核苷酸(nt)至100个nt(例如,30-90个、30-80个、30-75个、30-70个、30-65个、40-100个、40-90个、40-80个、40-75个、40-70个或40-65个nt)的长度。在一些情况下,CasZ指导RNA具有40个核苷酸(nt)至100个nt(例如,40-90个、40-80个、40-75个、40-70个或40-65个nt)的长度。
CasZ指导RNA的指导序列
主题CasZ指导RNA包含指导序列(即,靶向序列),其是与靶核酸中的序列(靶位点)互补的核苷酸序列。换句话讲,CasZ指导RNA的指导序列可通过杂交(即,碱基配对)以序列特异性方式与靶核酸(例如,双链DNA(dsDNA)、单链DNA(ssDNA)、单链RNA(ssRNA)或双链RNA(dsRNA))相互作用。CasZ指导RNA的指导序列可被修饰(例如,通过遗传工程)/设计成与靶核酸(例如,真核靶核酸,诸如基因组DNA)内的任何所需靶序列杂交(例如,当考虑PAM时,例如,当靶向dsDNA靶时)。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为60%或更高(例如,65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比为100%。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在靶核酸的靶位点最3'端的七个连续核苷酸上为100%。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17个或更多个(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为100%。
在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19个或更多个(例如,20个或更多个、21个或更多个、22个或更多个)连续核苷酸上为100%。
在一些实施方案中,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为100%。
在一些实施方案中,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些情况下,指导序列与靶核酸的靶位点之间的互补性百分比在19-25个连续核苷酸上为100%。
在一些情况下,指导序列具有在17-30个核苷酸(nt)(例如,17-25个、17-22个、17-20个、19-30个、19-25个、19-22个、19-20个、20-30个、20-25个或20-22个nt)的范围内的长度。在一些情况下,指导序列具有在17-25个核苷酸(nt)(例如,17-22个、17-20个、19-25个、19-22个、19-20个、20-25个或20-22个nt)的范围内的长度。在一些情况下,指导序列具有17或更多个nt(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个或者22个或更多个nt;19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些情况下,指导序列具有19个或更多个nt(例如,20个或更多个、21个或更多个或者22个或更多个nt;19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些情况下,指导序列具有17个nt的长度。在一些情况下,指导序列具有18个nt的长度。在一些情况下,指导序列具有19个nt的长度。在一些情况下,指导序列具有20个nt的长度。在一些情况下,指导序列具有21个nt的长度。在一些情况下,指导序列具有22个nt的长度。在一些情况下,指导序列具有23个nt的长度。
CasZ指导RNA的蛋白质结合区段
主题CasZ指导RNA的蛋白质结合区段与CasZ蛋白相互作用。CasZ指导RNA通过上文提及的指导序列将结合的CasZ蛋白导向至靶核酸内的特定核苷酸序列。CasZ指导RNA的蛋白质结合区段包含两段核苷酸,它们彼此互补并杂交形成双链RNA双链体(dsRNA双链体)。因此,蛋白质结合区段包含dsRNA双链体。
在一些情况下,dsRNA双链体区包含5-25个碱基对(bp)的范围(例如,5-22个、5-20个、5-18个、5-15个、5-12个、5-10个、5-8个、8-25个、8-22个、8-18个、8-15个、8-12个、12-25个、12-22个、12-18个、12-15个、13-25个、13-22个、13-18个、13-15个、14-25个、14-22个、14-18个、14-15个、15-25个、15-22个、15-18个、17-25个、17-22个或17-18个bp,例如5个bp、6个bp、7个bp、8个bp、9个bp、10个bp等)。在一些情况下,dsRNA双链体区包含6-15个碱基对(bp)的范围(例如,6-12个、6-10个或6-8个bp,例如6个bp、7个bp、8个bp、9个bp、10个bp等)。在一些情况下,双链体区包含5个或更多个bp(例如,6个或更多个、7个或更多个或者8个或更多个bp)。在一些情况下,双链体区包含6个或更多个bp(例如,7个或更多个或者8个或更多个bp)。在一些情况下,并非双链体区的所有核苷酸都是配对的,并且因此双链体形成区域可包含凸起。本文中的术语“凸起”用于意指一段核苷酸(其可以是一个核苷酸或多个核苷酸),这段核苷酸对双链双链体没有贡献,但是在5'端和3'端被有贡献的核苷酸围绕,并且因此凸起被认为是双链体区的一部分。在一些情况下,dsRNA包含1个或更多个凸起(例如,2个或更多个、3个或更多个、4个或更多个凸起)。在一些情况下,dsRNA双链体包含2个或更多个凸起(例如,3个或更多个、4个或更多个凸起)。在一些情况下,dsRNA双链体包含1-5个凸起(例如,1-4个、1-3个、2-5个、2-4个或2-3个凸起)。
因此,在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有70%-100%的互补性(例如,75%-100%、80%-10%、85%-100%、90%-100%、95%-100%的互补性)。在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有70%-100%的互补性(例如,75%-100%、80%-10%、85%-100%、90%-100%、95%-100%的互补性)。在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有85%-100%的互补性(例如,90%-100%、95%-100%的互补性)。在一些情况下,彼此杂交形成dsRNA双链体的核苷酸段彼此具有70%-95%的互补性(例如,75%-95%、80%-95%、85%-95%、90%-95%的互补性)。
换句话讲,在一些实施方案中,dsRNA双链体包含彼此具有70%-100%的互补性(例如,75%-100%、80%-10%、85%-100%、90%-100%、95%-100%的互补性)的两段核苷酸。在一些情况下,dsRNA双链体包含彼此具有85%-100%的互补性(例如,90%-100%、95%-100%的互补性)的两段核苷酸。在一些情况下,dsRNA双链体包含彼此具有70%-95%的互补性(例如,75%-95%、80%-95%、85%-95%、90%-95%的互补性)的两段核苷酸。
相对于天然存在的双链体区,主题CasZ指导RNA的双链体区可包含一个或多个(1个、2个、3个、4个、5个等)突变。例如,在一些情况下,可维持碱基对,同时对每个区段的碱基对有贡献的核苷酸可以是不同的。在一些情况下,与(天然存在的CasZ指导RNA的)天然存在的双链体区相比,主题CasZ指导RNA的双链体区包含更多配对的碱基、更少配对的碱基、更小的凸起、更大的凸起、更少的凸起、更多的凸起或它们的任何方便的组合。
各种Cas9指导RNA和cpf1指导RNA的实例可在本领域中找到,并且在一些情况下,与引入Cas9指导RNA中的那些相似的变型也可引入本公开的CasZ指导RNA中(例如,dsRNA双链体区的突变、5'或3'末端的延伸以用于增加稳定性以提供与另一种蛋白质的相互作用,等)。例如,参见Jinek等人,Science.2012年8月17日;337(6096):816-21;Chylinski等人,RNA Biol.2013年5月;10(5):726-37;Ma等人,Biomed Res Int.2013;2013:270805;Hou等人,Proc Natl Acad Sci U S A.2013年9月24日;110(39):15644-9;Jinek等人,Elife.2013;2:e00471;Pattanayak等人,Nat Biotechnol.2013年9月;31(9):839-43;Qi等人,Cell.2013年2月28日;152(5):1173-83;Wang等人,Cell.2013年5月9日;153(4):910-8;Auer等人,Genome Res.2013年10月31日;Chen等人,Nucleic Acids Res.2013年11月1日;41(20):e19;Cheng等人,Cell Res.2013年10月;23(10):1163-71;Cho等人,Genetics.2013年11月;195(3):1177-80;DiCarlo等人,Nucleic Acids Res.2013年4月;41(7):4336-43;Dickinson等人,Nat Methods.2013年10月;10(10):1028-34;Ebina等人,Sci Rep.2013;3:2510;Fujii等人,Nucleic Acids Res.2013年11月1日;41(20):e187;Hu等人,CellRes.2013年11月;23(11):1322-5;Jiang等人,Nucleic Acids Res.2013年11月1日;41(20):e188;Larson等人,Nat Protoc.2013年11月;8(11):2180-96;Mali等人,NatMethods.2013年10月;10(10):957-63;Nakayama等人,Genesis.2013年12月;51(12):835-43;Ran等人,Nat Protoc.2013年11月;8(11):2281-308;Ran等人,Cell.2013年9月12日;154(6):1380-9;Upadhyay等人,G3(Bethesda).2013年12月9日;3(12):2233-8;Walsh等人,Proc Natl Acad Sci U S A.2013年9月24日;110(39):15514-5;Xie等人,Mol Plant.2013年10月9日;Yang等人,Cell.2013年9月12日;154(6):1370-9;Briner等人,Mol Cell.2014年10月23日;56(2):333-9;以及以下美国专利和专利申请:8,906,616;8,895,308;8,889,418;8,889,356;8,871,445;8,865,406;8,795,965;8,771,945;8,697,359;20140068797;20140170753;20140179006;20140179770;20140186843;20140186919;20140186958;20140189896;20140227787;20140234972;20140242664;20140242699;20140242700;20140242702;20140248702;20140256046;20140273037;20140273226;20140273230;20140273231;20140273232;20140273233;20140273234;20140273235;20140287938;20140295556;20140295557;20140298547;20140304853;20140309487;20140310828;20140310830;20140315985;20140335063;20140335620;20140342456;20140342457;20140342458;20140349400;20140349405;20140356867;20140356956;20140356958;20140356959;20140357523;20140357530;20140364333;和20140377868;所述文献全部特此以引用方式整体并入。
CasZ指导RNA包含指导序列和杂交形成蛋白质结合区段的dsRNA双链体的两段核苷酸(“双链体形成区段”)。给定的CasZ指导RNA的特定序列可以是其中发现crRNA的物种的特征。本文提供合适的CasZ指导RNA的实例。
示例性指导RNA序列
表1和表3中显示天然存在的CasZ蛋白的crRNA的重复序列(CasZ指导RNA的非指导序列部分)(例如,参见图1和图7)。
表1.CasZ蛋白的crRNA重复序列
/>
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh或CasZi crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh或CasZi crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh或CasZi crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa、CasZb、CasZc、CasZd、CasZe、CasZf、CasZg、CasZh或CasZi crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZa crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZa crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZb crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZb crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZb crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZb crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZc crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZc crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZc crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZc crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZd crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZd crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZd crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZd crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZe crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZe crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZe crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZe crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZf crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZf crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZf crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZf crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZg crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZg crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZg crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZg crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZh crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZh crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZh crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZh crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZi crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZi crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZi crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZi crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZj crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZk crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZk crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZk crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZk crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZl crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZl crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZl crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZl crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
在一些情况下,主题CasZ指导RNA包含(例如,除例如作为蛋白质结合区的一部分的指导序列之外)表1或表3的CasZj、CasZl或CasZk crRNA序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj、CasZl或CasZk crRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj、CasZl或CasZk crRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ指导RNA包含与表1或表3的CasZj、CasZl或CasZk crRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。
CasZ反式激活非编码RNA(trancRNA)
本公开的组合物和方法包括CasZ反式激活非编码RNA(“trancRNA”;在本文中也称为“CasZ trancRNA”)。在一些情况下,trancRNA与本公开的CasZ多肽和CasZ指导RNA形成复合物。可将trancRNA鉴定为由CasZ基因座中存在的核苷酸序列编码的高度转录的RNA。编码trancRNA的序列通常位于cas基因与CasZ基因座的阵列(重复序列)之间(例如,可位于重复序列附近)。以下实例说明了CasZ trancRNA的检测。在一些情况下,CasZ trancRNA与CasZ多肽共免疫沉淀(形成复合物)。在一些情况下,***功能需要CasZ trancRNA的存在。与trancRNA相关的数据(例如,trancRNA的表达及其在天然存在的阵列上的位置)在下面的实施例部分中提供。
在一些情况下,CasZ trancRNA具有60个核苷酸(nt)至270个nt(例如,60-260个、70-270个、70-260个或75-255个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZatrancRNA)具有60-150个nt(例如,60-140个、60-130个、65-150个、65-140个、65-130个、70-150个、70-140个或70-130个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZatrancRNA)具有70-130个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZa trancRNA)具有约80个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZa trancRNA)具有约90个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZa trancRNA)具有约120个nt的长度。
在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有85-240个nt(例如,85-230个、85-220个、85-150个、85-130个、95-240个、95-230个、95-220个、95-150个或95-130个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有95-120个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有约105个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有约115个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZb trancRNA)具有约215个nt的长度。
在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有80-275个nt(例如85-260个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有80-110个nt(例如85-105个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有235-270个nt(例如240-260个nt)的长度。在一些情况下,CasZ trancRNA(例如,CasZctrancRNA)具有约95个nt的长度。在一些情况下,CasZ trancRNA(例如,CasZc trancRNA)具有约250个nt的长度。
示例性trancRNA序列
表2中显示天然存在的CasZ蛋白的trancRNA序列的实例。
表2.CasZ trancRNA序列
在一些情况下,主题CasZ trancRNA包含以上CasZa trancRNA序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有60-150个nt(例如,60-140个、60-130个、65-150个、65-140个、65-130个、70-150个、70-140个或70-130个nt)的长度。
在一些情况下,主题CasZ trancRNA包含以上CasZb trancRNA序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZb trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有85-240个nt(例如,85-230个、85-220个、85-150个、85-130个、95-240个、95-230个、95-220个、95-150个或95-130个nt)的长度。
在一些情况下,主题CasZ trancRNA包含以上CasZc trancRNA序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有80-110个nt(例如,85-105个nt)或235-270个nt(例如,240-260个nt)的长度。
在一些情况下,主题CasZ trancRNA包含以上CasZa、CasZb或CasZc trancRNA序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa、CasZb或CasZc trancRNA序列具有70%或更高的同一性(例如,75%或更高、80%或更高、85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa、CasZb或CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZ trancRNA包含与以上CasZa、CasZb或CasZc trancRNA序列具有90%或更高的同一性(例如,93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列。在一些情况下,主题CasZtrancRNA包含与以上CasZa、CasZb或CasZc trancRNA序列具有80%或更高的同一性(例如,85%或更高、90%或更高、93%或更高、95%或更高、97%或更高、98%或更高或100%的同一性)的核苷酸序列,并且具有60个核苷酸(nt)至270个nt(例如,60-260个、70-270个、70-260个或75-255个nt)的长度。
在一些情况下,CasZ trancRNA包含修饰的核苷酸(例如,甲基化的核苷酸)。在一些情况下,CasZ trancRNA包含以下一项或多项:i)碱基修饰或取代;ii)骨架修饰;iii)修饰的核苷间键;和iv)修饰的糖部分。下文描述可能的核酸修饰。
CASZ***
本公开提供一种CasZ***。本公开的CasZ***可包含以下一项或多项:(1)CasZ反式激活非编码RNA(trancRNA)(在本文中称为“CasZ trancRNA”)或编码CasZ trancRNA的核酸(例如表达载体);(2)CasZ蛋白(例如,野生型蛋白、变体、催化受损的变体、CasZ融合蛋白等)或编码CasZ蛋白的核酸(例如,RNA、表达载体等);以及(3)CasZ指导RNA(其与CasZ蛋白结合并提供针对CasZ蛋白的序列特异性,例如可与真核基因组的靶序列结合的指导RNA)或编码CasZ指导RNA的核酸)(例如,表达载体)。CasZ***可包含宿主细胞(例如,真核细胞、植物细胞、哺乳动物细胞、人细胞),所述宿主细胞包含(1)、(2)和(3)中的一者或多者(任意组合),例如,在一些情况下,宿主细胞包含trancRNA和/或编码trancRNA的核酸。在一些情况下,CasZ***包含(例如,除以上项之外)供体模板核酸。在一些情况下,CasZ***是一种或多种核酸(例如,一种或多种编码以上项的任何组合的表达载体)的***。
核酸
本公开提供一种或多种核酸,所述一种或多种核酸包含以下一项或多项:CasZtrancRNA序列、编码CasZ trancRNA的核苷酸序列、编码CasZ多肽(例如,野生型CasZ蛋白、切口酶CasZ蛋白、dCasZ蛋白、嵌合CasZ蛋白/CasZ融合蛋白等)的核苷酸序列、CasZ指导RNA序列、编码CasZ指导RNA的核苷酸序列和供体多核苷酸(供体模板、供体DNA)序列。在一些情况下,主题核酸(例如,一种或多种核酸)是重组表达载体(例如,质粒、病毒载体、微环DNA等)。在一些情况下,编码CasZ trancRNA的核苷酸序列、编码CasZ蛋白的核苷酸序列和/或编码CasZ指导RNA的核苷酸序列可操作地连接至启动子(例如,诱导型启动子),例如可在选择的细胞类型(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、灵长类动物细胞、啮齿动物细胞、人细胞等)中操作的启动子。
在一些情况下,编码本公开的CasZ多肽的核苷酸序列是密码子优化的。这种类型的优化可能需要编码CasZ的核苷酸序列的突变以模拟预期的宿主生物体或细胞同时编码相同蛋白质时的密码子偏好。因此,密码子可改变,但编码的蛋白质保持不变。例如,如果预期的靶细胞是人细胞,可使用人密码子优化的编码CasZ的核苷酸序列。作为另一个非限制性实例,如果预期的宿主细胞是小鼠细胞,则可生成小鼠密码子优化的编码CasZ的核苷酸序列。作为另一个非限制性实例,如果预期的宿主细胞是植物细胞,则可生成植物密码子优化的编码CasZ的核苷酸序列。作为另一个非限制性实例,如果预期的宿主细胞是昆虫细胞,则可生成昆虫密码子优化的编码CasZ的核苷酸序列。
本公开提供一种或多种重组表达载体,所述一种或多种重组表达载体包含(在一些情况下在不同的重组表达载体中,并且在一些情况下在相同的重组表达载体中):CasZtrancRNA序列、编码CasZ trancRNA的核苷酸序列、编码CasZ多肽(例如,野生型CasZ蛋白、切口酶CasZ蛋白、dCasZ蛋白、嵌合CasZ蛋白/CasZ融合蛋白等)的核苷酸序列、CasZ指导RNA序列、编码CasZ指导RNA的核苷酸序列和供体多核苷酸(供体模板、供体DNA)序列。在一些情况下,主题核酸(例如,一种或多种核酸)是重组表达载体(例如,质粒、病毒载体、微环DNA等)。在一些情况下,编码CasZ trancRNA的核苷酸序列、编码CasZ蛋白的核苷酸序列和/或编码CasZ指导RNA的核苷酸序列可操作地连接至启动子(例如,诱导型启动子),例如可在选择的细胞类型(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、灵长类动物细胞、啮齿动物细胞、人细胞等)中操作的启动子。
合适的表达载体包括病毒表达载体(例如,基于以下病毒的病毒载体:牛痘病毒;脊髓灰质炎病毒;腺病毒(参见例如Li等人,Invest Opthalmol Vis Sci 35:2543 2549,1994;Borras等人,Gene Ther 6:515524,1999;Li和Davidson,PNAS 92:7700 7704,1995;Sakamoto等人,H Gene Ther 5:1088 1097,1999;WO 94/12649、WO 93/03769;WO 93/19191;WO 94/28938;WO 95/11984和WO 95/00655);腺相关病毒(AAV)(参见例如Ali等人,Hum Gene Ther 9:81 86,1998;Flannery等人,PNAS 94:6916 6921,1997;Bennett等人,Invest Opthalmol Vis Sci38:2857 2863,1997;Jomary等人,Gene Ther 4:683 690,1997;Rolling等人,Hum Gene Ther 10:641 648,1999;Ali等人,Hum Mol Genet 5:591594,1996;Srivastava的WO 93/09239;Samulski等人,J.Vir.(1989)63:3822-3828;Mendelson等人,Virol.(1988)166:154-165;以及Flotte等人,PNAS(1993)90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见例如,Miyoshi等人,PNAS 94:1031923,1997;Takahashi等人,J Virol 73:7812 7816,1999);逆转录病毒载体(例如,鼠白血病病毒、脾坏死病毒和源自诸如劳斯肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人免疫缺陷病毒、骨髓增生肉瘤病毒以及乳腺肿瘤病毒的逆转录病毒的载体)等。在一些情况下,本公开的重组表达载体是重组腺相关病毒(AAV)载体。在一些情况下,本公开的重组表达载体是重组慢病毒载体。在一些情况下,本公开的重组表达载体是重组逆转录病毒载体。
根据所用的宿主/载体***,可在表达载体中使用多种合适的转录和翻译控制元件中的任一种,包括组成型启动子和诱导型启动子、转录增强子元件、转录终止子等。
在一些实施方案中,编码CasZ指导RNA的核苷酸序列可操作地连接至控制元件,例如转录控制元件,诸如启动子。在一些实施方案中,编码CasZ蛋白或CasZ融合多肽的核苷酸序列可操作地连接至控制元件,例如转录控制元件,诸如启动子。
转录控制元件可以是启动子。在一些情况下,启动子是组成型活性启动子。在一些情况下,启动子是可调控启动子。在一些情况下,启动子是诱导型启动子。在一些情况下,启动子是组织特异性启动子。在一些情况下,启动子是细胞类型特异性启动子。在一些情况下,转录控制元件(例如,启动子)在所靶向细胞类型或所靶向细胞群中是功能性的。例如,在一些情况下,转录控制元件在真核细胞(例如,造血干细胞(例如,动员的外周血(mPB)CD34(+)细胞、骨髓(BM)CD34(+)细胞等))中可以是功能性的。
真核启动子(在真核细胞中是功能性的启动子)的非限制性实例包括EF1α,来自巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、逆转录病毒的长末端重复序列(LTR)以及小鼠金属硫蛋白-I的那些启动子。选择适当的载体和启动子完全在本领域普通技术人员的水平之内。表达载体还可含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可包含用于扩增表达的适当序列。表达载体还可包含编码蛋白质标签(例如,6xHis标签、血凝素标签、荧光蛋白等)的核苷酸序列,所述蛋白质标签可融合至CasZ蛋白,从而产生嵌合CasZ多肽。
在一些情况下,编码CasZ指导RNA和/或CasZ融合多肽的核苷酸序列可操作地连接至诱导型启动子。在一些实施方案中,编码CasZ指导RNA和/或CasZ融合蛋白的核苷酸序列可操作地连接至组成型启动子。
启动子可以是组成型活性启动子(即,组成性地处于活性/“ON”状态的启动子),它可以是诱导型启动子(即,通过外界刺激例如特定温度、化合物或蛋白质的存在控制其状态(活性/“ON”或非活性/“OFF”)的启动子),它可以是空间限制的启动子(即,转录控制元件、增强子等)(例如,组织特异性启动子、细胞类型特异性启动子等),并且它可以是时间限制的启动子(即,启动子在胚胎发育的特定阶段过程中或在生物过程的特定阶段(例如,小鼠体内的毛囊周期)过程中处于“ON”状态或“OFF”状态)。
合适的启动子可衍生自病毒并且可因此称为病毒启动子,或者它们可衍生自任何生物,包括原核生物或真核生物。合适的启动子可用来通过任何RNA聚合酶(例如,pol I、pol II、pol III)驱动表达。示例性启动子包括但不限于SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复序列(LTR)启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子诸如CMV立即早期启动子区(CMVIE)、劳斯肉瘤病毒(RSV)启动子、人U6小核启动子(U6)(Miyagishi等人,Nature Biotechnology 20,497-500(2002))、增强的U6启动子(例如,Xia等人,Nucleic Acids Res.2003年9月1日;31(17))、人H1启动子(H1)等。
在一些情况下,编码CasZ指导RNA的核苷酸序列可操作地连接至(受控制于)在真核细胞中可操作的启动子(例如,U6启动子、增强的U6启动子、H1启动子等)。如本领域的普通技术人员所理解的,当使用U6启动子(例如,在真核细胞中)或另一种PolIII启动子由核酸(例如,表达载体)表达RNA(例如,指导RNA)时,如果连续存在若干个T(在RNA中编码U),则可能需要对RNA进行突变。这是因为DNA中的一串T(例如,5个T)可充当聚合酶III(PolIII)的终止子。因此,为了确保指导RNA在真核细胞中的转录,有时可能需要修饰编码指导RNA的序列以消除T的作用。在一些情况下,编码CasZ蛋白(例如,野生型CasZ蛋白、切口酶CasZ蛋白、dCasZ蛋白、嵌合CasZ蛋白等)的核苷酸序列可操作地连接至在真核细胞中可操作的启动子(例如,CMV启动子、EF1α启动子、***受体调控的启动子等)。
诱导型启动子的实例包括但不限于T7 RNA聚合酶启动子、T3RNA聚合酶启动子、异丙基-β-D-硫代半乳糖苷(IPTG)调控的启动子、乳糖诱导的启动子、热休克启动子、四环素调控的启动子、类固醇调控的启动子、金属调控的启动子、***受体调控的启动子等。因此,诱导型启动子可通过分子调控,所述分子包括但不限于强力霉素;***和/或***类似物;IPTG等。
适合使用的诱导型启动子包括本文所述或本领域的普通技术人员已知的任何诱导型启动子。诱导型启动子的实例包括但不限于化学/生物化学调控的启动子和物理调控的启动子,诸如醇调控的启动子、四环素调控的启动子(例如,无水四环素(aTc)-响应性启动子和其他四环素响应性启动子***,其包括四环素阻遏蛋白(tetR)、四环素操作序列(tetO)和四环素反式激活因子融合蛋白(tTA))、类固醇调控的启动子(例如,基于大鼠糖皮质激素受体、人***受体、蛾蜕皮激素受体的启动子以及来自类固醇/类视黄醇/甲状腺受体超家族的启动子)、金属调控的启动子(例如,衍生自来自酵母、小鼠和人的金属硫蛋白(结合并螯合金属离子的蛋白质)基因的启动子)、发病原调控的启动子(例如,由水杨酸、乙烯或苯并噻二唑(BTH)诱导的启动子)、温度/热诱导型启动子(例如,热休克启动子)和光调控的启动子(例如,来自植物细胞的光响应性启动子)。
在一些情况下,启动子是空间限制的启动子(即,细胞类型特异性启动子、组织特异性启动子等),使得在多细胞生物体中,启动子在特定细胞子组中是活性的(即,“ON”)。空间限制的启动子也可称为增强子、转录控制元件、控制序列等。可使用任何方便的空间限制的启动子,只要启动子在靶向宿主细胞(例如,真核细胞;原核细胞)中是功能性的即可。
在一些情况下,启动子是可逆启动子。合适的可逆启动子,包括可逆诱导型启动子,在本领域中是已知的。此类可逆启动子可分离自并衍生自许多生物体,例如真核生物和原核生物。用于第二生物体的衍生自第一生物体(例如,第一原核生物和第二真核生物、第一真核生物和第二原核生物等)的可逆启动子的修饰在本领域中是众所周知的。此类可逆启动子和基于此类可逆启动子但还包含另外的控制蛋白的***包括但不限于醇调控的启动子(例如,醇脱氢酶I(alcA)基因启动子、响应于醇反式激活因子蛋白(AlcR)的启动子等)、四环素调控的启动子(例如,包括Tet激活因子、TetON、TetOFF等的启动子***)、类固醇调控的启动子(例如,大鼠糖皮质激素受体启动子***、人***受体启动子***、类视黄醇启动子***、甲状腺启动子***、蜕皮激素启动子***、米非司酮启动子***等)、金属调控的启动子(例如,金属硫蛋白启动子***等)、发病原相关的调控启动子(例如,水杨酸调控的启动子、乙烯调控的启动子、苯并噻二唑调控的启动子等)、温度调控的启动子(例如,热休克诱导型启动子(例如,HSP-70、HSP-90、大豆热休克启动子等))、光调控的启动子、合成诱导型启动子等。
将核酸(例如,DNA或RNA)(例如,包含供体多核苷酸序列的核酸、一种或多种编码CasZ蛋白和/或CasZ指导RNA和/或CasZ trancRNA的核酸等)引入宿主细胞中的方法在本领域中是已知的,并且可使用任何方便的方法来将核酸(例如,表达构建体)引入细胞中。合适的方法包括例如病毒感染、转染、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米颗粒介导的核酸递送等。
将重组表达载体引入细胞中可在促进细胞存活的任何培养基中和任何培养条件下发生。将重组表达载体引入靶细胞中可在体内或离体进行。将重组表达载体引入靶细胞中可在体外进行。
在一些情况下,CasZ蛋白可作为RNA提供。RNA可通过直接化学合成提供,或者可在体外从DNA(例如,编码CasZ蛋白的DNA)转录。一旦合成,可通过用于将核酸引入细胞中的任何众所周知的技术(例如,微注射、电穿孔、转染等)将RNA引入细胞中。
可使用开发良好的转染技术(参见例如Angel和Yanik(2010)PLoS ONE 5(7):e11756);以及可从Qiagen商购获得的试剂、可从Stemgent商购获得的StemfectTM RNA转染试剂盒和可从Mirus Bio LLC商购获得的/>-mRNA转染试剂盒向细胞提供核酸。还参见Beumer等人(2008)PNAS 105(50):19821-19826。
可直接向靶宿主细胞提供载体。换句话讲,使细胞与包含主题核酸的载体(例如,具有供体模板序列并编码CasZ指导RNA的重组表达载体;编码CasZ蛋白的重组表达载体等)接触,使得载体被细胞吸收。用于使细胞与作为质粒的核酸载体接触的方法(包括电穿孔、氯化钙转染、微注射和脂质体转染)在本领域中是众所周知的。对于病毒载体递送,可使细胞与包含主题病毒表达载体的病毒颗粒接触。
逆转录病毒,例如慢病毒,适用于本公开的方法。通常使用的逆转录病毒载体是“缺陷型的”,即不能产生生产性感染所需要的病毒蛋白质。而且载体的复制需要在包装细胞系中生长。为了生成包含目标核酸的病毒颗粒,通过包装细胞系将包含核酸的逆转录病毒核酸包装到病毒衣壳中。不同的包装细胞系提供待并入衣壳中的不同包膜蛋白(嗜亲性、双嗜性或嗜异性),此包膜蛋白决定病毒颗粒对细胞的特异性(对鼠和大鼠的嗜亲性;对包括人、狗和小鼠的大多数哺乳动物细胞类型的双嗜性;以及对除了鼠细胞之外的大多数哺乳动物细胞类型的嗜异性)。适当的包装细胞系可用来确保细胞被包装的病毒颗粒靶向。将主题载体表达载体引入包装细胞系中以及采集由包装细胞系生成的病毒颗粒的方法在本领域中是众所周知的。还可通过直接微注射引入核酸(例如,RNA的注射)。
用于向靶宿主细胞提供编码CasZ指导RNA和/或CasZ多肽的核酸的载体可包括用于驱动目标核酸的表达(即,转录激活)的合适的启动子。换句话讲,在一些情况下,目标核酸将可操作地连接至启动子。所述启动子可包括遍在活化型启动子,例如CMV-β-肌动蛋白启动子;或诱导型启动子,诸如在特定细胞群中有活性或对药物(诸如四环素的)存在有响应的启动子。通过转录激活,预期转录将在靶细胞中与基础水平相比增加10倍、100倍、更通常地1000倍。另外,用于向细胞提供编码CasZ指导RNA和/或CasZ蛋白的核酸的载体可包含如下核酸序列,其在靶细胞中编码可选择标记以便鉴定已经吸收CasZ指导RNA和/或CasZ蛋白的细胞。
包含编码CasZ多肽或CasZ融合多肽的核苷酸序列的核酸在一些情况下是RNA。因此,可将CasZ融合蛋白以RNA的形式引入细胞中。将RNA引入细胞中的方法在本领域中是已知的并且可包括例如直接注射、转染或用于引入DNA的任何其他方法。CasZ蛋白可替代地以多肽的形式向细胞提供。这种多肽可任选地融合至增加产物溶解度的多肽结构域。所述结构域可通过限定的蛋白酶切割位点(例如,通过TEV蛋白酶切割的TEV序列)连接至多肽。接头还可包括一个或多个柔性序列,例如1至10个甘氨酸残基。在一些实施方案中,融合蛋白的切割在维持产物溶解度的缓冲液中进行,例如在0.5至2M尿素存在下、在增加溶解度的多肽和/或多核苷酸的存在下等进行。目标结构域包括核内体溶解结构域,例如流感HA结构域;和有助于产生的其他多肽,例如IF2结构域、GST结构域、GRPE结构域等。多肽可配制用于改进的稳定性。例如,肽可以是PEG化的,其中聚乙烯氧基提供在血流中的增加的寿命。
另外或可替代地,本公开的CasZ多肽可融合至多肽穿透结构域以促进被细胞吸收。许多穿透结构域在本领域中是已知的并且可用于本公开的非整合多肽,包括肽、肽模拟物和非肽运载体。例如,穿透肽可衍生自黑腹果蝇转录因子触角足基因(称为穿透蛋白)的第三α螺旋,所述第三α螺旋包含氨基酸序列RQIKIWFQNRRMKWKK(SEQ ID NO:134)。作为另一个实例,穿透肽包含HIV-1tat碱性区氨基酸序列,所述氨基酸序列可包括例如天然存在的tat蛋白的氨基酸49-57。其他穿透结构域包括聚精氨酸基序,例如HIV-1rev蛋白的氨基酸34-56的区域、九精氨酸、八精氨酸等。(参见例如Futaki等人(2003)Curr Protein PeptSci.2003年4月;4(2):87-9和446;以及Wender等人(2000)Proc.Natl.Acad.Sci.U.S.A2000年11月21日;97(24):13003-8;公布的美国专利申请20030220334;20030083256;20030032593;和20030022831,在此以引用方式明确地并入易位肽和类肽的教导内容中)。九精氨酸(R9)序列是已表征的更有效的PTD之一(Wender等人2000;Uemura等人2002)。可选择进行融合的位点以便优化多肽的生物活性、分泌或结合特征。将通过常规实验确定最佳位点。
本公开的CasZ多肽可在体外或通过真核细胞或通过原核细胞产生,并且它可通过解折叠(例如热变性、二硫苏糖醇还原等)进一步加工,并且可使用本领域已知的方法进一步再折叠。
不改变一级序列的目标修饰包括多肽的化学衍生化,例如酰化、乙酰化、羧化、酰胺化等。还包括糖基化的修饰,例如通过在多肽的合成和加工过程中或在进一步加工步骤中修饰多肽的糖基化形式而进行的那些修饰;例如通过将多肽暴露于影响糖基化的酶(诸如哺乳动物糖基化酶或脱糖基化酶)而进行的那些修饰。还涵盖具有磷酸化氨基酸残基例如磷酸酪氨酸、磷酸丝氨酸或磷酸苏氨酸的序列。
还适合包括在本公开的实施方案中的是核酸(例如,编码CasZ指导RNA、编码CasZ融合蛋白等的核酸)和蛋白质(例如,衍生自野生型蛋白质或变体蛋白质的CasZ融合蛋白),所述核酸和蛋白质已使用普通分子生物学技术和合成化学进行修饰,以便改进它们对蛋白水解降解的抗性,改变靶序列特异性,优化溶解特性,改变蛋白质活性(例如,转录调节活性、酶活性等)或使它们更合适。此类多肽的类似物包括含有除了天然存在的L-氨基酸之外的残基(例如,D-氨基酸或非天然存在的合成氨基酸)的那些多肽。D-氨基酸可取代一些或所有氨基酸残基。
可使用如本领域已知的常规方法,通过体外合成制备本公开的CasZ多肽。可使用各种商业合成装置,例如Applied Biosystems,Inc.、Beckman等的自动合成仪。通过使用合成仪,天然存在的氨基酸可被非天然氨基酸取代。制备的具体顺序和方式将通过方便性、经济性、所需纯度等来确定。
如果需要,可在合成过程中或在表达过程中将各种基团引入肽中,这允许连接至其他分子或表面。因此半胱氨酸可用来制备硫醚、组氨酸用于连接至金属离子络合物,羧基用于形成酰胺或酯,氨基用于形成酰胺等。
还可根据常规重组合成方法分离和纯化本公开的CasZ多肽。可由表达宿主制备裂解液,并且使用高效液相色谱法(HPLC)、排阻色谱法、凝胶电泳、亲和色谱法或其他纯化技术来纯化裂解液。大多数情况下,相对于与产物制备及其纯化的方法相关的污染物,所使用的组合物将占所需产物的20重量%或更多、更通常地75重量%或更多、优选地95重量%或更多,并且出于治疗目的通常为99.5重量%或更多。通常,百分数将基于总蛋白。因此,在一些情况下,本公开的CasZ多肽或CasZ融合多肽具有至少80%纯度、至少85%纯度、至少90%纯度、至少95%纯度、至少98%纯度或至少99%纯度(例如,不含污染物、非CasZ蛋白质或其他大分子等)。
为了诱导对靶核酸(例如,基因组DNA)的切割或任何所需的修饰,或对与靶核酸相关联的多肽的任何所需的修饰,可向细胞提供CasZ指导RNA和/或CasZ多肽和/或CasZtrancRNA和/或供体模板序列(无论它们作为核酸还是多肽引入)持续约30分钟至约24小时,例如1小时、1.5小时、2小时、2.5小时、3小时、3.5小时、4小时、5小时、6小时、7小时、8小时、12小时、16小时、18小时、20小时或约30分钟至约24小时的任何其他时间段,这可以约每天至约每4天的频率来重复,例如以每1.5天、每2天、每3天或约每天至约每四天的任何其他频率来重复。可一次或多次(例如一次、两次、三次或多于三次)向主题细胞提供一种或多种剂,并且在每次接触事件之后允许将细胞与所述一种或多种剂孵育持续一定时间量,例如16-24小时,在所述时间之后用新鲜培养基替代培养基并且进一步培养细胞。
在其中向细胞提供两种或更多种不同靶向复合物(例如,与相同或不同靶核酸内的不同序列互补的两种不同CasZ指导RNA)的情况下,可同时提供(例如,作为两种多肽和/或核酸)或同时递送所述复合物。可替代地,可连续提供复合物,例如首先提供靶向复合物,接着提供第二靶向复合物等,或反之亦然。
为了改进DNA载体向靶细胞的递送,可例如通过使用脂质复合物(lipoplex)和聚合复合物(polyplex)保护DNA免受损伤,并且促进DNA进入细胞中。因此,在一些情况下,本公开的核酸(例如,本公开的重组表达载体)可用有组织的结构(像胶束或脂质体)中的脂质覆盖。当有组织的结构与DNA复合时,它被称为脂质复合物。存在三种类型的脂质,阴离子脂质(带负电)、中性脂质或阳离子脂质(带正电)。利用阳离子脂质的脂质复合物已被证明可用于基因转移。阳离子脂质由于其正电荷,与带负电的DNA天然复合。同样由于它们的电荷,它们与细胞膜相互作用。然后发生脂质复合物的内吞作用,并且将DNA释放到细胞质中。阳离子脂质还可防止细胞对DNA的降解。
聚合物与DNA的复合物称为聚合复合物。大多数聚合复合物由阳离子聚合物组成,并且它们的产生由离子相互作用调控。聚合复合物与脂质复合物的作用方法之间的一个巨大差异是聚合复合物不能将其DNA负载释放到细胞质中,为此,必须发生与内体溶解剂(溶解内吞作用期间产生的内体)诸如灭活的腺病毒共转染。然而,并非总是如此;诸如聚乙烯亚胺的聚合物与壳聚糖和三甲基壳聚糖一样,都有自己的内体破坏方法。
树枝状聚合物,一种球形的高度支化的大分子,也可用于遗传修饰干细胞。树枝状聚合物颗粒的表面可被官能化以改变其特性。具体地,可能构建阳离子树枝状聚合物(即,具有正表面电荷的树枝状聚合物)。当存在遗传物质(诸如DNA质粒)时,电荷互补性导致核酸与阳离子树枝状聚合物的暂时缔合。树枝状聚合物-核酸复合物在到达其目的地时,可通过内吞作用被吸收到细胞中。
在一些情况下,本公开的核酸(例如,表达载体)包含目标指导序列的***位点。例如,核酸可包含目标指导序列的***位点,其中所述***位点紧邻编码CasZ指导RNA的部分的核苷酸序列,当指导序列被改变而与所需靶序列(例如,有助于指导RNA的CasZ结合方面的序列,例如,有助于CasZ指导RNA的一个或多个dsRNA双链体的序列-指导RNA的这个部分也可称为指导RNA的‘支架’或‘恒定区’)杂交时,CasZ指导RNA的所述部分不会改变。因此,在一些情况下,主题核酸(例如,表达载体)包含编码CasZ指导RNA的核苷酸序列,不同的是编码指导RNA的指导序列部分的部分是***序列(***位点)。***位点是用于***所需序列的任何核苷酸序列。用于各种技术的“***位点”是本领域的普通技术人员已知的,并且可使用任何方便的***位点。***位点可用于操纵核酸序列的任何方法。例如,在一些情况下,***位点是多克隆位点(MCS)(例如,包含一个或多个限制性酶识别序列的位点),用于不依赖于连接的克隆的位点,用于基于重组的克隆(例如,基于att位点的重组)的位点,由基于CRISPR/Cas(例如Cas9)的技术识别的核苷酸序列等。
***位点可以是任何期望的长度,并且可取决于***位点的类型(例如,可取决于位点是否包含一个或多个限制性酶识别序列(以及包含多少限制性酶识别序列),位点是否包括CRISPR/Cas蛋白的靶位点等)。在一些情况下,主题核酸的***位点的长度为3个或更多个核苷酸(nt)(例如,长度为5个或更多个、8个或更多个、10个或更多个、15个或更多个、17个或更多个、18个或更多个、19个或更多个、20个或更多个、或者25个或更多个、或者30个或更多个nt)。在一些情况下,主题核酸的***位点的长度具有在2至50个核苷酸(nt)的范围内(例如,2至40个nt、2至30个nt、2至25个nt、2至20个nt、5至50个nt、5至40个nt、5至30个nt、5至25个nt、5至20个nt、10至50个nt、10至40个nt、10至30个nt、10至25个nt、10至20个nt、17至50个nt、17至40个nt、17至30个nt、17至25个nt)的长度。在一些情况下,主题核酸的***位点的长度具有在5至40个nt的范围内的长度。
核酸修饰
在一些实施方案中,主题核酸(例如,CasZ指导RNA或trancRNA)具有一个或多个修饰(例如,碱基修饰、骨架修饰等)以对核酸提供新的或增强的特征(例如,改进的稳定性)。核苷是碱基-糖组合。核苷的碱基部分通常是杂环碱基。此类杂环碱基的两个最常见类别是嘌呤和嘧啶。核苷酸是还包含共价连接至核苷的糖部分的磷酸酯基团的核苷。对于包含戊呋喃糖的那些核苷,磷酸酯基团可连接至糖的2'、3'或5'羟基部分。在形成寡核苷酸中,磷酸酯基团共价连接彼此相邻的核苷以形成线性聚合化合物。继而,此线性聚合化合物的各端可进一步连接以形成环状化合物,然而,线性化合物是合适的。另外,线性化合物可具有内部核苷酸碱基互补性并且因此可以为了产生完全或部分双链化合物的方式折叠。在寡核苷酸内,磷酸酯基团通常被称为形成寡核苷酸的核苷间骨架。RNA和DNA的正常键或骨架是3'到5'的磷酸二酯键。
合适的核酸修饰包括但不限于:2'O甲基修饰的核苷酸、2'氟修饰的核苷酸、锁核酸(LNA)修饰的核苷酸、肽核酸(PNA)修饰的核苷酸、具有硫代磷酸酯键的核苷酸和5'帽(例如,7-甲基鸟苷酸帽(m7G))。下文描述另外的细节和另外的修饰。
2'-O-甲基修饰的核苷酸(也称为2'-O-甲基RNA)是在tRNA和其他小RNA中发现的天然存在的RNA修饰,其作为转录后修饰而出现。可直接合成含有2'-O-甲基RNA的寡核苷酸。这种修饰增加RNA:RNA双链体的Tm,但仅导致RNA:DNA稳定性的微小变化。它对于单链核糖核酸酶的攻击是稳定的,并且对DNA酶的易感性通常是DNA的5至10倍低。它通常用于反义寡核苷酸中,作为增加稳定性和对于靶信使的结合亲和力的手段。
2'氟修饰的核苷酸(例如,2'氟碱基)具有氟修饰的核糖,其增加结合亲和力(Tm)并且与天然RNA相比还赋予一定程度的相对核酸酶抗性。这些修饰通常用于核酶和siRNA中以改进在血清或其他生物体液中的稳定性。
LNA碱基具有对核糖骨架的修饰,其将碱基锁定在C3'-内部位置,这有利于RNA A型螺旋双链体几何结构。这种修饰显著增加Tm并且还具有非常强的核酸酶抗性。可将多个LNA***置于寡核苷酸中的除了3'末端之外的任何位置。已经描述了从反义寡核苷酸到杂交探针到SNP检测和等位基因特异性PCR的应用。由于LNA赋予Tm的大量增加,它们还可引起引物二聚体形成以及自发夹的形成的增加。在一些情况下,并入单个寡核苷酸中的LNA的数量是10个碱基或更少。
硫代磷酸酯(PS)键(即,硫代磷酸酯键联)用硫原子取代核酸(例如,寡核苷酸)的磷酸酯骨架中的非桥接氧。这种修饰使得核苷酸间键对核酸酶降解具有抗性。可在寡核苷酸的5'或3'末端的最后3-5个核苷酸之间引入硫代磷酸酯键以抑制外切核酸酶降解。在寡核苷酸内(例如,在整个寡核苷酸中)包含硫代磷酸酯键也可帮助减少内切核酸酶的攻击。
在一些实施方案中,主题核酸具有一个或多个核苷酸,所述一个或多个核苷酸是2'-O-甲基修饰的核苷酸。在一些实施方案中,主题核酸(例如,指导RNA、tranc RNA等)具有一个或多个2'氟修饰的核苷酸。在一些实施方案中,主题核酸(例如,dsRNA、siNA等)具有一个或多个LNA碱基。在一些实施方案中,主题核酸(例如,dsRNA、siNA等)具有通过硫代磷酸酯键连接的一个或多个核苷酸(即,主题核酸具有一个或多个硫代磷酸酯键联)。在一些实施方案中,主题核酸(例如,dsRNA、siNA等)具有5'帽(例如,7-甲基鸟苷酸帽(m7G))。在一些实施方案中,主题核酸(例如,指导RNA、tranc RNA等)具有修饰的核苷酸的组合。例如,除具有一个或多个具有其他修饰的核苷酸(例如,2'-O-甲基核苷酸和/或2'氟修饰的核苷酸和/或LNA碱基和/或硫代磷酸酯键联)之外,主题核酸(例如,指导RNA、tranc RNA等)可具有5'帽(例如,7-甲基鸟苷酸帽(m7G))。
修饰的骨架和修饰的核苷间键联
含有修饰的合适的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)的实例包括含有修饰的骨架或非天然的核苷间键联的核酸。具有修饰的骨架的核酸包括在骨架中保留磷原子的那些核酸和在骨架中不具有磷原子的那些核酸。
其中含有磷原子的合适的修饰的寡核苷酸骨架包括例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基磷酸酯(包括3'-亚烷基磷酸酯、5'-亚烷基磷酸酯和手性磷酸酯)、次膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、二氨基磷酸酯、硫羰氨基磷酸酯、硫羰烷基磷酸酯、硫羰烷基磷酸三酯,具有正常3'-5'键联的硒代磷酸酯和硼代磷酸酯、这些物质的2'-5'连接类似物以及具有反极性的那些寡核苷酸骨架,其中一个或多个核苷酸间键联为3'至3'、5'至5'或2'至2'键联。具有反极性的合适的寡核苷酸在最3'核苷酸间键处包含单个3'至3'键联,即可为碱性(核碱基丢失或其被羟基替代)的单个反核苷残基。还包括各种盐(例如像钾或钠)、混合盐和游离酸形式。
在一些实施方案中,主题核酸包含一个或多个硫代磷酸酯和/或杂原子核苷间键联,具体地是-CH2-NH-O-CH2-、-CH2-N(CH3)-O-CH2-(称为亚甲基(甲基亚氨基)或MMI骨架)、-CH2-O-N(CH3)-CH2-、-CH2-N(CH3)-N(CH3)-CH2-和-O-N(CH3)-CH2-CH2-(其中天然磷酸二酯核苷酸间键联表示为-O-P(=O)(OH)-O-CH2-)。MMI型核苷间键联公开于上文提及的美国专利号5,489,677中,所述专利的公开内容以引用方式整体并入本文。合适的酰胺核苷间键联公开于美国专利号5,602,240中,所述专利的公开内容以引用方式整体并入本文。
还合适的是具有吗啉代骨架结构的核酸,如例如美国专利号5,034,506中所述。例如,在一些实施方案中,主题核酸包含替代核糖环的6元吗啉代环。在这些实施方案的一些实施方案中,二氨基磷酸酯或其他非磷酸二酯核苷间键联替代磷酸二酯键联。
其中不包含磷原子的合适的修饰的多核苷酸骨架具有通过短链烷基或环烷基核苷间键联、混合杂原子和烷基或环烷基核苷间键联或一个或多个短链杂原子或杂环核苷间键联形成的骨架。这些包括:具有吗啉代键联(部分地由核苷的糖部分形成)的那些骨架;硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;核糖乙酰基(riboacetyl)骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚胺基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰氨骨架;以及具有混合的N、O、S和CH2组成部分的其他骨架。
模拟物
主题核酸可以是核酸模拟物。当对多核苷酸应用术语“模拟物”时意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间键联两者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环替代在本领域中也称为糖替代。维持杂环碱基部分或修饰的杂环碱基部分用于与适当的靶核酸的杂交。一种这样的核酸(已显示出具有优良杂交特性的多核苷酸模拟物)称为肽核酸(PNA)。在PNA中,多核苷酸的糖骨架被含酰胺的骨架替代,具体地被氨基乙基甘氨酸骨架替代。核苷酸被保留下来并且直接或间接键合至骨架的酰胺部分的氮杂氮原子。
已报道具有优良杂交特性的一种多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的骨架是给予PNA含酰胺骨架的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分直接或间接键合至骨架的酰胺部分的氮杂氮原子。描述PNA化合物制备的代表性美国专利包括但不限于:美国专利号5,539,082;5,714,331;和5,719,262,所述专利的公开内容以引用方式整体并入本文。
已研究的另一类多核苷酸模拟物基于具有连接至吗啉代环的杂环碱基的连接吗啉代单元(吗啉代核酸)。已报道连接吗啉代核酸中的吗啉代单体单元的许多连接基团。已选择一类连接基团来得到非离子型低聚化合物。基于非离子型吗啉代的低聚化合物不太可能与细胞蛋白质有不期望的相互作用。基于吗啉代的多核苷酸是不太可能与细胞蛋白质形成不期望的相互作用的寡核苷酸的非离子型模拟物(Dwaine A.Braasch和David R.Corey,Biochemistry,2002,41(14),4503-4510)。基于吗啉代的多核苷酸公开于美国专利号5,034,506中,所述专利的公开内容以引用方式整体并入本文。已制备了吗啉代类多核苷酸内的多种化合物,所述化合物具有连接单体亚单元的多种不同的连接基团。
另一类多核苷酸模拟物称为环己烯基核酸(CeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环替代。已制备了CeNA DMT保护的亚磷酰胺单体并且用于根据经典亚磷酰胺化学性质的低聚化合物合成。已制备并且研究了完全修饰的CeNA低聚化合物和具有用CeNA修饰的特异性位置的寡核苷酸(参见Wang等人,J.Am.Chem.Soc.,2000,122,8595-8602,其公开内容以引用方式整体并入本文)。一般来讲,CeNA单体并入DNA链中增加了DNA/RNA杂交体的稳定性。CeNA寡腺苷酸与RNA和DNA互补序列形成具有与天然复合物相似的稳定性的复合物。通过NMR和圆二色性示出将CeNA结构并入天然核酸结构中的研究以继续进行简单的构象调整。
另一种修饰包括锁核酸(LNA),其中2'-羟基连接至糖环的4'碳原子从而形成2'-C、4'-C-氧基亚甲基键联,从而形成双环糖部分。所述键可以是亚甲基(-CH2-),即桥接2’氧原子和4'碳原子的基团,其中n为1或2(Singh等人,Chem.Commun.,1998,4,455-456,其公开内容以引用方式整体并入本文)。LNA和LNA类似物显现出与互补DNA和RNA具有非常高的双链体热稳定性(Tm=+3℃至+10℃)、朝向3'-核酸外切降解的稳定性和良好的溶解特性。已经描述了含有LNA的有效且无毒的反义寡核苷酸(例如Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638,其公开内容以引用方式整体并入本文)。
已描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基-胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备连同其低聚化以及核酸识别特性(例如,Koshkin等人,Tetrahedron,1998,54,3607-3630,其公开内容以引用方式整体并入本文)。LNA及其制备也描述于WO 98/39352和WO 99/14226以及美国申请20120165514、20100216983、20090041809、20060117410、20040014959、20020094555和20020086998中,所述专利的公开内容以引用方式整体并入本文。
修饰的糖部分
主题核酸还可包含一个或多个取代的糖部分。合适的多核苷酸包含选自以下的糖取代基团:OH;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。特别合适的是:O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其他合适的多核苷酸包含选自以下的糖取代基团:C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷氨基、聚烷氨基、取代的硅烷基、RNA切割基团、报告基团、嵌入剂、改进寡核苷酸的药物代谢动力学特性的基团、或改进寡核苷酸的药效动力学特性的基团,以及其他具有相似特性的取代基。合适的修饰包括2'-甲氧基乙氧基(2'-O-CH2 CH2OCH3,又称为2'-O-(2-甲氧基乙基)或2'-MOE)(Martin等人,Helv.Chim.Acta,1995,78,486-504,其公开内容以引用方式整体并入本文),即烷氧基烷氧基。另外合适的修饰包括2'-二甲基氨基氧基乙氧基,即O(CH2)2ON(CH3)2基团,又称为2'-DMAOE,如在下文的实施例中所述;和2'-二甲基氨基乙氧基乙氧基(在本领域中又称为2'-O-二甲基-氨基-乙氧基-乙基或2'-DMAEOE),即2'-O-CH2-O-CH2-N(CH3)2
其他合适的糖取代基团包括甲氧基(-O-CH3)、氨基丙氧基(--OCH2CH2CH2NH2)、烯丙基(-CH2-CH=CH2)、-O-烯丙基(--O--CH2—CH=CH2)和氟(F)。2'-糖取代基团可处于***糖(上)位或核糖(下)位。合适的2'-***糖修饰是2'-F。还可在低聚化合物上的其他位置上做出相似的修饰,具体地在糖的3'末端核苷上或在2'-5'连接的寡核苷酸中的3'位置以及5'末端核苷酸的5'位置。低聚化合物还可具有替代呋喃戊糖的糖模拟物,诸如环丁基部分。
碱基修饰和取代
主题核酸还可包括核碱基(在本领域中常常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G)以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其他合成和天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代基、8-氨基、8-巯基、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤代基(具体为5-溴代基)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。另外的修饰的核碱基包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G-夹诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3',2':4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可包括其中嘌呤或嘧啶碱基被其他杂环替代的那些碱基,例如7-脱氮腺嘌呤、7-脱氮鸟苷、2-氨基吡啶和2-吡啶酮。另外的核碱基包括公开于美国专利号3,687,808中的那些、公开于The Concise Encyclopedia Of Polymer Science AndEngineering,第858-859页,Kroschwitz,J.I.编John Wiley&Sons,1990中的那些、由Englisch等人,Angewandte Chemie,International Edition,1991,30,613公开的那些以及由Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页,Crooke,S.T.和Lebleu,B.编,CRC Press,1993公开的那些,这些文献的公开内容以引用方式整体并入本文。这些核碱基中的某些可用于增加低聚化合物的结合亲和力。这些包括5-取代的嘧啶,6-氮杂嘧啶以及N-2、N-6和O-6取代的嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示出使核酸双链体稳定性增加0.6℃-1.2℃(Sanghvi等人编Antisense Research and Applications,CRC Press,Boca Raton,1993,第276-278页;其公开内容以引用方式整体并入本文)并且例如当与2'-O-甲氧基乙基糖修饰组合时是适合的碱基取代。
缀合物
主题核酸的另一种可能的修饰涉及将增强寡核苷酸的活性、细胞分布或细胞吸收的一个或多个部分或缀合物化学连接至多核苷酸。这些部分或缀合物可包括共价键合至诸如伯羟基或仲羟基的官能团的缀合物基团。缀合物基团包括但不限于嵌入剂、报告分子、多胺、聚酰胺、聚乙二醇、聚醚、增强低聚物的药效动力学特性的基团以及增强低聚物的药物代谢动力学特性的基团。合适的缀合物基团包括但不限于胆固醇、脂质、磷脂、生物素、吩嗪、叶酸酯、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素以及染料。增强药效动力学特性的基团包括改进吸收、增强对降解的抗性和/或加强与靶核酸的序列特异性杂交的基团。增强药物代谢动力学特性的基团包括改进主题核酸的吸收、分布、代谢或***的基团。
缀合物部分包括但不限于脂质部分,诸如胆固醇部分(Letsinger等人,Proc.Natl.Acad.Sci.USA,1989,86,6553-6556)、胆酸(Manoharan等人,Bioorg.Med.Chem.Let.,1994,4,1053-1060)、硫醚例如己基-S-三苯甲基硫醇(Manoharan等人,Ann.N.Y.Acad.Sci.,1992,660,306-309;Manoharan等人,Bioorg.Med.Chem.Let.,1993,3,2765-2770)、巯基胆固醇(Oberhauser等人,Nucl.Acids Res.,1992,20,533-538)、脂族链例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人,EMBO J.,1991,10,1111-1118;Kabanov等人,FEBS Lett.,1990,259,327-330;Svinarchuk等人,Biochimie,1993,75,49-54)、磷脂例如二-十六烷基-外消旋-甘油或三乙铵1,2-二-O-十六烷基-外消旋-甘油-3-H-磷酸酯(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654;Shea等人,Nucl.Acids Res.,1990,18,3777-3783)、多胺或聚乙二醇链(Manoharan等人,Nucleosides&Nucleotides,1995,14,969-973),或金刚烷乙酸(Manoharan等人,Tetrahedron Lett.,1995,36,3651-3654),棕榈基部分(Mishra等人,Biochim.Biophys.Acta,1995,1264,229-237),或十八烷基胺或己基氨基-羰基-羟基胆固醇部分(Crooke等人,J.Pharmacol.Exp.Ther.,1996,277,923-937)。
缀合物可包括“蛋白转导结构域”或PTD(又称为CPP–细胞穿透肽),其可指促进横穿脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机化合物或无机化合物。连接至另一个分子(所述分子可在小极性分子至大的高分子和/或纳米颗粒的范围内)的PTD促进分子横穿膜,例如从细胞外空间进入细胞内空间或从胞质溶胶进入细胞器(例如,细胞核)内。在一些实施方案中,PTD与外源多核苷酸的3'末端共价连接。在一些实施方案中,PTD与外源多核苷酸的5'末端共价连接。示例性PTD包括但不限于最小十一氨基酸多肽蛋白转导结构域(对应于包含YGRKKRRQRRR;SEQ ID NO:130的HIV-1TAT的残基47-57);包含足以直接进入细胞中的数量的精氨酸(例如,3个、4个、5个、6个、7个、8个、9个、10个或10-50个精氨酸)的聚精氨酸序列;VP22结构域(Zender等人(2002)Cancer GeneTher.9(6):489-96);果蝇触角足基因蛋白转导结构域(Noguchi等人(2003)Diabetes 52(7):1732-1737);截短的人降钙素肽(Trehin等人(2004)Pharm.Research 21:1248-1256);聚赖氨酸(Wender等人(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008);RRQRRTSKLMKRSEQ ID NO:131);运输蛋白GWTLNSAGYLLGKINLKALAALAKKIL SEQ ID NO:132);KALAWEAKLAKALAKALAKHLAKALAKALKCEA SEQ ID NO:133);和RQIKIWFQNRRMKWKK SEQ ID NO:134)。示例性PTD包括但不限于:YGRKKRRQRRR SEQ ID NO:130);RKKRRQRRR SEQ ID NO:135);具有3个精氨酸残基至50个精氨酸残基的精氨酸均聚物;示例性PTD结构域氨基酸序列包括但不限于以下序列中的任一个:YGRKKRRQRRR SEQ ID NO:130);RKKRRQRR SEQ ID NO:136);YARAAARQARA SEQ ID NO:137);THRLPRRRRRR SEQ ID NO:138);和GGRRARRRRRR SEQ IDNO:139)。在一些情况下,PTD是可激活的CPP(ACPP)(Aguilera等人(2009)Integr Biol(Camb)6月;1(5-6):371-381)。ACPP包括经由可切割接头连接至匹配聚阴离子(例如,Glu9或“E9”)的聚阳离子CPP(例如,Arg9或“R9”),这使净电荷减小至接近零并由此抑制粘附和吸收到细胞中。当切割接头时,释放聚阴离子,局部暴露聚精氨酸和其固有的粘附性,从而“激活”ACPP以横穿膜。
将组分引入靶细胞中
CasZ指导RNA(或包含编码CasZ指导RNA的核苷酸序列的核酸)和/或CasZ多肽(或包含编码CasZ多肽的核苷酸序列的核酸)和/或CasZ trancRNA(或包含编码CasZ trancRNA的核苷酸序列的核酸)和/或供体多核苷酸(供体模板)可通过多种众所周知的方法的任一种方法引入宿主细胞中。
可使用多种化合物和方法中的任一种化合物和方法将本公开的CasZ***递送至靶细胞。作为非限制性实例,本公开的CasZ***可与脂质组合。作为另一个非限制性实例,本公开的CasZ***可与颗粒组合或配制成颗粒。
将核酸引入宿主细胞中的方法在本领域中是已知的,并且可使用任何方便的方法来将主题核酸(例如,表达构建体/载体)引入靶细胞(例如,原核细胞、真核细胞、植物细胞、动物细胞、哺乳动物细胞、人细胞等)中。合适的方法包括例如病毒感染、转染、缀合、原生质体融合、脂质体转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接微注射、纳米颗粒介导的核酸递送(参见例如,Panyam等人Adv Drug Deliv Rev.2012年9月13日.pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023)等。
在一些情况下,本公开的CasZ多肽(例如,野生型蛋白、变体蛋白、嵌合/融合蛋白、dCasZ等)作为编码CasZ多肽的核酸(例如,mRNA、DNA、质粒、表达载体、病毒载体等)提供。在一些情况下,本公开的CasZ多肽直接作为蛋白质(例如,不与相关联的指导RNA一起或与相关联的指导RNA一起,即作为核糖核蛋白复合物)提供。可通过任何方便的方法将本公开的CasZ多肽引入细胞中(提供至细胞);此类方法是本领域的普通技术人员已知的。作为说明性实例,可将本公开的CasZ融合多肽直接注射到细胞中(例如,与或不与CasZ指导RNA或编码CasZ指导RNA的核酸一起,并且与或不与供体多核苷酸一起,并且与或不与CasZtrancRNA一起)。作为另一个实例,可将本公开的CasZ多肽和CasZ指导RNA的预先形成的复合物(RNP)引入细胞(例如,真核细胞)中(例如,通过注射、通过核转染;通过缀合至一种或多种组分的蛋白转导结构域(PTD),例如缀合至CasZ蛋白、缀合至指导RNA、缀合至CasZtrancRNA、缀合至本公开的CasZ多肽和指导RNA;等)。
在一些情况下,将核酸(例如,CasZ指导RNA和/或编码CasZ指导RNA的核酸、编码CasZ蛋白的核酸、CasZ trancRNA和/或编码CasZ trancRNA的核酸等)和/或多肽(例如,CasZ多肽;CasZ融合多肽)递送至颗粒中的或与颗粒缔合的细胞(例如,靶宿主细胞)。在一些情况下,将本公开的CasZ***递送至颗粒中的或与颗粒缔合的细胞。术语“颗粒”和“纳米颗粒”可适当地互换使用。例如,包含编码本公开的CasZ多肽的核苷酸序列和/或CasZ指导RNA的重组表达载体、包含编码本公开的CasZ多肽的核苷酸序列的mRNA以及指导RNA可使用颗粒或脂质包膜同时递送;例如,CasZ多肽和CasZ指导RNA和/或trancRNA,例如作为复合物(例如,核糖核蛋白(RNP)复合物)可通过颗粒递送,例如通过包含脂质或类脂质以及亲水性聚合物(例如,阳离子脂质和亲水聚合物)的递送颗粒递送,例如,其中阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四烷酰基-sn-甘油基-3-磷酸胆碱(DMPC)并且/或者其中亲水性聚合物包括乙二醇或聚乙二醇(PEG);并且/或者其中颗粒还包含胆固醇(例如,来自制剂1的颗粒=DOTAP 100、DMPC 0、PEG 0、胆固醇0;制剂编号2=DOTAP90、DMPC 0、PEG 10、胆固醇0;制剂编号3=DOTAP 90、DMPC 0、PEG 5、胆固醇5)。例如,可使用多步骤方法形成颗粒,其中将CasZ多肽和CasZ指导RNA例如以1:1的摩尔比、例如在室温下、例如持续30分钟、例如在无菌无核酸酶的1x磷酸盐缓冲盐水(PBS)中混合在一起;并且将适用于制剂的DOTAP、DMPC、PEG和胆固醇单独地溶于醇(例如,100%乙醇),并且将两种溶液混合在一起以形成含有复合物的颗粒)。
本公开的CasZ多肽(或包含编码本公开的CasZ多肽的核苷酸序列的mRNA;或包含编码本公开的CasZ多肽的核苷酸序列的重组表达载体)和/或CasZ指导RNA(或核酸,诸如一种或多种编码CasZ指导RNA的表达载体)可使用颗粒或脂质包膜同时递送。例如,可使用具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核的可生物降解的核壳结构的纳米颗粒。在一些情况下,使用基于自组装生物粘附聚合物的颗粒/纳米颗粒;此类颗粒/纳米颗粒可应用于肽的口服递送、肽的静脉内递送和肽的鼻内递送,例如递送至脑。还考虑了其他实施方案,诸如疏水性药物的口服吸收和眼部递送。可使用分子包膜技术,其涉及受保护并递送至疾病部位的工程化聚合物包膜。可以单剂量或多剂量使用约5mg/kg的剂量,这取决于各种因素,例如靶组织。
类脂质化合物(例如,如美国专利申请20110293703中所述)也可用于多核苷酸的施用,并且可用于递送本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ***。在一方面,将氨基醇类脂质化合物与待递送至细胞或受试者的剂组合以形成微颗粒、纳米颗粒、脂质体或胶束。氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等组合以形成颗粒。然后可任选地将这些颗粒与药物赋形剂组合以形成药物组合物。
聚(β-氨基醇)(PBAA)可用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。美国专利公开号20130302401涉及使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。
可使用基于糖的颗粒,例如,如参考WO2014118272(以引用方式并入本文)和Nair,J K等人,2014,Journal of the American Chemical Society 136(49),16958-16961)所述的GalNAc可用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ***递送至靶细胞。
在一些情况下,使用脂质纳米颗粒(LNP)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。带负电的聚合物(诸如RNA)可在低pH值(例如,pH 4)下装载到LNP中,其中可电离的脂质显示正电荷。然而,在生理pH值下,LNP表现出与较长的循环时间相容的低表面电荷。已经关注了四种可电离的阳离子脂质,即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)和1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。LNP的制备描述于例如Rosin等人(2011)Molecular Therapy19:1286-2200)中。可使用阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2”-(甲氧基聚乙二醇2000)琥珀酰基]-1,2-二肉豆蔻酰基-sn-乙二醇(PEG-S-DMG),以及R-3-[(.ω.-甲氧基-聚(乙二醇)2000)氨甲酰基]-1,2-二肉豆蔻酰氧基丙基-3-胺(PEG-C-DOMG)。核酸(例如,CasZ指导RNA;本公开的核酸等)可包封在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG的摩尔比为40:10:40:10)的LNP中。在一些情况下,并入0.2% SP-DiOC18。
球形核酸(SNATM)构建体和其他纳米颗粒(特别是金纳米颗粒)可用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。参见例如Cutler等人,J.Am.Chem.Soc.2011 133:9254-9257;Hao等人,Small.2011 7:3158-3162;Zhang等人,ACSNano.2011 5:6962-6970;Cutler等人,J.Am.Chem.Soc.2012134:1376-1391;Young等人,Nano Lett.2012 12:3867-71;Zheng等人,Proc.Natl.Acad.Sci.USA.2012 109:11975-80;Mirkin,Nanomedicine 2012 7:635-638;Zhang等人,J.Am.Chem.Soc.2012 134:16488-1691;Weintraub,Nature 2013 495:S14-S16;Choi等人,Proc.Natl.Acad.Sci.USA.2013110(19):7625-7630;Jensen等人,Sci.Transl.Med.5,209ra152(2013)和Mirkin,等人,Small,10:186-192。
具有RNA的自组装纳米颗粒可用聚乙烯亚胺(PEI)构建,所述聚乙烯亚胺(PEI)用连接在聚乙二醇(PEG)远端处的Arg-Gly-Asp(RGD)肽配体PEG化。
一般来讲,“纳米颗粒”是指具有小于1000nm的直径的任何颗粒。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞的纳米颗粒具有500nm或更小,例如,25nm至35nm、35nm至50nm、50nm至75nm、75nm至100nm、100nm至150nm、150nm至200nm、200nm至300nm、300nm至400nm或400nm至500nm的直径。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ***递送至靶细胞的纳米颗粒具有25nm至200nm的直径。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ***递送至靶细胞的纳米颗粒具有100nm或更小的直径。在一些情况下,适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸或本公开的CasZ***递送至靶细胞的纳米颗粒具有35nm至60nm的直径。
适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞的纳米颗粒可以不同的形式提供,例如,作为固体纳米颗粒(例如,金属(诸如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、纳米颗粒的悬浮液或它们的组合提供。可制备金属、介电和半导体纳米颗粒,以及混合结构(例如,核壳纳米颗粒)。如果由半导体材料制成的纳米颗粒足够小(通常低于10nm)以致发生电子能级的量子化,则也可将它们标记量子点。此类纳米级颗粒在生物医学应用中用作药物运载体或成像剂,并且可适用于本公开中的相似目的。
半固体和软纳米颗粒也适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。具有半固体性质的原型纳米颗粒是脂质体。
在一些情况下,使用外泌体将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。外泌体是内源性纳米囊泡,其运输RNA和蛋白质,并且可将RNA递送至脑和其他靶器官。
在一些情况下,使用脂质体将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。脂质体是球形囊泡结构,其由围绕内部水性隔室的单层或多层脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可由若干种不同类型的脂质制成;然而,磷脂最常用于生成脂质体。尽管当脂质膜与水性溶液混合时,脂质体形成是自发的,但是也可通过使用匀化器、超声波破碎仪或挤出装置以摇动的形式施加力来加速脂质体的形成。可将若干种其他添加剂添加到脂质体中以便改变它们的结构和特性。例如,可将胆固醇或鞘磷脂添加到脂质体混合物中,以便帮助稳定脂质体结构并防止脂质体内容物(inner cargo)的泄漏。脂质体制剂可主要由以下组成:天然磷脂和脂质,诸如1,2-二硬脂酰基-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂。
可使用稳定的核酸-脂质颗粒(SNALP)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。SNALP制剂可含有2:40:10:48摩尔百分比的脂质3-N-[(甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇。可通过使用25:1的脂质/siRNA比和48/40/10/2摩尔比的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA来配制D-Lin-DMA和PEG-C-DMA以及二硬脂酰基磷脂酰胆碱(DSPC)、胆固醇和siRNA来制备SNALP脂质体。所得的SNALP脂质体的尺寸可以是约80-100nm。SNALP可包含合成胆固醇(Sigma-Aldrich,St Louis,Mo.,USA)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids,Alabaster,Ala.,USA)、3-N-[(w-甲氧基聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰氧基丙胺和阳离子1,2-二亚油基氧基-3-N,N二甲基氨基丙烷。SNALP可以包含合成胆固醇(Sigma-Aldrich)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC;Avanti Polar LipidsInc.)、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)。
可使用其他阳离子脂质诸如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。可考虑具有以下脂质组成的预成形的囊泡:摩尔比分别为40/10/40/10的并且FVII siRNA/总脂质比为大约0.05(w/w)的氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基氨基甲酸酯(PEG-脂质)。为了确保在70-90nm范围内的窄粒径分布和0.11.+-.0.04(n=56)的低多分散指数,可在添加指导RNA之前将颗粒通过80nm膜挤出最高达三次。可使用含有高效氨基脂质16的颗粒,其中四种脂质组分16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)可进一步优化以增强体内活性。
脂质可用本公开的CasZ***或其一种或多种组分或编码其的核酸配制以形成脂质纳米颗粒(LNP)。合适的脂质包括但不限于DLin-KC2-DMA4、C12-200和辅脂质(colipid)二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG可用本公开的CasZ***或其组分使用自发的囊泡形成程序配制。组分摩尔比可以是约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。
本公开的CasZ***或其组分可包封在PLGA微球中递送,所述微球诸如在美国公布申请20130252281和20130245107和20130244279中进一步描述的微球。
可使用超电荷蛋白将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。超电荷蛋白是一类工程化或天然存在的蛋白质,其具有异常高的正或负净理论电荷。超负电荷蛋白和超正电荷蛋白均表现出耐受热或化学诱导的聚集的能力。超正电荷蛋白也能够穿透哺乳动物细胞。使货物与这些蛋白质(诸如质粒DNA、RNA或其他蛋白质)缔合可实现这些大分子在体外和体内向哺乳动物细胞的功能性递送。
可使用细胞穿透肽(CPP)将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞。CPP通常具有以下氨基酸组成,其含有高相对丰度的带正电荷的氨基酸(诸如赖氨酸或精氨酸),或者具有含有极性/带电荷氨基酸和非极性疏水氨基酸的交替模式的序列。
可使用可植入装置将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)(例如,CasZ指导RNA、编码CasZ指导RNA的核酸、编码CasZ多肽的核酸、供体模板等)或本公开的CasZ***递送至靶细胞(例如,体内靶细胞,其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)。适用于将本公开的CasZ多肽、本公开的CasZ融合多肽、本公开的RNP、本公开的核酸(例如,CasZ指导RNA和/或CasZ trancRNA)或本公开的CasZ***递送至靶细胞(例如,体内靶细胞,其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)的可植入装置可包括容器(例如,储库、基质等),所述容器包含CasZ多肽、CasZ融合多肽、RNP或CasZ***(或其组分,例如本公开的核酸)。
合适的可植入装置可包括例如用作装置主体的聚合物基底(诸如基质),并且在一些情况下包括另外的支架材料(诸如金属或另外的聚合物),以及增强可见性和成像的材料。可植入递送装置可有利于在局部和长时间内提供释放,其中待递送的多肽和/或核酸直接释放至靶位点,例如细胞外基质(ECM)、肿瘤周围的脉管***、病变组织等。合适的可植入递送装置包括适用于递送至腔(诸如腹腔)和/或其中药物递送***未锚定或附接的任何其他类型的施用的装置,所述装置包括生物稳定的和/或可降解的和/或生物可吸收的聚合物基底,其可以例如任选地是基质。在一些情况下,合适的可植入药物递送装置包含可降解聚合物,其中主要释放机制是整体侵蚀(bulk erosion)。在一些情况下,合适的可植入药物递送装置包含不可降解或缓慢降解的聚合物,其中主要释放机制是扩散而不是整体侵蚀,使得外部部分用作膜并且其内部部分用作药物储库,实际上,所述药物储库长时间内(例如约一周至约几个月)不会受到周围环境的影响。也可任选地使用具有不同释放机制的不同聚合物的组合。在总释放期的有效期内,浓度梯度可保持有效恒定,并且因此扩散速率是有效恒定的(称为“零模式”扩散)。术语“恒定”意指扩散速率维持高于治疗有效性的下阈值,但其仍然任选地以初始突发为特征并且/或者可波动,例如增加和降低到某一程度。扩散速率可长时间这样维持,并且可认为扩散速率恒定到某一水平以优化治疗有效期,例如有效的沉默期。
在一些情况下,可植入递送***被设计成保护基于核苷酸的治疗剂免于降解,无论是化学性质还是由于受试者体内酶和其他因素的攻击而引起的降解。
可选择装置的植入位点或靶位点,用于获得最大的治疗功效。例如,递送装置可植入在肿瘤环境内或附近,或者与肿瘤相关联的血液供给内或附近。靶位置可以是,例如:1)大脑退化位点,如在帕金森病或阿尔茨海默病中在基底神经节、白质和灰质处;2)脊柱,如就肌萎缩侧索硬化症(ALS)而言;3)子宫颈;4)活动性和慢性炎症关节;5)真皮,如就牛皮癣而言;7)交感神经和感觉神经位点,用于镇痛作用;7)骨;8)急性或慢性感染位点;9)***内;10)内耳-听觉***、内耳迷路、前庭***;11)气管内;12)心内;冠状动脉、心外膜;13)泌尿道或膀胱;14)胆***;15)实质组织,包括但不限于肾、肝、脾;16)***;17)唾液腺;18)牙龈;19)关节内(到关节中);20)眼内;21)脑组织;22)脑室;23)腔,包括腹腔(例如但不限于卵巢癌);24)食管内;和25)直肠内;和26)到脉管***中。
***方法(诸如植入)可任选地已经用于其他类型的组织植入和/或用于***和/或用于组织取样,任选地无需修改,或者可替代地仅在此类方法中任选地进行非主要修改。此类方法任选地包括但不限于近距离放射治疗方法、活组织检查、使用和/或不使用超声的内窥镜检查(诸如进入脑组织的立体定位方法)、腹腔镜检查(包括用腹腔镜植入关节、腹部器官、膀胱壁和体腔中)。
修饰的宿主细胞
本公开提供一种修饰的细胞,所述修饰的细胞包含本公开的CasZ多肽和/或包含编码本公开的CasZ多肽的核苷酸序列的核酸。本公开提供一种修饰的细胞,所述修饰的细胞包含本公开的CasZ多肽,其中所述修饰的细胞是通常不包含本公开的CasZ多肽的细胞。本公开提供一种修饰的细胞(例如,遗传修饰的细胞),所述修饰的细胞包含核酸,所述核酸包含编码本公开的CasZ多肽的核苷酸序列。本公开提供一种用mRNA遗传修饰的遗传修饰的细胞,所述mRNA包含编码本公开的CasZ多肽的核苷酸序列。本公开提供一种用重组表达载体遗传修饰的遗传修饰的细胞,所述重组表达载体包含编码本公开的CasZ多肽的核苷酸序列。本公开提供一种用重组表达载体遗传修饰的遗传修饰细胞,所述重组表达载体包含:a)编码本公开的CasZ多肽的核苷酸序列;和b)编码本公开的CasZ指导RNA的核苷酸序列。本公开提供一种用重组表达载体遗传修饰的遗传修饰的细胞,所述重组表达载体包含:a)编码本公开的CasZ多肽的核苷酸序列;b)编码本公开的CasZ指导RNA的核苷酸序列;和c)编码供体模板的核苷酸序列。
用作本公开的CasZ多肽和/或包含编码本公开的CasZ多肽和/或本公开的CasZ指导RNA(或编码它的核酸)和/或CasZ trancRNA(或编码它的核酸)的核苷酸序列的核酸的受体的细胞可以是多种细胞中的任一种,这些细胞包括例如体外细胞;体内细胞;离体细胞;原代细胞;癌细胞;动物细胞;植物细胞;藻类细胞;真菌细胞等。用作本公开的CasZ多肽和/或包含编码本公开的CasZ多肽和/或本公开的CasZ指导RNA的核苷酸序列的核酸的受体的细胞被称为“宿主细胞”或“靶细胞”。宿主细胞或靶细胞可以是本公开的CasZ***的受体。宿主细胞或靶细胞可以是本公开的CasZ RNP的受体。宿主细胞或靶细胞可以是本公开的CasZ***的单一组分的受体。
细胞(靶细胞)的非限制性实例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如,来自植物作物、水果、蔬菜、谷物、大豆、玉米(corn)、玉米(maize)、小麦、种子、番茄、大米、木薯、甘蔗、南瓜、干草、马铃薯、棉花、烟草、开花植物、针叶树、裸子植物、被子植物、蕨类植物、石松类、角苔类、苔类、苔藓、双子叶植物、单子叶植物等的细胞)、藻类细胞(例如,布朗葡萄藻(Botryococcusbraunii)、莱茵衣藻(Chlamydomonas reinhardtii)、海洋富油微拟球藻(Nannochloropsisgaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens)、羽藻(C.agardh)等)、海藻(例如巨藻(kelp))、真菌细胞(例如,酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如,有蹄类动物(例如,猪、牛、山羊、绵羊);啮齿动物(例如,大鼠、小鼠);非人灵长类动物;人;猫科动物(例如,猫);犬(例如,狗)等)的细胞等。在一些情况下,细胞是不源自天然生物体的细胞(例如,细胞可以是合成制得的细胞;也称为人造细胞)。
细胞可以是体外细胞(例如,培养物中的细胞,例如建立的培养细胞系)。细胞可以是离体细胞(来自个体的培养细胞)。细胞可以是体内细胞(例如,个体中的细胞)。细胞可以是分离的细胞。细胞可以是生物体内部的细胞。细胞可以是生物体。细胞可以是细胞培养物(例如,体外细胞培养物)中的细胞。细胞可以是细胞集合中的一者。细胞可以是原核细胞或衍生自原核细胞。细胞可以是细菌细胞或可衍生自细菌细胞。细胞可以是古细菌细胞或衍生自古细菌细胞。细胞可以是真核细胞或衍生自真核细胞。细胞可以是植物细胞或衍生自植物细胞。细胞可以是动物细胞或衍生自动物细胞。细胞可以是无脊椎动物细胞或衍生自无脊椎动物细胞。细胞可以是脊椎动物细胞或衍生自脊椎动物细胞。细胞可以是哺乳动物细胞或衍生自哺乳动物细胞。细胞可以是啮齿动物细胞或衍生自啮齿动物细胞。细胞可以是人细胞或衍生自人细胞。细胞可以是微生物细胞或衍生自微生物细胞。细胞可以是真菌细胞或衍生自真菌细胞。细胞可以是昆虫细胞。细胞可以是节肢动物细胞。细胞可以是原生动物细胞。细胞可以是蠕虫细胞。
合适的细胞包括干细胞(例如胚胎干(ES)细胞、诱导多能干(iPS)细胞;生殖细胞(例如,***、***、卵原细胞、***等);体细胞,例如成纤维细胞、少突胶质细胞、神经胶质细胞、造血细胞、神经元、肌细胞、骨细胞、肝细胞、胰腺细胞等。
合适的细胞包括人胚胎干细胞、胚胎心肌细胞、肌成纤维细胞、间充质干细胞、自体移植的扩增的心肌细胞、脂肪细胞、全能细胞、多能细胞、血液干细胞、成肌细胞、成体干细胞、骨髓细胞、间充质细胞、胚胎干细胞、实质细胞、上皮细胞、内皮细胞、间皮细胞、成纤维细胞、成骨细胞、软骨细胞、外源细胞、内源细胞、干细胞、造血干细胞、骨髓衍生祖细胞、心肌细胞、骨骼细胞、胎儿细胞、未分化细胞、多能祖细胞、单能祖细胞、单核细胞、心脏成肌细胞、骨骼成肌细胞、巨噬细胞、毛细血管内皮细胞、异种细胞、同种异体细胞和产后干细胞。
在一些情况下,细胞是免疫细胞、神经元、上皮细胞和内皮细胞或干细胞。在一些情况下,免疫细胞是T细胞、B细胞、单核细胞、天然杀伤细胞、树突状细胞或巨噬细胞。在一些情况下,免疫细胞是细胞毒性T细胞。在一些情况下,免疫细胞是辅助性T细胞。在一些情况下,免疫细胞是调节性T细胞(Treg)。
在一些情况下,细胞是干细胞。干细胞包括成体干细胞。成体干细胞也称为体细胞干细胞。
成体干细胞驻留在分化组织中,但保留自我更新的特性和产生多种细胞类型的能力,通常是干细胞所存在于的组织中的典型细胞类型。体细胞干细胞的许多实例是本领域的技术人员已知的,包括肌肉干细胞;造血干细胞;上皮干细胞;神经干细胞;间充质干细胞;乳腺干细胞;肠干细胞;中胚层干细胞;内皮干细胞;嗅干细胞;神经嵴干细胞等。
目标干细胞包括哺乳动物干细胞,其中术语“哺乳动物”是指被分类为哺乳动物的任何动物,包括人;非人灵长类动物;家畜和农场动物;以及动物园、实验室、运动或宠物动物,诸如狗、马、猫、牛、小鼠、大鼠、兔等。在一些情况下,干细胞是人干细胞。在一些情况下,干细胞是啮齿动物(例如,小鼠;大鼠)干细胞。在一些情况下,干细胞是非人灵长类动物干细胞。
干细胞可表达一种或多种干细胞标志物,例如SOX9、KRT19、KRT7、LGR5、CA9、FXYD2、CDH6、CLDN18、TSPAN8、BPIFB1、OLFM4、CDH17和PPARGC1A。
在一些情况下,干细胞是造血干细胞(HSC)。HSC是中胚层衍生的细胞,其可从骨髓、血液、脐带血、胎儿肝脏和卵黄囊中分离。HSC的特征在于CD34+和CD3-。HSC可在体内重新生成红系细胞、中性粒细胞-巨噬细胞、巨核细胞和淋巴样造血细胞谱系。在体外,可诱导HSC经历至少一些自我更新的细胞***,并且可诱导HSC分化成与体内所见相同的谱系。因此,可诱导HSC分化成红系细胞、巨核细胞、中性粒细胞、巨噬细胞和淋巴细胞中的一种或多种。
在其他情况下,干细胞是神经干细胞(NSC)。神经干细胞(NSC)能够分化成神经元和神经胶质细胞(包括少突胶质细胞和星形胶质细胞)。神经干细胞是能够进行多次***的多能干细胞,并且在特定条件下可产生作为神经干细胞的子细胞,或可作为成神经细胞或成胶质细胞的神经祖细胞,例如,分别致力于成为一种或多种类型的神经元和神经胶质细胞的细胞。获得NSC的方法在本领域中是已知的。
在其他情况下,干细胞是间充质干细胞(MSC)。MSC最初衍生自胚胎中胚层并从成人骨髓中分离,可分化形成肌肉、骨、软骨、脂肪、骨髓基质和肌腱。分离MSC的方法在本领域中是已知的;并且可使用任何已知的方法来获得MSC。参见例如美国专利号5,736,396,其描述了人MSC的分离。
在一些情况下,细胞是植物细胞。植物细胞可以是单子叶植物的细胞。细胞可以是双子叶植物的细胞。
在一些情况下,细胞是植物细胞。例如,细胞可以是主要农业植物的细胞,例如大麦、豆类(干食用)、油菜、玉米、棉花(皮玛棉)、棉花(陆地棉)、亚麻籽、干草(苜蓿)、干草(非苜蓿)、燕麦、花生、大米、高粱、大豆、甜菜、甘蔗、向日葵(油)、向日葵(非油)、甘薯、烟草(白肋烟)、烟草(烤烟)、番茄、小麦(硬质小麦)、小麦(春小麦)、小麦(冬小麦)等。作为另一个实例,细胞是蔬菜作物的细胞,所述蔬菜作物包括但不限于例如,苜蓿芽、芦荟叶、葛根(arrowroot)、慈菇(arrowhead)、朝鲜蓟、芦笋、竹笋、香蕉花、豆芽、豆类、甜菜叶、甜菜、苦瓜、白菜、西兰花、球花甘蓝(芜菁)、球芽甘蓝、卷心菜、卷心菜芽、仙人掌叶(仙人掌果)、笋瓜、刺棘蓟、胡萝卜、花椰菜、芹菜、佛手瓜、中国洋蓟(crosne)、大白菜、中国芹菜、中国韭菜、菜心、菊花叶(茼蒿(tung ho))、羽衣甘蓝、玉米秸秆、甜玉米、黄瓜、白萝卜(daikon)、蒲公英嫩叶、芋头(dasheen)、dau mue(豌豆尖)、donqua(冬瓜)、茄子、菊苣(endive)、莴苣、琴头蕨、田地水芹、苦苣、盖菜(芥菜)、gailon、良姜(暹罗、泰国姜)、大蒜、姜根、牛蒡(gobo)、嫩叶、汉诺威沙拉用绿叶(hanover salad green)、huauzontle、洋姜(jerusalemartichoke)、豆薯、羽衣甘蓝(kale)嫩叶、大头菜(kohlrabi)、羊腿藜(quilete)、生菜(贝比生菜(bibb))、生菜(波士顿生菜(boston))、生菜(波士顿红生菜(boston red))、生菜(绿叶)、生菜(冰山生菜(iceberg))、生菜(红毛菜(lolla rossa))、生菜(绿橡树叶)、生菜(红橡树叶)、生菜(加工生菜)、生菜(红叶)、生菜(罗马生菜(romaine))、生菜(红罗马生菜(ruby romaine))、生菜(俄罗斯红芥末)、linkok、白萝卜(lo bok)、长豆、莲藕、野苣(mache)、龙舌兰(龙舌兰(agave))叶、黄肉芋(malanga)、混和生菜(mesculin mix)、京水菜(mizuna)、moap(光滑丝瓜)、moo、moqua(有绒毛的南瓜)、蘑菇、芥末、山药(nagaimo)、秋葵、通菜、洋葱嫩叶、opo(长南瓜)、观赏玉米、观赏葫芦、欧芹、欧洲防风草、豌豆、辣椒(铃铛型)、辣椒、南瓜(pumpkin)、菊苣(radicchio)、萝卜芽、萝卜(radish)、青芸苔、青芸苔、大黄、罗马生菜(baby red)、芜菁甘蓝(rutabaga)、盐角草(海豆)、丝瓜(角形/脊状丝瓜)、菠菜、南瓜(squash)、稻草捆、甘蔗、甘薯、唐莴苣、罗望子、芋艿(taro)、芋艿叶、芋艿芽、塌棵菜、tepeguaje(葫芦(guaje))、红瓜(tindora)、粘果酸浆(tomatillo)、番茄、番茄(樱桃型)、番茄(葡萄型)、番茄(李子型)、姜黄、芜菁茎嫩叶、芜菁(turnip)、荸荠、薯蓣(yampi)、山药(名称)、油菜(yu choy)、木薯(yuca)(木薯)等。
在一些情况下,细胞是节肢动物细胞。例如,细胞可以是以下的亚目、家族、亚家族、群体、亚群或物种的细胞:例如,有螯肢亚门(Chelicerata)、多足亚门(Myriapodia)、Hexipodia、蛛形纲(Arachnida)、昆虫纲(Insecta)、石蛃目(Archaeognatha)、缨尾目(Thysanura)、古翅下纲(Palaeoptera)、蜉蝣目(Ephemeroptera)、蜻蜓目(Odonata)、差翅亚目(Anisoptera)、束翅亚目(Zygoptera)、新翅亚纲(Neoptera)、外翅总目(Exopterygota)、襀翅目(Plecoptera)、纺足目(Embioptera)、直翅目(Orthoptera)、缺翅目(Zoraptera)、革翅目(Dermaptera)、网翅目(Dictyoptera)、蛩蠊目(Notoptera)、蛩蠊科(Grylloblattidae)、螳科(Mantophasmatidae)、竹节虫目(Phasmatodea)、蜚蠊目(Blattaria)、等翅目(Isoptera)、螳螂目(Mantodea)、Parapneuroptera、啮虫目(Psocoptera)、缨翅目(Thysanoptera)、虱毛目(Phthiraptera)、半翅目(Hemiptera)、内翅类(Endopterygota)或全***类(Holometabola)、膜翅目(Hymenoptera)、鞘翅目(Coleoptera)、捻翅目(Strepsiptera)、蛇蛉目(Raphidioptera)、广翅目(Megaloptera)、脉翅目(Neuroptera)、长翅目(Mecoptera)、蚤目(Siphonaptera)、双翅目(Diptera)、毛翅目(Trichoptera)或鳞翅目(Lepidoptera)。
在一些情况下,细胞是昆虫细胞。例如,在一些情况下,细胞是蚊子、蚱蜢、半翅目昆虫、苍蝇、跳蚤、蜜蜂、黄蜂、蚂蚁、虱子、蛾或甲虫的细胞。
试剂盒
本公开提供一种试剂盒,所述试剂盒包含本公开的CasZ***或本公开的CasZ***的组分。
本公开的试剂盒可包含如对于CasZ***所列的任何组合(例如,参见上文)。本公开的试剂盒可包含:a)如上所述的本公开的CasZ***的组分,或者可包含本公开的CasZ***;和b)一种或多种另外的试剂,例如,i)缓冲剂;ii)蛋白酶抑制剂;iii)核酸酶抑制剂;iv)显影或可视化可检测标记所需的试剂;v)阳性和/或阴性对照靶DNA;vi)阳性和/或阴性对照CasZ指导RNA;vii)CasZ trancRNA等。本公开的试剂盒可包含:a)如上所述的本公开的CasZ***的组分,或者可包含本公开的CasZ***;和b)治疗剂。
本公开的试剂盒可包含重组表达载体,所述重组表达载体包含:a)用于***核酸的***位点,所述核酸包含编码CasZ指导RNA的一部分的核苷酸序列,所述CasZ指导RNA的一部分与靶核酸中的靶核苷酸序列杂交;和b)编码CasZ指导RNA的CasZ结合部分的核苷酸序列。本公开的试剂盒可包含重组表达载体,所述重组表达载体包含:a)用于***核酸的***位点,所述核酸包含编码CasZ指导RNA的一部分的核苷酸序列,所述CasZ指导RNA的一部分与靶核酸中的靶核苷酸序列杂交;b)编码CasZ指导RNA的CasZ结合部分的核苷酸序列;和c)编码本公开的CasZ多肽的核苷酸序列。本公开的试剂盒可包含重组表达载体,所述重组表达载体包含编码CasZ trancRNA的核苷酸序列。
SSDNA的检测
本公开的CasZ(Cas14)多肽一旦通过检测靶DNA(双链或单链)而被激活,就会混杂地切割非靶向单链DNA(ssDNA)。一旦CasZ(Cas14)被指导RNA激活(在指导RNA与靶DNA的靶序列杂交(即,样品包括靶DNA,例如靶ssDNA)时发生),该蛋白质就会成为混杂地切割ssDNA的核酸酶(即,核酸酶切割非靶ssDNA,即,指导RNA的指导序列未与之杂交的ssDNA)。因此,当样品中存在靶DNA时(例如,在一些情况下超过阈值量),引起样品中ssDNA的切割,这可使用任何方便的检测方法(例如,使用标记的单链检测剂DNA)加以检测。在一些情况下,除了CasZ指导RNA之外,CasZ多肽还需要tranc RNA进行激活。
提供了用于检测样品中的靶DNA(双链或单链)的组合物和方法。在一些情况下,使用为单链(ssDNA)并且不与指导RNA的指导序列杂交的检测剂DNA(即,检测剂ssDNA是非靶ssDNA)。此类方法可包括(a)使样品与以下物质接触:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与CasZ多肽结合的区域和与靶DNA杂交的指导序列;和(iii)为单链的且不与指导RNA的指导序列杂交的检测剂DNA;以及(b)测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。在一些情况下,所述方法可包括(a)使样品与以下物质接触:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与CasZ多肽结合的区域和与靶DNA杂交的指导序列;(iii)CasZ tranc RNA;和(iv)为单链的且不与指导RNA的指导序列杂交的检测剂DNA;以及(b)测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。如上所指出,一旦主题CasZ多肽蛋白被指导RNA激活(在样品中包含与指导RNA杂交的靶DNA(即,样品中包含靶向靶DNA)时发生),CasZ多肽就会被激活并且充当内切核糖核酸酶来非特异性地切割样品中存在的ssDNA(包括非靶ssDNA)。因此,当样品中存在所靶向的靶DNA时(例如,在一些情况下超过阈值量),引起样品中ssDNA(包括非靶ssDNA)的切割,这可使用任何方便的检测方法(例如,使用标记的检测剂ssDNA)加以检测。
还提供了用于切割单链DNA(ssDNA)(例如,非靶ssDNA)的组合物和方法。此类方法可包括使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:(i)CasZ多肽;和(ii)指导RNA,所述指导RNA包含与CasZ多肽结合的区域和与靶DNA杂交的指导序列,其中CasZ多肽切割所述多个非靶ssDNA。此类方法可包括使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与CasZ多肽结合的区域和与靶DNA杂交的指导序列;和(iii)CasZ tranc RNA,其中CasZ多肽切割所述多个非靶ssDNA。可使用此类方法,例如,在细胞中切割外源ssDNA(例如,病毒DNA)。
主题方法的接触步骤可在包含二价金属离子的组合物中进行。接触步骤可在无细胞环境中,例如在细胞外部进行。接触步骤可在细胞内部进行。接触步骤可在体外细胞中进行。接触步骤可在离体细胞中进行。接触步骤可在体内细胞中进行。
指导RNA可以RNA的形式或以编码指导RNA的核酸(例如,DNA,诸如重组表达载体)的形式提供。tranc RNA可作以RNA的形式或以编码指导RNA的核酸(例如,DNA,诸如重组表达载体)的形式提供。CasZ多肽可以蛋白质本身或以编码蛋白质的核酸(例如,mRNA、DNA诸如重组表达载体)的形式提供。在一些情况下,可提供两个或更多个(例如,3个或更多个、4个或更多个、5个或更多个或者6个或更多个)指导RNA。在一些情况下,使用单分子RNA,所述单分子RNA包含:i)CasZ指导RNA;和ii)tranc RNA(或包含编码单分子RNA的核苷酸序列的核酸)。
在一些情况下(例如,当使样品与指导RNA和CasZ多肽接触时;或者当使样品与指导RNA、CasZ多肽和tranc RNA接触时),在测量步骤之前使样品接触2小时或更短时间(例如,1.5小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间)。例如,在一些情况下,在测量步骤之前使样品接触40分钟或更短时间。在一些情况下,在测量步骤之前使样品接触20分钟或更短时间。在一些情况下,在测量步骤之前使样品接触10分钟或更短时间。在一些情况下,在测量步骤之前使样品接触5分钟或更短时间。在一些情况下,在测量步骤之前使样品接触1分钟或更短时间。在一些情况下,在测量步骤之前使样品接触50秒至60秒。在一些情况下,在测量步骤之前使样品接触40秒至50秒。在一些情况下,在测量步骤之前使样品接触30秒至40秒。在一些情况下,在测量步骤之前使样品接触20秒至30秒。在一些情况下,在测量步骤之前使样品接触10秒至20秒。
在一些情况下,本公开的用于检测靶DNA的方法包括:a)在提供检测剂DNA的反式切割的条件下,使样品与指导RNA、CasZ多肽和检测剂DNA接触,其中使样品接触2小时或更短时间(例如,1.5小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间);b)在不提供检测剂RNA的反式切割的条件下,将来自步骤(a)的样品保持一段时间;以及c)在步骤(b)的时间段之后,测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。提供检测剂DNA的反式切割的条件包括温度条件,诸如从17℃至约39℃(例如,约37℃)。不提供检测剂DNA的反式切割的条件包括10℃或更低、5℃或更低、4℃或更低或0℃的温度。
在一些情况下,本公开的用于检测靶DNA的方法包括:a)在提供检测剂DNA的反式切割的条件下,使样品与指导RNA、tranc RNA、CasZ多肽和检测剂DNA接触(或使样品与以下物质接触:i)包含指导RNA和tranc RNA的单分子RNA;i)CasZ多肽;和iii)检测剂DNA),其中使样品接触2小时或更短时间(例如,1.5小时或更短时间、1小时或更短时间、40分钟或更短时间、30分钟或更短时间、20分钟或更短时间、10分钟或更短时间、或5分钟或更短时间、或1分钟或更短时间);b)在不提供检测剂RNA的反式切割的条件下,将来自步骤(a)的样品保持一段时间;以及c)在步骤(b)的时间段之后,测量由CasZ多肽切割单链检测剂DNA而产生的可检测信号,从而检测靶DNA。提供检测剂DNA的反式切割的条件包括温度条件,诸如从17℃至约39℃(例如,约37℃)。不提供检测剂DNA的反式切割的条件包括10℃或更低、5℃或更低、4℃或更低或0℃的温度。
在一些情况下,通过切割单链检测剂DNA产生的可检测信号的产生时间不超过60分钟。例如,在一些情况下,通过切割单链检测剂DNA产生的可检测信号的产生时间不超过60分钟、不超过45分钟、不超过30分钟、不超过15分钟、不超过10分钟或不超过5分钟。例如,在一些情况下,通过切割单链检测剂DNA产生的可检测信号的产生时间段为1分钟至60分钟,例如1分钟至5分钟、5分钟至10分钟、10分钟至15分钟、15分钟至30分钟、30分钟至45分钟或45分钟至60分钟。在一些情况下,在产生可检测信号后(例如,产生时间不超过60分钟),可通过以下方式停止检测信号的产生,例如,降低样品的温度(例如,将温度降低至10℃或更低、5℃或更低、4℃或更低或0℃),向样品中添加抑制剂,冻干样品,将样品加热至40℃以上等。测量步骤可在已停止可检测信号产生之后的任何时间进行。例如,测量步骤可在已停止可检测信号产生之后的5分钟至48小时进行。例如,测量步骤可在已停止可检测信号产生之后的5分钟至15分钟、15分钟至30分钟、30分钟至60分钟、1小时至4小时、4小时至8小时、8小时至12小时、12小时至24小时、24小时至36小时或36小时至48小时进行。测量步骤可在已停止可检测信号产生之后超过48小时进行。
本公开的用于检测样品中的靶DNA(单链或双链)的方法可以高灵敏度检测靶DNA。在一些情况下,可使用本公开的方法检测包含多个DNA(包括靶DNA和多个非靶DNA)的样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个或多个拷贝(例如,每106个非靶DNA一个或多个拷贝、每105个非靶DNA一个或多个拷贝、每104个非靶DNA一个或多个拷贝、每103个非靶DNA一个或多个拷贝、每102个非靶DNA一个或多个拷贝、每50个非靶DNA一个或多个拷贝、每20个非靶DNA一个或多个拷贝、每10个非靶DNA一个或多个拷贝、或每5个非靶DNA一个或多个拷贝)存在。在一些情况下,可使用本公开的方法检测包含多个DNA(包括靶DNA和多个非靶DNA)的样品中存在的靶DNA,其中靶DNA以每1018个非靶DNA一个或多个拷贝(例如,每1015个非靶DNA一个或多个拷贝、每1012个非靶DNA一个或多个拷贝、每109个非靶DNA一个或多个拷贝、每106个非靶DNA一个或多个拷贝、每105个非靶DNA一个或多个拷贝、每104个非靶DNA一个或多个拷贝、每103个非靶DNA一个或多个拷贝、每102个非靶DNA一个或多个拷贝、每50个非靶DNA一个或多个拷贝、每20个非靶DNA一个或多个拷贝、每10个非靶DNA一个或多个拷贝、或每5个非靶DNA一个或多个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个拷贝至每10个非靶DNA一个拷贝(例如,每107个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA 1个拷贝、或每105个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每1018个非靶DNA一个拷贝至每10个非靶DNA一个拷贝(例如,每1018个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每1015个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每1012个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每109个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每106个非靶DNA1个拷贝至每104个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每10个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、或每105个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝)存在。
在一些情况下,本公开的方法可检测样品中存在的靶DNA,其中靶DNA以每107个非靶DNA一个拷贝至每100个非靶DNA一个拷贝(例如,每107个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每107个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每100个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每106个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每100个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每102个非靶DNA 1个拷贝、每105个非靶DNA1个拷贝至每103个非靶DNA 1个拷贝、或每105个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝)存在。
在一些情况下,对于检测样品中的靶DNA的主题方法,检测阈值为10nM或更小。因此,例如,靶DNA可以10nM或更低的浓度存在于样品中。术语“检测阈值”在本文用于描述要发生检测样品中必须存在的最小靶DNA量。因此,作为说明性实例,当检测阈值为10nM时,则当靶DNA以10nM或更高的浓度存在于样品中时,可检测到信号。在一些情况下,本公开的方法的检测阈值为5nM或更小。在一些情况下,本公开的方法的检测阈值为1nM或更小。在一些情况下,本公开的方法的检测阈值为0.5nM或更小。在一些情况下,本公开的方法的检测阈值为0.1nM或更小。在一些情况下,本公开的方法的检测阈值为0.05nM或更小。在一些情况下,本公开的方法的检测阈值为0.01nM或更小。在一些情况下,本公开的方法的检测阈值为0.005nM或更小。在一些情况下,本公开的方法的检测阈值为0.001nM或更小。在一些情况下,本公开的方法的检测阈值为0.0005nM或更小。在一些情况下,本公开的方法的检测阈值为0.0001nM或更小。在一些情况下,本公开的方法的检测阈值为0.00005nM或更小。在一些情况下,本公开的方法的检测阈值为0.00001nM或更小。在一些情况下,本公开的方法的检测阈值为10pM或更小。在一些情况下,本公开的方法的检测阈值为1pM或更小。在一些情况下,本公开的方法的检测阈值为500fM或更小。在一些情况下,本公开的方法的检测阈值为250fM或更小。在一些情况下,本公开的方法的检测阈值为100fM或更小。在一些情况下,本公开的方法的检测阈值为50fM或更小。在一些情况下,本公开的方法的检测阈值为500aM(渺摩尔)或更小。在一些情况下,本公开的方法的检测阈值为250aM或更小。在一些情况下,本公开的方法的检测阈值为100aM或更小。在一些情况下,本公开的方法的检测阈值为50aM或更小。在一些情况下,本公开的方法的检测阈值为10aM或更小。在一些情况下,本公开的方法的检测阈值为1aM或更小。
在一些情况下,检测阈值(用于以主题方法检测靶DNA)在500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内(其中浓度是指可检测到靶DNA的靶DNA阈值浓度)。在一些情况下,本公开的方法的检测阈值在800fM至100pM的范围内。在一些情况下,本公开的方法的检测阈值在1pM至10pM的范围内。在一些情况下,本公开的方法的检测阈值在10fM至500fM,例如10fM至50fM、50fM至100fM、100fM至250fM、或250fM至500fM的范围内。
在一些情况下,可在样品中检测到靶DNA的最小浓度在500fM至1nM(例如,500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在800fM至100pM的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在1pM至10pM的范围内。
在一些情况下,检测阈值(用于以主题方法检测靶DNA)在1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内(其中浓度是指可检测到靶DNA的靶DNA阈值浓度)。在一些情况下,本公开的方法的检测阈值在1aM至800aM的范围内。在一些情况下,本公开的方法的检测阈值在50aM至1pM的范围内。在一些情况下,本公开的方法的检测阈值在50aM至500fM的范围内。
在一些情况下,样品中存在的靶DNA在1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,样品中存在的靶DNA在1aM至800aM的范围内。在一些情况下,样品中存在的靶DNA在50aM至1pM的范围内。在一些情况下,样品中存在的靶DNA在50aM至500fM的范围内。
在一些情况下,可在样品中检测到靶DNA的最小浓度在1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在1aM至500pM的范围内。在一些情况下,可在样品中检测到靶DNA的最小浓度在100aM至500pM的范围内。
在一些情况下,样品中存在的靶DNA在1aM至1nM(例如,1aM至500pM、1aM至200pM、1aM至100pM、1aM至10pM、1aM至1pM、100aM至1nM、100aM至500pM、100aM至200pM、100aM至100pM、100aM至10pM、100aM至1pM、250aM至1nM、250aM至500pM、250aM至200pM、250aM至100pM、250aM至10pM、250aM至1pM、500aM至1nM、500aM至500pM、500aM至200pM、500aM至100pM、500aM至10pM、500aM至1pM、750aM至1nM、750aM至500pM、750aM至200pM、750aM至100pM、750aM至10pM、750aM至1pM、1fM至1nM、1fM至500pM、1fM至200pM、1fM至100pM、1fM至10pM、1fM至1pM、500fM至500pM、500fM至200pM、500fM至100pM、500fM至10pM、500fM至1pM、800fM至1nM、800fM至500pM、800fM至200pM、800fM至100pM、800fM至10pM、800fM至1pM、1pM至1nM、1pM至500pM、1pM至200pM、1pM至100pM、或1pM至10pM)的范围内。在一些情况下,样品中存在的靶DNA在1aM至500pM的范围内。在一些情况下,样品中存在的靶DNA在100aM至500pM的范围内。
在一些情况下,主题组合物或方法表现出渺摩尔级(aM)的检测灵敏度。在一些情况下,主题组合物或方法表现出飞摩尔级(fM)的检测灵敏度。在一些情况下,主题组合物或方法表现出皮摩尔级(pM)的检测灵敏度。在一些情况下,主题组合物或方法表现出纳摩尔级(nM)的检测灵敏度。
靶DNA
靶DNA可以是单链的(ssDNA)或双链的(dsDNA)。当靶DNA是单链的时,对靶DNA中的PAM序列没有偏好或要求。但是,当靶DNA是dsDNA时,PAM通常邻近靶DNA的靶序列存在(例如,参见本文其他地方对PAM的论述)。靶DNA的来源可与样品的来源相同,例如,如下文所述。
靶DNA的来源可以是任何来源。在一些情况下,靶DNA是病毒DNA(例如,DNA病毒的基因组DNA)。因而,主题方法可用于检测核酸群体中(例如,样品中)病毒DNA的存在。主题方法还可用于在靶DNA存在下切割非靶ssDNA。例如,如果方法发生在细胞中,则当细胞中存在特定靶DNA时,主题方法可用于混杂地切割细胞中的非靶ssDNA(不与指导RNA的指导序列杂交的ssDNA)(例如,当细胞被病毒感染并检测到病毒靶DNA时)。
可能的靶DNA的实例包括但不限于病毒DNA,诸如:乳多空病毒(例如,人***瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(Epstein-Barr virus,EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒(ichtadenovirus)、美洲白鲟腺病毒(mastadenovirus)、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;***病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮化病毒科;藻类DNA病毒科(Phycodnaviridae)等。在一些情况下,靶DNA是寄生虫DNA。在一些情况下,靶DNA是细菌DNA,例如病原性细菌的DNA。
样品
主题样品包括核酸(例如,多个核酸)。术语“多个”在本文中用于意指两个或更多个。因此,在一些情况下,样品包含两个或更多个(例如,3个或更多个、5个或更多个、10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或者5,000个或更多个)核酸(例如,DNA)。主题方法可用作检测样品中(例如,诸如DNA的核酸的复杂混合物中)存在的靶DNA的非常灵敏的方法。在一些情况下,样品包含序列彼此不同的5个或更多个DNA(例如,10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、或者5,000个或更多个DNA)。在一些情况下,样品包含10个或更多个、20个或更多个、50个或更多个、100个或更多个、500个或更多个、103个或更多个、5x103个或更多个、104个或更多个、5x104个或更多个、105个或更多个、5x105个或更多个、106个或更多个、5x106个或更多个、或者107个或更多个DNA。在一些情况下,样品包含10至20个、20至50个、50至100个、100至500个、500至103个、103至5x103个、5x103至104个、104至5x104个、5x104至105个、105至5x105个、5x105至106个、106至5x106个、或5x106至107个、或超过107个DNA。在一些情况下,样品包含5至107个DNA(例如,序列彼此不同)(例如,5至106个、5至105个、5至50,000个、5至30,000个、10至106个、10至105个、10至50,000个、10至30,000个、20至106个、20至105个、20至50,000个、或20至30,000个DNA)。在一些情况下,样品包含20个或更多个序列彼此不同的DNA。在一些情况下,样品包含来自细胞裂解液(例如,真核细胞裂解液、哺乳动物细胞裂解液、人细胞裂解液、原核细胞裂解液、植物细胞裂解液等)的DNA。例如,在一些情况下,样品包含来自细胞诸如真核细胞,例如哺乳动物细胞诸如人细胞的DNA。
术语“样品”在本文中用于意指包含DNA的任何样品(例如,以便确定在DNA群体中是否存在靶DNA)。样品可衍生自任何来源,例如,样品可以是纯化DNA的合成组合;样品可以是细胞裂解液、富含DNA的细胞裂解液,或从细胞裂解液中分离和/或纯化的DNA。样品可来自患者(例如,出于诊断目的)。样品可来自透化细胞。样品可来自交联细胞。样品可在组织切片中。样品可来自通过交联,之后进行脱脂和调整以形成均匀折射率而制备的组织。通过交联,之后进行脱脂和调整以形成均匀折射率的组织制备的实例描述于例如Shah等人,Development(2016)143,2862-2867doi:10.1242/dev.138560中。
“样品”可包含靶DNA和多个非靶DNA。在一些情况下,靶DNA在样品中以每10个非靶DNA一个拷贝、每20个非靶DNA一个拷贝、每25个非靶DNA一个拷贝、每50个非靶DNA一个拷贝、每100个非靶DNA一个拷贝、每500个非靶DNA一个拷贝、每103个非靶DNA一个拷贝、每5x103个非靶DNA一个拷贝、每104个非靶DNA一个拷贝、每5x104个非靶DNA一个拷贝、每105个非靶DNA一个拷贝、每5x105个非靶DNA一个拷贝、每106个非靶DNA一个拷贝、或小于每106个非靶DNA一个拷贝存在。在一些情况下,靶DNA在样品中以每10个非靶DNA一个拷贝至每20个非靶DNA 1个拷贝、每20个非靶DNA 1个拷贝至每50个非靶DNA 1个拷贝、每50个非靶DNA 1个拷贝至每100个非靶DNA 1个拷贝、每100个非靶DNA 1个拷贝至每500个非靶DNA 1个拷贝、每500个非靶DNA 1个拷贝至每103个非靶DNA 1个拷贝、每103个非靶DNA 1个拷贝至每5x103个非靶DNA 1个拷贝、每5x103个非靶DNA 1个拷贝至每104个非靶DNA 1个拷贝、每104个非靶DNA 1个拷贝至每105个非靶DNA 1个拷贝、每105个非靶DNA 1个拷贝至每106个非靶DNA 1个拷贝、或每106个非靶DNA 1个拷贝至每107个非靶DNA 1个拷贝存在。
合适的样品包括但不限于唾液、血液、血清、血浆、尿液、抽吸物和活检样品。因此,关于患者的术语“样品”涵盖生物来源的血液和其他液体样品、实体组织样品诸如活检样本或组织培养物或来源于其的细胞及其后代。该定义还包括在获得后采用以下任何方式操作过的样品:诸如用试剂处理;洗涤;或针对某些细胞群体诸如癌细胞进行富集。该定义还包括已经富集了特定类型的分子(例如,DNA)的样品。术语“样品”涵盖生物样品,诸如临床样品,诸如血液、血浆、血清、抽吸物、脑脊髓液(CSF),并且还包括通过手术切除获得的组织、通过活检获得的组织、培养物中的细胞、细胞上清液、细胞裂解液、组织样品、器官、骨髓等。“生物样品”包括来源于其的生物流体(例如,癌细胞、感染细胞等),例如包含从此类细胞获得的DNA的样品(例如,细胞裂解液或其他包含DNA的细胞提取物)。
样品可包含或可从多种细胞、组织、器官或无细胞流体中的任一种获得。合适的样品来源包括真核细胞、细菌细胞和古细菌细胞。合适的样品来源包括单细胞生物体和多细胞生物体。合适的样品来源包括单细胞真核生物体;植物或植物细胞;藻类细胞,例如布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞、组织或器官;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫、昆虫、蛛形纲动物等)的细胞、组织或器官;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、组织、体液或器官;来自哺乳动物(例如,人;非人灵长类动物;有蹄类动物;猫科动物;牛;绵羊;山羊等)的细胞、组织、体液或器官。合适的样品来源包括线虫、原生动物等。合适的样品来源包括寄生虫,诸如蠕虫、疟疾寄生虫等。
合适的样品来源包括例如以下六个界中任何一个界的细胞、组织或生物体:细菌界(例如,真细菌界);古细菌界;原生生物界;真菌界;植物界;和动物界。合适的样品来源包括原生生物界的植物样成员,包括但不限于藻类(例如,绿藻、红藻、灰胞藻、蓝细菌);原生生物界的真菌样成员,例如粘液菌、水霉菌等;原生生物界的动物样成员,例如鞭毛虫类(例如,眼虫藻)、变形虫类(amoeboids)(例如,变形虫)、孢子虫类(例如,顶复门(Apicomplexa)、粘体动物门(Myxozoa)、微孢子虫纲(Microsporidia))和纤毛虫类(例如,草履虫)。合适的样品来源包括包括真菌界的成员,包括但不限于以下门中的任何门的成员:担子菌门(担子菌类;例如,伞菌属、鹅膏菌属、牛肝菌属、鸡油菌属等成员);子囊菌门(子囊菌类,包括例如酵母菌);菌藻门(地衣);接合菌门(接合真菌);以及不完全菌门。合适的样品来源包括包括植物界的成员,包括但不限于以下分类中的任何分类的成员:苔藓植物门(例如,藓类)、角苔植物门(例如,角苔类)、苔类植物门(Hepaticophyta)(例如,苔类)、石松植物门(例如,石松类)、楔叶植物门(例如,木贼类)、裸蕨植物门(例如,松叶蕨类)、瓶尔小草门、蕨门(例如,蕨类)、苏铁门、银杏门、松柏门、买麻藤门和木兰门(例如,开花植物)。合适的样品来源包括包括动物界的成员,包括但不限于以下门中的任何门的成员:多孔动物门(海绵动物);扁盘动物门;直泳虫门(海洋无脊椎动物的寄生物);菱形虫门;刺胞动物门(珊瑚、海葵、海蜇、海笔、海肾、立方水母);栉水母门(栉水母类);扁虫动物门(扁虫类);纽形动物门(纽虫类);颚胃动物门(Ngathostomulida)(有颚蠕虫)p腹毛动物门;轮虫动物门;曳鳃动物门;动吻动物门;铠甲动物门;棘头动物门;内肛动物门;线虫动物门;线形动物门;环口动物门;软体动物门(软体动物);星虫动物门(方格星虫(peanut worms));环节动物门(环节蠕虫);缓步动物门(缓步动物);有爪动物门(栉蚕);节肢动物门(包括以下亚门:有螯肢亚门、多足亚门、六足亚门和甲壳亚门,其中有螯肢亚门包括例如蛛形纲、肢口纲和海蜘蛛纲,其中多足亚门包括例如唇足纲(唇足类)、倍足纲(多足类)、少足纲(Paropoda)和综合纲,其中六足亚门包括昆虫纲,并且其中甲壳亚门包括虾、磷虾、藤壶等;帚虫动物门;外肛动物门(苔藓动物);腕足动物门;棘皮动物门(例如,海星、海雏菊、毛头星、海胆、海参、海蛇尾、脆篮(brittle baskets)等);毛颚动物门(箭虫);半索动物门(玉钩虫);和脊索动物门。合适的脊索动物门成员包括以下亚门的任何成员:尾索动物亚门(海鞘纲;包括海鞘目、樽海鞘目和幼形目);头索亚门(文昌鱼);盲鳗纲(盲鳗);和脊椎动物亚门,其中脊椎动物亚门成员包括例如以下纲的成员:鳃鳗纲(七鳃类)、软骨鱼纲(软骨鱼)、辐鳍鱼纲(辐鳍鱼)、腔棘焦纲(腔棘鱼)、肺鱼纲(肺鱼)、爬行纲(爬行动物,例如蛇、短吻鳄、鳄鱼、蜥蜴等)、鸟纲(鸟类);和哺乳纲(哺乳动物)。合适的植物包括任何单子叶植物和任何双子叶植物。
合适的样品来源包括取自生物体;从生物体分离的特定细胞或细胞群的细胞、流体、组织或器官等。例如,在生物体是植物的情况下,合适的来源包括木质部、韧皮部、形成层、叶、根等。在生物体是动物的情况下,合适的来源包括特定组织(例如,肺、肝、心脏、肾、脑、脾、皮肤、胎儿组织等)、或特定细胞类型(例如,神经元细胞、上皮细胞、内皮细胞、星形胶质细胞、巨噬细胞、神经胶质细胞、胰岛细胞、T淋巴细胞、B淋巴细胞等)。
在一些情况下,样品来源是病变的(或疑似病变的细胞、流体、组织或器官。在一些情况下,样品来源是正常(非病变的)细胞、流体、组织或器官。在一些情况下,样品来源是(或疑似是病原体感染的细胞、组织或器官。例如,样品来源可以是可能被感染或可能未被感染的个体-并且样品可以是从个体收集的任何生物样品(例如血液、唾液、活检物、血浆、血清、支气管肺泡灌洗液、痰液、粪便样品、脑脊液、细针抽吸物、拭子样品(例如,颊拭子、宫颈拭子、鼻拭子)、间质液、滑液、鼻分泌物、眼泪、血沉棕黄层、粘膜样品、上皮细胞样品(例如,上皮细胞刮擦物)等)。在一些情况下,样品是无细胞液体样品。在一些情况下,样品是可包含细胞的液体样品。病原体包括病毒、真菌、蠕虫、原生动物、疟疾寄生虫、疟原虫寄生虫、弓形虫寄生虫、血吸虫寄生虫等。“蠕虫”包括蛔虫、犬恶丝虫和植食性线虫(线虫纲)、吸虫(吸虫纲)、棘头虫纲和绦虫(绦虫纲)。原生动物感染包括来自贾第虫属种、毛滴虫属种、非洲锥虫病、阿米巴痢疾、巴贝虫病、小袋虫性痢疾、查加斯病(Chaga's disease)、球虫病、疟疾和弓形体病的感染。病原体(诸如寄生/原生动物病原体)的实例包括但不限于:恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、克氏锥虫(Trypanosomacruzi)和刚地弓形虫(Toxoplasma gondii)。真菌病原体包括但不限于:新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、粗球孢菌(Coccidioides immitis)、皮炎芽生菌(Blastomyces dermatitidis)、沙眼衣原体(Chlamydia trachomatis)和白色念珠菌(Candida albicans)。病原性病毒包括例如免疫缺陷病毒(例如,HIV);流感病毒;登革热病毒;西尼罗河病毒;疱疹病毒;黄热病毒;丙型肝炎病毒;甲型肝炎病毒;乙型肝炎病毒;***瘤病毒等。病原性病毒可包括DNA病毒,诸如:乳多空病毒(例如,人***瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒、美洲白鲟腺病毒、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;***病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮化病毒科;藻科等。病原体可包括,例如DNA病毒[例如:乳多空病毒(例如,人***瘤病毒(HPV)、多瘤病毒属);嗜肝DNA病毒(例如,乙型肝炎病毒(HBV));疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、爱泼斯坦-巴尔病毒(EBV)、巨细胞病毒(CMV)、疱疹淋巴病毒、玫瑰糠疹、卡波西氏肉瘤相关疱疹病毒);腺病毒(例如,鸟腺病毒、禽腺病毒、鱼腺病毒、美洲白鲟腺病毒、唾液酸酶腺病毒);痘病毒(例如,天花、痘苗病毒、牛痘病毒、猴痘病毒、口疮病毒、假牛痘病毒、牛丘疹性口炎病毒;特纳河痘病毒、亚巴猴肿瘤病毒;***病毒(MCV));细小病毒(例如,腺相关病毒(AAV)、细小病毒B19、人博卡病毒、bufavirus、人parv4 G1);双生病毒科;矮化病毒科;藻科等]、结核分枝杆菌(Mycobacterium tuberculosis)、无乳链球菌(Streptococcus agalactiae)、耐甲氧西林金黄色葡萄球菌(methicillin-resistantStaphylococcus aureus)、嗜肺军团菌(Legionella pneumophila)、酿脓链球菌(Streptococcus pyogenes)、大肠杆菌(Escherichia coli)、淋病奈瑟氏菌(Neisseriagonorrhoeae)、脑膜炎奈瑟氏菌(Neisseria meningitidis)、肺炎球菌(Pneumococcus)、新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasma capsulatum)、流感嗜血杆菌B(Hemophilus influenzae B)、梅毒密螺旋体(Treponema pallidum)、莱姆病螺旋体(Lyme disease spirochetes)、铜绿假单胞菌(Pseudomonas aeruginosa)、麻风分枝杆菌(Mycobacterium leprae)、流产布鲁氏菌(Brucella abortus)、狂犬病病毒、流感病毒、巨细胞病毒、单纯疱疹病毒I、单纯疱疹病毒II、人血清细小样病毒(human serumparvo-like virus)、呼吸道合胞体病毒、水痘-带状疱疹病毒、乙型肝炎病毒、丙型肝炎病毒、麻疹病毒、腺病毒、人T细胞白血病病毒、爱泼斯坦-巴尔病毒、鼠白血病病毒、腮腺炎病毒、水疱性口炎病毒、辛德毕斯病毒(Sindbis virus)、淋巴细胞性脉络丛脑膜炎病毒、疣病毒、蓝舌病毒、仙台病毒(Sendai virus)、猫白血病病毒、呼肠孤病毒、脊髓灰质炎病毒、猿猴病毒40、小鼠乳腺肿瘤病毒、登革热病毒、风疹病毒、西尼罗河病毒、恶性疟原虫、间日疟原虫、刚地弓形虫、蓝氏锥虫(Trypanosoma rangeli)、克氏锥虫、罗氏锥虫(Trypanosomarhodesiense)、布氏锥虫(Trypanosoma brucei)、曼氏血吸虫(Schistosoma mansoni)、日本血吸虫(Schistosoma japonicum)、巴贝斯虫(Babesia bovis)、柔嫩艾美球虫(Eimeriatenella)、盘尾丝虫(Onchocerca volvulus)、利什曼原虫(Leishmania tropica)、结核分枝杆菌、旋毛虫(Trichinella spiralis)、泰勒原虫(Theileria parva)、胞状绦虫(Taeniahydatigena)、羊绦虫(Taenia ovis)、牛肉绦虫(Taenia saginata)、细粒棘球绦虫(Echinococcus granulosus)、柯氏中殖孔绦虫(Mesocestoides corti)、关节炎支原体(Mycoplasma arthritidis)、猪鼻支原体(M.hyorhinis)、口腔支原体(M.orale)、精氨酸支原体(M.arginini)、莱氏无胆甾原体(Acholeplasma laidlawii)、唾窦支原体(M.salivarium)和肺炎支原体(M.pneumoniae)。
测量可检测信号
在一些情况下,主题方法包括测量步骤(例如,测量由CasZ介导的ssDNA切割产生的可检测信号)。因为CasZ多肽一旦被激活就切割非靶向ssDNA(所述激活在存在CasZ多肽(并且在一些情况下还包括tranc RNA)的情况下指导RNA与靶DNA杂交时发生),所以可检测信号可以是当ssRNA被切割时产生的任何信号。例如,在一些情况下,测量步骤可包括以下一项或多项:基于金纳米颗粒的检测(例如,参见Xu等人,Angew Chem Int Ed Engl.2007;46(19):3468-70;和Xia等人,Proc Natl Acad Sci U S A.2010年6月15日;107(24):10837-41)、荧光偏振、胶体相变/分散(例如,Baksh等人,Nature.2004年1月8日;427(6970):139-41)、电化学检测、基于半导体的感测(例如,Rothberg等人,Nature.2011年7月20日;475(7356):348-52;例如,可以在ssDNA切割反应后使用磷酸酶以通过打开2'-3'环状磷酸酯并通过将无机磷酸盐释放到溶液中而产生pH变化),以及检测经标记的检测剂ssDNA(更多细节参见本文其他地方)。此类检测方法的读出可以是任何方便的读出。可能的读出的实例包括但不限于:所测量的可检测荧光信号的量;对凝胶上条带(例如,表示切割产物对比未切割底物的条带)的视觉分析、基于视觉或传感器的对颜色存在或不存在的检测(即,颜色检测方法),以及电信号的存在或不存在(或电信号的特定量)。
在一些情况下,例如在检测到的信号量可用于确定样品中存在的靶DNA的量的意义上,测量可以是定量的。在一些情况下,例如在可检测信号的存在或不存在可以指示靶DNA(例如,病毒、SNP等)的存在或不存在的意义上,测量可以是定性的。在一些情况下,除非靶DNA(例如,病毒、SNP等)以高于特定阈值浓度存在,否则可检测信号将不存在(例如,高于给定阈值水平)。在一些情况下,可通过修改CasZ多肽、指导RNA、样品体积和/或检测剂ssDNA(如果使用的话)的量来滴定检测阈值。因此,例如,如本领域的普通技术人员应当理解的,如果需要的话,可使用许多对照以建立一个或多个反应,每个反应设置用于检测靶DNA的不同阈值水平,并且因此可使用这样的一系列反应来确定样品中存在的靶DNA的量(例如,可使用这样的一系列反应来确定靶DNA‘以至少X的浓度’存在于样品中)。本公开的组合物和方法的应用/用途的非限制性实例包括单核苷酸多态性(SNP)检测、癌症筛查、细菌感染检测、抗生素抗性检测、病毒感染检测等。本公开的组合物和方法可用于检测任何DNA靶标。例如,可检测将核酸物质整合到基因组中的任何病毒,因为受试样品可包含细胞基因组DNA–并且指导RNA可被设计成检测整合的核苷酸序列。在一些情况下,本公开的方法不包括扩增步骤。在一些情况下,本公开的方法包括扩增步骤。
在一些情况下,可使用本公开方法确定样品(例如,包含靶DNA和多个非靶DNA的样品)中靶DNA的量。确定样品中靶DNA的量可包括将由测试样品产生的可检测信号的量与由参考样品产生的可检测信号的量进行比较。确定样品中靶DNA的量可包括:测量可检测信号以生成测试测量值;测量由参考样品产生的可检测信号以生成参考测量值;以及将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
例如,在一些情况下,本公开的用于确定样品中靶DNA量的方法包括:a)使样品(例如,包含靶DNA和多个非靶DNA的样品)与以下物质接触:i)与靶DNA杂交的指导RNA;(ii)切割样品中存在的DNA的CasZ多肽;和(iii)检测剂ssDNA;b)测量由CasZ多肽介导的ssDNA切割(例如,检测剂ssDNA的切割)产生的可检测信号,生成测试测量值;c)测量由参考样品产生的可检测信号以生成参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
作为另一个实例,在一些情况下,本公开的用于确定样品中靶DNA量的方法包括:a)使样品(例如,包含靶DNA和多个非靶DNA的样品)与以下物质接触:i)与靶DNA杂交的指导RNA;(ii)切割样品中存在的DNA的CasZ多肽;(iii)tranc RNA;(iv)检测剂ssDNA;b)测量由CasZ多肽介导的ssDNA切割(例如,检测剂ssDNA的切割)产生的可检测信号,生成测试测量值;c)测量由参考样品产生的可检测信号以生成参考测量值;以及d)将测试测量值与参考测量值进行比较,以确定样品中存在的靶DNA的量。
样品中核酸的扩增
在一些实施方案中,可通过将检测与核酸扩增结合来提高主题组合物和/或方法(例如,用于检测细胞基因组DNA中靶DNA(诸如病毒DNA或SNP)的存在)的灵敏度。在一些情况下,在与切割ssDNA的CasZ多肽接触之前扩增样品中的核酸(例如,样品中核酸的扩增可在与CasZ多肽接触之前开始)。在一些情况下,在与CasZ多肽接触的同时扩增样品中的核酸。例如,在一些情况下,主题方法包括扩增样品的核酸(例如,通过使样品与扩增组分接触),之后使扩增的样品与CasZ多肽接触。在一些情况下,主题方法包括在使样品与CasZ多肽接触的同一时间(同时)使样品与扩增组分接触。如果同时添加所有组分(扩增组分和检测组分,诸如CasZ多肽、指导RNA和检测剂DNA),则CasZ多肽的反式切割活性可能会在样品的核酸经历扩增的同时开始降解核酸。但是,即使是这种情况,与不进行扩增的方法相比,同时进行扩增和检测仍然可提高灵敏度。
在一些情况下,例如使用引物从样品中扩增特定序列(例如,病毒的序列,包括目标SNP的序列)。因此,可扩增将与指导RNA杂交的序列以提高主题检测方法的灵敏度–这可实现所需序列的有偏扩增,从而增加样品中存在的目标序列相对于样品中存在的其他序列的拷贝数。作为一个说明性实例,如果使用主题方法来确定给定样品是否包含特定病毒(或特定SNP),则可扩增病毒序列(或非病毒基因组序列)的所需区域,并且如果实际上样品中存在病毒序列(或SNP),则扩增的区域将包括与指导RNA杂交的序列。
如所指出的,在一些情况下,扩增核酸(例如,通过与扩增组分接触),之后使扩增的核酸与CasZ多肽接触。在一些情况下,在与酶活性CasZ多肽接触之前,扩增持续10秒或更长时间(例如,30秒或更长时间、45秒或更长时间、1分钟或更长时间、2分钟或更长时间、3分钟或更长时间、4分钟或更长时间、5分钟或更长时间、7.5分钟或更长时间、10分钟或更长时间等)。在一些情况下,在与活性CasZ多肽接触之前,扩增持续2分钟或更长时间(例如,3分钟或更长时间、4分钟或更长时间、5分钟或更长时间、7.5分钟或更长时间、10分钟或更长时间等)。在一些情况下,扩增持续时间段范围为10秒至60分钟(例如,10秒至40分钟、10秒至30分钟、10秒至20分钟、10秒至15分钟、10秒至10分钟、10秒至5分钟、30秒至40分钟、30秒至30分钟、30秒至20分钟、30秒至15分钟、30秒至10分钟、30秒至5分钟、1分钟至40分钟、1分钟至30分钟、1分钟至20分钟、1分钟至15分钟、1分钟至10分钟、1分钟至5分钟、2分钟至40分钟、2分钟至30分钟、2分钟至20分钟、2分钟至15分钟、2分钟至10分钟、2分钟至5分钟、5分钟至40分钟、5分钟至30分钟、5分钟至20分钟、5分钟至15分钟、或5分钟至10分钟)。在一些情况下,扩增持续时间段范围为5分钟至15分钟。在一些情况下,扩增持续时间段范围为7分钟至12分钟。
在一些情况下,使样品在与CasZ多肽接触的同时与扩增组分接触。在一些此类情况下,CasZ多肽在接触时是无活性的,并且一旦样品中的核酸被扩增就被激活。
各种扩增方法和组分将是本领域的普通技术人员已知的,并且可使用任何方便的方法(参见例如Zanoli和Spoto,Biosensors(Basel).2013年3月;3(1):18–43;Gill和Ghaemi,Nucleosides,Nucleotides,and Nucleic Acids,2008,27:224-243;Craw和Balachandrana,Lab Chip,2012,12,2469-2486;所述文献以引用方式整体并入本文)。核酸扩增可包括聚合酶链式反应(PCR)、逆转录PCR(RT-PCR)、定量PCR(qPCR)、逆转录qPCR(RT-qPCR)、巢式PCR、多重PCR、不对称PCR、降落式PCR、随机引物PCR、半巢式PCR、聚合酶循环组装(PCA)、菌落PCR、连接酶链式反应(LCR)、数字PCR、甲基化特异性PCR(MSP)、较低变性温度下的共扩增-PCR(COLD-PCR)、等位基因特异性PCR、序列间特异性PCR(ISS-PCR)、全基因组扩增(WGA)、反向PCR和热不对称交错PCR(TAIL-PCR)。
在一些情况下,扩增是等温扩增。术语“等温扩增”指示核酸(例如,DNA)扩增的一种方法(例如,使用酶链式反应),该方法可使用单一温度孵育,由此不需要热循环仪。等温扩增是核酸扩增的一种形式,其在扩增反应期间不依赖于靶核酸的热变性,因此可能不需要温度的多次快速变化。因此,等温核酸扩增方法可在实验室环境内部或外部进行。通过与逆转录步骤结合,这些扩增方法可用于等温扩增RNA。
等温扩增方法的实例包括但不限于:环介导等温扩增(LAMP)、解旋酶依赖性扩增(HDA)、重组酶聚合酶扩增(RPA)、链置换扩增(SDA)、基于核酸序列的扩增(NASBA)、转录介导扩增(TMA)、切口酶扩增反应(NEAR)、滚环扩增(RCA)、多置换扩增(MDA)、分枝(RAM)、环状解旋酶依赖性扩增(cHDA)、单引物等温扩增(SPIA)、信号介导RNA扩增技术(SMART)、自我持续序列复制(3SR)、基因组指数扩增反应(GEAR)和等温多置换扩增(IMDA)。
在一些情况下,扩增是重组酶聚合酶扩增(RPA)(参见例如美国专利号8,030,000;8,426,134;8,945,845;9,309,502;和9,663,820,所述专利特此以引用方式整体并入)。重组酶聚合酶扩增(RPA)使用两个相对的引物(非常类似于PCR),并且采用三种酶-重组酶、单链DNA结合蛋白(SSB)和链置换聚合酶。重组酶将双链体DNA中具有同源序列的寡核苷酸引物配对,SSB结合DNA的置换链以防止引物被置换,并且链置换聚合酶开始DNA合成,其中引物已与靶DNA结合。在RPA反应中添加逆转录酶可促进RNA以及DNA的检测,而无需单独的步骤来生产cDNA。RPA反应的组分的一个实例如下(参见例如美国专利号8,030,000;8,426,134;8,945,845;9,309,502;9,663,820):50mM Tris pH 8.4、80mM乙酸钾、10mM乙酸镁、2mMDTT、5%PEG化合物(Carbowax-20M)、3mM ATP、30mM磷酸肌酸、100ng/μl肌酸激酶、420ng/μlgp32、140ng/μl UvsX、35ng/μl UvsY、2000MdNTP、300nM各寡核苷酸、35ng/μl Bsu聚合酶和含核酸样品)。
在转录介导扩增(TMA)中,使用RNA聚合酶从引物区中工程化的启动子制备RNA,然后逆转录酶从引物合成cDNA。然后可使用第三种酶,例如RNA酶H,从cDNA降解RNA靶标,而无需进行热变性步骤。这种扩增技术类似于自我持续序列复制(3SR)和基于核酸序列的扩增(NASBA),但所用的酶有所不同。再例如,解旋酶依赖性扩增(HDA)利用热稳定解旋酶(Tte-UvrD)而非热量来解链dsDNA而产生单链,然后将单链用于通过聚合酶进行杂交和引物延伸。又例如,环介导扩增(LAMP)采用具有链置换能力的热稳定聚合酶和一组四个或更多个特异性设计的引物。每个引物均被设计成具有发夹末端,一旦移位,这些发夹末端便会卡入发夹中,以促进自动引发和进一步的聚合酶延伸。在LAMP反应中,尽管反应在等温条件下进行,但是对于双链靶标来说,需要初始的热变性步骤。另外,扩增产生各种长度产物的梯形图。又例如,链置换扩增(SDA)结合了限制性内切核酸酶对其靶DNA的未修饰链进行切口的能力和外切核酸酶缺陷型DNA聚合酶延伸切口处的3’末端并置换下游DNA链的能力。
检测剂DNA
在一些情况下,主题方法包括使样品(例如,包含靶DNA和多个非靶ssDNA的样品)与以下物质接触:i)CasZ多肽;ii)指导RNA;iii)为单链且不与指导RNA的指导序列杂交的检测剂DNA。
合适的单链检测剂DNA具有7个核苷酸至25个核苷酸的长度。例如,合适的单链检测剂DNA具有7个核苷酸至10个核苷酸、11个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、或20个核苷酸至25个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有10个核苷酸至15个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有10个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有11个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有12个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有13个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有14个核苷酸的长度。在一些情况下,合适的单链检测剂DNA具有15个核苷酸的长度。
在一些情况下,主题方法包括:a)使样品与以下物质接触:经标记的单链检测剂DNA(检测剂ssDNA),所述经标记的单链检测剂DNA包含荧光发射染料对;CasZ多肽,所述CasZ多肽在被激活后会切割经标记的检测剂ssDNA(通过在与靶DNA杂交的指导RNA的情形下与指导RNA结合);以及b)测量由荧光发射染料对产生的可检测信号。例如,在一些情况下,主题方法包括使样品与经标记的检测剂ssDNA接触,所述经标记的检测剂ssDNA包含荧光共振能量转移(FRET)对或猝灭剂/荧光剂对,或两者。在一些情况下,主题方法包括使样品与包含FRET对的经标记的检测剂ssDNA接触。在一些情况下,主题方法包括使样品与包含荧光剂/猝灭剂对的经标记的检测剂ssDNA接触。
荧光发射染料对包含FRET对或猝灭剂/荧光剂对。在FRET对和猝灭剂/荧光剂对的两种情况下,染料中的一种染料的发射光谱与所述对中的另一种染料的吸收光谱的某一区域重叠。如本文所用,术语“荧光发射染料对”是用于涵盖“荧光共振能量转移(FRET)对”和“猝灭剂/荧光剂对”两者的通用术语,这两个术语将在下文更详细地论述。术语“荧光发射染料对”与短语“FRET对和/或猝灭剂/荧光剂对”可互换使用。
在一些情况下(例如,当检测剂ssDNA包括FRET对时),经标记的检测剂ssDNA在被切割之前产生一定量的可检测信号,并且当经标记的检测剂ssDNA被切割时所测量到的可检测信号的量减少。在一些情况下,经标记的检测剂ssDNA在被切割之前产生第一可检测信号(例如,来自FRET对),并且当经标记的检测剂ssDNA被切割时产生第二可检测信号(例如,来自猝灭剂/荧光剂对)。因此,在一些情况下,经标记的检测剂ssDNA包含FRET对和猝灭剂/荧光剂对。
在一些情况下,经标记的检测剂ssDNA包含FRET对。FRET是这样的过程,通过所述过程,能量的无辐射转移发生为从激发态荧光团到紧邻的第二发色团。能量转移可以发生的范围限制在大约10纳米(100埃),并且转移效率对荧光团之间的分开距离非常敏感。因此,如本文所使用,术语“FRET”(“荧光共振能量转移”;也称为“萤光共振能量转移(resonance energy transfer)”)是指这样的物理现象,所述物理现象涉及供体荧光团和匹配的受体荧光团被选择为使得供体的发射光谱与受体的激发光谱重叠,并且被进一步选择为使得当供体和受体彼此非常接近(通常为10nm或更短距离)时,供体的激发将引起来自受体的激发和发射,这是因为一些能量经由量子耦合效应从供体传递到受体。因此,FRET信号用作供体和受体的接近度尺度;只有当它们彼此非常接近时才会产生信号。FRET供体部分(例如,供体荧光团)和FRET受体部分(例如,受体荧光团)在本文中统称为“FRET对”。
供体-受体对(FRET供体部分和FRET受体部分)在本文中被称为“FRET对”或“信号FRET对”。因此,在一些情况下,主题经标记的检测剂ssDNA包含两个信号配偶体(信号对),当一个信号配偶体是FRET供体部分时,另一个信号配偶体是FRET受体部分。因此,当信号配偶体非常接近时(例如,在相同的RNA分子上时),包含这种FRET对(FRET供体部分和FRET受体部分)的主题经标记的检测剂ssDNA将显示可检测信号(FRET信号),但是当所述配偶体分开时(例如,在CasZ多肽切割RNA分子后),信号将减少(或不存在)。
FRET供体和受体部分(FRET对)将是本领域的普通技术人员已知的,并且可以使用任何方便的FRET对(例如,任何方便的供体和受体部分对)。合适的FRET对的实例包括但不限于表1中所示的那些。还参见:Bajar等人Sensors(Basel).2016年9月14日;16(9);和Abraham等人PLoS One.2015年8月3日;10(8):e0134436。
表6.FRET对的实例(供体和受体FRET部分)
供体 受体
色氨酸 丹酰
IAEDANS(1) DDPM(2)
BFP DsRFP
丹酰 异硫氰酸荧光素(FITC)
丹酰 十八烷基罗丹明
青色荧光蛋白(CFP) 绿色荧光蛋白(GFP)
CF(3) 德克萨斯红
荧光素 四甲基罗丹明
Cy3 Cy5
GFP 黄色荧光蛋白(YFP)
BODIPY FL(4) BODIPY FL(4)
罗丹明110 Cy3
罗丹明6G 孔雀石绿
FITC 曙红氨基硫脲
B-藻红蛋白 Cy5
Cy5 Cy5.5
(1)5-(2-碘乙酰基氨基乙基)氨基萘-1-磺酸
(2)N-(4-二甲基氨基-3,5-二硝基苯基)马来酰亚胺
(3)羧基荧光素琥珀酰亚胺酯
(4)4,4-二氟-4-硼杂-3a,4a-二氮杂-s-吲哒省
在一些情况下,当经标记的检测剂ssDNA被切割时产生可检测信号(例如,在一些情况下,经标记的检测剂ssDNA包含猝灭剂/荧光剂对)。信号猝灭对的一个信号配偶体产生可检测信号,而另一个信号配偶体是猝灭剂部分,所述猝灭剂部分猝灭第一信号配偶体的可检测信号(即,猝灭剂部分猝灭信号部分的信号,使得当信号配偶体彼此接近时(例如,当信号对的信号配偶体非常接近时),来自信号部分的信号减少(被猝灭))。
例如,在一些情况下,当经标记的检测剂ssDNA被切割时,可检测信号的量增加。例如,在一些情况下,由一个信号配偶体(信号部分)显示的信号被另一个信号配偶体(猝灭剂信号部分)猝灭,例如当在由CasZ多肽进行切割之前两者存在于相同的ssDNA分子上时。这种信号对在本文中称为“猝灭剂/荧光剂对”、“猝灭对”或“信号猝灭对”。例如,在一些情况下,一个信号配偶体(例如,第一信号配偶体)是产生可检测信号的信号部分,所述可检测信号由第二信号配偶体(例如,猝灭剂部分)猝灭。因此,当配偶体被分开时(例如,在由CasZ多肽切割检测剂ssDNA之后),这种猝灭剂/荧光剂对的信号配偶体将产生可检测信号,但是当配偶体非常接近(例如,在由CasZ多肽切割检测剂ssDNA之前)时,所述信号将被猝灭。
猝灭剂部分可以将来自信号部分的信号(例如,在由CasZ多肽切割检测剂ssDNA之前)猝灭至不同程度。在一些情况下,猝灭剂部分猝灭来自信号部分的信号,其中在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号是在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号的95%或更少。例如,在一些情况下,在存在猝灭剂部分的情况下检测到的信号可以是在不存在猝灭剂部分的情况下检测到的信号的90%或更少、80%或更少、70%或更少、60%或更少、50%或更少、40%或更少、30%或更少、20%或更少、15%或更少、10%或更少、或者5%或更少。在一些情况下,在存在猝灭剂部分的情况下未检测到信号(例如,高于背景)。
在一些情况下,在不存在猝灭剂部分的情况下(当信号配偶体分开时)检测到的信号是在存在猝灭剂部分的情况下(当信号配偶体彼此接近时)检测到的信号的至少1.2倍(例如,至少1.3倍、至少1.5倍、至少1.7倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少7倍、至少10倍、至少20倍或至少50倍)。
在一些情况下,信号部分是荧光标记。在一些此类情况下,猝灭剂部分猝灭来自荧光标记的信号(光信号)(例如,通过吸收标记的发射光谱中的能量)。因此,当猝灭剂部分不与信号部分接近时,来自荧光标记的发射(信号)是可检测的,因为信号不被猝灭剂部分吸收。可以使用任何方便的供体受体对(信号部分/猝灭剂部分对),并且许多合适的对在本领域中是已知的。
在一些情况下,猝灭剂部分从信号部分(在本文中也称为“可检测标记”)吸收能量,然后发射信号(例如,不同波长的光)。因此,在一些情况下,猝灭剂部分本身是信号部分(例如,信号部分可以是6-羧基荧光素,而猝灭剂部分可以是6-羧基-四甲基罗丹明),并且在一些此类情况下,所述对也可以是FRET对。在一些情况下,猝灭剂部分是暗猝灭剂。暗猝灭剂可以吸收激发能量并以不同方式(例如,作为热量)耗散能量。因此,暗猝灭剂本身具有极小荧光至没有荧光(不发射荧光)。暗猝灭剂的实例进一步描述于美国专利号8,822,673和8,586,718;美国专利公布20140378330、20140349295和20140194611;以及国际专利申请:WO200142505和WO200186001中,所有这些专利特此以引用方式整体并入。
荧光标记的实例包括但不限于:Alexa染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTORho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、异硫氰酸荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白(tethered fluorescent protein)。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿和太平洋橙。
在一些情况下,可检测标记是选自以下的荧光标记:Alexa染料、ATTO染料(例如,ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO 495、ATTO 514、ATTO 520、ATTO532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTO Rho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTO Rho13、ATTO 610、ATTO 620、ATTORho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTO Oxa12、ATTO 665、ATTO 680、ATTO700、ATTO 725、ATTO 740)、DyLight染料、花青染料(例如,Cy2、Cy3、Cy3.5、Cy3b、Cy5、Cy5.5、Cy7、Cy7.5)、FluoProbes染料、Sulfo Cy染料、Seta染料、IRIS染料、SeTau染料、SRfluor染料、Square染料、荧光素(FITC)、四甲基罗丹明(TRITC)、德克萨斯红、俄勒冈绿、太平洋蓝、太平洋绿、太平洋橙、量子点和束缚荧光蛋白。
ATTO染料的实例包括但不限于:ATTO 390、ATTO 425、ATTO 465、ATTO 488、ATTO495、ATTO 514、ATTO 520、ATTO 532、ATTO Rho6G、ATTO 542、ATTO 550、ATTO 565、ATTORho3B、ATTO Rho11、ATTO Rho12、ATTO Thio12、ATTO Rho101、ATTO 590、ATTO 594、ATTORho13、ATTO 610、ATTO 620、ATTO Rho14、ATTO 633、ATTO 647、ATTO 647N、ATTO 655、ATTOOxa12、ATTO 665、ATTO 680、ATTO 700、ATTO 725和ATTO 740。
AlexaFluor染料的实例包括但不限于:Alexa350、Alexa/>405、Alexa/>430、Alexa/>488、Alexa/>500、Alexa/>514、Alexa/>532、Alexa/>546、Alexa/>555、Alexa/>568、Alexa/>594、Alexa610、Alexa/>633、Alexa/>635、Alexa/>647、Alexa/>660、Alexa/>680、Alexa/>700、Alexa/>750、Alexa/>790等。
猝灭剂部分的实例包括但不限于:暗猝灭剂、Black Hole (例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇(诸如金纳米颗粒)等。
在一些情况下,猝灭剂部分选自:暗猝灭剂、Black Hole(例如,BHQ-0、BHQ-1、BHQ-2、BHQ-3)、Qxl猝灭剂、ATTO猝灭剂(例如,ATTO 540Q、ATTO 580Q和ATTO 612Q)、二甲氨基偶氮苯磺酸(Dabsyl)、Iowa Black RQ、Iowa Black FQ、IRDye QC-1、QSY染料(例如,QSY 7、QSY 9、QSY 21)、AbsoluteQuencher、Eclipse和金属簇。
ATTO猝灭剂的实例包括但不限于:ATTO 540Q、ATTO 580Q和ATTO 612Q。BlackHole 的实例包括但不限于:BHQ-0(493nm)、BHQ-1(534nm)、BHQ-2(579nm)和BHQ-3(672nm)。
对于一些可检测标记(例如,荧光染料)和/或猝灭剂部分的实例,参见例如Bao等人,Annu Rev Biomed Eng.2009;11:25-47;以及美国专利号8,822,673和8,586,718;美国专利公布20140378330、20140349295、20140194611、20130323851、20130224871、20110223677、20110190486、20110172420、20060179585和20030003486;以及国际专利申请:WO200142505和WO200186001,所有这些文献特此以引用方式整体并入。
在一些情况下,可以通过测量比色读出来检测对经标记的检测剂ssDNA的切割。例如,荧光团的释放(例如,从FRET对释放、从猝灭剂/荧光剂对释放等)可导致可检测信号的波长偏移(并因此色移)。因此,在一些情况下,可以通过色移检测主题经标记的检测剂ssDNA的切割。这种偏移可以表示为一种颜色(波长)信号的量的损失、另一种颜色的量的增益、一种颜色与另一种颜色的比率的变化等。
用于检测靶DNA的试剂盒
本公开提供一种用于例如在包含多个DNA的样品中检测靶DNA的试剂盒。在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,例如FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;和ii)CasZ多肽,和/或编码所述CasZ多肽的核酸。在一些情况下,编码指导RNA的核酸包括供用户***指导序列的序列***位点。
在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,例如FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;ii)tranc RNA和/或编码所述指导RNA的核酸;和iii)CasZ多肽,和/或编码所述CasZ多肽的核酸。在一些情况下,编码指导RNA的核酸包括供用户***指导序列的序列***位点。
在一些情况下,所述试剂盒包含:(a)经标记的检测剂ssDNA(例如,包含荧光发射染料对,例如FRET对和/或猝灭剂/荧光剂对的经标记的检测剂ssDNA);以及(b)以下一项或多项:(i)包含指导RNA和tranc RNA的单分子RNA,和/或编码单分子RNA的核酸;和iii)CasZ多肽,和/或编码所述CasZ多肽的核酸。在一些情况下,编码单分子RNA的核酸包含供用户***指导序列的序列***位点。
在一些情况下,主题试剂盒包含:(a)经标记的检测剂ssDNA,所述经标记的检测剂ssDNA包含荧光发射染料对,例如FRET对和/或猝灭剂/荧光剂对;以及(b)以下一项或多项:(i)指导RNA,和/或编码所述指导RNA的核酸;和/或i)CasZ多肽。
阳性对照
本公开的试剂盒(例如,包含经标记的检测剂ssDNA和CasZ多肽的试剂盒)还可以包含阳性对照靶DNA。在一些情况下,试剂盒还包含阳性对照指导RNA,所述阳性对照指导RNA包含与对照靶DNA杂交的核苷酸序列。在一些情况下,将阳性对照靶DNA以各种量提供在分开的容器中。在一些情况下,将阳性对照靶DNA以各种已知浓度与对照非靶DNA一起提供在分开的容器中。
核酸
虽然本公开的RNA(例如,指导RNA、tranc RNA、包含指导RNA和tranc RNA的单分子RNA)可以使用任何方便的方法合成(例如,使用RNA聚合酶(例如,T7聚合酶、T3聚合酶、SP6聚合酶)在体外化学合成等),但是也设想了编码此类RNA的核酸。另外,虽然可以蛋白质形式提供本公开的CasZ多肽(例如,作为试剂盒的一部分),但是也可以提供编码所述CasZ多肽的核酸(诸如mRNA和/或DNA)。
在一些情况下,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码单分子RNA的核苷酸序列,所述单分子RNA包含:i)指导RNA;和ii)tranc RNA。在一些情况下,核苷酸序列编码没有指导序列的单分子RNA的指导RNA部分。例如,在一些情况下,核酸包含编码以下的核苷酸序列:i)指导RNA(没有指导序列的指导RNA)的恒定区,并且包含编码指导序列的核酸的***位点;和ii)tranc RNA。
例如,在一些情况下,本公开的试剂盒包含核酸(例如,DNA,例如重组表达载体),所述核酸包含编码指导RNA的核苷酸序列。在一些情况下,核苷酸序列编码没有指导序列的指导RNA。例如,在一些情况下,核酸包含编码指导RNA(没有指导序列的指导RNA)的恒定区的核苷酸序列,并且包含编码指导序列的核酸的***位点。在一些情况下,本公开的试剂盒包含核酸(例如,mRNA、DNA,例如重组表达载体),所述核酸包含编码CasZ多肽的核苷酸序列。
在一些情况下,编码指导RNA的核苷酸序列与启动子可操作地连接,所述启动子是例如在原核细胞中是功能性的启动子、在真核细胞中是功能性的启动子、在哺乳动物细胞中是功能性的启动子、在人细胞中是功能性的启动子等。在一些情况下,编码CasZ多肽的核苷酸序列与启动子可操作地连接,所述启动子是例如在原核细胞中是功能性的启动子、在真核细胞中是功能性的启动子、在哺乳动物细胞中是功能性的启动子、在人细胞中是功能性的启动子、细胞类型特异性启动子、可调控启动子、组织特异性启动子等。
实用性
CasZ组合物(例如,表达载体、试剂盒、组合物、核酸等)可用于多种方法。例如,本公开的CasZ组合物可用于(i)修饰(例如切割,例如切口;甲基化等)靶核酸(DNA或RNA;单链或双链);(ii)调节靶核酸的转录;(iii)标记靶核酸;(iv)结合靶核酸(例如,用于分离、标记、成像、追踪等的目的);(v)修饰与靶核酸相关联的多肽(例如,组蛋白)等。因此,本公开提供一种修饰靶核酸的方法。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)本公开的CasZ多肽;和b)一种或多种(例如,两种)CasZ指导RNA。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)CasZ多肽;和b)一种或多种(例如,两种)CasZ指导RNA;和c)CasZ trancRNA。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)本公开的CasZ多肽;b)CasZ指导RNA;和c)供体核酸(例如,供体模板)。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:a)CasZ多肽;b)CasZ指导RNA;c)CasZ trancRNA;和d)供体核酸(例如,供体模板)。在一些情况下,接触步骤在体外细胞中进行。在一些情况下,接触步骤在体内细胞中进行。在一些情况下,接触步骤在离体细胞中进行。
因为使用CasZ多肽的方法包括将CasZ多肽与靶核酸中的特定区域结合(通过相关联的CasZ指导RNA靶向靶核酸中的特定区域),所述方法在本文中一般称为结合方法(例如,结合靶核酸的方法)。然而,应理解在一些情况下,虽然结合方法可能无非是导致靶核酸的结合,但在其他情况下,所述方法可具有不同的最终结果(例如,所述方法可导致靶核酸的修饰(例如,切割/甲基化等);从靶核酸转录的调节;靶核酸翻译的调节;基因组编辑;与靶核酸相关联的蛋白质的调节;靶核酸的分离等)。
对于合适方法的实例(例如,与CRISPR/Cas9***一起使用的方法),参见例如Jinek等人,Science.2012年8月17日;337(6096):816-21;Chylinski等人,RNA Biol.2013年5月;10(5):726-37;Ma等人,Biomed Res Int.2013;2013:270805;Hou等人,Proc NatlAcad Sci U S A.2013年9月24日;110(39):15644-9;Jinek等人,Elife.2013;2:e00471;Pattanayak等人,Nat Biotechnol.2013年9月;31(9):839-43;Qi等人,Cell.2013年2月28日;152(5):1173-83;Wang等人,Cell.2013年5月9日;153(4):910-8;Auer等人,GenomeRes.2013年10月31日;Chen等人,Nucleic Acids Res.2013年11月1日;41(20):e19;Cheng等人,Cell Res.2013年10月;23(10):1163-71;Cho等人,Genetics.2013年11月;195(3):1177-80;DiCarlo等人,Nucleic Acids Res.2013年4月;41(7):4336-43;Dickinson等人,Nat Methods.2013年10月;10(10):1028-34;Ebina等人,Sci Rep.2013;3:2510;Fujii等人,Nucleic Acids Res.2013年11月1日;41(20):e187;Hu等人,Cell Res.2013年11月;23(11):1322-5;Jiang等人,Nucleic Acids Res.2013年11月1日;41(20):e188;Larson等人,Nat Protoc.2013年11月;8(11):2180-96;Mali等人,Nat Methods.2013年10月;10(10):957-63;Nakayama等人,Genesis.2013年12月;51(12):835-43;Ran等人,Nat Protoc.2013年11月;8(11):2281-308;Ran等人,Cell.2013年9月12日;154(6):1380-9;Upadhyay等人,G3(Bethesda).2013年12月9日;3(12):2233-8;Walsh等人,Proc Natl Acad Sci U SA.2013年9月24日;110(39):15514-5;Xie等人,Mol Plant.2013年10月9日;Yang等人,Cell.2013年9月12日;154(6):1370-9;以及以下美国专利和专利申请:8,906,616;8,895,308;8,889,418;8,889,356;8,871,445;8,865,406;8,795,965;8,771,945;8,697,359;20140068797;20140170753;20140179006;20140179770;20140186843;20140186919;20140186958;20140189896;20140227787;20140234972;20140242664;20140242699;20140242700;20140242702;20140248702;20140256046;20140273037;20140273226;20140273230;20140273231;20140273232;20140273233;20140273234;20140273235;20140287938;20140295556;20140295557;20140298547;20140304853;20140309487;20140310828;20140310830;20140315985;20140335063;20140335620;20140342456;20140342457;20140342458;20140349400;20140349405;20140356867;20140356956;20140356958;20140356959;20140357523;20140357530;20140364333;和20140377868;所述文献各自特此以引用方式整体并入。
例如,本公开提供(但不限于)切割靶核酸的方法;编辑靶核酸的方法;调节靶从核酸转录的方法;分离靶核酸的方法、结合靶核酸的方法、对靶核酸成像的方法、修饰靶核酸的方法等。
如本文所用,术语/短语“使靶核酸,例如,与CasZ多肽或与CasZ融合多肽等接触”,涵盖用于接触靶核酸的所有方法。例如,可将CasZ多肽作为蛋白质、RNA(编码CasZ多肽)或DNA(编码CasZ多肽)提供给细胞;而可将CasZ指导RNA作为指导RNA或编码指导RNA的核酸提供,并且可将CasZ trancRNA作为trancRNA或编码trancRNA的核酸提供。因此,当例如在细胞中(例如,在体外细胞内部、在体内细胞内部、在离体细胞内部)执行方法时,包括接触靶核酸的方法涵盖将处于活性/最终状态的任何或所有组分(例如,呈CasZ多肽的一种或多种蛋白质形式;呈CasZ融合多肽的蛋白质形式;在一些情况下呈指导RNA的RNA形式)引入细胞中,并且还涵盖将编码一种或多种组分的一种或多种核酸(例如,一种或多种包含编码CasZ多肽或CasZ融合多肽的一种或多种核苷酸序列的核酸、一种或多种包含编码一种或多种指导RNA的一种或多种核苷酸序列的核酸、包含编码供体模板的核苷酸序列的核酸等)引入细胞中。因为所述方法也可在体外在细胞外部执行,所以包括接触靶核酸的方法(除非另外指明)涵盖在体外在细胞外部、在体外在细胞内部、在体内在细胞内部、离体在细胞内部接触等。
在一些情况下,本公开的用于修饰靶核酸的方法包括向靶细胞中引入CasZ基因座,例如来自包含CasZ基因座的细胞(例如,在一些情况下,处于天然状态(天然存在的状态)包含CasZ基因座的细胞)的核酸,所述核酸包含编码CasZ多肽的核苷酸序列以及长度为约1千碱基(kb)至5kb的在编码CasZ的核苷酸序列周围的核苷酸序列,其中靶细胞通常(在天然状态下)不包含CasZ基因座(例如,在一些情况下,基因座包含CasZ trancRNA)。然而,可以修饰一个或多个间隔序列,一个或多个编码crRNA的编码指导序列,使得靶向一个或多个目标靶序列。因此,例如,在一些情况下,本公开的用于修饰靶核酸的方法包括向靶细胞中引入CasZ基因座,例如,从源细胞(例如,在一些情况下,处于天然状态(天然存在的状态)包含CasZ基因座的细胞)获得的核酸,其中核酸具有100个核苷酸(nt)至5kb(例如,100nt至500nt、500nt至1kb、1kb至1.5kb、1.5kb至2kb、2kb至2.5kb、2.5kb至3kb、3kb至3.5kb、3.5kb至4kb、或4kb至5kb)的长度并且包含编码CasZ多肽的核苷酸序列。如上所述,在一些此类情况下,可以修饰一个或多个间隔序列,一个或多个编码crRNA的编码指导序列,使得靶向一个或多个目标靶序列。在一些情况下,所述方法包括向靶细胞中引入:i)CasZ基因座;和ii)供体DNA模板。在一些情况下,靶核酸在体外无细胞组合物中。在一些情况下,靶核酸存在于靶细胞中。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是原核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是真核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是哺乳动物细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是植物细胞。
在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与本公开的CasZ多肽或本公开的CasZ融合多肽接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与CasZ多肽和CasZ指导RNA接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与CasZ多肽、CasZ指导RNA和CasZ trancRNA接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与CasZ多肽、第一CasZ指导RNA和第二CasZ指导RNA(以及在一些情况下,CasZ trancRNA)接触。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:本公开的CasZ多肽,和CasZ指导RNA,和供体DNA模板。在一些情况下,本公开的用于修饰靶核酸的方法包括使靶核酸与以下物质接触:本公开的CasZ多肽,和CasZ指导RNA,和CasZ trancRNA,和供体DNA模板。
在一些情况下,靶核酸在体外无细胞组合物中。在一些情况下,靶核酸存在于靶细胞中。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是原核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是真核细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是哺乳动物细胞。在一些情况下,靶核酸存在于靶细胞中,其中靶细胞是植物细胞。
目标靶核酸和靶细胞
靶核酸可以是任何核酸(例如,DNA、RNA),可以是双链或单链的,可以是任何类型的核酸(例如,染色体(基因组DNA)、衍生自染色体、染色体DNA、质粒、病毒、细胞外、细胞内、线粒体、叶绿体、线性、环状等)并且可来自任何生物体(例如,只要CasZ指导RNA包含与靶核酸中的靶序列杂交的核苷酸序列,使得靶核酸可被靶向即可)。
靶核酸可以是DNA或RNA。靶核酸可以是双链的(例如,dsDNA、dsRNA)或单链的(例如,ssRNA、ssDNA)。在一些情况下,靶核酸是单链的。在一些情况下,靶核酸是单链RNA(ssRNA)。在一些情况下,靶ssRNA(例如,靶细胞ssRNA、病毒ssRNA等)选自:mRNA、rRNA、tRNA、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和微小RNA(miRNA)。在一些情况下,靶核酸是单链DNA(ssDNA)(例如,病毒DNA)。如上所指出,在一些情况下,靶核酸是单链的。
靶核酸可位于任何地方,例如,体外细胞外部、体外细胞内部、体内细胞内部、离体细胞内部。合适的靶细胞(其可包含靶核酸,诸如基因组DNA)包括但不限于:细菌细胞;古细菌细胞;单细胞真核生物体的细胞;植物细胞;藻类细胞,例如,布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞;昆虫(例如,蚊子;蜜蜂;农业害虫等)的细胞;蛛形纲动物(例如,蜘蛛;蜱等)的细胞;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞;来自哺乳动物的细胞(例如,来自啮齿动物的细胞;来自人类的细胞;非人哺乳动物的细胞;啮齿动物(例如,小鼠、大鼠)的细胞;兔形目动物(例如,兔)的细胞;有蹄类动物(例如,牛、马、骆驼、美洲驼、骆马、绵羊、山羊等)的细胞;海洋哺乳动物(例如,鲸鱼、海豹、象海豹、海豚、海狮等)的细胞等。任何类型的细胞都可以是感兴趣的(例如干细胞,例如胚胎干(ES)细胞、诱导多能干(iPS)细胞、生殖细胞(例如,***、***、卵原细胞、***等)、成体干细胞、体细胞(例如,成纤维细胞)、造血细胞、神经元、肌肉细胞、骨细胞、肝细胞、胰腺细胞;在任何阶段下胚胎的体外或体内胚胎细胞(例如,1个细胞、2个细胞、4个细胞、8个细胞等阶段斑马鱼胚胎)等)。
细胞可来自已建立的细胞系或者它们可以是原代细胞,其中“原代细胞”、“原代细胞系”和“原代培养物”在本文中可互换使用,是指衍生自受试者并且允许培养物在体外生长有限次数的传代(即,***)的细胞和细胞培养物。例如,原代培养物是可能已传代0次、1次、2次、4次、5次、10次或15次但不足以通过转折期的次数的培养物。通常,原代细胞系在体外维持少于10代。靶细胞可以是单细胞生物体并且/或者可在培养物中生长。如果细胞是原代细胞,它们可通过任何方便的方法从个体收获。例如,白细胞可通过血浆分离置换法、白细胞血浆分离置换法、密度梯度分离等方便地收获,而来自组织(诸如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等)的细胞可通过活组织检查方便地收获。
在上述申请的一些申请中,主题方法可用于在体内和/或离体和/或体外的有丝***细胞或有丝***后细胞中诱导靶核酸切割、靶核酸修饰和/或结合靶核酸(例如,用于可视化,用于采集和/或分析等)(例如,以破坏由靶向mRNA编码的蛋白质的产生,以切割或以其他方式修饰靶DNA,以遗传修饰靶细胞等)。因为指导RNA通过与靶核酸杂交来提供特异性,所以在公开的方法中目标有丝***细胞和/或有丝***后细胞可包括来自任何生物体的细胞(例如,细菌细胞;古细菌细胞;单细胞真核生物体的细胞;植物细胞;藻类细胞,例如布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等;真菌细胞(例如,酵母细胞);动物细胞;来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞;来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞;来自哺乳动物的细胞;来自啮齿动物的细胞;来自人的细胞等)。在一些情况下,可将主题CasZ蛋白(和/或编码蛋白质的核酸,诸如DNA和/或RNA)和/或CasZ指导RNA(和/或编码指导RNA的DNA)和/或供体模板和/或RNP引入个体(即,靶细胞可在体内)(例如,哺乳动物、大鼠、小鼠、猪、灵长类动物、非人灵长类动物、人等)中。在一些情况下,这种施用可例如通过编辑靶向细胞的基因组用于治疗和/或预防疾病的目的。
植物细胞包括单子叶植物细胞和双子叶植物细胞。细胞可以是根细胞、叶细胞、木质部细胞、韧皮部细胞、形成层细胞、顶端分生组织细胞、实质细胞、厚角组织细胞、厚壁组织细胞等。植物细胞包括农作物的细胞,诸如小麦、玉米、大米、高粱、小米、大豆等的细胞。植物细胞包括农业水果和坚果植物的细胞,例如生产杏、橙子、柠檬、苹果、李子、梨、杏仁等的植物的细胞。
靶细胞的其他实例在上文标题为“修饰的细胞”的部分中列出。细胞(靶细胞)的非限制性实例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如,来自植物作物、水果、蔬菜、谷物、大豆、玉米(corn)、玉米(maize)、小麦、种子、番茄、大米、木薯、甘蔗、南瓜、干草、马铃薯、棉花、烟草、开花植物、针叶树、裸子植物、被子植物、蕨类植物、石松类、角苔类、苔类、苔藓、双子叶植物、单子叶植物等的细胞)、藻类细胞(例如,布朗葡萄藻、莱茵衣藻、海洋富油微拟球藻、蛋白核小球藻、展枝马尾藻、羽藻等)、海藻(例如巨藻)、真菌细胞(例如,酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如,鱼类、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如,有蹄类动物(例如,猪、牛、山羊、绵羊);啮齿动物(例如,大鼠、小鼠);非人灵长类动物;人;猫科动物(例如,猫);犬(例如,狗)等)的细胞等。在一些情况下,细胞是不源自天然生物体的细胞(例如,细胞可以是合成制得的细胞;也称为人造细胞)。
细胞可以是体外细胞(例如,建立的培养细胞系)。细胞可以是离体细胞(来自个体的培养细胞)。细胞可以是体内细胞(例如,个体中的细胞)。细胞可以是分离的细胞。细胞可以是生物体内部的细胞。细胞可以是生物体。细胞可以是细胞培养物(例如,体外细胞培养物)中的细胞。细胞可以是细胞集合中的一者。细胞可以是原核细胞或衍生自原核细胞。细胞可以是细菌细胞或可衍生自细菌细胞。细胞可以是古细菌细胞或衍生自古细菌细胞。细胞可以是真核细胞或衍生自真核细胞。细胞可以是植物细胞或衍生自植物细胞。细胞可以是动物细胞或衍生自动物细胞。细胞可以是无脊椎动物细胞或衍生自无脊椎动物细胞。细胞可以是脊椎动物细胞或衍生自脊椎动物细胞。细胞可以是哺乳动物细胞或衍生自哺乳动物细胞。细胞可以是啮齿动物细胞或衍生自啮齿动物细胞。细胞可以是人细胞或衍生自人细胞。细胞可以是微生物细胞或衍生自微生物细胞。细胞可以是真菌细胞或衍生自真菌细胞。细胞可以是昆虫细胞。细胞可以是节肢动物细胞。细胞可以是原生动物细胞。细胞可以是蠕虫细胞。
合适的细胞包括干细胞(例如胚胎干(ES)细胞、诱导多能干(iPS)细胞;生殖细胞(例如,***、***、卵原细胞、***等);体细胞,例如成纤维细胞、少突胶质细胞、神经胶质细胞、造血细胞、神经元、肌细胞、骨细胞、肝细胞、胰腺细胞等。
合适的细胞包括人胚胎干细胞、胚胎心肌细胞、肌成纤维细胞、间充质干细胞、自体移植的扩增的心肌细胞、脂肪细胞、全能细胞、多能细胞、血液干细胞、成肌细胞、成体干细胞、骨髓细胞、间充质细胞、胚胎干细胞、实质细胞、上皮细胞、内皮细胞、间皮细胞、成纤维细胞、成骨细胞、软骨细胞、外源细胞、内源细胞、干细胞、造血干细胞、骨髓衍生祖细胞、心肌细胞、骨骼细胞、胎儿细胞、未分化细胞、多能祖细胞、单能祖细胞、单核细胞、心脏成肌细胞、骨骼成肌细胞、巨噬细胞、毛细血管内皮细胞、异种细胞、同种异体细胞和产后干细胞。
在一些情况下,细胞是免疫细胞、神经元、上皮细胞和内皮细胞或干细胞。在一些情况下,免疫细胞是T细胞、B细胞、单核细胞、天然杀伤细胞、树突状细胞或巨噬细胞。在一些情况下,免疫细胞是细胞毒性T细胞。在一些情况下,免疫细胞是辅助性T细胞。在一些情况下,免疫细胞是调节性T细胞(Treg)。
在一些情况下,细胞是干细胞。干细胞包括成体干细胞。成体干细胞也称为体细胞干细胞。
成体干细胞驻留在分化组织中,但保留自我更新的特性和产生多种细胞类型的能力,通常是干细胞所存在于的组织中的典型细胞类型。体细胞干细胞的许多实例是本领域的技术人员已知的,包括肌肉干细胞;造血干细胞;上皮干细胞;神经干细胞;间充质干细胞;乳腺干细胞;肠干细胞;中胚层干细胞;内皮干细胞;嗅干细胞;神经嵴干细胞等。
目标干细胞包括哺乳动物干细胞,其中术语“哺乳动物”是指被分类为哺乳动物的任何动物,包括人;非人灵长类动物;家畜和农场动物;以及动物园、实验室、运动或宠物动物,诸如狗、马、猫、牛、小鼠、大鼠、兔等。在一些情况下,干细胞是人干细胞。在一些情况下,干细胞是啮齿动物(例如,小鼠;大鼠)干细胞。在一些情况下,干细胞是非人灵长类动物干细胞。
干细胞可表达一种或多种干细胞标志物,例如SOX9、KRT19、KRT7、LGR5、CA9、FXYD2、CDH6、CLDN18、TSPAN8、BPIFB1、OLFM4、CDH17和PPARGC1A。
在一些情况下,干细胞是造血干细胞(HSC)。HSC是中胚层衍生的细胞,其可从骨髓、血液、脐带血、胎儿肝脏和卵黄囊中分离。HSC的特征在于CD34+和CD3-。HSC可在体内重新生成红系细胞、中性粒细胞-巨噬细胞、巨核细胞和淋巴样造血细胞谱系。在体外,可诱导HSC经历至少一些自我更新的细胞***,并且可诱导HSC分化成与体内所见相同的谱系。因此,可诱导HSC分化成红系细胞、巨核细胞、中性粒细胞、巨噬细胞和淋巴细胞中的一种或多种。
在其他情况下,干细胞是神经干细胞(NSC)。神经干细胞(NSC)能够分化成神经元和神经胶质细胞(包括少突胶质细胞和星形胶质细胞)。神经干细胞是能够进行多次***的多能干细胞,并且在特定条件下可产生作为神经干细胞的子细胞,或可作为成神经细胞或成胶质细胞的神经祖细胞,例如,分别致力于成为一种或多种类型的神经元和神经胶质细胞的细胞。获得NSC的方法在本领域中是已知的。
在其他情况下,干细胞是间充质干细胞(MSC)。MSC最初衍生自胚胎中胚层并从成人骨髓中分离,可分化形成肌肉、骨、软骨、脂肪、骨髓基质和肌腱。分离MSC的方法在本领域中是已知的;并且可使用任何已知的方法来获得MSC。参见例如美国专利号5,736,396,其描述了人MSC的分离。
在一些情况下,细胞是植物细胞。植物细胞可以是单子叶植物的细胞。细胞可以是双子叶植物的细胞。
在一些情况下,细胞是植物细胞。例如,细胞可以是主要农业植物的细胞,例如大麦、豆类(干食用)、油菜、玉米、棉花(皮玛棉)、棉花(陆地棉)、亚麻籽、干草(苜蓿)、干草(非苜蓿)、燕麦、花生、大米、高粱、大豆、甜菜、甘蔗、向日葵(油)、向日葵(非油)、甘薯、烟草(白肋烟)、烟草(烤烟)、番茄、小麦(硬质小麦)、小麦(春小麦)、小麦(冬小麦)等。作为另一个实例,细胞是蔬菜作物的细胞,所述蔬菜作物包括但不限于例如,苜蓿芽、芦荟叶、葛根、慈菇、朝鲜蓟、芦笋、竹笋、香蕉花、豆芽、豆类、甜菜叶、甜菜、苦瓜、白菜、西兰花、球花甘蓝(芜菁)、球芽甘蓝、卷心菜、卷心菜芽、仙人掌叶(仙人掌果)、笋瓜、刺棘蓟、胡萝卜、花椰菜、芹菜、佛手瓜、中国洋蓟、大白菜、中国芹菜、中国韭菜、菜心、菊花叶(茼蒿)、羽衣甘蓝、玉米秸秆、甜玉米、黄瓜、白萝卜、蒲公英嫩叶、芋头、dau mue、donqua(冬瓜)、茄子、菊苣、莴苣、琴头蕨、田地水芹、苦苣、盖菜(芥菜)、gailon、良姜(暹罗、泰国姜)、大蒜、姜根、牛蒡、嫩叶、汉诺威沙拉用绿叶、huauzontle、洋姜、豆薯、羽衣甘蓝嫩叶、大头菜、羊腿藜、生菜(贝比生菜)、生菜(波士顿生菜)、生菜(波士顿红生菜)、生菜(绿叶)、生菜(冰山生菜)、生菜(红毛菜)、生菜(绿橡树叶)、生菜(红橡树叶)、生菜(加工生菜)、生菜(红叶)、生菜(罗马生菜)、生菜(红罗马生菜)、生菜(俄罗斯红芥末)、linkok、白萝卜、长豆、莲藕、野苣、龙舌兰(龙舌兰)叶、黄肉芋、混和生菜、京水菜、moap(光滑丝瓜)、moo、moqua(有绒毛的南瓜)、蘑菇、芥末、山药、秋葵、通菜、洋葱嫩叶、opo(长南瓜)、观赏玉米、观赏葫芦、欧芹、欧洲防风草、豌豆、辣椒(铃铛型)、辣椒、南瓜、菊苣、萝卜芽、萝卜、青芸苔、青芸苔、大黄、罗马生菜、芜菁甘蓝、盐角草(海豆)、丝瓜(角形/脊状丝瓜)、菠菜、南瓜、稻草捆、甘蔗、甘薯、唐莴苣、罗望子、芋艿、芋艿叶、芋艿芽、塌棵菜、tepeguaje(葫芦)、红瓜、粘果酸浆、番茄、番茄(樱桃型)、番茄(葡萄型)、番茄(李子型)、姜黄、芜菁茎嫩叶、芜菁、荸荠、薯蓣、山药(名称)、油菜、木薯(木薯)等。
在一些情况下,细胞是节肢动物细胞。例如,细胞可以是以下的亚目、家族、亚家族、群体、亚群或物种的细胞:例如,有螯肢亚门(Chelicerata)、多足亚门(Myriapodia)、Hexipodia、蛛形纲(Arachnida)、昆虫纲(Insecta)、石蛃目(Archaeognatha)、缨尾目(Thysanura)、古翅下纲(Palaeoptera)、蜉蝣目(Ephemeroptera)、蜻蜓目(Odonata)、差翅亚目(Anisoptera)、束翅亚目(Zygoptera)、新翅亚纲(Neoptera)、外翅总目(Exopterygota)、襀翅目(Plecoptera)、纺足目(Embioptera)、直翅目(Orthoptera)、缺翅目(Zoraptera)、革翅目(Dermaptera)、网翅目(Dictyoptera)、蛩蠊目(Notoptera)、蛩蠊科(Grylloblattidae)、螳科(Mantophasmatidae)、竹节虫目(Phasmatodea)、蜚蠊目(Blattaria)、等翅目(Isoptera)、螳螂目(Mantodea)、Parapneuroptera、啮虫目(Psocoptera)、缨翅目(Thysanoptera)、虱毛目(Phthiraptera)、半翅目(Hemiptera)、内翅类(Endopterygota)或全***类(Holometabola)、膜翅目(Hymenoptera)、鞘翅目(Coleoptera)、捻翅目(Strepsiptera)、蛇蛉目(Raphidioptera)、广翅目(Megaloptera)、脉翅目(Neuroptera)、长翅目(Mecoptera)、蚤目(Siphonaptera)、双翅目(Diptera)、毛翅目(Trichoptera)或鳞翅目(Lepidoptera)。
在一些情况下,细胞是昆虫细胞。例如,在一些情况下,细胞是蚊子、蚱蜢、半翅目昆虫、苍蝇、跳蚤、蜜蜂、黄蜂、蚂蚁、虱子、蛾或甲虫的细胞。
供体多核苷酸(供体模板)
在CasZ指导RNA的指导下,CasZ蛋白在一些情况下在双链DNA(dsDNA)靶核酸内生成位点特异性双链断裂(DSB)或单链断裂(SSB)(例如,当CasZ蛋白是切口酶变体时),这些断裂通过非同源末端连接(NHEJ)或同源定向重组(HDR)修复。
在一些情况下,使靶DNA(与CasZ蛋白和CasZ指导RNA)接触在允许非同源末端连接或同源定向修复的条件下发生。因此,在一些情况下,主题方法包括使靶DNA与供体多核苷酸接触(例如,通过将供体多核苷酸引入细胞中),其中将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合到靶DNA中。在一些情况下,所述方法不包括使细胞与供体多核苷酸接触,并且修饰靶DNA使得靶DNA内的核苷酸缺失。
在一些情况下,CasZ trancRNA(或编码CasZ trancRNA的核酸)、CasZ指导RNA(或编码CasZ指导RNA的核酸)和/或CasZ蛋白(或编码CasZ蛋白的核酸,诸如RNA或DNA,例如一种或多种表达载体)与供体多核苷酸序列共同施用(例如,与靶核酸接触、向细胞施用等),所述供体多核苷酸序列包括与靶DNA序列同源的至少一个区段,主题方法可用于将核酸物质添加(即***或替代)到靶DNA序列(例如以“敲入”核酸,例如编码蛋白质、siRNA、miRNA的核酸等),添加标签(例如,6xHis、荧光蛋白(例如,绿色荧光蛋白;黄色荧光蛋白等)、血凝素(HA)、FLAG等),将调控序列添加到基因(例如启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等),修饰核酸序列(例如,引入突变、通过引入正确的序列去除致病突变)等。因此,包含CasZ指导RNA和CasZ蛋白(或CasZ指导RNA和CasZ trancRNA和CasZ蛋白)的复合物可用于任何体外或体内应用中,在所述应用中希望以位点特异性(即“靶向的”)方式修饰DNA,例如基因敲除、基因敲入、基因编辑、基因标签等,例如,如在例如治疗疾病或作为抗病毒、抗病原体或抗癌治疗剂的基因疗法,农业中遗传修饰的生物体的生产,出于治疗、诊断或研究目的通过细胞进行的大规模蛋白质生产,iPS细胞诱导,生物研究,用于缺失或替代的病原体基因的靶向等中所使用的。
在其中希望将多核苷酸序列***靶序列被切割的基因组中的应用中,还可向细胞提供供体多核苷酸(包含供体序列的核酸)。“供体序列”或“供体多核苷酸”或“供体模板”意指待在CasZ蛋白切割的位点处***的核酸序列(例如,在dsDNA切割之后、对靶DNA进行切口之后、对靶DNA进行双切口之后等)。供体多核苷酸可含有与靶位点处的基因组序列足够的同源性(例如与侧接靶位点,例如在靶位点的约50个或更少的碱基内(例如约30个碱基内、约15个碱基内、约10个碱基内、约5个碱基内)的核苷酸序列或直接侧接靶位点的核苷酸序列,具有70%、80%、85%、90%、95%或100%的同源性),以支持所述供体多核苷酸与和其具有同源性的基因组序列之间的同源定向修复。在供体与基因组序列之间具有序列同源性的大约25个、50个、100个或200个核苷酸或多于200个核苷酸(或10与200之间任何整数值的核苷酸或更多)可支持同源定向修复。供体多核苷酸可具有任何长度,例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。
供体序列通常不与它替代的基因组序列相同。而且,供体序列相对于基因组序列可含有至少一个或多个单个碱基变化、***、缺失、反转或重排,只要存在足够同源性以支持同源定向修复即可(例如,用于基因校正,例如,以转化致病碱基对或非致病碱基对)。在一些实施方案中,供体序列包含侧接两个同源区的非同源序列,以使得靶DNA区域与两个侧接序列之间的同源定向修复导致在靶区域处***非同源序列。供体序列还可包含载体骨架,所述载体骨架含有不与目标DNA区域同源并且不意图***到目标DNA区域中的序列。通常,供体序列的一个或多个同源区将与希望与其重组的基因组序列具有至少50%的序列同一性。在某些实施方案中,存在60%、70%、80%、90%、95%、98%、99%或99.9%的序列同一性。根据供体多核苷酸的长度,可存在1%与100%之间的任何值的序列同一性。
供体序列与基因组序列相比可包含某些序列差异,例如限制位点、核苷酸多态性、可选择标记(例如,抗药基因、荧光蛋白、酶等)等,所述序列差异可用来评估供体序列在切割位点处的成功***或在一些情况下可用于其他目的(例如,表示靶向基因组基因座处的表达)。在一些情况下,如果位于编码区中,此类核苷酸序列差异将不会改变氨基酸序列,或将产生沉默氨基酸变化(即,不影响蛋白质结构或功能的变化)。可替代地,这些序列差异可包括侧接重组序列,诸如FLP、loxP序列等,所述侧接重组序列可在去除标记序列之后的时间里激活。
在一些情况下,供体序列作为单链DNA提供给细胞。在一些情况下,供体序列作为双链DNA提供给细胞。它可以线性或环状形式引入细胞中。如果以线性形式引入,供体序列的末端可通过任何方便的方法来保护(例如,免受核酸外切降解),并且此类方法是本领域的技术人员已知的。例如,可将一个或多个双脱氧核苷酸残基添加到线性分子的3’末端,并且/或者可将自身互补寡核苷酸连接至一个或两个末端。参见例如Chang等人(1987)Proc.Natl.Acad Sci USA 84:4959-4963;Nehls等人(1996)Science 272:886-889。用于保护外源多核苷酸免受降解的另外方法包括但不限于添加一个或多个末端氨基以及使用修饰的核苷酸间键联,例如像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。作为保护线性供体序列的末端的替代方案,可在同源区外部包括额外长度的序列,所述序列可在不影响重组的情况下降解。可将供体序列作为载体分子的一部分引入细胞中,所述载体分子具有另外的序列,例如像复制起点、启动子和编码抗生素耐药性的基因。此外,供体序列可作为裸核酸、作为与剂(诸如脂质体或泊洛沙姆)复合的核酸引入,或者可通过病毒(例如,腺病毒AAV)来递送,如本文其他地方对于编码CasZ指导RNA和/或CasZ融合多肽和/或供体多核苷酸的核酸所述。
转基因非人生物体
如上所述,在一些情况下,本公开的核酸(例如,重组表达载体)(例如,包含编码CasZ多肽的核苷酸序列的核酸;包含编码CasZ融合多肽的核苷酸序列的核酸等)用作转基因以生成转基因非人生物体,所述转基因非人生物体产生本公开的CasZ多肽或CasZ融合多肽。本公开提供一种转基因非人生物体,所述转基因非人生物体包含编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列。
转基因非人动物
本公开提供一种转基因非人动物,所述动物包含转基因,所述转基因包含含有编码CasZ多肽或CasZ融合多肽的核苷酸序列的核酸。在一些实施方案中,转基因非人动物的基因组包含编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列。在一些情况下,转基因非人动物对于遗传修饰是纯合的。在一些情况下,转基因非人动物对于遗传修饰是杂合的。在一些实施方案中,转基因非人动物是脊椎动物,例如鱼类(例如,鲑鱼、鳟鱼、斑马鱼、金鱼、河豚、洞穴鱼等)、两栖动物(青蛙、蝾螈、火蜥蜴等)、鸟类(例如,鸡、火鸡等)、爬行动物(例如,蛇、蜥蜴等)、非人哺乳动物(例如,有蹄类动物,例如猪、牛、山羊、绵羊等;兔形目动物(例如,兔);啮齿动物(例如,大鼠、小鼠);非人灵长类动物等)等。在一些情况下,转基因非人动物是无脊椎动物。在一些情况下,转基因非人动物是昆虫(例如,蚊子;农业害虫等)。在一些情况下,转基因非人动物是蛛形纲动物。
编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列可在未知启动子(例如,当核酸随机整合到宿主细胞基因组中时)的控制之下(即,可操作地连接至未知启动子)或可在已知启动子的控制之下(即,可操作地连接至已知启动子)。合适的已知启动子可以是任何已知启动子并且包括组成型活性启动子(例如,CMV启动子)、诱导型启动子(例如,热休克启动子、四环素调控的启动子、类固醇调控的启动子、金属调控的启动子、***受体调控的启动子等)、空间限制的和/或时间限制的启动子(例如,组织特异性启动子、细胞类型特异性启动子等)等。
转基因植物
如上所述,在一些情况下,本公开的核酸(例如,重组表达载体)(例如,包含编码本公开的CasZ多肽的核苷酸序列的核酸;包含编码本公开的CasZ融合多肽的核苷酸序列的核酸等)用作转基因以生成转基因植物,所述转基因植物产生本公开的CasZ多肽或CasZ融合多肽。本公开提供一种转基因植物,所述转基因植物包含编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列。在一些实施方案中,转基因植物的基因组包含主题核酸。在一些实施方案中,转基因植物对于遗传修饰是纯合的。在一些实施方案中,转基因植物对于遗传修饰是杂合的。
将外源核酸引入植物细胞中的方法在本领域中是众所周知的。如上所定义,此类植物细胞被认为是“转化的”。合适的方法包括病毒感染(诸如双链DNA病毒)、转染、缀合、原生质体融合、电穿孔、粒子枪技术、磷酸钙沉淀、直接微注射、碳化硅晶须技术、土壤杆菌属介导的转化等。方法的选择一般取决于待转化的细胞类型和发生转化所在的环境(即体外、离体或体内)。
基于土壤细菌根瘤土壤杆菌(Agrobacterium tumefaciens)的转化方法特别可用于将外源核酸分子引入维管植物中。土壤杆菌属(Agrobacterium)的野生型形式含有Ti(肿瘤诱导)质粒,该质粒引导在宿主植物上生长的致瘤冠瘿的产生。Ti质粒的肿瘤诱导T-DNA区向植物基因组的转移需要Ti质粒编码的毒力基因以及T-DNA边缘序列,所述T-DNA边缘序列是描绘待转移区域的一组正向DNA重复序列。基于土壤杆菌属的载体是Ti质粒的修饰形式,其中肿瘤诱导功能被待引入植物宿主中的目标核酸序列替代。
土壤杆菌属介导的转化一般采用共合体载体或二元载体***,其中Ti质粒的组分在辅助载体(所述辅助载体永久驻留在土壤杆菌属宿主中并且携带毒力基因)与穿梭载体(所述穿梭载体含有被T-DNA序列界定的目标基因)之间分配。多种二元载体在本领域中是众所周知的并且可例如从Clontech(Palo Alto,Calif.)商购获得。例如用培养的植物细胞或创伤组织诸如叶组织、根外植体、下胚轴体、茎块或块茎共同培养土壤杆菌属的方法在本领域中也是众所周知的。参见例如Glick和Thompson(编),Methods in Plant MolecularBiology and Biotechnology,Boca Raton,Fla.:CRC Press(1993)。
微粒介导的转化还可用来产生主题转基因植物。首先由Klein等人(Nature 327:70-73(1987))描述的这种方法依赖于微粒(诸如金或钨),所述微粒通过用氯化钙、亚精胺或聚乙二醇沉淀包被有所需的核酸分子。微粒颗粒使用诸如BIOLISTIC PD-1000(Biorad;Hercules Calif.)的装置在高速下被加速到被子植物组织中。
可将本公开的核酸(例如,包含编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列的核酸(例如,重组表达载体))以使得核酸能够例如通过体内或离体方案进入一种或多种植物细胞的方式引入植物中。“体内”意指向植物的活体施用核酸,例如渗透。“离体”意指在植物外部修饰细胞或外植体,然后使此类细胞或器官再生为植物。已描述了适用于稳定转化植物细胞或建立转基因植物的多种载体,包括描述于Weissbach和Weissbach,(1989)Methods for Plant Molecular Biology Academic Press以及Gelvin等人,(1990)Plant Molecular Biology Manual,Kluwer Academic Publishers中的那些载体。具体实例包括衍生自根瘤土壤杆菌的Ti质粒的那些,以及由Herrera-Estrella等人(1983)Nature303:209,Bevan(1984)Nucl Acid Res.12:8711-8721,Klee(1985)Bio/Technolo 3:637-642公开的那些。可替代地,非Ti载体可用来通过使用游离DNA递送技术将DNA转移到植物和细胞中。通过使用这些方法,可产生转基因植物,诸如小麦、大米(Christou(1991)Bio/Technology 9:957-9 and 4462)和玉米(Gordon-Kamm(1990)Plant Cell 2:603-618)。未成熟胚也可以是通过使用粒子枪的直接DNA递送技术(Weeks等人(1993)Plant Physiol102:1077-1084;Vasil(1993)Bio/Technolo 10:667-674;Wan和Lemeaux(1994)PlantPhysiol 104:37-48)和土壤杆菌属介导的DNA转移(Ishida等人(1996)Nature Biotech14:745-750)的单子叶植物的良好靶组织。用于将DNA引入叶绿体中的示例性方法是生物弹轰击、原生质体的聚乙二醇转化和微注射(Danieli等人Nat.Biotechnol 16:345-348,1998;Staub等人Nat.Biotechnol 18:333-338,2000;O’Neill等人Plant J.3:729-738,1993;Knoblauch等人Nat.Biotechnol 17:906-909;美国专利号5,451,513、5,545,817、5,545,818和5,576,198;国际申请号WO 95/16783;以及Boynton等人,Methods inEnzymology 217:510-536(1993);Svab等人,Proc.Natl.Acad.Sci.USA 90:913-917(1993);和McBride等人,Proc.Natl.Acad.Sci.USA 91:7301-7305(1994))。适用于生物弹轰击、原生质体的聚乙二醇转化以及微注射的方法的任何载体将适用作用于叶绿体转化的靶向载体。任何双链DNA载体可用作转化载体,尤其当引入方法没有使用土壤杆菌属时。
可遗传修饰的植物包括谷物、饲料作物、水果、蔬菜、油籽作物、棕榈植物、林业植物和藤本植物。可修饰的植物的具体实例如下:玉米、香蕉、花生、红豌豆、向日葵、番茄、芸苔、烟草、小麦、大麦、燕麦、土豆、大豆、棉花、康乃馨、高粱、羽扇豆和大米。
本公开提供转化的植物细胞,含有转化的植物细胞的组织、植物和产品。主题转化细胞以及包含所述转化细胞的组织和产品的特征是存在整合到基因组中的主题核酸,和通过本公开的CasZ多肽或CasZ融合多肽的植物细胞来产生。本发明的重组植物细胞可作为重组细胞群或作为组织、种子、全株植物、茎、果实、叶、根、花、茎、块茎、谷物、动物饲料、植田等使用。
编码本公开的CasZ多肽或CasZ融合多肽的核苷酸序列可在未知启动子(例如,当核酸随机整合到宿主细胞基因组中时)的控制之下(即,可操作地连接至未知启动子)或可在已知启动子的控制之下(即,可操作地连接至已知启动子)。合适的已知启动子可以是任何已知的启动子并且包括组成型活性启动子、诱导型启动子、空间限制的和/或时间限制的启动子等。
本公开的非限制性方面的实例
上文所述的本发明主题的方面(包括实施方案)可单独有益或与一个或多个其他方面或实施方案组合地有益。在不限制前述描述的情况下,下文提供本公开的某些非限制性方面,其编号为1-36。对本领域技术人员在阅读本公开后将显而易见的是,每个单独编号的方面都可与之前或之后单独编号的方面中的任一个一起使用或组合。这意图为所有此类方面的组合提供支持,并且不限于下文明确提供的方面的组合:
方面
方面1.一种将CasZ多肽导向至靶核酸的靶序列的方法,所述方法包括使所述靶核酸与工程化的和/或非天然存在的复合物接触,所述复合物包含:(a)CasZ多肽;和(b)CasZ指导RNA,所述CasZ指导RNA包含与所述靶核酸的靶序列杂交的指导序列,并且包含与所述CasZ多肽结合的区域。
方面2.如方面1所述的方法,其中所述方法导致所述靶核酸的修饰,从所述靶核酸的转录的调节,或与靶核酸相关联的多肽的修饰。
方面3.如方面2所述的方法,其中所述靶核酸通过被切割而被修饰。
方面4.如方面1-3中任一项所述的方法,其中所述靶核酸选自:双链DNA、单链DNA、RNA、基因组DNA和染色体外DNA。
方面5.如方面1-4中任一项所述的方法,其中所述指导序列和所述与所述CasZ多肽结合的区域彼此异源。
方面6.如方面1-5中任一项所述的方法,其中所述接触导致基因组编辑。
方面7.如方面1-5中任一项所述的方法,其中所述接触在细菌细胞外部和古细菌细胞外部发生。
方面8.如方面1-5中任一项所述的方法,其中所述接触在体外在细胞外部发生。
方面9.如方面1-7中任一项所述的方法,其中所述接触在靶细胞内部发生。
方面10.如方面9所述的方法,其中所述接触包括:将以下至少一项引入所述靶细胞中:(a)所述CasZ多肽或编码所述CasZ多肽的核酸;和(b)所述CasZ指导RNA或编码所述CasZ指导RNA的核酸。
方面11.如方面10所述的方法,其中所述编码所述CasZ多肽的核酸是经密码子优化以在所述靶细胞中表达的非天然序列。
方面12.如方面9-11中任一项所述的方法,其中所述靶细胞是真核细胞。
方面13.如方面9-12中任一项所述的方法,其中所述靶细胞在体外在培养物中。
方面14.如方面9-12中任一项所述的方法,其中所述靶细胞在体内。
方面15.如方面9-12中任一项所述的方法,其中所述靶细胞是离体的。
方面16.如方面12所述的方法,其中所述真核细胞选自由以下组成的组:植物细胞、真菌细胞、单细胞真核生物体、哺乳动物细胞、爬行动物细胞、昆虫细胞、禽细胞、鱼细胞、寄生虫细胞、节肢动物细胞、蛛形纲动物细胞、无脊椎动物细胞、脊椎动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类动物细胞和人细胞。
方面17.如方面9-16中任一项所述的方法,其中所述接触还包括:将DNA供体模板引入所述靶细胞中。
方面18.如方面1-17中任一项所述的方法,其中所述方法包括使所述靶核酸与CasZ反式激活非编码RNA(trancRNA)接触。
方面19.如方面9-17中任一项所述的方法,其中所述接触包括:将CasZ反式激活非编码RNA(trancRNA)和/或编码所述CasZ trancRNA的核酸引入所述靶细胞中。
方面20.如方面18或方面19所述的方法,其中所述trancRNA包含与表2的trancRNA序列具有70%或更高(至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的核苷酸序列同一性的核苷酸序列。
方面21.一种包含工程化的和/或非天然存在的复合物的组合物,所述复合物包含:(a)CasZ多肽或编码所述CasZ多肽的核酸;和(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
方面22.如方面21所述的组合物,所述组合物还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
方面23.一种包含工程化的和/或非天然存在的复合物的试剂盒,所述复合物包含:(a)CasZ多肽或编码所述CasZ多肽的核酸;(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
方面24.如方面23所述的试剂盒,所述试剂盒还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
方面25.一种遗传修饰的真核细胞,所述遗传修饰的真核细胞包含以下至少一项:(a)CasZ多肽或编码所述CasZ多肽的核酸;(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含可与所述CasZ多肽结合的区域;和(c)CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
方面26.如前述方面中任一项所述的组合物、试剂盒或真核细胞,所述组合物、试剂盒或真核细胞的特征在于以下至少一项:(a)编码所述CasZ多肽的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ多肽,并且(ii)与异源启动子可操作地连接;(b)编码所述CasZ指导RNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ指导RNA,并且(ii)与异源启动子可操作地连接;和(c)编码所述CasZ trancRNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ trancRNA,并且(ii)与异源启动子可操作地连接。
方面27.如前述方面中任一项所述的组合物、试剂盒或真核细胞,所述组合物、试剂盒或真核细胞用于治疗性治疗患者的方法中。
方面28.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中以下至少一项是重组表达载体:编码所述CasZ多肽的所述核酸、编码所述CasZ指导RNA的所述核酸和编码所述CasZ trancRNA的所述核酸。
方面29.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ指导RNA和/或所述CasZ trancRNA包含以下一项或多项:修饰的核碱基、修饰的骨架或非天然核苷间键联、修饰的糖部分、锁核酸、肽核酸和脱氧核糖核苷酸。
方面30.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽是与相应的野生型CasZ蛋白相比具有降低的核酸酶活性的变体CasZ多肽。
方面31.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中以下至少一项与异源部分缀合:所述CasZ多肽、编码所述CasZ多肽的所述核酸、所述CasZ指导RNA、编码所述CasZ指导RNA的所述核酸、所述CasZ trancRNA和编码所述CasZ trancRNA的所述核酸。
方面32.如方面31所述的方法、组合物、试剂盒或真核细胞,其中所述异源部分是异源多肽。
方面33.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽与相应的野生型CasZ蛋白相比具有降低的核酸酶活性,并且与异源多肽融合。
方面34.如方面33所述的方法、组合物、试剂盒或真核细胞,其中所述异源多肽:(i)具有DNA修饰活性,(ii)表现出增加或减少转录的能力,并且/或者(iii)具有修饰与DNA相关联的多肽的酶活性。
方面35.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述CasZ多肽包含与图1或图7的CasZ蛋白具有70%或更高(至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸序列。
方面36.如前述方面中任一项所述的方法、组合物、试剂盒或真核细胞,其中所述指导序列和与所述CasZ多肽结合的所述区域彼此异源。
方面37.一种检测样品中的靶DNA的方法,所述方法包括:(a)使所述样品与以下物质接触:(i)CasZ多肽;(ii)指导RNA,所述指导RNA包含与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列;和(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及(b)测量由所述CasZ切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
方面38.如方面37所述的方法,其中所述靶DNA是单链的。
方面39.如方面37或38所述的方法,其中所述靶DNA是双链的。
方面40.如方面37-39中任一项所述的方法,其中所述靶DNA是病毒DNA。
方面41.如方面37-40中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
方面42.如方面37-41中任一项所述的方法,其中所述CasZ多肽包含与图1和图7中任一个所示的CasZ氨基酸序列具有至少85%的氨基酸序列同一性的氨基酸序列。
方面43.如方面37-41中任一项所述的方法,其中所述CasZ多肽是Cas14a多肽。
方面44.根据方面37-43中任一项所述的方法,其中所述样品包含来自细胞裂解液的DNA分子。
方面45.根据方面37-44中任一项所述的方法,其中所述样品包含细胞。
方面46.根据方面37-45中任一项所述的方法,其中所述接触在体外、离体或体内的细胞内部进行。
方面47.根据方面46所述的方法,其中所述细胞是真核细胞。
方面48.根据方面37-47中任一项所述的方法,其中所述靶DNA能够以低至10aM的浓度被检测到。
方面49.根据方面37-48中任一项所述的方法,所述方法包括确定所述样品中存在的所述靶DNA的量。
方面50.根据方面49所述的方法,其中所述确定包括:测量所述可检测信号以生成测试测量值;测量由参考样品或细胞产生的可检测信号以生成参考测量值;以及将所述测试测量值与所述参考测量值进行比较,以确定所述样品中存在的靶DNA的量。
方面51.根据方面37-50中任一项所述的方法,其中测量可检测信号包括以下一项或多项:基于金纳米颗粒的检测、荧光偏振、胶体相变/分散、电化学检测和基于半导体的感测。
方面52.根据方面37-51中任一项所述的方法,其中所述单链检测剂DNA包含荧光发射染料对。
方面53.根据方面52所述的方法,其中在所述单链检测剂DNA被切割之前所述荧光发射染料对产生一定量的可检测信号,并且在所述单链检测剂DNA被切割之后所述可检测信号的量减少。
方面54.根据方面52所述的方法,其中所述单链检测剂DNA在被切割之前产生第一可检测信号,并且在所述单链检测剂DNA被切割之后产生第二可检测信号。
方面55.根据方面52-54中任一项所述的方法,其中所述荧光发射染料对是荧光共振能量转移(FRET)对。
方面56.根据方面18所述的方法,其中在所述单链检测剂DNA被切割之后,可检测信号的量增加。
方面57.根据方面52或方面56所述的方法,其中所述荧光发射染料对是猝灭剂/荧光剂对。
方面58.根据方面52-57中任一项所述的方法,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
方面59.根据方面58所述的方法,其中所述两个或更多个荧光发射染料对包括荧光共振能量转移(FRET)对和猝灭剂/荧光剂对。
方面60.根据方面37-59中任一项所述的方法,其中所述单链检测剂DNA包含修饰的核碱基、修饰的糖部分和/或修饰的核酸键联。
方面61.根据方面37-60中任一项所述的方法,其中所述方法包括扩增所述样品中的核酸。
方面62.根据方面61所述的方法,其中所述扩增包括等温扩增。
方面63.根据方面62所述的方法,其中所述等温扩增包括重组酶聚合酶扩增(RPA)。
方面64.根据方面61-63中任一项所述的方法,其中所述扩增在所述步骤(a)的接触之前开始。
方面65.根据方面61-63中任一项所述的方法,其中所述扩增与所述步骤(a)的接触一起开始。
方面66.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:(a)指导RNA或编码所述指导RNA的核酸;其中所述指导RNA包含:与CasZ多肽结合的区域和与靶DNA互补的指导序列;和(b)为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
方面67.如方面66所述的试剂盒,所述试剂盒还包含CasZ多肽。
方面68.如方面67所述的试剂盒,其中所述CasZ多肽包含与图1和图7中任一个所示的CasZ氨基酸序列具有至少85%的氨基酸序列同一性的氨基酸序列。
方面69.如方面67所述的试剂盒,其中所述CasZ多肽是Cas14a多肽。
方面70.如方面66-69中任一项所述的试剂盒,其中所述单链检测剂DNA包含荧光发射染料对。
方面71.如方面70所述的试剂盒,其中所述荧光发射染料对是FRET对。
方面72.如方面70所述的试剂盒,其中所述荧光发射染料对是猝灭剂/荧光剂对。
方面73.如方面70-72中任一项所述的试剂盒,其中所述单链检测剂DNA包含两个或更多个荧光发射染料对。
方面74.如方面73所述的试剂盒,其中所述两个或更多个荧光发射染料对包括产生第一可检测信号的第一荧光发射染料对和产生第二可检测信号的第二荧光发射染料对。
方面75.如方面66-74中任一项所述的试剂盒,所述试剂盒还包含核酸扩增组分。
方面76.如方面75所述的试剂盒,其中所述核酸扩增组分是用于重组酶聚合酶扩增(RPA)的组分。
方面77.一种切割单链DNA(ssDNA)的方法,所述方法包括:使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:(i)CasZ多肽;和(ii)指导RNA,所述指导RNA包含与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列,其中所述CasZ多肽切割所述多个非靶ssDNA。
方面78.如方面77所述的方法,其中所述接触是在体外、离体或体内的细胞内部。
方面79.如方面78所述的方法,其中所述细胞是真核细胞。
方面80.如方面79所述的方法,其中所述真核细胞是植物细胞。
方面81.如方面78-80中任一项所述的方法,其中所述非靶ssDNA对于所述细胞是外源的。
方面82.如方面81所述的方法,其中所述非靶ssDNA是病毒DNA。
方面83.如方面77-82中任一项所述的方法,其中所述靶DNA是单链的。
方面84.如方面77-82中任一项所述的方法,其中所述靶DNA是双链的。
方面85.如方面77-84中任一项所述的方法,其中所述靶DNA是病毒DNA。
方面86.如方面77-84中任一项所述的方法,其中所述靶DNA是乳多空病毒、嗜肝DNA病毒、疱疹病毒、腺病毒、痘病毒或细小病毒DNA。
实施例
提出以下实施例以便向本领域的普通技术人员提供如何制备和使用本发明的完全公开和描述,并且并非意图限制本发明人看待其发明的范围,也非意图表示以下实验是执行的全部或仅有的实验。已经努力确保关于所用数值(例如量、温度等)的精确性,但一些实验误差和偏差应加以说明。除非另外指示,否则份为重量份,分子量为重均分子量,温度以摄氏度计,并且压力在大气压下或接近大气压。可使用标准缩写,例如,bp,碱基对;kb,千碱基;pl,皮升;s或sec,秒;min,分钟;h或hr,小时;aa,氨基酸;kb,千碱基;bp,碱基对;nt,核苷酸;i.m.,肌内的(肌内地);i.p.,腹膜内的(腹膜内地);s.c.,皮下的(皮下地)等。
材料和方法
除非另外指出,否则以下材料和方法一般适用于本文所述实施例中给出的结果。
宏基因组学和宏转录组学
对来自以下两个地点的先前组装和框并的基因组进行初始分析:毗邻ColoradoRiver near Rifle,Colorado的Rifle Integrated Field Research(IFRC)地点;以及位于Colorado Plateau in Utah的Crystal Geyser,a cold,CO2-driven geyser。来自IFRC地点的宏转录组学数据用于检测自然界中非编码元件的转录。然后对来自IMG/M的公共宏基因组进行CRISPR-Cas14***的进一步挖掘。
CRISPR-Cas计算分析
使用隐马尔可夫模型(HMM)序型,用HMMer套件扫描来自各种样品的组装重叠群的已知Cas蛋白。基于推定V型效应子的MAFFT比对为Cas14蛋白构建另外的HMM,所述推定V型效应子含有少于800个氨基酸,并且与获取cas基因和CRISPR阵列相邻。通过使用手动选择的新推定Cas14序列增强这些HMM来迭代地完善这些HMM,所述新推定Cas14序列是通过使用现有Cas14 HMM模型发现的。Cas14重复序列的序列提供于表3中。使用CrisprFinder软件和CRISPRDetect的本地版本鉴定CRISPR阵列。使用以PROTGAMMALG作为替代模型的RAxML和100个自举取样构建Cas1和V型效应蛋白的***发育树。使用FigTree 1.4.1(http://tree.bio.ed.ac.uk/software/figtree/)对树进行可视化。使用Bowtie2将宏转录组学读段定位到组装的重叠群。RNA酶存在分析是基于由从KEGG数据库下载的KEGG直系同源组(KO)的比对建立的HMM。
表3.表3中显示本文使用的所有Cas14蛋白的重复序列(Cas14指导RNA的非指导序列部分)(例如,参见图7)。
/>
/>
/>
表达质粒、RNA和DNA底物的生成
通过去除获取蛋白并使用单个间隔序列生成最小阵列来设计用于推定***的最小CRISPR基因座。将这些最小基因座按gBlocks(IDT)排列,并组装到具有驱动基因座表达的四环素诱导型启动子的质粒中。质粒图谱可在Addgene和附图中获得。使用T7聚合酶和PCR产物作为dsDNA模板体外转录所有RNA。对所得IVT进行凝胶提取,并进行乙醇沉淀。DNA底物获自IDT,并且其序列可见于表4。对于放射性标记的切割测定,在进行放射性标记之前,从PAGE凝胶中凝胶提取DNA低聚物。对于FQ测定,无需进一步纯化即可使用DNA底物。
大肠杆菌RNAseq
如先前Harrington等人(2017)中所述,经过修改进行小RNA测序。用表达Cas14a1***的在Cas14a1 ORF上游具有四环素诱导型启动子的质粒或具有与Cas14融合的N末端10x-组氨酸标签的相同质粒转化大肠杆菌NEB Stable3。使引子(Starter)在SOB中生长过夜,在5mL含214nM脱水四环素的新鲜SOB中以1:100稀释,并在25℃下生长过夜。为了对用Cas14a提取的RNA进行测序,将含有与Cas14a1融合的N末端His标签的质粒在18℃下生长,然后如“蛋白质纯化”中所述进行裂解和纯化,在Ni-NTA洗脱后停止。如先前所述,沉淀细胞并使用热酚提取RNA。用TURBO DNA酶处理总核酸,并进行酚提取。用rSAP处理所得RNA,将其加热灭活之后添加T4PNK。使用NEBnext小RNA试剂盒将衔接子连接到小RNA上,并在8%天然PAGE凝胶上进行凝胶提取。在MiSeq上对RNA进行测序,其中单端为300bp读段。对于分析,使用Cutadapt修剪所得读段,丢弃<8nt的序列,并使用Bowtie2将其定位到质粒参考。
PAM消耗测定
如先前Burstein等人(2017)所述进行PAM缺失测定。使用含有与靶序列相邻的随机化PAM区的引物生成随机化质粒文库。将随机化引物和与引物3'末端互补的引物杂交,并使用Klenow Fragment(NEB)延伸双链体。将含有靶标的dsDNA用EcoRI和NcoI消化,连接到pUC19骨架中并转化到大大肠杆菌DH5α中,并且收获>107个细胞。接着,用CRISPR质粒或空载体对照转化大肠杆菌NEBstable,然后通过用10%甘油反复洗涤使这些转化的大肠杆菌呈电感受态。将这些电感受态细胞用200ng的靶文库转化,并铺板在含有针对靶标(羧苄西林,100mg l-1)和CRISPR质粒(氯霉素,30mg l-1)选择的物质的生物测定皿中。收获细胞并准备在Illumina MiSeq上进行扩增子测序。使用Cutadapt提取PAM区域,并在python中计算消耗值。使用WebLogo对PAM可视化。
转录组RNA作图
使用Invitrogen TRIzol试剂从0.2mm滤膜中提取RNA,之后使用Qiagen RNase-Free DNase Set试剂盒和Qiagen Mini RNeasy试剂盒去除基因组DNA并进行清洁。使用Agilent 2100Bioanalyzer(Agilent Technologies)评估RNA样品的完整性。使用AppliedBiosystems SOLiD Total RNA-Seq试剂盒生成cDNA模板文库。使用SOLiD EZ Bead***(Life Technologies)进行乳液克隆珠粒扩增,以生成珠粒模板供SOLiD平台测序。在Pacific Northwest National Laboratory在5500XL SOLiD平台上对样品进行测序。使用如Brown等人(2015)的Sickle修剪50bp的单读段。
蛋白质纯化
如先前所述,经过修改对Cas14a1进行纯化。将大肠杆菌BL21(DE3)RIL用10xHis-MBP-Cas14a1表达质粒转化,并在Terrific Broth(TB)中生长至OD600=0.5,并用0.5mMIPTG诱导。使细胞在18℃下生长过夜,通过离心收集,重悬于裂解缓冲液(50mM Tris-HClpH 7.5、20mM咪唑、0.5mM TCEP、500mM NaCl)中,并通过超声进行破碎。将裂解液分批装载到Ni-NTA树脂上,用上述缓冲液洗涤,然后用洗脱缓冲液(50mM Tris-HCl pH 7.5、300mM咪唑、0.5mM TCEP、500mM NaCl)洗脱。通过在4℃下与TEV一起孵育过夜,去除MBP和His标签。将所得蛋白质交换到缓冲液A(20mM HEPES pH 7.5、0.5mM TCEP、150mM NaCl)中,并装载到串联MBP肝素柱(GE,Hi-Trap)上,并以线性梯度从缓冲液A到缓冲液B洗脱(20mM HEPES pH7.5、0.5mM TCEP、1250mM NaCl)。将所得的含有Cas14a1的级分装载到S200凝胶过滤柱上,快速冷冻并在-80℃下储存直至使用。
体外切割测定
放射性标记的
在1×切割缓冲液(25mM NaCl、20mM HEPES pH 7.5、1mM DTT、5%甘油)中进行放射性标记的切割测定。在室温下,使100nM Cas14a1与125nM crRNA和125nM tracrRNA复合10分钟。添加约1nM放射性标记的DNA或RNA底物,并使其在37℃下反应30分钟。通过添加2x猝灭缓冲液(90%甲酰胺、25mM EDTA和痕量溴酚蓝)来终止反应,加热至95℃保持2分钟,然后在含有7M尿素和0.5×TBE的10%聚丙烯酰胺凝胶上电泳。通过磷光成像使产物可视化。
M13 DNA切割
在100mM NaCl、20mM HEPES pH 7.5、1mM DTT、5%甘油中进行M13 DNA切割测定。使250nM Cas14a1与250nM crRNA和250nM tracrRNA和250nM ssDNA激活剂复合。通过添加5nM M13ssDNA质粒来引发反应,并通过添加补充有10mM EDTA的上样缓冲液来猝灭反应。在用SYBR金(Thermofisher)预染的1.5%琼脂糖TAE凝胶上分离产物。
反式切割的FQ检测
如先前Chen等人(2018)所述,经过修改进行FQ检测。使100nM Cas14a1与125nMcrRNA、125nM tracrRNA、50nM FQ探针和2nM ssDNA激活剂在1×切割缓冲液中于37℃混合10分钟。对于所有反应,通过添加激活剂DNA来引发反应,但RNA优化实验除外,该实验中使用可变RNA组分来引发反应。在荧光酶标仪上于37℃下监测反应达120分钟,每1分钟进行一次荧光测量(λex:485nm;λem:535nm)。将所得数据使用在不存在激活剂的情况下获得的读数减去背景,并使用单指数衰减曲线进行拟合。
数据可用性
本文使用的质粒可在Addgene上获得(质粒编号112500、112501、112502、112503、112504、112505、112506)。本文使用的寡核苷酸提供于表4和表5中。本文使用的质粒提供于图24中。本文使用的Cas14蛋白序列提供于图7中。
表4.本文使用的寡核苷酸和质粒。
/>
/>
/>
表5.RNA寡核苷酸。
/>
/>
/>
实施例1
图1描绘天然存在的CasZ蛋白序列的实例。
图2描绘CasZ基因座的示意图,所述CasZ基因座除CasZ蛋白之外还包括Cas1蛋白。
图3描绘与其他2类CRISPR/Cas效应蛋白序列有关的CasZ序列的***发育树。
图4描绘与来自其他2类CRISPR/Cas基因座的Cas1序列有关的来自CasZ基因座的Cas1序列的***发育树。
图5描绘转录组学RNA作图数据,该数据证明了来自CasZ基因座的trancRNA的表达。trancRNA与CasZ重复序列阵列相邻,但不包含重复序列且不与重复序列互补。显示的是以下基因座的RNA作图数据:CasZa3、CasZb4、CasZc5、CasZd1和CasZe3。小重复对齐箭头表示CRISPR阵列的重复序列(指示存在编码指导RNA的序列);重复阵列外部和附近的峰表示高度转录的trancRNA。
此宏转录组学数据是非16S消耗的,因此大部分数据被定位到16S,例如,在这些读段中几乎根本没有显示mRNA。然而,观察到RNA定位到预测的trancRNA区域。
实施例2
本文公开一组来自未经培养的古细菌的CRISPR-Cas***,所述***含有Cas14,这是一个只有400-700个氨基酸的异常紧凑的RNA指导的核酸酶家族,包括Cas1和Cas2蛋白,它们负责将DNA整合到CRISPR基因组基因座中,并且显示了积极使他们的CRISPR阵列适应新感染的证据。尽管它们的尺寸很小,但Cas14蛋白能够进行RNA指导的单链DNA(ssDNA)切割,而无限制性序列要求。此外,Cas14的靶标识别触发了ssDNA分子的非特异性切割。宏基因组学数据显示,多个CRISPR-Cas14***独立进化,并表明了基于单效应子CRISPR的适应性免疫的潜在进化起源。
微生物与病毒之间的竞争刺激了基于CRISPR的适应性免疫的进化,从而提供了针对传染剂的保护。在2类CRISPR-Cas***中,具有多个功能结构域的单个100-200千道尔顿(kD)CRISPR相关(Cas)蛋白进行RNA指导的DNA或RNA底物结合和切割。要确定自然界中是否存在更简单、更小的RNA指导蛋白,查询terabase级宏基因组数据集,以查找与CRISPR阵列和cas1(编码通用CRISPR整合酶的基因)接近的未表征基因。此分析鉴定了本文所述的编码40-70kD多肽的CRISPR-Cas***的多样化家族,该家族含有cas1、cas2、cas4和cas14(图8,图A)。基于比较序列分析,已经鉴定出二十四(24)个不同的cas14基因变体,这些变体聚类成三个亚组(Cas14a-c)(图8,图A-图B;图9、图10)。Cas14蛋白为约400-700个氨基酸(aa),约为先前已知的2类CRISPR RNA指导的酶的尺寸的一半(图8,图C-图D)。虽然所鉴定的Cas14蛋白表现出可观的序列多样性,但所有这些蛋白质都是通过预测的RuvC核酸酶结构域的存在而结合在一起,所述结构域的组织的特征是靶向V型CRISPR-Cas DNA酶(图8,图D)。
所鉴定的Cas14蛋白几乎全部出现在DPANN内,DPANN是共生古细菌的超门,以小细胞和基因组尺寸为特征。***发育比较显示,Cas14蛋白与C2c10和C2c9(含细菌RuvC结构域的蛋白家族,有时在CRISPR阵列中发现,但从未与其他cas基因一起出现)的相似性存在广泛多样性(图8,图B;和图9)。此观察结果以及c2c10和cas14基因的小尺寸使得这些***无法用作独立的CRISPR效应子。
图8,图A-图D描绘CRISPR-Cas14基因组基因座的架构和***发育。图8,图A描绘V型CRISPR***的***发育树。新识别的微型CRISPR***以橙色突出显示。图8,图B描绘C2c10和CRISPR-Cas14***的代表性基因座架构。图8,图C描绘Cas14a-c***与Cas12a-e和Cas9相比的长度分布。图8,图D描绘Cas14a与Cas9和Cas12a相比的结构域组织。蛋白质长度按比例绘制。
图9描绘已知V型CRISPR效应子和含有RuvC结构域的2类候选物的最大似然树。插图显示每个新鉴定的亚型的单个直系同源物。图10描绘来自已知CRISPR***的Cas1的最大似然树。
实施例3
基于CRISPR-Cas14***与负责创建感染遗传记忆的保守基因(cas1、cas2、cas4)的接近性(图11,图A),我们研究了CRISPR-Cas14***是否主动将DNA序列获取到其CRISPR阵列中。多个CRISPR-Cas14基因座的组装宏基因组学连续DNA序列(重叠群)揭示,以其他方式相同的CRISPR***在其CRISPR阵列中显示出多样性,这表明对新感染具有主动适应性(图11,图B;和图12,图A)。无意受任何特定理论的束缚,提出对新DNA序列的主动获取指示这些CRISPR-Cas14基因座编码的功能酶尽管具有小尺寸,但具有核酸靶向活性。为了测试这种可能性,研究是否从CRISPR-Cas14基因座产生RNA成分。分析环境宏转录组学测序数据中是否存在来自含有CRISPR-Cas14a的原生古细菌宿主的RNA(图12,图B;和图13,图A)。除CRISPR RNA(crRNA)外,还将高度丰富的非编码RNA定位到位于cas14a与相邻CRISPR阵列之间的约130个碱基对的序列。此转录物的3′末端的20个核苷酸(nt)与crRNA的重复区段大部分互补(图12,图C;和图13,图B),如针对与Cas9、Cas12b和Cas12e CRISPR***相关发现的反式激活CRISPR RNA(tracrRNA)所观察到的。在这些先前研究的***中,双链RNA切割酶核糖核酸酶III(RNA酶III)生成成熟的tracrRNA和crRNA,但在含cas14的重建基因组中不存在编码RNA酶III的基因(图14,图A)。此观察结果暗示在这些宿主中存在CRISPR相关RNA加工的替代机制。
为了测试Cas14a蛋白和相关RNA组分是否可在异源生物体中组装,将质粒引入到含有最小CRISPR-Cas14a基因座的大肠杆菌中,所述基因座包含Cas14基因、CRISPR阵列和含有推定tracrRNA的基因间区域。从细胞裂解液中亲和纯化Cas14a蛋白以及对共纯化RNA进行测序揭示了高度丰富的成熟crRNA以及推定的tracrRNA,这表明Cas14与crRNA和tracrRNA两者都相关(图14,图B)。组装的Cas14a蛋白-tracrRNA-crRNA颗粒的计算质量按重量计为48%RNA,相较之下酿脓链球菌Cas9(SpCas9)仅为17%(图12,图D),而新泽西弗朗西斯菌(F.novicida)Cas12a(FnCas12a)为8%,暗示了RNA在Cas14a复合体架构中的核心作用。已知的2类CRISPR***需要称为原间隔序列相邻基序(PAM)的短序列来靶向双链DNA(dsDNA)。为了测试Cas14a是否需要PAM并能进行dsDNA干扰,将大肠杆菌用dsDNA质粒转化,表达最小Cas14a基因座,所述dsDNA质粒含有随机化PAM区,所述随机化PAM区邻近Cas14阵列中与编码靶标的序列(间隔序列)匹配的序列。在大肠杆菌转化体中未检测到PAM序列的消耗,表明CRISPR-Cas14a***要么无法靶向dsDNA,不需要PAM就能靶向,要么在此异源宿主中没有活性(图15,图A-图D)。
图11,图A-图B描绘CRISPR-Cas14***的新间隔序列获取。图11,图A描绘Cas14Cas1直系同源物的比对。扩展显示了以红色方框突出显示的先前涉及的活性位点残基的保护。图11,图B描绘针对各种CRISPR-Cas14***组装的多个CRISPR阵列,揭示了这些CRISPR***的间隔序列多样性。橙色箭头指示重复序列,而各种颜色的方框表示独特的间隔序列。
图12,图A-图D描绘CRISPR-Cas14a主动适应并编码tracrRNA。图12,图A描绘Cas14a和Cas14b的间隔序列多样性,其中CRISPR重复序列以橙色图示,而独特的间隔序列以不同颜色显示。图12,图B描绘定位到Cas14a1和Cas14a3的宏转录组学读段。插图显示最丰富的重复序列和间隔序列的伸展。图12,图C描绘Cas14a1 crRNA和tracrRNA的计算机模拟预测结构。在宿主基因组中未鉴定到RNA酶III直系同源物(图14,图A)。图12,图D描绘由RNA和蛋白质组成的各种CRISPR复合物的质量分数。
图13,图A-图B描绘CRISPR-Cas14基因座的宏转录组学。图13,图A描绘Cas14a直系同源物的环境RNA测序读段。Cas14和CRISPR阵列的位置如下所示。右侧的RNA结构显示从宏转录组学鉴定的tracrRNA的计算机模拟预测结构。图13,图B描绘Cas14a1crRNA:tracrRNA双链体的预测杂交。
图14,图A-图B描绘CRISPR-Cas14的RNA加工和异源表达。图14,图A描绘在含Cas14的基因组中常见的RNA酶直系同源物的存在。浅紫色表示明显短于给定RNA酶的预期长度的命中。需注意,在所有研究的基因组中都不存在RNA酶III。图14,图B描绘来自大肠杆菌中Cas14a1基因座的异源表达的小RNAseq读段(图14,图B,底部两个图)与相比的宏转录组学读段(图14,图B,顶部图)。下拉是指与Ni-NTA亲和纯化的Cas14a1共纯化的RNA。
图15,图A-图D描绘Cas14a1和SpCas9的质粒消耗。图15,图A描绘概述PAM发现实验的图。用含有位于靶标侧翼的随机化PAM序列的质粒攻击表达目标CRISPR***的大肠杆菌。收获存活的(转化的)细胞并与带有空载体的对照一起测序。然后对消耗的序列进行测序,消耗超过PAM消耗值阈值(PDVT)的PAM用于生成Weblogo。图15,图B-图D描绘被异源表达的Cas14a1消耗的PAM序列,所述Cas14a1用含有靶标的随机化PAM序列5’端(图15,图B)或3'端(图15,图C)的靶质粒转化。“无序列”指示在给定的PDVT处或之上未发现序列被消耗。
实施例4
测试纯化的Cas14a-tracrRNA-crRNA复合物是否能够体外进行RNA指导的核酸切割。所有当前重构的靶向DNA的2类干扰复合物均能够识别dsDNA和ssDNA底物。将纯化的Cas14a-tracrRNA-crRNA复合物与带有与crRNA指导序列互补的20个核苷酸的序列的放射性标记的靶寡核苷酸(ssDNA、dsDNA和ssRNA)或非互补的ssDNA一起孵育,并分析这些底物的Cas14a介导的切割。仅在存在互补的ssDNA底物的情况下,才检测到任何切割产物(图16,图A;和图17,图A-图C),并且切割取决于tracrRNA和crRNA的存在,tracrRNA和crRNA也可组合成单指导RNA(sgRNA)(图16,图B;和图18)。缺乏可检测的dsDNA切割表明Cas14a选择性地靶向ssDNA,尽管可能有其他因素或序列要求可实现天然宿主中的dsDNA识别。Cas14a RuvC结构域中保守活性位点残基的突变消除了切割活性(图17,图A),暗示RuvC是负责DNA切割的结构域。此外,Cas14a DNA切割对将RNA组分截短至短于天然产生的序列的长度敏感(图16,图B;和图19,图A-图D)。这些结果使Cas14a成为经证明可进行可编程的RNA指导的DNA切割的最小的2类CRISPR效应子。
通过在ssDNA底物上平铺Cas14a指导序列,测试Cas14a是否需要PAM进行体外ssDNA切割(图16,图C)。尽管邻近这些不同指导序列的靶标存在序列变异,但观察到所有四个序列的切割。切割位点出现在ssDNA的指导序列互补区之外,并响应于指导序列结合位置而偏移(图16,图C)。这些数据证明,Cas14a是靶向ssDNA的CRISPR内切核酸酶,其不需要PAM进行激活。
基于Cas14a切割靶向crRNA/DNA的异源双链体的外部的观测结果,提出Cas14a可能具有靶标激活的非特异性ssDNA切割活性,类似于含RuvC的酶Cas12a。为了测试这种可能性,将Cas14a-tracrRNA-crRNA与互补的激活剂DNA和等份的与Cas14a crRNA或激活剂没有序列互补性的M13噬菌体ssDNA一起孵育(图16,图D)。M13 ssDNA迅速降解为小片段,所述活性通过保守Cas14a RuvC活性位点突变而消除,表明Cas14a的激活导致非特异性ssDNA降解。
为了研究Cas14a对靶标依赖性非特异性DNA切割活性的特异性,对荧光团-猝灭剂(FQ)测定进行调整,其中经染料标记的ssDNA的切割生成荧光信号(图20,图A)。当将Cas14a与各种指导RNA-靶ssDNA对一起孵育时,仅在同源靶标存在下才观察到荧光信号,并且显示出对较长的含FQ底物的强烈偏好(图19,图F;和图20,图A)。通过在各种ssDNA底物中的靶区域上平铺2-nt错配来测试Cas14a错配耐受性。靠近ssDNA靶标中间的错配会强烈抑制Cas14a活性,揭示了内部种子序列与针对靶向dsDNA的CRISPR-Cas***所观察到的PAM邻近种子区不同(图20,图B;和图21,图A-图D)。此外,含有强二级结构的DNA底物导致Cas14a的激活降低(图21,图E)。截短ssDNA底物也导致反式切割减少或无法检测到(图21,图F)。这些结果表明了不同于靶向dsDNA的2类CRISPR***的保真机制,这种机制类似于靶向RNA的Cas13a酶,可能利用crRNA的前序区域来门控切割活性。
在宏基因组学数据中对紧凑型V型***的进一步研究揭示,如同Cas14a-c,多种多样的***包括与获取相关cas基因相邻的编码含RuvC的短蛋白的基因和CRISPR阵列。还发现了二十(20)个这样的***,它们聚类成五个主要家族(Cas14d-h)。这些家族似乎是从TnpB的独立驯化事件演化而来的,TnpB是与V型CRISPR效应子的进化亲本有关的转座酶相关蛋白。不包括与cas12b相关的cas14g,类似cas14的基因在V型效应子***发育上形成单独的进化枝(图22,图A-图B),并且它们的cas1基因具有不同的起源(图10,图A)。总共鉴定出属于八个家族(Cas14a-h)的38个CRISPR-Cas14***,以及八个无法经过分析进行聚类的其他***(称为Cas14u,表3)。
本文所述的Cas14蛋白的小尺寸及其与V型效应蛋白的相似性表明,RNA指导的ssDNA切割可能已作为祖传2类CRISPR***存在。在这种情形下,小型的驯化的类似TnpB的ssDNA干扰复合物可能会随时间推移获得更多的结构域,从而逐渐改善dsDNA的识别和切割。较小的Cas9直系同源物相比其较大对应物表现出较弱的靶向dsDNA的活性,但保留了稳健切割ssDNA的能力。除进化方面的意义外,Cas14特异性地靶向ssDNA的能力还表明了其对ssDNA病毒或通过ssDNA中间体传播的移动遗传元件(MGE)的防御作用。无意受任何特定理论的束缚,靶向ssDNA的CRISPR***在ssDNA病毒构成了绝大部分病毒丰度的某些海洋环境中可能特别有利。
图16,图A-图D描绘作为RNA指导的DNA内切核酸酶的CRISPR-Cas14a。图16,图A描绘靶向ssDNA、dsDNA、ssRNA和脱靶ssDNA的Cas14a1的切割动力学。图16,图B描绘与靶ssDNA结合的Cas14a RNP和在各种RNA组分存在的情况下Cas14a1切割放射性标记的ssDNA的动力学的示意图。图16,图C描绘Cas14a1指导序列对ssDNA底物的平铺。图16,图D描绘激活的Cas14a1对ssDNA病毒M13基因组的切割。
图17,图A-图E描绘Cas14a1对ssDNA的降解。图17,图A描绘纯化的Cas14a1和Cas14a1点突变体的SDS-PAGE。图17,图B描绘Cas14a1切割ssDNA靶标的盐、阳离子和温度的优化。图17,图C描绘各种长度的间隔序列下Cas14a1对ssDNA进行的放射性标记的切割。图17,图D描绘Cas14与先前研究的Cas12蛋白的比对,以鉴定RuvC活性位点残基;且图17,图E描绘纯化的Cas14a1 RuvC点突变体对ssDNA的切割。
图18描绘各种指导RNA组分下Cas14a1切割ssDNA的动力学。
图19,图A-图F描绘Cas14a1指导RNA组分的优化。图19,图A描绘靶向ssDNA的Cas14a1的图。通过改变间隔序列长度(图19,图B),改变重复序列长度(图19,图C),改变tracrRNA(图19,图D)以及将crRNA和tracrRNA融合在一起(图19,图E),研究对Cas14a1切割FQ ssDNA底物的影响。图19,图F描绘热图,其显示在存在各种指导序列和靶标组合的情况下,由于ssDNA FQ报告基因切割产生的减去背景的荧光。
图20,图A-图E描绘通过CRISPR-Cas14a进行的高保真ssDNA SNP检测。图20,图A描绘用于通过Cas14a1检测ssDNA的荧光猝灭剂(FQ)测定以及各种长度的FQ底物的切割动力学。图20,图B描绘在底物上平铺错配的情况下Cas14a1的切割动力学(各个点表示重复测量值)。图20,图C描绘Cas14-DETECTR策略和HERC2眼睛颜色SNP的图。图20,图D描绘T7外切核酸酶的滴定和对Cas14a-DETECTR的影响。图20,图E描绘与使用Cas12a的ssDNA检测相比,使用Cas14a-DETECTR与用于蓝眼和棕眼唾液样品的蓝眼靶向指导序列的SNP检测。
图21,图A-图F描绘各种激活剂对Cas14a1切割速率的影响图21,图A描绘ssDNA的Cas14a1靶向(图A-图D中使用了错配位置)和靶标1的错配(MM)位置的代表性重复的原始比率的图。在于三个不同底物上平铺突变的情况下,靶向底物的Cas14a的切割率(图21,图B-图D)。图21,图E描绘具有增加的二级结构量的底物的反式切割率。图21,图F描绘使用截短的底物的反式切割率。点表示单个测量值。
图22,图A-图B描绘CRISPR-Cas14***的多样性。图22,图A描绘指示的Cas14***的代表性基因座架构。蛋白质长度按比例绘制。图22,图B块描绘V型效应子的最大似然树,其中包括Cas14的所有八个已鉴定亚型。
图23,图A-图C描绘异源宿主中Cas14a1介导的干扰的测试。Cas14a1和LbCas12a构建体的图,用于测试大肠杆菌中的干扰。(B)在大肠杆菌上发现的ΦX174斑点揭示了Cas12a介导的而非Cas14a1介导的干扰。每个斑点表示ΦX174储备液的10倍稀释液。(C)感染ΦX174的表达Cas14a1或LbCas12a的大肠杆菌的生长曲线(T,靶向;NT,非靶向)。图19,图F显示热图,其显示在存在各种指导序列和靶标组合的情况下在30分钟孵育之后,由于ssDNAFQ报告基因切割产生的减去背景的荧光。
虽然本发明已经参考其特定实施方案进行描述,但是本领域技术人员应理解,可在不脱离本发明的真实精神和范围的情况下进行各种改变并且可进行等同物替换。另外,为了使特定情况、材料、物质组成、方法、一个或多个方法步骤适应本发明的目的、精神和范围,可进行许多修改。所有此类修改意图处于所附权利要求的范围内。
参考文献
1.R.Barrangou et al.,CRISPR provides acquired resistance againstviruses in prokaryotes.Science.315,1709-12(2007).
2.S.A.Jackson et al.,CRISPR-Cas:Adapting to change.Science.356(6333),pp.1-9(2017).
3.S.Shmakov et al.,Diversity and evolution of class 2 CRISPR-Cassystems.Nat.Rev.Microbiol.15,169-182(2017).
4.J.S.Chen,J.A.Doudna,The chemistry of Cas9 and its CRISPRcolleagues.Nat.Rev.Chem.1,0078(2017).
5.C.T.Brown et al.,Unusual biology across a group comprising morethan 15%of domain Bacteria.Nature.523,208-211(2015).
6.K.Anantharaman et al.,Thousands of microbial genomes shed light oninterconnected biogeochemical processes in an aquifer system.Nat.Commun.7,13219(2016).
7.V.M.Markowitz et al.,IMG/M 4 vetsion of the integrated metagenomecomparative analysis system.Nucleic Acids Res.42,568-573(2014).
8.V.M.Markowitz et al.,IMG:The integrated microbial genomes databaseand comparative analysis system.Nucleic Acids Res.40,115-122(2012).
9.A.J.Probst et al.,Genomic resolution of a cold subsurfacc aquifercommunity provides metabolic insights for novel microbes adapted to high CO2concentrations.Environ.Microbiol.19,459-474(2017).
10.I.Yosef,M.G.Goren,U.Qimron,Proteins and DNA elements essential forthe CRISPR adaptation process in Escherichia coli.Nucleic Acids Res.40,5569-5576(2012).
11.J.K.A.S.Y.Lee,A.Engelman,J.a.Doudna,Integrase-mediated spaceracquisition during CRISPR-Cas adaptive immunity.Nature.519,193-198(2015).
12.S.Shmakov et al.,Discovery and Functional Characterization ofDiverse Class 2 CRISPR-Cas Systems.Mol.Cell.60,385-397(2015).
13.D.Burstein et al.,New CRISPR-Cas systems from uncultivatedmicrobes.Nature.542,237-241(2017).
14.C.Rinke et al.,Insights into the phylogeny and coding potential ofmicrobial dark matter.Nature.499,431-437(2013).
15.C.J.Castelle et al.,Genomic expansion of domain archaea highlightsroles for organisms from new phyla in anaerobic carbon cycling.Curr.Biol.25,690-701(2015).
16.E.Deltcheva et al.,CRISPR RNA maturation by trans-encoded smallRNA and host factor RNase III.Nature.471,602-607(2011).
17.K.E.Savell,J.J.Day,Applications of CRISPR/CAS9 in the mammaliancentral nervous system.Yale J.Biol.Med.90(2017),pp.567-581.
18.F.J.M.Mojica,C.Díez-J.García-Martínez,C.Almendros,Shortmotif sequencesdetermine the targets of the prokaryotic CRISPR defenccsystem.Microbiology.155,733-740(2009).
19.Y.Zhang,R.Rajan,H.S.Seifert,A.Mondragón,E.J.Sontheimer,DNase HActivity of Neisseria meningitidis Cas9.Mol.Cell60,242-255(2015).
20.E.Ma,L.B.Harrington,M.R.O’Connell,K.Zhou,J.A.Doudna,Single-Stranded DNA Cleavage by Divergent CRISPR-Cas9 Enzymes.Mol.Cell.60,398-407(2015).
21.J.S.Chen et al.,CRISPR-Cas12a target binding unleashesindiscriminate single-stranded DNase activity.Science.360,436-439(2018).
22.B.Zetsche et al.,Cpf1 Is a Single RNA-Guided Endonuclease of aClass 2 CRISPR-Cas System.Cell.163,759-771(2015).
23.A.East-Seletsky et al.,Two distinct RNase activities of CRISPR-C2c2 enablc guide-RNA processing and RNA detection.Nature.538,270-273(2016).
24.L.Liu et al.-The Molecular Architecture for RNA-Guided RNACleavage by Cas13a.Cell.170,714-726.e10(2017).
25.O.O.Abudayyeh et al.,C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Science(80-.).353,1-9(2016).
26.G.J.Knott et al.,Guide-bound structures of an RNA-targeting A-cleaving CRISPR-Cas13a enzyme.Nat.Struct.Mol.Biol.24,825-833(2017).
27.S.Y.Li et al.,CRISPR-Cas12a has both cis-and trans-cleavageactivities on single-stranded DNA.Cell Res.28,491-493(2018).
28.H.Eiberg et al.,Blue eye color in humans may be caused by aperfectly associated founder mutation in a regulatory element located withinthe HERC2 gene inhibiting OCA2 expression.Hum.Genet.123,177-187(2008).
29.S.Shmakov et al.-Diversity and evolution of class 2 CRISPR-Cassystems.Nat.Rev.Microbiol.15,169-182(2017).
30.E.V Koonin,K.S.Makarova,F.Zhang,Diversity,classification andevolution of CRISPR-Cas systems.Curr.Opin.Microbiol.37,67-78(2017).
31.K.S.Makarova et al.,An updated evolutionary classification ofCRISPR-Cas systems.Nat Rev Microbiol,1-15(2015).
32.O.Barabas et al.,Mechanism of IS 200/IS 605 Family DNATransposases:Activation and Transposou-Directed Target Site Selection,208-220(2008).
33.M.Yoshida et al.,Quantitative viral community DNA analysis revealsthe dominance of single-stranded DNA viruses in offshore upper bathyalsediment from Tohoku,Japan,Front.Microbiol.9,1-10(2018).
34.C.T.Brown et al.,Unusual biology across a group comprising morethan 15%of domain Bacteria.Nature.523,208-211(2015).
35.K.Anantharaman et al.,Thousands of microbial genomes shed light oninterconnected biogeochemical processes in an aquifer system.Nat.Commun.7,13219(2016).
36.A.J.Probst et al.,Genomic resolution of a cold subsurface aquirercommunity provides metabolic insights for novel microbes adapted to high CO2concentrations.Environ.Microbiol.19,459-474(2017).
37.V.M.Markowitz et al.,IMG/M 4 version of the integrated metagenomecomparative analysis system.Nucleic Acids Res.42,568-573(2014).
38.V.M.Markowitz et al.,IMG:The integrated microbial genomes databaseand comparative analysis system.Nucleic Acids Res.40,115-122(2012).
39.R.D.Finn,J.Clements,S.R.Eddy,HMMER web server:interactive sequencesimilarity searching.Nucleic Acids Res.39,W29-W37(2011).
40.D.Burstein et al.,New CRISPR-Cas systems from uncultivatedmicrobes.Nature.542,237-241(2017).
41.I.Grissa,G.Vergnaud,C.Pourcel,CRISPRFinder:a web tool to identifyclustered regularly interspaced short palindromic repeats.Nucleic AcidsRes.35,W52-W57(2007).
42.A.Biswas,R.H.J.Staals,S.E.Morales,P.C.Fineran,C.M.Brown,CRISPRDetect:A flexible algorithm to define CRISPR arrays.BMC Genomics.17,1-14(2016).
43.A.Stamatakis,RAxML version 8:A tool for phylogenetic analysis andpost-analysis of large phylogenies.Bioinformatics.30,1312-1313(2014).
44.B.Langmead,S.L.Salzberg,Fast gapped-read alignment with Bowtie2.Nat Methods.9,357-359(2012).
45.H.Ogata et al.,KEGG:Kyoto encyclopedia of genes andgenomes.Nucleic Acids Res.27,29-34(1999).
46.L.B.Harrington et al.,A thermostable Cas9 with increased lifetimein human plasma.Nat.Commun.8,1-7(2017).
47.G.Crooks,G.Hon,J.Chandonia,S.Brenner,NCBI GenBank FTP Site\nWebLogo:a sequence logo generator.Genome Res.14,1188-1190(2004).
48.L.B.Harrington et al.,A Broad-Spectrum Inhibitor of CRISPR-Cas9.Cell.170,1224-1233.e15(2017).
49.J.S.Chen et al.,CRISPR-Cas12a target binding unleashesindiscriminate single-stranded DNase activity.Science.360,436-439(2018).
50.Brown et al.,Unusual biology across a group comprising more than15%of domain Bacteria.Nature.523,208-211(2015),doi:10.1038/nature14486.

Claims (22)

1.一种将CasZ多肽导向至靶核酸的靶序列的方法,
所述方法包括使所述靶核酸与工程化的和/或非天然存在的复合物接触,所述复合物包含:
(a)CasZ多肽;
(b)CasZ指导RNA,所述CasZ指导RNA包含与所述靶核酸的靶序列杂交的指导序列,并且包含与所述CasZ多肽结合的区域。
2.如权利要求1所述的方法,其中所述接触在靶细胞内部发生。
3.如权利要求2所述的方法,其中所述接触包括:将以下至少一项引入所述靶细胞中:
(a)所述CasZ多肽或编码所述CasZ多肽的核酸;和
(b)所述CasZ指导RNA或编码所述CasZ指导RNA的核酸。
4.如权利要求3所述的方法,其中编码所述CasZ多肽的所述核酸是经密码子优化以在所述靶细胞中表达的非天然序列。
5.如权利要求2-4中任一项所述的方法,其中所述靶细胞是真核细胞。
6.如权利要求2-5中任一项所述的方法,其中所述靶细胞在体外培养物中。
7.如权利要求2-5中任一项所述的方法,其中所述靶细胞是体内的。
8.如权利要求2-5中任一项所述的方法,其中所述靶细胞是离体的。
9.如权利要求5所述的方法,其中所述真核细胞选自由以下组成的组:植物细胞、真菌细胞、单细胞真核生物体、哺乳动物细胞、爬行动物细胞、昆虫细胞、禽细胞、鱼细胞、寄生虫细胞、节肢动物细胞、无脊椎动物细胞、脊椎动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、灵长类动物细胞、非人灵长类动物细胞和人细胞。
10.如权利要求2-9中任一项所述的方法,其中所述接触还包括:将DNA供体模板引入所述靶细胞中。
11.如权利要求1-10中任一项所述的方法,其中所述方法包括使所述靶核酸与CasZ反式激活非编码RNA(trancRNA)接触。
12.如权利要求2-10中任一项所述的方法,其中所述接触包括:将CasZ反式激活非编码RNA(trancRNA)和/或编码所述CasZ trancRNA的核酸引入所述靶细胞中。
13.如权利要求11或权利要求12所述的方法,其中所述trancRNA包含与表2的trancRNA序列具有70%或更高的同一性的核苷酸序列。
14.一种包含工程化的和/或非天然存在的复合物的组合物,所述复合物包含:
(a)CasZ多肽或编码所述CasZ多肽的核酸;和
(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
15.如权利要求14所述的组合物,其还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
16.一种包含工程化的和/或非天然存在的复合物的试剂盒,所述复合物包含:
(a)CasZ多肽或编码所述CasZ多肽的核酸;
(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域。
17.如权利要求16所述的试剂盒,其还包含CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
18.一种遗传修饰的真核细胞,其包含以下至少一项:
(a)CasZ多肽或编码所述CasZ多肽的核酸;
(b)CasZ指导RNA或编码所述CasZ指导RNA的核酸,其中所述CasZ指导RNA包含与靶核酸的靶序列互补的指导序列,并且包含与所述CasZ多肽结合的区域;和
(c)CasZ反式激活非编码RNA(trancRNA)或编码所述CasZ trancRNA的核酸。
19.如前述权利要求中任一项所述的组合物、试剂盒或真核细胞,其特征在于以下至少一项:
(a)编码所述CasZ多肽的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ多肽,并且(ii)与异源启动子可操作地连接;
(b)编码所述CasZ指导RNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ指导RNA,并且(ii)与异源启动子可操作地连接;和
(c)编码所述CasZ trancRNA的所述核酸包含如下核苷酸序列,所述核苷酸序列:(i)编码所述CasZ trancRNA,并且(ii)与异源启动子可操作地连接。
20.一种检测样品中的靶DNA的方法,所述方法包括:
(a)使所述样品与以下物质接触:
(i)CasZ多肽;
(ii)指导RNA,所述指导RNA包含:与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列;和
(iii)为单链的且不与所述指导RNA的所述指导序列杂交的检测剂DNA;以及
(b)测量由所述CasZ切割所述单链检测剂DNA而产生的可检测信号,从而检测所述靶DNA。
21.一种用于检测样品中的靶DNA的试剂盒,所述试剂盒包含:
(a)指导RNA或编码所述指导RNA的核酸;其中所述指导RNA包含:与CasZ多肽结合的区域和与靶DNA互补的指导序列;和
(b)为单链的且不与所述指导RNA的所述指导序列杂交的经标记的检测剂DNA。
22.一种切割单链DNA(ssDNA)的方法,所述方法包括:
使核酸群体与以下物质接触,其中所述群体包含靶DNA和多个非靶ssDNA:
(i)CasZ多肽;和
(ii)指导RNA,所述指导RNA包含:与所述CasZ多肽结合的区域和与所述靶DNA杂交的指导序列,
其中所述CasZ多肽切割所述多个非靶ssDNA。
CN202310721532.3A 2017-11-01 2018-10-31 Casz组合物和使用方法 Pending CN117487776A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762580395P 2017-11-01 2017-11-01
US62/580,395 2017-11-01
CN201880084919.XA CN111886336A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法
PCT/US2018/058545 WO2019089820A1 (en) 2017-11-01 2018-10-31 Casz compositions and methods of use

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201880084919.XA Division CN111886336A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Publications (1)

Publication Number Publication Date
CN117487776A true CN117487776A (zh) 2024-02-02

Family

ID=66332730

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310721532.3A Pending CN117487776A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法
CN201880084919.XA Pending CN111886336A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201880084919.XA Pending CN111886336A (zh) 2017-11-01 2018-10-31 Casz组合物和使用方法

Country Status (14)

Country Link
US (7) US20200087640A1 (zh)
EP (1) EP3704239A4 (zh)
JP (2) JP2021503278A (zh)
KR (1) KR20200091858A (zh)
CN (2) CN117487776A (zh)
AU (1) AU2018358051A1 (zh)
BR (1) BR112020008654A2 (zh)
CA (1) CA3080493A1 (zh)
GB (1) GB2582482B (zh)
IL (1) IL274276A (zh)
MX (1) MX2020004578A (zh)
RU (1) RU2020117711A (zh)
SG (1) SG11202003863VA (zh)
WO (1) WO2019089820A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4032538A3 (en) 2009-03-02 2022-10-26 Massachusetts Institute of Technology Methods and products for in vivo enzyme profiling
CA3214092A1 (en) 2011-03-15 2012-09-20 Massachusetts Institute Of Technology Multiplexed detection with isotope-coded reporters
WO2014197840A1 (en) 2013-06-07 2014-12-11 Massachusetts Institute Of Technology Affinity-based detection of ligand-encoded synthetic biomarkers
CA3020324A1 (en) 2016-04-08 2017-10-12 Massachusetts Institute Of Technology Methods to specifically profile protease activity at lymph nodes
US11428689B2 (en) 2016-05-05 2022-08-30 Massachusetts Institute Of Technology Methods and uses for remotely triggered protease activity measurements
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
CA3038982A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
EA201990861A1 (ru) 2016-09-30 2019-09-30 Те Риджентс Оф Те Юниверсити Оф Калифорния Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения
WO2018187688A1 (en) 2017-04-07 2018-10-11 Massachusetts Institute Of Technology Methods to spatially profile protease activity in tissue and sections
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
CN110997908A (zh) 2017-06-09 2020-04-10 爱迪塔斯医药公司 工程化的cas9核酸酶
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
CN117487776A (zh) 2017-11-01 2024-02-02 加利福尼亚大学董事会 Casz组合物和使用方法
CN110551800B (zh) * 2018-06-03 2022-08-19 上海吐露港生物科技有限公司 一种耐高温Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒
EP3830301B1 (en) 2018-08-01 2024-05-22 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
BR112021011372A2 (pt) * 2018-12-14 2021-08-31 Pioneer Hi-Bred International, Inc. Novos sistemas crispr-cas para edição de genoma
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP3911753A1 (en) 2019-01-17 2021-11-24 Massachusetts Institute of Technology Sensors for detecting and imaging of cancer metastasis
MX2021010559A (es) 2019-03-07 2021-12-15 Univ California Polipéptidos efectores de crispr-cas y métodos de uso de estos.
JP2022530981A (ja) * 2019-05-01 2022-07-05 マンモス バイオサイエンシズ インコーポレイテッド プログラム可能なヌクレアーゼおよび使用方法
CN114846146B (zh) 2019-10-29 2024-04-12 基恩科雷有限责任公司 用于增加CRISPR/Cas12f1***的效率的工程化引导RNA及其用途
US20210262025A1 (en) 2020-02-18 2021-08-26 Massachusetts Institute Of Technology Multiplexed in vivo disease sensing with nucleic acid-barcoded reporters
CN111257297B (zh) * 2020-03-31 2023-06-16 海南大学 一种基于Cas14a酶的RNA检测方法
WO2021204877A2 (en) 2020-04-08 2021-10-14 Astrazeneca Ab Compositions and methods for improved site-specific modification
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
AU2021353004A1 (en) 2020-09-30 2023-04-13 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
JP2023545079A (ja) 2020-10-08 2023-10-26 ゲンコレ インコーポレイテッド CRISPR/Cas12f1システム効率化のためのU-rich tailを含むエンジニアリングされたガイドRNAおよびその用途
JP2023544817A (ja) 2020-10-08 2023-10-25 ゲンコレ インコーポレイテッド CRISPR/Cas12f1システム効率化のためのエンジニアリングされたガイドRNAおよびその用途
WO2022075816A1 (ko) 2020-10-08 2022-04-14 주식회사 진코어 Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
KR102638799B1 (ko) * 2020-10-08 2024-02-22 주식회사 진코어 CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도
CN116568803A (zh) 2020-10-08 2023-08-08 基恩科雷有限责任公司 用于增加CRISPR/Cas12f1***的效率的包含富含U的尾部的经工程化的引导RNA及其用途
CN112176035A (zh) * 2020-10-14 2021-01-05 杭州优思达生物技术有限公司 一种新型crispr核酸检测方法及应用
WO2022092317A1 (ja) * 2020-10-30 2022-05-05 国立大学法人東京大学 エンジニアリングされたCas12fタンパク質
EP4337701A1 (en) 2021-05-10 2024-03-20 Mammoth Biosciences, Inc. Effector proteins and methods of use
WO2022241032A1 (en) * 2021-05-12 2022-11-17 Mammoth Biosciences, Inc. Enhanced guide nucleic acids and methods of use
KR20220155553A (ko) 2021-05-14 2022-11-23 주식회사 진코어 RNA-guided Nuclease를 이용한 LCA10 치료용 조성물 및 치료방법
US20230023791A1 (en) 2021-06-01 2023-01-26 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
KR20230074819A (ko) 2021-07-05 2023-05-31 주식회사 진코어 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도
US11814689B2 (en) 2021-07-21 2023-11-14 Montana State University Nucleic acid detection using type III CRISPR complex
WO2023086938A2 (en) * 2021-11-12 2023-05-19 Arbor Biotechnologies, Inc. Type v nucleases
WO2023102550A2 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Compositions and methods for efficient in vivo delivery
WO2023168242A1 (en) * 2022-03-01 2023-09-07 Epicrispr Biotechnologies, Inc. Engineered nucleases, compositions, and methods of use thereof
CN114561456A (zh) * 2022-03-23 2022-05-31 北京盛因生物科技有限公司 一种等温核酸检测酶组合物、试剂盒及其用途和检测方法
WO2023201275A1 (en) * 2022-04-13 2023-10-19 The Board Of Trustees Of The Leland Stanford Junior University Enzyme kinetics analyses of crispr endonucleases
WO2023208000A1 (en) * 2022-04-25 2023-11-02 Huidagene Therapeutics Co., Ltd. Novel crispr-cas12f systems and uses thereof
CN117512071B (zh) * 2023-09-15 2024-06-04 湖北大学 一种耐高温TnpB蛋白及其在核酸检测中的应用

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004521606A (ja) 2000-05-24 2004-07-22 サード・ウェーブ・テクノロジーズ・インク Rnaの検出法
US6773885B1 (en) 2000-09-29 2004-08-10 Integrated Dna Technologies, Inc. Compositions and methods for visual ribonuclease detection assays
EP1580273A1 (en) * 2004-03-26 2005-09-28 Friedrich-Alexander-Universität Erlangen-Nürnberg Peptide-based method for monitoring gene expression in a host cell
CN101283089A (zh) * 2005-10-07 2008-10-08 加利福尼亚大学董事会 修饰细胞色素p450酶的编码核酸和其应用方法
US9689031B2 (en) 2007-07-14 2017-06-27 Ionian Technologies, Inc. Nicking and extension amplification reaction for the exponential amplification of nucleic acids
WO2011100749A2 (en) 2010-02-15 2011-08-18 Cascade Biosystems, Inc. Methods and materials for detecting viral or microbial infections
US20130261196A1 (en) 2010-06-11 2013-10-03 Lisa Diamond Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US9730967B2 (en) 2011-02-04 2017-08-15 Katherine Rose Kovarik Method and system for treating cancer cachexia
US8815782B2 (en) 2011-11-11 2014-08-26 Agilent Technologies, Inc. Use of DNAzymes for analysis of an RNA sample
MX362866B (es) 2012-05-25 2019-02-20 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn.
US20140189896A1 (en) 2012-12-12 2014-07-03 Feng Zhang Crispr-cas component systems, methods and compositions for sequence manipulation
JP2016519652A (ja) * 2013-03-14 2016-07-07 カリブー・バイオサイエンシーズ・インコーポレイテッド 核酸ターゲティング核酸の組成物および方法
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
JP2016537028A (ja) 2013-11-18 2016-12-01 クリスパー セラピューティクス アーゲー Crispr−casシステムの材料及び方法
EP3080266B1 (en) 2013-12-12 2021-02-03 The Regents of The University of California Methods and compositions for modifying a single stranded target nucleic acid
WO2015116686A1 (en) 2014-01-29 2015-08-06 Agilent Technologies, Inc. Cas9-based isothermal method of detection of specific dna sequence
WO2015139139A1 (en) 2014-03-20 2015-09-24 UNIVERSITé LAVAL Crispr-based methods and products for increasing frataxin levels and uses thereof
US10253311B2 (en) * 2014-04-10 2019-04-09 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
CN107075546B (zh) * 2014-08-19 2021-08-31 哈佛学院董事及会员团体 用于对核酸探测并作图的rna-引导的***
WO2016094872A1 (en) 2014-12-12 2016-06-16 The Broad Institute Inc. Dead guides for crispr transcription factors
EP3985115A1 (en) 2014-12-12 2022-04-20 The Broad Institute, Inc. Protected guide rnas (pgrnas)
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016123243A1 (en) 2015-01-28 2016-08-04 The Regents Of The University Of California Methods and compositions for labeling a single-stranded target nucleic acid
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
EP4159856A1 (en) 2015-06-18 2023-04-05 The Broad Institute, Inc. Novel crispr enzymes and systems
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CA3012607A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzymes and systems
TWI813532B (zh) 2015-06-18 2023-09-01 美商博得學院股份有限公司 降低脱靶效應的crispr酶突變
US9580727B1 (en) * 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides
US20170211142A1 (en) 2015-10-22 2017-07-27 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3400299B1 (en) * 2016-01-08 2020-11-11 University of Georgia Research Foundation, Inc. Methods for cleaving dna and rna molecules
US11441146B2 (en) 2016-01-11 2022-09-13 Christiana Care Health Services, Inc. Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
US20190024075A1 (en) 2016-02-23 2019-01-24 Arc Bio, Llc Methods and compositions for target detection
US20190093091A1 (en) 2016-04-06 2019-03-28 Temple University - Of The Commonwealth System Of Higher Education Compositions for eradicating flavivirus infections in subjects
WO2017205668A1 (en) 2016-05-25 2017-11-30 Arizona Board Of Regents On Behalf Of Arizona State University Portable, low-cost pathogen detection and strain identification platform
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
KR20230156150A (ko) 2016-06-17 2023-11-13 더 브로드 인스티튜트, 인코퍼레이티드 제vi형 crispr 오솔로그 및 시스템
US10017760B2 (en) 2016-06-24 2018-07-10 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
US20210166783A1 (en) 2016-08-17 2021-06-03 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
CA3038982A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
EA201990861A1 (ru) 2016-09-30 2019-09-30 Те Риджентс Оф Те Юниверсити Оф Калифорния Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения
CN106701830B (zh) * 2016-12-07 2020-01-03 湖南人文科技学院 一种敲除猪胚胎p66shc基因的方法
BR112018015871B1 (pt) 2016-12-09 2021-12-07 The Broad Institute, Inc. Sistema, método e dispositivo para detectar a presença de uma sequência alvo de ácido nucleico em uma amostra
EP3601576A1 (en) 2017-03-24 2020-02-05 CureVac AG Nucleic acids encoding crispr-associated proteins and uses thereof
CA3059956A1 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
KR102631985B1 (ko) * 2017-08-09 2024-02-01 라이스텍, 인크. 게놈을 변형시키기 위한 조성물 및 방법
WO2019089796A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Cas12c compositions and methods of use
US20200255858A1 (en) 2017-11-01 2020-08-13 Jillian F. Banfield Casy compositions and methods of use
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
CN117487776A (zh) 2017-11-01 2024-02-02 加利福尼亚大学董事会 Casz组合物和使用方法
US10253365B1 (en) * 2017-11-22 2019-04-09 The Regents Of The University Of California Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs
US20210108267A1 (en) 2017-12-22 2021-04-15 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics

Also Published As

Publication number Publication date
MX2020004578A (es) 2020-12-03
RU2020117711A3 (zh) 2022-03-28
US20240167009A1 (en) 2024-05-23
GB202008124D0 (en) 2020-07-15
GB2582482B (en) 2023-05-17
US11180743B2 (en) 2021-11-23
US20200370028A1 (en) 2020-11-26
JP2021503278A (ja) 2021-02-12
CA3080493A1 (en) 2019-05-09
GB2582482A (en) 2020-09-23
IL274276A (en) 2020-06-30
US20200172886A1 (en) 2020-06-04
US11371031B2 (en) 2022-06-28
EP3704239A1 (en) 2020-09-09
US20200299660A1 (en) 2020-09-24
US20210017508A1 (en) 2021-01-21
US11453866B2 (en) 2022-09-27
US11441137B2 (en) 2022-09-13
KR20200091858A (ko) 2020-07-31
RU2020117711A (ru) 2021-12-02
US20200087640A1 (en) 2020-03-19
US20230323319A1 (en) 2023-10-12
EP3704239A4 (en) 2021-08-18
WO2019089820A1 (en) 2019-05-09
CN111886336A (zh) 2020-11-03
AU2018358051A1 (en) 2020-05-14
JP2023082141A (ja) 2023-06-13
SG11202003863VA (en) 2020-05-28
BR112020008654A2 (pt) 2020-11-10

Similar Documents

Publication Publication Date Title
US11453866B2 (en) CASZ compositions and methods of use
US11970719B2 (en) Class 2 CRISPR/Cas compositions and methods of use
US20200255858A1 (en) Casy compositions and methods of use
JP7306696B2 (ja) Rna誘導型核酸修飾酵素及びその使用方法
CN116732004A (zh) CRISPR-Cas效应子多肽和其使用方法
US20210309981A1 (en) Variant type v crispr/cas effector polypeptides and methods of use thereof
JP2021501611A (ja) Cas12c組成物及び使用方法
US20230028178A1 (en) Crispr-cas effector polypeptides and methods of use thereof
CN114040971A (zh) CRISPR-Cas效应子多肽及其使用方法
US20230348872A1 (en) Crispr-cas effector polypeptides and methods of use thereof
US20240102032A1 (en) Crispr-cas effector polypeptides and methods of use thereof
WO2023039373A2 (en) Crispr-cas effector polypeptides and method of use thereof
WO2023147240A2 (en) Variant type v crispr/cas effector polypeptides and methods of use thereof
EA045278B1 (ru) Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination