CN107614680A - 利用重组核酸内切酶***的最佳化基因编辑 - Google Patents

利用重组核酸内切酶***的最佳化基因编辑 Download PDF

Info

Publication number
CN107614680A
CN107614680A CN201680027857.XA CN201680027857A CN107614680A CN 107614680 A CN107614680 A CN 107614680A CN 201680027857 A CN201680027857 A CN 201680027857A CN 107614680 A CN107614680 A CN 107614680A
Authority
CN
China
Prior art keywords
dna
lys
leu
protein
genome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680027857.XA
Other languages
English (en)
Inventor
J·君格
T·亨特
S·费拉瑟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Southern California USC
Original Assignee
University of Southern California USC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Southern California USC filed Critical University of Southern California USC
Publication of CN107614680A publication Critical patent/CN107614680A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本文描述了用于基因组编辑的方法和组合物。用于基因组编辑的核酸内切酶涉及诱发双链DNA中的断裂,对于此来说,敲入是非常低效的,因为其依赖于通过修复蛋白将同源DNA序列随机整合至断裂位点。为了解决这些问题,本文描述了新颖的重组融合蛋白,所述重组融合蛋白主动在较接近基因组裂解位点处募集线性DNA***物,提高了大DNA片段整合至基因组的效率。此类对基因组编辑技术的改良允许在不牺牲效率下使用较低的线性DNA浓度,并且可以进一步与例如荧光蛋白报告***等其它特征组合。

Description

利用重组核酸内切酶***的最佳化基因编辑
发明领域
本文描述了用于遗传序列的体外和体内操控以进行研究和治疗活动,包括产生敲除和敲入序列以进行基因组编辑的方法和组合物。
发明背景
在过去的10年间,CRISPR-Cas基因组编辑已经成为一项更加成熟的技术。像所有其它的基因组编辑技术一样,它能够产生敲除表型,但是在引入供体DNA序列的敲入方面不是非常有效。对生物技术和初级研究更有用的酶的研发包括提高酶的功效,创造新的酶来满足需求,或修改酶以扩大其功能性。举例来说,克列诺(Klenow)核酸外切酶-酶是克列诺大片段的截短形式。此经修饰的DNA聚合酶保持其聚合酶活性,但失去了大片段回嚼(chewback)3’DNA悬垂物的能力。另一个实例包括DNA聚合酶,DNA聚合酶是一种有专利权的融合蛋白,它由校对DNA聚合酶加赋予较高拷贝速率的另一DNA聚合酶的结构域组成。将这些原理扩大至基因组编辑领域,将能够创造一种新的Cas-9蛋白,所述蛋白保持现存的DNA核酸内切酶活性,同时提高了供体DNA序列整合至基因组的效率。提出了若干策略来解决此需求。
尤其在供体DNA***基因组方面存在若干障碍。非同源末端接合(Non-homologousend joining,NHEJ)虽然是一种适于敲除基因的方法,但它总体上无法在不存在任何其它突变下来整合供体DNA。同源性指导修复(Homology directed repair,HDR)涵盖至少两种形式:需要霍利迪结构(Holliday structure)来解决整合的长序列同源性臂,或依赖于链侵入和紧急DNA修复***来解决整合事件的短同源性臂。HDR与NHEJ的任何组合将主要在NHEJ解决的受损DNA部分内产生indel(***和缺失)突变。本质上,随机过程决定了同源DNA可能的整合,并且困扰敲入的有效基因组编辑,包括供体DNA片段的长度与整合效率之间的反比关系,供体DNA的整合效率与细胞中的供体DNA浓度和线性DNA片段的细胞毒性过多成正比,以及双链断裂的两个自由端的空间限制,因此引起的最可能结果是两个末端再次退火。
本文描述了如下重组融合蛋白的研发,所述重组融合蛋白主动在较接近基因组裂解位点处募集线性DNA***物,从而提高整合效率,尤其是大DNA片段整合至基因组的效率。此类对基因组编辑技术的改良允许在不牺牲效率下使用较低的线性DNA浓度,并且可以进一步与例如荧光蛋白报告***等其它特征组合。
发明概要
本文描述了一种组合物,所述组合物包括如下载体,所述载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白。在多个实施方案中,融合蛋白包括至少一种选自由以下组成的群组的核酸内切酶:cas规则间隔的短回文(cas regularly interspacedshort palindromic,CRISPR)蛋白、锌指核酸酶(zinc finger nuclease,ZFN)和类转录激活因子效应物核酸酶(transcription activator-like effector nucleases,TALEN)。在多个实施方案中,CRISPR蛋白包括cas9。在多个实施方案中,DNA结合部分包括锌指蛋白。在多个实施方案中,锌指包括左旋CCR5结合蛋白。在多个实施方案中,至少一种核酸内切酶和DNA结合部分由包括两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个氨基酸的连接子接合。在多个实施方案中,融合蛋白包括荧光标记蛋白。在多个实施方案中,荧光标记蛋白包括一种或多种选自由以下组成的群组的蛋白质:绿色荧光蛋白(greenfluorescent protein,GFP)、增强型绿色荧光蛋白(eGFP)、红色荧光蛋白(redfluorescent protein,RFP)和mCherry。在多个实施方案中,融合蛋白包括核定位信号(nuclear localization signal,NLS)。在多个实施方案中,NLS是SV40NLS。
本文进一步描述了一种基因组编辑方法,所述方法包括:(a)提供一定量的一种或多种载体,所述载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白;以及(b)使细胞群体与所述量的一种或多种载体接触,其中所述融合蛋白能够诱发双链断裂(doublestranded break,DSB)并且DSB的同源重组(homologous recombination,HR)引起所述细胞群体的基因组的编辑。在多个实施方案中,所述方法包括在步骤(b)中使所述细胞群体与一种或多种指导RNA(guide RNA,gRNA)接触。在多个实施方案中,所述方法包括在步骤(b)中使所述细胞群体与模板DNA接触。在多个实施方案中,模板DNA包括至少一个表达盒、两个侧翼序列和DNA结合部分序列。在多个实施方案中,两个侧翼序列每个至少10bp,并与所述细胞群体的基因组中的序列同源。在多个实施方案中,DNA结合部分序列包括CCR5。在多个实施方案中,接触所述细胞群体包括选自由以下组成的群组的技术:转染、电穿孔和转化。在多个实施方案中,所述细胞群体包括干细胞或祖细胞。
本文描述了一种用于基因组编辑的试剂盒,所述试剂盒包括:一种或多种载体,所述载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白;以及模板DNA,所述模板DNA包括至少一个表达盒、两个侧翼序列和DNA结合部分序列。在多个实施方案中,试剂盒包括一种或多种指导RNA(gRNA)。在多个实施方案中,试剂盒的融合蛋白包括至少一种核酸内切酶CRISPR蛋白、DNA结合部分锌指蛋白。在多个实施方案中,试剂盒包括荧光标记蛋白。在多个实施方案中,试剂盒包括核定位信号(NLS)。
本文还描述了一种多基因座基因组编辑方法,所述方法包括在一个或多个基因座通过以下来诱发粘性末端形成:添加CRISPR蛋白,提供一定量的一种或多种指导链RNA,连接一种或多种单链供体DNA,将一种或多种双链DNA与终止寡核苷酸杂交,将一种或多种双链DNA从一种或多种单链供体DNA合成为一种或多种构成完整供体DNA链的双链DNA以形成粘性末端,并且将相容的粘性末端接合在一个或多个基因座上。
图示简单说明
图1.重组Cas-9设计。通常,指导RNA(gRNA)与标靶DNA互补,并且Cas-9核酸内切酶使基因组DNA裂解,其中随机过程决定了同源DNA的可能整合。为了使这些过程转向有利的重组事件,重组融合蛋白包括CCR5锌指作为DNA结合部分以结合待***的同源线性DNA片段,并使片段更接近双链断裂(DSB)。有助于增加DSB与线性DNA接近的重组Cas-9将更有效地产生基因组编辑。
图2.使用GFP作为报告基因以及β-肌动蛋白作为标靶基因,在野生型Cas-9与重组Cas-9之间进行比较。野生型条件包括18个CFP阳性群落中的5个也是GFP阳性的,其中2个是仅仅GFP阳性(即稳定要素)。在Cas-9锌指条件下包括12个CFP阳性群落中的9个也是GFP阳性的,其中4个是仅仅GFP阳性。比例尺=10μM。
图3:(图3A)数据显示锌指加入Cas9未赋予额外的锌指依赖性核酸内切酶活性。供体DNA(900bp)含有CCR5DNA结合序列(在线性DNA的5’末端上碱基对80-92)。针对每个条件来标记蛋白质与指导链的组合。(图3B)由供体DNA的整合产生的GFP信号的三个实例。正在证实GFP阳性克隆。mCherry是内部活力对照物。
图4:通过PCR证实β-肌动蛋白中GFP的整合。GFP的PCR是总GFP序列的300bp片段,β-肌动蛋白反向引物在sfGFP整合位点下游退火300bp。
图5:Cas9-锌指融合蛋白有效地将质粒DNA线性化。似乎存在脱靶裂解,可能是由于锌指而发生,不过当包括供体DNA时脱靶裂解得到改善。泳道5和6是负载至两个孔中的一种样品,因为孔5部分闭合。
图6:由指导链RNA混合物指导的平行多基因座。从指导链RNA的T7RNA合成(图6A)开始,接着夹板(图6B)介导的单链供体DNA序列(图6D)连接(图6C)至指导链RNA的5’末端。合成的供体DNA的5’核苷酸(图6E)与其邻近的核苷酸形成抵抗核酸外切酶的硫代磷酸酯键。其后,双链DNA终止寡核苷酸杂交(图6F),接着进行等温DNA聚合酶(克列诺核酸外切酶-)反应以从夹板引物(步骤2)至终止寡核苷酸(步骤3)填充双链(图6G),以及进行T4-DNA连接酶反应(图6H)以形成具有适当5’粘性末端的完整供体片段(图6I),用于供体DNA粘性末端连接至由cpf1消化的基因组DNA的粘性末端(图6J)。在供体DNA的粘性末端连接(图6K)以及供体和基因组DNA之间由于其接近和序列同源性而进行同源重组(图6L)后,完全整合。
发明详述
本文中引用的所有参考文献都如同充分阐述一般,以引用的方式整体并入本文中。除非另外定义,否则本文中使用的技术和科学术语具有与本发明所属领域的一般技术人员通常所了解的含义相同的含义。Allen等人,Remington:The Science and Practiceof Pharmacy第22版,Pharmaceutical Press(2012年9月15日);Hornyak等人,Introduction to Nanoscience and Nanotechnology,CRC Press(2008);Singleton和Sainsbury,Dictionary of Microbiology and Molecular Biology第3版,修订版,J.Wiley&Sons(New York,NY 2006);Smith,March’s Advanced Organic ChemistryReactions,Mechanisms and Structure第7版,J.Wiley&Sons(New York,NY 2013);Singleton,Dictionary of DNA and Genome Technology第3版,Wiley-Blackwell(2012年11月28日);以及Green和Sambrook,Molecular Cloning:A Laboratory Manual第4版,ColdSpring Harbor Laboratory Press(Cold Spring Harbor,NY 2012),为本领域的技术人员提供了关于本申请中所用的许多术语的通用指导。关于如何制备抗体的参考文献,参见Greenfield,Antibodies A Laboratory Manual第2版,Cold Spring Harbor Press(ColdSpring Harbor NY,2013);和Milstein,Derivation of specific antibody-producing tissue culture and tumor lines by cell fusion,Eur.J.Immunol.1976年7月,6(7):511-9;Queen和Selick,Humanized immunoglobulins,美国专利No.5,585,089(1996年12月);以及Riechmann等人,Reshaping human antibodies for therapy,Nature1988年3月24日,332(6162):323-7。
本领域的技术人员将认识到与本文描述的方法和材料类似或等同的许多方法和材料,这些方法和材料可以用于实施本发明。实际上,本发明决不限于本文描述的方法。出于本发明的目的,在下文定义以下术语。
如本文所用的“施用(Administering)”和/或“施用(administer)”是指用于将药物组合物递送至患者的任何途径。递送途径可以包括非侵入性经口(通过口腔)、局部(皮肤)、经粘膜(鼻、颊/舌下、***、眼睛和直肠)和吸入途径,以及肠胃外途径,和本领域中已知的其它方法。肠胃外是指一般与注射有关的递送途径,包括眶内、输注、动脉内、颈动脉内、囊内、心内、皮内、肌肉内、腹膜内、肺内、脊柱内、胸骨内、鞘内、子宫内、静脉内、蛛网膜下、囊下、皮下、经粘膜或经气管。通过肠胃外途径,组合物可以呈用于输注或注射的溶液或悬浮液形式,或呈冻干粉末形式。
如本文所用的“调节(Modulation)”或“调节(modulates)”或“调节(modulating)”是指反应的上调(即活化或刺激)、下调(即抑制或压制)或两者组合或分开。
如本文所用的“药学上可接受的载剂”是指适用于本发明中的常规药学上可接受的载剂。
如本文所用的“促进(Promote)”和/或“促进(promoting)”是指细胞或生物体的特定行为得到加强。
如本文所用的“受试者”包括所有动物,包括哺乳动物和其它动物,包括(但不限于)伴侣动物、家畜和动物园动物。术语“动物”可以包括任何活的多细胞脊椎动物生物体,这是一个包括例如哺乳动物、鸟、猿、犬、猫、马、母牛、啮齿类动物等的种类。同样,术语“哺乳动物”包括人类与非人类哺乳动物。
如本文所用的“治疗有效量”是指指定组合物或组合物中的活性剂足够在所治疗的受试者中实现所需作用的量。治疗有效量可以视多种因素而变化,这些因素包括但不限于受试者的生理条件(包括年龄、性别、疾病类型和阶段、整体身体状况、对所给剂量的反应性、所需临床作用)和施用途径。临床和药理学领域的技术人员将能够通过常规实验确定治疗有效量。
如本文所用的“治疗(Treat)”、“治疗(treating)”和“治疗(treatment)”是指治疗性治疗和防治性或预防性措施,其中目标是预防或减慢(减轻)目标病状、疾病或病症(统称为“病痛”),即使治疗最终不成功。需要治疗者可以包括已经患上病痛者以及有患上病痛的倾向者或有待预防病痛者。
在过去十年间,基因组编辑已经成为一个研究热点,其重点在于针对模型动物内的相关基因产生基因敲除。大部分的用于敲入所贡献的遗传序列的方法典型地依赖于利用随机整合位点的蛮力法或者同源重组事件。这些技术中的一些仅仅在界定的模型生物体中有效,而其它技术只具有有限的应用。因此,用于整合序列在300-3,500bp长度范围内的供体DNA的一种更广泛且有效的工具箱将提供解答生物学内的某些问题的解决方案,更迅速地产生有用的转基因动物,以及使治疗诊断剂更廉价、更快并且临床医师和其患者更易获得。此工具箱可以使甚至小的实验室也可以更有效地使用行业标准细胞培养技术迅速制造“无痕”转基因细胞系/动物并且总开支合理,尝试的次数更少。
在先前关于围绕整合的突变所解决的问题之上的关于供体DNA整合的基本问题是供体DNA片段的长度与整合效率之间的反比关系。已经报告在54个碱基对(总共120bp)的每一侧上41个和49个序列同源性碱基侧接27个碱基(总长度117)或33个碱基对的***供体DNA序列的27个和54个碱基产生以下效率:64%突变率、3.2%整合率,其中一半缺乏针对117碱基供体DNA的其它突变;以及86%突变率、15.6%整合、3.5%精确整合。他人已经使用TALEN核酸内切酶与极具创意的数学组合,报告对于侧接与整合位点同源的827个碱基和904个碱基的编码GFP的700个碱基,0%的突变率和50%的整合率(但使用最坏情况,可能低至8.9%)和1.5%胚系传播。
第二,供体DNA整合至基因组的效率与细胞中的供体DNA浓度成正比。细胞中的片段越丰富,它越可能参与DNA修复机制。线性DNA片段过多引起导致细胞毒性的问题,这在很大程度上是因为细胞防御DNA病毒的先天能力,以及细胞从核酸内切酶损害恢复的能力饱和。细胞无法辩别受损DNA末端与供体DNA末端可能会使基因组DNA未得到修复。
第三,细胞核是密集地填充着基因组DNA的结构。基因组DNA中的双链断裂的两个游离端受空间限制,不能彼此扩散开,因此最可能的结果是两个末端再次退火,在具有核酸内切酶活性的基因座处添加和/或去除一些序列。
基因组编辑.到目前为止已经揭露了基因组工程化是一种校正遗传突变的通用而有效的工具。位点特异性染色体整合可以靶向所需核苷酸改变,包括将治疗性基因盒引入染色体内的安全着陆位点,破坏特定等位基因的编码或非编码区以及校正遗传突变以逆转疾病表型。例如锌指核酸酶(ZFN)和类转录激活因子效应物核酸酶(TALEN)等常规技术已经为基因组编辑和疗法提供了概念验证研究的重要基础。然而,规律成簇的间隔短回文重复序列(CRISPR)和CRISPR相关的核酸内切酶蛋白(cas)***的最新发展通过减少设计特定突变的靶向所需的步骤数而扩大了此通用性和便利性。
简单地说,使用例如ZFN等工具的基因组编辑可以基于将位点特异性DNA双链断裂(DSB)引入相关基因座。此过程的关键是通过同源性指导修复(HDR)或非同源末端接合(NHEJ)途径有效修复DSB的细胞修复机制。这些DNA修复途径的机制可以产生界定的遗传结果。更具体地说,使用ZFN的基因组编辑可以基于将位点特异性DNA DSB引入相关基因座。其后,NHEJ修复可以迅速而有效地连接两个断裂的末端,为遗传信息的获得或失去提供了时机。此特征可以用于在断裂位点引入小的***和/或缺失,从而破环标靶基因。如果例如疾病由有毒的蛋白质积累引起,那么无义或错义序列的指令将有效地消除异常蛋白质,从而校正由遗传基因缺陷引起的人类病症。或者,如果特别设计的同源供体DNA与ZFN组合提供,那么此模板可以产生基因校正或***,因为DSB的修复可以包括几个在内源位点改变的核苷酸或在断裂位点添加新的基因。
虽然已知关于基因组编辑过程开拓了很多内容,但在例如ZFN和TALEN等常规技术下,存在重大的挑战。这些早一代核酸酶ZFN和TALEN是人造融合蛋白,是由工程化的DNA结合域与来自FokI限制酶的非特异性核酸酶裂解结构域融合构成。具有定制特异性的锌指和类转录激活因子效应物重复结构域可以接合,以结合于扩大的DNA序列。虽然通过修饰DNA结合特异性来修改ZFN和TALEN提供了显著水平的靶向控制,但是个别锌指结构域提供了一定异质性,对于DNA结合来说需要一些背景依赖性。TALE重复结构域似乎对这些背景依赖性作用不太敏感,并且可以模块化装配,实际上通过个别重复序列与四种可能的DNA核苷酸之间简单的一对一码识别任何DNA序列,但编码大量高度保守的TALE重复序列的DNA的装配可能需要使用非标准分子生物学克隆方法。
虽然ZFN与TALEN两者都涉及使用蛋白质-DNA相互作用进行靶向,但细菌CRISPR-Cas***是独特而灵活的,因为它利用RNA作为使核酸酶靶向所需DNA序列的部分。与ZFN和TALEN平台形成对比,CRISPR-CAS在工程化RNA与标靶DNA位点之间使用简单的沃森-克里克(Watson-Crick)碱基配对原则。一般地,两种组分形成CRISPR核酸酶***的核心,即Cas核酸酶(例如cas9)和指导RNA(grNA),gRNA来源于CRISPR衍生的RNA(“crRNA”)与顺式作用的反义RNA(“tracRNA”)的融合。在大部分充分研究的实例中,单个gRNA与cas蛋白(例如cas9)复合,以介导与gRNA的前(5′)20个核苷酸互补并且紧贴原型间隔区相邻基元(“PAM”)序列(酿脓链球菌(Streptococcus pyogenes)cas9的5’-NGG的典型形式,但也存在替代5’-NAG)的标靶DNA位点的裂解。因此,在此***下,简单地通过改变gRNA的前20个核苷酸以与标靶DNA序列对应,Cas9核酸酶活性可以针对形式N20-NGG的任何DNA序列。注意来自其它细菌物种的II型CRISPR***识别替代PAM序列并且利用不同的crRNA和tracrRNA序列进行靶向基因组编辑。
已经使用Cas9诱发的DSB引入NHEJ介导的indel突变,以及刺激双链质粒DNA和单链寡核苷酸供体模板两者的HDR。使用Cas9***将DSB同时引入多个位点的能力是此平台相对于ZFN或TALEN的一个独特的优点。举例来说,Cas9和多种gRNA的表达已经用于诱发DSB之间小和大的缺失或倒置,同时引入平行的遗传编辑突变,改变大鼠、小鼠ES细胞克隆和斑马鱼中的不同基因。总之,CRISPR/cas介导的基因编辑技术的这些发展可以加速基因-功能关系发现的步伐,并且成为研发个人化治疗剂的聚焦方法。
一种替代方案是使用Cpf1,Cpf1是具有与Cas9不同的特征的假定2类CRISPR效应物。Cpf1是单RNA指导的核酸内切酶,它不需要使用tracrRNA。作为替代,它利用富含T的原型间隔区相邻基元TTTN并且在指导的5’侧上。结果,切开的CPF1交错,发生在靶向的+链上PAM后面的19bp,以及在相反链上的23bp。与通过Cas9产生的钝端相反,Cpf1产生具有5'悬垂物的交错切口。此允许通过非同源末端接合(NHEJ)编辑。能够将粘性末端的确切序列程序化将允许研究员设计DNA***物,以便其呈适当取向整合。已经证明AsCpf1(来自氨基酸球菌属(Acidaminococcus))和LbCpf1(来自毛螺菌科(Lachnospiraceae))具有在人类细胞中进行基因组编辑的能力。
CRISPR/Cas或CRISPR/Cpf1***的精确和简明允许进行修改以靶向患者的特定突变,通过腺相关病毒(“AAV”)载体或也通过腺病毒载体与递送***组合,因为基因组编辑机制的最佳媒介物可以直接递送组分至相关器官或细胞。有限的报告说,例如携带锌指核酸酶和供体模板构筑体的AAV载体的全身性注射能够在小鼠中校正突变的转基因凝血因子IX并重建低水平但在临床上可检测的水平的循环蛋白。在这点上,AAV-CRISPR***可以经递送以通过用于隐性突变的相同基因校正机制处理显性突变,在能够通过病毒载体递送的有限的足迹下紧密地递送靶向的基因组编辑机制,相对于标靶基因的尺寸是恒定和不可知的,并且维持内源基因表达化学计量。CRISPR/Cas、CRISPR/Cpf1编辑的这些和其它优点给予其广泛的可能临床应用范围。
因此,对于利用工程化核酸酶的任何基因组编辑***来说,使用与DNA结合部分接合的核酸内切酶,例如结合供体DNA的锌指蛋白,或缔合供体DNA的其它方法。供体DNA和双链断裂的接近提高了供体DNA的整合效率。
尽管有了这些进展,但是最重要的技术问题仍然是使用基因组编辑工具进行供体DNA整合的效率低。本文中,本发明人描述了一种基于以下认识的解决方法:可以使供体DNA非常接近基因组DNA中的双链断裂位点。此可以通过创造Cas9:DNA结合蛋白基元融合物来实现。通过将供体DNA募集至裂解位点,可以使用对细胞无毒,但是提供将提高整合效率的局部供体DNA浓度的供体DNA浓度。因为供体DNA与受损DNA保持如此紧密接近,所以可以在供体DNA的两个末端上将序列同源性臂工程化成相对较短(<100bp),以便对比纯霍利迪接合依赖性同源重组,细胞的SOS DNA修复***偏好:5’-3’核酸外切酶V修整、单链DNA的RPA包覆、3’链侵入、通过核酸外切酶Rad1/Rad10进行3’端修整以及DNA缺口连接以修复DNA。利用此类型DNA修复,如果是有利的结果,那么将具有稳固的基因组编辑***,它可以针对极大的供体DNA片段的整合进一步最佳化。通过使随机过程转化有利的重组事件,重组融合蛋白有助于增加DSB和线性DNA的接近,以更有效地进行基因组编辑。
为了实现此提高的整合效率,供体DNA必须处于与DNA损害位点靠近或比受损基因组DNA的两个相对末端彼此更靠近的位置。供体DNA募集至这些位点通过供体DNA与酶促活性的Cas-9RNA依赖性核酸内切酶的直接或间接缔合来进行。这些DNA结合元件需要特定的结构域或全长蛋白质整体,包括但不限于这些天然存在或工程化的实例:转录因子、核酸内切酶、锌指、TALEN、核酸内切酶-Cas-9+指导链RNA或可以直接或间接结合特定DNA序列的其它此类核糖核蛋白。Cas9-核酸内切酶和供体DNA结合元件的一些(但当然不是所有)可能构型是:直接融合、缔合(多聚结构域,如亮氨酸拉链、fkbp/FRB等)、通过抗体模拟物的工程化缔合或以序列特异性方式结合于Cas9核酸内切酶以及结合于供体DNA的任何合成大分子(基于碳水化合物、蛋白质或脂质)。初步结果表明此经修饰的Cas-9比野生型Cas-9在细胞系中产生敲入基因修饰功效优良得多。
本文描述了一种组合物,所述组合物包括如下载体,所述载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白。在多个实施方案中,融合蛋白核酸内切酶包括至少一种选自由以下组成的群组的核酸内切酶:cas规则间隔的短回文(CRISPR)蛋白、锌指核酸酶(ZFN)或类转录激活因子效应物核酸酶(TALEN)。在其它实施方案中,DNA结合部分包括锌指蛋白。在其它实施方案中,融合蛋白包括至少一种核酸内切酶CRISPR蛋白和DNA结合部分锌指蛋白。在其它实施方案中,锌指蛋白包括左旋、右旋或两种锌指。在其它实施方案中,锌指包括左旋CCR5序列。在其它实施方案中,DNA结合部分可以包括特定结构域或全长蛋白质整体,包括转录因子、核酸内切酶、锌指、TALEN、核酸内切酶-Cas-9+指导链RNA或可以直接或间接结合特定DNA序列的其它此类核糖核蛋白。在其它实施方案中,至少一种核酸内切酶和DNA结合部分由包括两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个氨基酸的连接子接合。在其它实施方案中,Cas9-核酸内切酶和供体DNA结合部分的一些构型是:直接融合、缔合(多聚结构域,如亮氨酸拉链、fkbp/FRB等)、通过抗体模拟物的工程化缔合或以序列特异性方式结合于Cas9核酸内切酶以及结合于供体DNA的任何合成大分子(基于碳水化合物、蛋白质或脂质)。在其它实施方案中,融合蛋白进一步包括核定位信号(NLS),例如SV40NLS。在其它实施方案中,CRISPR蛋白是来源于酿脓链球菌的cas蛋白。在其它实施方案中,CRISPR蛋白不是来源于酿脓链球菌的cas蛋白。在多个实施方案中,CRISPR蛋白是cpf1,例如来自氨基酸球菌属的AsCpf1和来自毛螺菌科的LbCpf1。在其它实施方案中,CRISPR蛋白是cas9。在其它实施方案中,CRISPR蛋白是cpf1。在其它实施方案中,融合蛋白包括报告蛋白。在多个实施方案中,报告蛋白包括荧光标记蛋白,包括绿色或红色荧光蛋白(GFP或RFP,包括增强型eGFP)、mCherry或类似蛋白。在其它实施方案中,载体是DNA载体、质粒、人工染色体。在其它实施方案中,载体是病毒,例如腺病毒、腺相关病毒或慢病毒。
在其它实施方案中,载体编码一种或多种指导RNA(gRNA),其中所述一种或多种gRNA包括能够结合于原型间隔区相邻基元(PAM)的序列。在其它实施方案中,一种或多种gRNA包括能够结合于PAM的序列。在其它实施方案中,PAM包括序列NGG。在其它实施方案中,PAM包括序列NAG。在其它实施方案中,gRNA包含CRISPR衍生的RNA(crRNA)和顺式作用的反义RNA(tracRNA)。在多个实施方案中,gRNA长度是10个、20个、30个或40个或更多个核苷酸。在多个实施方案中,约15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸与相关基因同源。在多个实施方案中,约20个核苷酸与相关基因座同源。举例来说,此包括利用N20NGG与标靶序列杂交的gRNA设计。在一些实施方案中,CRISPR蛋白是cas9。在其它实施方案中,CRISPR蛋白是cpf1。在多个实施方案中,组合物用于改变细胞中的标靶多核苷酸序列的方法中,所述方法包括利用至少一种gRNA,使多核苷酸序列与CRISPR蛋白(例如cas9)接触,所述gRNA指导CRISPR与标靶多核苷酸序列上的同源序列杂交,其中所述标靶多核苷酸序列裂解,并且其中表达CRISPR蛋白的细胞的改变效率是约10%-20%、30%-40%、40%-50%或50%-80%或更多。在多个实施方案中,当与使用天然野生型核酸内切酶的方法相比时,改变效率提高1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、100倍。本文进一步描述了使用所述方法产生的一定量的细胞。
进一步描述了一种基因组编辑方法,所述方法包括提供一定量的一种或多种载体,每种载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白;以及使细胞群体与所述量的一种或多种载体接触。在多个实施方案中,融合蛋白核酸内切酶包括至少一种选自由以下组成的群组的核酸内切酶:cas规则间隔的短回文(CRISPR)蛋白、锌指核酸酶(ZFN)或类转录激活因子效应物核酸酶(TALEN)。在其它实施方案中,DNA结合部分包括锌指蛋白。在其它实施方案中,融合蛋白包括至少一种核酸内切酶CRISPR蛋白和DNA结合部分锌指蛋白。在其它实施方案中,锌指蛋白包括左旋、右旋或两种锌指。在其它实施方案中,锌指包括左旋CCR5序列。在其它实施方案中,DNA结合部分可以包括特定结构域或全长蛋白质整体,包括转录因子、核酸内切酶、锌指、TALEN、核酸内切酶-Cas-9+指导链RNA或可以直接或间接结合特定DNA序列的其它此类核糖核蛋白。在其它实施方案中,至少一种核酸内切酶和DNA结合部分由包括两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个氨基酸的连接子接合。在其它实施方案中,Cas9-核酸内切酶和供体DNA结合部分的一些构型是:直接融合、缔合(多聚结构域,如亮氨酸拉链、fkbp/FRB等)、通过抗体模拟物的工程化缔合或以序列特异性方式结合于Cas9核酸内切酶以及结合于供体DNA的任何合成大分子(基于碳水化合物、蛋白质或脂质)。在其它实施方案中,融合蛋白进一步包括核定位信号(NLS),例如SV40NLS。在其它实施方案中,CRISPR蛋白是来源于酿脓链球菌的cas蛋白。在其它实施方案中,CRISPR蛋白不是来源于酿脓链球菌的cas蛋白。在多个实施方案中,CRISPR蛋白是cpf1,例如来自氨基酸球菌属的AsCpf1和来自毛螺菌科的LbCpf1。在其它实施方案中,CRISPR蛋白是cas9。在其它实施方案中,CRISPR蛋白是cpf1。在其它实施方案中,融合蛋白包括报告蛋白。在多个实施方案中,报告蛋白包括荧光标记蛋白,包括绿色或红色荧光蛋白(GFP或RFP,包括增强型eGFP)、mCherry或类似蛋白。在其它实施方案中,所述方法是一种体内方法。在其它实施方案中,所述方法是一种体外方法。在某些实施方案中,所述细胞群体包括胚胎干细胞,包括人类或小鼠胚胎干细胞。在多个实施方案中,所述方法包括在所述量的细胞中产生双链断裂(DSB),其中所述DSB的同源重组(HR)引起细胞基因组的编辑。在其它实施方案中,HR包括非同源末端接合(NHEJ),其在基因座上引入所表达的蛋白质的错义或无义。在其它实施方案中,错义或无义引起基因组中标靶序列的敲除。在其它实施方案中,HR包括同源性指导修复(HDR),其引入模板DNA。在其它实施方案中,HDR引起基因组中标靶序列的敲入。在其它实施方案中,模板DNA与标靶序列同源。在其它实施方案中,模板DNA与野生型遗传序列同源。在其它实施方案中,模板DNA含有表达盒,所述表达盒例如包括被转录和翻译成相关蛋白质的序列。在其它实施方案中,模板DNA包括在与标靶序列同源或与野生型遗传序列同源的约20个碱基的上游和下游两处具有确切序列同源性的至少80个碱基。在其它实施方案中,上游和下游序列是至少10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、200个、250个、300个、350个、400个、450个、500个或更多个碱基对。在其它实施方案中,模板DNA包括用于结合DNA结合部分的序列。在其它实施方案中,模板DNA包括构成左旋CCR5-锌指-结合位点的约12个碱基对。在其它实施方案中,细胞群体与所述量的一种或多种载体接触包括转染、电穿孔和/或脂质体转染。在其它实施方案中,载体是DNA载体、质粒、人工染色体。在其它实施方案中,载体是病毒,例如腺病毒、腺相关病毒或慢病毒。
在其它实施方案中,载体编码一种或多种指导RNA(gRNA),其中所述一种或多种gRNA包括能够结合于原型间隔区相邻基元(PAM)的序列。在其它实施方案中,一种或多种外源性gRNA引入所述量的细胞中。在其它实施方案中,一种或多种gRNA包括能够结合于PAM的序列。在其它实施方案中,PAM包括序列NGG。在其它实施方案中,PAM包括序列NAG。在其它实施方案中,gRNA包含CRISPR衍生的RNA(crRNA)和顺式作用的反义RNA(tracRNA)。在多个实施方案中,gRNA长度是10个、20个、30个或40个或更多个核苷酸。在多个实施方案中,约15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸与相关基因同源。在多个实施方案中,约20个核苷酸与相关基因座同源。举例来说,此包括利用N20NGG与标靶序列杂交的gRNA设计。在一些实施方案中,CRISPR蛋白是cas9。在多个实施方案中,组合物用于改变细胞中的标靶多核苷酸序列的方法中,所述方法包括利用至少一种gRNA,使多核苷酸序列与CRISPR蛋白(例如cas9)接触,所述gRNA指导CRISPR与标靶多核苷酸序列上的同源序列杂交,其中所述标靶多核苷酸序列裂解,并且其中表达CRISPR蛋白的细胞的改变效率是约10%-20%、30%-40%、40%-50%或50%-80%或更多。在多个实施方案中,当与使用天然野生型核酸内切酶的方法相比时,改变效率提高1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、100倍。本文进一步描述了使用所述方法产生的一定量的细胞。
举例来说,基因组编辑方法包括提供一定量的一种或多种载体,每种载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白;以及使细胞群体与所述量的一种或多种载体接触,其中至少一种核酸内切酶包括CRISPR蛋白并且DNA结合部分包括锌指蛋白,使细胞群体与所述量的一种或多种载体接触包括转染、电穿孔和/或脂质体转染,进一步包括gRNA和/或模板DNA,并且在接触细胞群体之后,引起双链断裂(DSB)产生并且同源性指导修复(HDR)将模板DNA引入细胞群体的基因组中。在其它实施方案中,模板DNA与标靶序列同源。在其它实施方案中,模板DNA与野生型遗传序列同源。在其它实施方案中,模板DNA含有表达盒,所述表达盒例如包括被转录和翻译成相关蛋白质的序列。在其它实施方案中,模板DNA包括在与标靶序列同源或与野生型遗传序列同源的约20个碱基的上游和下游两处具有确切序列同源性的至少80个碱基。在其它实施方案中,模板DNA包括用于结合DNA结合部分的序列。在其它实施方案中,模板DNA包括构成左旋CCR5-锌指-结合位点的约12个碱基对。
还描述了一种用于基因组编辑的试剂盒,所述试剂盒包括一定量的一种或多种载体,每种载体编码包括至少一种核酸内切酶和DNA结合部分的融合蛋白并且使细胞群体与所述量的一种或多种载体接触,并且进一步包括与标靶序列或野生型遗传序列同源的模板DNA,所述模板DNA包括在与标靶序列同源或与野生型遗传序列同源的约20个碱基的上游和下游两处具有确切序列同源性的至少10个碱基。在其它实施方案中,DNA结合部分包括锌指蛋白。在其它实施方案中,融合蛋白包括至少一种核酸内切酶CRISPR蛋白和DNA结合部分锌指蛋白。在其它实施方案中,试剂盒包括一种或多种指导RNA(gRNA),其中所述一种或多种gRNA包括能够结合于原型间隔区相邻基元(PAM)的序列。
在其它实施方案中,上游和下游序列是至少10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、200个、250个、300个、350个、400个、450个、500个或更多个碱基对。在多个实施方案中,融合蛋白核酸内切酶包括至少一种选自由以下组成的群组的核酸内切酶:cas规则间隔的短回文(CRISPR)蛋白、锌指核酸酶(ZFN)或类转录激活因子效应物核酸酶(TALEN)。在其它实施方案中,DNA结合部分包括锌指蛋白。在其它实施方案中,融合蛋白包括至少一种核酸内切酶CRISPR蛋白和DNA结合部分锌指蛋白。在其它实施方案中,锌指蛋白包括左旋、右旋或两种锌指。在其它实施方案中,锌指包括左旋CCR5序列。在其它实施方案中,DNA结合部分可以包括特定结构域或全长蛋白质整体,包括转录因子、核酸内切酶、锌指、TALEN、核酸内切酶-Cas-9+指导链RNA或可以直接或间接结合特定DNA序列的其它此类核糖核蛋白。在其它实施方案中,至少一种核酸内切酶和DNA结合部分由包括两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个氨基酸的连接子接合。在其它实施方案中,Cas9-核酸内切酶和供体DNA结合部分的一些构型是:直接融合、缔合(多聚结构域,如亮氨酸拉链、fkbp/FRB等)、通过抗体模拟物的工程化缔合或以序列特异性方式结合于Cas9核酸内切酶以及结合于供体DNA的任何合成大分子(基于碳水化合物、蛋白质或脂质)。在其它实施方案中,融合蛋白进一步包括核定位信号(NLS),例如SV40NLS。在其它实施方案中,CRISPR蛋白是来源于酿脓链球菌的cas蛋白。在其它实施方案中,CRISPR蛋白不是来源于酿脓链球菌的cas蛋白。在多个实施方案中,CRISPR蛋白是cpf1,例如来自氨基酸球菌属的AsCpf1和来自毛螺菌科的LbCpf1。在其它实施方案中,CRISPR蛋白是cas9。在其它实施方案中,融合蛋白包括报告蛋白。在多个实施方案中,报告蛋白包括荧光标记蛋白,包括绿色或红色荧光蛋白(GFP或RFP,包括增强型eGFP)、mCherry或类似蛋白。在多个实施方案中,所述试剂盒能够在所述量的细胞中产生双链断裂(DSB),其中所述DSB的同源重组(HR)引起细胞基因组的编辑。在其它实施方案中,HR包括非同源末端接合(NHEJ),其在基因座引入所表达的蛋白质的错义或无义。在其它实施方案中,错义或无义引起基因组中标靶序列的敲除。在其它实施方案中,HR包括同源性指导修复(HDR),其引入模板DNA。在其它实施方案中,HDR引起基因组中标靶序列的敲入。在其它实施方案中,模板DNA与标靶序列同源。在其它实施方案中,模板DNA与野生型遗传序列同源。在其它实施方案中,模板DNA含有表达盒,所述表达盒例如包括被转录和翻译成相关蛋白质的序列。在其它实施方案中,模板DNA包括在与标靶序列同源或与野生型遗传序列同源的约20个碱基的上游和下游两处具有确切序列同源性的至少80个碱基。在其它实施方案中,上游和下游序列是至少10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、200个、250个、300个、350个、400个、450个、500个或更多个碱基对。在其它实施方案中,模板DNA包括用于结合DNA结合部分的序列。在其它实施方案中,模板DNA包括构成左旋CCR5-锌指-结合位点的约12个碱基对。在其它实施方案中,细胞群体与所述量的一种或多种载体接触包括转染、电穿孔和/或脂质体转染。在其它实施方案中,载体是DNA载体、质粒、人工染色体。在其它实施方案中,载体是病毒,例如腺病毒、腺相关病毒或慢病毒。
在其它实施方案中,载体编码一种或多种gRNA,其中所述一种或多种gRNA包括能够结合于PAM的序列。在其它实施方案中,一种或多种外源性gRNA引入所述量的细胞中。在其它实施方案中,一种或多种gRNA包括能够结合于PAM的序列。在其它实施方案中,PAM包括序列NGG。在其它实施方案中,PAM包括序列NAG。在其它实施方案中,gRNA包含CRISPR衍生的RNA(crRNA)和顺式作用的反义RNA(tracRNA)。在多个实施方案中,gRNA长度是10个、20个、30个或40个或更多个核苷酸。在多个实施方案中,约15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸与相关基因同源。在多个实施方案中,约20个核苷酸与相关基因座同源。举例来说,此包括利用N20NGG与标靶序列杂交的gRNA设计。在一些实施方案中,CRISPR蛋白是cas9。在其它实施方案中,CRISPR蛋白是cpf1。在多个实施方案中,试剂盒用于改变细胞中的标靶多核苷酸序列的方法中,所述方法包括利用至少一种gRNA,使多核苷酸序列与CRISPR蛋白(例如cas9)接触,所述gRNA指导CRISPR与标靶多核苷酸序列上的同源序列杂交,其中所述标靶多核苷酸序列裂解,并且其中表达CRISPR蛋白的细胞的改变效率是约10%-20%、30%-40%、40%-50%或50%-80%或更多。在多个实施方案中,当与使用天然野生型核酸内切酶的方法相比时,改变效率提高1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、100倍。本文进一步描述了使用所述方法产生的一定量的细胞。
本文还描述了一种多基因座基因组编辑方法,所述方法包括在一个或多个基因座通过以下来诱发粘性末端形成:添加CRISPR蛋白,提供一定量的一种或多种指导链RNA,连接一种或多种单链供体DNA,将一种或多种双链DNA与终止寡核苷酸杂交,将一种或多种双链DNA从一种或多种单链供体DNA合成为一种或多种构成完整供体DNA链的双链DNA以形成粘性末端,并且将相容的粘性末端接合在一个或多个基因座。在多个实施方案中,提供一定量的一种或多种指导链RNA包括指导链RNA的T7RNA合成。在其它实施方案中,连接一种或多种单链供体DNA包括夹板介导的单链供体DNA序列连接至指导链RNA的5’末端。在多个实施方案中,合成的供体DNA的5’核苷酸与其邻近核苷酸形成抵抗核酸外切酶的硫代磷酸酯键。在其它实施方案中,发生双链DNA与终止寡核苷酸的杂交。在其它实施方案中,将一个或多个双链DNA从一个或多个单链供体DNA合成为一个或多个构成完整供体DNA链的双链DNA包括等温DNA聚合酶(克列诺核酸外切酶-)反应。在其它实施方案中,将一个或多个双链DNA从一个或多个单链供体DNA合成为一个或多个构成完整供体DNA链的双链DNA以形成粘性末端是通过T4-DNA连接酶反应进行。在多个实施方案中,在供体DNA的粘性末端连接以及供体和基因组DNA之间由于其接近和序列同源性而进行同源重组后,完全整合。在多个实施方案中,PAM是TTTN。在多个实施方案中,cpf1粘性末端是靶向的+链上PAM后面的19bp,以及具有5'悬垂物的相反链上的23bp。在多个实施方案中,cpf1例如是来自氨基酸球菌属的AsCpf1和来自毛螺菌科的LbCpf1。
实施例1
实验设计
如所描述,通过Cas-9进行基因操控包括通过Cas-9DNA裂解进行基因敲除,并且紧急DNA修复***相对易于产生,然而基因敲入/融合更具挑战,因为:较大的DNA***物(GFP=717个碱基对)的整合效率低,整合速率取决于***DNA浓度,较高浓度的线性DNA对细胞来说是有毒的。
通过主动将线性DNA***物募集至与基因组裂解位点更接近,可以提高大DNA片段整合至基因组的效率,能够在不牺牲效率下使用较低的线性DNA浓度,并且通过因细胞培养***而产生的多种蛋白质构型迅速地筛选。良好的生物学(荧光)读数允许迅速最佳化。
为了有助于发展CRISPR/Cas9最佳化的迅速而容易的分析,研发一种GFP:B-肌动蛋白报告***,包括:步骤1)构建Cas9:CCR5:NLS融合蛋白;步骤2)合成针对人类基因组B-肌动蛋白的sgRNA;步骤3)设计针对有效修复DNA进行最佳化的合适线性GFP DNA序列;步骤4)针对绿细胞进行筛选并且必要时最佳化。
实施例2
研究模型
出于以下原因,GFP-β肌动蛋白是第一种基因组GFP标记目标蛋白:其表达恒定并且可以迅速地筛选细胞,任何引起肌动蛋白敲除的移码和/或裂解都会导致细胞死亡。两个荧光标记mCherry和GFP是筛选整合效率和细胞活力的手段。GFP只能在其整合至基因组中并与包围序列同框时进行表达。mCherry将在所有活的转染细胞中表达。
实验条件包括:1)仅mCherry(转染效率/细胞活力对照物);2)Cas-9-nls、gsRNA、供体DNA、mCherry(NHEJ效率);3)供体DNA、gsRNA、mCherry(归因于线性DNA的细胞活力);4)Cas-9-ZF、供体DNA、mCherry(脱靶CCR5作用);5)Cas-9-ZF、gsRNA、供体DNA、mCherry(测试)。
由于转染中的构成试剂,荧光标记的GFP信号允许快速测定细胞活力,从而使将来的电穿孔最佳化。GFP信号将仅仅来自对整合呈阳性的细胞并且可以将群落分离、收集、扩大、基因分型,以确定GFP***位点,并且成像以确定适当的蛋白质定位。
实施例3
方法
从Addgene购得编码Cas-9-NLS的载体(质粒#42251)。从DNA序列的3’末端去除C端NLS并替换为短的3x甘氨酸-丝氨酸连接子(总共6个氨基酸)的编码序列、左旋CCR5,并且将先前去除的NLS添加在后面。将载体线性化并用作T7封端mRNA合成试剂盒的模板。使用RNeasy试剂盒净化RNA,接着进行苯酚/氯仿萃取和乙醇沉淀。
使用以下方案合成指导链RNA。GFP-基因融合物(GFP-β肌动蛋白)被公布为功能上可行的蛋白质,因此成为所需的基因组GFP标记内源性蛋白。PCR引物被设计成能扩增此区域周围的序列以靶向***HEK293细胞系内,并且对PCR产物进行测序以证实公布的染色体序列数据的准确性。基因组内的序列的20个碱基被选择作为指导链RNA的杂交标靶,并历经若干在线算法,以将指导链与基因组的杂交最大化并将脱靶杂交最小化。在选择序列之后,通过克列诺填充和PCR扩增,由从IDT定购的4种ssDNA寡核苷酸装配120bp DNA模板,每个指导链只独有所述寡核苷酸中的一种(即为求独特的gsRNA,必须只购买一种寡核苷酸,$18)。模板由T7启动子、与基因组标靶具有独特同源性的20个碱基和将编码Cas9结合发夹的80个碱基组成。配方如下:5pmol DNA模板、125uM NTP混合物、转录缓冲液(HEPES-MgCl2、DTT、亚精胺,pH 7.5)、150ug T7RNApol(20ul,自制),总体积是200ul。反应在37℃下培育2-4小时,直至在管底部收集Mg2+(焦磷酸盐)的白色沉淀。加入25ul 0.5M EDTA以清除沉淀物并停止进一步聚合。新合成的RNA在8%丙烯酰胺脲-PAGE凝胶上跑动,以从全长100碱基gsRNA分离未并入的NTP、截短RNA和DNA模板。通过TLC板上的阴影成像目测RNA,从凝胶剪出亮带,并通过在Whatman elutrap上电泳从凝胶洗提。接着对RNA进行乙醇沉淀并溶于10mM Tris pH8.0中,达所需浓度。
在一些测试集成之后,确定供体DNA序列将由在Cas-9引起双链DNA断裂所需的20个碱基的上游和下游两处具有确切序列同源性的至少80个碱基组成。此上游80bp和下游80bp在即将加入基因组的供体DNA序列的5’和3’末端上工程化。需要着重注意,用于确定最佳gsRNA杂交序列的测序数据也可用于产生精确的同源性臂。为了不干扰最终编码序列或者从标靶基因座转录的mRNA的剪接,在策略上,加入构成左旋CCR5-锌指-结合位点的12个碱基对。Super-folder GFP(sfGFP)、mCerulean和tagRFP通过沉默突变进行密码子最佳化,以便从有义和反义链两者去除任何一致mRNA剪接供体和剪接接受体序列。在PCR反应中β肌动蛋白同源性结构域和CCR5-结合位点在两个方向上从sfGFP扩大。从LMP琼脂糖凝胶纯化线性DNA,使用Qiagen凝胶提取试剂盒提取,苯酚/氯仿萃取,乙醇沉淀,并溶于TE缓冲液(10mM Tris、1mM EDTA,pH 8.0),达所需浓度。
由于进入转染的多种组分混合的性质(100碱基gsRNA、4500碱基Cas-9-ZF mRNA、6500bp Ubi6::mCherry质粒作为转染对照物、890bp线性供体DNA),所以与亲脂性或受体介导的转染试剂相对比,确定电穿孔是精选的递送方法。1×106个细胞悬浮在含有以下的1xPBS中:2ug gsRNA、1.5ug Cas-9-ZF mRNA、50ng供体DNA和1ug质粒DNA,总体积是40ul。细胞以Harvard Apparatus BTX-840供应的42V、50ms的方波脉冲电穿孔。接着细胞涂铺在60mm玻璃钮扣细胞培养盘上以便于成像、分析和克隆收获。HEK293细胞在具有5%FBS和庆大霉素(gentamicin)的DMEM中生长。在受精后10-30分钟将CRISPR/Cas mRNA或蛋白质、gsRNA和供体DNA混合物注入斑马鱼胚胎,以制造斑马鱼转基因品系。
实施例4
初步结果
如图2所示,野生型条件引起18个CFP阳性群落中仅仅5个也是GFP阳性的,其中2个是仅仅GFP阳性(即稳定要素)。相比之下,使用所述Cas-9锌指条件,12个CFP阳性群落中的9个也是GFP阳性的,其中4个是仅仅GFP阳性。图3中,结果证明锌指加入Cas9不赋予额外的锌指依赖性核酸内切酶活性(图3A)并且展示由整合供体DNA产生的GFP信号的三个实例(图3B)。正在证实GFP阳性克隆(图4)。mCherry是内部活力对照物。此工作在HEK-293t细胞中进行以产生与内源性β肌动蛋白融合的GFP。
干细胞中标记内源性蛋白质的此概念验证容易转化成迅速产生转基因动物。在此第一次迭代中,通过Cas-9:CCR5锌指将供体DNA募集至Cas-9的断裂位点的能力使外来DNA(723个碱基对,GFP)的整合比野生型Cas-9增加2.7倍。通过在供体DNA的每一侧上添加更多的基因组序列,将能够得到更高的整合效率。
实施例5
随后计划和应用
一旦研究出适于整合的条件,就可以在分开的小鼠ES细胞系中将Oct4用tagRFP、Sox2用CFP和Nanog用sfGFP遗传标记,并以所有可能的排列将这些组合。虽然这些细胞系本身将是有用的,但可用于产生转基因小鼠品系,在这些转基因小鼠品系中我们能够目测表示为融合蛋白的内源性水平的这些对研发具有重要意义的蛋白质的绝对量和定位。
另外,可以通过细菌表达省略Cas-9突变体的体内翻译,并随后纯化Cas-9融合蛋白。此纯化蛋白将预混合并用所有独特的基因组整合所必需的指导链RNA和供体DNA两者平衡。这些预装配的核酸内切酶/供体DNA整合单元可以注射或转染至胚胎或任何细胞系中。此构型不仅允许在最早阶段进行基因组编辑,而且将允许高效率地同时进行多个整合事件。这将是同时利用所有三个先前描述的整合,首次成功地产生小鼠ES干细胞系,成为第一批多个敲入品系。在其它实施例中,还可以将RNA探针,例如Spinach(1或2)靶向基因组中,以得到初期转录和/或mRNA剪接事件的可见读数。
实施例6
构筑体格式
另外,可以将此CRISPR、Cas-9:融合物、靶向供体DNA的***的所有元件组合至单个病毒中。减弱病毒将在正交诱发的启动子(即蜕皮激素受体驱动的表达将在除昆虫外的所有物种中起作用)或细胞类型特异性启动子下表达Cas-9:融合物和指导链RNA,并且病毒基因组将含有在两侧都侧接被指导链RNA识别的20个碱基对的供体DNA序列。此构型将产生与基因组标靶具有同源性的必需侧翼序列的线性供体DNA,并被Cas-9:融合物-gsRNA核酸内切酶募集至标靶基因座。此病毒构筑体可以用于:校正遗传突变,制造对药物更敏感的可制药标靶,或使先前不可制药的标靶可制药,并在此过程中自毁。
实施例7
应用中使用的示例性序列
制备多种构筑体以测试本文描述的可变设计。在一个实施例中,产生Cas-9锌指融合蛋白,包括以下元件:Cas-9核酸内切酶、短的9氨基酸连接子(ssagagaga)、左旋CCR5锌指、4氨基酸(wrlp)和核定位序列、终止子。核苷酸序列描述于[SEQ ID NO:1]中并且构筑体的氨基酸序列描述于[SEQ ID NO:2]中。关于Cas-9融合蛋白的Ni-NTA纯化,本发明人将6x组氨酸标签加入蛋白质的最后羧基末端。
使用或合成的其它供体DNA序列实例包括人类癌细胞系HEK293中利用的super-folder GFP:β-肌动蛋白[SEQ ID NO:3]。此序列包括在Cas-9核酸内切酶裂解位点上游处具有序列同源性的80个碱基对、左旋CCR5结合序列、编码短连接子的12个碱基、super-folder GFP和在核酸内切酶裂解位点下游处具有序列同源性的80个碱基对。
另一实例包括Sox-2:PS-mOrange2:Spinach2[SEQ ID NO:4]用于斑马鱼(D.rerio)。在Cas-9核酸内切酶裂解位点的上游处具有序列同源性的81个碱基对、Sox-2羧基末端的沉默突变、编码16甘氨酸/丝氨酸残基的48个碱基、可光控的橙色荧光蛋白(PS-mOrange2)、144个非编码碱基对、左旋CCR5结合序列、Spinach-2(mRNA荧光报告基因)和在核酸内切酶裂解位点的下游处具有序列同源性的82个碱基对。
额外实例包括Oct-4:GFP[SEQ ID NO:5]用于小鼠(小家鼠(M.musculus))。此序列包括在Cas-9核酸内切酶裂解位点上游处具有序列同源性的82个碱基对、编码甘氨酸/丙氨酸连接子的27个碱基、super-folder GFP、左旋CCR5结合序列和在核酸内切酶裂解位点下游处具有序列同源性的94个碱基对。
最终,利用包括人类β-肌动蛋白[SEQ ID NO:6]、斑马鱼Sox-2[SEQ ID NO:7]和小鼠Oct-4[SEQ ID NO:8]的多种指导链RNA序列。
实施例8
实验方案
本文中进一步描述应用上述构筑体的一种示例性实验方案:
-使所有cas9蛋白/sgRNA/供体DNA复合物在室温下平衡30分钟。
-可以使用人类B-肌动蛋白sgRNA和供体DNA
-利用“1:2:3”混合物策略(例如1pmol质粒:2pmol sgRNA:3pmol蛋白质:3pmolsgRNA)与90ng(0.013pmol)质粒DNA。这些条件是针对最小蛋白质用量和在凝胶上清楚读取而最佳化。
-Cas9反应在28℃下进行两小时。
-利用XmaI消化液(单切割),在37℃下反应两小时。
-在凝胶电泳前样品用qiagen PCR净化试剂/柱净化。
-样品在TAE中在1%琼脂糖凝胶上跑动。
以上方案证明Cas9-锌指融合蛋白有效地将质粒DNA线性化(图5)。似乎由于存在锌指而可能出现一些脱靶裂解。但是,当包括供体DNA时,脱靶裂解得到改善。以上方法已经考虑到针对注射到斑马鱼而最佳化的条件,以及体外证实B-肌动蛋白指导链和cas-9融合物一起发挥作用。基于在冷冻GFP:B-肌动蛋白HEK细胞上操作流式细胞计量术细胞分选(FACS),可以进一步证实。一旦制备GFP分选的培养物,基因组分析就可以证实编辑。
实施例9
一体化CRISPR编辑
在一替代实施方案中,特定指导链RNA-供体DNA杂交物的混合物可以允许平行的多基因座突变。更具体地说,采用特定的指导链RNA-供体DNA杂交物的混合物和单个CRISPR蛋白制剂。此方法将允许研究员在任何生物体或细胞系的基因组中对多个基因座进行同时添加/突变。
通过使用Cpf1代替Cas9进行CRISPR基因组编辑,允许利用高效率的粘性末端供体DNA-基因组DNA连接修复。供体DNA装配引物中的部分非天然核苷酸主链使得供体DNA的粘性末端不易降解,所述保存在理论上将更高的连接效率。
可以制造用于发展任何生物体的疾病或研究模型的平行的多基因座遗传突变,并且允许仅仅通过添加额外的指导链RNA/供体DNA融合物就同时编辑许多标靶基因。
虽然为了有效地达成这些目的,使用CRISPR/cpf1***描述以上内容,但以上方法似乎与多种当前或将来的RNA依赖性核酸内切酶,例如尤其cas9相容。
指导链/供体融合物如图6所示装配。更具体地说,
1)指导链RNA的T7RNA合成(图6A)
2)夹板(图6B)介导的单链供体DNA序列(图6D)连接(图6C)至指导链RNA的5’末端。合成的供体DNA的5’核苷酸(图6E)与其邻近核苷酸形成抵抗核酸外切酶的硫代磷酸酯键。
3)双链DNA终止寡核苷酸杂交(图6F)。
4)进行等温DNA聚合酶(克列诺核酸外切酶-)反应以从夹板引物(步骤2)至终止寡核苷酸(步骤3)填充双链(图6G),以及进行T4-DNA连接酶反应(图6H)以形成具有适当5’粘性末端的完整供体片段(图6I),用于供体DNA粘性末端连接至由cpf1消化的基因组DNA的粘性末端(图6J)。
5)在供体DNA的粘性末端连接(图6K)以及供体和基因组DNA之间由于其接近和序列同源性而进行同源重组(图6)后,完全整合。
鉴于每个sgRNA/供体是独特的并且赋予靶向基因以消化特异性和特定供体DNA突变两者的事实,可以将这些杂交核苷酸与单个蛋白质制剂组合并同时得到多个靶向突变。
上述多种方法和技术提供了实施本发明的许多方式。当然,应了解不一定描述的所有目标或优点都可以根据本文描述的任何特定实施方案实现。因此,举例来说,本领域的技术人员将认识到所述方法可以通过实现或最佳化如本文中教示的一个优点或优点群组,无需实现如本文中可能教示或提出的其它目标或优点的方式进行。本文中提到多种有利和不利的替代方案。应了解一些优选实施方案特别包括一个、另一个或若干有利的特征,而其它实施方案特别排除一个、另一个或若干不利的特征,而还有其它实施方案通过包括一个、另一个或若干有利的特征来减轻目前不利的特征。
此外,熟练的技术人员将认识到来自不同的实施方案的多种特征的适用性。类似地,上文论述的多种元件、特征和步骤以及每个此类元件、特征或步骤的其它已知同等物可以由本领域技术人员混合和匹配,以进行根据本文描述的原理的方法。在多种元件、特征和步骤中,将特别包括一些,并且在不同实施方案中特别排除其它。
虽然已经在某些实施方案和实施例的上下文中公开了本发明,但本领域的技术人员应了解,本发明的实施方案延伸超过特别公开的实施方案,至其它替代实施方案和/或用途以及其修改和同等物。
已经在本发明的实施方案中公开了许多变化和替代元件。本领域的技术人员将显而易见更进一步的变化和替代元件。这些变化包括(不限于)遗传编辑的组合物和方法、与遗传编辑有关的体内方法、通过上述技术产生的细胞的组合物、与本发明的教示相关的疾病和/或病状的治疗、其中使用的技术和组合物和解决方案的使用以及通过本发明的教示创造的产物的特定用途。本发明的多种实施方案可以特别包括或排除这些变化或元件中的任一个。
在一些实施方案中,用于描述和要求本发明的某些实施方案的表述成分的量、性质(例如浓度、反应条件)等的数字应理解为在一些情况下由术语“约”修饰。因此,在一些实施方案中,书面描述和随附权利要求书中阐述的数字参数是近似值,可以取决于设法通过特定实施方案获得的所需性质而变化。在一些实施方案中,数字参数将按照所报告的有效数字的数目并通过应用常规舍入技术来解释。尽管阐述本发明的一些实施方案的宽范围的数值范围和参数是近似值,但特定实施例中阐述的数值尽可能精确地报告。在本发明的一些实施方案中呈现的数值可能含有一定误差,这些误差是由在各自的试验测量中发现的标准偏差所必然引起的。
在一些实施方案中,在描述本发明的特定实施方案的上下文中(特别是在某些以下权利要求书的上下文中)使用的术语“一(a/an)”和“所述”以及类似提及可以解释为包涵单数与复数。本文中叙述值的范围仅仅打算用作个别提及所述范围内的每个单独值的一种速记方法。除非本文中另外指示,否则每个个别值如同其在本文中个别地叙述一般并入说明书中。除非本文中另外指示或与上下文另外明显矛盾,否则本文描述的所有方法都可以按任何合适的顺序进行。关于本文中的某些实施方案提供的任何和所有实例或示例性语言(例如“例如”)的使用仅仅是为了更好地说明本发明,而不是对另外要求的本发明的范围施加限制。说明书中的措辞不应被看作是指示实施本发明所必要的任何未要求的要素。
本文公开的本发明的替代元件或实施方案的分组不应看作是限制。每个群组成员都可以个别或以与所述群组的其它成员或本文中发现的其它要素的任何组合提及和要求。出于方便和/或可专利性的原因,群组的一个或多个成员可以包括在群组中或从群组中删除。当出现任何此类包括或删除时,本文中认为说明书含有经过修改的所述群组,因此满足用于随附权利要求书中的所有马库什群组(Markush group)的书面描述。
本文描述了本发明的优选实施方案,包括本发明人已知的用于实施本发明的最佳方式。本领域的一般技术人员在阅读以上描述后,将显而易见那些优选实施方案的变化。预期熟练的技术人员可以视情况采用此类变化,并且本发明可以通过除本文特别描述外的方式实施。因此,本发明的许多实施方案包括随附权利要求书中叙述的主题的适用法律所允许的所有修改和同等物。此外,除非本文中另外指示或上下文明显矛盾,否则本发明涵盖上述要素呈所有可能变化的任何组合。
此外,在本说明书通篇,已经大量提及专利和印刷出版物。每个以上引用的参考文献和印刷出版物都个别地以引用的方式整体并入本文中。
最后,应了解本文公开的本发明的实施方案说明本发明的原理。可以采用的其它修改可以在本发明的范围内。因此,举例来说(但不限制),可以根据本文中的教示利用本发明的替代构型。因此,本发明的实施方案不限于如精确展示和描述的实施方案。
 序列表
<110> UNIVERSITY OF SOUTHERN CALIFORNIA
JUNGE, Jason
HUNT, Timothy
FRASER, Scott
<120> 利用重组核酸内切酶***的最佳化基因编辑
<130> 065715-000063WO00
<141> 2016-05-13
<150> 62/161,487
<151> 2015-05-14
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4518
<212> DNA
<213> 人工序列
<220>
<223> Cas9
<400> 1
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactctagc gctggagcgg gtgcaggggc tcccgggttc 4140
cagtgccgga tctgcatgcg gaacttcagc gaccggtcca acctgagcag gcacatcaga 4200
acccacaccg gagaaaagcc cttcgcctgc gacatttgcg gccggaagtt cgccatcagc 4260
agcaacctga acagccacac caagatccac actggcagcc agaaaccttt ccagtgcaga 4320
atttgtatga gaaactttag cagaagcgac aacctggcca gacacatccg gacacatact 4380
ggtgaaaaac cttttgcctg tgatatctgt ggcagaaagt ttgccacctc cggcaatctg 4440
acccggcaca caaagattca cctgcggggc agccagctgt ggcgcctacc caagaagaag 4500
aggaaagtct ctagatag 4518
<210> 2
<211> 1505
<212> PRT
<213> 人工序列
<220>
<223> Cas9
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Ser Ala Gly Ala Gly Ala Gly
1365 1370 1375
Ala Pro Gly Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg
1380 1385 1390
Ser Asn Leu Ser Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
1395 1400 1405
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Ile Ser Ser Asn Leu Asn
1410 1415 1420
Ser His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
1425 1430 1435 1440
Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu Ala Arg His Ile
1445 1450 1455
Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg
1460 1465 1470
Lys Phe Ala Thr Ser Gly Asn Leu Thr Arg His Thr Lys Ile His Leu
1475 1480 1485
Arg Gly Ser Gln Leu Trp Arg Leu Pro Lys Lys Lys Arg Lys Val Ser
1490 1495 1500
Arg
1505
<210> 3
<211> 883
<212> DNA
<213> 人工序列
<220>
<223> Super Folder GFP
<400> 3
ctaaggactc ggcgcgccgg aagtggccag ggcgggggcg acctcggctc acagcgcgcc 60
cggctattct cgcagctcag gtcatcctca tcatgagtaa aggcgaagag ctgttcactg 120
gtgtcgtccc tattctggtg gaactggatg gtgatgtcaa cggtcataag ttttccgtgc 180
gtggcgaggg tgaaggtgac gcaactaatg ggaaactgac gctgaagttc atctgtacta 240
ctgggaaact gccggtgcct tggccgactt tagtaacgac gctgacttat ggtgttcagt 300
gctttgctcg ttatccggac catatgaagc agcatgactt cttcaagtcc gccatgccgg 360
aaggctatgt gcaggaacgc acgatttcct tcaaagatga cggcacgtac aaaacgcgtg 420
cggaagtgaa atttgaaggc gatactttag taaaccgcat tgagttgaaa ggcattgact 480
ttaaagaaga cggcaatatc ctgggccata agctggaata caattttaac agccacaatg 540
tttacatcac cgccgataaa caaaaaaatg gcattaaagc gaattttaaa attcgccaca 600
acgtggagga tggcagcgtg cagctggctg atcactacca gcaaaacact ccaatcggtg 660
atggtcctgt tctgctgccg gacaatcact atctgagcac gcaaagcgtt ttgtctaagg 720
acccgaacga gaaacgcgat catatggttc tgctggagtt cgtaaccgca gcgggcatca 780
cgcatggaat ggatgaatta tatgggtcca aaaccatgga tgatgatatc gccgcgctcg 840
tcgtcgacaa cggctccggc atgtgcaagg ccggcttcgc ggg 883
<210> 4
<211> 1251
<212> DNA
<213> 人工序列
<220>
<223> Sox-2-mOrange
<400> 4
ccggggcgga ggtgcaggac cagagcgcgc agagcagact gcacatgtcc caacattacc 60
agagcgcacc tgtgcccggt accatcaatg gtaccatccc gctgagccac atgggtggag 120
gttctggtgg aggatccgga ggtggatcag gaggaggttc ggtgagcaag ggcgaggaga 180
ataatatggc catcattaag gagttcatgc gcttcaaggt gcacatggag ggcactgtga 240
acggccacga gttcgagatc gagggcgagg gcgagggcca cccctacgag ggctttcaga 300
ccgctaagct gaaggtgacc aagggcggcc ccctgccctt cgcctgggac atcctgtccc 360
ctctcatcac ctacggctcc aaggcctacg tgaagcaccc cgccgacatc cccgactact 420
tcaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaactac gaggacggcg 480
gcgtggtgac cgtgacccag gactcctctc tgcaggacgg cgagttcatc tacaaggtga 540
agatgcgcgg caccaacttc ccctccgacg gccccgtgat gcagaagaag accatgggct 600
gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc gagatcagga 660
tgaggctgaa gctgaaggat ggcggccact acacctccga ggtcaagact acctacaagg 720
ccaagaagtc cgtgctgctg cccggcgcct acatcgtcgg catcaagctg gacatcacct 780
cccacaacga ggactacacc atcgtggaac agtacgaacg ctccgaggcc cgccactcca 840
ccggcggcat ggacgagctg tacaagtaaa gcggccgcga ctctagatca taatcagcca 900
taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct 960
gaaacataaa atgaatgcaa ttggtcatcc tcatcgcccg gatagctcag tcggtagagc 1020
agcggccgga tgtaactgaa tgaaatggtg aaggacgggt ccagtaggct gcttcggcag 1080
cctacttgtt gagtagagtg tgagctccgt aactagttac atccggccgc gggtccaggg 1140
ttcaagtccc tgttcgggcg ccagaattct aaaatgaact ctttttacta cactgctgga 1200
ctatttttgt acagaacact tcttttgggg agggaaaaag ttgtatagag c 1251
<210> 5
<211> 931
<212> DNA
<213> 人工序列
<220>
<223> Oct-4-GFP
<400> 5
ccacactcta ctcagtccct tttcctgagg gcgaggcctt tccctctgtt cccgtcactg 60
ctctgggctc tcccatgcat tcaaactcta gcgctggagc gggtgcaggg gctaaaggcg 120
aagagctgtt cactggtgtc gtccctattc tggtggaact ggatggtgat gtcaacggtc 180
ataagttttc cgtgcgtggc gagggtgaag gtgacgcaac taatgggaaa ctgacgctga 240
agttcatctg tactactggg aaactgccgg tgccttggcc gactttagta acgacgctga 300
cttatggtgt tcagtgcttt gctcgttatc cggaccatat gaagcagcat gacttcttca 360
agtccgccat gccggaaggc tatgtgcagg aacgcacgat ttccttcaaa gatgacggca 420
cgtacaaaac gcgtgcggaa gtgaaatttg aaggcgatac tttagtaaac cgcattgagt 480
tgaaaggcat tgactttaaa gaagacggca atatcctggg ccataagctg gaatacaatt 540
ttaacagcca caatgtttac atcaccgccg ataaacaaaa aaatggcatt aaagcgaatt 600
ttaaaattcg ccacaacgtg gaggatggca gcgtgcagct ggctgatcac taccagcaaa 660
acactccaat cggtgatggt cctgttctgc tgccggacaa tcactatctg agcacgcaaa 720
gcgttttgtc taaggacccg aacgagaaac gcgatcatat ggttctgctg gagttcgtaa 780
ccgcagcggg catcacgcat ggaatggatg aattatataa ataagtcatc ctcatcctga 840
ggcaccagcc ctccctgggg atgctgtgag ccaaggcaag ggaggtagac aagagaacct 900
ggagctttgg ggttaaattc ttttactgag g 931
<210> 6
<211> 100
<212> RNA
<213> 智人(Homo sapiens)
<400> 6
gcuauucucg cagcucacca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 7
<211> 100
<212> RNA
<213> 斑马鱼(D. rerio)
<400> 7
gugcccggua cgacgauuaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 8
<211> 100
<212> RNA
<213> 小家鼠(Mus musculus)
<400> 8
ccuuggcuca cagcaucccc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100

Claims (23)

1.一种组合物,所述组合物包含如下载体,所述载体编码包含至少一种核酸内切酶和DNA结合部分的融合蛋白。
2.如权利要求1所述的组合物,其中所述融合蛋白包含至少一种选自由以下组成的群组的核酸内切酶:cas规则间隔的短回文(CRISPR)蛋白、锌指核酸酶(ZFN)和类转录激活因子效应物核酸酶(TALEN)。
3.如权利要求2所述的组合物,其中所述CRISPR蛋白包含cas9。
4.如权利要求1所述的组合物,其中所述DNA结合部分包含锌指蛋白。
5.如权利要求4所述的组合物,其中所述锌指包含左旋CCR5结合蛋白。
6.如权利要求1所述的组合物,其中所述至少一种核酸内切酶和DNA结合部分由包含两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个氨基酸的连接子接合。
7.如权利要求1所述的组合物,其中所述融合蛋白包含荧光标记蛋白。
8.如权利要求7所述的组合物,其中所述荧光标记蛋白包含一种或多种选自由以下组成的群组的蛋白质:绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、红色荧光蛋白(RFP)和mCherry。
9.如权利要求1所述的组合物,其中所述融合蛋白包含核定位信号(NLS)。
10.如权利要求9所述的组合物,其中所述NLS是SV40NLS。
11.一种基因组编辑方法,所述方法包括:
(a)提供一定量的一种或多种载体,所述载体编码包含至少一种核酸内切酶和DNA结合部分的融合蛋白;以及
(b)使细胞群体与所述量的所述一种或多种载体接触,其中所述融合蛋白能够诱发双链断裂(DSB)并且所述DSB的同源重组(HR)引起所述细胞群体的基因组的编辑。
12.如权利要求11所述的方法,所述方法进一步包括在步骤(b)中使所述细胞群体与一种或多种指导RNA(gRNA)接触。
13.如权利要求11所述的方法,所述方法进一步包括在步骤(b)中使所述细胞群体与模板DNA接触。
14.如权利要求13所述的方法,其中所述模板DNA包含至少一个表达盒、两个侧翼序列和DNA结合部分序列。
15.如权利要求14所述的方法,其中所述两个侧翼序列每个至少10bp,并与所述细胞群体的基因组中的序列同源。
16.如权利要求15所述的方法,其中所述DNA结合部分序列包含CCR5。
17.如权利要求11所述的方法,其中接触所述细胞群体包含选自由以下组成的群组的技术:转染、电穿孔和转化。
18.如权利要求11所述的方法,其中所述细胞群体包含干细胞或祖细胞。
19.一种用于基因组编辑的试剂盒,所述试剂盒包含:
一种或多种载体,所述载体编码包含至少一种核酸内切酶和DNA结合部分的融合蛋白;以及
模板DNA,所述模板DNA包含至少一个表达盒、两个侧翼序列和DNA结合部分序列。
20.如权利要求19所述的试剂盒,所述试剂盒进一步包含一种或多种指导RNA(gRNA)。
21.如权利要求19所述的试剂盒,其中所述融合蛋白包含至少一种核酸内切酶CRISPR蛋白、DNA结合部分锌指蛋白。
22.如权利要求21所述的试剂盒,所述试剂盒进一步包含荧光标记蛋白。
23.如权利要求21所述的试剂盒,所述试剂盒进一步包含核定位信号(NLS)。
CN201680027857.XA 2015-05-14 2016-05-13 利用重组核酸内切酶***的最佳化基因编辑 Pending CN107614680A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562161487P 2015-05-14 2015-05-14
US62/161,487 2015-05-14
PCT/US2016/032367 WO2016183448A1 (en) 2015-05-14 2016-05-13 Optimized gene editing utilizing a recombinant endonuclease system

Publications (1)

Publication Number Publication Date
CN107614680A true CN107614680A (zh) 2018-01-19

Family

ID=57249535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680027857.XA Pending CN107614680A (zh) 2015-05-14 2016-05-13 利用重组核酸内切酶***的最佳化基因编辑

Country Status (4)

Country Link
US (2) US11535871B2 (zh)
EP (1) EP3294879A4 (zh)
CN (1) CN107614680A (zh)
WO (1) WO2016183448A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111065747A (zh) * 2018-02-06 2020-04-24 株式会社金希科 突变细胞游离基因分离试剂盒及利用其的突变细胞游离基因分离方法
CN111154003A (zh) * 2020-01-14 2020-05-15 温氏食品集团股份有限公司 提高基因敲入效率的Cas9融合蛋白和外源基因敲入整合***
CN111885915A (zh) * 2018-03-19 2020-11-03 瑞泽恩制药公司 使用crispr/cas***对动物进行转录调制
CN112154211A (zh) * 2018-03-25 2020-12-29 基因系链公司 用于束缚供体dna的修饰的核酸编辑***
US11535871B2 (en) 2015-05-14 2022-12-27 University Of Southern California Optimized gene editing utilizing a recombinant endonuclease system
CN115716880A (zh) * 2022-12-07 2023-02-28 云舟生物科技(广州)股份有限公司 一种核定位荧光蛋白及其应用

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
BR112015011995B1 (pt) 2012-11-27 2023-02-07 Children's Medical Center Corporation Método para a produção de uma célula progenitora hematopoiética tendo bcl11a diminuído ou para aumentar seus níveis de hemoglobina fetal, composição e uso das mesmas
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
SG10201809290SA (en) 2014-04-25 2019-01-30 Childrens Medical Ct Corp Compositions and Methods to Treating Hemoglobinopathies
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
ES2835861T3 (es) 2015-05-08 2021-06-23 Childrens Medical Ct Corp Direccionamiento de regiones funcionales del potenciador de BCL11A para la reinducción de hemoglobina fetal
CA2999500A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP4047092A1 (en) 2016-04-13 2022-08-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US11608499B2 (en) * 2016-04-29 2023-03-21 Basf Plant Science Company Gmbh Methods for modification of target nucleic acids
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
WO2018031683A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
WO2018218135A1 (en) 2017-05-25 2018-11-29 The Children's Medical Center Corporation Bcl11a guide delivery
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
WO2019051097A1 (en) * 2017-09-08 2019-03-14 The Regents Of The University Of California RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME
WO2019055878A2 (en) * 2017-09-15 2019-03-21 The Board Of Trustees Of The Leland Stanford Junior University MULTIPLEX PRODUCTION AND BAR CODIFICATION OF GENETICALLY MODIFIED CELLS
JP2021500036A (ja) 2017-10-16 2021-01-07 ザ ブロード インスティテュート, インコーポレーテッドThe Broad Institute, Inc. アデノシン塩基編集因子の使用
US20210115420A1 (en) * 2018-05-01 2021-04-22 The Children's Medical Center Corporation Enhanced bcl11a rnp / crispr delivery & editing using a 3xnls-cas9
CN108841845A (zh) * 2018-06-21 2018-11-20 广东石油化工学院 一种带有筛选标记的CRISPR/Cas9载体及其构建方法
KR20210111276A (ko) * 2019-01-04 2021-09-10 스텔레이트 바이오세러퓨틱스 인코포레이티드 원형 단일 가닥 dna를 이용한 목표 게놈 변형
BR112021018607A2 (pt) 2019-03-19 2021-11-23 Massachusetts Inst Technology Métodos e composições para editar sequências de nucleotídeos
CN115667505A (zh) 2020-03-19 2023-01-31 因特利亚治疗公司 用于定向基因组编辑的方法和组合物
CN116096873A (zh) 2020-05-08 2023-05-09 布罗德研究所股份有限公司 同时编辑靶标双链核苷酸序列的两条链的方法和组合物
TW202342069A (zh) * 2022-03-09 2023-11-01 香港商正基基因科技有限公司 經修飾之基於crispr之基因編輯系統及使用方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2392208A1 (en) * 2010-06-07 2011-12-07 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
US20140287426A1 (en) * 2011-03-14 2014-09-25 University Of Southern California Antibody and antibody mimetic for visualization and ablation of endogenous proteins
US20140356958A1 (en) * 2012-12-17 2014-12-04 President And Fellows Of Harvard College RNA-Guided Human Genome Engineering
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
US20150067922A1 (en) * 2013-05-30 2015-03-05 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5530101A (en) 1988-12-28 1996-06-25 Protein Design Labs, Inc. Humanized immunoglobulins
US6534261B1 (en) * 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
EP1913149A4 (en) * 2005-07-26 2009-08-05 Sangamo Biosciences Inc TARGETED INTEGRATION AND EXPRESSION OF EXOGENOUS NUCLEIC ACID SEQUENCES
ES2378333T3 (es) * 2006-05-25 2012-04-11 Sangamo Biosciences, Inc. Métodos y composiciones para la inactivación de genes
WO2009154686A1 (en) 2008-05-28 2009-12-23 Sangamo Biosciences, Inc. Compositions for linking dna-binding domains and cleavage domains
BR112014027813A2 (pt) * 2012-05-07 2017-08-08 Dow Agrosciences Llc métodos e composições para integração de transgenes direcionada mediada por nuclease
MX362866B (es) * 2012-05-25 2019-02-20 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn.
AU2014312295C1 (en) * 2013-08-28 2020-08-13 Sangamo Therapeutics, Inc. Compositions for linking DNA-binding domains and cleavage domains
EP3845655A1 (en) * 2014-10-01 2021-07-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
AU2015330699B2 (en) * 2014-10-10 2021-12-02 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
US10190106B2 (en) * 2014-12-22 2019-01-29 Univesity Of Massachusetts Cas9-DNA targeting unit chimeras
CN107614680A (zh) 2015-05-14 2018-01-19 南加利福尼亚大学 利用重组核酸内切酶***的最佳化基因编辑
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2392208A1 (en) * 2010-06-07 2011-12-07 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
US20140287426A1 (en) * 2011-03-14 2014-09-25 University Of Southern California Antibody and antibody mimetic for visualization and ablation of endogenous proteins
US20140356958A1 (en) * 2012-12-17 2014-12-04 President And Fellows Of Harvard College RNA-Guided Human Genome Engineering
US20150067922A1 (en) * 2013-05-30 2015-03-05 The Penn State Research Foundation Gene targeting and genetic modification of plants via rna-guided genome editing
US20150044772A1 (en) * 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11535871B2 (en) 2015-05-14 2022-12-27 University Of Southern California Optimized gene editing utilizing a recombinant endonuclease system
CN111065747A (zh) * 2018-02-06 2020-04-24 株式会社金希科 突变细胞游离基因分离试剂盒及利用其的突变细胞游离基因分离方法
US11613776B2 (en) 2018-02-06 2023-03-28 Genecker Co., Ltd. Mutant cell-free DNA isolation kit and mutant cell-free DNA isolation method using the same
CN111065747B (zh) * 2018-02-06 2023-10-31 株式会社金希科 突变细胞游离基因分离试剂盒及利用其的突变细胞游离基因分离方法
CN111885915A (zh) * 2018-03-19 2020-11-03 瑞泽恩制药公司 使用crispr/cas***对动物进行转录调制
CN112154211A (zh) * 2018-03-25 2020-12-29 基因系链公司 用于束缚供体dna的修饰的核酸编辑***
CN111154003A (zh) * 2020-01-14 2020-05-15 温氏食品集团股份有限公司 提高基因敲入效率的Cas9融合蛋白和外源基因敲入整合***
CN115716880A (zh) * 2022-12-07 2023-02-28 云舟生物科技(广州)股份有限公司 一种核定位荧光蛋白及其应用

Also Published As

Publication number Publication date
US20180127785A1 (en) 2018-05-10
US20230203541A1 (en) 2023-06-29
WO2016183448A1 (en) 2016-11-17
EP3294879A1 (en) 2018-03-21
EP3294879A4 (en) 2019-02-20
US11535871B2 (en) 2022-12-27

Similar Documents

Publication Publication Date Title
CN107614680A (zh) 利用重组核酸内切酶***的最佳化基因编辑
CN115651927B (zh) 编辑rna的方法和组合物
CN113831407B (zh) 用于使用多个引导rna来破坏免疫耐受性的方法
AU2016326711B2 (en) Use of exonucleases to improve CRISPR/Cas-mediated genome editing
Blitz et al. Biallelic genome modification in F0 Xenopus tropicalis embryos using the CRISPR/Cas system
US20230125704A1 (en) Modified bacterial retroelement with enhanced dna production
CN113939591A (zh) 编辑rna的方法和组合物
AU2018339164B2 (en) Artificial genome manipulation for gene expression regulation
CN107109434A (zh) 新颖cho整合位点和其用途
CN106715694A (zh) 核酸酶介导的dna组装
JP2022546592A (ja) ゲノム組込みのための方法および組成物
CN110248957A (zh) 经人工操纵的sc功能控制***
WO2023241669A1 (zh) CRISPR-Cas效应子蛋白、其基因编辑***及应用
JP2023542976A (ja) カーゴヌクレオチド配列を転位させるための系および方法
CN111051509A (zh) 用于电介质校准的含有c2cl核酸内切酶的组合物以及使用其进行电介质校准的方法
US20230141052A1 (en) Methods and compositions for genomic integration
CA3233336A1 (en) Circular rna and preparation method thereof
WO2005003389A2 (en) In vitro amplification of dna
KR102679001B1 (ko) 신규의 개량된 염기 편집 또는 교정용 융합단백질 및 이의 용도
US20230175019A1 (en) Scalable trio guide rna approach for integration of large donor dna
US20220145323A1 (en) Improved transposon insertion sites and uses thereof
WO2020207560A1 (en) Improved transposon insertion sites and uses thereof
Moghadam Developing safe and controllable Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)-based therapies with design principles of synthetic biology
Haluska Developing a System to Arrest Transformation using a Zebrafish Model for Melanomagenesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180119

WD01 Invention patent application deemed withdrawn after publication