CN107002078A - Crispr寡核苷酸和基因剪辑 - Google Patents

Crispr寡核苷酸和基因剪辑 Download PDF

Info

Publication number
CN107002078A
CN107002078A CN201580066476.8A CN201580066476A CN107002078A CN 107002078 A CN107002078 A CN 107002078A CN 201580066476 A CN201580066476 A CN 201580066476A CN 107002078 A CN107002078 A CN 107002078A
Authority
CN
China
Prior art keywords
cell
nucleic acid
crispr
rna
cas9
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580066476.8A
Other languages
English (en)
Inventor
N·拉文德尔
K·海尔
郭奕柱
梁锡权
R·波特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thermo Fisher Scientific Geneart GmbH
Life Technologies Inc
Life Technologies Corp
Original Assignee
Thermo Fisher Scientific Geneart GmbH
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thermo Fisher Scientific Geneart GmbH, Life Technologies Inc filed Critical Thermo Fisher Scientific Geneart GmbH
Priority to CN202111303287.1A priority Critical patent/CN113930455A/zh
Publication of CN107002078A publication Critical patent/CN107002078A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明大体上涉及对细胞进行基因修饰的组合物和方法。具体地说,本发明涉及CRISPR试剂和此类试剂的用途。

Description

CRISPR寡核苷酸和基因剪辑
优先权
本申请要求美国临时申请第62/061,961号(2014年10月9日提交)、第62/101,787号(2015年1月9日提交)和第62/218,826号(2015年9月15日提交)的权益,所述美国临时申请的揭露内容全部并入本文中供参考。
序列表
本申请含有序列表,所述序列表已经以ASCII格式以电子方式提交且全部结合在此供参考。2015年10月7日创建的所述ASCII拷贝命名为LT00948PCT_SL.txt且大小是99,575个字节。
技术领域
本发明大体上涉及对细胞进行基因修饰的组合物和方法。具体地说,本发明涉及CRISPR试剂和此类试剂的用途。
背景技术
已经研发出多种基因组剪辑***,如设计者锌指、转录活化因子样效应子(TALE)、CRISPR和归巢大核酸酶。这些***存在的一个问题是其需要鉴别用于修饰的靶点和设计特异性针对那些位点的试剂,这往往费力且耗时。在一个方面中,本发明可以有效地设计、制备和使用基因组剪辑试剂。
发明内容
本发明部分地涉及用于剪辑核酸分子的组合物和方法。对于修饰基因组的高效***和技术存在着相当大的需求。本发明解决了这种需求且提供了相关优势。
CRISPR***不需要产生靶向特定序列的定制蛋白质,而是需要可以通过序列与目标互补的短RNA分子导向目标核苷酸序列(目标基因座)的单一Cas酶。
本发明部分地涉及增强这些***有用性的CRISPR剪辑***修饰。与基因剪辑***有关的一个问题是为了设计和制备目标基因座特异性基因剪辑试剂所需的时间量和劳动量。本发明部分地提供高效、有成本效益地制备CRISPR组分的组合物和方法。
在一些特定方面,本发明涉及三种类型的序列特异性核酸结合活性。使用Cas9蛋白质作为实例,这些三种***包括其中利用Cas9蛋白质的***,所述***具有(1)双股切割活性(例如单一Cas9蛋白质基因剪辑***);(2)切口酶活性(例如双Cas9蛋白质基因剪辑***,称为“双切口酶”***;和(3)无切割活性,但是保留核酸结合活性(例如“死亡”Cas9,称为dCas9,其适用于例如基因抑制、基因活化、DNA甲基化等)。
在一些方面中,本发明提供了制备核酸分子的方法,包括包含执行反应混合物中的聚合酶链反应(PCR)的方法,所述反应混合物含有(i)双股核酸区段和(ii)至少一种能够在双股核酸区段的一个末端与核酸杂交的寡核苷酸,其中核酸分子是通过PCR反应产生,且其中产物核酸分子在或靠近一个末端含有适于活体外转录的启动子。在一些情况下,通过PCR反应产生的核酸分子编码长度为约20到约300(例如约20到约250、约20到约200、约35到约150、约70到约150、约40到约200、约50到约200、约60到约200、约60到约125等)个核苷酸的RNA分子。
通过本发明方法(例如连接)产生或由本发明方法所产生的核酸分子编码的RNA分子可以含有与目标基因座互补的序列区域(例如约10到约50、约20到约50、约30到约50、约15到约40、约15到约30等个核苷酸)。此类RNA分子还可以在生理条件(例如37℃、10mMTris-HCl pH 7.0、0.9%氯化钠)下形成一或多(例如二、三、四、五等)个发夹弯。另外,此类RNA分子可以是CRISPR RNA,如向导RNA分子。
在其它方面中,本发明包括制备核酸分子的方法,这些方法包含执行反应混合物中的聚合酶链反应(PCR),所述反应混合物包含:(i)包含第一末端和第二末端的双股核酸区段;(ii)包含第一末端和第二末端的第一寡核苷酸,其中第一寡核苷酸的第二末端能够与双股核酸区段的第一末端杂交;和(iii)包含第一末端和第二末端的第二寡核苷酸,其中第二寡核苷酸的第二末端能够与第一寡核苷酸的第一末端杂交,从而产生核酸分子。在一些情况下,产物核酸分子在或靠近一个末端含有一或多(例如一、二、三等)个适于活体外转录的启动子。另外,在一些情况下,产物核酸分子将编码一或多种CRISPR RNA(例如crRNA分子、tracrRNA分子、向导RNA分子等)。在一些情况下,反应混合物进一步包含第一引物和第二引物,其中第一引物能够在或靠近第二寡核苷酸的第一末端进行杂交且第二引物能够在或靠近双股核酸区段的第二末端进行杂交。
本发明还包括制备核酸分子的方法,所述方法包含执行反应混合物中的聚合酶链反应,所述反应混合物含有:(i)包含第一末端和第二末端的第一双股核酸区段;(ii)包含第一末端和第二末端的第二双股核酸区段;和(iii)至少一种包含第一末端和第二末端的寡核苷酸,其中寡核苷酸的第一末端能够在第一双股核酸区段的第一末端与核酸杂交以产生核酸分子,且其中寡核苷酸的第二末端能够在第二双股核酸区段的第二末端与核酸杂交以产生核酸分子。在一些情况下,产物核酸分子在或靠近一个末端含有一或多个适于活体外转录的启动子。
本发明进一步包括制备核酸分子的方法,这些方法包含执行反应混合物中的聚合酶链反应,所述反应混合物含有:(i)包含第一末端和第二末端的第一双股核酸区段;(ii)包含第一末端和第二末端的第二双股核酸区段;(iii)包含第一末端和第二末端的第一寡核苷酸;和(iv)包含第一末端和第二末端的第二寡核苷酸,其中第一寡核苷酸的第二末端能够在第二双股核酸区段的第一末端与核酸杂交,其中第二寡核苷酸的第二末端能够与第一寡核苷酸的第一末端杂交,其中第二寡核苷酸的第二末端能够与第二双股核酸区段的第一末端杂交。在一些情况下,产物核酸分子在或靠近(例如在10个碱基对内)一个末端含有一或多个适于活体外转录的启动子。
本发明还包括制备CRISPR RNA分子的方法,这些方法包含使两个或超过两个线性RNA区段在允许第一RNA区段的5'末端与第二RNA区段的3'末端共价连接以形成CRISPR RNA的条件下彼此接触。在一些情况下,从反应混合物组分中分离出CRISPR RNA分子(例如通过柱色谱法,如通过高效液相色谱法)。
本发明另外包括制备向导RNA分子的方法,这些方法包含:(a)分别制备crRNA分子和tracrRNA分子以及(b)使crRNA分子和tracrRNA分子在允许crRNA的3'末端与tracrRNA的5'末端共价连接以产生向导RNA分子的条件下彼此接触。向导RNA分子可以具有与目标基因座互补的序列区域,所述序列区域具有至少10(例如约10到约50、约10到约40、约10到约35、约10到约30、约10到约25、约15到约25、约17到约22等)个核苷酸。在许多情况下,目标基因座是真核细胞中天然存在的染色体基因座。
本发明还包括包含两个经***基团连接的RNA分子的组合物,其中一个RNA分子具有与目标基因座互补的至少10个核苷酸的序列区域。
在一些方面中,本发明涉及对细胞内的目标基因座进行基因剪辑的方法,这些方法包含将至少一种CRISPR蛋白质和至少一种CRISPR RNA引入细胞内,其中至少一种CRISPRRNA具有与目标基因座互补的至少10个碱基对的序列区域。在一些情况下,还将在两个末端均与目标基因座具有序列同源性的线性DNA区段引入细胞中。在一些情况下,至少一种CRISPR蛋白质之一是Cas9蛋白质。这种Cas9蛋白质可以具有在DNA中产生双股切口或在双股DNA中产生缺口的能力。在一些情况下,将两种Cas9蛋白质引入细胞中,其中一种Cas9蛋白质具有使得HNH域无活性的突变且另一种Cas9蛋白质具有使得RuvC域致使HNH域无活性的突变。在一些情况下,将序列各自与不同目标序列互补的两种RNA分子(例如CRISPR RNA分子)引入细胞中。另外,这些不同目标序列可以位于彼此间的四十(例如约2到约40、约2到约25、约2到约20、约2到约15、约2到约10、约2到约8、约4到约20、约4到约15、约4到约10、约6到约20等)个碱基对内。序列之间的距离可以参照双股切口或缺口位点来测量。在此类情况下,目标序列可以重叠。
本发明进一步包括含有一或多种CRISPR***组分的细胞和通过本文中所述方法制备的细胞。举例来说,本发明包括CRISPR复合物已经引入其中的细胞(例如含有(1)编码Cas9的质体和向导RNA、(2)Cas9 mRNA和向导RNA的细胞等)。本发明进一步包括含有编码dCas9和其融合蛋白的mRNA的细胞,以及已经被本发明方法修饰而含有或不再含有一或多种CRISPR***组分的细胞(例如具有和不具有***序列的细胞DNA已经在裂解位点经历裂解和丢弃的细胞)。
附图说明
为了更加全面地了解本文中所揭露的原理和其优点,现结合附图来参考以下说明,其中:
图1是天然存在的CRISPR***的代表图。除“目标DNA”之外,还需要三种额外组分:Cas9蛋白质(阴影矩形)、crRNA(CRISPR RNA)和tracrRNA(反式活化型crRNA)。标识“RuvC”和“HNH”的箭头指出目标DNA中的切割位置。标识“PAM”的虚线框是指原间隔子相邻基序。
图2绘示了crRNA分子(SEQ ID NO:56)与tracrRNA分子(SEQ ID NO:57)之间的结合。杂交区域1(在此情况下,19个核苷酸)与靶点互补。杂交区域2是crRNA(41个核苷酸)与tracrRNA(85个核苷酸)之间互补的序列区域。tracrRNA 3'区域是延长超过杂交区域2的tracrRNA分子的3'区域。环可替换区域大致由闭合的框界定且可以用发夹环替换以将crRNA和tracrRNA分子连成单一实体,典型地称为向导RNA(参见图3)。
图3是向导RNA分子(104个核苷酸)的示意图,其绘示了结合到Cas9蛋白质和目标基因组基因座的向导RNA。发夹区域1是由经核苷酸GAAA连接的互补性crRNA和tracrRNA区域杂交而形成。发夹区域2是由tracrRNA的3'部分中的互补区域形成。图3揭露了分别按出现顺序的SEQ ID NO 58-60。
图4是示意图,其绘示了使用CRISPR***的基于缺口的核酸裂解策略。在图的顶部中,两条线代表双股核酸。两个缺口位点由位点1和位点2指示。这些位点位于实线框或虚线框内,所述框指示与CRISPR/Cas9复合物相互作用的核酸区域。图的下部绘示了点切作用,其在双股中产生位置接近的两个缺口。
图5是示意图,其绘示了在细胞内获得短暂CRISPR活性的一些方法。Cas9蛋白质和/或编码Cas9的核酸的引入绘示于左侧。向导RNA、crRNA加tracrRNA或单独crRNA的引入绘示于右侧。中部绘示了编码Cas9的线性DNA或Cas9加tracrRNA的引入。这种DNA经设计可在细胞中稳定维持。
图6绘示了使用DNA寡核苷酸模板合成向导RNA的工作流程。编码向导RNA的DNA模板是使用组装式PCR产生。这种组装反应中的组分包括1)目标特异性DNA寡核苷酸(编码crRNA区域)、2)对活体外转录所用的细菌启动子(在这种情况下,T7启动子)具有特异性的DNA寡核苷酸,和3)编码tracrRNA区域的重叠PCR产物。在Thermo循环仪中,使用DNA聚合酶(在这种情况下,为高保真度 Taq DNA聚合酶)进行填补反应,随后进行PCR扩增,PCR组装之后,在37℃下使用非编码RNA合成用的活体外转录试剂(在这种情况下,为MEGASHORTSCRIPTTM T7试剂盒)转录所得DNA模板以产生目标特异性gRNA。合成之后,使用基于柱或磁珠的方法将所得gRNA提纯。被提纯的活体外转录向导RNA即可与Cas9蛋白质共转染或作为mRNA递送于所关注的宿主***或细胞系中。图6向导RNA揭露为SEQ ID NO:58。
图7绘示了重叠DNA寡核苷酸作为gRNA合成用的模板。T7启动子序列和重叠区域各自具有约20个核苷酸的长度。另外,标识“20bp crRNA”的框是crRNA的目标识别组分。向导RNA是使用2种重叠DNA寡核苷酸合成。1)正向DNA寡核苷酸含有T7启动子区(或其它相关的活体外转录启动子),继之为目标特异性crRNA编码区域和与反向寡核苷酸重叠的区域。2)反向DNA寡核苷酸编码作为恒定组分的tracrRNA序列。使用高保真度DNA聚合酶(例如 Taq DNA聚合酶)将这两种重叠寡核苷酸粘接且延长以产生DNA模板供gRNA活体外转录(IVT)用。组装反应还包括2-3次PCR循环条件以富集全长模板。然后使用所组装的DNA模板,使用非编码RNA合成用的活体外转录试剂(在这种情况下,使用MEGASHORTSCRIPTTMT7试剂盒),在37℃下产生向导RNA。gRNA合成之后,使用柱或替代地使用基于珠粒的提纯方法将产物提纯。
图8绘示了用于制备编码向导RNA分子的DNA分子的基于PCR组装的方法。在这个示意图中,“寡核苷酸1”编码T7启动子和杂交区域1的一部分且“寡核苷酸2”编码杂交区域1的一部分且与“3'PCR区段”具有重叠的序列。然后使用PCR组装这些重叠片段,随后使用5'和3'引物扩增,从而产生双股DNA分子,所述双股DNA分子含有可操作地连接到目标特异性向导RNA编码序列的T7启动子。RNA可以由这种双股DNA分子通过活体外转录而产生。图8向导RNA揭露为SEQ ID NO:58。
图9绘示了通过PCR组装来合成向导RNA表达模板的PCR组装方法。这种方法在向导RNA的情形下可以用于引入其它启动子和终止子。在这个示意图中,“第一寡核苷酸”与“第二寡核苷酸”之间的重叠区域编码“杂交区域1”。由于这些启动子可以具有数百个碱基的长度,因此RNA聚合酶III启动子区域中的~代表了核酸分子的未呈现区段。这个图中未绘示RNA聚合酶III终止子序列。5'引物和3'引物序列延长超过与其杂交的核酸区段的末端,这表示引物可以用于向所扩增的核酸分子中添加额外的官能团。
图10绘示了一组可变crRNA分子和恒定的tracrRNA分子。可以选择特定的crRNA分子(在此情况下为crRNA3)且然后连接到tracrRNA分子。
图11绘示了一种用于连接两个RNA区段的示例性方法。这个图中所示的连接反应(一个末端使用炔丙基且另一末端使用叠氮基)是单向的,原因在于具有化学修饰的末端是可以彼此连接的唯一末端。
图12A-12F绘示了来自五种链球菌种的Cas9蛋白质的比对(按出现顺序分别是SEQID NO 61-63、1和64)。相同氨基酸是以黑色背景下的白色字符绘示。保守氨基酸变异是以灰色背景下的黑色字母绘示。
图13绘示了寡核苷酸设计用于单步合成gRNA模板工作流程中。序列经验证的PCR片段是指序列经验证的质体的PCR片段。
图14绘示了得自活体内基因组裂解和检测分析的数据。凝胶影像A:使用由质体扩增的gRNA相对于由6种重叠寡核苷酸组装的gRNA进行的初始裂解分析。发现裂解活性小于质体的50%。这归因于组装不当。凝胶影像B:新颖的组装方法如图13中所概述,其使用20bp重叠或15bp重叠。发现裂解活性等效于质体对照。
图15绘示了来源于合成gRNA模板的数据,所述gRNA模板在ZERO TOPO载体中克隆。随机挑选九十六个群落供定序分析用。计算错误克隆的百分比。
图16绘示的数据表明了T7启动子的3'末端缺失G对活体外转录的影响。
图17绘示了含有CD4编码区的“一体化”载体。载体的核苷酸序列列于表9中。
图18绘示了含有橙色荧光蛋白质(OFP)编码区的“一体化”载体。载体的核苷酸序列列于表10中。
图19.细胞工程改造工作流程。第1天,研究人员设计CRISPR目标和种子细胞。第2天,合成gRNA且用Cas9蛋白质/gRNA复合物(Cas9 RNP)转染细胞。第3-4天进行基因组裂解分析。图19揭示SEQ ID NO:65。
图20A-20D.gRNA的设计和合成。(图20A)寡核苷酸池的设计。所述池由以下组成:80个核苷酸tracerRNA PCR片段一个、两个末端引物,和两个具有15bp重叠的34bp寡核苷酸。(图20B)gRNA模板的单步合成。四种DNA寡核苷酸和一个PCR片段在单一试管中进行组装且通过琼脂糖凝胶电泳分析PCR产物(泳道2和3)。由一体化质体制备的gRNA模板充当对照(泳道1)。(图20C)活体外转录。对PCR产物(泳道2和3)以及对照物(泳道1)的等分试样进行活体外转录。所得产物通过变性凝胶来分析。(图20D:合成gRNA模板中的错误率)使用标准基因合成方法、使用一组短寡核苷酸(GS)合成gRNA的DNA模板。或者,使用上述寡核苷酸池进行PCR组装。利用组装式PCR反应来测试两种标准的经脱盐的末端引物(15bp)和经HPLC或PAGE提纯的末端引物(15bp*)。使合成gRNA模板以及来自‘一体化’质体(质体)的对照gRNA模板在TOPO载体中克隆。对于每种个别模板来说,随机挑选96个群落用于定序。
图21A-21D.脂质介导式转染。(图21A:DNA相对于mRNA相对于蛋白质)通过Cas9质体DNA、mRNA或蛋白质转染HEK293FT细胞来剪辑三种各别的基因组基因座(HPRT、AAVS或RelA)。对于HPRT目标来说,在血清的存在或不存在下进行转染。基因组修饰效率是通过基因组裂解分析来测定。(图21B:剪辑的时间过程)HEK293FT细胞经导向HPRT基因座的质体DNA、Cas9 mRNA/gRNA或Cas9 RNP转染。在不同时间点获取细胞样品且通过基因组裂解分析加以分析。(图21C)对在不同时间点获取的样品进行的西方印迹分析。(图21D)Cas9质体DNA、mRNA或蛋白质转染引起VEGFA T3目标发生的脱靶突变。靶向突变以及OT3-2和OT3-18脱靶突变的百分比是通过DNA定序来测定。
图22A-22B.电穿孔介导式转染。(图22A:电穿孔介导式转染)使用质体DNA、Cas9mRNA/gRNA或Cas9蛋白质/gRNA的预混液,使用脉冲电压、脉冲宽度和脉冲数目可变的Neon24优化方案将Jurkat T细胞电穿孔。使用基因组裂解分析对转染后48小时的基因座特异性基因组裂解百分比进行估算。字母“P”位于每个蛋白质泳道的顶部是为了便于数据评审。每个“P”右侧的两条柱分别是DNA和mRNA。(图22B:电穿孔介导式转染)基因组剪辑的剂量依赖性作用。在保持Cas9蛋白质/gRNA比率不变的同时,使用方案5、使用不同量的Cas9 RNP进行电穿孔。实验重复三次。通过定序来确认裂解百分比。
图23A-23D.人类基因组中的多基因剪辑。Jurkat T细胞用以下各物共转染:Cas9质体池、Cas9 mRNA/gRNA池,或靶向AAVS1和HPRT目标(图23A)或AAVS、RelA和HPRT基因目标(图23C)的Cas9 RNP复合物。转染后48小时,对每个基因座进行基因组裂解分析。然后通过连续稀释对细胞等分试样进行克隆分离。克隆扩增之后,对来自每种克隆细胞系的每个基因座进行PCR扩增。然后使PCR产物在质体载体中克隆且通过对八个个别大肠杆菌群落进行定序来测定***缺失型突变的百分比。AAVS1和HPRT的双重突变体的定量是基于16种克隆细胞系(图23B:双重突变体制备效率),而AAVS、RelA和HPRT三重突变体的定量是基于来源于三次独立实验的总共53种克隆细胞系(图23D:三重突变体制备效率)。
图24绘示了将CRISPR组分和供体DNA依序递送到HEK293细胞中且进行细胞富集的工作流程,其中供体DNA用Alexa647染料标记且Cas9与GFP融合。
图25绘示了依序递送CRISPR组分和供体DNA且进行细胞富集的工作流程。在这个工作流程中,对细胞进行电穿孔两次,其中供体DNA或Cas9 RNP通过每次电穿孔而引入细胞中。
图26绘示了来源于使用HEK293细胞的两个系列实验的数据,所述HEK293细胞涉及CRISPR***组分和供体DNA的共递送或CRISPR***组分和供体DNA的依序递送。简言之,将2μg Cas9蛋白质和500ng相应T1、T2和/或T8gRNA添加到悬浮缓冲液R(赛默飞世尔科技(Thermo Fisher Scientific),DPBS,目录号#14287)中以制备Cas9RNP复合物。为了共递送,此时向10μl反应物中添加1μl 50μM具有钝端(B)或5'突起(5O)的供体DNA。或者,添加1μg单股(ss)DNA寡核苷酸和500ng双股DNA片段。然后使用1150伏、20ms和2个脉冲,将混合物以电穿孔方式送入具有断裂的GFP编码序列的细胞系中。立刻将细胞转移到含有500μl培养基的24孔中,随后培育48小时,随后进行流式细胞术分析。对于依序电穿孔来说,首先将Cas9 RNP递送到细胞中,随后使用500μl悬浮缓冲液R快速洗涤。离心后,将细胞离心块再悬浮于10μl悬浮缓冲液R中。添加相应的供体DNA分子之后,使用相同的电穿孔条件对细胞再次进行电穿孔。这些序列实验中所用的核酸分子的核苷酸序列列于表12中。
以校正编码GFP的核酸中的变异、从而在校正后产生荧光的方式设计寡核苷酸。因此,同源重组校正了变异,从而产生了表达活性GFP。“GFP+细胞%”是指发现含有功能活性GFP的细胞的百分比。使用相同分析对本文所述的多项其它实验中的同源重组进行评分。
图27绘示了寡核苷酸的数量对同源重组的影响的数据。在测试条件下,寡核苷酸的最佳量是10μl悬浮缓冲液R中含有0.2μg到0.5μg单股供体DNA。
图28绘示了寡核苷酸长度和硫代磷酸酯修饰对同源重组的影响的数据。在等质量实验中,寡核苷酸的数量是每10μl反应物0.33μg。在等摩尔浓度实验中,每10μl反应物使用10皮摩尔(1μM最终浓度)。“N”是指无化学修饰。“PS”是指两个末端处的硫代磷酸酯化学修饰。
图29绘示多种电穿孔条件和其使用所产生的数据。数据是对HEK 293细胞使用依序递送而产生:首先使用Pstd电穿孔条件递送Cas9 RNP且其次使用指定条件递送供体DNA。使用0.2μg反义供体DNA进行Pstd的数据表明同源重组的诱导为Cas9/无gRNA供体所诱导的HR背景的约147倍且诱导为Cas9 RNP背景的约47倍。使用0.5μg反义供体DNA进行Pstd的数据表明同源重组的诱导为Cas9/供体背景的约126倍且诱导为Cas9 RNP背景的约40倍。
图30绘示了实验测定gRNA/Cas9复合物稳定性的结果。将50μg gRNA与150μg Cas9蛋白质合并,在室温下搁置5分钟,且然后将样品在4℃储存或在-20℃冷冻以下时间长度:1周(A)、2周(B)、1个月(C)、2个月(D)、3个月(E)或6个月(F)。指定的时间长度之后,然后使用293FT细胞(针对裂解活性),使用基因组裂解检测试剂盒(赛默飞世尔科技,目录号A24372)筛选样品。将裂解活性与新鲜制备的gRNA/Cas9复合物进行对比且计算相对活性,其中1表示所储存样品和新鲜制备样品的活性相同。误差条表示一个标准差。
图31绘示了实验测定gRNA/Cas9复合物稳定性的结果且培养基(赛默飞世尔科技,目录号31985-070)、复合物制备和储存条件如图例到图30中所列,其中将50μggRNA与150μg Cas9蛋白质和10μl合并。
图32绘示了实验测定Cas9蛋白质的结果且 RNAiMax转染试剂(赛默飞世尔科技,目录号13778-150)、稳定性复合物制备和储存条件如图例到图30中所列,其中使用150ng Cas9蛋白质和1.5μl RNAiMax,在4C或-20℃下储存。50ng gRNA与Opti-MEM混合。
具体实施方式
定义:
如本文中所用,术语“CRISPR活性”是指与CRISPR***有关的活性。此类活性的实例是双股核酸酶、切口酶、转录活化、转录抑制、核酸甲基化、核酸去甲基化和重组酶。
如本文中所用,术语“CRISPR***”是指一组CRISPR蛋白质和核酸,当组合时,其产生至少与CRISPR相关的活性(例如双股DNA的目标基因座特异性双股裂解)。
如本文中所用,术语“CRISPR复合物”是指CRISPR蛋白质和核酸(例如RNA)彼此结合而形成具有功能活性的聚集物。CRISPR复合物的一个实例是结合到对目标基因座具有特异性的向导RNA的野生型Cas9(有时称为Csn1)蛋白质。
如本文中所用,术语“CRISPR蛋白质”是指包含核酸(例如RNA)结合域核酸和效应域(例如Cas9,如酿脓链球菌Cas9(Streptococcus pyogenes Cas9)的蛋白质。核酸结合域与具有能够和所期望目标核酸(例如向导RNA)杂交的区域的第一核酸分子发生相互作用或允许具有能够与所期望目标核酸(例如crRNA)杂交的区域的第二核酸结合。CRISPR蛋白质还可以包含核酸酶域(即,脱氧核糖核酸酶或核糖核酸酶域)、额外的DNA结合域、解螺旋酶域、蛋白质-蛋白质相互作用域、二聚合域以及其它域。
CRISPR蛋白质还指形成结合上文所提及的第一核酸分子的复合物的蛋白质。因此,一种CRISPR蛋白质可以结合到例如向导RNA且另一种蛋白质可以具有核酸内切酶活性。这些都被认为是CRISPR蛋白质,原因是其充当与单一蛋白质(如Cas9)执行相同功能的复合物的一部分。
在许多情况下,CRISPR蛋白质将含有使其输送到核的核定位信号(NLS)。
代表性Cas9蛋白质的氨基酸序列列于下文表1中。
如在此所用,术语“转录调节序列”是指核酸分子上所含的呈任何构形或几何形状的功能性核苷酸片段,其用于调节(1)一或多种结构基因(例如二、三、四、五、七、十种等)转录成信使RNA或(2)一或多种基因转录成非转译RNA。转录调节序列的实例包括(但不限于)启动子、增强子、抑制子以及其类似物。
如本文中所用,术语“启动子”是转录调节序列的一个实例,且确切地说,是核酸,其通常被描述为位置接近编码非转译RNA的起始密码子或核酸的基因的5'区。相邻核酸区段的转录在启动子区域启动。可抑制型启动子的转录速率回应于抑制剂而减小。诱导型启动子的转录速率回应于诱导剂而增大。组成型启动子的转录速率不受到特异性调节,然而其在一般代谢条件的影响下可以变化。
如本文中所用,术语“载体”是指向***序列提供适用生物学或生物化学特性的核酸分子(例如DNA)。实例包括质体、噬菌体、自主复制序列(ARS)、着丝点,和能够在活体外或在宿主细胞中复制或被复制或将所期望的核酸区段输送到宿主细胞内的期望位置的其它序列。载体可以具有一或多个限制性核酸内切酶识别位点(例如二、三、四、五、七、十个等),序列可以在所述识别位点以可测定的方式被切而不会损失载体的基本生物学功能,且可以在所述识别位点中将核酸片段剪接以便实现其复制和克隆。载体可以进一步提供引物位点(例如用于PCR)、转录和/或转译起始和/或调节位点、重组信号、复制子、可选标记等。显然,还可以应用***所期望的核酸片段而不需要使用重组、转位或限制酶(如(但不限于)尿嘧啶N糖基化酶(UDG)克隆PCR片段(美国专利第5,334,575号和第5,888,795号,两个专利均完全并入本文中供参考))、T:A克隆以及其类似方法)的方法将片段克隆到待根据本发明使用的克隆载体中。克隆载体可以进一步含有一或多种(例如二、三、四、五、七、十种等)适用于鉴别经克隆载体转化的细胞的可选标记。
如本文中所用,术语“核酸靶向能力”是指分子或分子复合物根据序列特异性来识别核酸和/或与核酸结合的能力。举例来说,crRNA分子上的杂交区域1将核酸靶向能力赋予CRISPR复合物。
如本文中所用,术语“目标基因座”是指核酸分子内的供CRISPR***相互作用(例如结合和裂解)用的位点。当单一CRISPR复合物设计成使双股核酸裂解时,则目标基因座是CRISPR复合物所识别的切点和周围区域。当两种CRISPR复合物设计成将非常接近的双股核酸点切以产生双股断裂时,则断点周围且包括断点的区域称为目标基因座。
如本文中所用,“反向可选”标记(本文中还称为“负向”可选标记)或标记基因是指允许通过排除非所需元件来选择所需载体、克隆、细胞或生物体的任何基因或其功能变异体。这些标记对在某些条件下的复制往往具有毒性或以其它方式抑制,所述条件往往涉及暴露于特定的底物或生长条件的变换。反向可选标记基因往往并入基因修饰方案中以便选择需要除去标记的罕见重组或克隆事件或选择性地从指定群体中排除质体或细胞。细菌克隆方法中广泛使用的负向可选标记***的一个实例是ccdA/ccdB毒素-抗毒素***。
综述:
本发明部分地涉及用于制备核酸分子的组合物和方法。具体地说,本发明涉及设计成与其它核酸分子相互作用的蛋白质和核酸分子组合。更确切地说,本发明涉及蛋白质核酸复合物,其中核酸组分具有与目标核酸分子互补的序列。在这些***中,所复合的核酸与目标核酸分子之间的序列互补性用于使复合物与目标核酸结合。一旦此发生,则与复合物有关的功能活性可以用于改变目标核酸分子。
本发明举CRISPR***为例说明。术语“CRISPR”是应用于三种类型的***和***亚型的通用术语。一般来说,术语CRISPR是指编码CRISPR***组分(例如所编码的crRNA)的重复区域。已经鉴别出各自具有不同特征的三种类型的CRISPR***(参见表2)。
虽然本发明具有多个方面和与其有关的变化形式,但是II型CRISPR/Cas9***已经选作参考端供在本文中解释。
在某些方面中,本发明提供:
1.制备crRNA/tracrRNA的个别寡核苷酸和此类寡核苷酸的集合,以及产生和使用此类寡核苷酸的方法。
2.用于将CRISPR复合物组分引入细胞中的组合物和方法。
图1绘示了与II型CRISPR***有关的组分和分子相互作用。在此情况下,举Cas9介导式酿脓链球菌***为例说明。
图1中绘示了crRNA,所述crRNA与目标DNA(杂交区域1)和tracrRNA(杂交区域2)均杂交。在这个***中,这两种RNA分子用于将Cas9蛋白质以允许切割目标DNA的方式引到目标DNA序列。目标DNA在两个位点被切割而形成双股断裂。
tracrRNA序列中出现了相当大的序列变异。已经假设tracrRNA功能与RNA结构的相关性大于RNA序列。
酿脓链球菌中的Cas9蛋白质具有1368个氨基酸的长度(NCBI参考序列:WP_030126706.1)且含有多个结构域供结合和切割核酸分子用。这种蛋白质含有两个各自具有DNA切口酶活性的结构域(RuvC和HNH)。当此蛋白质点切DNA的两个股时,缺口紧密接近的程度足以允许双股断裂形成。
在一些情况下,CRISPR蛋白质将含有以下氨基酸序列中的一或多种:(1)YSIGLDIGTNSVG(SEQ ID NO:2)、(2)PTIYHLR(SEQ ID NO:3)、(3)RGHFLIE(SEQ ID NO:4)、(4)TKAPLSASM(SEQ ID NO:5)、(5)LRKQRTFDNG(SEQ ID NO:6)、(6)LTFRIPYYVGPLAR(SEQ IDNO:7)、(7)TLTLFEDREMI(SEQ ID NO:8)、(8)AGSPAIKKGILQ(SEQ ID NO:9)、(9)RQLVETRQITKHVA(SEQ ID NO:10)和/或(10)QTGGFSKESIL(SEQ ID NO:11)。
虽然不希望被理论束缚,但是简言之,如图1中所示,crRNA与目标DNA(称为“杂交区域1”)杂交。杂交区域1典型地在18到22个碱基对的范围内,但是可以是更长或更短。crRNA由此“鉴别”目标DNA序列。crRNA还与tracrRNA(称为“杂交区域2”)杂交。杂交区域1典型地在15到25个碱基对的范围内,但是可以更长或更短且杂交股之间往往不具有全序列互补。相信tracrRNA与Cas9蛋白质结合,从而使RuvC和HNH裂解域与目标DNA接触。
已经鉴别出CRISPR/Cas9***的多种特征,其中的任一种或全部均可以用于实施本发明:
1.可以将crRNA与tracrRNA组合而形成向导RNA(gRNA)。
2.可以将突变引入Cas9蛋白质中,从而使RuvC或HNH域失活,产生具有股特异性切口酶活性的蛋白质。
3.可以将突变引入Cas9蛋白质中,从而使所有核酸裂解活性失活,但是允许这些蛋白质保留核酸结合活性。
4.可以使CRISPR***RNA组分发生序列变异,包括截断和多核苷酸缺失。
对II型CRISPR***的一个限制是需要原间隔子相邻基序(PAM)以获得高水平活性。通过Cas9-RNA发生的DNA有效结合和裂解需要识别PAM。典型地,PAM具有三个核苷酸的长度。
在许多情况下,当本发明方法使核酸裂解时,希望使得两个缺口彼此间紧密接近。当目标基因座处于细胞基因组中时,特别如此。使用CRISPR***组分点切核酸相信可限制“脱靶效应”,原因在于,在除目标基因座之外的位置产生单一缺口不大可能引起核酸发生单股裂解。
图4绘示了选择两个紧密相关的形成目标基因座的位点。每个位点(位点1和位点2)结合具有切口酶活性的CRISPR复合物。
图4中举例说明的两个位点的位置彼此间通常充分接近,以致含有缺口的双股核酸断裂。虽然此距离视各种因素(如区域中的AT/CG含量)而变,但是缺口位点通常在彼此间的200个碱基对内(例如约1到约200、约10到约200、约25到约200、约40到约200、约50到约200、约60到约200、约1到约100、约10到约100、约20到约100、约30到约100、约40到约100、约50到约100、约1到约60、约10到约60、约20到约60、约30到约60、约40到约60、约1到约35、约5到约35、约10到约35、约20到约35、约25到约35、约1到约25、约10到约25、约15到约25、约2到约15、约5到约15个碱基对等)。
在许多情况下,CRISPR复合物以高亲和力结合到目标基因座。在许多此类情形下,当目标基因座发生双股断裂时,所期望的CRISPR复合物将以使得其彼此间不发生位阻干扰的方式导向目标基因座。因此,本发明包括其中对目标基因座的CRISPR复合物结合位点进行选择的方法,以便每个股上的点切活性不因导向另一股的缺口的CRISPR复合物的结合而发生显著变化。本发明进一步包括用于执行此类方法的组合物。
酿脓链球菌Cas9蛋白质具有多个域(参见表3),其中两个是核酸酶域。不连续的RuvC样域大致被氨基酸1-62、718-765和925-1102涵盖。HNH核酸酶域大致被氨基酸残基810-872涵盖。识别波瓣(大致为氨基酸60-718)是以序列非依赖性方式识别且结合向导RNA中的区域。此波瓣的一些部分缺失使得CRISPR活性消除。PAM相互作用域(大致为氨基酸1099-1368)识别PAM基序。
点切活性可以通过多种方法实现。举例来说,Cas9蛋白质具有两个域,称为RuvC和HNH,其将双股核酸的不同股点切。可以改变Cas9蛋白质以使一个域或另一个域失活。结果是,为了使双股断裂发生,需要两种Cas9蛋白质来点切目标基因座。举例来说,来自酿脓链球菌的Cas9的RuvC催化域中发生的天冬氨酸被丙胺酸取代(D10A)使得Cas9从核酸酶(使双股裂解)转化为切口酶(使单股裂解)。使Cas9成为切口酶的突变的其它实例包括H840A、N854A和N863A。
具有切口酶活性的CRISPR蛋白质(例如Cas9)可以与分别靶向DNA目标的有义股和反义股的向导序列(例如双向导序列)组合使用。
利用切口酶活性在核酸中产生双股断裂的另一种方式是使用连接到异源核酸酶域的缺乏核酸酶活性的CRISPR蛋白质。这种蛋白质的一个实例是连接到FokI域的突变型Cas9,称为dCas9。FokI域需要发生二聚化才能获得核酸酶活性。因此,在此类情况下,使用CRISPR RNA分子使两种dCas9-FokI融合蛋白充分紧密地接近以产生核酸酶活性,从而形成双股切口。这种类型的方法陈述于Tsai等人,“二聚合CRISPR RNA引导的FokI核酸酶用于高度特异性基因组剪辑(Dimeric CRISPR RNA-guided FokI nucleases for highlyspecific genome editing)”,《自然生物技术(Nature Biotech)》,32:569-576(2014)和Guilinger等人,“无催化活性Cas9与FokI核酸酶的融合使基因组修饰特异性改善(Fusionof catalytically inactive Cas9to FokI nuclease improves the specificity ofgenome modification)”,《自然生物技术》,32:577-582(2014)。
短暂活性
一个需求是具有短暂或高度可调节活性的基因组剪辑***。短暂活性对于多项应用来说具有重要作用。举例来说,构筑涉及一或多种核酸酶活性的细胞系。一旦细胞核酸例如已经有效地暴露于核酸酶且适当地暴露于切口,则通常发生核酸的修复(例如通过非同源末端连接)。细胞保持活力通常需要细胞核酸的修复。在许多情况下,细胞将核酸整合到被修复的核酸分子中或从被修复的核酸分子中除去核酸(例如1个碱基对到约100个碱基对)。在任一种情形下,细胞基因组内均发生可遗传的变化。然后可以筛选具有基因变化的细胞以鉴别具有所期望变异的细胞。在大部分应用中,一旦鉴别出具有所期望变化的细胞,则维持细胞而不发生进一步的核酸酶诱导基因变化是有利的。因此,通常希望用于促进基因变化的核酸酶活性在细胞内不具有活性。
短暂活性可以通过多种方法实现,其中一些呈现于图5中。CRISPR***典型地要求所有必需组分存在活性。使用CRISPR/Cas9***进行参考,目标核酸分子必须与Cas9蛋白质和一或多种CRISPR核酸分子(例如(1)crRNA分子和tracrRNA分子或(2)向导RNA分子)接触。
本发明因此包括获得短暂CRISPR介导活性(例如核酸酶活性)的组合物和方法。短暂活性可以通过任何数目种方法产生。CRISPR***的一个特征是所有组分典型地需要合在一起才能产生活性。这些组分是(1)一或多种CRISPR蛋白质(例如Cas9)、(2)杂交区域1(例如crRNA),和(3)与杂交区域1和一或多种CRISPR蛋白质均结合的核酸。因此,如果将CRISPR介导活性所必需的一或多种组分除去,那么所述活性被抑制。
使用基于Cas9的CRISPR***用于说明的目的,CRISP介导活性需要三种组分:(1)Cas9蛋白质、(2)crRNA和(3)tracrRNA。因此,通过这些组分中的任一种的有时限的存在来产生短暂***。变异数呈现于图5中。
如上文所提及,在Cas9介导式***中,必须存在Cas9蛋白质才能产生活性。另外,蛋白质通常是细胞内相当稳定的分子。Cas9蛋白质可以通过例如泛素化而被修饰以增强细胞内降解(例如蛋白酶体介导式降解)。
可以将Cas9蛋白质引入细胞中(第2行,A栏)或在细胞内产生(第1、3、4和5行,A栏)。另外,可以控制或调节Cas9蛋白质在细胞内吸收或产生的持续时间和在细胞内存在的量。举例来说,可以使经染色体整合的Cas9蛋白质编码序列可操作地连接到可调节启动子。另外,可以调节引入细胞中的编码Cas9蛋白质的mRNA的量。
就高水平CRISPR活性所需的非编码CRISPR RNA来说,至少两种形式是可能的:(1)单独的crRNA和tracrRNA分子以及(2)向导RNA(参见表4)。
本发明因此包括用于使细胞内短暂产生CRISPR介导型活性的组合物和方法。此类方法包括例如稳定和不稳定CRISPR***组分的组合使用。一个实例是其中将编码野生型Cas9蛋白质的mRNA和向导RNA按大致相等的量引入细胞中的***。在这个实例中,Cas9mRNA的存在将引起稳定Cas9蛋白质的产生且针对CRISPR介导型活性的限制因素典型地根据向导RNA的存在量和向导RNA的降解量来确定。
CRISPR介导式***中的各种组分通过多种方法产生且/或引入细胞内。举例来说,可以产生为了便于CRISPR***重构所设计细胞。这种细胞的一个实例是哺乳动物细胞系(例如CHO、293等),其含有编码Cas9蛋白质的核酸和整合到基因组中的tracrRNA。然后可以通过将crRNA引入细胞系中(例如借助于转染)而将CRISPR介导型活性导向特定的目标序列。在此类示例性细胞系中,可以组成性地表达或可调节地表达Cas9和/或tracrRNA编码序列(例如可操作地连接到诱导性或抑制性启动子)。
本发明因此包括含有CRISPR***的一或多种组分的细胞系(例如真核细胞系),以及将一或多种CRISPR介导型活性导向此类细胞内的特定目标基因座的方法。在许多情况下,这起因于至少一种额外组分的添加或产生,从而在细胞内产生目标基因座CRISPR介导型活性。
杂交区域1(HR1)
相信HR1(还称为目标互补crRNA)决定了CRISPR复合物所结合的目标核酸序列。HR1在长度、核苷酸组成(例如AT/CG比率)以及序列与目标序列互补的程度(例如100%)方面可以变化。
如上文所提及,HR1长度可以变化。HR1长度是由与目标核酸互补的序列中的核苷酸数目(不包括内部错配)决定。举例来说,如果crRNA或向导RNA具有二十二个核苷酸区域,其中十个5'最末端核苷酸和十个3'最末端核苷酸与目标核酸的序列100%互补,那么HR1区域具有二十二个核苷酸的长度,其中有两个内部错配。在此情况下,HR1与目标核酸的序列具有约91%序列互补性。
本发明的组合物和方法中所用的HR1可以是从约12个核苷酸到约35个核苷酸不等(例如约13个核苷酸到约33个核苷酸、约15个核苷酸到约33个核苷酸、约17个核苷酸到约33个核苷酸、约18个核苷酸到约33个核苷酸、约19个核苷酸到约33个核苷酸、约20个核苷酸到约33个核苷酸、约21个核苷酸到约33个核苷酸、约13个核苷酸到约30个核苷酸、约15个核苷酸到约30个核苷酸、约18个核苷酸到约30个核苷酸、约20个核苷酸到约30个核苷酸、约13个核苷酸到约27个核苷酸、约15个核苷酸到约27个核苷酸、约18个核苷酸到约27个核苷酸、约20个核苷酸到约27个核苷酸、约13个核苷酸到约25个核苷酸、约15个核苷酸到约25个核苷酸、约17个核苷酸到约25个核苷酸、约18个核苷酸到约25个核苷酸、约20个核苷酸到约25个核苷酸、约13个核苷酸到约23个核苷酸、约15个核苷酸到约23个核苷酸、约18个核苷酸到约23个核苷酸、约20个核苷酸到约23个核苷酸等)。
HR1可以设计成序列在特定的AT/CG比率下与目标核酸互补。可以改变AT/CG以调节HR1与特定目标核酸之间的杂交“亲和力”。A-T对的杂交紧密性小于C-G对。因此,可以通过改变HR1的AT/CG比率来使杂交强度发生变化。在一些情况下,可能期望较高的结合亲和力且在一些情况下,可能期望较低的结合亲和力。
另外,crRNA和向导RNA分子可以设计成具有使得脱靶效应减小的AT/CG含量。举例来说,人类基因组具有约41%到42%的平均CG含量。因此,含有CG含量大于或小于41%到42%的HR1的核酸不大可能与除预定目标核酸之外的核酸具有显著的序列互补性。另外,脱靶效应预期越小,则HR1和目标核酸的AT/CG比率越偏离所改变的基因组或其它核酸分子的平均AT/CG比率。
本发明的组合物和方法中所用的HR1因此可以具有以下范围内的AT/CG比率:约1:5到约5:1(例如约1:4到约5:1、约1:3到约5:1、约1:2到约5:1、约1:1到约5:1、约1:5到约4:1、约1:4到约4:1、约1:3到约4:1、约1:2到约4:1、约1:1到约4:1、约1:5到约3:1、约1:4到约3:1、约1:3到约3:1、约1:2到约3:1、约1:1到约3:1、约1:5到约2:1、约1:4到约2:1、约1:3到约2:1、约1:2到约2:1,或约1:1到约2:1)。
HR1与目标核酸之间的结合亲和力可以通过HR1长度、AT/CG含量和序列互补百分比的组合来改变。在大多数情况下,HR1与目标核酸之间的序列是100%,但是其可以在约80%到约100%、约90%到约100%、约95%到约100%、约80%到约95%、约85%到约95%或约90%到约95%之间变化。本发明的组合物和方法中所用的HR1可以具有上文所提及的序列互补特征。
HR1也可以使用生物信息学数据设计以限制脱靶效应。可以获得数千个基因组的全基因组序列数据。当CRISPR***经工程改造可修饰特定生物体的基因组时,可以分析那种生物体的基因组(假设基因组序列已知),选择独特的且/或与CRISPR复合物基本结合程度足够类似的序列无对应区域的区域。这可以通过位点选择与结合到所选位点的HR1制备的组合来进行。
杂交区域2(HR2)
HR2是(1)crRNA与tracrRNA之间或(2)向导RNA内的序列互补区域。在向导RNA中,这个区域形成发夹(图3)。
CRISPR蛋白质
视CRISPR***的类型而定,可以使用一或多种CRISPR蛋白质(例如Cas9)。这些CRISPR蛋白质通过第二核酸靶向已确定序列的第一核酸(目标基因座)且单独或结合其它蛋白质发挥作用。因此,CRISPR复合物是核酸引导的核酸识别***。
CRISPR蛋白质或蛋白质复合物典型地具有针对一或多种CRISPR寡核苷酸的结合活性和核酸修饰活性(例如重组酶活性、甲基化酶活性等)。另外,CRISPR蛋白质或蛋白质复合物中可以存在核定位信号,特别是当(1)产生于真核细胞中时或(2)经设计或经制备以引入真核细胞中时。
因此,CRISPR蛋白质可以是融合蛋白,其包含例如CRISPR蛋白质或其片段和效应域。适合的效应域包括例如核酸裂解域(例如异源裂解域,如核酸内切酶FokI的裂解域)、外遗传修饰域、转录活化域(例如VP16域)和转录抑制域。每个融合蛋白可以引导到特定的染色体基因座,例如通过特定的向导RNA来引导,其中效应域介导靶向基因组修饰或基因调节。
在一些方面中,融合蛋白可以充当二聚体,借此增加靶点长度和增加其在基因组中的唯一可能性(从而,减少脱靶效应)。举例来说,内源CRISPR***基于约13-20bp的DNA结合字长来修改基因组位置(Cong等人,《科学(Science)》,339:819-823(2013))。
CRISPR蛋白质可以通过任何数目种方式合成且/或提纯。在许多情况下,CRISPR蛋白质将在期望活性的细胞内产生。在一些情况下,CRISPR蛋白质可以在期望活性的细胞的细胞外产生且然后引入所述细胞中。用于制备此类CRISPR蛋白质的方法实例是活体外转译、从表达由表达载体编码的这些蛋白质的细胞中提取蛋白质,和从通常表达这些蛋白质的细胞中提取这些蛋白质。
CRISPR寡核苷酸
CRISPR寡核苷酸可以通过多种方法产生且可以产生而具有不同特征。在许多情况下,CRISPR寡核苷酸将是单组分或双组分。“单组分”意指只有一种寡核苷酸(例如向导RNA)是CRISPR活性必需的。“双组分”意指只有两种不同的寡核苷酸(例如crRNA和tracrRNA)是CRISPR活性必需的。还可以设计、制备和使用具有超过两种组分的CRISPR***。因此,本发明涵盖多组分CRISPR寡核苷酸,其中功能涉及三、四、五种寡核苷酸等。
在一些情况下,可以分别产生两种或超过两种寡核苷酸且然后将彼此连接以形成例如一种寡核苷酸,其作为CRISPR***的一部分发挥作用。***中的组分数目是根据与Cas9的相互作用来决定。举例来说,如果产生两种寡核苷酸且然后连接,随后引入细胞中,其中所连接的寡核苷酸不需要额外的寡核苷酸来促进CRISPR介导型活性,那么这称为单组分***。
当然,核苷酸序列和CRISPR寡核苷酸的其它特征可以根据特定的***和所期望的功能来变化。CRISPR寡核苷酸的共同特征包括与一或多种CRISPR复合物蛋白质(例如Cas9)的结合和核酸“靶向”能力。
本发明因此包括用于产生CRISPR寡核苷酸的组合物和方法,以及所产生的寡核苷酸集合(例如使用此类组合物和方法所产生)。
在一些实施例中,本发明的组合物和方法涉及用于产生CRISPR寡核苷酸的分子生物学合成(例如PCR)和/或化学合成之一或组合。使用图6中所示的示意图供参考,可以设计出向导RNA的两种化学合成寡核苷酸编码组分,其彼此杂交且延长而形成完全双股核酸分子(例如DNA)。
图6绘示了本发明的示例性工作流程。图6中的示意图绘示了经设计可产生DNA分子的寡核苷酸,其中向导RNA编码区可操作地连接到T7启动子。在此工作流程中,使用单独或与双股DNA结合的DNA寡核苷酸通过PCR产生DNA分子,所述DNA分子编码可操作地连接到适于活体外转录的启动子的向导RNA。然后对DNA分子进行活体外转录以产生向导RNA。然后可以通过例如柱提纯或基于珠粒的方法来“净化”向导RNA。然后如下使向导RNA适合使用:举例来说,(1)直接引入细胞中,或(2)与一或多种CRISPR蛋白质复合之后,引入细胞中。当哺乳动物细胞含有T7RNA聚合酶时,可操作地连接到T7启动子的核酸可以在这些细胞中转录(Lieber等人,《核酸研究(Nucleic Acids Res.)》,17:8485-8493(1989))。当然,在真核细胞中发挥功能的其它启动子(例如CMV启动子、U6启动子、H1启动子等)还可以用于细胞内产生向导RNA。H1启动子的长度是例如约300个碱基对。T7启动子的一个优点是其尺寸小(20个碱基对)。可以用于本发明组合物和方法中的特定T7启动子包括具有以下核苷酸序列的那些启动子:GAAATTAATACGACTCACTATAG(SEQ ID NO:12)。
T7启动子还可以用于在活体外转录***中产生向导RNA。在此情况下,双股核酸分子用于细胞外产生向导RNA以便引入细胞中。
图6中所示的向导RNA产生方法的优点6是速度和低制备成本。具体地说,一旦已经鉴别出目标序列,则可以产生正向寡核苷酸且与反向寡核苷酸合并于反应混合物中,所述反应混合物经设计使每种寡核苷酸延长以形成双股核酸分子(参见图7)。正向寡核苷酸编码crRNA序列,所述crRNA序列经设计具有与目标基因座互补的序列。另外,反向寡核苷酸具有与向导RNA共同的序列。反向寡核苷酸可以通过任何方式产生且作为标准组分储存。然而,正向寡核苷酸是特定的目标序列,因此其必须考虑目标基因座来设计。
如图6中所述的适于产生适于转录的双股DNA的两种寡核苷酸绘示于图7中。在图7的示意图中,“正向寡核苷酸”是根据目标基因座来定制,因为其含有目标特异性crRNA的杂交区域1。“反向寡核苷酸”含有不具有目标基因座特异性的tracrRNA和crRNA的区域。因此,“反向寡核苷酸”可以是“储备”组分。本发明因此包括用于形成向导RNA分子的组合物和方法。本发明的这个方面的方法可以包含以下中的一或多个:
a.鉴别目标基因座,
b.计算机模拟设计序列与那个基因座互补的一或多种CRISPR RNA分子,
c.使用启动子序列(与目标基因座互补的序列区域(例如15到25个核苷酸的长度))产生第一寡核苷酸,
d.将第一寡核苷酸与(i)第二寡核苷酸和(ii)聚合酶在适于执行聚合酶链反应(PCR)的条件下培育以产生双股核酸分子,其中第一寡核苷酸和第二寡核苷酸具有长度足以允许两种寡核苷酸之间杂交的序列互补区域,以及
e.使PCR产生的双股核酸分子进行活体外转录反应以产生向导RNA分子,以及
f.从反应混合物的其它组分中提纯向导RNA分子。
在图8所示的工作流程中,具有T7启动子和杂交区域1核酸的两种寡核苷酸和双股核酸区段是通过PCR组装。在这个工作流程中,双股核酸区段具有恒定的序列且因此可以是储备组分。
两种寡核苷酸通过聚合酶介导式组装反应来形成全长双股核酸区段。组装成全长产物分子后,进一步进行PCR反应扩增产物。引物防止两种寡核苷酸成为PCR“限制”组分。换句话说,产物核酸分子已经产生后,则引物允许扩增在第一和第二寡核苷酸已经消耗之后继续进行。
图9绘示了一种方法,其类似于图8中所示,但是组装反应使两个双股核酸区段连接且将特定核酸***其间。因此,图9中所示的方法特别适用于将所设计序列的核酸区段***所选核酸分子之间。
就CRISPR RNA编码序列构筑来说,可以合成第一寡核苷酸和第二寡核苷酸以与第一核酸区段和第二核酸区段杂交。这些寡核苷酸各自还编码杂交区域1的全部或一部分。组装反应因此可以设计成产生例如DNA分子,其编码可操作地连接到启动子的目标基因座特异性向导RNA。
虽然图9中所示类型的组装反应只需要一种寡核苷酸,但是通常使用两种,原因是crRNA杂交区域1典型地具有约20个碱基的长度且约15个碱基的序列一致性是与第一核酸区段和第二核酸区段发生有效杂交所期望的。虽然45到55个碱基的寡核苷酸可以用化学方式合成,但是序列保真度往往随着长度而降低。具有短序列的crRNA杂交区域1区段的引入产生了两个问题:(1)由于杂交区域1与除所期望目标基因座之外的基因座结合,因此“脱靶”效应可能会增加;以及(2)所编码的向导RNA的目标基因座相互作用效率降低。
将PCR组装的异源核酸(例如DNA)转录(例如通过活体外转录)且然后引入细胞中时,出现上述第二个问题。一般来说,初始组装寡核苷酸群体中的序列保真度越低,则所表达的向导RNA群体中的杂交区域1的变异度越大。解决此问题的一种方式是使用通过高序列保真度所产生的寡核苷酸。
图9表示了合成向导RNA表达盒组装设计。在这个设计中,目标特异性crRNA可变区是由35到40个碱基对的DNA寡核苷酸(在此所示具有第一和第二寡核苷酸)编码。所有剩余DNA寡核苷酸和双股DNA区段可以是恒定组分。这些恒定组分包括1)编码例如RNA聚合酶III启动子的第一双股核酸区段,所述RNA聚合酶III启动子可以用于活体内表达非编码向导RNA组分;2)编码tracrRNA组分的第二双股核酸区段;和3)用于扩增和富集含有RNA聚合酶III启动子的全长向导RNA表达模板的5'和3'引物。含有相关RNA聚合酶III启动子的全长向导RNA表达盒是使用双股核酸区段、目标特异性重叠寡核苷酸和侧接PCR引物、通过组装PCR来产生。使用Taq DNA聚合酶(例如 Taq DNA聚合酶)进行组装PCR,所得产物经柱提纯之后递送到所关注的宿主细胞系中。诸如此类的方法还可以用于产生含有任何使用者限定启动子的向导RNA表达盒。
本发明进一步包括用于组装CRISPR RNA分子(例如向导RNA分子)的组合物和方法。CRISPR RNA分子可以通过两个或超过两个(例如二、三、四、五个等)RNA区段彼此间的连接来组装。具体地说,本发明包括制备核酸分子的方法,这些方法包含使两个或超过两个线性RNA区段在允许第一RNA区段的5'末端与第二RNA区段的3'末端共价连接的条件下彼此接触。
这种组装形式的优点是其允许CRISPR RNA分子发生快速且高效的组装。使用图10中所示的示意图供说明的目的,使用连接到靶点特异性crRNA分子/区段的单一tracrRNA分子/区段可以产生对不同靶点具有特异性的向导RNA分子。图10绘示了含有不同crRNA分子的四个试管,其中crRNA分子3连接到tracrRNA分子而形成向导RNA分子。因此,图10绘示了两个RNA区段的连接以获得产物RNA分子。因此,本发明包括用于使crRNA分子和tracrRNA分子连接(例如共价连接)的组合物和方法。
本发明还包括用于制备对靶点具有特异性的向导RNA分子的组合物和方法,所述方法包含:(1)鉴别靶点;(2)产生crRNA区段;和(3)使crRNA区段与tracrRNA区段连接。在此类方法中,可以先产生tracrRNA区段,随后与crRNA连接,且作为“储备”组分储存,或可以由编码tracrRNA的DNA分子产生tracrRNA区段。
在本发明的实施中彼此连接的RNA分子/区段可以通过任何数目种方式产生,包括DNA分子的化学合成和转录。在一些情况下,彼此连接的RNA区段可以通过不同方法产生。举例来说,通过化学合成所产生的crRNA分子可以连接到通过编码tracrRNA的DNA或RNA的活体外转录所产生的tracrRNA分子。
RNA区段彼此间还可以通过共价偶合来连接。RNA连接酶(诸如T4RNA连接酶)可以用于使两个或超过两个RNA区段彼此连接。当使用试剂(诸如RNA连接酶)时,5'末端典型地连接到3'末端。如果连接两个区段,那么可以形成两种可能的线性构筑体(即,(1)5'-区段1-区段2-3'和(2)5'-区段2-区段1-3')。另外,还可以发生分子内环化。这两个问题均可以通过将一个5'末端或一个3'末端封端来解决,以便RNA连接酶不能使所述末端连接到另一末端。因此,如果期望5'-区段1-区段2-3'的构筑体,那么将封端基团放置于区段1的5'端或区段2的3'端将只形成正确的线性连接产物且防止分子内环化。本发明因此包括供两个核酸(例如RNA)区段共价连接用的组合物和方法。本发明的方法包括使用RNA连接酶使两个单股RNA区段彼此间定向连接。
可以配合例如T4RNA连接酶使用的封端子的一个实例是双脱氧终止子。
T4RNA连接酶催化5'-磷酸酯与3'-羟基末端之间发生ATP依赖性的磷酸二酯键连接。因此,当一个末端使用T4RNA连接酶时,所连接的末端上必须存在适合的末端。一种通过末端阻断T4RNA连接酶的方式是通过不去拥有正确的末端形式。换句话说,具有5-羟基或3'-磷酸酯的RNA区段末端不充当T4RNA连接酶的底物。
可以用于连接RNA区段的另一方法是“点击化学”(参见例如美国专利第7,375,234号和第7,070,941号,和美国专利公开第2013/0046084号,其完整的揭露内容并入本文中供参考)。举例来说,一个点击化学反应发生于炔基与叠氮基之间(参见图11)。任何点击反应均可以用于连接RNA区段(例如Cu-叠氮基-炔、菌株促进型叠氮基-炔、施陶丁格尔连接(staudinger ligation)、四嗪连接、光诱导型四唑-烯烃、巯基-烯、NHS酯、环氧化物、异氰酸酯,以及醛-氨氧基)。利用点击化学反应连接RNA分子是有利的,原因是点击化学反应快速、模块化、高效,通常不产生有毒废产物,可以用水作为溶剂来进行,且可以设定成具有立体特异性。
在一个实施例中,本发明使用“惠斯金叠氮基-炔环加成(Azide-Alkyne HuisgenCycloaddition)”反应,这是叠氮基与末端或内部炔之间的1,3-偶极环加成,得到1,2,3-***供连接RNA区段用。这种连接方法的一个优点是,此反应可以通过添加所需的Cu(I)离子来引发。
可以据以连接RNA区段的其它机制包括使用卤素(F-、Br-、I-)/炔加成反应、碳基/硫氢基/顺丁烯二酰亚胺以及羧基/胺键联。
举例来说,一个RNA分子可以被修饰成在3'具有巯基(使用二硫基氨基酸酯和通用载体或被二硫基修饰的载体),且另一个RNA分子可以被修饰成在5'具有丙烯酰胺(使用丙烯酸类氨基磷酸酯),然后通过迈克尔加成反应(Michael addition reaction)可以将两个RNA分子连接。这种策略还可以应用于逐步连接多个RAN分子。
本发明还包括用于使超过两个(例如三、四、五、六个等)RNA分子彼此连接的方法。可以执行此方法的一个原因是,当期望长于约40个核苷酸的RNA分子(如在本文中别处所提及)时,化学合成效率降低。
举例而言,tracrRNA典型地是约80个核苷酸。此类RNA分子可以通过诸如活体外转录或化学合成方法制备。当化学合成用于制备此类RNA分子时,其可以作为单一合成产物或通过使两个或超过两个合成RNA区段彼此连接而制得。另外,当三个或超过三个RNA区段彼此连接时,可以利用不同方法将个别区段连在一起。另外,RNA区段的彼此连接可以在一个“锅”中、皆在相同时间,或在一个“锅”中、在不同时间,或在不同“锅”中、在不同时间进行。
出于说明的目的,假设希望将RNA区段1、2和3按数字顺序组装。RNA区段1和2可以从5'到3'彼此连接。然后可以从反应混合物组分中提纯反应产物(例如通过色谱法),然后放入第二容器“锅”中以便3'末端与RNA区段3的5'末端连接。然后可以使最终反应产物连接到RNA区段3的5'末端。
本发明的一个实施例的第二个更具体图解说明如下。RNA区段1(约30个核苷酸)是crRNA的目标基因座识别序列和发夹区域1的一部分。RNA区段2(约35个核苷酸)含有发夹区域1的剩余部分和位于发夹区域1与发夹区域2之间的一些线性tracrRNA。RNA区段3(约35个核苷酸)含有发夹区域1与发夹区域2之间的线性tracrRNA的剩余部分以及发夹区域2的全部。在此图解说明中,利用点击化学使RNA区段2和3从5'到3'连接。另外,反应产物的5'和3'末端均发生磷酸化。然后使反应产物与具有3'末端羟基的RNA区段1和T4RNA连接酶接触,以产生向导RNA分子。
可以利用多种额外的连接化学反应,根据本发明的方法连接RNA区段。这些化学反应中的一些阐明于表6中。
RNA区段连接方法出现的一个问题是,其往往不能使得所述区段完全转化成所连接的RNA分子。举例来说,一些化学键联反应只有50%的反应物形成所期望的最终产物。在此类情况下,往往希望除去试剂和未反应的RNA区段。此可以通过任何数目种方式进行,诸如渗析、色谱(例如HPLC)、沉淀、电泳等。因此,本发明包括用于连接RNA区段的组合物和方法,其中反应产物RNA分子与其它反应混合物组分分离。
如上文所提及,CRISPR***组分就目标基因座(例如Cas9蛋白质)来说可以是“通用的”或可以是特异性针对特定目标基因座(例如crRNA)。由此可以产生能够配合目标序列特异性组分使用的“通用”组分。因此,当鉴别出所关注的目标基因座时,只需要产生特异性针对那个目标基因座的一种或多种组分。在设法在目标序列中产生两个紧密相关的“缺口”的情况下,然后典型地需要产生例如两个crRNA分子。当鉴别出所关注的目标序列时,可以产生这些crRNA分子,或其可以预先产生且储存直至需要时为止。
本发明进一步包括特异性针对个别靶点的crRNA分子的集合。举例来说,本发明包括特异性针对特定类型细胞(例如人类细胞)内的靶点的rRNA分子的集合。细胞的此类集合中的成员可以根据这些特定类型细胞的序列信息产生。举例来说,一种此类集合可以使用特定类型细胞的全基因组序列产生。基因组序列数据可以用于产生对人类基因组内的每个基因的编码区具有特异性的crRNA分子的文库。可以用于产生此类文库的参数可以包括原间隔子相邻基序(PAM)位点的位置、脱靶效应(例如目标区域独有的序列),以及当期望基因“敲除”时,编码区内的可能使基因表达产物完全或部分丧失功能的位置(例如活性位点编码区、内含子/外显子接合点等)。
本发明crRNA分子的集合或文库可以包括多种多样的个别分子,如约五到约100,000(例如约50到约100,000、约200到约100,000、约500到约100,000、约800到约100,000、约1,000到约100,000、约2,000到约100,000、约4,000到约100,000、约5,000到约100,000、约50到约50,000、约100到约50,000、约500到约50,000、约1,000到约50,000、约2,000到约50,000、约4,000到约50,000、约50到约10,000、约100到约10,000、约200到约10,000、约500到约10,000、约1,000到约10,000、约2,000到约10,000、约4,000到约10,000、约50到约5,000、约100到约5,000、约500到约5,000、约1,000到约5,000、约50到约2,000、约100到约2,000、约500到约2,000等)种。
通过本发明实施所产生和所用的RNA分子可以多种方式储存。RNA分子通常不如DNA分子那样稳定,且因此,为了增强稳定性,RNA分子可以在低温(例如-70℃)下和/或在一或多种核糖核酸酶抑制剂(例如RNASEOUTTM、RNASECURETM试剂,均获自赛默飞世尔科技)存在下储存。
另外,可以对RNA分子进行化学修饰,例如使用具核糖核酸酶抗性的三磷酸核糖核苷产生,以对核糖核酸酶具有抗性。具核糖核酸酶抗性的被修饰核糖核苷的实例包括(但不限于)2-氟核糖核苷、2-氨基核糖核苷和2-甲氧基核糖核苷。美国专利公开2014/0235505A1中揭露了具核糖核酸酶抗性的被修饰核糖核苷的其它实例,其完整揭露内容并入本文中供参考。本发明的RNA分子中还可以并入2'-O-烯丙基-核糖核苷酸。
本发明实施中所用的化学修饰往往根据一系列准则来选择,如对使用化学修饰的用途(例如核糖核酸酶抗性)的有效性、细胞中毒程度(低毒性通常比高毒性更好)、容易并入核酸分子中,以及对核酸分子生物活性(例如向导RNA分子活性)的干扰最小。
另外,本发明实施中所用的RNA分子可以多种形式储存。举例来说,RNA分子可以储存于试管(例如1.5ml微量离心管)中或培养盘(例如96孔、384孔或1536孔盘)的各孔中。
本发明因此包括供产生CRISPR***组分的文库和/或集合用的组合物和方法,以及CRISPR***组分的文库和/或集合本身。
本发明还包括用于分离gRNA分子的组合物和方法。此类方法往往基于gRNA区域与另一种核酸分子的杂交,随后将杂交复合物与存在于混合物中的其它分子(例如核酸分子)分离。
举例来说,含有序列与gRNA分子同源的核酸分子的珠粒可以用于从溶液中提纯gRNA。在一些情况下,珠粒是磁珠。另外,经设计可与gRNA分子杂交的核酸分子可以设计成与存在于gRNA分子中的序列同源,或gRNA分子可以设计成含有用于杂交的序列。本发明因此包括gRNA分子,所述gRNA分子设计成含有有效的杂交“标签”。
此类“标签”特别适用于高处理量应用。举例来说,96孔盘可以在各孔中含有不同的gRNA分子,其中每种gRNA分子含有相同标签。可以将磁珠放入盘的一或多个孔中且然后在指定的时间段之后除去,以允许gRNA/珠粒结合杂交发生。然后可以将这些珠粒在允许gRNA分子从珠粒中释放的条件(例如与一致或相似序列的寡核苷酸竞争标签)下个别地放入含有细胞和供体DNA的另一盘的各孔中。
如上文所提及,杂交标签可以自然地随gRNA分子一起驻留或可以引入gRNA分子中或添加到gRNA分子中。此类标签可以通过存在于gRNA分子中的区域的变异来添加,或可以添加到gRNA内部或末端。另外,标签可以在gRNA分子合成期间产生或在gRNA分子产生(例如通过“点击化学”)之后添加。
杂交标签典型地具有小于25(例如约10到约25、约15到约25、约16到约25、约10到约20、约15到约25、约15到约20等)个碱基的长度。此类标签典型地能够以足够亲和力与同源序列杂交结合,但是结合不会强到当期望时其不能有效释放的程度。另外,较短标签往往具有较高GC含量。在许多情况下,标签将具有至少45%(例如约45%到约75%、约50%到约75%、约55%到约75%、约60%到约75%、约65%到约75%等)的GC含量。
另外,标记的gRNA分子可以含有标记。可以利用这种标记来定量gRNA存在量。当欲测定通过基于杂交的方式所转移的gRNA的量时,标记也可以是适用的。此类标记还可以用于测量细胞吸收率,如本文中在别处所阐明。
CRISPR活性
本发明的CRISPR复合物可以具有任何数目种活性。举例来说,CRISPR蛋白质可以是包含一或多个异源蛋白质域(例如一、二、三、四、五个等)的融合蛋白。CRISPR融合蛋白可以包含任何其它蛋白质序列,和任选地存在于两个域之间的连接序列。可以与CRISPR蛋白质融合的蛋白质域的实例包括(但不限于)抗原决定基标签、报告基因序列,和具有以下活性中的一或多种的蛋白质域:甲基化酶活性、去甲基化酶活性、转录活化活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA裂解活性和核酸结合活性。
抗原决定基标签的非限制性实例包括组胺酸(His)标签、V5标签、FLAG标签、流感血球凝集素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括(但不限于)谷胱甘肽-S-转移酶(GST)、辣根过氧化酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP),和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。
CRISPR蛋白可以与编码结合DNA分子或结合其它细胞分子的蛋白质或蛋白质片段的基因序列融合,包括(但不限于)麦芽糖结合蛋白(MBP)、S-标签、Lex A DNA结合域(DBD)融合物、GALA DNA结合域融合物,和单纯性疱疹病毒(HSV)BP16蛋白融合物。US 2011/0059502中描述了可以形成融合蛋白的一部分的额外域,所述融合蛋白包含CRISPR蛋白,所述文献并入本文中供参考。
具体地说,本文中部分地提供CRISPR蛋白质核酸内切酶,其包含至少一种核定位信号、至少一种核酸酶域,和至少一种与向导RNA相互作用的结构域以使核酸内切酶靶向特异性核苷酸序列用于裂解。还提供编码CRISPR蛋白质核酸内切酶的核酸,以及使用CRISPR蛋白质核酸内切酶修饰真核细胞或胚的染色体序列的方法。CRISPR蛋白质核酸内切酶与特异性向导RNA发生相互作用,其中的每一者将核酸内切酶导向特定靶点,在靶点处,CRISPR蛋白质核酸内切酶引入可以通过DNA修复过程修复的双股断裂,从而修饰染色体序列。由于向导RNA(或crRNA)提供了特异性,所以CRISPR蛋白质核酸内切酶是通用的且可以与不同的向导RNA一起使用以靶向不同的基因组序列。本文中揭露的方法可以用于靶向且修饰特异性染色体序列且/或将外源序列引入细胞或胚基因组的靶向位置。
CRISPR复合物还可以用于活化或抑制转录。举例来说,dCas9转录活化因子融合蛋白(例如dCas9-VP64)可以配合向导RNA使用,以活化与目标基因座有关的核酸转录。类似地,dCas9抑制因子融合物(例如dCas9-KRAB转录抑制因子)可以用于抑制与目标基因座有关的核酸转录。如上文所提及的转录活化和抑制论述于例如Kearns等人,Cas9效应子介导调节人类多能干细胞的转录和分化(Cas9effector-mediated regulation oftranscription and differentiation in human pluripotent stem cells),《发育(Development)》,141:219-223(2014)。
本发明因此包括用于制备和使用供活化和抑制转录用的CRISPR***组分的组合物和方法。
CRISPR***
可以用于实施本发明的CRISPR***变化极大。这些***通常具有能够形成包含蛋白质和第一核酸的复合物的功能活性,其中复合物识别第二核酸。CRISPR***可以是I型、II型或III型***(参见表2)。适合CRISPR蛋白的非限制性实例包括Cas3、Cas4、Cas5、Cas5e(或CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9、Cas10、Casl Od、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(或CasA)、Cse2(或CasB)、Cse3(或CasE)、Cse4(或CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966。
在一些实施例中,CRISPR蛋白质(例如Cas9)来源于II型CRISPR***。在特定实施例中,CRISPR***经设计可充当寡核苷酸(例如DNA或RNA)引导的来源于Cas9蛋白质的核酸内切酶。用于本文中所阐明的这种和其它功能的Cas9蛋白质可以来源于酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌种(Streptococcus sp.)、达松维尔拟诺卡放线菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、产绿色链霉菌(Streptomycesviridochromogenes)、产绿色链霉菌、粉红链孢囊菌(Streptosporangium roseum)、酸热脂肪杆菌(AlicyclobacHlus acidocaldarius)、假蕈状芽孢杆菌(Bacilluspseudomycoides)、砷还原芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、戴白氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderiales bacterium)、萘沃喃极单胞菌(Polaromonas naphthalenivorans)、极单胞菌种(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌种(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻种(Synechococcussp.)、***糖醋杆菌(Acetohalobium arabaticum)、得津西氨热杆菌(Ammonifexdegensii)、贝茨热解纤维素菌(Caldicelulosiruptor)、金矿菌(CandidatusDesulforudis)、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridiumdifficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobiusthermophilus)、嗜热丙酸氧化型佩洛菌(Pelotomaculumthermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、氧化亚铁嗜酸硫杆菌(Acidithiobacillusferrooxidans)、酒色等着色菌(Allochromatium vinosum)、海杆菌种(Marinobactersp.)、嗜盐片球亚硝化球菌(Nitrosococcus halophilus)、瓦生氏亚硝化球菌(Nitrosococcus watsoni)、哈河豚毒素假交替单胞菌(Pseudoalteromonashaloplanktis)、具总状花纤线杆菌(Ktedonobacter racemifer)、爱维斯特甲烷盐菌(Methanohalobium evestigatum)、多变念珠藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻种(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻种(Arthrospira sp.)、螺旋藻种(Lyngbyasp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤藻种(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲高热杆菌(Thermosipho africanus),或深海藻青菌(Acaryochloris marina)。
图12A-12F绘示了Cas9氨基酸序列的比对。在许多情况下,本发明的组合物和方法涉及II型CRISPR***。在此类情况下,可以利用多种不同的Cas9蛋白质。Cas9蛋白质在一定程度上可以根据其序列同源区域界定。适用于本发明的组合物和方法中的蛋白质典型地包括具有与图12A-12F中所示的酿脓链球菌Cas9氨基酸序列一致的七个或更多个(例如约七到约十五个、约七到约十一个、约七到约十个、约七到约八个等)氨基酸的那些蛋白质。本文中在别处阐明了属于本发明范围内的CRISPR蛋白质的其它特征。
载体组分和细胞:
多种功能核酸组分(例如启动子、聚腺苷酸信号、复制起点、可选标记等)可以用于实施本发明。使用时,本发明实施中所用的功能核酸组分的选择将根据使用性质和***特殊性(例如细胞内、细胞外、活体外转录、成对的活体外转录/转译等)而大大变化。
启动子选择视多种因素而定,如所用细胞或***的表达产物和类型。举例来说,非mRNA分子往往使用RNA聚合酶I或III启动子产生。mRNA通常使用RNA聚合酶II启动子转录。然而存在例外。一种是微小RNA表达***,其中微小RNA可以使用RNA聚合酶II启动子(例如CMV启动子)从DNA转录。虽然RNA聚合酶II启动子不具有“尖锐”的中止和中止点,但微小RNA倾向于通过5'和3'末端的除去而被处理。从而除去末端的“额外”RNA区段。mRNA(例如cas9mRNA)通常通过RNA聚合酶II启动子产生。
特定启动子的选择根据具体应用而变。举例来说,活体外转录和活体外转录/转译***往往使用T7、T3和SP6启动子。期望细胞内表达时,所用的启动子通常将设计成在所用细胞内有效地发挥作用。举例来说,CMV启动子是用于哺乳动物细胞内的强启动子。杂交Hsp70A-Rbc S2启动子是一种在真核藻类(如莱茵衣藻(Chlamydomonas reinhardtii))中发挥良好功能的组成型启动子。(参见产品手册“衣藻属蛋白质表达试剂盒( Chlamydomonas Protein Expression Kit)”,目录号A24244,B.0版,购自生命技术公司(Life Technologies Corp.),Carlsbad,CA)。可以用于实施本发明的其它启动子包括AOX1、GAP、花椰菜花叶病毒35S、pGC1、EF1α和Hsp70启动子。
表达载体中的DNA区段可操作地连接到适当的表达控制序列(启动子)以引导RNA合成。适合的真核启动子包括CMV即刻早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、逆转录病毒LTR的启动子(如劳斯氏肉瘤病毒(Rous Sarcoma Virus,RSV)的启动子),和金属硫蛋白启动子,如小鼠金属硫蛋白-I启动子。适于本发明使用的示例性启动子来自III型RNA聚合酶III启动子类别。另外,启动子可以选自由U6和H1启动子组成的群组。U6和H1启动子均是III型RNA聚合酶III启动子类别的成员。
RNA聚合酶III启动子适用于通过本发明方法所产生的核酸分子的活体内转录。举例来说,如图9中所示所产生的线性DNA分子可以引入细胞中且通过例如天然驻留的细胞内转录过程转录。
本发明的组合物和方法中的启动子还可以具有诱导性,原因是可以“开启”或“关闭”表达。举例来说,使用U6启动子的四环素可调节***可以用于控制siRNA产生。表达载体可以或可以不含有供转译起始用的核糖体结合位点和转录终止子。载体还可以包括适用于增强表达的序列。
实施本发明时,可以利用多种克隆/表达***表达蛋白质和核酸分子。此类载体尤其包括染色体、游离体和病毒来源的载体,例如来源于以下的载体:质体、细菌噬菌体、转座子、酵母游离体、***元件、酵母染色体元件、病毒(如杆状病毒、乳多空病毒(如SV40)、牛痘病毒、腺病毒、腺相关病毒、禽痘(avipox)(例如禽痘(fowl pox))病毒、猪痘病毒、羊痘病毒、假性狂犬病病毒、小核糖核酸病毒和逆转录病毒);以及来源于其组合的载体,如来源于质体和细菌噬菌体基因元件的那些载体,如粘质粒和噬菌粒。表达***构筑体可以含有调节以及产生表达的控制区。一般来说,适于在宿主中维持、繁殖或表达聚核苷酸或表达多肽的任何***或载体可以用于就此而言的表达。可以通过多种众所周知的常规技术中的任一种将适当的DNA序列***表达***中,所述常规技术如以下文献中所述的技术:Sambrook等人,《分子克隆:实验室手册(MOLECULAR CLONING:A LABORATORY MANUAL),第2版,ColdSpring Harbour Laboratory Press,Cold Spring Harbour.N.Y.(1989)。
适用于本发明的细胞包括多种多样的原核和真核细胞。在许多情况下,细胞的一或多种CRISPR***组分天然地与细胞不相关(即,对于细胞来说是外源的)。
可以用于实施本发明的代表性细胞包括(但不限于)细菌细胞、酵母细胞、植物细胞和动物细胞。示例性细菌细胞包括埃希氏杆菌种细胞(具体地说,大肠杆菌细胞且最具体地说,大肠杆菌菌株DH10B、Stbl2、、DB3、DB3.1)、芽孢杆菌种细胞(具体地说,枯草杆菌(B.subtilis)和巨大芽孢杆菌(B.megaterium)细胞)、链霉菌种(Streptomyces spp.)细胞、欧文菌种(Erwinia spp.)细胞、克雷伯氏菌种(Klebsiella spp.)细胞、沙雷氏菌种(Serratia spp.)细胞(具体地说,粘质沙雷氏菌(S.marcessans))、假单胞菌种细胞(具体地说,绿脓杆菌(P.aeruginosa)细胞),和沙门氏菌种细胞(具体地说,鼠伤寒沙门氏菌(S.typhimurium)和伤寒沙门氏菌(S.typhi)细胞)。示例性动物细胞包括昆虫细胞(最具体地说,黑腹果蝇(Drosophila melanogaster)细胞、草地粘虫(Spodoptera frugiperda)Sf9和Sf21细胞以及粉夜蛾属(Trichoplusa)High5细胞)、线虫细胞(具体地说,秀丽隐杆线虫(C.elegans)细胞)、禽鸟细胞、两栖动物细胞(具体地说,爪蟾(Xenopus laevis)细胞)、象爬虫细胞,和哺乳动物细胞(更具体地说,NIH3T3、CHO、COS、VERO、BHK CHO-K1、BHK-21、HeLa、COS-7、HEK 293、HEK 293T、HT1080、PC12、MDCK、C2C12、Jurkat、NIH3T3、K-562、TF-1、P19和人类胚胎干细胞,如克隆H9(Wicell,Madison,Wis.,USA))。示例性酵母细胞包括酿酒酵母细胞和甲醇酵母(Pichia pastoris)细胞。这些和其它细胞可购自例如赛默飞世尔科技(Waltham,MA)、美国菌种保藏中心(American Type Culture Collection),以及农业研究菌种保藏中心(Agricultural Research Culture Collection,NRRL;Peoria,Illinois)。示例性植物细胞包括细胞,如来源于大麦、小麦、稻米、大豆、马铃薯、芥菜属和烟草(例如烟草SR1)的细胞。
将CRISPR***组分引入细胞中:
本发明还包括用于将CRISPR***组分引入细胞中的组合物和方法。将分子引入细胞中可以通过多种方法进行,包括许多标准实验室手册中所述的方法,如Davis等人,《分子生物学基本方法(BASIC METHODS IN MOLECULAR BIOLOGY)》(1986)和Sambrook等人,《分子克隆:实验室手册》第2版,Cold Spring Harbour Laboratory Press,Cold SpringHarbour.N.Y.(1989),如磷酸钙转染、DEAE-聚葡萄糖介导式转染、转染、微注射、阳离子脂质介导式转染、电穿孔、转导、刮擦加载、弹道式引入、核穿孔、流体动力学冲击和感染。
本发明包括通过不同方式将不同CRISPR***组分引入细胞中的方法以及用于执行此类方法的组合物。举例来说,可以使用慢病毒载体将编码Cas9的可操作地连接到适合的向导RNA的核酸引入,可以通过转染引入。
CRISPR***组分可以是功能CRISPR***分子或其可以是编码功能分子的分子(例如编码Cas9的DNA、RNA等),从而将CRISPR***组分转染到细胞中。本发明的方法涉及将以下中的一或多种引入细胞中:
a.向导RNA、
b.crRNA、
c.tracrRNA、
d.编码Cas9或dCas9(以及每一者的融合蛋白)的DNA,和
e.编码Cas9或dCas9(以及每一者的融合蛋白)的mRNA。
在大多数情况下,将CRISPR***组分以引起细胞内产生CRISPR活性的方式引入细胞中。因此,在细胞表达Cas9蛋白质(例如从编码经染色体整合的CRISPR的可操作地连接到启动子的核酸)的情况下,可以转染将crRNA和tracrRNA或向导引入细胞中。
适用于本发明的转染剂包括促进RNA、DNA和蛋白质引入细胞中的转染剂。示例性转染试剂包括TurboFect转染试剂(赛默飞世尔科技)、Pro-Ject试剂(赛默飞世尔科技)、TRANSPASSTM P蛋白质转染试剂(新英格兰生物实验室(New England Biolabs))、CHARIOTTM蛋白质递送试剂(Active Motif)、PROTEOJUICETM蛋白质转染试剂(EMD Millipore);293fectin、LIPOFECTAMINETM 2000、LIPOFECTAMINETM 3000(赛默飞世尔科技);LIPOFECTAMINETM(赛默飞世尔科技)、LIPOFECTINTM(赛默飞世尔科技);DMRIE-C、CELLFECTINTM(赛默飞世尔科技);OLIGOFECTAMINETM(赛默飞世尔科技)、LIPOFECTACETM、FUGENETM(瑞士巴塞尔罗氏(Roche,Basel,Switzerland))、FUGENETM HD(罗氏)、TRANSFECTAMTM(Transfectam,Promega,Madison,Wis.)、TFX-10TM(Promega)、TFX-20TM(Promega)、TFX-50TM(Promega)、TRANSFECTINTM(BioRad,Hercules,Calif.)、SILENTFECTTM(Bio-Rad)、EffecteneTM(Qiagen,Valencia,Calif.)、DC-chol(Avanti Polar Lipids)、GENEPORTERTM(基因治疗***(Gene Therapy Systems),San Diego,Calif.)、DHARMAFECT1TM(Dharmacon,Lafayette,Colo.)、DHARMAFECT 2TM(Dharmacon)、DHARMAFECT 3TM(Dharmacon)、DHARMAFECT 4TM(Dharmacon)、ESCORTTM III(Sigma,St.Louis,Mo.)和ESCORTTM IV(Sigma化学公司)。
本发明进一步包括其中将一种分子引入细胞中、随后将另一分子引入细胞中的方法。因此,可以在相同时间或不同时间将超过一种CRISPR***组分分子引入细胞中。举例来说,本发明包括如下方法:将Cas9引入细胞中,同时使细胞与设计成促进蛋白质引入细胞中的转染试剂(例如TurboFect转染试剂)接触,随后洗涤细胞且然后引入向导RNA,同时使细胞与LIPOFECTAMINETM 2000接触。
通常根据例如每种细胞类型、根据CRISPR***组分引入细胞中的期望水平来调整条件。虽然被强化的条件将变化,但是可以通过检测细胞内CRISPR***活性来测量增强。因此,本发明包括对CRISPR***组分细胞内引入细胞中进行测量的组合物和方法。
本发明还包括与形成CRISPR复合物以及CRISPR复合物引入细胞中有关的组合物和方法。本发明的一种示例性方法包含:
a.形成包含至少一种CRISPR***蛋白质和至少一种CRISPR RNA的复合物,
b.使CRISPR***蛋白质和RNA复合物与细胞接触,
c.将所得细胞培育或培养一段时间(例如约2分钟到约8小时、约10分钟到约8小时、约20分钟到约8小时、约30分钟到约8小时、约60分钟到约8小时、约20分钟到约6小时、约20分钟到约3小时、约20分钟到约2小时、约45分钟到约3小时等),以及
d.测量CRISPR***在细胞内的活性。
在一些情况下,在本发明方法实施期间,可以对引入细胞中的分子进行标记。这种标记的一个示意性实例阐明于图24,其中将经ALEXA647染料(赛默飞世尔科技)标记的供体DNA和GFP-Cas9 RNP复合物依序引入HEK293细胞中,随后进行细胞分选以获得含有两种标记(图24的右下方)的细胞。这种标记有利的原因是可以将含有特定量的两种标记的细胞与其它细胞分离以获得经历基因修饰(例如同源重组)的概率增强的细胞群。类似的工作流程阐明于图25中。
可以使标记连接到一或多种CRISPR***组分和/或其它分子(例如供体核酸分子)以便引入细胞中。在许多情况下,标记可通过目测或通过细胞分选仪器检测到。示例性标记包括青色荧光蛋白质(CFP)、绿色荧光蛋白质(GFP)、橙色荧光蛋白质(OFP)、红色荧光蛋白质(RFP)和黄色荧光蛋白质(YFP)。其它标记包括AMCA-6-dUTP、DEAC-dUTP、dUTP-ATTO-425、dUTP-XX-ATTO-488、荧光素-12-dUTP、若丹明-12-dUTP(Rhodamine-12-dUTP)、dUTP-XX-ATTO-532、dUTP-Cy3、dUTP-ATTO-550、dUTP-德克萨斯红(dCTP-Texas Red)、dUTP-J647、dUTP-Cy5、dUTP-ATTO-647N、dUTP-ATTO-655、荧光素-12-dCTP、若丹明-12-dCTP、dCTP-Cy3dCTP-ATTO-550、dCTP-德克萨斯红、dCTP-J647、dCTP-Cy5和dCTP-ATTO-647N,其获自多个来源,包括Jena Bioscience。
标记可以位于核酸分子和蛋白质的特定分子的一或两个末端和/或内部。
分选细胞时,可以利用多种分离参数。在大多数情况下,可以对分选进行设计以获得经历基因修饰的概率增强的细胞。举例来说,细胞可以如图24中所示用基因修饰所需的不同组分标记,,随后进行细胞分选以获得各组分的信号量特定的细胞。使用图24的示意图用于图解说明的目的,可以根据供体DNA分子数和存在于细胞内的GFP-Cas9RNP复合物的种数来选择细胞。这可以通过选择两种标记中的每一种的最小信号水平来进行,从而使那些细胞作为“阳性”细胞被分选。另一分选选项是相较于混合物中的所有细胞,将两种信号处于前3%、5%、8%、10%、15%、20%、25%等的细胞评为“阳性”细胞。假设两种标记被等量且独立地吸收,则根据两种标记对前25%的细胞评分预期可分选出初始群体的6.25%。这些可能是混合物中的经历基因修饰概率最高的细胞。
本发明因此包括获得细胞群的方法以及用于执行此类方法的组合物,其中所述细胞群中的细胞经历基因修饰的概率增强。在一些情况下,此类方法将涉及以下中的一或两种:(1)细胞选择(例如通过细胞分选法)已经吸收一或多种为基因修饰所必需的组分(例如一或多种CRISPR***组分和一或多种供体DNA分子)的细胞和(2)通过经设计可提高细胞吸收率的方法将基因修饰所必需的一或多种组分引入细胞中(例如如本文中阐明的序列组分引入)。
如本文中在别处所提及,在一些情况下,依序添加组分可以加以利用。如根据图26所示的数据所表明,依序递送CRISPR***组分和供体DNA使得基因修饰的效率水平通常高于共递送。虽然不希望被理论束缚,但是CRISPR***组分和非CRISPR复合物结合核酸分子的组合当共递送时可能出现吸收效率降低。
利用依序递送时,可以将多种组分依照多种次序引入细胞中。举例来说,首先可以将Cas9蛋白质、gRNA或Cas9 RNP引入细胞中,随后引入供体DNA。当然,也可以使用反向次序。另外,Cas9蛋白质可以在细胞内表达且gRNA和供体DNA可以共递送或按任何次序依序递送到细胞中。另外,gRNA可以在细胞内表达且Cas9蛋白质和供体DNA可以共递送或按任何次序依序递送到细胞中。在一些情况下,可以首先将gRNA引入细胞中,随后引入Cas9蛋白质,然后引入供体DNA。当然,也可以使用其它递送次序,只要基因修饰所需的所有组分不同时递送即可。
在一些情况下,本发明的方法包括:使细胞与线性DNA区段在允许线性DNA区段被细胞吸收的条件下接触(例如结合电穿孔、与转染试剂接触等),所述线性DNA区段在两个末端与目标基因座(例如供体DNA分子)具有序列同源性;随后使细胞与一或多种CRISPR***组分(例如Cas9 mRNA、向导RNA、Cas9 mRNA和向导RNA、Cas9蛋白质/向导RNA复合物等)在允许一或多种CRISPR***组分被细胞吸收的条件下接触。
在特定方面中,本发明包括包含下述步骤(a)、(b)和(c)的方法。另外,步骤(c)和步骤(a)可以依序交换。
步骤(a)涉及使细胞与线性DNA区段在允许线性DNA区段被细胞吸收的条件下接触,所述线性DNA区段在两个末端与目标基因座(例如供体DNA分子)具有序列同源性。这可以按任何数目种方式进行。举例来说,细胞可以在线性DNA区段存在下经受电穿孔或可以使用转染试剂。
步骤(b)涉及等待一段时间。这个时间段可以通过多种方法确定。
步骤(c)涉及使细胞与Cas9 RNP复合物在允许线性DNA区段被细胞吸收的条件下接触。
如图27和28所示,结合CRISPR***组分引入细胞中的核酸分子的量和特征可以加以调整以增强基因修饰。
图27中的数据表明,在特定的使用条件下,发生有效的同源重组,其中每10μl反应体积使用0.2μg和0.5μg供体DNA。细胞数目介于50,000到200,000之间。另外,在供体DNA含量低于和高于那些量的情况下,同源重组减少。本发明因此包括组合物和方法,其中供体DNA浓度是在0.01μg/10μl到500μg/10μl范围内(例如约0.01到约400、约0.01到约200、约0.01到约100、约0.01到约50、约0.01到约30、约0.01到约20、约0.01到约15、约0.01到约10、约0.1到约50、约0.1到约25、约0.1到约15、约0.1到约10、约0.1到约50、约0.1到约5、约0.1到约1、约0.1到约0.8μg/10μl等)。
图27中的数据表明,在特定的使用条件下,有效的同源重组随着某些化学修饰的长度、量和存在或不存在而变化。长度变异可能部分地归因于与所修饰的基因座同源的区域的尺寸。举例来说,长度约80个碱基的约单股供体核酸分子似乎足以发生有效的同源重组。在许多情况下,此类供体核分子典型地具有与被修饰的目标基因座同源的末端区域,其中中心区域含有用于***目标基因座的核酸或用于取代目标基因座的核酸的核酸。在许多情况下,末端同源区域的长度在30个与50个碱基之间(例如约30到约45、约35到约45、约40到约45、约40到约48个等),中间区域在1个与20个碱基之间(例如一、二、三、四、五、六、七个等)。另外,可以使用供体核酸分子,其含有经设计可与目标基因座的空间分隔区域杂交的同源区域。在许多情况下,这种空间间距小于约20个核苷酸。使用此类供体核酸分子的同源重组预期会引起目标基因座的核酸缺失。
本发明进一步包括用于***和校正单核苷酸多态性(SNP)的组合物和方法。在一些情况下,此类方法涉及结合CRISPR***组分使用末端区域与靶点具有同源性的单股供体核酸。当然,还可以使用双股供体核酸进行SNP***或校正。
图27中的数据表明,在所利用的使用条件下,同源重组效率随着供体核酸的末端化学修饰的存在或不存在而变化。在所用的被修饰的供体分子的两个末端使用硫代磷酸酯修饰,从而产生图27中的数据。虽然不希望被理论束缚,但是一种可能性是所用的末端化学修饰保护供体核酸免受核酸酶消化。
本发明因此包括含有具有化学修饰的供体核酸分子的组合物以及使用具有化学修饰的供体核酸分子的方法。在许多情况下,这些化学修饰使得含有其的核酸分子耐受一或多种核酸酶(例如核酸外切酶和/或核酸内切酶)。可以用于实施本发明的化学修饰包括以下:硫代磷酸酯基团、5'封端基团(例如5'二鸟苷帽)、3'封端基团、2'-氟核苷、2'-O-甲基-3'硫代磷酸酯,或2'-O-甲基-3'硫代PACE、反向dT、反向ddT和生物素。另外,可以将胺基磷酸酯C3间隔子并入寡核苷酸的内部或任一末端以引入亲水性长间隔子臂以便连接荧光团或其它基团且还可以用于抑制3'核酸外切酶的降解作用。
在一些情况下,位于供体DNA分子的一个或每个末端的末端碱基被化学修饰。在其它情况下,位于一个或每个末端的两个或三个末端碱基被化学修饰。在仍然其它情况下,内部碱基被化学修饰。在一些情况下,存在于供体核酸分子中的碱基总数的约1%到约50%(例如约1%到约45%、约1%到约40%、约1%到约35%、约1%到约25%、约1%到约15%、约5%到约50%、约10%到约50%、约15%到约50%、约15%到约35%等)被化学修饰。
图29绘示了使用一系列电穿孔条件所产生的数据。已发现一些细胞类型中的Cas9RNP吸收是稳定的(数据未示出),但是供体DNA吸收条件往往需要根据特定的细胞类型进行调整以便实现有效的吸收。另外,人们相信,在鉴别出针对特定细胞类型的有效吸收条件后,那些条件表明当使用不同的供体DNA分子时,变异程度较低。因此,当利用电穿孔时,用于调整达成有效基因修饰的条件的主要因素之一是将供体DNA引入所用特定细胞中的有效条件的选择。当使用大型供体DNA分子时,情况尤其如此。
可以使用多种组合物和方法形成CRISPR复合物。举例来说,可以如下将Cas9 mRNA和向导RNA囊封于INVIVOFECTAMINETM中,用于例如后续的活体内和活体外递送。将Cas9mRNA与向导RNA混合(例如浓度是0.6mg/ml)。所得mRNA/gRNA溶液可以原样使用或在添加稀释剂之后使用,且然后与等体积的INVIVOFECTAMINETM混合且在50℃培育30分钟。然后使用50kDa分子量截止值,将混合物在1X PBS pH7.4中透析2小时。将含有所调配的mRNA/gRNA的所得透析样品稀释到所要浓度且活体外直接施加于细胞上或注入尾静脉或腹膜内以便活体内递送。所调配的mRNA/gRNA是稳定的且可以在4℃下储存。
对于Cas9 mRNA转染细胞培养物(如293细胞)来说,将0.5μg mRNA添加到25μlOpti-MEM中,随后添加50-100ng gRNA。同时,将2μl LIPOFECTAMINETM 3000或RNAiMax在25μl Opti-MEM中稀释且然后与mRNA/gRNA样品混合。将混合物培育15分钟之后添加到细胞中。
CRISPR***活性可以包含报告体(例如绿色荧光蛋白、β-内酰胺酶、荧光素酶等)的表达或核酸裂解活性。使用核酸裂解活性用于说明的目的,可以从待测试CRISPR***活性的细胞中分离出全部核酸且然后分析已经在目标基因座切割的核酸的量。如果细胞是二倍体且两种等位基因均含有目标基因座,那么数据往往反映了每个细胞有两个切口位点。CRISPR***可以设计成切割单倍目标细胞基因组中的多个靶点(例如二、三、四、五个等)。此类方法可以用于有效地“扩大”CRISPR***组分增强引入细胞(例如特定细胞类型)中的数据。可以增强条件,以使得暴露于CRISPR***组分(例如以下中的一种或多种:Cas9蛋白质、Cas9 mRNA、crRNA、tracrRNA、向导RNA、Cas9/向导RNA复合物等)细胞中的全部目标基因座的大于50%裂解。在许多情况下,可以调整条件,使得全部目标基因座的大于60%(例如大于70%、大于80%、大于85%、大于90%、大于95%、约50%到约99%、约60%到约99%、约65%到约99%、约70%到约99%、约75%到约99%、约80%到约99%、约85%到约99%、约90%到约99%、约95%到约99%等)裂解。
可以改变任何数目种条件以增强CRISPR***组分引入细胞中。示例性培育条件是pH、离子强度、细胞类型、细胞的能量补充、存在的特定CRISPR***组分、CRISPR***组分(存在超过一种CRISPR***组分时)的比率、CRISPR***组分/细胞比率、细胞和CRISPR***组分的浓度、培育时间等。
可以改变的一种因素(特别是当形成CRISPR复合物时)是离子强度。离子强度是溶液中的总离子浓度。CRISPR复合物是由CRISPR蛋白质与CRISPR RNA结合而形成且这种结合部分地依赖于周围环境的离子强度。一种用于计算溶液离子强度的方法是依据Debye和Huckel公式。在许多情况下,实施本发明所用的溶液的离子强度是约0.001到约3(例如约0.001到约2、约0.001到约1.5、约0.001到约1、约0.001到约0.7、约0.001到约0.5、约0.001到约0.25、约0.001到约0.1、约0.01到约1、约0.01到约0.5、约0.01到约0.2、约0.01到约0.1等)。
pH是可以影响转染效率的另一种因素。典型地,复合和/或转染将在近似生理pH下发生(例如约6.5到约7.5的pH、约6.8到约7.5的pH、约6.9到约7.5的pH、6.5到约7.3的pH、约6.5到约7.1的pH、约6.8到约7.2的pH等)。在一些情况下,已知转染效率对pH的微小变化(例如=/-0.2个pH单位)敏感。
CRISPR***组分彼此间的比率以及与其它混合组分(例如细胞)的比率还影响了CRISPR***组分细胞更新的效率。使用Cas9蛋白质和向导RNA用于图解说明的目的,可以使Cas9蛋白质与向导RNA复合,随后与细胞接触,或同时进行细胞接触。在许多情况下,CRISPR蛋白质和CRISPR RNA组分是按设定的比率存在(例如1:1、1.5:1、2:1、2.5:1、3:1、1:1.5、1:2、1:2.5、1:3、约0.2:1到约4:1、约0.2:1到约3:1、约0.2:1到约2:1、约0.5:1到约6:1、约0.5:1到约4:1等)。Cas9蛋白质与向导RNA的一种适用比率是1:1,其中为了形成复合物,每个Cas9蛋白质有一个向导RNA分子搭配物可供其利用。
细胞吸收CRISPR复合物部分地是由CRISPR复合物的浓度以及细胞密度以及CRISPR复合物与细胞的比率决定。典型地,CRISPR复合物浓度高将使得可利用细胞的吸收量更高。示例性CRISPR复合物/细胞密度条件包括每个细胞107个CRISPR复合物。另外,每个细胞的CRISPR复合物可以是在每个细胞102到1012个复合物范围内(例如约102到约1011、约102到约1010、约102到约109、约102到约108、约102到约107、约102到约106、约103到约1012、约104到约1012、约105到约1012、约106到约1012、约107到约1012、约108到约1012、约103到约1010、约104到约1010、约105到约1011等)。另外,细胞密度典型地是约105个细胞/毫升。典型地,细胞密度将在102到108个细胞/毫升范围内(例如约102到约107、约102到约106、约102到约105、约102到约104、约103到约108、约103到约107、约104到约107等)。
本发明包括如下方法:调节CRISPR复合物/细胞密度和/或总细胞密度中的一或两者,使得当分析双股目标基因座切口时,目标基因座切口百分比在80%与99.9%之间(例如约80%到约99%、约85%到约99%、约90%到约99%、约95%到约99%、约96%到约99%、约80%到约95%、约90%到约97%等)。
可以使用的一组示例性条件是其中使约55个细胞与500ng的Cas9(约212个分子)与目标基因座特异性向导RNA复合物接触。
本发明还包括用于储存供细胞内基因修饰用的试剂的组合物和方法。图30、31和32绘示了在4℃下储存且冷冻的CRISPR复合物的三个月稳定性测试结果。图30中所示的数据是使用单独的gRNA和Cas9蛋白质产生。图31中所示的数据是使用gRNA、Cas9蛋白质和培养基产生。图32中所示的数据是使用Cas9蛋白质和RNAiMax转染试剂产生。在所有情况下,冷冻使功能活性高水平保持三个月。对Cas9蛋白质和培养基观察到类似结果。Cas9蛋白质和 RNAiMax转染试剂数据表明了功能活性在4℃下似乎相对快速地降低。
图30、31和32中所示的数据各自绘示了CRISPR***组分试剂在最少六个月期间是稳定的。这特别适用于高处理量应用。本发明因此包括含有CRISPR***组分的高处理量试剂。在一些实施例中,此类组分包含以下中的一或多种:一或多种gRNA、一或多种Cas9蛋白质、一或多种细胞培养基(例如一或多种哺乳动物细胞培养基)、一或多种转染试剂和一或多种供体核酸分子。
出于说明的目的,本发明包括多孔盘,以及使用此类培养盘的高处理量方法,其中不同的孔含有Cas9蛋白质和转染试剂。另外,不同的孔含有不同的gRNA分子。此类培养盘可以用于高处理量方法中以便改变细胞内的多个基因位点。每个孔可以进一步含有例如供体DNA,其末端与gRNA引导裂解位点同源以便使细胞内的不同基因座变异。
本发明还包括当储存指定的时间段时保持稳定的CRISPR***试剂。出于说明的目的,本发明提供了CRISPR***试剂,其在-20℃下储存3个月之后,保持其初始CRISPR相关活性的至少75%(例如约75%到约100%、约80%到约100%、约85%到约100%、约90%到约100%、约95%到约100%、约75%到约90%、约80%到约90%等)。当然,CRISPR***试剂可以在不同温度(例如4℃、-20℃、-70℃、约4℃到约-70℃、约-20℃到约-70℃等)下储存。另外,本发明还包括CRISPR***试剂和用于储存此类试剂的方法,其中在长达1年(例如约1个月到约12个月、约2个月到约12个月、约3个月到约12个月、约4个月到约12个月、约5个月到约12个月、约1个月到约9个月、约3个月到约9个月、约2个月到约6个月等)之后,保持其初始CRISPR相关活性的的至少75%。
在一些情况下,CRISPR复合物在储存期间可能不稳定,特别是在某些条件下。举例来说,在一些条件下,Cas9、gRNA和转染试剂在一组条件下可能是稳定的,但在另一组条件下可能是不稳定的。已经测定在一些条件下(例如在某些缓冲液配方中),Cas9、gRNA和转染试剂混合物在冷冻后不稳定,但是在4℃下储存后是稳定的。本发明因此包括在一组储存条件下稳定、但在另一组储存条件下不稳定的组合物。
图30、31和32中所示的数据是使用特定条件产生。RNA于水中制备,但是可以使用EDTA(例如0.1mM)和/或乙酸钠缓冲液。Cas9蛋白质于15mM Tris HCl、250mM NaCl、0.6mMTCEP、50%甘油(pH 8)中制备。
储存数据是使用多壁培养盘的孔中所含的试剂混合物产生。Cas9以每孔500ng(0.5μl的0.5μg/μl储备溶液)的量存在于孔中且gRNA以每孔200ng(0.7μl的300ng/μl储备溶液)的量存在。所有试剂均以4X溶液储存。Cas9/gRNA样品以每个孔1.2μl等分试样放置在储存条件下。Cas9/gRNA/样品以每个孔20μl等分试样放置在储存条件下,其中每个孔中存在18.8μlCas9/样品是以每个孔10μl等分试样放置在储存条件下,其中每个孔中存在9.5μlCas9/RNAiMax样品是以每个孔6.5μl等分试样放置在储存条件下,其中每个孔中存在6μl RNAiMax转染试剂。
储存之后,然后将上述试剂与其它试剂和细胞组合之后用于裂解分析中。图30中所示的数据是通过合并1.2μl Cas9蛋白质和gRNA与18.8μl(在室温下培育5分钟)来产生。还将6μl RNAiMax与14μl(在室温下培育5分钟)混合。然后将这两种混合物合并且在室温下培育5分钟,然后与细胞接触。将Cas9/gRNA/样品(图31)与6μl RNAiMax和14μl(已经在室温下培育5分钟)合并。然后将这两种混合物合并且在室温下培育5分钟,然后与细胞接触。将Cas9/样品与0.7μl gRNA和9.3μl(在室温下培育5分钟)和6μl RNAiMax和14μl(在室温下培育5分钟)混合,然后在室温下培育5分钟之后,与细胞接触。将Cas9/ RNAiMax样品(图32)与0.7μl gRNA和32.8μl(在室温下培育5分钟)混合,然后与细胞接触。
为了转染,在转染前一天,将293FT细胞以每孔20,000个细胞接种于96孔盘形式中,在转染当天得到约50%到60%的细胞汇合。接种时,每个孔具有100μl细胞培养基(DMEM、10%FBS,以及各5%的丙酮酸钠、非必需氨基酸和GlutaMAXTM)。转染时,将10μl最终转染混合物(含有Cas9、gRNA、 RNAiMAX和)添加到96孔形式的每个孔中。在37℃下培育72小时之后,收获细胞以便使用GENEARTTM裂解检测分析测量相应目标基因座(在这种情况下,为HPRT基因目标)的裂解效率%。
在一个方面中,本发明涉及与即用试剂有关的组合物和方法。即用试剂可以呈任何数目种形式。举例来说,即用试剂可以含有一或多种Cas9蛋白质、一或多种gRNA、一或多种转染试剂和一或多种细胞培养基。特定实例是含有Cas9蛋白质、两种gRNA和 RNAiMax(都是2倍浓度)和培养基(1倍浓度)的试剂。这种类型的即用试剂可以与培养基中所含的细胞1:1混合以产生用于将两种gRNA引入细胞中的转染反应混合物,其中gRNA与细胞基因组中的两个位置共有序列同源性。适当时,细胞可以同时或随后与一或多种用于***基因组切口位点的核酸分子接触。
即用试剂的另一实例包括一或多种Cas9蛋白质、一或多种gRNA和一或多种细胞培养基的组合。特定实例是含有Cas9蛋白质和两种gRNA(2倍浓度)和培养基(1倍浓度)的试剂。这种类型的即用试剂可以首先与 RNAiMax混合且然后与培养基中所含的细胞1:1混合以产生转染反应混合物以便将两种gRNA引入细胞中。
即用试剂(如上述试剂)在使用之前可以在4℃下储存一段时间。如本文中在别处所提及,在一些条件下,Cas9、gRNA和转染试剂混合物在冷冻后不稳定,但是在4℃下储存后是稳定的。
即用试剂可以在优选的储存条件下标记且有效日期设计成反映活性发生所指定的降低(例如小于活性的80%)。举例来说,有效日期的范围可以是约两周到约一年(例如约。两周到约十月、约两周到约八个月、约两周到约六个月、约两周到约四个月、约一个月到约一年、约一个月到约十个月、约一个月到约六个月、约一个月到约四个月、约三个月到约一年、约三个月到约八个月等)。
还已经发现,在一些情况下,较高浓度的CRISPR***组分在储存时的稳定性较高。因此,在一些方面中,本发明包括含有大于50ng/μl(例如约50ng/μl到约500ng/μl、约100ng/μl到约500ng/μl、约150ng/μl到约500ng/μl、约200ng/μl到约500ng/μl、约250ng/μl到约500ng/μl、约300ng/μl到约500ng/μl、约400ng/μl到约500ng/μl等)gRNA的试剂。在许多情况下,Cas9蛋白质(当存在时)的摩尔量相对于gRNA的范围是约5:1到约1:5(例如约5:1到约1:4、约5:1到约1:3、约5:1到约1:2、约5:1到约1:1、约5:1到约1:1、约4:1到约1:5、约5:1到约1:5、约2:1到约1:5、约1:2到约1:5、约4:1到约1:4、约3:1到约1:3、约2:1到约1:2等)。
试剂盒:
本发明还提供试剂盒,其部分地用于组装和/或储存核酸分子以及用于剪辑细胞基因组。作为这些试剂盒的一部分,提供了组装核酸分子和制备反应混合物的材料和说明书用于试剂盒组分的储存和使用。
本发明的试剂盒往往含有以下组分中的一或多种:
1.一或多种核酸分子(例如一或多种引物、一或多种编码Cas9、dCas9、向导RNA等的DNA分子、一或多种编码CRISPR***组分(如Cas9、dCas9等)的mRNA),
2.一或多种聚合酶,
3.一或多种蛋白质(例如一或多种CRISPR蛋白质,如Cas9、dCas9等),
4.一或多种部分载体(例如一或多种含有复制起点和/或可选标记的核酸区段)或完整载体,以及
5.如何使用试剂盒组分的说明书。
具体地说,本发明的一些试剂盒可以包括以下中的一或多种:(a)编码向导RNA分子的3'端的双股核酸分子(参见图8),其中这种双股核酸分子不编码杂交区域1的全部或一部分;(b)聚合酶;和(c)至少一种缓冲液。
在一些实施例中,试剂盒可以包含一或多种试剂,其在使用本文所论述的一或多种CRISPR***组分的方法中使用,或用于制备本文所论述的一或多种CRISPR***组分。
试剂盒试剂可以提供于任何适合容器中。试剂盒可以提供例如一或多种反应或储存缓冲液。试剂可以能用于特定反应的形式提供,或以使用之前需要添加一或多种其它组分的形式(例如浓缩物或冻干形式)提供。缓冲液可以是任何缓冲液,包括(但不限于)碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液以及其组合。在一些实施例中,缓冲液呈碱性。在一些实施例中,缓冲液具有约7到约10的pH。
实例
实例1:一步合成gRNA模板和高效率细胞工程工作流程
概要
CRISPR-Cas9***提供了创新的基因组工程应用。为了剪辑基因组,需要Cas9、成熟crRNA和tracrRNA或单一向导RNA(gRNA)的表达。通常将成熟crRNA和tracrRNA或gRNA的元件构建成Cas9表达质体或构筑成通过U6启动子驱动的标准质体用于哺乳动物表达。这个实例中描述了一种快速合成gRNA模板的新颖方法,这种方法是基因合成和DNA片段组装技术的组合,组装精确度>96%。换句话说,组装成的核酸分子中逾96%是所期望的组装产物。所述方法允许使用短DNA寡核苷酸、通过活体外转录快速合成向导RNA(gRNA)。结合Cas9蛋白质递送,可以通过诸如脂质介导方法、电穿孔和细胞渗透肽介导递送等方法将Cas9/gRNA复合物转染到细胞中。总体而言,可以将细胞工程工作流程缩短到至少四天且在一些情况下缩短到两天。本文所述的方法适用于高处理量gRNA合成和全基因组剪辑。
介绍
CRISPR-Cas9介导式基因组工程能够使研究人员直接且有效地活体内修饰基因组DNA。三种组分(Cas9、成熟crRNA和tracrRNA)是有效细胞工程必不可少的。虽然可以用化学方式合成成熟crRNA和tracrRNA,但是合成RNA的品质由于例如截断型副产物的存在而通常不足以用于细胞工程。因此,成熟crRNA和tracrRNA或组合的单一gRNA通常是由Cas9表达质体转录或构建成由U6启动子驱动的单独质体。然后将所得质体或共转染到细胞中。由于构筑体相对较大,因此质体DNA的递送往往变成限制步骤,特别是对于悬浮细胞来说。最近,已经利用Cas9 mRNA提高DNA裂解速率。为了制备gRNA,基于例如图17或图18中所示的载体的克隆前一体化质体可以充当模板来制备含有T7启动子的gRNA PCR片段,随后进行凝胶提取。或者,可以使用合成DNA串作为模板。
总体而言,制备供活体外转录用的gRNA模板是耗时的。gRNA模板可以通过PCR、在约一小时内组装而成。另外,可以在约3小时内通过活体外转录来产生gRNA。可以在约4小时内将DNA寡核苷酸转化成gRNA。对于使用上述时序元件的工作流程进行测试。另外,细胞工程循环与Cas9蛋白质转染技术的组合如本文所述在四天内实现。
材料和方法
材料
293FT细胞、DMEM培养基、胎牛血清(FBS)、培养基、3000、RNAIMAXTM、MESSENGERMAXTM、具有OFP报告体的 CRISPR核酸酶载体、2% EX琼脂糖凝胶、 PCR微型试剂盒、TranscriptAid T7高产量转录试剂盒、MEGASHORTSCRIPTTM T7转录试剂盒、MEGACLEARTM转录净化试剂盒、ZERO PCR克隆试剂盒、 Pro Quick96质体提纯试剂盒、RNA BR分析试剂盒、蛋白质分析试剂盒、Pierce LAL显色内毒素定量试剂盒、基因组裂解检测试剂盒,和肝素柱得自赛默飞世尔科技。高保真度DNA聚合酶购自新英格兰生物实验室。HIPREPTM 16/60Sephacryl S-300HR凝胶过滤柱购自通用电气医疗集团(GE Healthcare)。gRNA合成所用的所有DNA寡核苷酸均得自赛默飞世尔科技。
方法
一步合成gRNA模板
供合成gRNA模板用的寡核苷酸的设计描绘于图13中。使用正向引物:
5'-GTT TTA GAG CTA GAA ATA GCA AG-3'(SEQ ID NO:13)和反向引物:
5'-AAA AGC ACC GAC TCG GTG CCA C-3'(SEQ ID NO:14),利用CRISPR核酸酶载体扩增tracrRNA的80bp恒定区,随后使用琼脂糖凝胶提取法来提纯。PCR产物浓度是通过Nanodrop(赛默飞世尔科技)测量且基于24.8kd的分子量来计算摩尔浓度。为了制备寡核苷酸池,将80bp PCR产物的等分试样与两种末端引物5'-taatacgactcactatagg-3'(SEQ ID NO:15)和5'-AAA AGC ACC GAC TCG GTG CCA C-3'(SEQID NO:14)混合,80bp PCR产物的最终浓度是0.3μM且各种末端引物的最终浓度是10μM。对于特定目标来说,用化学方式合成具有15bp重叠的由19bp T7启动子序列taatacgactcactatagg(SEQ ID NO:15)和15bp 5'端目标序列组成的34bp正向引物以及由20bp目标序列和14bp 5'端tracrRNA序列gttttagagctaga(SEQ ID NO:16)组成的34bp反向引物。制备最终浓度为0.3μM的含有两种34bp寡核苷酸的工作溶液。或者,合成具有20bp重叠的一对39bp正向和反向引物且进行测试。为了配置gRNA模板的一步合成,将1.5μl混合寡核苷酸和1.5μl工作溶液添加到PCR试管中,所述PCR试管含有10μl 5x Phusion HF缓冲液、1μl 10mM dNTP、35.5μl H2O和0.5μl高保真度DNA聚合酶。PCR程序设定为98℃历时30秒且然后为30个循环的98℃历时5秒和55℃历时数秒,随后在72℃培育30秒且始终保持在4℃。PCR产物通过2% EX琼脂糖凝胶进行分析,随后使用Purelink PCR微柱进行提纯。通过Nanodrop仪器测定DNA浓度。
为了测定错误率,将PCR产物克隆到ZERO载体中,随后进行质体DNA分离和定序。
活体外转录
gRNA模板的活体外转录是使用TRANSCRIPTAIDTM T7高产量转录试剂盒进行。简言之,将6μl gRNA模板(250-500ng)添加到含有8μl NTP、4μl 5倍反应缓冲液和2μl T7酶混合物的反应混合物中。反应在37℃进行2小时,随后与脱氧核糖核酸酶I(2个单位/120ng DNA模板)一起培育15分钟。使用MEGACLEARTM转录净化试剂盒,如手册中所述提纯gRNA产物。使用 RNA BR分析试剂盒测定RNA浓度。
Cas9蛋白质的表达和提纯
将甘油储备的表达NLS Cas9蛋白质的BL21(DE3)star大肠杆菌菌株接种于20mlBRM培养基中且在振荡培育箱中、在37℃生长过夜。然后将过夜培养物添加到1升BRM培养基中且使细胞在振荡培育箱中、在37℃生长到0.6-0.8的OD600nm(约4-5小时)。获取未诱导样品的等分试样以便监测使用IPTG的蛋白质诱导。将0.5ml 1M IPTG添加到培养物中且在室温下、在振荡培育箱中培育过夜。通过SDS-PAGE分析被诱导样品以及未诱导样品的等分试样。验证蛋白质诱导后,将培养基以5000rpm离心15分钟,以收获细胞离心块(约24克湿重)。使用100ml含有20mM Tris(pH7.5)、100mM NaCl、10%甘油和1mM PMSF的缓冲液A使细胞离心块再悬浮。将细胞悬浮液在冰上进行声波处理,其中中端的功率水平设定为8,10秒“开启”且20秒“关闭”。细胞裂解物通过16500rpm离心澄清30分钟。上清液通过0.2μm过滤装置过滤之后,以2ml/min的流速装载到预先经缓冲液A平衡的16ml肝素柱中。所述柱首先用五个柱体积的缓冲液A洗涤且然后逐渐增加到含有20mM Tris(pH7.5)、1.2M NaCl和10%甘油的40%缓冲液B。Cas9蛋白质用5CV梯度40%到100%缓冲液B洗提。通过SDS-PAGE分析洗脱份。将含有Cas9蛋白质的洗脱份合并且使用两个15ml Amicon离心过滤单元(EMDMillipore,目录号UFC905024)过滤。被浓缩的蛋白质通过0.2μm过滤装置过滤且分两次装载到预先经含有20mM Tris(pH 8)、250mM KCl和10%甘油的缓冲液C平衡的120ml HIPREPTM16/60Sephacryl S-300HR柱中。将含有Cas9蛋白质的洗脱份混合且浓缩。通过蛋白质分析试剂盒测定蛋白质浓度。被提纯的蛋白质中的内毒素含量通过内毒素定量试剂盒测量。被浓缩的蛋白质用50%甘油调节且在-20℃储存。
细胞培养
使293FT细胞在补充有10%FBS的DMEM培养基中、在5%CO2培育箱中维持。转染前一天,将细胞以2.5x105个细胞/0.5ml培养基的细胞密度接种于24孔盘中。为了转染,将500ng被提纯的Cas9添加到25μl培养基中,随后添加120ng gRNA。通过轻缓地轻敲试管几次来混合样品且然后在室温下培育10分钟。向单独的试管中,向25μl培养基中添加3μl RNAIMAXTM。将被稀释的转染试剂转移到含有Cas9蛋白质/gRNA复合物的试管中,随后在室温下培育15分钟。然后将完整溶液添加到24孔中的细胞中且通过将盘轻缓地涡旋几次来混合。将培养盘在5%CO2培育箱中、在37℃下培育48小时。基因组剪辑百分比是通过基因组裂解检测试剂盒测量。
结果和论述
一步合成gRNA模板
由于gRNA合成是基因组工程中的限制步骤之一,因此努力缩短gRNA合成时间。举例来,选择HPRT-T1目标catttctcagtcctaaaca(SEQ ID NO:17),但是也发现这些方法对GFP和VEGFA-T3目标有用(数据未示出)。首先,使用基因合成方法,使用一组6种合成DNA寡核苷酸(表8中的第1组寡核苷酸)组装gRNA模板。通过优化寡核苷酸池浓度和PCR条件,在琼脂糖凝胶上获得纯净的PCR产物(数据未示出)。PCR产物的等分试样充当模板通过活体外转录合成gRNA。通过变性凝胶分析合成gRNA的品质。
为了测试合成gRNA的功能,使gRNA与Cas9蛋白质结合。所得复合物然后通过基于脂质的转染法递送到293FT细胞中。然而,活体内基因组裂解分析的评价表明gRNA未充分发挥作用(数据未示出)。为了确定问题,将gRNA模板克隆到ZERO TOPO载体中且然后定序。如图15中所示,注意到超过20%的gRNA模板含有突变,主要是缺失。为了使潜在的错误来源最小化,由序列经验证的质体模板(而非使用合成的长寡核苷酸产生完整T7启动子/向导RNA模板)扩增80bp tracrRNA恒定区,随后进行凝胶提纯以除去模板。然后为了使T7启动子序列和目标序列与恒定tracrRNA融合,设计一对34bp或39bp正向和反向寡核苷酸,其跨越可变目标序列分别共享15bp或20bp同源性,其中中间寡核苷酸2也与tracrRNA区域共享19个碱基的同源性(图13)。
如材料和方法中所述,使用DNA寡核苷酸池和tracrRNA片段,通过单一PCR反应来组装gRNA模板(图13)。进行PCR微柱提纯后,使用gRNA模板,通过活体外转录来制备gRNA。使用TBE-尿素变性凝胶来检查gRNA品质。由一体化质体通过PCR扩增而制备的gRNA用作阳性对照。“一体化质体”是含有CRISPR***的所有组分(如向导RNA和Cas9编码序列)的质体。本文实验中所用的两种相似一体化质体的载体图谱示于图17和图18中。
为了检查合成gRNA的活体内功能,对来自大肠杆菌的Cas9蛋白质进行表达和提纯。将Cas9蛋白质与合成gRNA一起预培育以形成复合物,随后进行细胞转染。由一体化质体制备的gRNA充当阳性对照。通过基因组裂解和检测分析来检查基因组修饰。如图14的凝胶影像B中所描绘,新合成gRNA的***缺失百分比类似于阳性对照。为了测定gRNA模板中的错误率,还进行定序分析。如图15中所描绘,约7%的gRNA模板含有突变,大部分缺失发生于3'端和5'端。使用较长的39bp寡核苷酸时,检测到目标区域内存在一个突变。使用经PAGE提纯的末端引物(各约20bp)将错误率进一步降低到3.6%且目标区域中未检测到突变,这类似于2%错误率的由一体化质体制备的对照gRNA。这些结果表明gRNA的品质对于我们的大多数应用来说是充分足够的。
由于80bp tracrRNA含有位于3'端的polyT,因此Poly T对基因组剪辑可能没有影响。为了对此进行测试,在gRNA(表8中的第3组寡核苷酸)的3'端产生PolyT的连续缺失。基于活体内基因组裂解分析,除去gRNA的3'端的PolyT对于gRNA的性能似乎没有影响。在3'端添加三个额外的Ts也不影响gRNA的功能(数据未示出)。
标准T7启动子序列“taatacgactcactataggg”(SEQ ID NO:18)含有位于3'端的GGG,其被认为是通过活体外转录来最大化产生gRNA所必需的。然而,由于转录始于第一个G,因此将三个额外的G添加到gRNA序列中(假设目标在5'端不具有G,这可能会影响gRNA功能)。为了对此进行检查,选择AAVS目标ccagtagccagccccgtcc(SEQ ID NO:19)和IP3R2目标tcgtgtccctgtacgcgga(SEQ ID NO:20)且在T7启动子的3'端产生G缺失(参见图16和表7)。添加G(特别是成行添加3个G)明显地降低了gRNA活性。即使活体外转录反应中均产生相似量的gRNA,但是添加1个G展现的裂解效率稍微优于添加2个G。然而,在无任何G的情况下,活体外转录反应的产量显著降低。
总之,本文所提供的与gRNA合成有关的组合物和方法以及相关工作流程允许细胞工程历时四天。第1天,生物学家(1)设计且(2)合成或定购短DNA寡核苷酸且接种所关注的细胞。第2天,生物学家通过一锅式PCR制备gRNA模板,随后进行活体外转录以便制备gRNA。gRNA与被提纯的Cas9蛋白质结合后,通过脂质介导的方法或电穿孔将Cas9蛋白质/gRNA复合物转染到细胞中。第4天,生物学家收获细胞以分析基因组修饰。因此,本发明提供与改进基因组工程工作流程有关的组合物和方法。在一些方面中,这些工作流程允许基因组修饰实验从构思到完成历时四天。
实例2:通过Cas9蛋白质转染进行的快速且高效率的哺乳动物细胞工程
概要
CRISPR-Cas9***提供了一种高效率基因组剪辑平台,其使得哺乳动物细胞工程实现了创新的应用。然而,Cas9的递送和向导RNA(gRNA)的合成仍然是可以限制总体效率和一般易用性的步骤。本文描述了快速合成gRNA以及通过脂质体介导式转染或电穿孔将Cas9蛋白质/gRNA核糖核蛋白复合物(Cas9 RNP)递送到多种哺乳动物细胞中的方法。据报道,使用这些方法,核酸酶介导单一目标发生的***缺失率在Jurkat T细胞中高达94%且在诱导多能干细胞(iPSC)中是87%。当此方法用于Jurkat细胞中的多基因目标时,发现所得分离细胞系中分别有约93%和65%实现了双基因座和三基因座***缺失。另外,在这项研究中,发现相较于质体DNA转染,使用Cas9蛋白质明显降低了脱靶裂解速率。综合而言,所呈现的流线型细胞工程工作流程使得所剪辑细胞的gRNA设计到分析能够在少到四天内完成且从而在很难转染的细胞中产生高效率的基因组调节作用。试剂制备和递送到细胞中不需要质体操作,且因此能经受住高处理量、多工化全基因组细胞工程改造。
介绍
CRISPR-Cas9介导式基因组工程使研究人员能够直接且有效地修饰活体内基因组DNA(Cho等人,“使用Cas9RNA引导式核酸内切酶对人类细胞进行的靶向基因组工程(Targeted genome engineering in human cells with the Cas9RNA-guidedendonuclease)”,《自然生物技术》31:230-232(2013);Mali等人,“通过Cas9进行的RNA引导式人类基因组工程(RNA-guided human genome engineering via Cas9)”,《科学》339:823-826(2013);Jiang等人,“使用CRISPR-Cas***对细菌基因组进行的RNA引导式剪辑(RNA-guided editing of bacterial genomes using CRISPR-Cas systems)”,《自然生物技术》31:233-239(2013);Wang等人,“通过CRISPR/Cas介导式基因组工程一步产生在多个基因中携有突变的小鼠(One-step generation of mice carrying mutations inmultiple genes by CRISPR/Cas-mediated genome engineering)”《细胞(Cell)》153:910-918(2013))。三种组分(Cas9、成熟crRNA和tracrRNA)是功能活性必不可少的。虽然可以用化学方式合成成熟crRNA和tracrRNA,但是合成RNA的品质由于截断型副产物的存在(数据未示出)而不足以用于活体内细胞工程。因此,通常将成熟crRNA和tracrRNA或组合的单一gRNA的模板克隆到Cas9表达质体中或构建成由U6或H1启动子驱动的单独质体以便在转染哺乳动物细胞之后进行转录。由于构筑体相对较大,因此可以降低递送速率,这会限制基因组裂解效率,特别是很难转染的细胞。最近,使用以mRNA形式递送的Cas9已经使一些细胞中的基因组裂解速率提高。举例来说,将Cas9 mRNA和单一物种的gRNA的混合物共注入小鼠胚胎干(ES)细胞中,导致在95%的初生小鼠中产生双等位基因突变(Wang等人,“通过CRISPR/Cas介导式基因组工程一步产生在多个基因中携有突变的小鼠(One-stepgeneration of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering)”《细胞》153:910-918(2013))。为了制备向导RNA,通常直接使用预克隆质体或通过PCR扩增来自质体的目标序列来产生线性模板。如果质体中未出现5'T7启动子,那么其通常在此步骤添加且所得PCR产物可以用于活体外转录反应。或者,可以使用含有T7启动子、crRNA和tracerRNA的合成DNA片段作为模板、通过活体外转录来制备gRNA。总体上,这些代表了劳动力密集型且耗时的工作流程,使得我们去寻求一种合成高品质gRNA的更简单方法。为此,本文描述了一种用于活体外产生gRNA的流线型模块化方法。从两种短的单股寡核苷酸开始,通过‘一锅式’PCR反应组装gRNA模板。产物然后作为模板用于活体外转录(IVT)反应中,随后进行快速提纯步骤,从而在少到四个小时内产生即用于转染的gRNA。
为了使细胞工程工作流程进一步流线化,通过将Cas9/gRNA核糖核蛋白(RNP)复合物直接引入细胞中来设法排除任何残余的细胞转录或转译。将Cas9蛋白质和gRNA复合物微注入秀丽隐杆线虫(C.elegans)中首先描述于2013(Cho等人,“通过直接注射Cas9-sgRNA核糖核蛋白来剔除秀丽隐杆线虫中的可遗传基因(Heritable gene knockout inCaenorhabditis elegans by direct injection of Cas9-sgRNA ribonucleoproteins)”《遗传学(Genetics)》195:1177-1180(2013))中且随后用于产生基因剔除小鼠和斑马鱼,其中初生小鼠的突变率高达93%(Sung等人,“使用RNA引导式核酸内切酶对小鼠和斑马鱼的基因进行高度有效的剔除(Highly efficient gene knockout in mice and zebrafishwith RNA-guided endonucleases)”《基因组研究(Genome Res.)》24:125-131(2014))。根据那个报告,通过电穿孔、以高效率和相对较低的脱靶效应将Cas9蛋白质/gRNA复合物递送到所培养的人类纤维母细胞和诱导多能干细胞(iPSC)(Kim等人,“通过递送被提纯的Cas9核糖核蛋白而在人类细胞中进行高度有效的RNA引导式基因组剪辑(Highly efficientRNA-guided genome editing in human cells via delivery of purifiedCas9ribonucleoproteins)”《基因组研究(Genome Res.)》24:1012-1019(2014))。在那项研究中,有效的基因组修饰(高达79%***缺失效率)需要大量的Cas9蛋白质(4.5μg到45μg)和gRNA(6μg到60μg)。最近报道了通过脂质体递送与Cas9蛋白质结合的gRNA复合物,其中使用RNAiMAX将Cas9:sgRNA核酸酶复合物活体内递送到所培养的人类细胞和小鼠内耳中,基因组修饰效率分别为高达80%和20%(Zuris等人,“阳离子脂质介导式递送蛋白质能够在活体外和活体内实现有效的基于蛋白质的基因组剪辑(ationic lipid-mediateddelivery of proteins enables efficient protein-based genome editing in vitroand in vivo)”《自然生物技术》10月30日.doi:10.1038/nbt.3081(2014))。
CRISPR/Cas***已经证明是多工化基因组剪辑的有效基因靶向工具(Wang等人,“通过CRISPR/Cas介导式基因组工程一步产生在多个基因中携有突变的小鼠(One-stepgeneration of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering)”《细胞》153:910-918(2013);Kabadi等人,“利用单一慢病毒载体进行的基于CRISPR/Cas9的多工基因组工程(Multiplex CRISPR/Cas9-basedgenome engineering from a single lentiviral vector)”《核酸研究(Nucleic AcidsRes.)》10月29日;42(19):e147.doi:10.1093/nar/gku749(2014);Sakuma等人,“使用一体化CRISPR/Cas9载体***在人类细胞中进行的多工基因组工程(Multiplex genomeengineering in human cells using all-in-one CRISPR/Cas9 vector system)”《科学报告(Sci Rep.)》6月23日;4:5400.doi:10.1038/srep05400(2014);Cong等人,“使用CRISPR/Cas***进行的多工基因组工程(Multiplex genome engineering using CRISPR/Cas systems)”《科学》339:819-823(2013))。举例来说,基于限制性片段长度多形性(RFLP)分析,使用表达Cas9的构筑体和靶向Tet1、2和3的三种sgRNA共转染小鼠ES细胞导致20%的细胞在三种基因的所有六个等位基因中具有突变(Wang等人,“通过CRISPR/Cas介导式基因组工程一步产生在多个基因中携有突变的小鼠(One-step generation of mice carryingmutations in multiple genes by CRISPR/Cas-mediated genome engineering)”《细胞》153:910-918(2013))。基于基因组裂解检测分析,在十个克隆群体中,将表达Cas9和四种sgRNA的单一载体通过慢病毒递送到初始人类皮肤纤维母细胞中使得四个基因组基因座有约30%发生同时剪辑(Kabadi等人,“利用单一慢病毒载体进行的基于CRISPR/Cas9的多工基因组工程(Multiplex CRISPR/Cas9-based genome engineering from a singlelentiviral vector)”《核酸研究》10月29日;42(19):e147.doi:10.1093/nar/gku749(2014))。在一项最新研究中,将含有七个向导RNA表达盒和Cas9核酸酶/切口酶表达盒的‘一体化’表达载体递送到293T细胞中,其中每个个别目标的基因组裂解效率在4%到36%范围内(Sakuma等人,“使用一体化CRISPR/Cas9载体***在人类细胞中进行的多工基因组工程(Multiplex genome engineering in human cells using all-in-one CRISPR/Cas9vector system)”《科学报告》,6月23;4:5400.doi:10.1038/srep05400(2014))。一般来说,使用基于质体的递送方法剪辑人类基因组中的多个基因的效率仍然是相对较低的,其随后增加了下游克隆分离的工作负荷。
已经研发出一种活体外gRNA产生***且其利用***方法将通过脂质介导式转染或电穿孔递送Cas9:gRNA复合物的条件优化。测试了多种哺乳动物细胞系,包括原代细胞和其它很难转染的细胞。对质体DNA、mRNA和Cas9蛋白质转染进行并列式评价。使用通过电穿孔进行的Cas9蛋白质转染实现了优良的基因组剪辑效率,即使在很难转染的细胞中。另外,本文评估且描述了使用Cas9 RNP递送***对多个目标同时进行基因组剪辑。已发现Cas9RNP的递送不仅在单一基因座引起大量***缺失产生,而且支持至少两种基因在单一转染中的高效双等位基因调节。
材料和方法
材料:293FT细胞、人类游离型iPSC株系、DMEM培养基、RPMI 1640培养基、IMDM、DMEM/F-12、胎牛血清(FBS)、KnockoutTM血清替代物、非必需氨基酸溶液、碱性纤维母细胞生长因子、胶原蛋白酶IV、TrypLETM表达酶、Geltrex、Opti-MEM培养基、FluoroBriteTMDMEM、Lipofectamine 2000、Lipofectamine 3000、RNAiMAX、MessengerMAX、具有OFP报告体的 CRISPR核酸酶载体、2% EX琼脂糖凝胶、 PCR微型试剂盒、TranscriptAid T7高产量转录试剂盒、MEGAclearTM转录净化试剂盒、Zero PCR克隆试剂盒、 Pro Quick96质体提纯试剂盒、Endotoxin定量试剂盒、 RNA BR分析试剂盒、TRA-1-60Alexa488结合抗体、SSEA4 Alexa 647,以及Phusion Flash高保真度PCR预混液得自赛默飞世尔科技。Jurkat T细胞和K562细胞获自美国菌种保藏中心(ATCC)。MEF饲养细胞和ROCK抑制剂Y-27632购自EMD Millipore。单株Cas9抗体购自Diagenode。重组Cas9蛋白质如Kim等人(7)所述提纯。gRNA合成所用的所有寡核苷酸均得自赛默飞世尔科技(增补表格1s)。
一步合成gRNA模板
通过PCR扩增来自 CRISPR核酸酶载体的tracrRNA的80nt恒定区且通过琼脂糖凝胶提取来提纯。PCR产物浓度是通过Nanodrop(赛默飞世尔科技)测量且基于49.6kd的分子量来计算摩尔浓度。为了制备寡核苷酸池,将80nt PCR产物的等分试样与两种末端引物和目标特异性正向和反向引物混合,其中80nt PCR产物的最终浓度是0.15μM且每种末端引物的最终浓度是10μM。对于特定目标来说,在15nt重叠的情况下,用化学方式合成由T7启动子序列和5'端目标序列组成的34nt正向引物,以及由目标序列和5'端tracrRNA序列组成的34nt反向引物。为了设定gRNA模板的合成,将混合的寡核苷酸的等分试样添加到Phusion Flash高保真度PCR预混液中且使用制造商建议的反应条件扩增。PCR产物通过2% EX琼脂糖凝胶进行分析,随后使用Purelink PCR微柱进行提纯。用13μl水洗脱gRNA模板且通过Nanodrop仪器测定浓度。
为了测定错误率,将PCR产物克隆到Zero载体中,随后进行质体DNA分离且用3500xl DNA分析仪(赛默飞世尔科技)定序。
活体外转录
使用TranscriptAid T7高产量转录试剂盒,使用制造商建议的条件进行gRNA模板的活体外转录。使用MEGAclearTM转录净化试剂盒,如手册中所述提纯gRNA产物。使用 RNA BR分析试剂盒测定RNA浓度。
细胞培养
使HEK 293FT细胞在补充有10%FBS的DMEM培养基中维持。使Jurkat T细胞在含有10%FBS的RPMI培养基中繁殖,而K562细胞在补充有10%FBS的IMDM培养基中培养。将饲养依赖型人类游离型iPSC在人类ESC(hESC)培养基中、在有丝***失活的MEF饲养细胞上培养,所述培养基在DMEM/F-12中含有20%KnockoutTM血清替代物、10μM非必需氨基酸溶液、55μM 2-巯基乙醇和4ng/ml碱性纤维母细胞生长因子。所有培养物均在5%CO2、37℃加湿培育箱中维持。iPSC培养物在每天更换培养基的情况下维持且使用胶原蛋白酶IV定期传代。
脂质介导式细胞转染
转染前一天,将细胞以2.5x105个细胞/孔的细胞密度接种于24孔盘中。为了进行质体DNA转染,将0.5μg DNA添加到25μl Opti-MEM培养基中,随后添加25μl含有2μlLipofectamine 2000的Opti-MEM。在室温下培育混合物15分钟且然后添加到细胞中。对于Cas9 mRNA转染来说,将0.5μg Cas9 mRNA(赛默飞世尔科技)添加到25μl Opti-MEM中,随后添加50-100ng gRNA。同时,将2μl Lipofectamine 3000在25μl Opti-MEM中稀释且然后与mRNA/gRNA样品混合。将混合物培育15分钟之后添加到细胞中。对于Cas9蛋白质转染来说,将500ng被提纯的Cas9蛋白质(赛默飞世尔科技)添加到25μl Opti-MEM培养基中,随后添加120ng gRNA。gRNA相对于Cas9蛋白质的摩尔比是约1:1.2。通过轻缓地轻敲试管几次来混合样品且然后在室温下培育10分钟。向单独的试管中,将2μl RNAiMAX或Lipofectamine 3000添加到25μl Opti-MEM培养基中。将被稀释的转染试剂转移到含有Cas9蛋白质/gRNA复合物的试管中,随后在室温下培育15分钟。然后将完整溶液添加到24孔中的细胞中且通过将盘轻缓地涡旋来混合。将培养盘在5%CO2培育箱中、在37℃下培育48小时。基因座特异性***缺失形成百分比是通过基因组裂解检测试剂盒测量。使用Alpha成像仪(Bio-Rad)的内置软件定量色带强度。
电穿孔
对于悬浮细胞(如Jurkat T细胞或K562细胞)来说,使用转染***10μL试剂盒(赛默飞世尔科技)每次电穿孔使用2x105个细胞。为了最大化基因组裂解效率,根据制造商说明书应用Neon 24优化方案。为了配置预混液,将24μg被提纯的Cas9蛋白质添加到试剂盒所提供的240μL再悬浮缓冲液R中,随后添加4.8μg gRNA。在室温下培育混合物10分钟。同时,将4.8x106个细胞转移到无菌试管中且以500xg离心5分钟。抽吸上清液且将细胞离心块再悬浮于1ml不含Ca2+和Mg2+的PBS中。离心后,小心地抽吸上清液,以便除去几乎所有的PBS缓冲液而无细胞损失或使细胞损失降到最小。然后使用含有Cas9蛋白质/gRNA复合物的再悬浮缓冲液R使细胞离心块再悬浮。24种优化条件(在脉冲电压、脉冲宽度和脉冲数目上变化)中的每一种均使用10μl细胞悬浮液。将电穿孔细胞立刻转移到含有0.5ml相应生长培养基的24孔中且然后在5%CO2培育箱中培育48小时。通过离心来收获细胞且然后用PBS洗涤一次,随后如手册所述进行基因组裂解和检测分析。优化电穿孔条件后,可以施加较高量的Cas9蛋白质(1.5μg到2μg)和gRNA(300ng到400ng),以进一步提高基因组剪辑效率。对于多工分析中的每个目标来说,将1μg到2μg的Cas9蛋白质和200-400ng的gRNA分别进行预培育,随后与细胞离心块混合用于电穿孔。对于克隆分离来说,在48小时培育后,对所转染细胞的细胞数进行计数,随后基于细胞计数而对细胞密度为每盘10-20个细胞的96孔盘进行连续稀释。克隆扩增三周之后,从每个个别孔中收获细胞,随后对目标基因座进行PCR扩增。然后使用TOPO载体克隆PCR片段且转化成TOP10胜任细胞。随机挑选约8个大肠杆菌群落用于对每个个别目标基因座进行定序。根据每个等位基因的序列同质性来确定单一细胞群。全部所期望目标上含有双等位基因突变的单一细胞视为纯质性***缺失。不进行可确认框移诱导式终止密码子引入的下游序列分析。
对于转染无饲养的自适应的iPSC来说,使饲养依赖性iPSC生长到80%汇合后,通过胶原蛋白酶来收获。从饲养层中除去细胞簇之后,其发生重力沉降以防止MEF污染。然后将细胞簇接种于组织培养皿上,所述培养皿经含有补充有4ng/ml bFGF的MEF条件培养基涂布。使用失活的饲养细胞产生MEF条件培养基,连续7天收获,无菌过滤且冷冻直到使用。允许培养物达到80-90%汇合。转染前一天,培养物用5μM ROCK抑制剂Y-27632预处理。收获当天,检验培养物的分化迹象且通过显微解剖除去任何污染的分化细胞。培养物用DPBS洗涤一次且然后使用TrypLETM表达酶收获。使用自动化细胞计数器对单一细胞悬浮液进行计数。转染之后,将细胞接种于经涂布的多孔(24孔)组织培养皿上且与含有5μM ROCK的MEF条件培养基一起培育过夜。分析之前,每天置换培养基(不含ROCK抑制剂)。
细胞表面免疫染色
为了在转染和基因组剪辑后确保多能性维持,测试iPSC细胞对自我更新的细胞表面标记的表达。待探测的孔用DMEM/F12基础培养基洗涤。TRA-1-60Alexa488结合的抗体和SSEA4 Alexa647在DMEM/F-12基础培养基中进行多工操作。两种抗体均以每种抗体2μl的浓度添加到0.5mL预温热的DMEM/F-12培养基中且在37℃下培育45分钟。培育之后,除去抗体溶液且孔用DMEM/F-12洗涤两次。观察之前,将培养基用预温热的FluoroBriteTM DMEM更换。使用Zeiss Axiovision显微镜(使用FITC和Cy5激光/滤光片组合)拍摄影像。
多能性标记的分析
使用TrypLETM Select以及湿磨将培养物拆离且解离。将单一细胞悬浮液与TRA-1-60Alexa488结合的抗体和SSEA4 Alexa647一起在室温下、在轻缓搅拌下培育1小时。将两微升(50x)的每种抗体添加到0.5mL DMEM/F-12中。培育之后,将细胞离心且用杜尔贝科氏磷酸盐缓冲盐水(Dulbecco's Phosphate-Buffered Saline,DPBS)洗涤一次。除去DPBS洗液之后,将离心块状的细胞轻缓地再悬浮于1mL DPBS中且通过经滤网封端的试管染色。然后使用声波聚焦细胞仪测量细胞对两种标记的表达且使用FlowJo软件分析数据。
西方印迹分析
如上文所述用质体DNA、mRNA或Cas9蛋白质转染293FT细胞。在指定的时间收获细胞以执行基因组裂解和检测分析以及西方印迹分析。使用4-12%Novex Bis-tris凝胶对细胞裂解物进行分级分离。使用iBlot,依循制造商方案将蛋白质转移到PVDF膜上。阻断后,将膜与单克隆小鼠Cas9抗体(1:3000稀释)一起培育2小时。洗涤之后,将膜与兔抗小鼠抗体-HRP结合物(1:2000稀释)一起培育1小时。广泛洗涤后,膜用Pierce ECL试剂显影,随后使用富士成像仪LAS 4000仪器成像。
结果
三天细胞工程工作流程
为了使基因组工程工作流程流线化,设法简化gRNA合成程序和尽可能地缩短从实验设计到初始分析的时间。本文中呈现了一种方法,其中在第1天,研究人员设计且定购短DNA寡核苷酸且接种所关注的细胞用于次日的转染(图19)。第2天收到寡核苷酸后,研究人员通过‘一锅式’PCR在不到1小时内组装gRNA模板。然后对所得PCR产物进行活体外转录以在约3个小时内合成gRNA。gRNA与被提纯的Cas9蛋白质结合后,通过脂质介导式递送或电穿孔、使用Cas9蛋白质/gRNA复合物(Cas9 RNP)转染细胞。早在第3天(转染后24小时)可以收获细胞用于分析基因座特异性基因组修饰效率。
为了组装DNA模板供产生gRNA用,使用总共4种合成DNA寡核苷酸和被提纯的PCR产物,其代表了恒定(非靶向)crRNA区域和tracrRNA序列(缺乏gRNA的目标序列)(图20A)。通过在线网络工具(Beta测试版,赛默飞世尔科技)设计一对34nt正向和反向寡核苷酸引物,且所述引物与CRISPR和示踪RNA区域分别具有15nt同源性。对寡核苷酸池浓度以及PCR条件进行优化,以便使模板在单个试管中、在不到40分钟内扩增而无明显的副产物(图20B)。通过活体外转录(IVT),gRNA模板直接用于制备gRNA。提纯所得gRNA,从而提高gRNA含量且无可检测到的副产物(图20C)。这种方法是通过合成超过96种不同的gRNA来验证。为了测定合成DNA模板中的错误率,克隆PCR片段且定序,且发现约7%的gRNA模板具有突变,这些突变主要是发生于成熟模板的远侧3'端和5'端的小缺失。使用经HPLC提纯的末端引物将错误率进一步降低到3.6%且目标区域中未检测到突变,这类似于使用由‘一体化’质体制备的对照模板、在2%错误率下所观察到的结果(图20D)。综合而言,这种优化方法促进了一小组DNA寡核苷酸在约4个小时内转化成被提纯的gRNA,精确度为96%且在靶向或Cas9复合(cr/tracrRNA)区域中未检测到错误。鉴于所述方法仅由液体操控PCR、转录和RNA分离步骤组成,因此其非常适于高处理量gRNA产生和筛选。
脂质体介导式Cas9蛋白质转染
为了检查合成gRNA的活性,产生所提纯的合成IVT gRNA与Cas9蛋白质的预复合物。提出一个假设:产生所提纯的gRNA与Cas9蛋白质的复合物、随后递送到细胞中可能会引起更高的基因组剪辑效率,原因是其在转染过程中转运到核中时,gRNA具有保护作用。为了检查***的活体内功能,使用一组阳离子脂质试剂、用Cas9/gRNA核糖核蛋白的预复合物(Cas9 RNP)转染人类胚胎肾脏(HEK293)细胞,随后进行基因组裂解检测分析。有趣的是,常用质体DNA或RNA转染试剂能够有效地递送Cas9 RNP。在HEK 293细胞中,Lipofectamine3000和RNAiMAX胜过Lipofectamine 2000(数据未示出),这与Cas9 mRNA递送中的RNAiMAX性能优于Lipofectamine 2000的最新发现一致(Zuris等人,“阳离子脂质介导蛋白质递送能够在活体外和活体内实现有效的基于蛋白质的基因组剪辑(Cationic lipid-mediateddelivery of proteins enables efficient protein-based genome editing in vitroand in vivo)”《自然生物技术》10月30日.doi:10.1038/nbt.3081(2014))。对于蛋白质转染来说,通常使用无血清培养基以避免血清蛋白质推断。然而,在这项研究中,注意到含有10%FBS的完全培养基促进了蛋白质转染和基因组修饰(图21A)。使用三种不同目标基因座HPRT、AAVS和RelA来评价通过质体DNA、mRNA和Cas9 RNP转染进行基因组剪辑的效率。通过Lipofectamine 3000将质体DNA和mRNA递送到HEK293细胞中,而Cas9 RNP通过RNAiMAX递送。如图15中所示,在经DNA、mRNA和Cas9蛋白质转染的细胞中,三种目标基因座的基因组修饰效率相似。
接下来通过用质体DNA、mRNA或Cas9 RNP转染细胞来检查基因组裂解动力学,随后对细胞裂解物进行基因组裂解分析和西方印迹分析。在这项研究中,注意到以质体DNA、mRNA和蛋白质形式递送的Cas9之间存在类似的裂解动力学,在HEK293细胞转染后24小时发现有效的裂解,转染后48到72小时处于平稳期(图21B)。发现Cas9 RNP和mRNA编码Cas9在所转染细胞内部的出现和周转动力学与在Cas9通过质体DNA递送的情况下所发现的有极大不同。通过西方印迹法(图21C)测量,发现Cas9蛋白质正如所预期在经质体DNA转染的细胞中随着时间推移而聚积,而Cas9在经mRNA转染的细胞中的相对较低表达似乎早在转染后四小时便达到峰值且相对稳定地保持约44小时,随后衰减。在经Cas9 RNP转染的细胞中,在四小时或更短时间内达到峰值的Cas9蛋白质含量然后快速降低且在48小时时在我们的分析中几乎检测不到。作为对照,剥离印迹膜且用抗肌动蛋白抗体再探测。观察到肌动蛋白表达水平在各样品之间类似(数据未示出)。
由于蛋白质出现和表观周转速率的差异,因此假设Cas9 RNP转染的脱靶裂解活性低于质体DNA转染的脱靶裂解活性。其如下测试:通过DNA、mRNA和Cas9 RNP蛋白质转染来靶向已鉴别具有若干个高活性脱靶位点的VEGFA基因的基因座(Tsai等人,“向导序列能够对CRISPR-Cas核酸酶的脱靶裂解实现全基因组图谱分析(UIDE-seq enables genome-wideprofiling of off-target cleavage by CRISPR-Cas nucleases)”《自然生物技术》doi:10.1038/nbt.3117(2014)),随后进行基因组裂解和基因座定序分析。基于基因组裂解分析,在此前已经研究的六个潜在脱靶位点(OT3-1、OT3-2、OT3-4、OT3-9、OT3-17和OT3-18)中,只检测到OT3-2和OT3-18具有脱靶突变。通过定序进一步分析基因座OT3-2表明,在经mRNA和Cas9 RNP转染的细胞中,OT3-2的***缺失突变相对于在靶突变的比率比经DNA转染的细胞分别低2倍和2.5倍。OT3-18的***缺失突变相对于在靶突变的比率在经mRNA或Cas9RNP转染的细胞中比在经DNA转染的细胞中分别低1.6倍和28倍(图21D)。在靶剪辑效率随着Cas9 RNP的剂量增加而增大,Cas9蛋白质在约2μg时达到平稳期,而位于所检查的基因座的脱靶修饰保持较低且恒定(数据未示出)。综合而言,这些数据表明Cas9以mRNA和预复合的蛋白质形式递送促进了基因组裂解特异性增强(相较于标准的DNA质体转染)。
电穿孔介导式Cas9蛋白质转染
生物学上和生理学上相关的许多细胞系(如患者来源的iPSC和祖细胞)很难通过基于脂质的试剂进行有效的转染。基因组调节效率的任何改进会促进适当工程改造的细胞被分离用于实验和治疗,因此研究递送Cas9 RNP和Cas9 mRNA/gRNA调配物的替代方式和其对产生***缺失的影响。使用Jurkat T细胞作为初始模型,使用显微穿孔(描述于材料和方法中,数据未示出)比较Cas9和gRNA质体DNA、Cas9 mRNA/gRNA配制物和Cas9 RNP的递送。我们的结果表明,与质体DNA和mRNA递送相比,通过递送在若干电穿孔条件下具有约90%HPRT基因座特异性修饰的Cas9 RNP来实现优良的基因组剪辑效率(图22A)。一般来说,在所测试的大部分电穿孔条件下,Cas9 RNP递送的稳健性大于DNA或mRNA递送。裂解效率与剂量相关,每次转染在约1.5μg Cas9蛋白质和300ng gRNA(约1:1摩尔比)的情况下达到最大值。对细胞池定序之后发现,94%的目标基因座在位于NGG PAM序列上游的3个碱基处的裂解位点具有突变(增补定序数据)。与此前工作一致,大部分突变彼此不同,其中***为73%、缺失为18%和碱基取代为3%。鉴于使用Cas9 RNP***测得较高的单一基因座裂解效率,因此测试在单一转染中有效损伤多个基因的能力。在此检查在三种基因座(AAVS1、RelA和HPRT)实现多工Cas9转染的能力。将多种物种的Cas9 RNP(只有gRNA目标不同)混合且递送之后,发现在所有基因座发生的AAVS1/HPRT或AAVS1/RelA/HPRT基因座同时剪辑效率明显大于质体或mRNA递送Cas9(图23A和23C)。为了深刻了解多工操作的分子水平,通过连续稀释进行一轮克隆分离。克隆扩增之后,对每个基因座进行PCR扩增,随后进行DNA克隆和定序。在双基因剪辑的情况下,发现16种所分离克隆细胞系全部在单一AAVS1基因座上具有双等位基因***缺失突变且93.7%(16个中有15个)的克隆细胞在HPRT基因座具有一个等位基因***缺失突变,原因是HPRT目标位于雄性Jurkat T细胞系的X染色体上。总体上,93.7%的克隆细胞群在AAVS1和HPRT基因座上均有***缺失突变(图23B)。为了对三种基因进行多工操作,使用所分析的总共53种单一细胞系进行三次个别细胞转染和克隆分离。在这项实验中,所分析的克隆细胞系中90%和65%分别在AAVS1和RelA基因座具有双等位基因***缺失突变,而80%的克隆细胞在HPRT基因座具有***缺失突变。约65%的克隆细胞在AAVS1和RelA基因座上均有双等位基因***缺失突变,而80%和65%的克隆细胞分别在AAVS1/HPRT基因座和RelA/HPRT基因座上具有***缺失突变。总体上,65%的克隆细胞系在所有三个目标上均有***缺失突变(图23D)。另外,100%的Jurkat T细胞克隆被剪辑至少一次,表明转染效率达到几乎100%。综合而言,在本文所用条件下通过电穿孔所递送的Cas9 RNP实现了格外高的突变诱发频率。这表示Cas9介导式基因组剪辑发生相当大的改进且通过大幅度减少为了鉴别和分离所期望细胞系而必须筛选的细胞的数目来明显降低克隆分离所需的工作负荷。
论述
相较于已经用于基因组剪辑的其它核酸酶(如锌指核酸酶和TAL效应子),通过简单地改变gRNA的20个核苷酸靶向序列而能够容易地调节Cas9核酸酶的序列特异性提供了明显通用的递送选择方案。现今,研究人员能够选择有成本效益的快速设计选择方案,以质体DNA、预制的mRNA或提纯的蛋白质形式调配核酸酶。向导RNA组分的快速制备实现了设计通用性。直到最近,通常将模板序列克隆到质体载体中且活体内表达Cas9和gRNA来制备gRNA。在此描述一种流线型方案,其中通过合成两种短的单股寡核苷酸来促进gRNA设计和模板构筑。寡核苷酸是通过短时间的PCR反应并入gRNA模板中,随后通过活体外转录而转化成gRNA。目标特异性寡核苷酸可以在少到两天内设计、定购且转化成被提纯的gRNA。次日,将gRNA与Cas9 mRNA或蛋白质一起调配,且立刻用于转染细胞。整个过程完全由液体操控和酶反应步骤组成,这使得其能经受住在多孔盘中进行的较高处理量gRNA制备和转染。
对三种递送选择方案的流线型gRNA工作流程进行比较且发现通常使用在大部分细胞系中提供优良***缺失产生效率的Cas9/gRNA核糖核蛋白复合物(Cas9 RNP)作为测试床。当前不清楚Cas9 RNP和总RNA配制物发挥作用的原因,但是考虑因素可以是脂质复合物的总体尺寸、Cas9蛋白质保护gRNA以防细胞降解的能力,以及基于DNA的细胞毒性的消除。关于质体递送,以Cas9 RNP或mRNA形式引入的Cas9以较低、但是明显具有功能性的含量出现在细胞中且快速地被清除,这也可以减少脱靶结合和裂解的机会。上文呈现的数据表明这种情况可以是个例,而且需要明显更详细的评价以便确认。
为了减少或排除CRISPR***的脱靶裂解,已经取得许多进展,如使用成对的Cas9切口酶和二聚‘死Cas9’FokI融合物,这已经表明可将脱靶活性降低50到1,500倍(Tsai等人,“向导序列能够对CRISPR-Cas核酸酶的脱靶裂解实现全基因组图谱分析(GUIDE-seqenables genome-wide profiling of off-target cleavage by CRISPR-Casnucleases)”《自然生物技术》doi:10.1038/nbt.3117(2014);Fu等人,“CRISPR-Cas核酸酶在人类细胞中诱导的高频脱靶突变诱发(High-frequency off-target mutagenesisinduced by CRISPR-Cas nucleases in human cells)”《自然生物技术》31:822-826(2013))。这些工具通过Cas9 RNP的可能递送产生了甚至更高的特异性,同时保持了高活性水平。
在这项工作中已经表明,可以对靶向Jurkat T细胞中的单独基因座的三种Cas9RNP种类进行多工操作,同时在所有三种基因座实现高水平的***缺失产生。另外,在这些实验中观察到两种二倍体等位基因(AAVS1和RelA)存在较高的双等位基因修饰率(甚至也以类似的高水平修饰单倍体基因座(HPRT))。综合而言,细胞群中的较高双等位基因修饰率表明,使用Cas9 RNP递送通过促进了从单一实验中选择多基因剔除细胞系而明显地简化了工作流程。
通过比较借助于质体、Cas9 mRNA/gRNA和Cas9 RNP的CRISPR递送,对十一种常用哺乳动物细胞系进行调查(表11)且发现在所测试的所有细胞系中,Cas9mRNA/gRNA或Cas9RNP优于质体递送。在测试条件下,通过显微穿孔递送这些试剂提供了最高的目标特异性***缺失产生。在除一种(NHEK细胞)之外的所有情况下,Cas9 RNP胜过Cas9 mRNA/gRNA且在人类CD34+脐血细胞中,通过显微穿孔递送Cas9 RNP是产生明显稳健剪辑方案的唯一方法。
本文中描述了一种用于哺乳动物基因组工程工作流程的流线化方法,从CRISPR目标设计到基因组剪辑评价,其花费很短的三天对哺乳动物基因组进行修饰。为了在很难转染的细胞中实现高突变诱发效率,使用***方法优化转染条件且对通过质体DNA、Cas9mRNA/提纯的向导RNA(gRNA)配制物以及Cas9蛋白质和gRNA核糖核蛋白的预复合物(Cas9RNP)递送CRISPR剪辑工具进行比较。发现在这项工作所分析的多种细胞系中,Cas9 mRNA/gRNA和Cas9 RNP性能优于‘一体化’质体DNA构筑体。最可能的原因是Cas9 RNP递送的效率高,因此可以同时在多个基因座有效地修饰基因组,从而在期望剔除超过一种基因的方案中降低下游克隆分离的工作负荷。另外,发现将Cas9 RNP递送到视为很难通过电穿孔转染的细胞系(Jurkat、iPSC、CD4+)中产生了高水平的基因座特异性修饰。
尽管前述实施例已在某种程度上详细地加以描述用于清楚了解的目的,但所属领域的技术人员通过阅读本发明将清楚,可以在形式和细节上进行各种变化而这些变化不脱离本文中所揭露的实施例的真实范围。举例来说,可以将上述所有技术、设备、***和方法按各种组合形式使用。
序列表
<110> LIFE TECHNOLOGIES CORPORATION
THERMO FISHER SCIENTIFIC GENEART GMBH
<120> CRISPR寡核苷酸和基因剪辑
<130> LT00948 PCT
<140>
<141>
<150> 62/218,826
<151> 2015-09-15
<150> 62/101,787
<151> 2015-01-09
<150> 62/061,961
<151> 2014-10-09
<160> 65
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 13
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 2
Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10
<210> 3
<211> 7
<212> PRT
<213> Streptococcus sp.
<400> 3
Pro Thr Ile Tyr His Leu Arg
1 5
<210> 4
<211> 7
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 4
Arg Gly His Phe Leu Ile Glu
1 5
<210> 5
<211> 9
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 5
Thr Lys Ala Pro Leu Ser Ala Ser Met
1 5
<210> 6
<211> 10
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 6
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
1 5 10
<210> 7
<211> 14
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 7
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
1 5 10
<210> 8
<211> 11
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 8
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
1 5 10
<210> 9
<211> 12
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 9
Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1 5 10
<210> 10
<211> 14
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 10
Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1 5 10
<210> 11
<211> 11
<212> PRT
<213> 链球菌种(Streptococcus sp.)
<400> 11
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1 5 10
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 12
gaaattaata cgactcacta tag 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 13
gttttagagc tagaaatagc aag 23
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 14
aaaagcaccg actcggtgcc ac 22
<210> 15
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 15
taatacgact cactatagg 19
<210> 16
<211> 14
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 16
gttttagagc taga 14
<210> 17
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 17
catttctcag tcctaaaca 19
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 18
taatacgact cactataggg 20
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 19
ccagtagcca gccccgtcc 19
<210> 20
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 20
tcgtgtccct gtacgcgga 19
<210> 21
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 21
taatacgact cactataggg gcatttctca gtcctaaaca 40
<210> 22
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 22
gctatttcta gctctaaaac tgtttaggac tgagaaatgc 40
<210> 23
<211> 60
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 23
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
<210> 24
<211> 60
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 24
aaaagcaccg actcggtgcc actttttcaa gttgataacg gactagcctt attttaactt 60
<210> 25
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 25
gctatttcta gctctaaaac tgtttaggac tgagaaatg 39
<210> 26
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 26
ttctagctct aaaactgttt aggactgaga aatg 34
<210> 27
<211> 39
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 27
taatacgact cactataggc atttctcagt cctaaacag 39
<210> 28
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 28
taatacgact cactataggc atttctcagt ccta 34
<210> 29
<211> 21
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 29
aaagcaccga ctcggtgcca c 21
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 30
aagcaccgac tcggtgccac 20
<210> 31
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 31
agcaccgact cggtgccac 19
<210> 32
<211> 18
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 32
gcaccgactc ggtgccac 18
<210> 33
<211> 35
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 33
taatacgact cactataggg ccagtagcca gcccc 35
<210> 34
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 34
taatacgact cactataggc cagtagccag cccc 34
<210> 35
<211> 33
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 35
taatacgact cactatagcc agtagccagc ccc 33
<210> 36
<211> 9823
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成多核苷酸"
<220>
<221> 修饰的碱基
<222> (7336)..(7355)
<223> a, c, t, g, 未知或其他
<400> 36
gttaggcgtt ttgcgctgct tcgcgatgta cgggccagat atacgcgttg acattgatta 60
ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc atatatggag 120
ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc 180
ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac tttccattga 240
cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat 300
atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc 360
cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct 420
attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca 480
cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat 540
caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg 600
cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcgcctgg 660
agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc cagcctccgg 720
agcggccgcc accatgggca agcccatccc taaccccctg ttggggctgg acagcaccgc 780
tcccaaaaag aaaaggaagg tgggcattca cggcgtgcct gcggccgaca aaaagtacag 840
catcggcctt gatatcggca ccaatagcgt gggctgggcc gttatcacag acgaatacaa 900
ggtacccagc aagaagttca aggtgctggg gaatacagac aggcactcta tcaagaaaaa 960
ccttatcggg gctctgctgt ttgactcagg cgagaccgcc gaggccacca ggttgaagag 1020
gaccgcaagg cgaaggtaca cccggaggaa gaacaggatc tgctatctgc aggagatctt 1080
cagcaacgag atggccaagg tggacgacag cttcttccac aggctggagg agagcttcct 1140
tgtcgaggag gataagaagc acgaacgaca ccccatcttc ggcaacatag tcgacgaggt 1200
cgcttatcac gagaagtacc ccaccatcta ccacctgcga aagaaattgg tggatagcac 1260
cgataaagcc gacttgcgac ttatctactt ggctctggcg cacatgatta agttcagggg 1320
ccacttcctg atcgagggcg accttaaccc cgacaacagt gacgtagaca aattgttcat 1380
ccagcttgta cagacctata accagctgtt cgaggaaaac cctattaacg ccagcggggt 1440
ggatgcgaag gccatactta gcgccaggct gagcaaaagc aggcgcttgg agaacctgat 1500
agcccagctg cccggtgaaa agaagaacgg cctcttcggt aatctgattg ccctgagcct 1560
gggcctgacc cccaacttca agagcaactt cgacctggca gaagatgcca agctgcagtt 1620
gagtaaggac acctatgacg acgacttgga caatctgctc gcccaaatcg gcgaccagta 1680
cgctgacctg ttcctcgccg ccaagaacct ttctgacgca atcctgctta gcgatatcct 1740
tagggtgaac acagagatca ccaaggcccc cctgagcgcc agcatgatca agaggtacga 1800
cgagcaccat caggacctga cccttctgaa ggccctggtg aggcagcaac tgcccgagaa 1860
gtacaaggag atctttttcg accagagcaa gaacggctac gccggctaca tcgacggcgg 1920
agccagccaa gaggagttct acaagttcat caagcccatc ctggagaaga tggatggcac 1980
cgaggagctg ctggtgaagc tgaacaggga agatttgctc cggaagcaga ggacctttga 2040
caacggtagc atcccccacc agatccacct gggcgagctg cacgcaatac tgaggcgaca 2100
ggaggatttc taccccttcc tcaaggacaa tagggagaaa atcgaaaaga ttctgacctt 2160
caggatcccc tactacgtgg gccctcttgc caggggcaac agccgattcg cttggatgac 2220
aagaaagagc gaggagacca tcaccccctg gaacttcgag gaagtggtgg acaaaggagc 2280
aagcgcgcag tctttcatcg aacggatgac caatttcgac aaaaacctgc ctaacgagaa 2340
ggtgctgccc aagcacagcc tgctttacga gtacttcacc gtgtacaacg agctcaccaa 2400
ggtgaaatat gtgaccgagg gcatgcgaaa acccgctttc ctgagcggcg agcagaagaa 2460
ggccatcgtg gacctgctgt tcaagaccaa caggaaggtg accgtgaagc agctgaagga 2520
ggactacttc aagaagatcg agtgctttga tagcgtggaa ataagcggcg tggaggacag 2580
gttcaacgcc agcctgggca cctaccacga cttgttgaag ataatcaaag acaaggattt 2640
cctggataat gaggagaacg aggatatact cgaggacatc gtgctgactt tgaccctgtt 2700
tgaggaccga gagatgattg aagaaaggct caaaacctac gcccacctgt tcgacgacaa 2760
agtgatgaaa caactgaaga gacgaagata caccggctgg ggcagactgt ccaggaagct 2820
catcaacggc attagggaca agcagagcgg caagaccatc ctggatttcc tgaagtccga 2880
cggcttcgcc aaccgaaact tcatgcagct gattcacgat gacagcttga ccttcaagga 2940
ggacatccag aaggcccagg ttagcggcca gggcgactcc ctgcacgaac atattgcaaa 3000
cctggcaggc tcccctgcga tcaagaaggg catactgcag accgttaagg ttgtggacga 3060
attggtcaag gtcatgggca ggcacaagcc cgaaaacata gttatagaga tggccagaga 3120
gaaccagacc acccaaaagg gccagaagaa cagccgggag cgcatgaaaa ggatcgagga 3180
gggtatcaag gaactcggaa gccagatcct caaagagcac cccgtggaga atacccagct 3240
ccagaacgag aagctgtacc tgtactacct gcagaacggc agggacatgt acgttgacca 3300
ggagttggac atcaacaggc tttcagacta tgacgtggat cacatagtgc cccagagctt 3360
tcttaaagac gatagcatcg acaacaaggt cctgacccgc tccgacaaaa acaggggcaa 3420
aagcgacaac gtgccaagcg aagaggtggt taaaaagatg aagaactact ggaggcaact 3480
gctcaacgcg aaattgatca cccagagaaa gttcgataac ctgaccaagg ccgagagggg 3540
cggactctcc gaacttgaca aagcgggctt cataaagagg cagctggtcg agacccgaca 3600
gatcacgaag cacgtggccc aaatcctcga cagcagaatg aataccaagt acgatgagaa 3660
tgacaaactc atcagggaag tgaaagtgat taccctgaag agcaagttgg tgtccgactt 3720
tcgcaaagat ttccagttct acaaggtgag ggagatcaac aactaccacc atgcccacga 3780
cgcatacctg aacgccgtgg tcggcaccgc cctgattaag aagtatccaa agctggagtc 3840
cgaatttgtc tacggcgact acaaagttta cgatgtgagg aagatgatcg ctaagagcga 3900
acaggagatc ggcaaggcca ccgctaagta tttcttctac agcaacatca tgaacttttt 3960
caagaccgag atcacacttg ccaacggcga aatcaggaag aggccgctta tcgagaccaa 4020
cggtgagacc ggcgagatcg tgtgggacaa gggcagggac ttcgccaccg tgaggaaagt 4080
cctgagcatg ccccaggtga atattgtgaa aaaaactgag gtgcagacag gcggctttag 4140
caaggaatcc atcctgccca agaggaacag cgacaagctg atcgcccgga agaaggactg 4200
ggaccctaag aagtatggag gcttcgacag ccccaccgta gcctacagcg tgctggtggt 4260
cgcgaaggta gagaagggga agagcaagaa actgaagagc gtgaaggagc tgctcggcat 4320
aaccatcatg gagaggtcca gctttgagaa gaaccccatt gactttttgg aagccaaggg 4380
ctacaaagag gtcaaaaagg acctgatcat caaactcccc aagtactccc tgtttgaatt 4440
ggagaacggc agaaagagga tgctggcgag cgctggggaa ctgcaaaagg gcaacgaact 4500
ggcgctgccc agcaagtacg tgaattttct gtacctggcg tcccactacg aaaagctgaa 4560
aggcagcccc gaggacaacg agcagaagca gctgttcgtg gagcagcaca agcattacct 4620
ggacgagata atcgagcaaa tcagcgagtt cagcaagagg gtgattctgg ccgacgcgaa 4680
cctggataag gtcctcagcg cctacaacaa gcaccgagac aaacccatca gggagcaggc 4740
cgagaatatc atacacctgt tcaccctgac aaatctgggc gcacctgcgg cattcaaata 4800
cttcgatacc accatcgaca ggaaaaggta cactagcact aaggaggtgc tggatgccac 4860
cttgatccac cagtccatta ccggcctgta tgagaccagg atcgacctga gccagcttgg 4920
aggcgactct agggcggacc caaaaaagaa aaggaaggtg gaattctcta gaggcagtgg 4980
agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg gcccaatgaa 5040
ccggggagtc ccttttaggc acttgcttct ggtgctgcaa ctggcgctcc tcccagcagc 5100
cactcaggga aagaaagtgg tgctgggcaa aaaaggggat acagtggaac tgacctgtac 5160
agcttcccag aagaagagca tacaattcca ctggaaaaac tccaaccaga taaagattct 5220
gggaaatcag ggctccttct taactaaagg tccatccaag ctgaatgatc gcgctgactc 5280
aagaagaagc ctttgggacc aaggaaactt ccccctgatc atcaagaatc ttaagataga 5340
agactcagat acttacatct gtgaagtgga ggaccagaag gaggaggtgc aattgctagt 5400
gttcggattg actgccaact ctgacaccca cctgcttcag gggcagagcc tgaccctgac 5460
cttggagagc ccccctggta gtagcccctc agtgcaatgt aggagtccaa ggggtaaaaa 5520
catacagggg gggaagaccc tctccgtgtc tcagctggag ctccaggata gtggcacctg 5580
gacatgcact gtcttgcaga accagaagaa ggtggagttc aaaatagaca tcgtggtgct 5640
agctttccag aaggcctcca gcatagtcta taagaaagag ggggaacagg tggagttctc 5700
cttcccactc gcctttacag ttgaaaagct gacgggcagt ggcgagctgt ggtggcaggc 5760
ggagagggct tcctcctcca agtcttggat cacctttgac ctgaagaaca aggaagtgtc 5820
tgtaaaacgg gttacccagg accctaagct ccagatgggc aagaagctcc cgctccacct 5880
caccctgccc caggccttgc ctcagtatgc tggctctgga aacctcaccc tggcccttga 5940
agcgaaaaca ggaaagttgc atcaggaagt gaacctggtg gtgatgagag ccactcagct 6000
ccagaaaaat ttgacctgtg aggtgtgggg acccacctcc cctaagctga tgctgagctt 6060
gaaactggag aacaaggagg caaaggtctc gaagcgggag aaggcggtgt gggtgctgaa 6120
ccctgaggcg gggatgtggc agtgtctgct gagtgactcg ggacaggtcc tgctggaatc 6180
caacatcaag gttctgccca catggtcgac cccggtgcag ccaatggccc tgattgtgct 6240
ggggggcgtc gccggcctcc tgcttttcat tgggctaggc atcttcttct gtgtcaggtg 6300
ccggcacacc ggttagtaat gagtttaaac gggggaggct aactgaaaca cggaaggaga 6360
caataccgga aggaacccgc gctatgacgg caataaaaag acagaataaa acgcacgggt 6420
gttgggtcgt ttgttcataa acgcggggtt cggtcccagg gctggcactc tgtcgatacc 6480
ccaccgagac cccattgggg ccaatacgcc cgcgtttctt ccttttcccc accccacccc 6540
ccaagttcgg gtgaaggccc agggctcgca gccaacgtcg gggcggcagg ccctgccata 6600
gcagatctgc gcagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta 6660
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 6720
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 6780
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 6840
aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 6900
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 6960
acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 7020
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt aaggtcgggc 7080
aggaagaggg cctatttccc atgattcctt catatttgca tatacgatac aaggctgtta 7140
gagagataat tagaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac 7200
gtagaaagta ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact 7260
atcatatgct taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga 7320
aaggacgaaa caccgnnnnn nnnnnnnnnn nnnnngtttt agagctagaa atagcaagtt 7380
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttcta 7440
gtataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 7500
gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 7560
cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 7620
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 7680
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 7740
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 7800
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 7860
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 7920
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 7980
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 8040
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 8100
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 8160
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 8220
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 8280
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 8340
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 8400
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 8460
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 8520
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 8580
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 8640
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 8700
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 8760
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 8820
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 8880
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 8940
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 9000
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 9060
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 9120
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 9180
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 9240
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 9300
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 9360
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 9420
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 9480
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 9540
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 9600
ttccgcgcac atttccccga aaagtgccac ctgacgtcga cggatcggga gatctcccga 9660
tcccctatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatct 9720
gctccctgct tgtgtgttgg aggtcgctga gtagtgcgcg agcaaaattt aagctacaac 9780
aaggcaaggc ttgaccgaca attgcatgaa gaatctgctt agg 9823
<210> 37
<211> 9220
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成多核苷酸"
<220>
<221> 修饰的碱基
<222> (6733)..(6752)
<223> a, c, t, g, 未知或其他
<400> 37
gttaggcgtt ttgcgctgct tcgcgatgta cgggccagat atacgcgttg acattgatta 60
ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc atatatggag 120
ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc 180
ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac tttccattga 240
cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat 300
atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc 360
cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct 420
attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca 480
cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat 540
caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg 600
cgtgtacggt gggaggtcta tataagcaga gctcgtttag tgaaccgtca gatcgcctgg 660
agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc cagcctccgg 720
agcggccgcc accatgggca agcccatccc taaccccctg ttggggctgg acagcaccgc 780
tcccaaaaag aaaaggaagg tgggcattca cggcgtgcct gcggccgaca aaaagtacag 840
catcggcctt gatatcggca ccaatagcgt gggctgggcc gttatcacag acgaatacaa 900
ggtacccagc aagaagttca aggtgctggg gaatacagac aggcactcta tcaagaaaaa 960
ccttatcggg gctctgctgt ttgactcagg cgagaccgcc gaggccacca ggttgaagag 1020
gaccgcaagg cgaaggtaca cccggaggaa gaacaggatc tgctatctgc aggagatctt 1080
cagcaacgag atggccaagg tggacgacag cttcttccac aggctggagg agagcttcct 1140
tgtcgaggag gataagaagc acgaacgaca ccccatcttc ggcaacatag tcgacgaggt 1200
cgcttatcac gagaagtacc ccaccatcta ccacctgcga aagaaattgg tggatagcac 1260
cgataaagcc gacttgcgac ttatctactt ggctctggcg cacatgatta agttcagggg 1320
ccacttcctg atcgagggcg accttaaccc cgacaacagt gacgtagaca aattgttcat 1380
ccagcttgta cagacctata accagctgtt cgaggaaaac cctattaacg ccagcggggt 1440
ggatgcgaag gccatactta gcgccaggct gagcaaaagc aggcgcttgg agaacctgat 1500
agcccagctg cccggtgaaa agaagaacgg cctcttcggt aatctgattg ccctgagcct 1560
gggcctgacc cccaacttca agagcaactt cgacctggca gaagatgcca agctgcagtt 1620
gagtaaggac acctatgacg acgacttgga caatctgctc gcccaaatcg gcgaccagta 1680
cgctgacctg ttcctcgccg ccaagaacct ttctgacgca atcctgctta gcgatatcct 1740
tagggtgaac acagagatca ccaaggcccc cctgagcgcc agcatgatca agaggtacga 1800
cgagcaccat caggacctga cccttctgaa ggccctggtg aggcagcaac tgcccgagaa 1860
gtacaaggag atctttttcg accagagcaa gaacggctac gccggctaca tcgacggcgg 1920
agccagccaa gaggagttct acaagttcat caagcccatc ctggagaaga tggatggcac 1980
cgaggagctg ctggtgaagc tgaacaggga agatttgctc cggaagcaga ggacctttga 2040
caacggtagc atcccccacc agatccacct gggcgagctg cacgcaatac tgaggcgaca 2100
ggaggatttc taccccttcc tcaaggacaa tagggagaaa atcgaaaaga ttctgacctt 2160
caggatcccc tactacgtgg gccctcttgc caggggcaac agccgattcg cttggatgac 2220
aagaaagagc gaggagacca tcaccccctg gaacttcgag gaagtggtgg acaaaggagc 2280
aagcgcgcag tctttcatcg aacggatgac caatttcgac aaaaacctgc ctaacgagaa 2340
ggtgctgccc aagcacagcc tgctttacga gtacttcacc gtgtacaacg agctcaccaa 2400
ggtgaaatat gtgaccgagg gcatgcgaaa acccgctttc ctgagcggcg agcagaagaa 2460
ggccatcgtg gacctgctgt tcaagaccaa caggaaggtg accgtgaagc agctgaagga 2520
ggactacttc aagaagatcg agtgctttga tagcgtggaa ataagcggcg tggaggacag 2580
gttcaacgcc agcctgggca cctaccacga cttgttgaag ataatcaaag acaaggattt 2640
cctggataat gaggagaacg aggatatact cgaggacatc gtgctgactt tgaccctgtt 2700
tgaggaccga gagatgattg aagaaaggct caaaacctac gcccacctgt tcgacgacaa 2760
agtgatgaaa caactgaaga gacgaagata caccggctgg ggcagactgt ccaggaagct 2820
catcaacggc attagggaca agcagagcgg caagaccatc ctggatttcc tgaagtccga 2880
cggcttcgcc aaccgaaact tcatgcagct gattcacgat gacagcttga ccttcaagga 2940
ggacatccag aaggcccagg ttagcggcca gggcgactcc ctgcacgaac atattgcaaa 3000
cctggcaggc tcccctgcga tcaagaaggg catactgcag accgttaagg ttgtggacga 3060
attggtcaag gtcatgggca ggcacaagcc cgaaaacata gttatagaga tggccagaga 3120
gaaccagacc acccaaaagg gccagaagaa cagccgggag cgcatgaaaa ggatcgagga 3180
gggtatcaag gaactcggaa gccagatcct caaagagcac cccgtggaga atacccagct 3240
ccagaacgag aagctgtacc tgtactacct gcagaacggc agggacatgt acgttgacca 3300
ggagttggac atcaacaggc tttcagacta tgacgtggat cacatagtgc cccagagctt 3360
tcttaaagac gatagcatcg acaacaaggt cctgacccgc tccgacaaaa acaggggcaa 3420
aagcgacaac gtgccaagcg aagaggtggt taaaaagatg aagaactact ggaggcaact 3480
gctcaacgcg aaattgatca cccagagaaa gttcgataac ctgaccaagg ccgagagggg 3540
cggactctcc gaacttgaca aagcgggctt cataaagagg cagctggtcg agacccgaca 3600
gatcacgaag cacgtggccc aaatcctcga cagcagaatg aataccaagt acgatgagaa 3660
tgacaaactc atcagggaag tgaaagtgat taccctgaag agcaagttgg tgtccgactt 3720
tcgcaaagat ttccagttct acaaggtgag ggagatcaac aactaccacc atgcccacga 3780
cgcatacctg aacgccgtgg tcggcaccgc cctgattaag aagtatccaa agctggagtc 3840
cgaatttgtc tacggcgact acaaagttta cgatgtgagg aagatgatcg ctaagagcga 3900
acaggagatc ggcaaggcca ccgctaagta tttcttctac agcaacatca tgaacttttt 3960
caagaccgag atcacacttg ccaacggcga aatcaggaag aggccgctta tcgagaccaa 4020
cggtgagacc ggcgagatcg tgtgggacaa gggcagggac ttcgccaccg tgaggaaagt 4080
cctgagcatg ccccaggtga atattgtgaa aaaaactgag gtgcagacag gcggctttag 4140
caaggaatcc atcctgccca agaggaacag cgacaagctg atcgcccgga agaaggactg 4200
ggaccctaag aagtatggag gcttcgacag ccccaccgta gcctacagcg tgctggtggt 4260
cgcgaaggta gagaagggga agagcaagaa actgaagagc gtgaaggagc tgctcggcat 4320
aaccatcatg gagaggtcca gctttgagaa gaaccccatt gactttttgg aagccaaggg 4380
ctacaaagag gtcaaaaagg acctgatcat caaactcccc aagtactccc tgtttgaatt 4440
ggagaacggc agaaagagga tgctggcgag cgctggggaa ctgcaaaagg gcaacgaact 4500
ggcgctgccc agcaagtacg tgaattttct gtacctggcg tcccactacg aaaagctgaa 4560
aggcagcccc gaggacaacg agcagaagca gctgttcgtg gagcagcaca agcattacct 4620
ggacgagata atcgagcaaa tcagcgagtt cagcaagagg gtgattctgg ccgacgcgaa 4680
cctggataag gtcctcagcg cctacaacaa gcaccgagac aaacccatca gggagcaggc 4740
cgagaatatc atacacctgt tcaccctgac aaatctgggc gcacctgcgg cattcaaata 4800
cttcgatacc accatcgaca ggaaaaggta cactagcact aaggaggtgc tggatgccac 4860
cttgatccac cagtccatta ccggcctgta tgagaccagg atcgacctga gccagcttgg 4920
aggcgactct agggcggacc caaaaaagaa aaggaaggtg gaattctcta gaggcagtgg 4980
agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg gcccaatgaa 5040
cctgagcaaa aacgtgagcg tgagcgtgta tatgaagggg aacgtcaaca atcatgagtt 5100
tgagtacgac ggggaaggtg gtggtgatcc ttatacaggt aaatattcca tgaagatgac 5160
gctacgtggt caaaattccc tacccttttc ctatgatatc attaccacgg catttcagta 5220
tggtttccgc gtatttacaa aataccctga gggaattgtt gactatttta aggactcgct 5280
tcccgacgca ttccagtgga acagacgaat tgtgtttgaa gatggtggag tactaaacat 5340
gagcagtgat atcacatata aagataatgt tctgcatggt gacgtcaagg ctgagggagt 5400
gaacttcccg ccgaatgggc cagtgatgaa gaatgaaatt gtgatggagg aaccgactga 5460
agaaacattt actccaaaaa acggggttct tgttggcttt tgtcccaaag cgtacttact 5520
taaagacggt tcctattact atggaaatat gacaacattt tacagatcca agaaatctgg 5580
ccaggcacct cctgggtatc actttgttaa gcatcgtctc gtcaagacca atgtgggaca 5640
tggatttaag acggttgagc agactgaata tgccactgct catgtcagtg atcttcccaa 5700
gttcgaagct tgataatgag tttaaacggg ggaggctaac tgaaacacgg aaggagacaa 5760
taccggaagg aacccgcgct atgacggcaa taaaaagaca gaataaaacg cacgggtgtt 5820
gggtcgtttg ttcataaacg cggggttcgg tcccagggct ggcactctgt cgatacccca 5880
ccgagacccc attggggcca atacgcccgc gtttcttcct tttccccacc ccacccccca 5940
agttcgggtg aaggcccagg gctcgcagcc aacgtcgggg cggcaggccc tgccatagca 6000
gatctgcgca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 6060
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 6120
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 6180
ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 6240
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 6300
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 6360
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat 6420
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattaag gtcgggcagg 6480
aagagggcct atttcccatg attccttcat atttgcatat acgatacaag gctgttagag 6540
agataattag aattaatttg actgtaaaca caaagatatt agtacaaaat acgtgacgta 6600
gaaagtaata atttcttggg tagtttgcag ttttaaaatt atgttttaaa atggactatc 6660
atatgcttac cgtaacttga aagtatttcg atttcttggc tttatatatc ttgtggaaag 6720
gacgaaacac cgnnnnnnnn nnnnnnnnnn nngttttaga gctagaaata gcaagttaaa 6780
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt ttttctagta 6840
taccgtcgac ctctagctag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa 6900
attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 6960
ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 7020
agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 7080
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 7140
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 7200
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 7260
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 7320
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 7380
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 7440
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 7500
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 7560
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 7620
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 7680
agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 7740
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 7800
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 7860
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 7920
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 7980
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 8040
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 8100
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 8160
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 8220
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 8280
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 8340
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 8400
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 8460
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 8520
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 8580
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 8640
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 8700
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 8760
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 8820
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 8880
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 8940
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 9000
cgcgcacatt tccccgaaaa gtgccacctg acgtcgacgg atcgggagat ctcccgatcc 9060
cctatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc agtatctgct 9120
ccctgcttgt gtgttggagg tcgctgagta gtgcgcgagc aaaatttaag ctacaacaag 9180
gcaaggcttg accgacaatt gcatgaagaa tctgcttagg 9220
<210> 38
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 38
ccctggccca ccctcgtgac caccttcacc tacg 34
<210> 39
<211> 34
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 39
gggaccgggt gggagcactg gtggaagtgg atgc 34
<210> 40
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 40
ccctggccca ccctcgtgac caccttcacc tacggcgtgc 40
<210> 41
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 41
gggcacggga ccgggtggga gcactggtgg aagtggatgc 40
<210> 42
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 42
cccgtgccct ggcccaccct cgtgaccacc ttcacctacg 40
<210> 43
<211> 40
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 43
gggaccgggt gggagcactg gtggaagtgg atgccgcacg 40
<210> 44
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 44
cttcacctac ggcgtgc 17
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 45
cactggtgga agtggatgc 19
<210> 46
<211> 19
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 46
gtgaccacct tcacctacg 19
<210> 47
<211> 17
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 47
gaagtggatg ccgcacg 17
<210> 48
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 48
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accttcacct acg 53
<210> 49
<211> 53
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 49
gtggccgttc gacgggcacg ggaccgggtg ggagcactgg tggaagtgga tgc 53
<210> 50
<211> 59
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 50
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accttcacct acggcgtgc 59
<210> 51
<211> 59
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 51
gacgtggtgg ccgttcgacg ggcacgggac cgggtgggag cactggtgga agtggatgc 59
<210> 52
<211> 59
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 52
ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccacct tcacctacg 59
<210> 53
<211> 59
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 53
gtggccgttc gacgggcacg ggaccgggtg ggagcactgg tggaagtgga tgccgcacg 59
<210> 54
<211> 97
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 54
catctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccttcaccta 60
cggcgtgcag tgcttcgccc gctaccccga ccacatg 97
<210> 55
<211> 400
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成多核苷酸"
<400> 55
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccttcaccta cggcgtgcag tgcttcgccc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg 400
<210> 56
<211> 41
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 56
ccaguagcca gccccguccg uuuuagagcu augcuguuuu g 41
<210> 57
<211> 85
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 57
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
agggcaccga gucggugcuu uuuuu 85
<210> 58
<211> 104
<212> RNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成多核苷酸"
<400> 58
gcauuucggu augcauauga augaguuuua gagcuagaaa uagcaaguua aaauaaggcu 60
aguccguuau caacuugaaa aaguggcacc gagucggugc uuuu 104
<210> 59
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 59
ccatcatatg cataccgaaa tgc 23
<210> 60
<211> 23
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<220>
<221> 修饰的碱基
<222> (21)..(21)
<223> a, c, t, g, 未知或其他
<400> 60
gcatttcggt atgcatatga ngg 23
<210> 61
<211> 1370
<212> PRT
<213> 无乳链球菌(Streptococcus agalactiae)
<400> 61
Met Asn Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ser Ile Ile Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met
20 25 30
Arg Val Leu Gly Asn Thr Asp Lys Glu Tyr Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Gly Gly Asn Thr Ala Ala Asp Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ala Glu Glu Met Ser Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Asp Ser Phe Leu Val Glu Glu Asp Lys Arg
100 105 110
Gly Ser Lys Tyr Pro Ile Phe Ala Thr Met Gln Glu Glu Lys Tyr Tyr
115 120 125
His Glu Lys Phe Pro Thr Ile Tyr His Leu Arg Lys Glu Leu Ala Asp
130 135 140
Lys Lys Glu Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Asp Asp Arg Phe Asp
165 170 175
Val Arg Asn Thr Asp Ile Gln Lys Gln Tyr Gln Ala Phe Leu Glu Ile
180 185 190
Phe Asp Thr Thr Phe Glu Asn Asn Asp Leu Leu Ser Gln Asn Val Asp
195 200 205
Val Glu Ala Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp
210 215 220
Arg Ile Leu Ala Arg Tyr Pro Asn Gln Lys Ser Thr Gly Ile Phe Ala
225 230 235 240
Glu Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His
245 250 255
Phe Asn Leu Glu Asp Lys Thr Pro Leu Gln Phe Ala Lys Asp Ser Tyr
260 265 270
Asp Glu Asp Leu Glu Asn Leu Leu Gly Gln Ile Gly Asp Glu Phe Ala
275 280 285
Asp Leu Phe Ser Ala Ala Lys Lys Leu Tyr Asp Ser Val Leu Leu Ser
290 295 300
Gly Ile Leu Thr Val Thr Asp Leu Ser Thr Lys Ala Pro Leu Ser Ala
305 310 315 320
Ser Met Ile Gln Arg Tyr Asp Glu His Arg Glu Asp Leu Lys Gln Leu
325 330 335
Lys Gln Phe Val Lys Ala Ser Leu Pro Glu Lys Tyr Gln Glu Ile Phe
340 345 350
Ala Asp Ser Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Glu Gly Lys Thr
355 360 365
Asn Gln Glu Ala Phe Tyr Lys Tyr Leu Ser Lys Leu Leu Thr Lys Gln
370 375 380
Glu Gly Ser Glu Tyr Leu Leu Glu Lys Ile Lys Asn Glu Asp Phe Leu
385 390 395 400
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Val His
405 410 415
Leu Thr Glu Leu Arg Ala Ile Ile Arg Arg Gln Ser Glu Tyr Tyr Pro
420 425 430
Phe Leu Lys Glu Asn Leu Asp Arg Ile Glu Lys Ile Leu Thr Phe Arg
435 440 445
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Glu Lys Ser Asp Phe Ala
450 455 460
Trp Met Thr Arg Lys Thr Asp Asp Ser Ile Arg Pro Trp Asn Phe Glu
465 470 475 480
Asp Leu Val Asp Lys Glu Lys Ser Ala Glu Ala Phe Ile His Arg Met
485 490 495
Thr Asn Asn Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His
500 505 510
Ser Leu Ile Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
515 520 525
Arg Phe Leu Ala Glu Gly Phe Lys Asp Phe Gln Phe Leu Asn Arg Lys
530 535 540
Gln Lys Glu Thr Ile Phe Asn Ser Leu Phe Lys Glu Lys Arg Lys Val
545 550 555 560
Thr Glu Lys Asp Ile Ile Ser Phe Leu Asn Lys Val Asp Gly Tyr Glu
565 570 575
Gly Ile Ala Ile Lys Gly Ile Glu Lys Gln Phe Asn Ala Ser Leu Ser
580 585 590
Thr Tyr His Asp Leu Lys Lys Ile Leu Gly Lys Asp Phe Leu Asp Asn
595 600 605
Thr Asp Asn Glu Leu Ile Leu Glu Asp Ile Val Gln Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Asp Ile Tyr Lys Asp
625 630 635 640
Phe Phe Thr Glu Ser Gln Leu Lys Lys Leu Tyr Arg Arg His Tyr Thr
645 650 655
Gly Trp Glu Arg Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asn Lys
660 665 670
Glu Asn Gln Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ser Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile Lys Asp Ala Gly Leu Ser Phe Lys
690 695 700
Pro Ile Ile Asp Lys Ala Arg Thr Gly Ser His Leu Asp Asn Leu Lys
705 710 715 720
Glu Val Val Gly Glu Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Val Met Gly Tyr
740 745 750
Glu Pro Glu Gln Ile Val Val Glu Met Ala Arg Glu Asn Gln Thr Thr
755 760 765
Ala Lys Gly Leu Ser Arg Ser Arg Gln Arg Leu Thr Thr Leu Arg Glu
770 775 780
Ser Leu Ala Asn Leu Lys Ser Asn Ile Leu Glu Glu Lys Lys Pro Lys
785 790 795 800
Tyr Val Lys Asp Gln Val Glu Asn His His Leu Ser Asp Asp Arg Leu
805 810 815
Phe Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Asp Asp Glu
820 825 830
Leu Asp Ile Asp Asn Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro
835 840 845
Gln Ala Phe Ile Lys Asp Asp Ser Ile Asp Asn Arg Val Leu Val Ser
850 855 860
Ser Ala Lys Asn Arg Gly Lys Ser Asp Asp Val Pro Ser Leu Glu Ile
865 870 875 880
Val Lys Asp Cys Lys Val Phe Trp Lys Lys Leu Leu Asp Ala Lys Leu
885 890 895
Met Ser Gln Arg Lys Tyr Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly
900 905 910
Leu Thr Ser Asp Asp Lys Ala Arg Phe Ile Gln Arg Gln Leu Val Glu
915 920 925
Thr Arg Gln Ile Thr Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe
930 935 940
Asn Asn Glu Leu Asp Ser Lys Gly Arg Arg Ile Arg Lys Val Lys Ile
945 950 955 960
Val Thr Leu Lys Ser Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Gly
965 970 975
Phe Tyr Lys Ile Arg Glu Val Asn Asn Tyr His His Ala His Asp Ala
980 985 990
Tyr Leu Asn Ala Val Val Ala Lys Ala Ile Leu Thr Lys Tyr Pro Gln
995 1000 1005
Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr Asn Ser
1010 1015 1020
Tyr Lys Thr Arg Lys Ser Ala Thr Glu Lys Leu Phe Phe Tyr Ser
1025 1030 1035
Asn Ile Met Asn Phe Phe Lys Thr Lys Val Thr Leu Ala Asp Gly
1040 1045 1050
Thr Val Val Val Lys Asp Asp Ile Glu Val Asn Asn Asp Thr Gly
1055 1060 1065
Glu Ile Val Trp Asp Lys Lys Lys His Phe Ala Thr Val Arg Lys
1070 1075 1080
Val Leu Ser Tyr Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1085 1090 1095
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Ala His Gly Asn
1100 1105 1110
Ser Asp Lys Leu Ile Pro Arg Lys Thr Lys Asp Ile Tyr Leu Asp
1115 1120 1125
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Ile Val Ala Tyr Ser
1130 1135 1140
Val Leu Val Val Ala Asp Ile Lys Lys Gly Lys Ala Gln Lys Leu
1145 1150 1155
Lys Thr Val Thr Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1160 1165 1170
Arg Phe Glu Lys Asn Pro Ser Ala Phe Leu Glu Ser Lys Gly Tyr
1175 1180 1185
Leu Asn Ile Arg Thr Asp Lys Leu Ile Ile Leu Pro Lys Tyr Ser
1190 1195 1200
Leu Phe Glu Leu Glu Asn Gly Arg Arg Arg Leu Leu Ala Ser Ala
1205 1210 1215
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Thr Gln Tyr
1220 1225 1230
Met Lys Phe Leu Tyr Leu Ala Ser Arg Tyr Asn Glu Leu Lys Gly
1235 1240 1245
Lys Pro Glu Glu Ile Glu Gln Lys Gln Glu Phe Val Val Gln His
1250 1255 1260
Val Ser Tyr Phe Asp Asp Ile Leu Gln Ile Ile Asn Asp Phe Ser
1265 1270 1275
Asn Arg Val Ile Leu Ala Asp Ala Asn Leu Glu Lys Ile Asn Lys
1280 1285 1290
Leu Tyr Gln Asp Asn Lys Glu Asn Ile Pro Val Asp Glu Leu Ala
1295 1300 1305
Asn Asn Ile Ile Asn Leu Phe Thr Phe Thr Ser Leu Gly Ala Pro
1310 1315 1320
Ala Ala Phe Lys Phe Phe Asp Lys Ile Val Asp Arg Lys Arg Tyr
1325 1330 1335
Thr Ser Thr Lys Glu Val Leu Asn Ser Thr Leu Ile His Gln Ser
1340 1345 1350
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Gly Lys Leu Gly
1355 1360 1365
Glu Gly
1370
<210> 62
<211> 1345
<212> PRT
<213> 变异链球菌(Streptococcus mutans)
<400> 62
Met Lys Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Val Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Asp Lys Ser His Ile Lys Lys Asn Leu Leu
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Asn Thr Ala Glu Asp Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Glu Glu Met Gly Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Asp Ser Phe Leu Val Thr Glu Asp Lys Arg
100 105 110
Gly Glu Arg His Pro Ile Phe Gly Asn Leu Glu Glu Glu Val Lys Tyr
115 120 125
His Glu Asn Phe Pro Thr Ile Tyr His Leu Arg Gln Tyr Leu Ala Asp
130 135 140
Asn Pro Glu Lys Val Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Ile Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Lys Phe Asp Thr
165 170 175
Arg Asn Asn Asp Val Gln Arg Leu Phe Gln Glu Phe Leu Ala Val Tyr
180 185 190
Asp Asn Thr Phe Glu Asn Ser Ser Leu Gln Glu Gln Asn Val Gln Val
195 200 205
Glu Glu Ile Leu Thr Asp Lys Ile Ser Lys Ser Ala Lys Lys Asp Arg
210 215 220
Val Leu Lys Leu Phe Pro Asn Glu Lys Ser Asn Gly Arg Phe Ala Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe
245 250 255
Glu Leu Glu Glu Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Glu
260 265 270
Glu Glu Leu Glu Val Leu Leu Ala Gln Ile Gly Asp Asn Tyr Ala Glu
275 280 285
Leu Phe Leu Ser Ala Lys Lys Leu Tyr Asp Ser Ile Leu Leu Ser Gly
290 295 300
Ile Leu Thr Val Thr Asp Val Ser Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Gln Arg Tyr Asn Glu His Gln Met Asp Leu Ala Gln Leu Lys
325 330 335
Gln Phe Ile Arg Gln Lys Leu Ser Asp Lys Tyr Asn Glu Val Phe Ser
340 345 350
Asp Val Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Ala Phe Tyr Lys Tyr Leu Lys Gly Leu Leu Asn Lys Ile Glu
370 375 380
Gly Ser Gly Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Ile Arg Arg Gln Ala Glu Phe Tyr Pro Phe
420 425 430
Leu Ala Asp Asn Gln Asp Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Lys Ser Asp Phe Ala Trp
450 455 460
Leu Ser Arg Lys Ser Ala Asp Lys Ile Thr Pro Trp Asn Phe Asp Glu
465 470 475 480
Ile Val Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Asn Tyr Asp Leu Tyr Leu Pro Asn Gln Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Lys Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Lys Thr Glu Gln Gly Lys Thr Ala Phe Phe Asp Ala Asn Met Lys
530 535 540
Gln Glu Ile Phe Asp Gly Val Phe Lys Val Tyr Arg Lys Val Thr Lys
545 550 555 560
Asp Lys Leu Met Asp Phe Leu Glu Lys Glu Phe Asp Glu Phe Arg Ile
565 570 575
Val Asp Leu Thr Gly Leu Asp Lys Glu Asn Lys Val Phe Asn Ala Ser
580 585 590
Tyr Gly Thr Tyr His Asp Leu Cys Lys Ile Leu Asp Lys Asp Phe Leu
595 600 605
Asp Asn Ser Lys Asn Glu Lys Ile Leu Glu Asp Ile Val Leu Thr Leu
610 615 620
Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu Glu Asn Tyr
625 630 635 640
Ser Asp Leu Leu Thr Lys Glu Gln Val Lys Lys Leu Glu Arg Arg His
645 650 655
Tyr Thr Gly Trp Gly Arg Leu Ser Ala Glu Leu Ile His Gly Ile Arg
660 665 670
Asn Lys Glu Ser Arg Lys Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly
675 680 685
Asn Ser Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Ala Leu Ser
690 695 700
Phe Lys Glu Glu Ile Ala Lys Ala Gln Val Ile Gly Glu Thr Asp Asn
705 710 715 720
Leu Asn Gln Val Val Ser Asp Ile Ala Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Leu Lys Ile Val Asp Glu Leu Val Lys Ile Met
740 745 750
Gly His Gln Pro Glu Asn Ile Val Val Glu Met Ala Arg Glu Asn Gln
755 760 765
Phe Thr Asn Gln Gly Arg Gln Asn Ser Gln Gln Arg Leu Lys Gly Leu
770 775 780
Thr Asp Ser Ile Lys Glu Phe Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Ser Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Thr Gly Glu Glu Leu Asp Ile Asp Tyr
820 825 830
Leu Ser Gln Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe Ile Lys
835 840 845
Asp Asn Ser Ile Asp Asn Arg Val Leu Thr Ser Ser Lys Glu Asn Arg
850 855 860
Gly Lys Ser Asp Asp Val Pro Ser Glu Asp Val Val Arg Lys Met Lys
865 870 875 880
Ser Tyr Trp Ser Lys Leu Leu Ser Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Thr Asp Asp Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe Tyr Thr Glu Thr Asp
930 935 940
Glu Asn Asn Lys Lys Ile Arg Gln Val Lys Ile Val Thr Leu Lys Ser
945 950 955 960
Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Glu Leu Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Ile Gly Lys Ala Leu Leu Gly Val Tyr Pro Gln Leu Glu Pro Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Pro His Phe His Gly His Lys Glu Asn Lys
1010 1015 1020
Ala Thr Ala Lys Lys Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1025 1030 1035
Lys Lys Asp Asp Val Arg Thr Asp Lys Asn Gly Glu Ile Ile Trp
1040 1045 1050
Lys Lys Asp Glu His Ile Ser Asn Ile Lys Lys Val Leu Ser Tyr
1055 1060 1065
Pro Gln Val Asn Ile Val Lys Lys Val Glu Glu Gln Thr Gly Gly
1070 1075 1080
Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Asn Ser Asp Lys Leu
1085 1090 1095
Ile Pro Arg Lys Thr Lys Lys Phe Tyr Trp Asp Thr Lys Lys Tyr
1100 1105 1110
Gly Gly Phe Asp Ser Pro Ile Val Ala Tyr Ser Ile Leu Val Ile
1115 1120 1125
Ala Asp Ile Glu Lys Gly Lys Ser Lys Lys Leu Lys Thr Val Lys
1130 1135 1140
Ala Leu Val Gly Val Thr Ile Met Glu Lys Met Thr Phe Glu Arg
1145 1150 1155
Asp Pro Val Ala Phe Leu Glu Arg Lys Gly Tyr Arg Asn Val Gln
1160 1165 1170
Glu Glu Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Lys Leu
1175 1180 1185
Glu Asn Gly Arg Lys Arg Leu Leu Ala Ser Ala Arg Glu Leu Gln
1190 1195 1200
Lys Gly Asn Glu Ile Val Leu Pro Asn His Leu Gly Thr Leu Leu
1205 1210 1215
Tyr His Ala Lys Asn Ile His Lys Val Asp Glu Pro Lys His Leu
1220 1225 1230
Asp Tyr Val Asp Lys His Lys Asp Glu Phe Lys Glu Leu Leu Asp
1235 1240 1245
Val Val Ser Asn Phe Ser Lys Lys Tyr Thr Leu Ala Glu Gly Asn
1250 1255 1260
Leu Glu Lys Ile Lys Glu Leu Tyr Ala Gln Asn Asn Gly Glu Asp
1265 1270 1275
Leu Lys Glu Leu Ala Ser Ser Phe Ile Asn Leu Leu Thr Phe Thr
1280 1285 1290
Ala Ile Gly Ala Pro Ala Thr Phe Lys Phe Phe Asp Lys Asn Ile
1295 1300 1305
Asp Arg Lys Arg Tyr Thr Ser Thr Thr Glu Ile Leu Asn Ala Thr
1310 1315 1320
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1325 1330 1335
Leu Ser Lys Leu Gly Gly Asp
1340 1345
<210> 63
<211> 1347
<212> PRT
<213> Streptococcus plurextorum
<400> 63
Met Gln Lys Thr Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Phe Ser Val Val Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Asn Gly Asn Thr Asp Lys Lys Tyr Leu Lys Lys Asn Leu Leu
35 40 45
Gly Thr Leu Leu Phe Asp Ser Gly Glu Thr Ala Ala Gly Thr Arg Met
50 55 60
Arg Arg Thr Thr Arg Arg Arg Tyr Val Arg Arg Asn Asn Arg Leu Arg
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ala Asp Gln Met Glu Gln Ile Asp Pro Asn
85 90 95
Phe Phe His Arg Leu Lys Glu Ser Phe Leu Asp Glu Glu Asp Lys Gln
100 105 110
Phe Glu Gln His Pro Ile Phe Gly Thr Leu Ala Glu Glu Val Ala Tyr
115 120 125
His Gln Gln Phe Pro Thr Ile Tyr His Leu Arg Lys His Leu Ala Asp
130 135 140
Ser Lys Glu Gln Val Asp Leu Arg Leu Val Tyr Met Ala Leu Ala His
145 150 155 160
Ile Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Gly Leu Glu Ser
165 170 175
Gln Ala Val Gly Ile Gln Gln Leu Phe Asp Glu Phe Val Gln Val Tyr
180 185 190
Asp Ser Val Phe Glu Gly Ser Asp Leu Val Ser Ile His Ala Glu Val
195 200 205
Glu Pro Ile Leu Val Asp Lys Leu Ser Lys Ser Val Lys Lys Asp Arg
210 215 220
Val Met Gln Leu Phe Pro Thr Glu Lys Ser Asn Gly Asn Phe Ala Glu
225 230 235 240
Phe Met Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys Val Phe
245 250 255
Ser Leu Asp Glu Lys Ala Val Leu Gln Leu Ser Lys Asp Thr Tyr Glu
260 265 270
Glu Glu Leu Ala Asp Leu Leu Gly Lys Val Gly Asp Asp Tyr Leu Asp
275 280 285
Leu Phe His Ala Ala Lys Arg Leu Tyr Asp Ala Val Leu Leu Ala Gly
290 295 300
Ile Ile Thr Ser Gln Asp Ile Ala Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Val Gln Arg Tyr Glu Glu His Gln Ser Asp Leu Lys Ala Leu Lys
325 330 335
Lys His Ile Pro Asn Tyr Lys Pro Asp Glu Arg Lys Leu Tyr Lys Glu
340 345 350
Met Phe Asn Asp Ser Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Glu Gly
355 360 365
Gly Val Lys Gln Glu Glu Phe Tyr Lys Tyr Thr Lys Ala Leu Leu Ser
370 375 380
Glu Ile Glu Asn Ser Gln Tyr Phe Ile Asp Lys Ile Glu Arg Glu Asp
385 390 395 400
Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ala Ile Pro His Gln
405 410 415
Ile His Leu Gln Glu Leu Lys Ala Ile Val Arg Arg Gln Gly Glu His
420 425 430
Tyr Pro Phe Leu Lys Glu Glu Gln His Lys Ile Glu Ala Leu Leu Thr
435 440 445
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
450 455 460
Phe Ala Trp Ala Val Arg Lys Ser Asn Glu Lys Ile Thr Pro Trp Asn
465 470 475 480
Phe Glu Glu Ile Ile Asp Lys Glu Glu Ser Ala Arg Lys Phe Ile Glu
485 490 495
Arg Met Thr Asn Val Asp Leu Tyr Leu Pro Asp Glu Lys Val Leu Pro
500 505 510
Lys His Ser Phe Leu Tyr Glu Lys Phe Ala Val Phe Asn Glu Leu Thr
515 520 525
Lys Val Lys Tyr Ile Thr Glu Gln Gly Lys Glu Glu Phe Phe Asp Cys
530 535 540
His Leu Lys Arg Glu Ile Phe Glu Gln Val Phe Lys Asn Ser Arg Lys
545 550 555 560
Val Lys Lys Lys Asp Leu Leu Asn Phe Leu Asp Lys Glu Phe Glu Glu
565 570 575
Phe Arg Ile Val Asp Ile Thr Gly Leu Asp Ser Glu Lys Gln Glu Phe
580 585 590
Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Lys Lys Ile Leu Asp Lys
595 600 605
Asp Phe Leu Asp Asp Val Ala Asn Glu His Leu Leu Glu Glu Leu Ile
610 615 620
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Arg Lys Arg Leu
625 630 635 640
Ser Lys Tyr Ser Glu Ala Leu Thr Lys Glu Gln Leu Lys Lys Leu Glu
645 650 655
Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Ala Lys Leu Leu Asn
660 665 670
Gly Ile Arg His Lys Ala Thr Asn Lys Thr Ile Leu Asp Tyr Leu Met
675 680 685
Asp Asp Gly Gln Ile Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
690 695 700
Gly Leu Asp Phe Lys Thr Ile Ile Ser Glu Ala Gln Val Ile Gly Glu
705 710 715 720
Arg Asp Asp Leu Lys Ala Ile Val Asp Asp Ile Ala Gly Ser Pro Ala
725 730 735
Ile Lys Lys Gly Ile Leu Gln Ser Leu Lys Val Val Glu Glu Leu Val
740 745 750
Ser Ile Met Gly His Asn Pro Glu Ser Ile Ile Ile Glu Met Ala Arg
755 760 765
Glu Asn Gln Thr Thr Gln Lys Gly Arg Lys Asn Ser Gln Gln Arg Leu
770 775 780
Thr Gly Leu Thr Asn Ser Ile Arg Glu Leu Gly Ser Asp Ile Leu Lys
785 790 795 800
Glu Phe Pro Val Asp Asn Ser Gln Leu Gln Asn Asp Arg Leu Tyr Leu
805 810 815
Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Glu Thr Leu Asn
820 825 830
Ile Asp Gln Leu Ser His Tyr Asp Ile Asp His Ile Ile Pro Gln Ser
835 840 845
Phe Ile Lys Asp Asp Ser Leu Asp Asn Arg Val Leu Thr Ser Ser Lys
850 855 860
Ser Asn Arg Gly Lys Ser Asp Ser Val Pro Ser Gln Glu Ile Val Gln
865 870 875 880
Lys Met Lys Pro Phe Trp Lys Lys Leu Arg Asp Ala Gln Leu Ile Ser
885 890 895
Lys Arg Lys Phe Asp Asn Leu Thr Lys Ser Glu Arg Gly Gly Leu Ser
900 905 910
Gln Glu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
915 920 925
Gln Ile Thr Lys His Val Ala Arg Ile Leu Asp Glu Arg Phe Asn Gln
930 935 940
Lys Arg Asp Asp Asn Asn Lys Leu Ile Arg Asp Val Lys Ile Ile Thr
945 950 955 960
Leu Lys Ser Asn Leu Val Ser Gln Phe Arg Lys Glu Phe Glu Leu Tyr
965 970 975
Lys Ile Arg Glu Leu Asn Asp Tyr His His Ala His Asp Ala Tyr Leu
980 985 990
Asn Ala Val Val Gly Lys Ala Leu Leu Ala Lys Tyr Pro Gln Leu Glu
995 1000 1005
Ala Glu Phe Val Phe Gly Asp Tyr Pro Lys Tyr Asn Ser Tyr Lys
1010 1015 1020
Glu Arg Met Thr Ala Thr Gln Lys Val Leu Phe Tyr Ser Asn Ile
1025 1030 1035
Leu Asn Phe Leu Lys Asp Gly Asn Lys His Gly Asn Glu Asp Gly
1040 1045 1050
Glu Val Ile Trp Asp Pro Asn Tyr His Leu Pro Met Ile Lys Lys
1055 1060 1065
Val Leu Ser Tyr Pro Gln Val Asn Ile Val Lys Lys Thr Glu Ile
1070 1075 1080
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Gly Asp
1085 1090 1095
Ser Asp Lys Leu Ile Arg Arg Lys Asn Asn Trp Asp Pro Lys Lys
1100 1105 1110
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1115 1120 1125
Ile Ala Asp Val Ala Lys Gly Lys Ala Gln Lys Leu Lys Thr Val
1130 1135 1140
Lys Glu Leu Val Gly Ile Thr Ile Met Glu Arg Ser Ala Phe Glu
1145 1150 1155
Lys Asn Pro Ile Val Phe Leu Glu Ser Lys Gly Tyr Gln Asn Ile
1160 1165 1170
Gln Glu Lys Asn Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1175 1180 1185
Leu Glu Glu Gly Arg Arg Arg Leu Leu Ala Ser Ala Ile Glu Leu
1190 1195 1200
Gln Lys Gly Asn Gln Leu Val Leu Ser Gln Glu Gln Ile Asn Leu
1205 1210 1215
Leu Tyr His Ala Gln Arg Val Lys Asn Leu Glu Gln Pro Glu His
1220 1225 1230
Leu Arg Tyr Val Glu Glu His Lys Ala Glu Phe Glu Val Ile Leu
1235 1240 1245
Asn Thr Leu Leu Ile Ala Ala Glu Arg Tyr Ile Leu Lys Pro Lys
1250 1255 1260
Val Ile Glu Met Ile Lys Lys Ala Leu Glu Ser Asn Gln Leu Asp
1265 1270 1275
Ile Thr Gln Tyr Ala Glu Ser Phe Val Asn Leu Leu Lys Phe Thr
1280 1285 1290
Ala Phe Gly Ala Pro Gly Gly Phe Lys Cys Phe Gly Ile Glu Ile
1295 1300 1305
Lys Gln Ala Asn Leu Arg Tyr Gln Thr Val Thr Glu Cys Leu Asn
1310 1315 1320
Ala Thr Leu Ile His Gln Tyr Val Thr Gly Leu Tyr Glu Thr Arg
1325 1330 1335
Ile Asp Leu Ser Lys Leu Gly Gly Glu
1340 1345
<210> 64
<211> 1388
<212> PRT
<213> 嗜热链球菌(Streptococcus thermophilus)
<400> 64
Met Thr Lys Pro Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asn Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Ser Lys Lys Tyr Ile Lys Lys Asn Leu Leu
35 40 45
Gly Val Leu Leu Phe Asp Ser Gly Ile Thr Ala Glu Gly Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Arg Asn Arg Ile Leu
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Thr Glu Met Ala Thr Leu Asp Asp Ala
85 90 95
Phe Phe Gln Arg Leu Asp Asp Ser Phe Leu Val Pro Asp Asp Lys Arg
100 105 110
Asp Ser Lys Tyr Pro Ile Phe Gly Asn Leu Val Glu Glu Lys Ala Tyr
115 120 125
His Asp Glu Phe Pro Thr Ile Tyr His Leu Arg Lys Tyr Leu Ala Asp
130 135 140
Ser Thr Lys Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Tyr Arg Gly His Phe Leu Ile Glu Gly Glu Phe Asn Ser
165 170 175
Lys Asn Asn Asp Ile Gln Lys Asn Phe Gln Asp Phe Leu Asp Thr Tyr
180 185 190
Asn Ala Ile Phe Glu Ser Asp Leu Ser Leu Glu Asn Ser Lys Gln Leu
195 200 205
Glu Glu Ile Val Lys Asp Lys Ile Ser Lys Leu Glu Lys Lys Asp Arg
210 215 220
Ile Leu Lys Leu Phe Pro Gly Glu Lys Asn Ser Gly Ile Phe Ser Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Arg Lys Cys Phe
245 250 255
Asn Leu Asp Glu Lys Ala Ser Leu His Phe Ser Lys Glu Ser Tyr Asp
260 265 270
Glu Asp Leu Glu Thr Leu Leu Gly Tyr Ile Gly Asp Asp Tyr Ser Asp
275 280 285
Val Phe Leu Lys Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Phe Leu Thr Val Thr Asp Asn Glu Thr Glu Ala Pro Leu Ser Ser Ala
305 310 315 320
Met Ile Lys Arg Tyr Asn Glu His Lys Glu Asp Leu Ala Leu Leu Lys
325 330 335
Glu Tyr Ile Arg Asn Ile Ser Leu Lys Thr Tyr Asn Glu Val Phe Lys
340 345 350
Asp Asp Thr Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Asn
355 360 365
Gln Glu Asp Phe Tyr Val Tyr Leu Lys Asn Leu Leu Ala Glu Phe Glu
370 375 380
Gly Ala Asp Tyr Phe Leu Glu Lys Ile Asp Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro Tyr Gln Ile His Leu
405 410 415
Gln Glu Met Arg Ala Ile Leu Asp Lys Gln Ala Lys Phe Tyr Pro Phe
420 425 430
Leu Ala Lys Asn Lys Glu Arg Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Asp Phe Ala Trp
450 455 460
Ser Ile Arg Lys Arg Asn Glu Lys Ile Thr Pro Trp Asn Phe Glu Asp
465 470 475 480
Val Ile Asp Lys Glu Ser Ser Ala Glu Ala Phe Ile Asn Arg Met Thr
485 490 495
Ser Phe Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Thr Phe Asn Val Tyr Asn Glu Leu Thr Lys Val Arg
515 520 525
Phe Ile Ala Glu Ser Met Arg Asp Tyr Gln Phe Leu Asp Ser Lys Gln
530 535 540
Lys Lys Asp Ile Val Arg Leu Tyr Phe Lys Asp Lys Arg Lys Val Thr
545 550 555 560
Asp Lys Asp Ile Ile Glu Tyr Leu His Ala Ile Tyr Gly Tyr Asp Gly
565 570 575
Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ser Ser Leu Ser Thr
580 585 590
Tyr His Asp Leu Leu Asn Ile Ile Asn Asp Lys Glu Phe Leu Asp Asp
595 600 605
Ser Ser Asn Glu Ala Ile Ile Glu Glu Ile Ile His Thr Leu Thr Ile
610 615 620
Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ser Lys Phe Glu Asn
625 630 635 640
Ile Phe Asp Lys Ser Val Leu Lys Lys Leu Ser Arg Arg His Tyr Thr
645 650 655
Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Arg Asp Glu
660 665 670
Lys Ser Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Ile Ser
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ala Leu Ser Phe Lys
690 695 700
Lys Lys Ile Gln Lys Ala Gln Ile Ile Gly Asp Glu Asp Lys Gly Asn
705 710 715 720
Ile Lys Glu Val Val Lys Ser Leu Pro Gly Ser Pro Ala Ile Lys Lys
725 730 735
Gly Ile Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met
740 745 750
Gly Gly Arg Lys Pro Glu Ser Ile Val Val Glu Met Ala Arg Glu Asn
755 760 765
Gln Tyr Thr Asn Gln Gly Lys Ser Asn Ser Gln Gln Arg Leu Lys Arg
770 775 780
Leu Glu Lys Ser Leu Lys Glu Leu Gly Ser Lys Ile Leu Lys Glu Asn
785 790 795 800
Ile Pro Ala Lys Leu Ser Lys Ile Asp Asn Asn Ala Leu Gln Asn Asp
805 810 815
Arg Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly
820 825 830
Asp Asp Leu Asp Ile Asp Arg Leu Ser Asn Tyr Asp Ile Asp His Ile
835 840 845
Ile Pro Gln Ala Phe Leu Lys Asp Asn Ser Ile Asp Asn Lys Val Leu
850 855 860
Val Ser Ser Ala Ser Asn Arg Gly Lys Ser Asp Asp Phe Pro Ser Leu
865 870 875 880
Glu Val Val Lys Lys Arg Lys Thr Phe Trp Tyr Gln Leu Leu Lys Ser
885 890 895
Lys Leu Ile Ser Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Leu Pro Glu Asp Lys Ala Gly Phe Ile Gln Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Arg Leu Leu Asp Glu
930 935 940
Lys Phe Asn Asn Lys Lys Asp Glu Asn Asn Arg Ala Val Arg Thr Val
945 950 955 960
Lys Ile Ile Thr Leu Lys Ser Thr Leu Val Ser Gln Phe Arg Lys Asp
965 970 975
Phe Glu Leu Tyr Lys Val Cys Glu Ile Asn Asp Phe His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Ile Ala Ser Ala Leu Leu Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Pro Glu Phe Val Tyr Gly Asp Tyr Pro Lys Tyr
1010 1015 1020
Asn Ser Phe Arg Glu Arg Lys Ser Ala Thr Glu Lys Val Tyr Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Ile Phe Lys Lys Ser Ile Ser Leu Ala
1040 1045 1050
Asp Gly Arg Val Ile Glu Arg Pro Leu Ile Glu Val Asn Glu Glu
1055 1060 1065
Thr Gly Glu Ser Val Trp Asn Lys Glu Ser Asp Leu Ala Thr Val
1070 1075 1080
Arg Arg Val Leu Ser Tyr Pro Gln Val Asn Val Val Lys Lys Val
1085 1090 1095
Glu Glu Gln Asn His Gly Leu Asp Arg Gly Lys Pro Lys Gly Leu
1100 1105 1110
Phe Asn Ala Asn Leu Ser Ser Lys Pro Lys Pro Asn Ser Asn Glu
1115 1120 1125
Asn Leu Val Gly Ala Lys Glu Tyr Leu Asp Pro Lys Lys Tyr Gly
1130 1135 1140
Gly Tyr Ala Gly Ile Ser Asn Ser Phe Ala Val Leu Val Lys Gly
1145 1150 1155
Thr Ile Glu Lys Gly Ala Lys Lys Lys Ile Thr Asn Val Leu Glu
1160 1165 1170
Phe Gln Gly Ile Ser Ile Leu Asp Arg Ile Asn Tyr Arg Lys Asp
1175 1180 1185
Lys Leu Asn Phe Leu Leu Glu Lys Gly Tyr Lys Asp Ile Glu Leu
1190 1195 1200
Ile Ile Glu Leu Pro Lys Tyr Ser Leu Phe Glu Leu Ser Asp Gly
1205 1210 1215
Ser Arg Arg Met Leu Ala Ser Ile Leu Ser Thr Asn Asn Lys Arg
1220 1225 1230
Gly Glu Ile His Lys Gly Asn Gln Ile Phe Leu Ser Gln Lys Phe
1235 1240 1245
Val Lys Leu Leu Tyr His Ala Lys Arg Ile Ser Asn Thr Ile Asn
1250 1255 1260
Glu Asn His Arg Lys Tyr Val Glu Asn His Lys Lys Glu Phe Glu
1265 1270 1275
Glu Leu Phe Tyr Tyr Ile Leu Glu Phe Asn Glu Asn Tyr Val Gly
1280 1285 1290
Ala Lys Lys Asn Gly Lys Leu Leu Asn Ser Ala Phe Gln Ser Trp
1295 1300 1305
Gln Asn His Ser Ile Asp Glu Leu Cys Ser Ser Phe Ile Gly Pro
1310 1315 1320
Thr Gly Ser Glu Arg Lys Gly Leu Phe Glu Leu Thr Ser Arg Gly
1325 1330 1335
Ser Ala Ala Asp Phe Glu Phe Leu Gly Val Lys Ile Pro Arg Tyr
1340 1345 1350
Arg Asp Tyr Thr Pro Ser Ser Leu Leu Lys Asp Ala Thr Leu Ile
1355 1360 1365
His Gln Ser Val Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ala
1370 1375 1380
Lys Leu Gly Glu Gly
1385
<210> 65
<211> 54
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /注释="人工序列的描述: 合成寡核苷酸"
<400> 65
tcgaattcca cttacggatc gttcaacgca ggctacggtt agctacctag tagg 54

Claims (26)

1.一种用于制备核酸分子的方法,所述方法包含在反应混合物中进行聚合酶链反应(PCR),所述反应混合物含有(i)双股核酸区段和(ii)至少一种寡核苷酸,所述寡核苷酸能够与核酸在所述双股核酸区段的一个末端杂交,
其中所述核酸分子是通过所述PCR反应产生,并且
其中所述产物核酸分子在或靠近一个末端含有适于活体外转录的启动子。
2.根据权利要求1所述的方法,其中通过所述PCR反应产生的所述核酸分子编码长度为35到150个核苷酸的RNA分子。
3.根据权利要求1所述的方法,其中通过所述PCR反应产生的所述核酸分子具有70到150个碱基对的长度。
4.根据权利要求1所述的方法,其中通过所述PCR反应产生的所述核酸分子编码具有至少两个发夹弯的RNA分子。
5.根据权利要求1所述的方法,其中通过所述PCR反应产生的所述核酸分子编码CRISPRRNA。
6.根据权利要求5所述的方法,其中通过所述PCR反应产生的所述核酸分子编码向导RNA。
7.一种用于制备核酸分子的方法,所述方法包含在反应混合物中进行聚合酶链反应(PCR),所述反应混合物包含:(i)包含第一末端和第二末端的双股核酸区段;(ii)包含第一末端和第二末端的第一寡核苷酸,其中所述第一寡核苷酸的所述第二末端能够与所述双股核酸区段的所述第一末端杂交;以及(iii)包含第一末端和第二末端的第二寡核苷酸,其中所述第二寡核苷酸的所述第二末端能够与所述第一寡核苷酸的所述第一末端杂交,从而产生所述核酸分子,
其中所述产物核酸分子在或靠近一个末端含有适于活体外转录的启动子且编码CRISPR RNA。
8.根据权利要求7所述的方法,其中通过所述PCR反应产生的所述核酸分子编码向导RNA。
9.根据权利要求7所述的方法,其中所述反应混合物进一步包含第一引物和第二引物,其中所述第一引物能够在或靠近所述第二寡核苷酸的所述第一末端进行杂交且所述第二引物能够在或靠近所述双股核酸区段的所述第二末端进行杂交。
10.一种用于制备核酸分子的方法,所述方法包含在反应混合物中进行聚合酶链反应,所述反应混合物含有:(i)包含第一末端和第二末端的第一双股核酸区段;(ii)包含第一末端和第二末端的第二双股核酸区段;以及至少一种包含第一末端和第二末端的寡核苷酸,其中所述寡核苷酸的所述第一末端能够与核酸在所述第一双股核酸区段的所述第一末端杂交以产生所述核酸分子,且其中所述寡核苷酸的所述第二末端能够与核酸在所述第二双股核酸区段的第二末端杂交以产生所述核酸分子,并且
其中所述产物核酸分子在或靠近一个末端含有适于活体外转录的启动子。
11.一种用于制备核酸分子的方法,所述方法包含在反应混合物中进行聚合酶链反应,所述反应混合物含有:(i)包含第一末端和第二末端的第一双股核酸区段;(ii)包含第一末端和第二末端的第二双股核酸区段;(iii)包含第一末端和第二末端的第一寡核苷酸;以及(iv)包含第一末端和第二末端的第二寡核苷酸,
其中所述第一寡核苷酸的所述第二末端能够与核酸在所述第二双股核酸区段的所述第一末端杂交,其中所述第二寡核苷酸的所述第二末端能够与所述第一寡核苷酸的所述第一末端杂交,其中所述第二寡核苷酸的所述第二末端能够与所述第二双股核酸区段的所述第一末端杂交,且其中所述产物核酸分子在或靠近一个末端含有适于活体外转录的启动子。
12.一种用于制备CRISPR RNA的方法,所述方法包含在允许第一RNA区段的5'末端与第二RNA区段的3'末端共价连接以形成所述CRISPR RNA的条件下使两个或超过两个线性RNA区段彼此接触。
13.根据权利要求12所述的方法,其中从反应混合物组分中分离出所述CRISPRRNA。
14.根据权利要求13所述的方法,其中通过高效液相色谱法从反应混合物组分中分离出所述CRISPR RNA。
15.一种用于制备向导RNA分子的方法,所述方法包含:
(a)分别制备crRNA分子和tracrRNA分子,以及
(b)在允许所述crRNA的所述3'末端与所述tracrRNA的所述5'末端发生所述共价连接以产生所述向导RNA分子的条件下使所述crRNA分子和所述tracrRNA分子彼此接触。
16.根据权利要求15所述的方法,其中向导RNA分子具有与目标基因座互补的至少10个核苷酸的序列区域。
17.根据权利要求16所述的方法,其中所述目标基因座是真核细胞中天然存在的染色体基因座。
18.一种包含经***基连接的两个RNA分子的组合物,其中所述RNA分子之一具有与目标基因座互补的至少10个核苷酸的序列区域。
19.一种用于对细胞内的目标基因座进行基因剪辑的方法,所述方法包含将至少一种CRISPR蛋白质和至少一种CRISPR RNA引入所述细胞中,
其中所述至少一种CRISPR RNA具有与所述目标基因座互补的至少10个碱基对的序列区域。
20.根据权利要求19所述的方法,其中还将在两个末端均与所述目标基因座具有序列同源性的线性DNA区段引入所述细胞中。
21.根据权利要求19所述的方法,其中所述至少一种CRISPR蛋白质是Cas9蛋白质。
22.根据权利要求21所述的方法,其中所述Cas9蛋白质具有在DNA中产生双股切口的能力。
23.根据权利要求21所述的方法,其中将两种Cas9蛋白质引入所述细胞中且每种Cas9蛋白质具有点切双股DNA的能力。
24.根据权利要求23所述的方法,其中所述Cas9蛋白质之一具有使得HNH域失活的突变且所述另一种Cas9蛋白质具有使得RuvC域致使HNH域失活的突变。
25.根据权利要求19所述的方法,其中将各自具有与不同目标序列互补的序列的两种RNA分子引入所述细胞中。
26.根据权利要求25所述的方法,其中所述不同目标序列位于彼此的二十个碱基对内。
CN201580066476.8A 2014-10-09 2015-10-09 Crispr寡核苷酸和基因剪辑 Pending CN107002078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111303287.1A CN113930455A (zh) 2014-10-09 2015-10-09 Crispr寡核苷酸和基因剪辑

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462061961P 2014-10-09 2014-10-09
US62/061,961 2014-10-09
US201562101787P 2015-01-09 2015-01-09
US62/101,787 2015-01-09
US201562218826P 2015-09-15 2015-09-15
US62/218,826 2015-09-15
PCT/US2015/054986 WO2016057951A2 (en) 2014-10-09 2015-10-09 Crispr oligonucleotides and gene editing

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202111303287.1A Division CN113930455A (zh) 2014-10-09 2015-10-09 Crispr寡核苷酸和基因剪辑

Publications (1)

Publication Number Publication Date
CN107002078A true CN107002078A (zh) 2017-08-01

Family

ID=54356656

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202111303287.1A Pending CN113930455A (zh) 2014-10-09 2015-10-09 Crispr寡核苷酸和基因剪辑
CN201580066476.8A Pending CN107002078A (zh) 2014-10-09 2015-10-09 Crispr寡核苷酸和基因剪辑

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202111303287.1A Pending CN113930455A (zh) 2014-10-09 2015-10-09 Crispr寡核苷酸和基因剪辑

Country Status (4)

Country Link
US (3) US9879283B2 (zh)
EP (2) EP3204513A2 (zh)
CN (2) CN113930455A (zh)
WO (1) WO2016057951A2 (zh)

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012333134B2 (en) 2011-07-22 2017-05-25 John Paul Guilinger Evaluation and improvement of nuclease cleavage specificity
ES2943498T3 (es) 2013-08-05 2023-06-13 Twist Bioscience Corp Genotecas sintetizadas de novo
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
KR20220142547A (ko) 2014-02-11 2022-10-21 더 리전츠 오브 더 유니버시티 오브 콜로라도, 어 바디 코퍼레이트 Crispr 이용의 다중화된 게놈 조작
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EP3209303A1 (en) 2014-10-24 2017-08-30 Avectas Limited Delivery across cell plasma membranes
CN107250148B (zh) 2014-12-03 2021-04-16 安捷伦科技有限公司 具有化学修饰的指导rna
US10059940B2 (en) 2015-01-27 2018-08-28 Minghong Zhong Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents
CA2975852A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016126987A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
AU2016246450B2 (en) 2015-04-06 2022-03-17 Agilent Technologies, Inc. Chemically modified guide RNAs for CRISPR/Cas-mediated gene regulation
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
WO2016186745A1 (en) * 2015-05-15 2016-11-24 Ge Healthcare Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
IL258164B (en) 2015-09-18 2022-09-01 Twist Bioscience Corp Methods to regulate the activity of proteins and cells and a method for the production of nucleic acids
CN113604546A (zh) 2015-09-22 2021-11-05 特韦斯特生物科学公司 用于核酸合成的柔性基底
SG10202104041PA (en) 2015-10-23 2021-06-29 Harvard College Nucleobase editors and uses thereof
EP3384077A4 (en) 2015-12-01 2019-05-08 Twist Bioscience Corporation FUNCTIONALIZED SURFACES AND THEIR PREPARATION
CN109312315B (zh) * 2015-12-30 2023-06-09 阿维塔斯有限公司 基因编辑蛋白和组合物向细胞和组织的无载体递送
CN109415729B (zh) * 2016-04-21 2022-12-09 生命技术公司 具有降低毒性的基因编辑试剂
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
AU2017280353B2 (en) 2016-06-24 2021-11-11 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
WO2018031683A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
AU2017315294B2 (en) 2016-08-22 2023-12-21 Twist Bioscience Corporation De novo synthesized nucleic acid libraries
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US10417457B2 (en) 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
EP3526320A1 (en) 2016-10-14 2019-08-21 President and Fellows of Harvard College Aav delivery of nucleobase editors
EA201991262A1 (ru) 2016-12-16 2020-04-07 Твист Байосайенс Корпорейшн Библиотеки вариантов иммунологического синапса и их синтез
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
CN110249052B (zh) * 2016-12-30 2024-04-12 爱迪塔斯医药公司 合成的指导分子、组合物和与其相关的方法
EP3586255A4 (en) 2017-02-22 2021-03-31 Twist Bioscience Corporation NUCLEIC ACID-BASED DATA STORAGE
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3595674A4 (en) 2017-03-15 2020-12-16 Twist Bioscience Corporation BANKS OF VARIANTS OF IMMUNOLOGICAL SYNAPSE AND THEIR SYNTHESIS
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
EP3615672A1 (en) * 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
JP7169999B2 (ja) 2017-06-12 2022-11-11 ツイスト バイオサイエンス コーポレーション シームレス核酸アセンブリのための方法
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
MX2019015188A (es) 2017-06-15 2020-08-03 Univ California Inserciones de adn no virales orientadas.
CN107365793A (zh) * 2017-06-19 2017-11-21 百格基因科技(江苏)有限公司 一种适用于植物的大规模基因组编辑的方法
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
RS63202B1 (sr) 2017-06-30 2022-06-30 Inscripta Inc Automatizovani postupci, moduli, instrumenti i sistemi za obradu ćelija
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
US10738327B2 (en) 2017-08-28 2020-08-11 Inscripta, Inc. Electroporation cuvettes for automation
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
GB2581620A (en) 2017-09-11 2020-08-26 Twist Bioscience Corp GPCR binding proteins and synthesis thereof
AU2018338990B2 (en) 2017-09-30 2022-06-23 Inscripta, Inc. Flow through electroporation instrumentation
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
JP7066840B2 (ja) 2017-10-20 2022-05-13 ツイスト バイオサイエンス コーポレーション ポリヌクレオチド合成のための加熱されたナノウェル
MX2020004325A (es) 2017-10-27 2020-11-09 Univ California Reemplazo dirigido de receptores de células t endógenos.
US20190218544A1 (en) * 2017-10-31 2019-07-18 Takara Bio Usa, Inc. Gene editing, identifying edited cells, and kits for use therein
AU2019205269A1 (en) 2018-01-04 2020-07-30 Twist Bioscience Corporation DNA-based digital information storage
CA3092451A1 (en) * 2018-02-28 2019-09-06 University Of Pittsburgh - Of The Commonwealth System Of Higher Education A modular system for gene and protein delivery based on aav
CN112204131A (zh) 2018-03-29 2021-01-08 因思科瑞普特公司 用于诱导和转化的细胞生长速率的自动化控制
US10376889B1 (en) 2018-04-13 2019-08-13 Inscripta, Inc. Automated cell processing instruments comprising reagent cartridges
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
WO2019209926A1 (en) 2018-04-24 2019-10-31 Inscripta, Inc. Automated instrumentation for production of peptide libraries
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
WO2019214604A1 (zh) * 2018-05-07 2019-11-14 中国农业大学 CRISPR/Cas效应蛋白及***
WO2019222545A1 (en) 2018-05-16 2019-11-21 Synthego Corporation Methods and systems for guide rna design and use
CA3100739A1 (en) 2018-05-18 2019-11-21 Twist Bioscience Corporation Polynucleotides, reagents, and methods for nucleic acid hybridization
CN112638494B (zh) 2018-06-30 2022-01-21 因思科瑞普特公司 用于改进活细胞中编辑序列的检测的仪器、模块和方法
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
US10532324B1 (en) 2018-08-14 2020-01-14 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
US10752874B2 (en) 2018-08-14 2020-08-25 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
WO2020081149A2 (en) 2018-08-30 2020-04-23 Inscripta, Inc. Improved detection of nuclease edited sequences in automated modules and instruments
KR20210091167A (ko) 2018-10-16 2021-07-21 블루알렐, 엘엘씨 유전자에서 dna의 표적화 삽입을 위한 방법
US11214781B2 (en) 2018-10-22 2022-01-04 Inscripta, Inc. Engineered enzyme
US10604746B1 (en) 2018-10-22 2020-03-31 Inscripta, Inc. Engineered enzymes
KR20210143766A (ko) 2019-02-26 2021-11-29 트위스트 바이오사이언스 코포레이션 Glp1 수용체에 대한 변이체 핵산 라이브러리
CA3131691A1 (en) 2019-02-26 2020-09-03 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
US10947534B2 (en) 2019-03-07 2021-03-16 The Trustees Of Columbia University In The City Of New York RNA-guided DNA integration using Tn7-like transposons
EP3938510A1 (en) * 2019-03-11 2022-01-19 Sorrento Therapeutics, Inc. Improved process for integration of dna constructs using rna-guided endonucleases
EP3942042A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
EP3947691A4 (en) 2019-03-25 2022-12-14 Inscripta, Inc. SIMULTANEOUS MULTIPLEX GENOME EDITING IN A YEAST
CN113939593A (zh) 2019-06-06 2022-01-14 因思科瑞普特公司 用于递归的核酸指导的细胞编辑的处治
US10907125B2 (en) 2019-06-20 2021-02-02 Inscripta, Inc. Flow through electroporation modules and instrumentation
CA3139124C (en) 2019-06-21 2023-01-31 Inscripta, Inc. Genome-wide rationally-designed mutations leading to enhanced lysine production in e. coli
EP3987019A4 (en) 2019-06-21 2023-04-19 Twist Bioscience Corporation BARCODE-BASED NUCLEIC ACID SEQUENCE ARRANGEMENT
US10927385B2 (en) 2019-06-25 2021-02-23 Inscripta, Inc. Increased nucleic-acid guided cell editing in yeast
WO2021016075A1 (en) 2019-07-19 2021-01-28 Flagship Pioneering Innovations Vi, Llc Recombinase compositions and methods of use
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
CA3157131A1 (en) 2019-12-10 2021-06-17 Inscripta, Inc. Novel mad nucleases
US10704033B1 (en) 2019-12-13 2020-07-07 Inscripta, Inc. Nucleic acid-guided nucleases
CA3157127A1 (en) 2019-12-18 2021-06-24 Aamir MIR Cascade/dcas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
US20230220434A1 (en) * 2020-01-09 2023-07-13 Duke University Composistions and methods for crispr enabled dna synthesis
US10689669B1 (en) 2020-01-11 2020-06-23 Inscripta, Inc. Automated multi-module cell processing methods, instruments, and systems
CA3157061A1 (en) 2020-01-27 2021-08-05 Christian SILTANEN Electroporation modules and instrumentation
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
US11787841B2 (en) 2020-05-19 2023-10-17 Inscripta, Inc. Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli
US11299731B1 (en) 2020-09-15 2022-04-12 Inscripta, Inc. CRISPR editing to embed nucleic acid landing pads into genomes of live cells
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
CA3204158A1 (en) 2021-01-04 2022-07-07 Juhan Kim Mad nucleases
US11332742B1 (en) 2021-01-07 2022-05-17 Inscripta, Inc. Mad nucleases
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
CA3230927A1 (en) 2021-09-10 2023-03-16 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing
WO2023192384A1 (en) * 2022-03-29 2023-10-05 University Of Massachusetts Tetrazine-derived linkers for single guide rnas
WO2024040112A2 (en) * 2022-08-16 2024-02-22 Mammoth Biosciences, Inc. Signal amplification assays for nucleic acid detection

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992007949A1 (en) * 1990-11-05 1992-05-14 The United States Of America, As Represented By The Secretary Of The Army Method for the in vitro production of protein from a dna sequence without cloning
WO1994012632A1 (en) * 1992-11-27 1994-06-09 University College London Improvements in nucleic acid synthesis by pcr

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5334575A (en) 1992-12-17 1994-08-02 Eastman Kodak Company Dye-containing beads for laser-induced thermal dye transfer
US5888795A (en) 1997-09-09 1999-03-30 Becton, Dickinson And Company Thermostable uracil DNA glycosylase and methods of use
US6440695B1 (en) * 1998-04-17 2002-08-27 Whitehead Institute For Biomedical Research Method for producing diverse libraries of encoded polypeptides
KR101138643B1 (ko) 2002-05-30 2012-04-26 더 스크립스 리서치 인스티튜트 구리 촉매 작용하에서의 아지드와 아세틸렌과의 리게이션
US7070941B2 (en) 2003-11-17 2006-07-04 Board Of Regents, The University Of Texas System Methods and compositions for tagging via azido substrates
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US8846883B2 (en) 2011-08-16 2014-09-30 University Of Southhampton Oligonucleotide ligation
US20140235505A1 (en) 2012-11-06 2014-08-21 Wisconsin Alumni Research Foundation Rna array compositions and methods
WO2014089290A1 (en) * 2012-12-06 2014-06-12 Sigma-Aldrich Co. Llc Crispr-based genome modification and regulation
WO2014093694A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
WO2014099750A2 (en) * 2012-12-17 2014-06-26 President And Fellows Of Harvard College Rna-guided human genome engineering
US9234213B2 (en) * 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
CN103382468B (zh) * 2013-07-04 2015-04-29 中国科学院遗传与发育生物学研究所 一种水稻基因组定点改造方法
CN103397018B (zh) * 2013-08-20 2015-04-22 中国医学科学院医学生物学研究所 一种dna病毒基因组的定点改造方法
US9526784B2 (en) * 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
CN113215219A (zh) * 2014-02-13 2021-08-06 宝生物工程(美国) 有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
JP6947638B2 (ja) * 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992007949A1 (en) * 1990-11-05 1992-05-14 The United States Of America, As Represented By The Secretary Of The Army Method for the in vitro production of protein from a dna sequence without cloning
WO1994012632A1 (en) * 1992-11-27 1994-06-09 University College London Improvements in nucleic acid synthesis by pcr

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
J LOGEL: "Synthesis of cRNA probes from PCR-generated DNA", 《BIOTECHNIQUES》 *
LANAR DE: "Expression-PCR (E-PCR): overview and applications.", 《PCR METHODS APPL》 *
THOMAS P QUINN: "A Streamlined Method for the Production, Screening, and Application of sgRNAs for CRISPR/Cas9 Gene Editing", 《BIOTECHNIQUES》 *
YANJIAO SHAO: "CRISPR/Cas-mediated genome editing in the rat via direct injection of one-cell embryos", 《NATURE PROTOCOLS》 *

Also Published As

Publication number Publication date
US20180195089A1 (en) 2018-07-12
EP3204513A2 (en) 2017-08-16
US20220033858A1 (en) 2022-02-03
WO2016057951A2 (en) 2016-04-14
US20160102322A1 (en) 2016-04-14
EP3998344A1 (en) 2022-05-18
US9879283B2 (en) 2018-01-30
WO2016057951A3 (en) 2016-06-02
CN113930455A (zh) 2022-01-14

Similar Documents

Publication Publication Date Title
CN107002078A (zh) Crispr寡核苷酸和基因剪辑
AU2020207840B2 (en) Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CN108822217A (zh) 一种基因碱基编辑器
US20240117335A1 (en) Fusion proteins for base editing
WO1995007351A1 (en) Intron-mediated recombinant techniques and reagents
CN109863243A (zh) 用于治疗粘多糖症的腺相关病毒载体
CN108384783B (zh) 一种环状rna成环序列及应用
CN116157514A (zh) 新颖omni-59、61、67、76、79、80、81和82crispr核酸酶
CN108384805B (zh) 促进环状RNA circRNF13表达的试剂在制备治疗舌鳞癌药物上的应用
CN113088529B (zh) 一种新型β-葡聚糖基因HG278及其应用
US20030180801A1 (en) Method for searching for gene encoding nuclear transport protein
CN110922484B (zh) 抗EGFRvIII抗体及其在疾病诊断或治疗中的应用
CN101608189A (zh) 一种表达双基因的真核表达载体
CN108315349B (zh) 环状RNA circRNF13的应用方法
CN108103100B (zh) 一种表达环状rna的真核表达载体
CN108396064B (zh) 检测环状RNA circRNF13的试剂在制备舌鳞癌患者预后制剂上的应用
CN108300786B (zh) 检测环状RNAcircRNF13的试剂在制备舌鳞癌辅助诊断制剂上的应用
CN114134141A (zh) 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译***及其构建方法
CN108138188A (zh) 用于体外和体内表达的多核苷酸构建体
KR102061251B1 (ko) 내인성 폴리펩타이드 생산을 위한 재조합 세포 및 방법
Martínez-Morales et al. Vectors for tissue specific transcriptomics
CN111690682B (zh) 调节骨骼肌发育的方法和应用
CN109706246B (zh) 原位杂交检测circRNF13的试剂在制备舌鳞癌诊断或患者预后制剂上的应用
CN110029127A (zh) 一种携带荧光Timer基因可变色的重组单纯疱疹病毒及制备方法和应用
CN115698300A (zh) 佛司可林诱导型启动子和低氧诱导型启动子

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20220719

AD01 Patent right deemed abandoned