CN107406858A - 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法 - Google Patents

用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法 Download PDF

Info

Publication number
CN107406858A
CN107406858A CN201680012247.2A CN201680012247A CN107406858A CN 107406858 A CN107406858 A CN 107406858A CN 201680012247 A CN201680012247 A CN 201680012247A CN 107406858 A CN107406858 A CN 107406858A
Authority
CN
China
Prior art keywords
plant
sequence
dna
plant cell
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680012247.2A
Other languages
English (en)
Inventor
A.M.斯甘
S.斯维塔舍夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN107406858A publication Critical patent/CN107406858A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8237Externally regulated expression systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • C12N15/821Non-antibiotic resistance markers, e.g. morphogenetic, metabolic markers
    • C12N15/8212Colour markers, e.g. beta-glucoronidase [GUS], green fluorescent protein [GFP], carotenoid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

提供了用于在植物细胞、植物和种子中进行指导RNA/Cas内切核酸酶***的调节型表达的组合物和方法。还提供了用于在植物或植物细胞的基因组中进行靶序列的基因组修饰的组合物和方法。这些方法和组合物采用调节型指导RNA/Cas内切核酸酶***,以提供用于修饰或改变植物、植物细胞或种子的基因组内的靶位点的有效***。

Description

用于指导RNA/CAS内切核酸酶复合物的调节型表达的组合物 和方法
本申请要求于2015年2月25日提交的美国临时申请号62/120421的权益,该申请通过引用以其全文结合在此。
技术领域
本披露涉及植物分子生物学领域,具体涉及用于改变植物细胞的基因组的方法。
以电子方式提交的序列表的引用
该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式提交,文件名为“20160129_BB2393PCT_ST25_SeqLst.txt”,创建于2016年1月29日,且具有76千字节大小,并与本说明书同时提交。包含在该ASCII格式的文件中的序列表是说明书的一部分并通过引用以其全文结合在此。
背景技术
重组DNA技术使得能够将DNA序列***生物体的基因组中,由此改变生物体的表型。最常用的植物转化方法是农杆菌感染和生物射弹粒子轰击,其中基因以随机方式并以不可预测的拷贝数整合到植物基因组中。因此,为控制植物中的基因整合进行了大量的工作。一种用于***或修饰DNA序列的方法涉及通过引入侧翼是与基因组靶标同源的序列的转基因DNA序列来进行的同源DNA重组。美国专利号5,527,695描述了用靶向真核生物DNA的预定序列的DNA序列来转化真核生物细胞。具体地,讨论了位点特异性重组的用途。通过使用可选择标记(该可选择标记作为引入的DNA序列的一部分被包括在内)来鉴定转化的细胞。
采用位点特异性重组***以及其他类型重组技术的位点特异性整合技术已经被用于在各种生物体中产生目的基因的靶向***。尽管已经开发出若干种方法来靶向在植物的基因组中用于修饰的特异位点,但仍存在防止重组表达盒的稳定整合和/或提供调节型表达***的需要。
发明内容
提供了用于在植物细胞、植物和种子中进行指导RNA/Cas内切核酸酶***的调节型表达的组合物和方法。还提供了用于在植物或植物细胞的基因组中进行靶序列的基因组修饰的组合物和方法。这些方法和组合物采用调节型指导RNA/Cas内切核酸酶***,以提供用于修饰或改变植物、植物细胞或种子的基因组内的靶位点的有效***。
在一个实施例中,该方法包括用于在植物细胞中进行指导RNA/Cas内切核酸酶复合物的调节型表达的方法,该方法包括:a.)向植物细胞提供指导RNA,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂;以及b.)通过对该植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致该Cas内切核酸酶的表达。该诱导型启动子可以是任何化学或胁迫诱导型启动子,例如但不限于,a)诱导型启动子,其包括以下核苷酸序列:包含SEQ ID NO:17或SEQ ID NO:18的全部或功能片段的核苷酸序列;或包含(a)的核苷酸序列的全长互补序列的核苷酸序列;或基于BLASTN比对法,当与(a)或(b)的核苷酸序列相比时,包含具有至少90%序列同一性的序列的核苷酸序列。
在另一个实施例中,该方法包括用于在植物细胞的基因组中修饰靶DNA序列的方法,该方法包括:a)提供植物细胞,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子;b)向(a)的植物细胞提供指导RNA,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述靶DNA序列处引入双链断裂;以及c)通过对(b)的植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致(a)的Cas内切核酸酶的表达。
还提供的是通过本文所述的方法产生的具有改变的靶位点和改变的目的多核苷酸的核酸构建体、植物、植物细胞、外植体、种子以及谷粒。在本文中示出本披露的这些方法和组合物的另外的实施例。
附图和序列表的说明
根据下列的详细描述和附图以及序列表,可以更全面地理解本披露,所述详细描述和附图以及序列表形成本申请的一部分。这些序列描述以及所附序列表遵循如37C.F.R.§§1.821-1.825所列出的管理专利申请中核苷酸和氨基酸序列披露内容的规定。这些序列描述包含如在37 C.F.R.§§1.821-1.825中所定义的用于氨基酸的三字母代码,将其通过引用结合在此。
附图
图1示出农杆菌载体(描绘右边界和左边界之间的序列组分)的示意图,该农杆菌载体包含有效地连接至Cas9内切核酸酶(Cas9)的诱导型启动子(ZmCAS1)、以及可选择标记盒、和处于中断的可见标记表达盒。
图2示出农杆菌载体(描绘右边界和左边界之间的序列组分)的示意图,该农杆菌载体包含有效地连接至Cas9内切核酸酶(Cas9)的组成型启动子(ZmUBI)、以及可选择标记盒、和处于中断的可见标记表达盒。
序列
SEQ ID NO:1是来自化脓性链球菌M1GAS(SF370)的Cas9基因的核苷酸序列。
SEQ ID NO:2是马铃薯ST-LS1内含子的核苷酸序列。
SEQ ID NO:3是SV40氨基N-端的氨基酸序列。
SEQ ID NO:4是根癌土壤农杆菌双分型VirD2T-DNA边界内切核酸酶羧基端的氨基酸序列。
SEQ ID NO:5是表达盒的核苷酸序列,其表达玉蜀黍优化的Cas9表达盒,该Cas9表达盒有效地连接至泛素启动子。
SEQ ID NO:6是表达盒的核苷酸序列,其表达玉蜀黍优化的Cas9表达盒,该Cas9表达盒有效地连接至Zm-CAS1启动子(也称为Zm-Mdh启动子)。
SEQ ID NO:7是LIGCas-3gRNA靶序列(无PAM)的核苷酸序列。
SEQ ID NO:8是MS26Cas-2gRNA靶序列(无PAM)的核苷酸序列。
SEQ ID NO:9是LIG-CR3单指导RNA表达盒的核苷酸序列。
SEQ ID NO:10是LIG-CR3单链的单指导RNA分子的核苷酸序列。
SEQ ID NO:11是包含Ds-Red表达盒的Ubi-Cas9、END2-Am-Cyan、和H2B驱动的中断拷贝的T-DNA的核苷酸序列。
SEQ ID NO:12是包含Ds-Red表达盒的CAS1-Cas9、END2-Am-Cyan、和H2B驱动的中断拷贝的T-DNA的核苷酸序列。
SEQ ID NO:13是RF-FP-CR1单指导RNA表达盒的核苷酸序列。
SEQ ID NO:14是RF-FP-CR2单指导RNA表达盒的核苷酸序列。
SEQ ID NO:15是MS26-CR2单指导RNA表达盒的核苷酸序列。
SEQ ID NO:16是MS26-CR2单链的单指导RNA分子的核苷酸序列。
SEQ ID NO:17是1049bp功能形式的玉蜀黍ZmCAS1启动子的核苷酸序列。
SEQ ID NO:18是1746bp功能形式的玉蜀黍ZmCAS1启动子的核苷酸序列。
SEQ ID NO:19是来自水稻(稻)的甘露醇脱氢酶基因(DP000086)的推定的5'UTR-启动子区的核苷酸序列。
SEQ ID NO:20是来自高粱属甘露醇脱氢酶基因(NC-012879)的推定的5'UTR-启动子区的核苷酸序列。
SEQ ID NO:21是玉蜀黍优化的Cas9内切核酸酶的核苷酸序列。
SEQ ID NO:22是玉蜀黍ALS基因组靶位点ALSCas-1的核苷酸序列。
SEQ ID NO:23是玉蜀黍ALS基因组靶位点ALSCas-4的核苷酸序列。
SEQ ID NO:24是ALS多核苷酸修饰修复DNA模板的核苷酸序列。
发明详细说明
本披露包括用于植物细胞、植物和种子中的指导RNA/Cas内切核酸酶复合物的调节型表达的组合物和方法。本披露进一步包括用于在植物或植物细胞的基因组中的靶序列的基因组修饰的组合物和方法,用于选择植物,用于改变目的多核苷酸的表达,以及用于将目的多核苷酸***植物的基因组中。这些方法采用调节型指导RNA/Cas内切核酸酶***,其中该指导RNA可以被递送(作为单链或双链RNA或作为DNA表达盒),并且该Cas内切核酸酶可以通过将Cas9内切核酸酶核苷酸序列有效地连接至诱导型启动子来调节,其中Cas内切核酸酶蛋白质由该指导RNA指导来识别特定靶位点处的双链断裂并且任选地将其引入细胞的基因组中。该指导RNA/Cas内切核酸酶复合物提供用于修饰植物、植物细胞或种子的基因组内的靶位点的有效***。一旦鉴定出基因组靶位点,就可以采用多种方法来进一步修饰靶位点,这样使得它们包含多种目的多核苷酸。待编辑的核苷酸序列(目的核苷酸序列)可以位于由指导RNA/Cas复合物识别的靶位点内部或外部。
CRISPR基因座(规律间隔成簇短回文重复序列)(又称SPIDR--间隔区散在同向重复序列)构成最近描述的DNA基因座的家族。CRISPR基因座由部分回文的短而高度保守的DNA重复序列(通常为24至40bp,重复从1至140次,也称为CRISPR重复序列)组成。重复序列(通常具有物种特异性)由恒定长度的可变序列(通常为20至58,依赖于CRISPR基因座(WO2007/025097,2007年3月1日公布))间隔。
CRISPR基因座首次在大肠杆菌中被识别(Ishino等人(1987)J.Bacterial.[细菌学杂志]169:5429-5433;Nakata等人(1989)J.Bacterial.[细菌学杂志]171:3553-3556)。相似的间隔短序列重复序列已经在地中海富盐菌、化脓性链球菌、鱼腥藻属、和结核分枝杆菌中被鉴定出(Groenen等人(1993)Mol.Microbiol[分子微生物学]10:1057-1065;Hoe等人(1999)Emerg.Infect.Dis[新兴传染病]5:254-263;Masepohl等人(1996)Biochim.Biophys.Acta[生物化学与生物物理学学报]1307:26-30;Mojica等人(1995)Mol.Microbiol[分子微生物学]17:85-93)。该CRISPR基因座与其他SSR的不同之处在于重复序列的结构,该结构已经称为短规律间隔重复序列(SRSR)(Janssen等人(2002)OMICSJ.Integ.Biol.[组学:整合生物学杂志]6:23-33;Mojica等人(2000)Mol.Microbiol[分子微生物学]36:244-246)。重复序列是以成簇形式发生的短元件,这些短元件总是由以恒定长度的可变序列规律地间隔开(Mojica等人(2000)Mol.Microbiol[分子微生物学]36:244-246)。
Cas基因包括通常与侧翼CRISPR基因座联接的、相关的、或接近的、或邻近的基因。术语“Cas基因”,“CRISPR-相关的(Cas)基因”在本文中可互换地使用。Cas蛋白质家族的全面的评论呈现在Haft等人(2005)Computational Biology[计算生物学],PLoS ComputBiol[科学公共图书馆计算生物学]1(6):e60.doi:10.1371/journal.pcbi.0010060中。
如该文献所述,描述了41个CRISPR-相关的(Cas)基因家族(除了四个先前已知的基因家族以外)。这示出CRISPR***属于不同类别,具有不同的重复模式、基因的组、和物种范围。在给定的CRISPR基因座处的Cas基因的数目可以在物种之间变化。
Cas内切核酸酶涉及由Cas基因编码的Cas蛋白质,其中所述Cas蛋白质能够将双链断裂引入DNA靶序列中。Cas内切核酸酶由指导多核苷酸指导来识别特定靶位点处的双链断裂并且任选地将其引入细胞的基因组中。如在此使用,术语“指导多核苷酸/Cas内切核酸酶***”包括能够将双链断裂引入DNA靶序列的Cas核酸内切酶和指导多核苷酸的复合物。当由指导RNA识别靶序列时,Cas内切核酸酶紧邻基因组靶位点解开DNA双链体,并且切割两个DNA链,但前提是正确的前间区序列邻近基序(PAM)被大致定向在靶序列的3’端(还参见于2014年8月20日提交的美国专利申请号14/463,687,将该申请通过引用结合在此)。
在一个实施例中,该Cas内切核酸酶基因是Cas9内切核酸酶,例如但不限于,于2007年3月1日公开的WO 2007/025097中的SEQ ID NO:462、474、489、494、499、505、以及518中列出的Cas9基因,并且将该公开案通过引用结合在此。在另一个实施例中,该Cas内切核酸酶基因是植物(玉蜀黍或大豆)优化的Cas9内切核酸酶。可以将该Cas内切核酸酶基因有效地连接至Cas密码子区上游的SV40核靶向信号和Cas密码子区下游的双分型VirD2核定位信号(Tinland等人(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:7442-6)。
在一个实施例中,该Cas内切核酸酶基因是玉蜀黍优化的Cas9内切核酸酶基因,例如但不限于SEQ ID NO:21。
术语“功能片段”、“在功能上等价的片段”、和“功能等价片段”在本文中可互换地使用。这些术语意指本披露的Cas内切核酸酶序列的一部分或子序列,其中产生双链断裂的能力被保留。
术语“功能变体”、“在功能上等价的变体”、和“功能等价变体”在本文中可互换地使用。这些术语意指本披露的Cas内切核酸酶的变体,其中产生双链断裂的能力被保留。片段和变体可以经由例如定点诱变和合成构建的方法获得。
在一个实施例中,该Cas内切核酸酶基因是植物密码子优化的化脓性链球菌Cas9基因,该基因可以识别原则上是可以靶向的N(12-30)NGG形式的任何基因组序列。
可以通过在本领域已知的任何方法将该Cas内切核酸酶直接引入细胞,这些方法例如但不限于,瞬时引入方法、转染、和/或局部施用。
内切核酸酶是切割多核苷酸链内的磷酸二酯键的酶,并且包括在特定位点处切割DNA而不损伤碱基的限制性内切核酸酶。限制性内切核酸酶包括I型、II型、III型、和IV型内切核酸酶,这些限制性内切核酸酶进一步包括亚型。在I型和III型***中,甲基化酶和限制性酶活性二者均包含在单复合物中。内切核酸酶还包括大范围核酸酶,也称为归巢内切核酸酶(HE酶),该酶相似于限制性内切核酸酶,在特定识别位点处结合并且切割,然而对于大范围核酸酶,这些识别位点通常更长,约18bp或更长(于2012年3月22日提交的专利申请WO-PCT PCT/US 12/30061)。基于保守的序列基序将大范围核酸酶分类为四个家族,这些家族是LAGLIDADG、GIY-YIG、H-N-H、和His-Cys box家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HE酶的显著之处在于它们的长识别位点,并且还在于耐受其DNA底物中的一些序列多态性。对于大范围核酸酶的命名约定相似于对其他限制性内切核酸酶的约定。大范围核酸酶还分别特征在于针对由独立的ORF、内含子、和内含肽编码的酶的前缀F-、I-、或PI-。在重组过程中的一个步骤涉及在识别位点处或在该识别位点附近的多核苷酸切割。该切割活性可用于产生双链断裂。对于位点特异性重组酶和它们的识别位点的综述,参见,Sauer(1994)Curr Op Biotechnol[生物技术新见]5:521-7;以及Sadowski(1993)FASEB[美国实验生物学学会联合会杂志]7:760-7。在一些实例中,重组酶来自Integrase或Resolvase家族。
TAL效应子核酸酶是新一类的序列-特异性核酸酶,该酶可以用于在植物或其他生物体的基因组中的特定靶序列处造成双链断裂(Miller等人(2011)Nature Biotechnology[自然生物技术]29:143-148)。锌指核酸酶(ZFN)是由锌指DNA结合结构域和双链-断裂-诱导剂结构域组成的工程化双链断裂诱导剂。识别位点特异性由锌指结构域赋予,该锌指结构域通常包含两个、三个、或四个锌指,例如具有C2H2结构,然而其他锌指结构是已知的并且已经被工程化。锌指结构域适于设计特异性结合所选择的多核苷酸识别序列的多肽。ZFN包括连接至非特异性内切核酸酶结构域(例如来自II型内切核酸酶,例如FokI的核酸酶结构域)的工程化DNA结合锌指结构域。另外的功能性可以融合到锌指结合结构域中,这些另外的功能性包括转录激活子结构域、转录抑制子结构域、和甲基化酶。在一些实例中,核酸酶结构域的二聚化是切割活性所需的。每个锌指在靶DNA中识别三个连续的碱基对。例如,3指结构域识别9个连续核苷酸的序列,由于该核酸酶的二聚化需要,因此两组锌指三联体用于结合18个核苷酸的识别序列。
细菌和古细菌已经进化出了适应性免疫防御,称为成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR-相关的(Cas)***,该***使用短的RNA来引导外源核酸的降解(于2007年3月1日公开的WO 2007/025097)。来自细菌的II型CRISPR/Cas***采用crRNA和tracrRNA将Cas内切核酸酶指导至其DNA靶。该crRNA(CRISPR RNA)包含与双链DNA靶的一条链互补,并且与tracrRNA(反式激活CRISPR RNA)碱基配对形成RNA双链体的区域,该RNA双链体引导Cas内切核酸酶切割DNA靶。
术语“指导RNA”、“单指导RNA”、和“sgRNA”在本文中可互换地使用,并且包括两种RNA分子(包含可变靶向结构域的crRNA(CRISPR RNA)和tracrRNA)的合成融合。在一个实施例中,该指导RNA包括12至30个核苷酸序列的可变靶向结构域以及可以与Cas内切核酸酶相互作用的RNA片段。
如在此使用,术语“指导多核苷酸”,涉及可以与Cas内切核酸酶形成复合物,并且使得该Cas内切核酸酶能够识别并且任选地切割DNA靶位点的多核苷酸序列(还参见于2014年8月20日提交的美国专利申请号14/462691,将其通过引用结合在此)。指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列、或其组合(RNA-DNA组合序列)。任选地,指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰,例如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2′-氟代A、2′-氟代U、2′-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5′至3′共价连接。仅包含核糖核酸的指导多核苷酸也被称为“指导RNA”。
指导多核苷酸可以是双分子(也称为双链体指导多核苷酸),其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(称为Cas内切核酸酶识别结构域或CER结构域)。双分子指导多核苷酸的CER结构域包含沿着互补区域杂交的两个单独的分子。两个单独的分子可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施例中,包含连接到CER结构域的VT结构域的双链体指导多核苷酸的第一个分子被称为“crDNA”(当由DNA核苷酸的连续延伸构成时)或“crRNA”(当由RNA核苷酸的连续延伸构成时)或“crDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。cr核苷酸可以包括在细菌和古细菌中天然存在的crRNA的片段。在一个实施例中,存在于在此披露的cr核苷酸中的细菌和古细菌中天然存在的crRNA的片段的大小范围可以是,但并不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施例中,包含CER结构域的双链体指导多核苷酸的第二个分子被称为“tracrRNA”(当由RNA核苷酸的连续延伸构成时)或“tracrDNA”(当由DNA核苷酸的连续延伸构成时)或“tracrDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。在一个实施例中,指导RNA/Cas9内切核酸酶复合物的RNA是包含双链体crRNA-tracrRNA的双链体的RNA。
指导多核苷酸还可以是单分子,其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸结构域(称为Cas内切核酸酶识别结构域或CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施例中,单指导多核苷酸包含连接到tracr核苷酸(包含CER结构域)的cr核苷酸(包含与CER结构域连接的VT结构域),其中该连接是包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列构成的单指导多核苷酸可以被称为“单指导RNA”(当由RNA核苷酸的连续延伸构成时)或“单指导DNA”(当由DNA核苷酸的连续延伸构成时)或“单指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。在本披露的一个实施例中,单指导RNA包含可以与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas***的cRNA或cRNA片段和tracrRNA或tracrRNA片段,其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导至植物基因组靶位点,使得Cas内切核酸酶能够将双链断裂引入基因组靶位点。使用单指导多核苷酸对比双链体指导多核苷酸的一个方面是,为了表达单指导多核苷酸,仅需要制造一个表达盒。
术语“可变靶向结构域”或“VT结构域”在本文中可互换地使用,并且包括与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列(还参见于2014年8月20日提交的美国专利申请号14/463,687,将其通过引用结合在此)。第一个核苷酸序列结构域(VT结构域)和靶序列之间的%互补可以为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%。可变靶标结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。在一些实施例中,可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。
指导多核苷酸的术语“Cas内切核酸酶识别结构域”或“CER结构域”在本文中可互换地使用,并且包括与Cas内切核酸酶多肽相互作用的核苷酸序列(例如指导多核苷酸的第二核苷酸序列结构域)(还参见于2014年8月20日提交的美国专利申请号14/463,687,将其通过引用结合在此)。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任何组合构成。
连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含RNA序列、DNA序列、或RNA-DNA组合序列。在一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸长度。在另一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含四环序列,例如但不限于GAAA四环序列。
指导多核苷酸、VT结构域和/或CER结构域的核苷酸序列修饰可以选自但不限于下组,该组由以下各项组成:5′帽、3′聚腺苷酸化尾巴、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供跟踪的修饰或序列、为蛋白质提供结合位点的修饰或序列、锁核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2′-氟代A核苷酸、2′-氟代U核苷酸、2′-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的键合、与聚乙二醇分子的键合、与间隔区18分子的键合、5′至3′共价键、或其任何组合。这些修饰可以导致至少一个另外的有益特征,其中该另外的有益特征选自以下各项的组:修饰或调节的稳定性、亚细胞靶向、跟踪、荧光标记、蛋白质或蛋白质复合物的结合位点、与互补靶序列的修饰的结合亲和力、对细胞降解的修饰的抗性、以及增加的细胞通透性(还参见于2014年8月20日提交的美国专利申请号14/463,687,将其通过引用结合在此)。
在本披露的一个实施例中,该可变靶结构域是12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸长度。
在本披露的一个实施例中,该指导RNA包含可以与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas***的cRNA(或cRNA片段)和tracrRNA(或tracrRNA片段),其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导至植物基因组靶位点,使得Cas内切核酸酶能够将双链断裂引入基因组靶位点。
术语“指导多核苷酸/Cas内切核酸酶复合物”或“指导多核苷酸/Cas内切核酸酶***”在本文中可互换地使用,并且意指能够形成复合物的指导多核苷酸和Cas内切核酸酶,其中该指导多核苷酸可以与Cas内切核酸酶蛋白质相互作用,并且将该复合物指导至特定DNA靶位点。
术语“指导RNA/Cas内切核酸酶复合物”、“指导RNA/Cas内切核酸酶***”、“gRNA/Cas***”、和“gRNA/Cas复合物”在本文中可互换地使用,并且意指能够形成复合物的指导RNA和Cas内切核酸酶,其中该指导RNA可以与Cas内切核酸酶蛋白质相互作用,并且将该复合物指导至特定DNA靶位点。
如果该Cas内切核酸酶蛋白质用作双链断裂诱导剂,则该指导多核苷酸/Cas内切核酸酶使得该Cas内切核酸酶能够在DNA靶位点处引入双链断裂。在一些情况下,可以修饰Cas内切核酸酶,这样使得它仅引入单链断裂(例如切口酶)或被修饰,这样使得该Cas内切核酸酶包含DNA结合活性但不含DNA切割活性。
可以对指导RNA和Cas内切核酸酶的活性,以及因此在DNA靶位点处双链断裂的引入进行调节。例如,指导RNA和Cas内切核酸酶的瞬时表达或存在可以导致指导RNA/Cas内切核酸酶复合物的瞬时形成,该复合物仅在有限的时间内起作用。例如,调节型指导RNA/Cas内切核酸酶复合物可以从Cas内切核酸酶表达盒中产生,其中该Cas内切核酸酶有效地连接至诱导型启动子(例如本文所述的化学或胁迫诱导型启动子)。在此类调节复合物中,当启动子被诱导时,该Cas内切核酸酶将产生,并且因此调节指导RNA/Cas内切核酸酶复合物何时/何地可以发生的时序和位置。在一些情况下,可以修饰Cas内切核酸酶,这样使得它仅引入单链断裂(例如切口酶)或被修饰,这样使得该Cas内切核酸酶包含DNA结合活性但不含DNA切割活性。
在一个实施例中,可以通过将该Cas内切核酸酶有效地连接至调节型启动子来调节该Cas内切核酸酶的活性,其中此类调节可以是但不限于,由胁迫或热处理对启动子进行的诱导,或用热、胁迫、或安全剂处理对此类启动子的表达进行的去阻遏(例如当操纵子与所述启动子结合,并且然后释放时-相似于lac阻遏物)。此类启动子的一个实例是本文所述的CAS1(或Mdh)启动子。
可替代地,可以使用在本领域已知的任何方法(例如,但不限于,粒子轰击、农杆菌转化、或局部施用),将作为单链的RNA或双链的RNA的指导RNA瞬时地引入植物或植物细胞中。
还可以通过引入重组DNA分子(DNA表达盒)间接地引入指导RNA,该重组DNA分子包含有效地连接至植物特定启动子的相应的指导DNA序列,该启动子能够在所述植物细胞中转录该指导RNA。术语“相应的指导DNA”包括与RNA分子相同的,但具有“T”取代RNA分子的每个“U”的DNA分子。
指导RNA/Cas9内切核酸酶复合物的RNA还可以包括包含双链体crRNA-tracrRNA的双链体RNA(如描述在于2014年8月20日提交的美国专利申请号14/463,687中,将其通过引用结合在此)。使用指导RNA对比双链体crRNA-tracrRNA的一个优点是,为了表达融合的指导RNA,仅需要制造一个表达盒。
术语“靶位点”、“靶序列”、“靶DNA”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、以及“基因组靶基因座”在本文中可互换地使用,并且意指植物细胞的基因组(包括叶绿体DNA和线粒体DNA)中的多核苷酸序列,在该多核苷酸序列处通过Cas内切核酸酶在植物细胞基因组中诱导双链断裂。靶位点可以是植物基因组中的内源性位点,或者可替代地,靶位点可以与植物异源,从而不是基因组中天然存在的,或者与其在自然界中存在的地方相比,靶位点可以发现于异源基因组位置中。如在此使用,术语“内源性靶序列”和“天然靶序列”在本文中可互换地使用,从而意指对于植物的基因组是内源的或天然的靶序列,并且是在植物的基因组中靶序列的内源或天然位置处。
在一个实施例中,该靶位点可以相似于由双链断裂诱导剂,例如LIG3-4内切核酸酶(还参见于2014年12月16日发布的美国专利号8,912,392,将其通过引用结合在此)、或MS26、MS26+、或MS26++大范围核酸酶(于2014年1月16日公开的美国专利申请US 2014-0020131 A1,将其通过引用结合在此)特异性识别和/或结合的DNA识别位点或靶位点。
““人工靶位点”或“人工靶序列”在本文中可互换地使用,并且意指已经引入植物的基因组中的靶序列。此类人工靶序列可以在序列上与植物的基因组中的内源性或天然靶序列相同,但是位于植物的基因组中的不同位置(即,非内源性的或非天然的位置)处。
““改变的靶位点”、“改变的靶序列”、“修饰的靶位点”、“修饰的靶序列”在本文中可互换地使用,并且意指如本文披露的靶序列,当与非改变的靶序列相比时,该靶序列包括至少一种改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的***,或(iv)(i)-(iii)的任何组合。
在植物细胞中用于指导RNA/Cas内切核酸酶复合物的调节型表达和瞬时表达的方法在本文中进行了描述。
在一个实施例中,该方法包括用于在植物细胞中瞬时地表达指导RNA/Cas内切核酸酶复合物的方法,该方法包括:a)向植物细胞提供指导RNA,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂;以及b)通过对该植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致该Cas内切核酸酶的表达。可以使用在本领域已知的任何方法(例如,但不限于,粒子轰击、农杆菌转化、或局部施用),将作为单链RNA抑或双链RNA的指导RNA瞬时地提供至植物细胞。
在一个实施例中,该方法包括用于在植物细胞中进行指导RNA/Cas内切核酸酶复合物的调节型表达的方法,该方法包括:a)向植物细胞提供指导RNA,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂;以及b)通过对该植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致该Cas内切核酸酶的表达。如上所述可以通过引入重组DNA分子(DNA表达盒),将该指导RNA直接提供至植物细胞,该重组DNA分子包含有效地连接至植物特定启动子的相应的指导DNA序列,该启动子能够在所述植物细胞中转录该指导RNA。该指导RNA/Cas内切核酸酶复合物可以通过化学或胁迫处理诱导启动子来进行调节,从而诱导(调节)该Cas表达盒的表达。
还提供的是用于在植物细胞的基因组中修饰靶DNA序列的方法,该方法包括:a)提供植物细胞,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子;b)向(a)的植物细胞提供指导RNA,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述靶DNA序列处引入双链断裂;以及c)通过对(b)的植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致(a)的Cas内切核酸酶的表达。
靶DNA序列(靶位点)的长度可以变化,并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的,即,一条链上的序列与在互补链上以相反方向的读取相同。切口/切割位点可以在靶序列内,或者切口/切割位点可以在靶序列之外。在另一种变异中,切割可以发生在彼此正好相对的核苷酸位置处,以产生平端切割,或者在其他情况下,切口可以交错以产生单链突出端,也称为“粘性末端”,其可以是5′突出端抑或或3′突出端。
能够被Cas内切核酸酶切割的基因组靶位点可以包括雄性可育性基因,例如MS26(参见例如美国专利7,098,388、7,517,975、7,612,251)、MS45(参见例如美国专利5,478,369、6,265,640)、或MSCA1(参见例如美国专利7,919,676)、ALS、或ESPS基因的12个至30个核苷酸的片段。
还可以使用基因组靶位点的活性变体。这样的活性变体可以包含与给定靶位点至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,其中该活性变体保留生物活性,因此能够被Cas内切核酸酶识别和切割。测量由内切核酸酶引起的靶位点的双链断裂的测定是本领域已知的,并且通常测量试剂在包含识别位点的DNA底物上的总体活性和特异性。
可以采用不同方法和组合物来获得植物,该植物具有***到针对Cas内切核酸酶的靶位点中的目的多核苷酸。此类方法可以采用同源重组以提供目的多核苷酸在靶位点处的整合。在提供的一个方法中,将在供体DNA构建体中的目的多核苷酸提供至植物细胞。如在此使用,“供体DNA”是DNA构建体,其包括待***到Cas内切核酸酶的靶位点的目的多核苷酸。供体DNA构建体进一步包含位于目的多核苷酸侧翼的同源的第一区域和第二区域。供体DNA的同源的第一区域和第二区域分别与存在于植物基因组的靶位点中或位于该靶位点侧翼的第一和第二基因组区域共享同源性。“同源”意指DNA序列是相似的。例如,在供体DNA上发现的“与基因组区域同源的区域”是与植物基因组中给定的“基因组序列”具有相似序列的DNA的区域。同源的区域可以具有足以促进在切割的靶位点处的同源重组的任何长度。例如,同源的区域的长度可以包括至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,这样使得同源的区域具有足够的同源性以与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100%序列同一性的连续核苷酸)的保守区域以及在序列的长度的一部分上的百分比序列同一性来描述。
由靶标和供体多核苷酸共享的同源性或序列同一性的量可以变化,并且包括总长度和/或在约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb、或多达并包括靶位点的总长度的范围内具有单位整数值的区域。这些范围包括该范围内的每个整数,例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可以通过在两个多核苷酸的完整比对长度上的百分比序列同一性来描述,其包括约至少50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的百分比序列同一性。足够的同源性包括多核苷酸长度、总体百分比序列同一性,和任选地连续核苷酸的保守区域或局部百分比序列同一性的任何组合,例如,足够的同源性可以被描述为与靶标基因座的区域具有至少80%序列同一性的75-150bp的区域。还可以通过用来在高严格条件下特异性杂交的两个多核苷酸的预测能力,来描述足够的同源性,参见例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual[分子克隆:实验手册](Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY[纽约冷泉港冷泉港实验室出版社]);CurrentProtocols in Molecular Biology[现代分子生物学实验技术],Ausubel等人,编辑(1994)Current Protocols[实验室指南](Greene Publishing Associates,Inc.[格林出版合伙公司]和John Wiley&Sons,Inc.[约翰威利父子公司]);以及Tijssen(1993)LaboratoryTechniques in Biochemistry and Molecular Biology--Hybridization with NucleicAcid Probes[生物化学和分子生物学中的实验室技术--与核酸探针杂交](Elsevier[爱思唯尔],纽约(New York))。
如在此使用,“基因组区域”是存在于靶位点任一例上的植物细胞的基因组中的染色体的区段,或者可替代地,还包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,这样使得基因组区域具有足够的同源性以便与相应的同源的区域进行同源重组。
目的多核苷酸和/或性状可以在复合物性状基因座中堆叠在一起,如在公开于2013年10月3日的US-2013-0263324-A1和在公开于2013年1月24日的PCT/US 13/22891中的描述,通过引用将这两个申请结合在此。本文所述的指导多核苷酸/Cas9内切核酸酶***提供了用来产生双链断裂并允许将性状在复杂性状基因座中堆叠的有效***。
指导多核苷酸/Cas内切核酸酶***可用于通过向植物细胞提供一个或多个指导多核苷酸、一种Cas内切核酸酶、和任选地一个或多个供体DNA来将一个或多个目的多核苷酸或一个或多个目的性状引入一个或多个靶位点(如在于2014年8月20日提交的美国专利申请号14/463,687中的描述,将其通过引用结合在此)。可育的植物可以从包括在所述一个或多个靶位点处的改变的植物细胞产生,其中该改变选自下组,该组由以下各项组成:(i)至少一个核苷酸的替代,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的***,以及(iv)(i)-(iii)的任何组合。包含这些改变的靶位点的植物可以与包含在相同的复杂性状基因座中的至少一种目的基因或性状的植物杂交,从而进一步在所述复杂性状基因座中堆叠性状。(还参见于2013年10月3日公开的US-2013-0263324-A1,和在2013年1月24日公开的PCT/US 13/22891)。
在给定的基因组区域和在供体DNA上发现的相应的同源的区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如,由供体DNA的“同源的区域”和植物基因组的“基因组区域”共享的同源性或序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,这样使得序列进行同源重组。
供体DNA上的同源的区域可以与靶位点侧翼的任何序列具有同源性。虽然在一些实施例中,同源的区域与紧邻靶位点侧翼的基因组序列共享显著的序列同源性,但是应当认识到同源的区域可以被设计为与可能更靠近靶位点的5′或3′的区域具有足够的同源性。在又其他实施例中,同源的区域还可以与靶位点的片段以及下游基因组区域具有同源性。在一个实施例中,第一同源的区域进一步包含靶位点的第一片段,并且第二同源的区域包含靶位点的第二片段,其中第一片段和第二片段不相似。
如在此使用,“同源重组”包括在同源的位点处的两个DNA分子之间的DNA片段的交换。同源重组的频率受多个因素影响。不同的生物体相对于同源重组的量以及同源重组与非同源重组的相对比例而变化。通常,同源的区域的长度影响同源重组事件的频率:同源的区域越长,频率越高。为观察同源重组而需要的同源区域的长度也是随物种而异的。在许多情况下,已经利用了至少5kb的同源性,但已经观察到具有仅25-50bp的同源性的同源重组。参见,例如,Singer等人,(1982)Cell[细胞]31:25-33;Shen和Huang,(1986)Genetics[遗传学]112:441-57;Watt等人,(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82:4768-72,Sugawara和Haber,(1992)Mol Cell Biol[分子细胞生物学]12:563-75,Rubnitz和Subramani,(1984)Mol Cell Biol[分子细胞生物学]4:2253-8;Ayares等人,(1986)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:5199-203;Liskay等人,(1987)Genetics[遗传学]115:161-7。
同源-定向修复(HDR)是在细胞中用来修复双链DNA和单链DNA断裂的机制。同源-定向修复包括同源重组(HR)和单链退火(SSA)(Lieber.2010 Annu.Rev.Biochem[生物化学年鉴]79:181-211)。HDR的最常见形式称为同源重组(HR),其在供体和受体DNA之间具有最长的序列同源性要求。HDR的其他形式包括单链退火(SSA)和断裂诱导的复制,并且这些需要相对于HR更短的序列同源性。缺口(单链断裂)处的同源-定向修复可以经由与在双链断裂处的HDR不同的机制发生(Davis和Maizels.PNAS[美国国家科学院院刊](0027-8424),111(10),E924-E932页)。
植物细胞的基因组的改变,例如通过同源重组(HR),其是对于遗传工程而言的有力工具。尽管在高等植物中的低频率的同源重组,但是存在植物内源基因的成功同源重组的少数实例。用于植物中同源重组的参数主要已经通过挽救引入的截短的可选择标记基因进行了研究。在这些实验中,同源DNA片段通常在0.3kb至2kb之间。针对同源重组观察到的频率是在10-4至10-5数量级。参见,例如,Halfter等人,(1992)Mol Gen Genet[分子遗传和基因组学]231:186-93;Offringa等人,(1990)EMBO J[欧洲分子生物学学会杂志]9:3077-84;Offringa等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:7346-50;Paszkowski等人,(1988)EMBO J[欧洲分子生物学学会杂志]7:4021-6;Hourda andPaszkowski,(1994)Mol Gen Genet[分子遗传和基因组学]243:106-11;以及Risseeuw等人,(1995)Plant J[植物杂志]7∶109-19。
同源重组在昆虫中已经得到证明。在果蝇中,Dray和Gloor发现只有3kb的总模板:靶同源性足以将DNA的大量非同源区段以合理的效率复制到靶标中(Dray和Gloor,(1997)Genetics[遗传学]147:689-99)。在果蝇中,Golic等人,使用在靶标FRT处FLP介导的DNA整合,示出了当供体和靶标共享4.1kb的同源性时,与1.1kb的同源性相比,整合是大约10倍更有效的(Golic等人,(1997)Nucleic Acids Res[核酸研究]25:3665)。来自果蝇的数据表明,2-4kb的同源性足以用于有效靶向,但有一些证据表明,处于约30bp至约100bp的数量级的远远更少的同源性也可以满足(Nassif和Engels,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:1262-6;Keeler和Gloor,(1997)Mol Cell Biol[分子细胞生物学]17:627-34)。
在其他生物体中也可以实现同源重组。例如,在寄生原生动物利什曼原虫中,至少需要150-200bp的同源性进行同源重组(Papadopoulou和Dumas,(1997)Nucleic Acids Res[核酸研究]25:4278-86)。在丝状真菌构巢曲霉中,已经用仅50bp侧翼同源性实现基因置换(Chaveroche等人,(2000)Nucleic Acids Res[核酸研究]28:e97)。在纤毛虫嗜热四膜虫中也已经证明了靶向基因置换(Gaertig等人,(1994)Nucleic Acids Res[核酸研究]22:5391-8)。在哺乳动物中,使用可在培养基中生长、转化、选择、和引入小鼠胚胎中的多能胚胎干细胞系(ES),同源重组在小鼠中已经是最成功的。携带***的转基因ES细胞的胚胎发育为遗传后代。通过将同胞小鼠进行杂种繁殖,可以获得携带所选基因的纯合子小鼠。在Watson等人,(1992)Recombinant DNA[重组DNA],第2版,(Scientific American Booksdistributed by WH Freeman&Co.[由WH Freeman&Co.公司发行的科学美国人图书]);Capecchi,(1989)Trends Genet[遗传学趋势]5:70-6;以及Bronson,(1994)J Biol Chem[生物化学杂志]269:27155-8中提供了该过程的综述。在除小鼠外的哺乳动物中的同源重组已经受到缺少能够移植到***或发育中的胚胎的干细胞的限制。然而,McCreath等人,Nature[自然]405:1066-9(2000)报道了在原代胚胎成纤维细胞中通过转化和选择在绵羊中成功的同源重组。
易错DNA修复机制可以在双链断裂位点处产生突变。非同源末端连接(NHEJ)途径是用来将断裂的末端结合在一起的最常见的修复机制(Bleuyard等人,(2006)DNA Repair[DNA修复]5:1-12)。染色体的结构完整性通常通过修复来保持,但是缺失、***、或其他重排是可能的。一个双链断裂的两个末端是NHEJ最普遍的底物(Kirik等人,(2000)EMBO J[欧洲分子生物学学会杂志]19:5562-6),然而如果发生两种不同的双链断裂,则来自不同断裂的游离端可以被连接,并且导致染色体缺失(Siebert和Puchta,(2002)Plant Cell[植物细胞]14:1121-31),或在不同的染色体之间的染色体易位(Pacher等人,(2007)Genetics[遗传学]175:21-9)。
还可以将附加体DNA分子连接至双链断裂中,例如,将T-DNA整合至染色体双链断裂中(Chilton和Que,(2003)Plant Physiol[植物生理学]133:956-65;Salomon和Puchta,(1998)EMBO J[欧洲分子生物学学会杂志]17:6086-95)。一旦双链断裂周围的序列被改变,例如被涉及双链断裂的成熟的外切核酸酶活性改变,则基因转换途径可以恢复原始结构,如果有同源序列的话,例如非***的体细胞中的同源染色体,或DNA复制后的姊妹染色单体(Molinier等人,(2004)Plant Cell[植物细胞]16:342-52)。异位的和/或表观遗传的DNA序列还可以充当用于同源重组的DNA修复模板(Puchta,(1999)Genetics[遗传学]152:1173-81)。
一旦在DNA中诱导双链断裂,则细胞的DNA修复机制被激活来修复断裂。易错DNA修复机制可以在双链断裂位点处产生突变。用来将断裂的末端结合在一起的最常见的修复机制是非同源末端连接(NHEJ)途径(Bleuyard等人,(2006)DNA Repair[DNA修复]5:1-12)。染色体的结构完整性通常通过修复来保存,但是缺失、***或其他重排是可能的(Siebert和Puchta,(2002)Plant Cell[植物细胞]14:1121-31;Pacher等人,(2007)Genetics[遗传学]175:21-9)。
可替代地,该双链断裂可以通过同源DNA序列之间的同源重组来修复。一旦双链断裂周围的序列被改变,例如通过涉及双链断裂的成熟的外切核酸酶活性,则基因转换途径可以恢复原始结构(如果有同源序列的话),例如非***的体细胞中的同源染色体,或DNA复制后的姊妹染色单体(Molinier等人,(2004)Plant Cell[植物细胞]16:342-52)。异位的和/或表观遗传的DNA序列还可以充当用于同源重组的DNA修复模板(Puchta,(1999)Genetics[遗传学]152:1173-81)。
DNA双链断裂似乎是刺激同源重组途径的有效因子(Puchta等人,(1995)PlantMol Biol[植物分子生物学]28:281-92;Tzfira和White,(2005)Trends Biotechnol[生物技术趋势]23:567-9;Puchta,(2005)J Exp Bot[实验植物学杂志]56:1-14)。使用DNA断裂剂,在植物中的人工构建的同源DNA重复序列之间观察到同源重组的两倍至九倍的增加(Puchta等人,(1995)Plant Mol Biol[植物分子生物学]28:281-92)。在玉蜀黍原生质体中,用线状DNA进行的实验证实了在质粒之间增强的同源重组(Lyznik等人,(1991)Mol GenGenet[分子遗传和基因组学]230:209-18)。
可以通过在本领域已知的任何手段引入供体DNA。例如,提供了具有靶位点的植物。可以通过在本领域已知的任何转化方法(包括,例如农杆菌介导的转化或生物射弹粒子轰击)提供供体DNA。该供体DNA可以瞬时地存在于细胞中,或可以经由病毒复制子引入。在Cas内切核酸酶和靶位点的存在下,供体DNA被***到转化植物的基因组中。
在本文中进一步描述了目的多核苷酸,并且这些多核苷酸反映了涉及作物发育的那些的商业市场和利益。目的作物和市场在变化,并且随着发展中国家打开国际市场,也将出现新的作物和技术。此外,随着我们对农学性状和特征(例如产量和杂种优势增加)的理解逐渐深入,对用于遗传工程的基因的选择将会相应变化。
可以将本文所述的调节型指导RNA/Cas内切核酸酶***与共递送多核苷酸修饰模板组合使用,从而允许目的基因组核苷酸序列的编辑。已经描述了使用DSB-诱导剂(例如Cas9-gRNA复合物)的基因组编辑,例如在2014年8月20日提交的美国申请号14/463,687、2014年8月20日提交的PCT申请PCT/US 14/51781,以及2014年8月13日提交的美国申请62/036,652中,将其全部内容通过引用结合在此。还已经描述了指导多核苷酸/Cas内切核酸酶***,例如在2014年8月20日提交的美国申请号14/463,691中,将其通过引用结合在此。
针对调节型指导RNA/Cas内切核酸酶***的其他用途包括但不限于修饰或置换目的核苷酸序列(例如调节元件)、目的多核苷酸的***、基因敲除、基因敲入、剪接位点的修饰和/或引入替代的剪接位点、编码目的蛋白质的核苷酸序列的修饰、氨基酸和/或蛋白质融合、以及通过将反向重复表达为目的基因的基因沉默。(还参见于2014年8月20日提交的专利号14/463,687、于2014年8月20日提交的PCT申请PCT/US 14/51781、以及于2014年8月13日提交的美国申请62/036,652,将其全部内容通过引用结合在此)。
还提供的是用于鉴定至少一种植物细胞的方法,该植物细胞在其基因组中包含在靶位点处整合的目的多核苷酸。可以使用多种方法来鉴定在靶位点处或靶位点附近***到基因组中的那些植物细胞,而不使用可筛选的标记表型。此类方法可被认为是直接分析靶序列以检测靶序列中的任何变化,包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法、及其任何组合。参见,例如,美国专利申请12/147,834,将该申请通过引用结合在此至本文所述方法所必需的程度。该方法还包括从植物细胞重新获得包含整合至其基因组中的目的多核苷酸的植物。该植物可以是不育的或可育的。应当认识到,可以提供任何目的多核苷酸,将该多核苷酸在靶位点处整合到植物的基因组中,并在植物中表达。
目的多核苷酸/多肽包括但不限于,除草剂-抗性编码序列、杀昆虫编码序列、杀线虫编码序列、抗微生物编码序列、抗真菌编码序列、抗病毒编码序列、非生物和生物胁迫耐受性编码序列、或修饰植物性状(例如产量、籽粒质量、营养成分、淀粉质量和数量、固氮和/或氮利用、脂肪酸、以及含油量和/或油组成)的序列。更具体的目的多核苷酸包括但不限于:改进作物产量的基因、改进作物合意性的多肽、编码赋予对非生物胁迫(例如干旱、氮、温度、盐度、毒性金属、或痕量元素)的抗性的蛋白质,或赋予对毒素(例如杀有害生物剂和除草剂)、或对生物胁迫(例如真菌、病毒、细菌、昆虫和线虫的攻击以及与这些生物体相关的疾病的发展)的抗性的那些蛋白质的基因。目的基因的一般类别包括,例如涉及信息的那些基因(例如锌指),涉及通讯的那些基因(例如激酶),以及涉及管家的那些基因(例如热休克蛋白)。转基因的更具体类别包括,例如,编码对农学、昆虫抗性、疾病抗性、除草剂抗性、育性或不育性,谷物特征、和商品而言重要的性状的基因。目的基因通常包括涉及油、淀粉、碳水化合物、或营养代谢的那些,以及可以与如本文所述的其他性状(例如但不限于除草剂抗性)堆叠或组合使用的影响籽粒大小、蔗糖负载量等的那些基因。
除了使用传统的育种方法之外,还可通过遗传方式改变农学上重要的性状(例如油、淀粉、和蛋白质含量)。修饰包括增加油酸、饱和及不饱和油的含量、增加赖氨酸和硫的水平、提供必需氨基酸、以及还有对淀粉的修饰。在美国专利号5,703,049、5,885,801、5,885,802、和5,990,389中描述了Hordothionin蛋白质修饰,将这些专利通过引用结合在此。
目的多核苷酸序列可以编码涉及提供疾病或有害生物抗性的蛋白质。“疾病抗性”或“有害生物抗性”意指植物避免为植物-病原体相互作用后果的有害症状的发生。有害生物抗性基因可以编码针对严重影响产量的有害生物的抗性,所述有害生物例如是根虫、切根虫、欧洲玉米螟、等。疾病抗性基因和昆虫抗性基因,例如用于抗细菌保护的溶菌酶或天蚕杀菌肽,或用于抗真菌保护的蛋白质,例如防御素、葡聚糖酶、或几丁质酶,或用于控制线虫或昆虫的苏云金芽孢杆菌内毒素、蛋白酶抑制剂、胶原酶、凝集素、或糖苷酶,均是有用的基因产物的实例。编码疾病抗性性状的基因包括解毒基因,例如抗伏马毒素(美国专利号5,792,931);无毒力(avr)和疾病抗性(R)基因(Jones等人(1994)Science[科学]266:789;Martin等人(1993)Science[科学]262:1432;和Mindrinos等人(1994)Cell[细胞]78:1089);等。昆虫抗性基因可以编码对有害生物的抗性,这些有害生物会严重影响产量,例如根虫、切根虫、欧洲玉米螟、等。此类基因包括,例如,苏云金芽孢杆菌毒性蛋白基因(美国专利号5,366,892;5,747,450;5,736,514;5,723,756;5,593,881;和Geiser等人(1986)Gene[基因]48:109);等。
“除草剂抗性蛋白”或由“除草剂抗性编码核酸分子”表达生成的蛋白质包括这样的蛋白质,其赋予细胞与未表达该蛋白质的细胞相比耐受更高浓度除草剂的能力,或赋予细胞与未表达该蛋白质的细胞相比对某种浓度的除草剂耐受更长时段的能力。除草剂抗性性状可通过如下基因引入进植物中:编码对起到抑制乙酰乳酸合酶(ALS)的作用的除草剂(特别是磺酰脲类除草剂)的抗性的基因、编码对起到抑制谷氨酰胺合酶的作用的除草剂(例如草丁膦或basta)的抗性的基因(例如bar基因)、编码对草甘膦的抗性的基因(如EPSP合酶基因和GAT基因)、编码对HPPD抑制剂的抗性的基因(例如HPPD基因)或本领域已知的其他此类基因。参见,例如,美国专利号7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970、6,867,293,以及美国临时申请号61/401,456,其各自通过引用结合在此。bar基因编码对除草剂basta的抗性,nptII基因编码对抗生素卡那霉素和遗传霉素的抗性,以及ALS-基因突变体编码对除草剂氯磺隆的抗性。
不育性基因还可以在表达盒中编码,并为物理去雄提供替代方案。以此类方式使用的基因的实例包括雄性可育性基因,例如MS26(参见例如美国专利7,098,388、7,517,975、7,612,251)、MS45(参见例如美国专利5,478,369、6,265,640)、或MSCA1(参见例如美国专利7,919,676)。玉蜀黍植物(玉米)可以通过自花授粉和异花传粉技术二者来进行育种。玉蜀黍在同一植物上具有位于雄穗上的雄花和位于雌穗上的雌花。玉蜀黍可自花授粉(“自交”)或异花授粉。当风将花粉从雄穗吹到从初期(incipient)雌穗顶端伸出的须上时,玉蜀黍中就发生了自然授粉。授粉可以通过本领域技术人员已知的技术容易地控制。对玉蜀黍杂交体的开发需要开发纯合纯合近交系,将这些纯合近交系杂交,以及对这些杂交的评价。谱系育种和轮回选择是用于从种群开发近交系的两种育种方法。育种程序将来自两个或更多个近交系或不同基础广泛来源的所希望的性状组合进育种库,从该育种库中通过自交和对所希望表型的选择从而开发出新的近交系。杂交玉蜀黍品种是两种此类近交系的杂交,每种都可能具有由另一种所缺少的一个或多个所希望的特征,或补足另一种。新的近交系与其他近交系杂交,并对来自这些杂交的杂交体进行评价,以确定哪些具有商业潜力。第一代的杂交后代被指定为F1。F1杂种比其近交的亲本更有活力。这种杂交活力或杂种优势可以按许多方式表现,包括增加的营养生长和增加的产量。
杂交玉蜀黍种子可以通过结合人工去雄在内的雄性不育***来生产。为了产生杂交种子,将雄花穗从生长的雌性近交亲本中除去,这些雌性近交亲本可以与雄性近交亲本以不同交替行排列模式种植。因此,如果与外来玉蜀黍花粉的来源有足够的隔离,则雌性近交系的穗将只能用来自雄性近交系的花粉进行受精。因此,所得的种子是杂种(F1),并将形成杂种植物。
影响植物发育的田间变化可以导致在对雌性亲本的人工去雄完成后的植物抽穗。或,在去雄过程中雌性近交植物雄穗可能没有完全去除。无论如何,结果是雌性植物将成功地散播花粉,并且一些雌性植物将会自花授粉。这将导致雌性近交系的种子与正常产生的杂交种子一起被收获。雌性近交系种子不显示杂种优势,并且因此不如F1种子多产。此外,雌性近交系种子的存在可以代表生产杂交体的公司的种质安全风险。
可替代地,雌性近交系可以通过机器进行机械地去雄。机械去雄和手工去雄的可靠性大致相同,但更快并且成本更低。然而,相比手工去雄,大多数去雄机器会对植物造成更多伤害。因此,目前没有令人完全满意的去雄形式,并且仍存在对替代方案的需求,这些替代方案进一步降低生产成本,并且消除在杂交种子的生产中的雌性亲本的自花授粉。
在植物中引起雄性不育的突变具有可用于作物植物(例如玉蜀黍)的杂交种子生产的方法的潜力,并且可以通过消除对耗费大量劳动力从用作杂交亲本的母本植物上去除雄花(也称为去雄)的需要来降低生产成本。在玉蜀黍中引起雄性不育的突变已通过多种方法产生,这些方法例如X射线或紫外线照射、化学处理、或转座元件***(ms23、ms25、ms26、ms32)(Chaubal等人(2000)Am J Bot[美国植物学杂志]87:1193-1201)。通过可育性/不育性“分子转换”对可育性基因进行条件调节可以增强用于设计新的雄性不育***来进行作物改进的选项(Unger等人(2002)Transgenic Res[转基因研究]11:455-465)。
除了鉴定影响雄性可育性的新颖基因外,仍需要提供产生遗传性雄性不育的可靠***。
在美国专利号5,478,369中描述了一种方法,通过该方法将Ms45雄性可育性基因加标签并克隆于玉蜀黍染色体9上。此前,已经描述了在染色体9上的雄性可育性基因ms2,它从未被克隆和测序。该基因不是′369专利中提及的基因的等位基因。参见Albertsen,M.和Phillips,R.L.,“Developmental Cytology of 13 Genetic Male SterileLoci inMaize[玉蜀黍中13个遗传雄性不育基因座的发育细胞学]”Canadian Journal ofGenetics&Cytology[加拿大遗传学与细胞学杂志]23:195-208(1981年1月)。此前克隆的唯一可育性基因是在Aarts,等人,同上中描述的拟南芥属的基因。
此外,认识到目的多核苷酸还可以包括与针对目的所靶向的基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与相应的mRNA杂交。可以对该反义序列作出修饰,只要该序列与相应的mRNA杂交并干扰相应的mRNA的表达。在该方式中,可以使用与相应的反义序列具有70%、80%、或85%序列同一性的反义构建体。此外,反义核苷酸的部分可以用来破坏该靶基因的表达。通常,可以使用至少50个核苷酸、100个核苷酸、200个核苷酸、或更多个核苷酸的序列。
此外,目的多核苷酸还可以按有义取向来使用从而抑制植物中内源基因的表达。以有义取向使用多核苷酸用于抑制植物中基因表达的方法是本领域已知的。这些方法通常涉及用包含启动子的DNA构建体的转化植物,该启动子有效地连接到至少一部分的对应于该内源基因的转录物的核苷酸序列上,驱动在植物中的表达。通常,此类核苷酸序列与内源基因的转录物的序列具有实质性的序列同一性,通常大于约65%序列同一性、约85%序列同一性、或大于约95%序列同一性。参见,美国专利号5,283,184和5,034,323;将这些专利通过引用结合在此。
目的多核苷酸还可以是表型标记。表型标记是可筛选或可选择标记,其包括视觉标记和可选择标记,无论它是阳性还是阴性可选择标记。可以使用任何表型标记。具体地,可选择或可筛选标记包含允许人们通常在特定条件下鉴定或选择包含它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性,例如但不限于RNA、肽或蛋白质的产生,或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
可选择标记的实例包括但不限于包含限制酶位点的DNA区段;编码提供对包括抗生素在内的其他毒性化合物的抗性的产物的DNA区段,该抗生素例如是大观霉素、氨苄青霉素、卡那霉素、四环素、巴斯塔(Basta)、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外在受体细胞中缺少的产物的DNA区段(例如,tRNA基因、营养缺陷型标记);编码可以容易地鉴定的产物的DNA区段(例如,表型标记例如β-半乳糖苷酶、GUS;荧光蛋白,例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白);产生用于PCR的新引物位点(例如,以前未并列的两个DNA序列的并列),包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列;并且包含允许其鉴定的特异性修饰(例如,甲基化)所需的DNA序列。
另外的可选择标记包括赋予除草剂化合物(例如草胺磷、溴草腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))抗性的基因。参见例如,Yarranton,(1992)Curr Opin Biotech[生物技术新见]3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:6314-8;Yao等人,(1992)Cell[细胞]71:63-72;Reznikoff,(1992)MolMicrobiol[分子微生物学]6:2419-22;Hu等人,(1987)Cell[细胞]48:555-66;Brown等人,(1987)Cell[细胞]49:603-12;Figge等人,(1988)Cell[细胞]52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2549-53;Deuschle等人,(1990)Science[科学]248:480-3;Gossen,(1993)Ph.D.Thesis,University of Heidelberg[海德堡大学博士论文];Reines等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:1917-21;Labow等人,(1990)Mol Cell Biol[分子细胞生物学]10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:5072-6;Wyborski等人,(1991)Nucleic Acids Res[核酸研究]19:4647-53;Hillen and Wissman,(1989)Topics MolStruc Biol[热点分子结构生物学]10:143-62;Degenkolb等人,(1991)Antimicrob AgentsChemother[抗微生物剂和化疗]35:1591-5;Kleinschnidt等人,(1988)Biochemistry[生物化学]27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg[海德堡大学博士论文];Gossen等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:5547-51;Oliva等人,(1992)Antimicrob Agents Chemother[抗微生物剂和化疗]36:913-9;Hlavka等人,(1985)Handbook of Experimental Pharmacology[实验药理学手册],78卷(Springer-Verlag,Berlin[柏林施普林格出版社]);Gill等人,(1988)Nature[自然]334:721-4。还可以在可以增加例如用于乙醇生产的淀粉或提供蛋白质表达的一种基因或多种基因上编码商业性状。转化植物的另一个重要的商业用途是生产聚合物和生物塑料,例如在美国专利号5,602,321中所述。多种基因(例如β-酮硫解酶、PHBase(聚羟基丁酸酯合酶)、和乙酰乙酰辅酶A还原酶)(参见Schubert等人(1988)J.Bacteriol.[细菌学杂志]170:5837-5847)促进聚羟基链烷酸酯(PHA)的表达。
外源产物包括植物酶和植物产物,以及来自包括原核生物和其他真核生物在内的其他来源的那些产物。此类产物包括酶、辅因子、激素等。可以增加具有改进的氨基酸分布以改进植物的营养价值的蛋白质,特别是修饰的蛋白质的水平。这通过表达具有增加的氨基酸含量的此类蛋白质来实现。
转基因、重组DNA分子、目的DNA序列、和目的多核苷酸可以包括用于基因沉默的一个或多个DNA序列。用于涉及在植物中DNA序列表达的基因沉默的方法是本领域已知的,包括但不限于,共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、包含内含子的发夹RNA(ihpRNA)干扰、转录基因沉默、以及微小RNA(miRNA)干扰。
如在此使用,“核酸”意指多核苷酸,并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或DNA的聚合物,任选地包含合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以其5′-单磷酸酯形式发现)以其单字母名称表示如下:“A”表示腺苷或脱氧腺苷(分别用于RNA或DNA),“C”表示胞苷或脱氧胞苷,“G”表示鸟苷或脱氧鸟苷,“U”表示尿苷,“T”表示脱氧胸苷,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。
“可读框”缩写为ORF。
术语“在功能上等价的亚片段”和“功能等价亚片段”在本文中可互换地使用。这些术语意指分离的核酸片段的一部分或子序列,其中不管该片段或亚片段是否编码活性酶,改变基因表达或产生某种表型的能力被保留。例如,片段或亚片段可用于设计基因以在转化的植物中产生所希望的表型。可以将基因设计为用于在抑制中使用,无论该基因是否编码活性酶,通过以相对于植物启动子序列的有义或反义取向连接其核酸片段或其亚片段。
术语“保守结构域”或“基序”是指沿进化相关蛋白的比对序列在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其他位置处的氨基酸可以发生变化,但在特定位置处高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们通过蛋白质同系物家族的比对序列中的高度保守性而被鉴定,所以它们可以用作标识符或“特征”,以确定具有新确定的序列的蛋白质是否属于先前鉴定的蛋白质家族。
多核苷酸和多肽序列、其变体、以及这些序列的结构关系,可用术语“同源性”、“同源的”、“基本上同一的”、“基本上相似的”、以及“基本上相应”来描述,这些术语在本文中可互换地使用。这些意指多肽或核酸片段,其中在一个或多个氨基酸或核苷酸碱基上的变化不影响分子的功能,例如介导基因表达或产生某种表型的能力。这些术语还意指相对于初始未修饰的片段,基本上不改变所得核酸片段的功能特性的核酸片段的一个或多个修饰。这些修饰包括在核酸片段中一个或多个核苷酸的缺失、取代、和/或***。
所涵盖的基本上相似的核酸序列可以通过这些核酸序列与本文所示例的序列杂交,或与本文所披露的并且与任何本文所披露的核酸序列在功能上等价的核苷酸序列的任何部分杂交(在中严格条件下,例如0.5X SSC,0.1%SDS,60℃)的能力来定义。可以调节严格条件以筛选中度相似的片段(例如来自远缘生物体的同源序列),到筛选高度相似的片段(例如从近缘生物体复制功能性酶的基因)。杂交后的洗涤决定了严格条件。
术语“选择性杂交”包括参考在严格的杂交条件下将核酸序列杂交到特定的核酸靶序列上,相比其杂交到非靶核酸序列和基本上排除非靶核酸,该杂交达到可检测地更大程度(例如,至少为背景值的2倍)。选择性杂交序列通常彼此具有约至少80%序列同一性、或90%序列同一性、高达并且包括100%序列同一性(即,完全互补)。
术语“严格条件”或“严格杂交条件”包括参考在体外杂交测定中,探针将与其靶序列选择性杂交的条件。严格条件是序列依赖性的,并且在不同情况下将有所不同。通过控制杂交条件和/或洗涤条件的严格性,可以鉴定与探针100%互补的靶序列(同源探测)。可替代地,也能够调节严格条件以允许序列中的某些错配,以便检测到更低程度的相似性(异源探测)。通常,探针长度为小于约1000个核苷酸,任选地是长度小于500个核苷酸。
通常,严格条件将是以下条件:在pH 7.0至8.3下盐浓度为小于约1.5M Na离子、通常约0.01至1.0M Na离子浓度(或其他一种或多种盐),并且对于短探针(例如,10至50个核苷酸)为至少约30℃,并且对于长探针(例如,超过50个核苷酸)为至少约60℃。添加去稳定剂例如甲酰胺也可以实现严格条件。示例性低严格条件包括在37℃下用30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,并且在50℃至55℃下在1X至2XSSC(20X SSC=3.0M NaCI/0.3M柠檬酸三钠)中洗涤。示例性中严格条件包括在37℃下在40%至45%甲酰胺、1.0M NaCl、1%SDS中杂交,并且在55℃至60℃下在0.5X至1X SSC中洗涤。示例性高严格条件包括在37℃下在50%甲酰胺、1M NaCl、1%SDS中杂交,并且在60℃至65℃下在0.1X SSC中洗涤。
在核酸或多肽序列的上下文中的“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。
“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参考序列(其不包含添加或缺失)比较两个序列的最佳比对时,该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将该结果乘以100以产生序列同一性百分比。百分比序列同一性的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从50%至100%的任何整数百分比。可以使用在此描述的任何程序确定这些同一性。
序列比对和百分比同一性或相似性计算可以使用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息计算包(DNASTAR Inc.公司,麦迪逊(Madison),威斯康星州)的MegAlignTM程序。在此申请的背景内,应当理解的是,在使用序列分析软件来分析的情况下,分析的结果将基于参考的程序的“默认值”,除非另外指明。如在此使用,“默认值”将意指当第一次初始化时,最初加载该软件的任意组的值或参数。
“比对的Clustal V方法”对应于标记为Clustal V的比对方“Clustal V比对方法”对应于比对方法标记的Clustal V(由以下描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci[生物科学中的计算机应用]8:189-191),并且发现于LASERGENE生物信息计算包(DNASTAR Inc.公司,麦迪逊(Madison),威斯康星州)的MegAlignTM程序中。对于多重比对,默认值对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对话框(DIAGONALS SAVED)=5。对于核酸,这些参数是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。使用Clustal V程序比对序列后,可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
“Clustal W比对方法”对应于比对方法标记的Clustal W(由以下描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci[生物科学中的计算机应用]8:189-191),并且发现于LASERGENE生物信息计算包(DNASTAR Inc.公司,麦迪逊(Madison),威斯康星州)的MegAlign v6.1程序中。用于多重比对的默认参数(空位罚分=10、空位长度罚分=0.2、延迟发散序列(Delay Divergen Seqs)(%)=30、DNA转换权重=0.5、蛋白质权矩阵=Gonnet系列、DNA权矩阵=IUB)。使用Clustal W程序比对序列后,可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
除非另有说明,本文中提供的序列同一性/相似性值是指使用GAP版本10(GCG,Accelrys公司,圣地亚哥,加利福尼亚州)使用以下参数获得的值:核苷酸序列的%同一性和%相似性使用空位创建罚分权重为50、空位长度延伸罚分权重为3、以及nwsgapdna.cmp打分矩阵;氨基酸序列的%同一性和%相似性使用空位创建罚分权重为8、空位长度延伸罚分为2、以及BLOSUM62打分矩阵(Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:10915)。GAP使用Needleman和Wunsch(1970)J.Mol.Biol.[分子生物学杂志]48:443-453中的算法,以找到两个完全序列的比对,该比对能使匹配数最大且空位数最小。GAP考虑所有可能的比对和空位位置,并且使用匹配碱基的单位中的空位产生罚分和空位延伸罚分,产生具有最大数目的匹配碱基和最少的空位的比对。
“BLAST”是美国国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)提供的用于寻找生物序列之间的相似性的区域的搜索算法。该程序将核苷酸或者蛋白质序列与序列数据库比较,并计算匹配的统计显著性以鉴定出与查询序列具有足够的相似性的序列,这样使得相似性不会被预测为已经随机发生。BLAST报告鉴定的序列和它们与查询序列的局部比对。
本领域技术人员很清楚地理解,许多水平的序列同一性可用于鉴定来自其他物种的多肽或修饰的天然的或合成的多肽,其中这样的多肽具有相同或相似的功能或活性。百分比同一性的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从50%至100%的任何整数百分比。实际上,从50%至100%的任何整数氨基酸同一性可以用于描述本披露,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
“基因”包括表达功能分子(例如,但不限于特定蛋白质)的核酸片段,包括编码序列之前的调节序列(5’非编码序列)和编码序列之后的调节序列(3’非编码序列)。“天然基因”是指自然界中发现的具有其自身调节序列的基因。
“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本披露的某些实施例中,突变基因包含生成自如在此披露的指导多核苷酸/Cas内切核酸酶***的改变。突变的植物是包含突变基因的植物。
如在此使用,“靶向突变”是通过使用涉及双链断裂诱导剂的方法,改变天然基因内的靶序列,而造成的天然基因中的突变,该双链断裂诱导剂能够在如在此披露的或本领域已知的靶序列的DNA中诱导双链断裂。
在一个实施例中,如本文所述,靶向突变是调节型指导RNA/Cas内切核酸酶诱导的基因编辑的结果。指导RNA/Cas核酸内切酶诱导的靶向突变可以发生在位于由Cas内切核酸酶识别和切割的基因组靶位点内部或外部的核苷酸序列中。
术语“基因组”当应用于植物细胞时不仅涵盖在细胞核内发现的染色体DNA,还涵盖在细胞的亚细胞组分(例如线粒体、或质体)内发现的细胞器DNA。
“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是其密码子使用的频率被设计为模拟宿主细胞的偏好的密码子使用的频率的基因。
“等位基因”是占据染色体上给定基因座的基因的若干种替代形式中的一种。当染色体上在给定基因座处存在的所有等位基因都相同时,该植物在该基因座处是纯合的。如果染色体上在给定基因座处存在的等位基因不同,则该植物在该基因座处是杂合的。
“编码序列”是指编码特定氨基酸序列的多核苷酸序列。“调节序列”是指位于编码序列的上游(5′非编码序列)、内部或下游(3′非编码序列)的核苷酸序列,并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列可以包括但不限于:启动子、翻译前导序列、5′非翻译序列、3′非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点、和茎-环结构。
“植物-优化的核苷酸序列”是已经被优化用于增加在植物中的表达、特别是增加在植物中或在一种或者多种目的植物中表达的核苷酸序列。例如,可以使用个或多个植物-偏好的密码子来改进表达一,通过修饰编码蛋白质(例如,如本文披露的双链-断裂-诱导剂(例如,内切核酸酶))的核苷酸序列,来合成植物-优化的核苷酸序列。有关宿主偏好的密码子使用的讨论,参见例如Campbell和Gowri(1990)Plant Physiol.[植物生理学]92:1-11。
本领域中可获得用于合成植物偏好的基因的方法。参见,例如,美国专利号5,380,831,和5,436,391,以及Murray等人(1989)Nucleic Acids Res.[核酸研究]17:477-498,通过引用结合在此。已知另外的序列修饰以增强在植物宿主中的基因表达。这些包括例如消除以下项:编码假的聚腺苷酸化信号、一个或多个外显子-内含子剪接位点信号的一个或多个序列、一个或多个转座子样重复序列、以及可能对基因表达有害的其他此类充分表征的序列。可以将序列的G-C含量调节至通过参考宿主植物细胞中表达的已知基因而计算出的给定植物宿主的平均水平。当可能时,修饰序列以避免出现一个或多个预测的发夹二级mRNA结构。因此,本披露的“植物-优化的核苷酸序列”包括一个或多个此类序列修饰。
启动子是参与RNA聚合酶和其他蛋白质的识别和结合以开始转录的DNA区域。启动子序列由近端和更远端的上游元件组成,后一元件通常被称为增强子。“增强子”是可以刺激启动子活性的DNA序列,并且可以是启动子的固有元件或被***以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因,或者由来源于在自然界存在的不同启动子的不同元件构成,和/或包含合成的DNA区段。本领域技术人员应当理解,不同的启动子可能引导基因在不同组织或细胞类型中、或在不同的发育的阶段、或者响应于不同的环境条件的表达。还认识到,由于在大多数情况下调节序列的确切界限仍未完全限进一步认识到,由于在大多数情况下调节序列的确切边界尚未完全限定,一些变异的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。
已示出某些启动子能够以相比其他启动子更高的速率引导RNA合成。这些被称为“强启动子”。某些其他启动子已经示出仅在特定类型的细胞或组织中以更高水平引导RNA合成,并且如果这些启动子在某些组织中优选引导RNA合成,而且在其他组织中以减少水平引导RNA合成,则通常被称为“组织特异性启动子”或“组织-偏好的启动子”。由于引入到植物中的嵌合基因(或基因)的表达模式是使用启动子来控制的,因此在分离能够在特定组织类型中或在特定的植物发育阶段以某种水平控制嵌合基因或(基因)表达的新颖启动子中是具有持续兴趣的。
植物启动子可以包括能够在植物细胞中启动转录的启动子;关于植物启动子的综述,参见Potenza等人,(2004)In Vitro Cell Dev Biol[体外细胞与发育生物学]40:1-22。组成型启动子包括例如Rsyn7启动子的核心启动子以及披露于WO 99/43838和美国专利号6,072,050中的其他组成型启动子;核心CaMV35S启动子(Odell等人,(1985)Nature[自然]313:810-2);稻肌动蛋白(McElroy等人,(1990)Plant Cell[植物细胞]2:163-71);泛素(Christensen等人,(1989)Plant Mol Biol[植物分子生物学]12:619-32;Christensen等人,(1992)Plant Mol Biol[植物分子生物学]18:675-89);pEMU(Last等人,(1991)TheorAppl Genet[理论与应用遗传学]81:581-8);MAS(Velten等人,(1984)EMBO J 3:2723-30);ALS启动子(美国专利号5,659,026)等。其他组成型启动子被描述于例如美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142和6,177,611中。在一些实例中,可以使用诱导型启动子。在被病原体感染后诱导的病原体诱导型启动子包括但不限于调节PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等的表达的启动子。
可以使用化学调节型启动子以通过应用外源化学调节剂来调节植物中的基因表达。在应用化学品诱导基因表达的情况下启动子可以是化学诱导型启动子,或者在应用化学品阻抑基因表达的情况下启动子可以是化学阻抑型启动子。化学品诱导型启动子包括但不限于:由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人,(1997)PlantCell Physiol[植物细胞生理学]38:568-77)、由用作出苗前除草剂的疏水性亲电子化合物激活的玉米GST启动子(GST-ll-27,WO 93/01294)、以及由水杨酸激活的烟草PR-1启动子(Ono等人,(2004)Biosci Biotechnol Biochem[生物科学 生物技术 生物化学]68:803-7)。其他化学调节的启动子包括类固醇反应启动子(参见,例如,糖皮质激素诱导型启动子(Schena等人,(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:10421-5;McNellis等人,(1998)Plant J[植物学]14:247-257);四环素诱导型和四环素阻抑型启动子(Gatz等人,(1991)Mol Gen Genet[分子遗传和基因组学]227:229-37;美国专利号5,814,618和5,789,156)。
组织偏好性启动子可以用于靶向特定植物组织内的增强的表达。组织偏好性启动子包括,例如Kawamata等人,(1997)Plant Cell Physiol[植物细胞生理学]38:792-803;Hansen等人,(1997)Mol Gen Genet[分子遗传和基因组学]254:337-43;Russell等人,(1997)Transgenic Res[转基因研究]6:157-68;Rinehart等人,(1996)Plant Physiol[植物生理学]112:1331-41;Van Camp等人,(1996)Plant Physiol[植物生理学]112:525-35;Canevascini等人,(1996)Plant Physiol[植物生理学]112:513-524;Lam,(1994)ResultsProbl Cell Differ[细胞分化的结果和问题]20:181-96;以及Guevara-Garcia等人,(1993)Plant J[植物学杂志]4:495-505。叶偏好性启动子包括,例如,Yamamoto等人,(1997)Plant J[植物学杂志]12:255-65;Kwon等人,(1994)Plant Physiol[植物生理学]105:357-67;Yamamoto等人,(1994)Plant Cell Physiol[植物细胞生理学]35:773-8;Gotor等人,(1993)Plant J[植物学]3∶509-18;Orozco等人,(1993)Plant Mol Biol[植物分子生物学]23:1129-38;Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:9586-90;Simpson等人,(1958)EMBO J 4:2723-9;Timko等人,(1988)Nature[自然]318:57-8。根偏好性启动子包括,例如,Hire等人,(1992)Plant Mol Biol[植物分子生物学]20:207-18(soybean root-specific glutaminesynthase gene[大豆根特异性谷氨酰胺合成酶基因]]);Miao等人,(1991)Plant Cell[植物细胞]3∶11-22(cytosolicglutamine synthase(GS)[胞浆谷氨酰胺合成酶(GS)](;Keller和Baumgartner,(1991)Plant Cell[植物细胞]3:1051-61(root-specific control element in the GRP1.8gene of French bean[法国菜豆的GRP 1.8基因中的根特异性控制元件]);Sanger等人,(1990)Plant Mol Biol[植物分子生物学]14:433-43(root-specific promoter ofA.tumefaciens mannopine synthase(MAS)[根瘤土壤杆菌甘露碱合酶(MAS)的根特异性启动子]);Bogusz等人,(1990)Plant Cell[植物细胞]2:633-41(root-specific promotersisolated from Parasponia andersonii and Trema tomentosa[从糙叶山黄麻(Parasponia andersonii)和山黄麻(Trema tomentosa)中分离的根特异性启动子]);Leach和Aoyagi,(1991)Plant Sci[植物科学]79:69-76(A.rhizogenes rolC and rolDroot-inducing genes[毛根土壤杆菌(A.rhizogenes)rolC和rolD根诱导基因]);Teeri等人,(1989)EMBO J[欧洲分子生物学学会杂志]8:343-50(Agrobacterium wound-inducedTR1′and TR2’genes[土壤杆菌伤口诱导的TR1′和TR2’基因]);VfENOD-GRP3基因启动子(Kuster等人,(1995)Plant Mol Biol 29:759-72[植物分子生物学]);和rolB启动子(Capana等人,(1994)Plant Mol Biol[植物分子生物学]25:681-91;phaseolin基因(Murai等人,(1983)Science[科学]23:476-82;Sengopta-Gopalen等人,(1988)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],82:3320-4)。还参见美国专利号5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732和5,023,179。
“种子偏好性”启动子包括在种子发育期间有活性的种子特异性启动子以及在种子发芽期间有活性的种子发芽性启动子两者。参见Thompson等人,(1989)BioEssays[生物学分析]10:108。种子偏好性启动子包括但不限于Cim1(细胞***素诱导的信号);cZ19B1(玉蜀黍19kDa玉米蛋白);和milps(肌醇-1-磷酸盐合酶);(WO 00/11177;以及美国专利6,225,529)。对于双子叶植物,种子偏好性启动子包括但不限于:菜豆β-菜豆素、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白等。对于单子叶植物,种子偏好性启动子包括但不限于玉蜀黍15kDa玉米蛋白、22kDa玉米蛋白、27kDaγ玉米蛋白、蜡质、收缩素1、收缩素2、球蛋白1、油质蛋白和nuc1。还参见WO 00/12733,其中披露了来自END1和END2基因的种子偏好性启动子。
术语“诱导型启动子”意指对内源或外源刺激的存在,例如通过化学化合物(化学诱导剂)响应,或对环境、激素、化学品、和/或发育信号响应,选择性表达编码序列或功能RNA的启动子。诱导型或调节型启动子包括例如通过光、热、胁迫、水淹或干旱、盐胁迫、渗透胁迫、植物激素、伤口或化学品(例如乙醇、脱落酸(ABA)、茉莉酮酸酯、水杨酸或安全剂)诱导或调节的启动子。
胁迫诱导型启动子的实例是RD29A启动子(Kasuga等人(1999)Nature Biotechnol[自然生物技术].17:287-91)。本领域技术人员熟悉模拟干旱条件并评价植物耐旱性的规程,所述植物已经遭受了模拟的或天然存在的干旱条件。技术人员可以通过给予植物比正常需要更少的水或在一个时段内不提供水来模拟干旱条件,并且技术人员可通过寻找在生理和/或物理条件上的差异来评价耐旱性,包括(但不限于)活力、生长、大小、或根长、或具体地讲叶片颜色或叶片面积大小。用于评价耐旱性的其它技术包括测量叶绿素荧光、光合作用速率和换气速率。此外,本领域技术人员熟悉模拟胁迫条件(例如渗透胁迫、盐胁迫、和温度胁迫)并评价植物的胁迫耐受性的规程,所述植物已经遭受了模拟的或天然存在的胁迫条件。
在植物细胞中有用的诱导型启动子的另一个实例已经在于2013年11约21日公开的美国专利申请US 2013-0312137 A1中进行了描述,将该申请通过引用结合在此。美国专利申请US 2013-0312137 A1描述了来自CBSU-Anther_Subtraction文库(CAS1)基因的ZmCAS1启动子及其功能片段,该基因编码来自玉蜀黍的甘露醇脱氢酶。该ZmCAS1启动子可以通过化学或胁迫处理进行诱导。该化学品可以是安全剂,例如,但不限于,N-(氨基羰基)-2-氯苯磺酰胺(2-CBSU)。胁迫处理可以是热处理,例如,但不限于,热休克处理。该ZmCAS1启动子可以被温度高于26℃的热休克处理诱导,例如像但不限于,27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、或高达并且包括导致启动子具有功能性的任何温度和任何时段。
术语“CAS1启动子”、“甘露醇脱氢酶启动子”、“mdh启动子”在本文中可互换地使用。
如在此使用,“ZmCAS1启动子”或“Zm-mdh启动子”意指来自玉蜀黍(玉米)的调节型启动子。天然ZmCAS1启动子是分离自CBSU-Anther_Subtraction文库的玉蜀黍基因的启动子,该玉蜀黍基因与在不同植物物种(包括玉蜀黍)中鉴定出的甘露醇脱氢酶基因具有显著的同源性,所述玉蜀黍在美国国家生物技术信息中心(National Center forBiotechnology Information,NCBI)数据库中保藏(如在于2013年11月21日公开的美国专利申请US 2013-0312137 A1中描述,将该申请通过引用结合在此)。该ZmCAS1启动子可以被如上所述的化学或胁迫处理诱导,或还可以通过用热、胁迫、或安全剂(化学品)处理将启动子的表达去阻遏(例如当操纵子与所述启动子结合,并且然后释放时-相似于lac阻遏物)来进行调节。
如在此使用,“ZmCAS1启动子”还意指保留显著的启动子活性的全长天然启动子的片段。例如,ZmCAS1启动子的长度可以是1.7kb,或其启动子-功能片段。当通过化学或胁迫处理诱导时,1.0kb ZmCAS1启动子片段(SEQ ID NO:17)以及更长的1.7kb ZmCAS1启动子片段(SEQ ID NO:18)能够驱动基因表达(如在于2013年11月21日公开的美国专利申请US2013-0312137 A1中描述的)。
以一个碱基对的增量,ZmCAS1启动子还包括与核苷酸序列的任何部分基本相似和功能上等价的变体。实际上,玉蜀黍甘露醇脱氢酶基因启动子ZmCAS1可以被用作诱导型启动子以驱动转基因的有效表达。诱导的GUS和MS45表达已经在库组织(sink tissue),例如花药、愈伤组织、根、和幼苗的芽以及发育的叶中观察到(参见例如于2013年11月21日公开的美国专利申请US 2013-0312137 A1)。
不断发现在植物细胞中有用的不同类型的新启动子;许多实例可以在Okamuro和Goldberg,(1989)The Biochemistry of Plants[植物生物化学],115卷,Stumpf和Conn,编辑(纽约,纽约州:学术出版社(Academic Press))1-82页的汇编中发现。
“翻译前导序列”意指位于基因的启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的mRNA上游。翻译前导序列可以影响初级转录物对mRNA的加工、mRNA稳定性、或翻译效率。已经描述了翻译前导序列的实例(例如,Turner和Foster,(1995)Mol Biotechnol[分子生物技术]3∶225-236)。
“3’非编码序列”、“转录终止子”、或“终止序列”意指位于编码序列的下游的DNA序列,并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征在于影响聚腺苷酸片添加到mRNA前体的3′末端。由Ingelbrecht等人,(1989)Plant Cell[植物细胞]1:671-680示例了不同的3’非编码序列的用途。
“RNA转录物”是指由DNA序列的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列的完全互补拷贝时,该RNA转录物被称为初级转录物或前mRNA。当RNA转录物是源自初级转录物前mRNAt的转录后加工的RNA序列时,RNA转录物被称为成熟RNA或mRNA。“信使RNA”或“mRNA”是指不含内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指使用酶逆转录酶与mRNA模板互补并由其合成的DNA。cDNA可以是单链的或者可以使用DNA聚合成酶I的Klenow片段转化成双链形式。“正义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补、并且阻断靶基因的表达的RNA转录物(参见,例如美国专利号5,107,065)。反义RNA的互补性可以是与特定基因转录物的任何部分,即在5′非编码序列、3′非编码序列、内含子或编码序列处。“功能性RNA”是指反义RNA、核酶RNA、或不能被翻译但对细胞加工有影响的其他RNA。术语“互补序列”和“反向互补序列”在本文中关于mRNA转录物可互换使用,并且意在限定信使的反义RNA。
术语“有效地连接”是指单个核酸片段上的核酸序列的关联,这样使得其中一个核酸序列的功能被另一个核酸序列调节。例如,当启动子能够调节编码序列的表达(即,该编码序列在启动子的转录控制下)时,启动子与该编码序列有效地连接。编码序列可以在正义或反义取向上有效地连接到调节序列。在另一个实例中,互补的RNA区域可以直接或间接有效地连接至靶mRNA的5’、或靶mRNA的3’、或靶mRNA内、或第一个互补区是5’且其互补序列是靶mRNA的3’。
本文使用的标准重组DNA和分子克隆技术是在本领域已知的,并且在Sambrook等人,Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册];Cold SpringHarbor Laboratory:Cold Spring Harbor,NY[冷泉港实验室:冷泉港,纽约州](1989)中进行了更全面的描述。转化方法是本领域技术人员熟知的并且在下文中进行了描述。
“PCR”或“聚合酶链反应”是用于合成特定DNA片段的技术,并且“PCR”或“聚合酶链式反应”是用于特定DNA区段的合成的技术,由一系列重复变性、退火和延伸循环组成。通常,将双链DNA进行热变性,并将两条与靶区段的3′边界互补的引物与该DNA在低温下退火,并且然后在中等温度下延伸。将这三个连续步骤的一组称为一个“循环”。
术语“重组”是指例如通过化学合成或者通过基因工程技术操纵分离的核酸区段来将两个原本分离的序列区段进行人工组合。
术语“质粒”、“载体”和“盒”意指染色体外元件,其通常携带非细胞中心代谢的一部分的基因,并且通常处于双链DNA的形式。这样的元件可以是来源于任何来源的、单链或双链DNA或RNA的、处于直链或环状形式的自主复制序列、基因组整合序列、噬菌体、或核苷酸序列,其中许多核苷酸序列已经被连接或重组成能够将目的多核苷酸引入细胞中的独特构造。“转化盒”意指包含基因并具有促进特定宿主细胞转化的基因之外的元件的特定载体。“表达盒”意指包含基因并具有允许在宿主中表达该基因的基因之外的元件的特定载体。
术语“重组DNA分子”、“重组构建体”、“表达构建体”、“构建体”、“构建体”、和“重组DNA构建体”在此可互换地使用。重组构建体包含核酸片段,例如在自然界中未全部一起发现的调节序列和编码序列的人工组合。例如,构建体可以包含源于不同来源的调节序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调节序列和编码序列。这样一个构建体可以单独使用或可以与载体结合使用。如果使用载体,则载体的选择取决于如本领域技术人员熟知的将用于转化宿主细胞的方法。例如,可以使用质粒载体。技术人员充分了解必须存在于载体上以便成功转化,选择和繁殖宿主细胞的遗传元件。技术人员还将认识到,不同的独立转化事件可以导致表达的不同水平和模式(Jones等人,(1985)EMBO J[欧洲分子生物学学会杂志]4:2411-2418;De Almeida等人,(1989)Mol GenGenetics[分子遗传学和普通遗传学]218:78-86),并且因此通常筛选多个转植项,从而获得显示希望的表达水平和模式的品系。此类筛选可以是完成的标准分子生物学测定、生物化学测定以及其他测定,这些测定包括DNA的印迹分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、逆转录PCR(RT-PCR)、蛋白表达的免疫印迹分析、酶测定或活性测定、和/或表型分析。
如在此使用,术语“表达”是指处于前体抑或成熟形式的功能性终产物(例如,mRNA、指导RNA或蛋白质)的产生。
术语“提供”包括向细胞提供核酸(例如,表达构建体)或蛋白质。提供包括参考核酸合并到真核细胞或原核细胞中,其中核酸可以被并入细胞的基因组中,并且包括参考核酸或蛋白被瞬时提供至细胞。引入包括参考稳定的或瞬时的转化方法,以及有性杂交。因此,在将核酸片段(例如,重组DNA构建体/表达构建体)***细胞中的上下文中,“提供”意指“转染”、或“转化”、或“转导”,并且包括参考将核酸片段并入真核或原核细胞中,其中该核酸片段可以并入细胞的基因组(例如,染色体、质粒、质体、或线粒体DNA)中,转化为自主复制子,或瞬时地表达(例如,转染的mRNA)。
“成熟”蛋白质是指翻译后加工的多肽(即,从其中已经除去存在于初级翻译产物中的任何前肽(pre-peptide)或原肽(propeptide)的一种多肽)。“前体”蛋白质是指mRNA的翻译的初级产物(即,仍存在前肽或原肽)。前肽或原肽可以是但不限于细胞内定位信号。
“稳定转化”是指将核酸片段转移至宿主生物体的基因组中,包括细胞核的和细胞器的基因组,导致遗传稳定的遗传。相比之下,“瞬时转化”是指将核酸片段转移至宿主生物体的细胞核中或其他包含DNA的细胞器中,导致基因表达而无整合或稳定的遗传。包含转化的核酸片段的宿主生物体被称为“转基因”生物体。
基因改进种质的商业开发也已经进展至向作物植物引入多个性状的阶段,其通常称为基因堆叠法(gene stacking approach)。在该方法中,可以将赋予目的不同特征的多种基因引入植物中。基因堆叠可通过许多手段实现,包括但不限于共转化、再转化以及具有目的不同基因的品系的杂交。
术语“植物”意指整株植物、植物器官、植物组织、种子、植物细胞、种子和植物的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。植物部分包括分化和未分化的组织,包括但不限于根、茎、芽、叶、花粉、种子、肿瘤组织和各种形式的细胞和培养物(例如单细胞、原生质体、胚和愈伤组织)。植物组织可以是在植物中或在植物器官、组织或细胞培养物中的。术语“植物器官”意指植物组织或构成植物的形态上和功能上不同部分的一组组织。术语“基因组”意指存在于生物体或病毒或细胞器的每个细胞中的遗传物质的全部互补序列(基因和非编码序列);和/或从一个亲本遗传为(单倍体)单位的完整染色体组。“子代”包括植物的任何后续世代。
转基因植物包括例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合到基因组内,这样使得多核苷酸被传递给连续世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。转基因植物还可以在其基因组内包含多于一个异源多核苷酸。各异源多核苷酸均可对所述转基因植物产生不同的性状。异源多核苷酸可以包括起源于外来物种的序列,或者如果来自相同物种,可以是从其天然形式上进行实质改变的序列。转基因可以包括其基因型已经通过异源核酸的存在改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,这些异源核酸包括最初如此改变的那些转基因以及通过有性杂交或无性繁殖从初始转基因产生的那些。通过常规植物育种方法,通过本文所述的不导致外源多核苷酸的***的基因组编辑程序,或通过天然存在的事件例如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变的基因组(染色体或染色体外)的改变并不旨在被视为转基因。
在本披露的某些实施例中,可育植物是产生活雄配子和雌配子并且是自身可育的植物。这样的自体受精的植物可以产生子代植物,而没有来自任何其他植物的配子和其中所含的遗传物质的贡献。本披露的其他实施例可以涉及使用非自身可育的植物,因为该植物不产生有生活力的或在其他情况下能够受精的雄配子或雌配子或二者。如在此使用,“雄性不育植物”是不产生有生活力的或在其他情况下能够受精的雄配子的植物。如在此使用,“雌性不育植物”是不产生有生活力的或在其他情况下能够受精的雌配子的植物。认识到雄性不育植物和雌性不育植物可以分别是雌性可育的和雄性可育的。进一步认识到,雄性可育(但雌性不育)植物当与雌性可育植物杂交时可以产生有生活力的子代,并且雌性可育(但雄性不育)植物当与雄性可育植物杂交时可以产生有生活力的子代。
“厘摩”(cM)或“图距单位”是两个连锁的基因、标记、靶位点、基因座或它们的任何配对之间的距离,其中1%的减数***的产物是重组的。因此,一厘摩与等于两个连锁的基因、标记、靶位点、基因座或它们的任何配对之间的1%平均重组频率的距离相当。
本披露在包含一个或多个转基因性状的植物的育种中找到了用途。最常见的是,作为基于农杆菌、生物射弹、或其他常用程序的转化***的结果,将转基因性状随机地***整个植物的基因组中。最近,已经开发了使能够实现定向转基因***的基因靶向方案。一个重要的技术,位点特异性整合(SSI)使转基因能够靶向至与先前***的转基因相同的染色***置。专门设计的大范围核酸酶和专门设计的锌指大范围核酸酶允许研究者设计核酸酶以靶向特定的染色***置,并且这些试剂允许将转基因靶向到由这些核酸酶切割的染色***点处。
用于真核生物基因组(例如植物基因组)的精准遗传工程的目前使用的***,依赖归巢内切核酸酶、大范围核酸酶、锌指核酸酶、和转录激活子样效应子核酸酶(TALEN),这些需要用于每个新靶基因座的从头蛋白质工程。本文描述的高度特异性的、RNA指导的DNA核酸酶、指导RNA/Cas9内切核酸酶***更容易可定制,并且因此当对许多不同靶序列的修饰是目的时更有用。本披露进一步利用了指导RNA/Cas***的两组分性质,具有其恒定蛋白质组分(Cas内切核酸酶),及其可变且容易再编程的靶向组分(指导RNA或crRNA)。
本文所述的调节型指导RNA/Cas***在核酸酶离靶切割会对靶细胞有毒性的情况下,对于基因组工程(尤其是植物的基因组工程)是尤其有用的。在本文所述的指导RNA/Cas***的一个实施例中,将处于表达-优化的Cas9基因形式的恒定组分稳定整合到靶基因组(例如植物基因组)中。Cas9基因的表达是在启动子(例如植物启动子)的控制下进行的,该启动子可以是组成型启动子、组织特异性启动子、或诱导型启动子,例如,温度-诱导型、胁迫-诱导型、发育阶段诱导型、或化学品诱导型启动子。在不存在可变组分(即指导RNA或crRNA)的情况下,Cas9蛋白不能切割DNA,并且因此其在植物细胞中的存在应该具有很少的结果或没有结果。因此,本文所描述的指导RNA/Cas***的关键优点是产生并且维持能够有效表达对细胞活力具有很少的结果或没有结果的Cas9蛋白的细胞系或转基因生物体的能力。为了诱导在所希望的基因组位点处切割以实现靶向的遗传修饰,可以通过多种方法将指导RNA或crRNA引入包含稳定整合的且表达的cas9基因的细胞中。例如,指导RNA或crRNA可以化学合成或酶合成,并且经由直接的递送方法(例如粒子轰击或电穿孔)引入到Cas9表达细胞中。
可替代地,可以经化学合成、酶合成、在生物学***中合成能够在靶细胞中有效地表达指导RNA或crRNA的基因,并且可以将这些基因经由直接递送方法,例如粒子轰击、电穿孔、或生物学递送方法(例如农杆菌介导的DNA递送)引入Cas9表达细胞中。
介导基因靶向的调节型指导RNA/Cas***可以在用于按如在WO 2013/0198888(于2013年8月1日公开)中披露的相似的方式指导转基因***和/或用于产生包含多个转基因的复合转基因性状基因座的方法中使用,其中使用如本文披露的调节型指导RNA/Cas***来代替使用双链断裂诱导剂,以引入目的基因。在一个实施例中,复合转基因性状基因座是具有彼此遗传连锁的多个转基因的基因组基因座。通过***在0.1、0.2、0.3、0.4、0.5、1、2、或甚至5厘摩(cM)内的彼此独立的转基因,这些转基因可以作为单个遗传基因座进行育种(参见,例如,美国专利申请13/427,138或PCT申请PCT/US 2012/030061)。在选择包含转基因的植物后,可以将包含(至少)一个转基因的植物进行杂交从而形成包含全部两个转基因的F1。来自这些F1(F2或BC1)1/500子代的子代将具有重组到相同的染色体上的两个不同的转基因。可以然后将复合物基因座育种为具有全部两个转基因性状的单遗传基因座。可以重复该过程以堆叠尽可能多的性状。
可以鉴定与目的表型或性状相关的染色体区间。本领域熟知的多种方法可用于鉴定染色体区间。此类染色体区间的边界扩展到涵盖将与控制目的性状的基因连锁的标记。换句话说,扩展染色体区间,这样使得位于区间内的任何标记(包括限定区间的边界的末端标记)可以用作北方叶枯病抗性的标记。在一个实施例中,染色体区间包含至少一个QTL,并且此外,确实可以包含多于一个QTL。相同区间中非常接近的多个QTL可以搅乱特定标记与特定QTL的关联,因为一个标记可显示与多于一个QTL连锁。相反地,例如如果非常接近的两个标记显示与期望表型性状共分离,则有时分不清楚是否那些标记中的每一个鉴定相同QTL或两个不同的QTL。术语“数量性状基因座”或“QTL”意指在至少一种遗传背景下(例如在至少一个育种种群中),与数量表型性状的差异表达关联的DNA区域。QTL的区域涵盖或紧密地连锁于影响所考虑的性状的一个或多个基因。“QTL的等位基因”可以包含在连续的基因组区域或连锁群中的多个基因或其他遗传因子,例如单倍型。QTL的等位基因可以表示在指定窗口内的单倍型,其中所述窗口是可以用一组的一个或多个多态性标记定义和追踪的连续的基因组区域。单倍型可以指定被窗口内的每一标记的等位基因的独特指纹定义。
可以使用多种方法来鉴定在靶位点处或靶位点附近具有改变的基因组的那些细胞,而不使用可筛选标记表型。此类方法可被认为是直接分析靶序列以检测靶序列中的任何变化,包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法、及其任何组合。
可以以不同方式改变蛋白质,这些方式包括氨基酸取代、缺失、截短、和***。用于此类操作的方法通常是已知的。例如,可以通过在DNA中的突变制备一种或多种蛋白质的氨基酸序列变体。用于诱变和核苷酸序列改变的方法包括,例如,Kunkel,(1985)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]82:488-92;Kunkel等人,(1987)MethEnzymol[酶学方法]154:367-82;美国专利号4,873,192;Walker和Gaastra,编辑(1983)Techniques in Molecular Biology[分子生物学技术](MacMillan Publishing Company,New York[麦克米伦出版公司,纽约]),以及其中所引用的文献。发现关于不太可能影响蛋白质生物学活性的氨基酸取代的引导,例如,在Dayhoff等人,(1978)Atlas of ProteinSequence and Structure[蛋白质序列和结构图谱集](Natl Biomed Res Found,Washington,D.C.[国家生物医学研究基金会,美国华盛顿哥伦比亚特区])的模型中。保守取代,例如将一个氨基酸与具有相似特性的另一个氨基酸交换,会是优选的。未预期保守缺失、***、和氨基酸取代会产生在蛋白质特征中的根本变化,并且可以通过常规筛选测定来评价任何取代、缺失、***、或其组合的作用。对双链-断裂-诱导活性的测定是已知的,并且通常测量试剂对包含靶位点的DNA底物的总体活性和特异性。
已知用于将核苷酸序列和多肽引入生物体中的各种方法,这些方法包括,例如转化、有性杂交、以及将多肽、DNA、或mRNA引入细胞中。
用于接触组合物、提供组合物和/或将组合物引入到不同生物体中的方法是已知的,并且包括但不限于稳定转化方法、瞬时转化方法、病毒介导的方法、以及有性育种。稳定转化表明将引入的多聚核苷酸整合到生物体的基因组中,并且能够由其子代进行遗传。瞬时转化表明所引入的组合物仅在生物体中暂时表达或存在。
用于将多核苷酸和多肽引入植物的方案可以取决于被靶向用于转化的植物或植物细胞的类型(例如单子叶植物或双子叶植物)而变化。将多核苷酸和多肽引入到植物细胞中并随后***到植物基因组中的适合方法包括显微注射(Crossway等人,(1986)Biotechniques[生物技术]4:320-34和美国专利号6,300,543)、分生组织转化(美国专利号5,736,369)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:5602-6)、农杆菌介导的转化(美国专利号5,563,055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J[欧洲分子生物学学会杂志]3:2717-22)、以及弹道粒子加速(美国专利号4,945,050;5,879,918;5,886,244;5,932,782;Tomes等人,(1995)“DirectDNA Transfer into Intact Plant Cells via Microprojectile Bombardment[经由粒子轰击向完整植物细胞中直接转移DNA]”在Plant Cell,Tissue,and Organ Culture:Fundamental Methods[植物细胞、组织和器官培养:基本方法]中,编辑Gamborg&Phillips(Springer-Verlag,Berlin[柏林施普林格出版社]);McCabe等人,(1988)Biotechnology[生物技术]6:923-6;Weissinger等人,(1988)Ann Rev Genet[遗传学年评]22:421-77;Sanford等人,(1987)Particulate Science and Technology[微粒科学与技术]5:27-37(洋葱);Christou等人,(1988)Plant Physiol[植物生理学]87:671-4(大豆);Finer和McMullen,(1991)In Vitro Cell Dev Biol[体外细胞与发育生物学]27P:175-82(大豆);Singh等人,(1998)Theor Appl Genet[理论与应用遗传学]96:319-24(大豆);Datta等人,(1990)Biotechnology[生物技术]8:736-40(水稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]85:4305-9(玉蜀黍);Klein等人,(1988)Biotechnology[生物技术]6:559-63(玉蜀黍);美国专利号5,240,855;5,322,783和5,324,646;Klein等人,(1988)Plant Physiol[植物生理学]91:440-4(玉蜀黍);Fromm等人,(1990)Biotechnology[生物技术]8:833-9(玉蜀黍);Hooykaas-Van Slogteren等人,(1984)Nature[自然]311:763-4;美国专利号5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]84:5345-9(百合科);De Wet等人,(1985)在The Experimental Manipulation of Ovule Tissues[胚珠组织的实验操作],编辑Chapman等人,(Longman,New York[纽约朗文出版社]),197-209页(花粉);Kaeppler等人,(1990)Plant Cell Rep[植物细胞报告]9∶415-8),和Kaeppler等人,(1992)Theor ApplGenet[理论与应用遗传学]84:560-6(whisker介导的转化);D′Halluin等人,(1992)PlantCell[植物细胞]4:1495-505(电穿孔);Li等人,(1993)Plant Cell Rep[植物细胞报告]12:250-5;Christou和Ford(1995)Annals Botany[植物学年鉴]75:407-13(水稻)以及Osjoda等人,(1996)Nat Biotechnol[自然生物技术]14:745-50(经由根癌土壤农杆菌的玉蜀黍)。
可替代地,通过使植物与病毒或病毒核酸接触来将多核苷酸引入植物中。通常,此类方法涉及将多核苷酸并入病毒DNA或RNA分子内。在一些实例中,可以最初将目的多肽作为病毒多聚蛋白的一部分合成,然后将合成的多肽在体内或在体外通过蛋白水解加工从而产生所希望的重组蛋白。用于将多核苷酸引入植物,并且表达在其中编码的蛋白质(涉及病毒DNA或RNA分子)的方法是已知的(参见,例如,美国专利号5,889,191、5,889,190、5,866,785、5,589,367、以及5,316,931)。瞬时转化方法包括但不限于将多肽(例如双链断裂诱导剂)直接引入生物体,将多核苷酸(例如DNA和/或RNA多核苷酸)引入,以及将RNA转录物(例如编码双链断裂诱导剂的mRNA)引入生物体。此类方法包括例如显微注射或粒子轰击。参见,例如Crossway等人,(1986)Mol Gen Genet[分子遗传和基因组学]202:179-85;Nomura等人,(1986)Plant Sci[植物科学]44:53-8;Hepler等人,(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:2176-80;以及Hush等人,(1994)J Cell Sci[细胞科学杂志]107:775-84。
术语“双子叶植物”是指被子植物的亚类,也被称为“双子叶植物类”,并且包括参考整株植物,植物器官(例如叶、茎、根、等),种子,植物细胞,以及植物的子代。本文所用的植物细胞包括但不限于种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。
在本披露的上下文中,术语“杂交的”或“杂交(“cross”或“crossing”)”是指经由授粉将配子融合从而产生子代(即,细胞、种子、或植物)。该术语涵盖有性杂交(一株植物被另一株植物授粉)和自交(自体授粉,即当花粉和胚珠(或小孢子和大孢子)是来自同一植物或基因相同的植物时)。
术语“渗入”指基因座的期望等位基因从一种遗传背景传递到另一种遗传背景的现象。例如,可以经由两个亲本植物之间的有性杂交将指定基因座处的所希望的等位基因的渗入传递给至少一个子代植物,其中至少一个亲本植物在其基因组内具有所希望的等位基因。可替代地,例如等位基因的传递可以通过两个供体基因组之间的重组而发生,例如在融合原生质体中,其中至少其中一个供体原生质体在其基因组中具有所希望的等位基因。所希望的等位基因可以是,例如转基因、修饰的(突变的或编辑的)天然等位基因、或标记或QTL的选择的等位基因。
标准的DNA分离、纯化、分子克隆、载体构建、和验证/表征方法是完善确立的,参见,例如Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册](纽约冷泉港实验室出版社(Cold Spring Harbor Laboratory Press,NY))。载体和构建体包括包含目的多核苷酸的环状质粒和线状多核苷酸,以及任选地其他组分,包括接头、适配子、调节区、内含子、限制位点、增强子、隔离子、可选择标记、目的核苷酸序列、启动子、和/或有助于载体构建或分析的其他位点。在一些实例中,识别位点和/或靶位点可以包含在内含子、编码序列、5′UTR、3′UTRs、和/或调节区内。
本披露进一步提供了用于在植物、植物细胞、或植物部分中表达指导RNA/Cas***的表达构建体,该指导RNA/Cas***能够结合靶位点并且在靶位点处产生双链断裂。在一个实施例中,本披露的表达构建体包括有效地连接至编码Cas基因的核苷酸序列的启动子,以及有效地连接至本披露的指导RNA的启动子。该启动子能够驱动在植物细胞中有效地连接的核苷酸序列的表达。
表型标记是可筛选或可选择标记,其包括视觉标记和可选择标记,无论其是阳性还是阴性可选择标记。可以使用任何表型标记。具体地,可选择或可筛选标记包含允许人们通常在特定条件下鉴定或选择包含它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性,例如但不限于RNA、肽或蛋白质的产生,或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
可选择标记的实例包括但不限于包含限制酶位点的DNA区段;编码提供对包括抗生素在内的其他毒性化合物的抗性的产物的DNA区段,该抗生素例如是大观霉素、氨苄青霉素、卡那霉素、四环素、巴斯塔(Basta)、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT);编码另外在受体细胞中缺少的产物的DNA区段(例如,tRNA基因、营养缺陷型标记);编码可以容易地鉴定的产物的DNA区段(例如,表型标记例如β-半乳糖苷酶、GUS;荧光蛋白,例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白);产生用于PCR的新引物位点(例如,以前未并列的两个DNA序列的并列),包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列;并且包含允许其鉴定的特异性修饰(例如,甲基化)所需的DNA序列。
另外的可选择标记包括赋予除草剂化合物(例如草胺磷、溴草腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-D))抗性的基因。参见例如,Yarranton,(1992)Curr Opin Biotech[生物技术新见]3:506-11;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:6314-8;Yao等人,(1992)Cell[细胞]71:63-72;Reznikoff,(1992)MolMicrobiol[分子微生物学]6∶2419-22;Hu等人,(1987)Cell[细胞]48:555-66;Brown等人,(1987)Cell[细胞]49:603-12;Figge等人,(1988)Cell[细胞]52:713-22;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-4;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2549-53;Deuschle等人,(1990)Science[科学]248:480-3;Gossen,(1993)Ph.D.Thesis,University of Heidelberg[海德堡大学博士论文];Reines等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:1917-21;Labow等人,(1990)Mol Cell Biol[分子细胞生物学]10:3343-56;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:3952-6;Baim等人,(1991)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]88:5072-6;Wyborski等人,(1991)Nucleic Acids Res[核酸研究]19:4647-53;Hillen和Wissman,(1989)Topics Mol StrucBiol[热点分子结构生物学]10:143-62;Degenkolb等人,(1991)Antimicrob AgentsChemother[抗微生物剂和化疗]35:1591-5;Kleinschnidt等人,(1988)Biochemistry[生物化学]27:1094-104;Bonin,(1993)Ph.D.Thesis,University of Heidelberg[海德堡大学博士论文];Gossen等人,(1992)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:5547-51;Oliva等人,(1992)Antimicrob Agents Chemother[抗微生物剂和化疗]36:913-9;Hlavka等人,(1985)Handbook of Experimental Pharmacology[实验药理学手册],Vol.78(Springer-Verlag,Berlin[柏林施普林格出版社]);Gill等人,(1988)Nature[自然]334:721-4。
具有引入序列的这些细胞可以使用常规条件生长或再生成植物,参见例如,McCormick等人,(1986)Plant Cell Rep[植物细胞报告]5:81-4。然后可以使这些植物生长,并且用相同的转化植株或用不同的转化的或未转化的植株进行授粉,并且产生具有所希望的特征和/或包含所鉴定的引入的多核苷酸或多肽的子代。可以生长两个或更多个世代,以确保多核苷酸的稳定维持和遗传,并且收获种子。
可使用任何植物,包括单子叶植物和双子叶植物。可以使用的单子叶植物的实例包括但不限于,玉米(玉米(Zea mays))、水稻(稻)、黑麦(黑麦(Secale cereale))、高粱(双色高粱(Sorghum bicolor)、高粱(Sorghum vulgare))、小米(例如,珍珠小米、御谷(Pennisetum glaucum))、黍稷(粟米(Panicum miliaceum))、粟(谷子(Setariaitalica))、穇子(龙爪稷(Eleusine coracana))、小麦(小麦(Triticum aestivum))、甘蔗(甘蔗属物种(Saccharum spp.))、燕麦(燕麦属(Avena))、大麦(大麦属(Hordeum)),柳枝稷(柳枝黍(Panicum virgatum))、菠萝(菠萝(Ananas comosus))、香蕉(香蕉属物种(Musaspp.))、棕榈、观赏植物、草坪草、以及其他草。可以使用的双子叶植物的实例包括大豆(大豆(Glycine max))、卡诺拉(欧洲油菜和白菜型油菜)、苜蓿(紫花苜蓿(Medicagosativa))、烟草(烟草(Nicotiana tabacum))、拟南芥(拟南芥(A.thaliana))、向日葵(向日葵(Helianthus annuus))、棉花(木本棉(Gossypium arboreum))、和花生(花生(Arachishypogaea))、番茄(番茄(Solanum lycopersicum))、马铃薯(马铃薯(Solanum tuberosum))等。
转基因、重组DNA分子、目的DNA序列、以及目的多核苷酸可以包括一个或多个目的基因。此类目的基因可以编码,例如,为植物提供农学优势的蛋白质。
缩写的含义如下:“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“μL”意指微升、“mL”意指毫升、“L”意指升、“μM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”微摩尔、“g”意指克、“μg”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、以及“kb”意指千碱基。
本文所披露的组合物和方法的非限制性实例如下所述:
1.一种用于在植物细胞中进行指导RNA/Cas内切核酸酶复合物的调节型表达的方法,该方法包括:
a)向植物细胞提供指导RNA,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂;以及
b)通过对该植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致该Cas内切核酸酶的表达;
2.如实施例1所述的方法,其中该诱导型启动子是通过热处理诱导的。
3.如实施例2所述的方法,其中所述热处理包括高于26℃的温度。
4.如实施例1所述的方法,其中该植物细胞来源于单子叶植物或双子叶植物。
5.如实施例1所述的方法,其中该植物细胞是体细胞胚的细胞。
6.如实施例1所述的方法,其中经由能够表达指导RNA的DNA表达盒提供该指导RNA。
7.如实施例1所述的方法,其中该指导RNA作为单链RNA分子抑或双链RNA分子被直接提供至细胞。
8.如实施例1所述的方法,其中该植物细胞进一步包括一个可选择标记表达盒。
9.如实施例8所述的方法,其中该可选择标记盒包含中断的可见标记盒,该中断的可见标记盒包含中断可见标记基因的间隔子核苷酸序列,其中所述可见标记基因可以通过表达该Cas内切核酸酶进行恢复。
10.如实施例9所述的方法,该方法进一步包括c)选择表达恢复的可见标记基因的植物细胞。
11.如实施例10所述的方法,该方法进一步包括d)使c)的植物细胞生长成植物。
12.由实施例11所述的方法产生的植物或植物细胞,其中所述植物具有稳定并入其基因组中的所述诱导型启动子。
13.由实施例12所述的植物产生的种子,其中所述种子具有稳定并入其基因组中的所述诱导型启动子。
14.如权利要求1所述的方法,其中该诱导型启动子包括:
a)包含SEQ ID NO:17或SEQ ID NO:18的全部或功能片段的核苷酸序列;
b)包含(a)的核苷酸序列的全长互补序列的核苷酸序列;或
c)基于BLASTN比对法,当与(a)或(b)的核苷酸序列相比时,包含具有至少90%序列同一性的序列的核苷酸序列;并且,
其中所述核苷酸序列是启动子。
15.一种用于在植物细胞的基因组中修饰靶DNA序列的方法,该方法包括:
a)提供植物细胞,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子;
b)向(a)的植物细胞提供指导RNA,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述靶DNA序列处引入双链断裂;以及,
c)通过对(b)的植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致(a)的Cas内切核酸酶的表达。
16.如实施例15所述的方法,该方法进一步包括d)鉴定在所述靶标处具有修饰的植物细胞,其中该修饰包括在所述靶DNA序列中的一个或多个核苷酸的至少一个缺失或取代。
17.如实施例15所述的方法,其中经由能够表达指导RNA的DNA表达盒提供该指导RNA。
18.如实施例15所述的方法,其中能够表达该指导RNA的该DNA表达盒稳定并入所述植物细胞基因组中。
19.如实施例15所述的方法,其中将该指导RNA作为单链RNA分子或双链RNA分子提供。
20.一种用于在植物细胞中改变至少一个目的多核苷酸表达的方法,该方法包括:
a)提供植物细胞,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子;
b)向(a)的植物细胞提供至少一个指导RNA,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述靶DNA序列处引入双链断裂;
c)通过对(b)的植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致(a)的Cas内切核酸酶的表达;并且
d)选择一种植物细胞,其中所述至少一个目的多核苷酸的表达是增加或减少的。
21.如实施例1所述的方法,其中该Cas内切核酸酶是玉蜀黍优化的Cas9内切核酸酶。
22.如实施例21所述的方法,其中该Cas内切核酸酶核苷酸序列是SEQ ID NO:21。
23.一种用于在植物细胞中进行指导RNA/Cas内切核酸酶复合物的调节型表达的方法,该方法包括:
a)向植物细胞提供指导RNA,该植物细胞具有稳定并入其基因组中的重组DNA构建体,其中该重组DNA包括:
i.包含SEQ ID NO:17或SEQ ID NO:18的全部核苷酸序列或功能片段的诱导型启动子;或,
ii基于BLASTN比对法,当与(i)的核苷酸序列相比时,包含具有至少90%序列同一性的序列的诱导型启动子,
有效地连接到至少一个Cas内切核酸酶,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂;以及
b)通过对该植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致该Cas内切核酸酶的表达。
实例
在以下实例中,除非另有说明,份数和百分比以重量计,并且度数为摄氏度。应当理解的是,尽管这些实例说明了本披露的实施例,但仅是通过说明的方式给出的。从上述讨论和这些实例,本领域技术人员可以对本披露进行各种改变和修改以使其适应不同用途和条件。这样的修改也旨在落入所附权利要求书的范围内。
实例1
通过递送Cas9内切核酸酶表达盒和单指导RNA(作为RNA分子或作为DNA表达盒)来 修饰植物细胞基因组中的靶DNA序列
来自化脓性链球菌M1GAS(SF370)的Cas9基因(SEQ ID NO:1)是按本领域已知的标准技术进行玉蜀黍密码子优化的,并且引入马铃薯ST-LS1内含子(SEQ ID NO:2)以便于消除该基因在大肠杆菌和农杆菌中的表达。为了促进Cas9蛋白质在玉蜀黍细胞中的核定位,将猿猴病毒40(SV40)单分型氨基端核定位信号(MAPKKKRKV,SEQ ID NO:3)和根癌土壤农杆菌双分型VirD2T-DNA边界内切核酸酶羧基端核定位信号(KRPRDRHDGELGGRKRAR,SEQ IDNO:4)分别并入Cas9可读框的氨基和羧基端处。通过标准分子生物学技术,将该玉蜀黍优化的Cas9基因有效地连接至玉蜀黍组成型启动子(泛素)或玉蜀黍温度诱导型CAS1启动子(还称为ZmCAS1或ZmMdh)(在2013年11月21日公开的美国专利申请US 2013-0312137 A1中进行了描述,将该申请通过引用结合在此)。将泛素驱动的玉蜀黍优化的Cas9表达盒的序列在SEQ ID NO:5中示出,并且将CAS1驱动的玉蜀黍优化的Cas9表达盒的序列在SEQ ID NO:6中示出。
通过指导RNA/Cas9内切核酸酶复合物,将两个基因组靶序列(LIGCas-3和MS26Cas-2)靶向用于切割(参见表1)。LIGCas-3靶序列位于liguleless1(LIG1)基因的上游大约1150bp的基因组区域(LIG3-4)中。MS26Cas-2靶序列位于雄性可育性基因26(MS26)中。
表1.针对指导RNA/Cas内切核酸酶复合物的玉蜀黍基因组靶位点
将包含SpyCas9和sgRNA表达盒的DNA载体共递送至玉蜀黍胚胎可以产生对子代植物的可遗传突变。然而,已经示出,分离模式通常不遵循预期的孟德尔(1∶1)分离(Feng等人2014;Wang等人2014)。这可能是在T0和T1植物中sgRNAs和Cas9内切核酸酶的稳定整合和组成型表达的结果,导致不同类型的体细胞突变,并且因此导致嵌合植物。
为了克服与包含CRIPR-Cas组分的DNA载体的稳定整合相关的潜在问题,用处于DNA表达盒(SEQ ID NO:9)形式的或作为单链的RNA分子(SEQ ID NO:10)的LIG-CR3 sgRNA,与包含泛素驱动的Cas9表达盒(SEQ ID NO:5)的DNA载体组合在一起共轰击玉蜀黍未成熟的胚胎。然后通过针对转化后7天的突变进行深度测序来分析胚胎。当LIG-CR3sgRNA作为RNA分子递送时,观察到的突变频率相比作为质粒递送相同sgRNA时低大约100倍(0.026%-0.037%对比2.6%,表2)。
表2.在处于DNA表达盒(DNA载体)或单链RNA分子形式的sgRNA的递送后,由指导 RNA-Cas9内切核酸酶复合物产生的在玉蜀黍LIGCas-3靶位点处的突变体读数的百分比。
RNA DNA 突变体读数百分比
- Cas9+gRNA 2.600
LIGCas-CR3 sgRNA(35ng) Cas9 0.026
LIGCas-CR3 sgRNA(70ng) Cas9 0.037
表达和sgRNA-Cas9复合物形成的时序对于有效的DNA切割很重要。当使用DNA载体递送Cas9和sgRNA时,当分别由组成型启动子ZmUbi和ZmPolIIIU6表达时,这些组分的表达的时序可能是一致的。然而,由于Cas9蛋白的大尺寸和编码Cas9的基因在结合sgRNA之前需要被转录和翻译的要求,当sgRNA作为本质上具有短半衰期的RNA共递送时,没有满足适当时序。
实例2
在包含稳定整合于其基因组中的Cas9表达盒的植物细胞中,指导RNA的瞬时递送
为了克服上述问题,并且进一步评价瞬时sgRNA递送的可行性,产生了包含Cas9的预整合拷贝的玉蜀黍系。
包含Cαs9内切核酸酶表达盒的土壤农杆菌载体由诱导型启动子或组成型启动子驱动
将由组成型(Zm-Ubi)或温度调节型(ZmMdh)启动子调节的包含玉蜀黍优化的化脓性链球菌Cas9(SpyCas9)内切核酸酶(SEQ ID NO:21)的两种农杆菌载体(图1和图2)引入玉蜀黍以建立SpyCas9的预整合的基因组拷贝。这些农杆菌T-DNA还包含调节蓝色荧光基因(Am-Cyan)(作为可见标记)的表达的胚胎END2启动子,以及在玉蜀黍组蛋白2B启动子下的Ds-Red基因的中断拷贝。Ds-Red序列的一部分以直接取向(369bp片段)复制,并由Ds-Red(RF-FP)基因的两个片段组成,该Ds-Red基因由包含可以由sgRNA靶向的序列的343-bp间隔子隔开。将在图1中描绘的T-DNA的右边界和左边界之间的DNA序列在SEQ ID NO:11中列出,并且将在图2中描绘的T-DNA的右边界和左边界之间的DNA序列在SEQ ID NO:12中列出。
B.靶向中断的红色荧光蛋白质序列(FR-RF)的指导RNA-Cas9内切核酸酶复合物恢复功能性可见标记基因。
间隔子区域内的双链断裂促进了对被破坏的Ds-Red基因的分子内同源重组修复功能,从而导致了红色荧光细胞。将具有包含ZmUbi:SpyCas9抑或ZmMdh:SpyCas9的单拷贝T-DNA***物的玉蜀黍植物用作未成熟胚胎的来源,用于作为DNA表达盒或作为在体外转录的RNA递送sgRNA。将包含预整合的SpyCas9的蓝色荧光胚胎切离并且在28℃(ZmUbi:SpyCas9)或在37℃(ZmMdh:SpyCas9)下孵育24小时。将胚胎用包含sgRNA表达盒的两种载体进行生物射弹转化,该sgRNA表达盒靶向中断复制的Ds-Red基因(RF-FP-CR1 SEQ ID NO:13,RF-FP-CR2 SEQ ID NO:14.)的343bp间隔子。
轰击后,将具有ZmMdh:SpyCas9的胚胎在37℃下孵育24小时,并且然后转移至28℃。如在表3中所示,与对照对比,将包含ZmUbi:SypCas9和ZmMdh:SPyCas9的胚胎用靶向343bp间隔子的两个sgRNAs表达盒轰击,5天后容易地产生红色荧光焦点,表明在这些植物中功能性Cas9蛋白质的高水平的表达。
表3.经由瞬时表达的指导RNA/Cas9内切核酸酶复合物介导的分子内同源重组, RF-FR可见标记基因的修复。
C.用预整合的Cas9内切核酸酶表达盒将sgRNA瞬时递送至植物细胞,导致在靶位点中的高频率突变
为测量在LIG和MS26内源靶位点处的突变频率,将作为DNA载体(SEQ ID NO:9)或作为在体外合成的RNA分子(SEQ ID NO:10)的LIG-CR3 sgRNA以及作为DNA载体(SEQ IDNO:15)或作为在体外合成的RNA分子(SEQ ID NO:16)的MS26-CR2 sgRNA递送至CAS1:SpyCas9胚细胞中,用如上所述的温度处理,轰击后2天收获,并且针对突变进行深度测序。如在表4中示出,用在两个靶位点处产生突变的呈DNA抑或RNA的sgRNA对胚胎进行轰击。与上述结果相反,在该实验中,当sgRNA(呈RNA)与SpyCas9表达盒共转化时(表2),对于作为DNA载体或作为RNA分子递送sgRNA观察到几乎相似的频率,其中对于具有由组成型(ZmUbi)启动子驱动的SpyCas9的胚胎观察到最高突变频率。
表4.处于DNA表达盒和RNA分子形式的sgRNA递送后,在具有由诱导型Mdh启动子驱 动的稳定整合的Cas9的玉蜀黍胚细胞中,三个靶位点处的突变体读数的百分比
这些数据一起表明将处于RNA分子形式的sgRNA递送到包含预整合的SpyCas9的玉蜀黍细胞中是对用于在植物细胞中产生突变的DNA递送的可行替代方案。它阻止gRNA的稳定整合和表达,并且因此进一步阻止DNA切割,以允许更精确和受控的基因组编辑。
D.sgRNA和修复DNA模板瞬时递送至具有预整合的Cas9内切核酸酶表达盒的植物细胞导致ALS2基因编辑
该实例表明,指导RNA与单链DNA寡核苷酸的瞬时递送足以将特定变化引入玉蜀黍ALS基因的核苷酸序列中,导致植物对磺酰脲类除草剂(特别是氯磺隆)的抗性。
内源ALS蛋白质是ALS抑制剂磺酰脲类除草剂的靶位点。在作物中表达耐除草剂型的ALS蛋白质赋予对这类除草剂的耐受性。来自内源玉蜀黍乙酰乳酸合酶蛋白质的单个氨基酸残基(P165A或P165S)的修饰提供玉蜀黍中对磺酰脲类除草剂的抗性。
在玉蜀黍中存在两种ALS基因(ALS1和ALS2),分别位于染色体4和染色体5上。基于ALS1和ALS2核苷酸序列之间的多态性,鉴定和测试ALS2-特异性ALSCas-4靶位点。将靶向ALS1和ALS2基因二者的ALSCas-1指导RNA表达构建体用作对照(表5)。
表5.测试的玉蜀黍ALS基因组靶位点
*在ALS2基因中的靶位点;突出显示的核苷酸是与ALS1基因中不同的。
如在实例2中所述进行实验并且确定突变频率,并且将其结果在表6中示出。
表6.在两个ALS靶位点处的NHEJ突变的频率,通过深度测序重新获得
TS 总读数 突变体读数(ALS1) 突变体读数(ALS2)
ALSCas-1 204,230 5072(2.5%) 2704(1.3%)
ALSCas-4 120,766 3294(2.7%) 40(0.03%)
结果表明,ALSCas-4指导RNA/Cas9***使ALS2基因以相比ALS2基因大约90倍更高的效率进行突变。因此,选择ALSCas-4靶位点和相应的指导RNA,用于ALS基因编辑实验。
为产生编辑的转植项,使用粒子轰击,将该ALS多核苷酸修饰修复DNA模板(单链的127bp DNA寡核苷酸:AACCTTGTCTCCGCGCTCGCCGACGCGTTGCTGGACTCCGTGCCGATGGTCGCCATCACGGGACAGGTGTCCCGACGCATGATTGGCACCGACGCCTTCCAGGAGACGCCCATCGTCGAGGTCACCC,SEQ IDNO:24,下划线是不同于基因组序列的(修饰的)核苷酸)与预整合的Cas9内切核酸酶、和处于DNA表达盒或靶向ALSCas-4位点的在体外合成的RNA分子形式的指导RNA,作为可选择和可见标记的moPAT-DsRed融合蛋白、以及发育基因(ODP-2和WUS)共递送至玉蜀黍未成熟的胚胎中。用上述两种形式的gRNA中的每一种轰击大约500个Hi-II未成熟的胚胎。轰击后七天,将胚胎转移至具有100ppm氯磺隆的介质中以进行选择。一个月后,收集在氯磺隆选择下继续生长的转植项并用于分析。
通过对编辑的ALS2等位基因的存在进行测序,将来自每个所选择的转植项的少量愈伤组织用于总DNA提取和分析。然后使用具有经特异性编辑的ALS2等位基因的转植项来再生植物。
这些数据表明,可以将处于RNA分子和单链修复DNA模板形式的sgRNA瞬时递送至包含预整合的SpyCas9的玉蜀黍细胞,以成功用于在玉蜀黍中进行天然基因编辑。
序列表
<110> 先锋良种国际有限公司
Cigan, Andrew Mark N.
Svitashev, Sergei N.
<120> 用于指导RNA/CAS内切核酸酶复合物的调节型表达的组合物和方法
<130> BB2393 PCT
<150> 62/120421
<151> 2015-02-25
<160> 24
<170> PatentIn 版本 3.5
<210> 1
<211> 4107
<212> DNA
<213> 化脓性链球菌 M1 GAS (SF370)
<400> 1
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 2
<211> 189
<212> DNA
<213> 马铃薯
<400> 2
gtaagtttct gcttctacct ttgatatata tataataatt atcattaatt agtagtaata 60
taatatttca aatatttttt tcaaaataaa agaatgtagt atatagcaat tgcttttctg 120
tagtttataa gtgtgtatat tttaatttat aacttttcta atatatgacc aaaacatggt 180
gatgtgcag 189
<210> 3
<211> 9
<212> PRT
<213> 猿猴病毒40
<400> 3
Met Ala Pro Lys Lys Lys Arg Lys Val
1 5
<210> 4
<211> 18
<212> PRT
<213> 根癌土壤农杆菌
<400> 4
Lys Arg Pro Arg Asp Arg His Asp Gly Glu Leu Gly Gly Arg Lys Arg
1 5 10 15
Ala Arg
<210> 5
<211> 6717
<212> DNA
<213> 人工序列
<220>
<223> 泛素驱动的玉蜀黍优化的Cas9表达盒
<400> 5
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840
ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900
caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960
cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc taccttctct 1020
agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct gttcatgttt 1080
gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg gatgcgacct 1140
gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg aatcctggga 1200
tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt cgttgcatag 1260
ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt gtcgggtcat 1320
cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc ggtcgttcta 1380
gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg gatctgtatg 1440
tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat atcgatctag 1500
gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc tttttgttcg 1560
cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga tcggagtaga 1620
atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg tgtgtcatac 1680
atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag gtatacatgt 1740
tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1800
taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1860
atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1920
tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1980
tacttctgca ggtcgactct agaggatcca tggcaccgaa gaagaagcgc aaggtgatgg 2040
acaagaagta cagcatcggc ctcgacatcg gcaccaactc ggtgggctgg gccgtcatca 2100
cggacgaata taaggtcccg tcgaagaagt tcaaggtcct cggcaataca gaccgccaca 2160
gcatcaagaa aaacttgatc ggcgccctcc tgttcgatag cggcgagacc gcggaggcga 2220
ccaggctcaa gaggaccgcc aggagacggt acactaggcg caagaacagg atctgctacc 2280
tgcaggagat cttcagcaac gagatggcga aggtggacga ctccttcttc caccgcctgg 2340
aggaatcatt cctggtggag gaggacaaga agcatgagcg gcacccaatc ttcggcaaca 2400
tcgtcgacga ggtaagtttc tgcttctacc tttgatatat atataataat tatcattaat 2460
tagtagtaat ataatatttc aaatattttt ttcaaaataa aagaatgtag tatatagcaa 2520
ttgcttttct gtagtttata agtgtgtata ttttaattta taacttttct aatatatgac 2580
caaaacatgg tgatgtgcag gtggcctacc acgagaagta cccgacaatc taccacctcc 2640
ggaagaaact ggtggacagc acagacaagg cggacctccg gctcatctac cttgccctcg 2700
cgcatatgat caagttccgc ggccacttcc tcatcgaggg cgacctgaac ccggacaact 2760
ccgacgtgga caagctgttc atccagctcg tgcagacgta caatcaactg ttcgaggaga 2820
accccataaa cgctagcggc gtggacgcca aggccatcct ctcggccagg ctctcgaaat 2880
caagaaggct ggagaacctt atcgcgcagt tgccaggcga aaagaagaac ggcctcttcg 2940
gcaaccttat tgcgctcagc ctcggcctga cgccgaactt caaatcaaac ttcgacctcg 3000
cggaggacgc caagctccag ctctcaaagg acacctacga cgacgacctc gacaacctcc 3060
tggcccagat aggagaccag tacgcggacc tcttcctcgc cgccaagaac ctctccgacg 3120
ctatcctgct cagcgacatc cttcgggtca acaccgaaat taccaaggca ccgctgtccg 3180
ccagcatgat taaacgctac gacgagcacc atcaggacct cacgctgctc aaggcactcg 3240
tccgccagca gctccccgag aagtacaagg agatcttctt cgaccaatca aaaaacggct 3300
acgcgggata tatcgacggc ggtgccagcc aggaagagtt ctacaagttc atcaaaccaa 3360
tcctggagaa gatggacggc accgaggagt tgctggtcaa gctcaacagg gaggacctcc 3420
tcaggaagca gaggaccttc gacaacggct ccatcccgca tcagatccac ctgggcgaac 3480
tgcatgccat cctgcggcgc caggaggact tctacccgtt cctgaaggat aaccgggaga 3540
agatcgagaa gatcttgacg ttccgcatcc catactacgt gggcccgctg gctcgcggca 3600
actcccggtt cgcctggatg acccggaagt cggaggagac catcacaccc tggaactttg 3660
aggaggtggt cgataagggc gctagcgctc agagcttcat cgagcgcatg accaacttcg 3720
ataaaaacct gcccaatgaa aaagtcctcc ccaagcactc gctgctctac gagtacttca 3780
ccgtgtacaa cgagctcacc aaggtcaaat acgtcaccga gggcatgcgg aagccggcgt 3840
tcctgagcgg cgagcagaag aaggcgatag tggacctcct cttcaagacc aacaggaagg 3900
tgaccgtgaa gcaattaaaa gaggactact tcaagaaaat agagtgcttc gactccgtgg 3960
agatctcggg cgtggaggat cggttcaacg cctcactcgg cacgtatcac gacctcctca 4020
agatcattaa agacaaggac ttcctcgaca acgaggagaa cgaggacatc ctcgaggaca 4080
tcgtcctcac cctgaccctg ttcgaggacc gcgaaatgat cgaggagagg ctgaagacct 4140
acgcgcacct gttcgacgac aaggtcatga aacagctcaa gaggcgccgc tacactggtt 4200
ggggaaggct gtcccgcaag ctcattaatg gcatcaggga caagcagagc ggcaagacca 4260
tcctggactt cctcaagtcc gacgggttcg ccaaccgcaa cttcatgcag ctcattcacg 4320
acgactcgct cacgttcaag gaagacatcc agaaggcaca ggtgagcggg cagggtgact 4380
ccctccacga acacatcgcc aacctggccg gctcgccggc cattaaaaag ggcatcctgc 4440
agacggtcaa ggtcgtcgac gagctcgtga aggtgatggg ccggcacaag cccgaaaata 4500
tcgtcataga gatggccagg gagaaccaga ccacccaaaa agggcagaag aactcgcgcg 4560
agcggatgaa acggatcgag gagggcatta aagagctcgg gtcccagatc ctgaaggagc 4620
accccgtgga aaatacccag ctccagaatg aaaagctcta cctctactac ctgcagaacg 4680
gccgcgacat gtacgtggac caggagctgg acattaatcg gctatcggac tacgacgtcg 4740
accacatcgt gccgcagtcg ttcctcaagg acgatagcat cgacaacaag gtgctcaccc 4800
ggtcggataa aaatcggggc aagagcgaca acgtgcccag cgaggaggtc gtgaagaaga 4860
tgaaaaacta ctggcgccag ctcctcaacg cgaaactgat cacccagcgc aagttcgaca 4920
acctgacgaa ggcggaacgc ggtggcttga gcgaactcga taaggcgggc ttcataaaaa 4980
ggcagctggt cgagacgcgc cagatcacga agcatgtcgc ccagatcctg gacagccgca 5040
tgaatactaa gtacgatgaa aacgacaagc tgatccggga ggtgaaggtg atcacgctga 5100
agtccaagct cgtgtcggac ttccgcaagg acttccagtt ctacaaggtc cgcgagatca 5160
acaactacca ccacgcccac gacgcctacc tgaatgcggt ggtcgggacc gccctgatca 5220
agaagtaccc gaagctggag tcggagttcg tgtacggcga ctacaaggtc tacgacgtgc 5280
gcaaaatgat cgccaagtcc gagcaggaga tcggcaaggc cacggcaaaa tacttcttct 5340
actcgaacat catgaacttc ttcaagaccg agatcaccct cgcgaacggc gagatccgca 5400
agcgcccgct catcgaaacc aacggcgaga cgggcgagat cgtctgggat aagggccggg 5460
atttcgcgac ggtccgcaag gtgctctcca tgccgcaagt caatatcgtg aaaaagacgg 5520
aggtccagac gggcgggttc agcaaggagt ccatcctccc gaagcgcaac tccgacaagc 5580
tcatcgcgag gaagaaggat tgggacccga aaaaatatgg cggcttcgac agcccgaccg 5640
tcgcatacag cgtcctcgtc gtggcgaagg tggagaaggg caagtcaaag aagctcaagt 5700
ccgtgaagga gctgctcggg atcacgatta tggagcggtc ctccttcgag aagaacccga 5760
tcgacttcct agaggccaag ggatataagg aggtcaagaa ggacctgatt attaaactgc 5820
cgaagtactc gctcttcgag ctggaaaacg gccgcaagag gatgctcgcc tccgcaggcg 5880
agttgcagaa gggcaacgag ctcgccctcc cgagcaaata cgtcaatttc ctgtacctcg 5940
ctagccacta tgaaaagctc aagggcagcc cggaggacaa cgagcagaag cagctcttcg 6000
tggagcagca caagcattac ctggacgaga tcatcgagca gatcagcgag ttctcgaagc 6060
gggtgatcct cgccgacgcg aacctggaca aggtgctgtc ggcatataac aagcaccgcg 6120
acaaaccaat acgcgagcag gccgaaaata tcatccacct cttcaccctc accaacctcg 6180
gcgctccggc agccttcaag tacttcgaca ccacgattga ccggaagcgg tacacgagca 6240
cgaaggaggt gctcgatgcg acgctgatcc accagagcat cacagggctc tatgaaacac 6300
gcatcgacct gagccagctg ggcggagaca agagaccacg ggaccgccac gatggcgagc 6360
tgggaggccg caagcgggca aggtaggtac cgttaaccta gacttgtcca tcttctggat 6420
tggccaactt aattaatgta tgaaataaaa ggatgcacac atagtgacat gctaatcact 6480
ataatgtggg catcaaagtt gtgtgttatg tgtaattact agttatctga ataaaagaga 6540
aagagatcat ccatatttct tatcctaaat gaatgtcacg tgtctttata attctttgat 6600
gaaccagatg catttcatta accaaatcca tatacatata aatattaatc atatataatt 6660
aatatcaatt gggttagcaa aacaaatcta gtctaggtgt gttttgcgaa tgcggcc 6717
<210> 6
<211> 5758
<212> DNA
<213> 人工序列
<220>
<223> CAS1驱动的玉蜀黍优化的Cas9表达盒
<400> 6
agctttttgg aaggctaagg agaggaagcc ggcgagaagg agggggcgtt ttacgtgtca 60
ctgtcctgtc gtgttggctg ttgacacgaa tcatttcttc cgcgcgtggg aagaagaaga 120
tgcacattag cggcctgaag tagagatgtc aatggggaat tccccagcgg ggattaactc 180
cccagacccg tacccatgaa catagaccgg cccccatccc cgaacccgaa cccgacctcg 240
ggtacgaaaa tcctcccata cccattcccg accgggtact aaatacccat gggtatccat 300
acccgacccg attattcaaa aattaatggg ctttttattt gttaaccggc ggacgcaatg 360
cttgggactc taggtttttt tactttgttg accggctggc ggctgggctt tttcctacag 420
gcccaaagtt ggtcggcagc cactaggcca cacgtcacag gcagcccaca agtaaatgtc 480
gttggattgc tggatggtgg aataaaaatc ctagatgcta gattgttctg gttccgggta 540
tttttctcca tggctaatcg ggtttgggtt tagccctccc aaacccgaac ccgccatacc 600
cgatgggtaa gggatttatt ccaaatctat acccatgggg atttgtttta acccatacct 660
taaccctaat agaggaattc cccacgggta atcgggtttc ggggcccatt gacatctcta 720
gactgaaggc gtccaactca aatcattaaa aagtgttgac gcacgcgctg atgcgccggc 780
cgcacagcac aggctgcaca gcccgtttaa tcagcgatgg agccccggcc gtcagccagc 840
caggtccggc gtccgggtct gcgccctgcg gcgtcactgc tgtcgccacc gtctccgatg 900
gtcccacatc catccagcgg gccgcgcgtg gtacaaaagg ctcttcctcg ccgtcaggtg 960
cagctgccca aacaccagac acagactcca ccaccccgct tcgatcttct gttgcagctg 1020
aaatctgtca gattctgcag ttcattcctc atggcaccga agaagaagcg caaggtgatg 1080
gacaagaagt acagcatcgg cctcgacatc ggcaccaact cggtgggctg ggccgtcatc 1140
acggacgaat ataaggtccc gtcgaagaag ttcaaggtcc tcggcaatac agaccgccac 1200
agcatcaaga aaaacttgat cggcgccctc ctgttcgata gcggcgagac cgcggaggcg 1260
accaggctca agaggaccgc caggagacgg tacactaggc gcaagaacag gatctgctac 1320
ctgcaggaga tcttcagcaa cgagatggcg aaggtggacg actccttctt ccaccgcctg 1380
gaggaatcat tcctggtgga ggaggacaag aagcatgagc ggcacccaat cttcggcaac 1440
atcgtcgacg aggtaagttt ctgcttctac ctttgatata tatataataa ttatcattaa 1500
ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta gtatatagca 1560
attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc taatatatga 1620
ccaaaacatg gtgatgtgca ggtggcctac cacgagaagt acccgacaat ctaccacctc 1680
cggaagaaac tggtggacag cacagacaag gcggacctcc ggctcatcta ccttgccctc 1740
gcgcatatga tcaagttccg cggccacttc ctcatcgagg gcgacctgaa cccggacaac 1800
tccgacgtgg acaagctgtt catccagctc gtgcagacgt acaatcaact gttcgaggag 1860
aaccccataa acgctagcgg cgtggacgcc aaggccatcc tctcggccag gctctcgaaa 1920
tcaagaaggc tggagaacct tatcgcgcag ttgccaggcg aaaagaagaa cggcctcttc 1980
ggcaacctta ttgcgctcag cctcggcctg acgccgaact tcaaatcaaa cttcgacctc 2040
gcggaggacg ccaagctcca gctctcaaag gacacctacg acgacgacct cgacaacctc 2100
ctggcccaga taggagacca gtacgcggac ctcttcctcg ccgccaagaa cctctccgac 2160
gctatcctgc tcagcgacat ccttcgggtc aacaccgaaa ttaccaaggc accgctgtcc 2220
gccagcatga ttaaacgcta cgacgagcac catcaggacc tcacgctgct caaggcactc 2280
gtccgccagc agctccccga gaagtacaag gagatcttct tcgaccaatc aaaaaacggc 2340
tacgcgggat atatcgacgg cggtgccagc caggaagagt tctacaagtt catcaaacca 2400
atcctggaga agatggacgg caccgaggag ttgctggtca agctcaacag ggaggacctc 2460
ctcaggaagc agaggacctt cgacaacggc tccatcccgc atcagatcca cctgggcgaa 2520
ctgcatgcca tcctgcggcg ccaggaggac ttctacccgt tcctgaagga taaccgggag 2580
aagatcgaga agatcttgac gttccgcatc ccatactacg tgggcccgct ggctcgcggc 2640
aactcccggt tcgcctggat gacccggaag tcggaggaga ccatcacacc ctggaacttt 2700
gaggaggtgg tcgataaggg cgctagcgct cagagcttca tcgagcgcat gaccaacttc 2760
gataaaaacc tgcccaatga aaaagtcctc cccaagcact cgctgctcta cgagtacttc 2820
accgtgtaca acgagctcac caaggtcaaa tacgtcaccg agggcatgcg gaagccggcg 2880
ttcctgagcg gcgagcagaa gaaggcgata gtggacctcc tcttcaagac caacaggaag 2940
gtgaccgtga agcaattaaa agaggactac ttcaagaaaa tagagtgctt cgactccgtg 3000
gagatctcgg gcgtggagga tcggttcaac gcctcactcg gcacgtatca cgacctcctc 3060
aagatcatta aagacaagga cttcctcgac aacgaggaga acgaggacat cctcgaggac 3120
atcgtcctca ccctgaccct gttcgaggac cgcgaaatga tcgaggagag gctgaagacc 3180
tacgcgcacc tgttcgacga caaggtcatg aaacagctca agaggcgccg ctacactggt 3240
tggggaaggc tgtcccgcaa gctcattaat ggcatcaggg acaagcagag cggcaagacc 3300
atcctggact tcctcaagtc cgacgggttc gccaaccgca acttcatgca gctcattcac 3360
gacgactcgc tcacgttcaa ggaagacatc cagaaggcac aggtgagcgg gcagggtgac 3420
tccctccacg aacacatcgc caacctggcc ggctcgccgg ccattaaaaa gggcatcctg 3480
cagacggtca aggtcgtcga cgagctcgtg aaggtgatgg gccggcacaa gcccgaaaat 3540
atcgtcatag agatggccag ggagaaccag accacccaaa aagggcagaa gaactcgcgc 3600
gagcggatga aacggatcga ggagggcatt aaagagctcg ggtcccagat cctgaaggag 3660
caccccgtgg aaaataccca gctccagaat gaaaagctct acctctacta cctgcagaac 3720
ggccgcgaca tgtacgtgga ccaggagctg gacattaatc ggctatcgga ctacgacgtc 3780
gaccacatcg tgccgcagtc gttcctcaag gacgatagca tcgacaacaa ggtgctcacc 3840
cggtcggata aaaatcgggg caagagcgac aacgtgccca gcgaggaggt cgtgaagaag 3900
atgaaaaact actggcgcca gctcctcaac gcgaaactga tcacccagcg caagttcgac 3960
aacctgacga aggcggaacg cggtggcttg agcgaactcg ataaggcggg cttcataaaa 4020
aggcagctgg tcgagacgcg ccagatcacg aagcatgtcg cccagatcct ggacagccgc 4080
atgaatacta agtacgatga aaacgacaag ctgatccggg aggtgaaggt gatcacgctg 4140
aagtccaagc tcgtgtcgga cttccgcaag gacttccagt tctacaaggt ccgcgagatc 4200
aacaactacc accacgccca cgacgcctac ctgaatgcgg tggtcgggac cgccctgatc 4260
aagaagtacc cgaagctgga gtcggagttc gtgtacggcg actacaaggt ctacgacgtg 4320
cgcaaaatga tcgccaagtc cgagcaggag atcggcaagg ccacggcaaa atacttcttc 4380
tactcgaaca tcatgaactt cttcaagacc gagatcaccc tcgcgaacgg cgagatccgc 4440
aagcgcccgc tcatcgaaac caacggcgag acgggcgaga tcgtctggga taagggccgg 4500
gatttcgcga cggtccgcaa ggtgctctcc atgccgcaag tcaatatcgt gaaaaagacg 4560
gaggtccaga cgggcgggtt cagcaaggag tccatcctcc cgaagcgcaa ctccgacaag 4620
ctcatcgcga ggaagaagga ttgggacccg aaaaaatatg gcggcttcga cagcccgacc 4680
gtcgcataca gcgtcctcgt cgtggcgaag gtggagaagg gcaagtcaaa gaagctcaag 4740
tccgtgaagg agctgctcgg gatcacgatt atggagcggt cctccttcga gaagaacccg 4800
atcgacttcc tagaggccaa gggatataag gaggtcaaga aggacctgat tattaaactg 4860
ccgaagtact cgctcttcga gctggaaaac ggccgcaaga ggatgctcgc ctccgcaggc 4920
gagttgcaga agggcaacga gctcgccctc ccgagcaaat acgtcaattt cctgtacctc 4980
gctagccact atgaaaagct caagggcagc ccggaggaca acgagcagaa gcagctcttc 5040
gtggagcagc acaagcatta cctggacgag atcatcgagc agatcagcga gttctcgaag 5100
cgggtgatcc tcgccgacgc gaacctggac aaggtgctgt cggcatataa caagcaccgc 5160
gacaaaccaa tacgcgagca ggccgaaaat atcatccacc tcttcaccct caccaacctc 5220
ggcgctccgg cagccttcaa gtacttcgac accacgattg accggaagcg gtacacgagc 5280
acgaaggagg tgctcgatgc gacgctgatc caccagagca tcacagggct ctatgaaaca 5340
cgcatcgacc tgagccagct gggcggagac aagagaccac gggaccgcca cgatggcgag 5400
ctgggaggcc gcaagcgggc aaggtaggta ccgttaacct agacttgtcc atcttctgga 5460
ttggccaact taattaatgt atgaaataaa aggatgcaca catagtgaca tgctaatcac 5520
tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac tagttatctg aataaaagag 5580
aaagagatca tccatatttc ttatcctaaa tgaatgtcac gtgtctttat aattctttga 5640
tgaaccagat gcatttcatt aaccaaatcc atatacatat aaatattaat catatataat 5700
taatatcaat tgggttagca aaacaaatct agtctaggtg tgttttgcga atgcggcc 5758
<210> 7
<211> 17
<212> DNA
<213> 玉蜀黍
<220>
<221> 尚未归类的特征
<222> (1)..(17)
<223> LIGCas-3 gRNA 靶序列 (无 PAM)
<400> 7
gcgtacgcgt acgtgtg 17
<210> 8
<211> 21
<212> DNA
<213> 玉蜀黍
<220>
<221> 尚未归类的特征
<222> (1)..(21)
<223> MS26Cas-2 gRNA 靶序列 (无 PAM)
<400> 8
gcacgtacgt caccatcccg c 21
<210> 9
<211> 1102
<212> DNA
<213> 人工序列
<220>
<223> LIG-CR3 单指导RNA表达盒
<400> 9
tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60
tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120
ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180
gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240
ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300
atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360
gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420
gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480
aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540
cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600
aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660
attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720
ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780
agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840
agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900
ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960
gtggagcgta ccttataaac cgagccgcaa gcaccgaatt gcgtacgcgt acgtgtggtt 1020
ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 1080
accgagtcgg tgcttttttt tt 1102
<210> 10
<211> 98
<212> RNA
<213> 人工序列
<220>
<223> LIG-CR3 单链的单指导 RNA分子
<400> 10
ggcguacgcg uacguguggu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60
uuaucaacuu gaaaaagugg caccgagucg gugcuuuu 98
<210> 11
<211> 12716
<212> DNA
<213> 人工序列
<220>
<223> 包含Ds-Red表达盒的Ubi-Cas9、END2-Am-Cyan、和H2B驱动的中断拷贝的T-DNA
<400> 11
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840
ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900
caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960
cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc taccttctct 1020
agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct gttcatgttt 1080
gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg gatgcgacct 1140
gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg aatcctggga 1200
tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt cgttgcatag 1260
ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt gtcgggtcat 1320
cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc ggtcgttcta 1380
gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg gatctgtatg 1440
tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat atcgatctag 1500
gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc tttttgttcg 1560
cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga tcggagtaga 1620
atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg tgtgtcatac 1680
atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag gtatacatgt 1740
tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1800
taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1860
atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1920
tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1980
tacttctgca ggtcgactct agaggatcca tggcaccgaa gaagaagcgc aaggtgatgg 2040
acaagaagta cagcatcggc ctcgacatcg gcaccaactc ggtgggctgg gccgtcatca 2100
cggacgaata taaggtcccg tcgaagaagt tcaaggtcct cggcaataca gaccgccaca 2160
gcatcaagaa aaacttgatc ggcgccctcc tgttcgatag cggcgagacc gcggaggcga 2220
ccaggctcaa gaggaccgcc aggagacggt acactaggcg caagaacagg atctgctacc 2280
tgcaggagat cttcagcaac gagatggcga aggtggacga ctccttcttc caccgcctgg 2340
aggaatcatt cctggtggag gaggacaaga agcatgagcg gcacccaatc ttcggcaaca 2400
tcgtcgacga ggtaagtttc tgcttctacc tttgatatat atataataat tatcattaat 2460
tagtagtaat ataatatttc aaatattttt ttcaaaataa aagaatgtag tatatagcaa 2520
ttgcttttct gtagtttata agtgtgtata ttttaattta taacttttct aatatatgac 2580
caaaacatgg tgatgtgcag gtggcctacc acgagaagta cccgacaatc taccacctcc 2640
ggaagaaact ggtggacagc acagacaagg cggacctccg gctcatctac cttgccctcg 2700
cgcatatgat caagttccgc ggccacttcc tcatcgaggg cgacctgaac ccggacaact 2760
ccgacgtgga caagctgttc atccagctcg tgcagacgta caatcaactg ttcgaggaga 2820
accccataaa cgctagcggc gtggacgcca aggccatcct ctcggccagg ctctcgaaat 2880
caagaaggct ggagaacctt atcgcgcagt tgccaggcga aaagaagaac ggcctcttcg 2940
gcaaccttat tgcgctcagc ctcggcctga cgccgaactt caaatcaaac ttcgacctcg 3000
cggaggacgc caagctccag ctctcaaagg acacctacga cgacgacctc gacaacctcc 3060
tggcccagat aggagaccag tacgcggacc tcttcctcgc cgccaagaac ctctccgacg 3120
ctatcctgct cagcgacatc cttcgggtca acaccgaaat taccaaggca ccgctgtccg 3180
ccagcatgat taaacgctac gacgagcacc atcaggacct cacgctgctc aaggcactcg 3240
tccgccagca gctccccgag aagtacaagg agatcttctt cgaccaatca aaaaacggct 3300
acgcgggata tatcgacggc ggtgccagcc aggaagagtt ctacaagttc atcaaaccaa 3360
tcctggagaa gatggacggc accgaggagt tgctggtcaa gctcaacagg gaggacctcc 3420
tcaggaagca gaggaccttc gacaacggct ccatcccgca tcagatccac ctgggcgaac 3480
tgcatgccat cctgcggcgc caggaggact tctacccgtt cctgaaggat aaccgggaga 3540
agatcgagaa gatcttgacg ttccgcatcc catactacgt gggcccgctg gctcgcggca 3600
actcccggtt cgcctggatg acccggaagt cggaggagac catcacaccc tggaactttg 3660
aggaggtggt cgataagggc gctagcgctc agagcttcat cgagcgcatg accaacttcg 3720
ataaaaacct gcccaatgaa aaagtcctcc ccaagcactc gctgctctac gagtacttca 3780
ccgtgtacaa cgagctcacc aaggtcaaat acgtcaccga gggcatgcgg aagccggcgt 3840
tcctgagcgg cgagcagaag aaggcgatag tggacctcct cttcaagacc aacaggaagg 3900
tgaccgtgaa gcaattaaaa gaggactact tcaagaaaat agagtgcttc gactccgtgg 3960
agatctcggg cgtggaggat cggttcaacg cctcactcgg cacgtatcac gacctcctca 4020
agatcattaa agacaaggac ttcctcgaca acgaggagaa cgaggacatc ctcgaggaca 4080
tcgtcctcac cctgaccctg ttcgaggacc gcgaaatgat cgaggagagg ctgaagacct 4140
acgcgcacct gttcgacgac aaggtcatga aacagctcaa gaggcgccgc tacactggtt 4200
ggggaaggct gtcccgcaag ctcattaatg gcatcaggga caagcagagc ggcaagacca 4260
tcctggactt cctcaagtcc gacgggttcg ccaaccgcaa cttcatgcag ctcattcacg 4320
acgactcgct cacgttcaag gaagacatcc agaaggcaca ggtgagcggg cagggtgact 4380
ccctccacga acacatcgcc aacctggccg gctcgccggc cattaaaaag ggcatcctgc 4440
agacggtcaa ggtcgtcgac gagctcgtga aggtgatggg ccggcacaag cccgaaaata 4500
tcgtcataga gatggccagg gagaaccaga ccacccaaaa agggcagaag aactcgcgcg 4560
agcggatgaa acggatcgag gagggcatta aagagctcgg gtcccagatc ctgaaggagc 4620
accccgtgga aaatacccag ctccagaatg aaaagctcta cctctactac ctgcagaacg 4680
gccgcgacat gtacgtggac caggagctgg acattaatcg gctatcggac tacgacgtcg 4740
accacatcgt gccgcagtcg ttcctcaagg acgatagcat cgacaacaag gtgctcaccc 4800
ggtcggataa aaatcggggc aagagcgaca acgtgcccag cgaggaggtc gtgaagaaga 4860
tgaaaaacta ctggcgccag ctcctcaacg cgaaactgat cacccagcgc aagttcgaca 4920
acctgacgaa ggcggaacgc ggtggcttga gcgaactcga taaggcgggc ttcataaaaa 4980
ggcagctggt cgagacgcgc cagatcacga agcatgtcgc ccagatcctg gacagccgca 5040
tgaatactaa gtacgatgaa aacgacaagc tgatccggga ggtgaaggtg atcacgctga 5100
agtccaagct cgtgtcggac ttccgcaagg acttccagtt ctacaaggtc cgcgagatca 5160
acaactacca ccacgcccac gacgcctacc tgaatgcggt ggtcgggacc gccctgatca 5220
agaagtaccc gaagctggag tcggagttcg tgtacggcga ctacaaggtc tacgacgtgc 5280
gcaaaatgat cgccaagtcc gagcaggaga tcggcaaggc cacggcaaaa tacttcttct 5340
actcgaacat catgaacttc ttcaagaccg agatcaccct cgcgaacggc gagatccgca 5400
agcgcccgct catcgaaacc aacggcgaga cgggcgagat cgtctgggat aagggccggg 5460
atttcgcgac ggtccgcaag gtgctctcca tgccgcaagt caatatcgtg aaaaagacgg 5520
aggtccagac gggcgggttc agcaaggagt ccatcctccc gaagcgcaac tccgacaagc 5580
tcatcgcgag gaagaaggat tgggacccga aaaaatatgg cggcttcgac agcccgaccg 5640
tcgcatacag cgtcctcgtc gtggcgaagg tggagaaggg caagtcaaag aagctcaagt 5700
ccgtgaagga gctgctcggg atcacgatta tggagcggtc ctccttcgag aagaacccga 5760
tcgacttcct agaggccaag ggatataagg aggtcaagaa ggacctgatt attaaactgc 5820
cgaagtactc gctcttcgag ctggaaaacg gccgcaagag gatgctcgcc tccgcaggcg 5880
agttgcagaa gggcaacgag ctcgccctcc cgagcaaata cgtcaatttc ctgtacctcg 5940
ctagccacta tgaaaagctc aagggcagcc cggaggacaa cgagcagaag cagctcttcg 6000
tggagcagca caagcattac ctggacgaga tcatcgagca gatcagcgag ttctcgaagc 6060
gggtgatcct cgccgacgcg aacctggaca aggtgctgtc ggcatataac aagcaccgcg 6120
acaaaccaat acgcgagcag gccgaaaata tcatccacct cttcaccctc accaacctcg 6180
gcgctccggc agccttcaag tacttcgaca ccacgattga ccggaagcgg tacacgagca 6240
cgaaggaggt gctcgatgcg acgctgatcc accagagcat cacagggctc tatgaaacac 6300
gcatcgacct gagccagctg ggcggagaca agagaccacg ggaccgccac gatggcgagc 6360
tgggaggccg caagcgggca aggtaggtac cgttaaccta gacttgtcca tcttctggat 6420
tggccaactt aattaatgta tgaaataaaa ggatgcacac atagtgacat gctaatcact 6480
ataatgtggg catcaaagtt gtgtgttatg tgtaattact agttatctga ataaaagaga 6540
aagagatcat ccatatttct tatcctaaat gaatgtcacg tgtctttata attctttgat 6600
gaaccagatg catttcatta accaaatcca tatacatata aatattaatc atatataatt 6660
aatatcaatt gggttagcaa aacaaatcta gtctaggtgt gttttgcgaa tgcggccgcc 6720
accgcggtgg agctcgaatt cgagctcggt accctgggat ccagcttcgc ttagttttta 6780
gtttttggca gaaaaaatga tcaatgtttc acaaaccaaa tatttttata acttttgatg 6840
aaagaagatc accacggtca tatctagggg tggtaacaaa ttgcgatcta aatgtttctt 6900
cataaaaaat aaggcttctt aataaatttt agttcaaaat aaatacgaat aaagtctgat 6960
tctaatctga ttcgatcctt aaattttata atgcaaaatt tagagctcat taccacctct 7020
agtcatatgt ctagtctgag gtatatccaa aaagcccttt ctctaaattc cacacccaac 7080
tcagatgttt gcaaataaat actccgactc caaaatgtag gtgaagtgca actttctcca 7140
ttttatatca acatttgtta ttttttgttt aacatttcac actcaaaact aattaataaa 7200
atacgtggtt gttgaacgtg cgcacatgtc tcccttacat tatgtttttt tatttatgta 7260
ttattgttgt tttcctccga acaacttgtc aacatatcat cattggtctt taatatttat 7320
gaatatggaa gcctagttat ttacacttgg ctacacacta gttgtagttt tgccacttgt 7380
ctaacatgca actctagtag ttttgccact tgcctggcat gcaactctag tattgacact 7440
tgtatagcat ataatgccaa tacgacacct gccttacatg aaacattatt tttgacactt 7500
gtataccatg caacattacc attgacattt gtccatacac attatatcaa atatattgag 7560
cgcatgtcac aaactcgata caaagctgga tgaccctccc tcaccacatc tataaaaacc 7620
cgagcgctac tgtaaatcac tcacaacaca acacatatct tttagtaacc tttcaatagg 7680
cgtcccccaa gaactagtaa ccatggccct gtccaacaag ttcatcggcg acgacatgaa 7740
gatgacctac cacatggacg gctgcgtgaa cggccactac ttcaccgtga agggcgaggg 7800
cagcggcaag ccctacgagg gcacccagac ctccaccttc aaggtgacca tggccaacgg 7860
cggccccctg gccttctcct tcgacatcct gtccaccgtg ttcatgtacg gcaaccgctg 7920
cttcaccgcc taccccacca gcatgcccga ctacttcaag caggccttcc ccgacggcat 7980
gtcctacgag agaaccttca cctacgagga cggcggcgtg gccaccgcca gctgggagat 8040
cagcctgaag ggcaactgct tcgagcacaa gtccaccttc cacggcgtga acttccccgc 8100
cgacggcccc gtgatggcca agaagaccac cggctgggac ccctccttcg agaagatgac 8160
cgtgtgcgac ggcatcttga agggcgacgt gaccgccttc ctgatgctgc agggcggcgg 8220
caactacaga tgccagttcc acacctccta caagaccaag aagcccgtga ccatgccccc 8280
caaccacgtg gtggagcacc gcatcgccag aaccgacctg gacaagggcg gcaacagcgt 8340
gcagctgacc gagcacgccg tggcccacat cacctccgtg gtgcccttct gaagcggccc 8400
atggatattc gaacgcgtag gtaccacatg gttaacctag acttgtccat cttctggatt 8460
ggccaactta attaatgtat gaaataaaag gatgcacaca tagtgacatg ctaatcacta 8520
taatgtgggc atcaaagttg tgtgttatgt gtaattacta gttatctgaa taaaagagaa 8580
agagatcatc catatttctt atcctaaatg aatgtcacgt gtctttataa ttctttgatg 8640
aaccagatgc atttcattaa ccaaatccat atacatataa atattaatca tatataatta 8700
atatcaattg ggttagcaaa acaaatctag tctaggtgtg ttttgcgaat tcccatggac 8760
ctcgaggggg ggcccgggca cccagctttc ttgtacaaag tggccgttaa cggatcggcc 8820
agaatggccc ggaccgggtt accgaattcg agctcggtac cctgggatcg gccgctctag 8880
aactagtgga tcccccgggc tgcaggaatt cccatggagt caaagattca aatagaggac 8940
ctaacagaac tcgccgtaaa gactggcgaa cagttcatac agagtctctt acgactcaat 9000
gacaagaaga aaatcttcgt caacatggtg gagcacgaca cgcttgtcta ctccaaaaat 9060
atcaaagata cagtctcaga agaccaaagg gcaattgaga cttttcaaca aagggtaata 9120
tccggaaacc tcctcggatt ccattgccca gctatctgtc actttattgt gaagatagtg 9180
gaaaaggaag gtggctccta caaatgccat cattgcgata aaggaaaggc catcgttgaa 9240
gatgcctctg ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa 9300
aaagaagacg ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac 9360
gtaagggatg acgcacaatc ccactaagct tcggccgggg cccatcgatc tggcgaaagg 9420
gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 9480
taaaacgacg gccagtgcca agctcagatc agcttggggc tggtatcgat aaatgtttcc 9540
acatagattt tgcatatcat aatgatgttt gtcgttccgt atctatgttt catacaaaat 9600
ttttacgcat atcgcaacac atgggcacat acctagtgac tgtataactc tgcatgtatg 9660
agtgtatgac tatatgatgt agtaactaat aagaagggta gacatttgag tgattctttt 9720
attcctggac ttgtaagact tgacatttct gccttgagtg cgatacatca tatggacagg 9780
ggttatgcat acactgcttg tttgttgttt atgttctaag agcatctcca acaacgtgac 9840
atatgaaaat gccctacaat ttaaaaatgg ttatatttta taaaatttag ggcataaata 9900
aaacatcccg ctccaacatt aaagccttaa atctattata gggaagccca ctatgatata 9960
gtatatttga ggcactttag agggtgccct ataatttttt gaccattttt ttatgaaatg 10020
agacactatt ggagtatttt ttttccgtag agcaccatat ttcaatttga gacaccaatt 10080
taaggcattg ttggagatgt tctaaatgtt ggtttatttt gtctgtatcg ttgtggtttt 10140
gatagtggtg cctttgcaat gtacatctta cattgacaat aataataggt aaaactctac 10200
aaatttttta tctaatggac tcttgtatga aacattgtac ttgcacacat ctgatgtaaa 10260
cactgcatac ttttaacagt gacaagattc tgtttcattt tagggctagt ttgggaacca 10320
aattttatta gggtttttat tttctaagaa aaagtaattt attttacctt gagaaaatat 10380
aaattacttg agaaaataga gttccaaact agctcttatc tttgtcgaat cctcctctat 10440
tcaaatgtga catttctggc acgtgacaac tggtgatgtt gtagactgtg ttaagtaata 10500
cgtgtcatta ttactaaatg ccattttagt aaatgttgag tatgtactct actacagtaa 10560
gtattattgg tgtatttaca ctagacagtt ggcggcctgg cgggtaaagt tatcctgtag 10620
aaagttgggc caggccaaaa ccaaccgcca aaggaaaggc cttccggccc gcccaccttt 10680
gcgcgccgaa ggtcagttcc ttcagtctcc tcccgcttca gactctgacc acgtcgacaa 10740
tccgggccga aacacatctg caccgtccac ttgcgacaga ttgaacacac cacttctatc 10800
cacgtcagcg atccgtggca ctagcccttc caccaatcag cccaagttgc ccctttcctt 10860
taaattcgcc gcacccattg ctcttctcac ggccatagaa atcgaccgag cgaatccctc 10920
gcatcgcatt cgcagccttt gctgcatcac accaccgcga aaccccagca gccgcatctg 10980
caggtcgact ctagaggatc catggcctcc tccgaggacg tcatcaagga gttcatgcgc 11040
ttcaaggtgc gcatggaggg ctccgtgaac ggccacgagt tcgagatcga gggcgagggc 11100
gagggccgcc cctacgaggg cacccagacc gccaagctga aggtgaccaa gggcggcccc 11160
ctgcccttcg cctgggacat cctgtccccc cagttccagt acggctccaa ggtgtacgtg 11220
aagcaccccg ccgacatccc cgactacaag aagctgtcct tccccgaggg cttcaagtgg 11280
gagcgcgtga tgaacttcga ggacggcggc gtggtgacag tgacccagga ctcctccctg 11340
caggacggct ccttcatcta caaggtgaag ttcatcggcg tgaacttccc ctccgacggc 11400
cccgtaatgc agaagaagac tatgggctgg gaggcctcca ccgagcgcct gtacccccgc 11460
gacggcgtgc tgaagggcga gatccacaag gccctgaagc tgaaggacgg cggccacgct 11520
agcccatcca cccactcact cactcatatc tgtgctgtac gtacgagaat ttctcgacca 11580
accgtcgtga gacctgccca ccggagatcg gacgcaagag ggtttaggca agaatgtcgt 11640
gcgacagggt gagcgctgac tagtatacgt gagagacctt gagatatacc tcacacgtac 11700
gcgtacttta catgacgtag gacattacga ctcaaacaga ttcacgtcag atttcggagt 11760
ttctcacgcg tgagagcctt ggagggcggt atgtatgtca tactatatgt tgggatggag 11820
ggagtgagtg agtgatatgt ggctagcaag ggcggccccc tgcccttcgc ctgggacatc 11880
ctgtcccccc agttccagta cggctccaag gtgtacgtga agcaccccgc cgacatcccc 11940
gactacaaga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat gaacttcgag 12000
gacggcggcg tggtgacagt gacccaggac tcctccctgc aggacggctc cttcatctac 12060
aaggtgaagt tcatcggcgt gaacttcccc tccgacggcc ccgtaatgca gaagaagact 12120
atgggctggg aggcctccac cgagcgcctg tacccccgcg acggcgtgct gaagggcgag 12180
atccacaagg ccctgaagct gaaggacggc ggccactacc tggtggagtt caagtccatc 12240
tacatggcca agaagcccgt gcagctgccc ggctactact acgtggactc caagctggac 12300
atcacctccc acaacgagga ctacaccatc gtggagcagt acgagcgcgc cgagggccgc 12360
caccacctgt tcctgtagtc aggatctgag tcgaaaccta gacttgtcca tcttctggat 12420
tggccaactt aattaatgta tgaaataaaa ggatgcacac atagtgacat gctaatcact 12480
ataatgtggg catcaaagtt gtgtgttatg tgtaattact agttatctga ataaaagaga 12540
aagagatcat ccatatttct tatcctaaat gaatgtcacg tgtctttata attctttgat 12600
gaaccagatg catttcatta accaaatcca tatacatata aatattaatc atatataatt 12660
aatatcaatt gggttagcaa aacaaatcta gtctaggtgt gttttgcgaa tgcggc 12716
<210> 12
<211> 11757
<212> DNA
<213> 人工序列
<220>
<223> 包含Ds-Red表达盒的CAS1-Cas9、END2-Am-Cyan、和H2B驱动的中断拷贝的T-DNA
<400> 12
agctttttgg aaggctaagg agaggaagcc ggcgagaagg agggggcgtt ttacgtgtca 60
ctgtcctgtc gtgttggctg ttgacacgaa tcatttcttc cgcgcgtggg aagaagaaga 120
tgcacattag cggcctgaag tagagatgtc aatggggaat tccccagcgg ggattaactc 180
cccagacccg tacccatgaa catagaccgg cccccatccc cgaacccgaa cccgacctcg 240
ggtacgaaaa tcctcccata cccattcccg accgggtact aaatacccat gggtatccat 300
acccgacccg attattcaaa aattaatggg ctttttattt gttaaccggc ggacgcaatg 360
cttgggactc taggtttttt tactttgttg accggctggc ggctgggctt tttcctacag 420
gcccaaagtt ggtcggcagc cactaggcca cacgtcacag gcagcccaca agtaaatgtc 480
gttggattgc tggatggtgg aataaaaatc ctagatgcta gattgttctg gttccgggta 540
tttttctcca tggctaatcg ggtttgggtt tagccctccc aaacccgaac ccgccatacc 600
cgatgggtaa gggatttatt ccaaatctat acccatgggg atttgtttta acccatacct 660
taaccctaat agaggaattc cccacgggta atcgggtttc ggggcccatt gacatctcta 720
gactgaaggc gtccaactca aatcattaaa aagtgttgac gcacgcgctg atgcgccggc 780
cgcacagcac aggctgcaca gcccgtttaa tcagcgatgg agccccggcc gtcagccagc 840
caggtccggc gtccgggtct gcgccctgcg gcgtcactgc tgtcgccacc gtctccgatg 900
gtcccacatc catccagcgg gccgcgcgtg gtacaaaagg ctcttcctcg ccgtcaggtg 960
cagctgccca aacaccagac acagactcca ccaccccgct tcgatcttct gttgcagctg 1020
aaatctgtca gattctgcag ttcattcctc atggcaccga agaagaagcg caaggtgatg 1080
gacaagaagt acagcatcgg cctcgacatc ggcaccaact cggtgggctg ggccgtcatc 1140
acggacgaat ataaggtccc gtcgaagaag ttcaaggtcc tcggcaatac agaccgccac 1200
agcatcaaga aaaacttgat cggcgccctc ctgttcgata gcggcgagac cgcggaggcg 1260
accaggctca agaggaccgc caggagacgg tacactaggc gcaagaacag gatctgctac 1320
ctgcaggaga tcttcagcaa cgagatggcg aaggtggacg actccttctt ccaccgcctg 1380
gaggaatcat tcctggtgga ggaggacaag aagcatgagc ggcacccaat cttcggcaac 1440
atcgtcgacg aggtaagttt ctgcttctac ctttgatata tatataataa ttatcattaa 1500
ttagtagtaa tataatattt caaatatttt tttcaaaata aaagaatgta gtatatagca 1560
attgcttttc tgtagtttat aagtgtgtat attttaattt ataacttttc taatatatga 1620
ccaaaacatg gtgatgtgca ggtggcctac cacgagaagt acccgacaat ctaccacctc 1680
cggaagaaac tggtggacag cacagacaag gcggacctcc ggctcatcta ccttgccctc 1740
gcgcatatga tcaagttccg cggccacttc ctcatcgagg gcgacctgaa cccggacaac 1800
tccgacgtgg acaagctgtt catccagctc gtgcagacgt acaatcaact gttcgaggag 1860
aaccccataa acgctagcgg cgtggacgcc aaggccatcc tctcggccag gctctcgaaa 1920
tcaagaaggc tggagaacct tatcgcgcag ttgccaggcg aaaagaagaa cggcctcttc 1980
ggcaacctta ttgcgctcag cctcggcctg acgccgaact tcaaatcaaa cttcgacctc 2040
gcggaggacg ccaagctcca gctctcaaag gacacctacg acgacgacct cgacaacctc 2100
ctggcccaga taggagacca gtacgcggac ctcttcctcg ccgccaagaa cctctccgac 2160
gctatcctgc tcagcgacat ccttcgggtc aacaccgaaa ttaccaaggc accgctgtcc 2220
gccagcatga ttaaacgcta cgacgagcac catcaggacc tcacgctgct caaggcactc 2280
gtccgccagc agctccccga gaagtacaag gagatcttct tcgaccaatc aaaaaacggc 2340
tacgcgggat atatcgacgg cggtgccagc caggaagagt tctacaagtt catcaaacca 2400
atcctggaga agatggacgg caccgaggag ttgctggtca agctcaacag ggaggacctc 2460
ctcaggaagc agaggacctt cgacaacggc tccatcccgc atcagatcca cctgggcgaa 2520
ctgcatgcca tcctgcggcg ccaggaggac ttctacccgt tcctgaagga taaccgggag 2580
aagatcgaga agatcttgac gttccgcatc ccatactacg tgggcccgct ggctcgcggc 2640
aactcccggt tcgcctggat gacccggaag tcggaggaga ccatcacacc ctggaacttt 2700
gaggaggtgg tcgataaggg cgctagcgct cagagcttca tcgagcgcat gaccaacttc 2760
gataaaaacc tgcccaatga aaaagtcctc cccaagcact cgctgctcta cgagtacttc 2820
accgtgtaca acgagctcac caaggtcaaa tacgtcaccg agggcatgcg gaagccggcg 2880
ttcctgagcg gcgagcagaa gaaggcgata gtggacctcc tcttcaagac caacaggaag 2940
gtgaccgtga agcaattaaa agaggactac ttcaagaaaa tagagtgctt cgactccgtg 3000
gagatctcgg gcgtggagga tcggttcaac gcctcactcg gcacgtatca cgacctcctc 3060
aagatcatta aagacaagga cttcctcgac aacgaggaga acgaggacat cctcgaggac 3120
atcgtcctca ccctgaccct gttcgaggac cgcgaaatga tcgaggagag gctgaagacc 3180
tacgcgcacc tgttcgacga caaggtcatg aaacagctca agaggcgccg ctacactggt 3240
tggggaaggc tgtcccgcaa gctcattaat ggcatcaggg acaagcagag cggcaagacc 3300
atcctggact tcctcaagtc cgacgggttc gccaaccgca acttcatgca gctcattcac 3360
gacgactcgc tcacgttcaa ggaagacatc cagaaggcac aggtgagcgg gcagggtgac 3420
tccctccacg aacacatcgc caacctggcc ggctcgccgg ccattaaaaa gggcatcctg 3480
cagacggtca aggtcgtcga cgagctcgtg aaggtgatgg gccggcacaa gcccgaaaat 3540
atcgtcatag agatggccag ggagaaccag accacccaaa aagggcagaa gaactcgcgc 3600
gagcggatga aacggatcga ggagggcatt aaagagctcg ggtcccagat cctgaaggag 3660
caccccgtgg aaaataccca gctccagaat gaaaagctct acctctacta cctgcagaac 3720
ggccgcgaca tgtacgtgga ccaggagctg gacattaatc ggctatcgga ctacgacgtc 3780
gaccacatcg tgccgcagtc gttcctcaag gacgatagca tcgacaacaa ggtgctcacc 3840
cggtcggata aaaatcgggg caagagcgac aacgtgccca gcgaggaggt cgtgaagaag 3900
atgaaaaact actggcgcca gctcctcaac gcgaaactga tcacccagcg caagttcgac 3960
aacctgacga aggcggaacg cggtggcttg agcgaactcg ataaggcggg cttcataaaa 4020
aggcagctgg tcgagacgcg ccagatcacg aagcatgtcg cccagatcct ggacagccgc 4080
atgaatacta agtacgatga aaacgacaag ctgatccggg aggtgaaggt gatcacgctg 4140
aagtccaagc tcgtgtcgga cttccgcaag gacttccagt tctacaaggt ccgcgagatc 4200
aacaactacc accacgccca cgacgcctac ctgaatgcgg tggtcgggac cgccctgatc 4260
aagaagtacc cgaagctgga gtcggagttc gtgtacggcg actacaaggt ctacgacgtg 4320
cgcaaaatga tcgccaagtc cgagcaggag atcggcaagg ccacggcaaa atacttcttc 4380
tactcgaaca tcatgaactt cttcaagacc gagatcaccc tcgcgaacgg cgagatccgc 4440
aagcgcccgc tcatcgaaac caacggcgag acgggcgaga tcgtctggga taagggccgg 4500
gatttcgcga cggtccgcaa ggtgctctcc atgccgcaag tcaatatcgt gaaaaagacg 4560
gaggtccaga cgggcgggtt cagcaaggag tccatcctcc cgaagcgcaa ctccgacaag 4620
ctcatcgcga ggaagaagga ttgggacccg aaaaaatatg gcggcttcga cagcccgacc 4680
gtcgcataca gcgtcctcgt cgtggcgaag gtggagaagg gcaagtcaaa gaagctcaag 4740
tccgtgaagg agctgctcgg gatcacgatt atggagcggt cctccttcga gaagaacccg 4800
atcgacttcc tagaggccaa gggatataag gaggtcaaga aggacctgat tattaaactg 4860
ccgaagtact cgctcttcga gctggaaaac ggccgcaaga ggatgctcgc ctccgcaggc 4920
gagttgcaga agggcaacga gctcgccctc ccgagcaaat acgtcaattt cctgtacctc 4980
gctagccact atgaaaagct caagggcagc ccggaggaca acgagcagaa gcagctcttc 5040
gtggagcagc acaagcatta cctggacgag atcatcgagc agatcagcga gttctcgaag 5100
cgggtgatcc tcgccgacgc gaacctggac aaggtgctgt cggcatataa caagcaccgc 5160
gacaaaccaa tacgcgagca ggccgaaaat atcatccacc tcttcaccct caccaacctc 5220
ggcgctccgg cagccttcaa gtacttcgac accacgattg accggaagcg gtacacgagc 5280
acgaaggagg tgctcgatgc gacgctgatc caccagagca tcacagggct ctatgaaaca 5340
cgcatcgacc tgagccagct gggcggagac aagagaccac gggaccgcca cgatggcgag 5400
ctgggaggcc gcaagcgggc aaggtaggta ccgttaacct agacttgtcc atcttctgga 5460
ttggccaact taattaatgt atgaaataaa aggatgcaca catagtgaca tgctaatcac 5520
tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac tagttatctg aataaaagag 5580
aaagagatca tccatatttc ttatcctaaa tgaatgtcac gtgtctttat aattctttga 5640
tgaaccagat gcatttcatt aaccaaatcc atatacatat aaatattaat catatataat 5700
taatatcaat tgggttagca aaacaaatct agtctaggtg tgttttgcga atgcggccgc 5760
caccgcggtg gagctcgaat tcgagctcgg taccctggga tccagcttcg cttagttttt 5820
agtttttggc agaaaaaatg atcaatgttt cacaaaccaa atatttttat aacttttgat 5880
gaaagaagat caccacggtc atatctaggg gtggtaacaa attgcgatct aaatgtttct 5940
tcataaaaaa taaggcttct taataaattt tagttcaaaa taaatacgaa taaagtctga 6000
ttctaatctg attcgatcct taaattttat aatgcaaaat ttagagctca ttaccacctc 6060
tagtcatatg tctagtctga ggtatatcca aaaagccctt tctctaaatt ccacacccaa 6120
ctcagatgtt tgcaaataaa tactccgact ccaaaatgta ggtgaagtgc aactttctcc 6180
attttatatc aacatttgtt attttttgtt taacatttca cactcaaaac taattaataa 6240
aatacgtggt tgttgaacgt gcgcacatgt ctcccttaca ttatgttttt ttatttatgt 6300
attattgttg ttttcctccg aacaacttgt caacatatca tcattggtct ttaatattta 6360
tgaatatgga agcctagtta tttacacttg gctacacact agttgtagtt ttgccacttg 6420
tctaacatgc aactctagta gttttgccac ttgcctggca tgcaactcta gtattgacac 6480
ttgtatagca tataatgcca atacgacacc tgccttacat gaaacattat ttttgacact 6540
tgtataccat gcaacattac cattgacatt tgtccataca cattatatca aatatattga 6600
gcgcatgtca caaactcgat acaaagctgg atgaccctcc ctcaccacat ctataaaaac 6660
ccgagcgcta ctgtaaatca ctcacaacac aacacatatc ttttagtaac ctttcaatag 6720
gcgtccccca agaactagta accatggccc tgtccaacaa gttcatcggc gacgacatga 6780
agatgaccta ccacatggac ggctgcgtga acggccacta cttcaccgtg aagggcgagg 6840
gcagcggcaa gccctacgag ggcacccaga cctccacctt caaggtgacc atggccaacg 6900
gcggccccct ggccttctcc ttcgacatcc tgtccaccgt gttcatgtac ggcaaccgct 6960
gcttcaccgc ctaccccacc agcatgcccg actacttcaa gcaggccttc cccgacggca 7020
tgtcctacga gagaaccttc acctacgagg acggcggcgt ggccaccgcc agctgggaga 7080
tcagcctgaa gggcaactgc ttcgagcaca agtccacctt ccacggcgtg aacttccccg 7140
ccgacggccc cgtgatggcc aagaagacca ccggctggga cccctccttc gagaagatga 7200
ccgtgtgcga cggcatcttg aagggcgacg tgaccgcctt cctgatgctg cagggcggcg 7260
gcaactacag atgccagttc cacacctcct acaagaccaa gaagcccgtg accatgcccc 7320
ccaaccacgt ggtggagcac cgcatcgcca gaaccgacct ggacaagggc ggcaacagcg 7380
tgcagctgac cgagcacgcc gtggcccaca tcacctccgt ggtgcccttc tgaagcggcc 7440
catggatatt cgaacgcgta ggtaccacat ggttaaccta gacttgtcca tcttctggat 7500
tggccaactt aattaatgta tgaaataaaa ggatgcacac atagtgacat gctaatcact 7560
ataatgtggg catcaaagtt gtgtgttatg tgtaattact agttatctga ataaaagaga 7620
aagagatcat ccatatttct tatcctaaat gaatgtcacg tgtctttata attctttgat 7680
gaaccagatg catttcatta accaaatcca tatacatata aatattaatc atatataatt 7740
aatatcaatt gggttagcaa aacaaatcta gtctaggtgt gttttgcgaa ttcccatgga 7800
cctcgagggg gggcccgggc acccagcttt cttgtacaaa gtggccgtta acggatcggc 7860
cagaatggcc cggaccgggt taccgaattc gagctcggta ccctgggatc ggccgctcta 7920
gaactagtgg atcccccggg ctgcaggaat tcccatggag tcaaagattc aaatagagga 7980
cctaacagaa ctcgccgtaa agactggcga acagttcata cagagtctct tacgactcaa 8040
tgacaagaag aaaatcttcg tcaacatggt ggagcacgac acgcttgtct actccaaaaa 8100
tatcaaagat acagtctcag aagaccaaag ggcaattgag acttttcaac aaagggtaat 8160
atccggaaac ctcctcggat tccattgccc agctatctgt cactttattg tgaagatagt 8220
ggaaaaggaa ggtggctcct acaaatgcca tcattgcgat aaaggaaagg ccatcgttga 8280
agatgcctct gccgacagtg gtcccaaaga tggaccccca cccacgagga gcatcgtgga 8340
aaaagaagac gttccaacca cgtcttcaaa gcaagtggat tgatgtgata tctccactga 8400
cgtaagggat gacgcacaat cccactaagc ttcggccggg gcccatcgat ctggcgaaag 8460
ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 8520
gtaaaacgac ggccagtgcc aagctcagat cagcttgggg ctggtatcga taaatgtttc 8580
cacatagatt ttgcatatca taatgatgtt tgtcgttccg tatctatgtt tcatacaaaa 8640
tttttacgca tatcgcaaca catgggcaca tacctagtga ctgtataact ctgcatgtat 8700
gagtgtatga ctatatgatg tagtaactaa taagaagggt agacatttga gtgattcttt 8760
tattcctgga cttgtaagac ttgacatttc tgccttgagt gcgatacatc atatggacag 8820
gggttatgca tacactgctt gtttgttgtt tatgttctaa gagcatctcc aacaacgtga 8880
catatgaaaa tgccctacaa tttaaaaatg gttatatttt ataaaattta gggcataaat 8940
aaaacatccc gctccaacat taaagcctta aatctattat agggaagccc actatgatat 9000
agtatatttg aggcacttta gagggtgccc tataattttt tgaccatttt tttatgaaat 9060
gagacactat tggagtattt tttttccgta gagcaccata tttcaatttg agacaccaat 9120
ttaaggcatt gttggagatg ttctaaatgt tggtttattt tgtctgtatc gttgtggttt 9180
tgatagtggt gcctttgcaa tgtacatctt acattgacaa taataatagg taaaactcta 9240
caaatttttt atctaatgga ctcttgtatg aaacattgta cttgcacaca tctgatgtaa 9300
acactgcata cttttaacag tgacaagatt ctgtttcatt ttagggctag tttgggaacc 9360
aaattttatt agggttttta ttttctaaga aaaagtaatt tattttacct tgagaaaata 9420
taaattactt gagaaaatag agttccaaac tagctcttat ctttgtcgaa tcctcctcta 9480
ttcaaatgtg acatttctgg cacgtgacaa ctggtgatgt tgtagactgt gttaagtaat 9540
acgtgtcatt attactaaat gccattttag taaatgttga gtatgtactc tactacagta 9600
agtattattg gtgtatttac actagacagt tggcggcctg gcgggtaaag ttatcctgta 9660
gaaagttggg ccaggccaaa accaaccgcc aaaggaaagg ccttccggcc cgcccacctt 9720
tgcgcgccga aggtcagttc cttcagtctc ctcccgcttc agactctgac cacgtcgaca 9780
atccgggccg aaacacatct gcaccgtcca cttgcgacag attgaacaca ccacttctat 9840
ccacgtcagc gatccgtggc actagccctt ccaccaatca gcccaagttg cccctttcct 9900
ttaaattcgc cgcacccatt gctcttctca cggccataga aatcgaccga gcgaatccct 9960
cgcatcgcat tcgcagcctt tgctgcatca caccaccgcg aaaccccagc agccgcatct 10020
gcaggtcgac tctagaggat ccatggcctc ctccgaggac gtcatcaagg agttcatgcg 10080
cttcaaggtg cgcatggagg gctccgtgaa cggccacgag ttcgagatcg agggcgaggg 10140
cgagggccgc ccctacgagg gcacccagac cgccaagctg aaggtgacca agggcggccc 10200
cctgcccttc gcctgggaca tcctgtcccc ccagttccag tacggctcca aggtgtacgt 10260
gaagcacccc gccgacatcc ccgactacaa gaagctgtcc ttccccgagg gcttcaagtg 10320
ggagcgcgtg atgaacttcg aggacggcgg cgtggtgaca gtgacccagg actcctccct 10380
gcaggacggc tccttcatct acaaggtgaa gttcatcggc gtgaacttcc cctccgacgg 10440
ccccgtaatg cagaagaaga ctatgggctg ggaggcctcc accgagcgcc tgtacccccg 10500
cgacggcgtg ctgaagggcg agatccacaa ggccctgaag ctgaaggacg gcggccacgc 10560
tagcccatcc acccactcac tcactcatat ctgtgctgta cgtacgagaa tttctcgacc 10620
aaccgtcgtg agacctgccc accggagatc ggacgcaaga gggtttaggc aagaatgtcg 10680
tgcgacaggg tgagcgctga ctagtatacg tgagagacct tgagatatac ctcacacgta 10740
cgcgtacttt acatgacgta ggacattacg actcaaacag attcacgtca gatttcggag 10800
tttctcacgc gtgagagcct tggagggcgg tatgtatgtc atactatatg ttgggatgga 10860
gggagtgagt gagtgatatg tggctagcaa gggcggcccc ctgcccttcg cctgggacat 10920
cctgtccccc cagttccagt acggctccaa ggtgtacgtg aagcaccccg ccgacatccc 10980
cgactacaag aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 11040
ggacggcggc gtggtgacag tgacccagga ctcctccctg caggacggct ccttcatcta 11100
caaggtgaag ttcatcggcg tgaacttccc ctccgacggc cccgtaatgc agaagaagac 11160
tatgggctgg gaggcctcca ccgagcgcct gtacccccgc gacggcgtgc tgaagggcga 11220
gatccacaag gccctgaagc tgaaggacgg cggccactac ctggtggagt tcaagtccat 11280
ctacatggcc aagaagcccg tgcagctgcc cggctactac tacgtggact ccaagctgga 11340
catcacctcc cacaacgagg actacaccat cgtggagcag tacgagcgcg ccgagggccg 11400
ccaccacctg ttcctgtagt caggatctga gtcgaaacct agacttgtcc atcttctgga 11460
ttggccaact taattaatgt atgaaataaa aggatgcaca catagtgaca tgctaatcac 11520
tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac tagttatctg aataaaagag 11580
aaagagatca tccatatttc ttatcctaaa tgaatgtcac gtgtctttat aattctttga 11640
tgaaccagat gcatttcatt aaccaaatcc atatacatat aaatattaat catatataat 11700
taatatcaat tgggttagca aaacaaatct agtctaggtg tgttttgcga atgcggc 11757
<210> 13
<211> 1105
<212> DNA
<213> 人工序列
<220>
<223> RF-FP-CR1 单指导 RNA 表达盒
<400> 13
tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60
tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120
ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180
gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240
ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300
atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360
gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420
gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480
aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540
cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600
aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660
attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720
ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780
agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840
agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900
ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960
gtggagcgta ccttataaac cgagccgcaa gcaccgaatt gtaaagtacg cgtacgtgtg 1020
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 1080
ggcaccgagt cggtgctttt ttttt 1105
<210> 14
<211> 1102
<212> DNA
<213> 人工序列
<220>
<223> 单指导 RNA 表达盒
<400> 14
tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60
tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120
ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180
gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240
ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300
atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360
gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420
gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480
aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540
cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600
aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660
attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720
ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780
agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840
agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900
ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960
gtggagcgta ccttataaac cgagccgcaa gcaccgaatt gcaggtctca cgacggtgtt 1020
ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 1080
accgagtcgg tgcttttttt tt 1102
<210> 15
<211> 1106
<212> DNA
<213> 人工序列
<220>
<223> MS26-CR2 单指导 RNA 表达盒
<400> 15
tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60
tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120
ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180
gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240
ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300
atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360
gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420
gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480
aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540
cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600
aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660
attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720
ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780
agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840
agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900
ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960
gtggagcgta ccttataaac cgagccgcaa gcaccgaatt gcacgtacgt caccatcccg 1020
cgttttagag ctagaaatag caagttaaaa taaggctagt ccgttatcaa cttgaaaaag 1080
tggcaccgag tcggtgcttt tttttt 1106
<210> 16
<211> 102
<212> RNA
<213> 人工序列
<220>
<223> 单链的单指导RNA分子
<400> 16
ggcacguacg ucaccauccc gcguuuuaga gcuagaaaua gcaaguuaaa auaaggcuag 60
uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 102
<210> 17
<211> 1049
<212> DNA
<213> 玉蜀黍
<220>
<221> 尚未归类的特征
<222> (1)..(1049)
<223> 1.0 KB ZmCAS1 启动子
<400> 17
aagctttttg gaaggctaag gagaggaagc cggcgagaag gagggggcgt tttacgtgtc 60
actgtcctgt cgtgttggct gttgacacga atcatttctt ccgcgcgtgg gaagaagaag 120
atgcacatta gcggcctgaa gtagagatgt caatggggaa ttccccagcg gggattaact 180
ccccagaccc gtacccatga acatagaccg gcccccatcc ccgaacccga acccgacctc 240
gggtacgaaa atcctcccat acccattccc gaccgggtac taaataccca tgggtatcca 300
tacccgaccc gattattcaa aaattaatgg gctttttatt tgttaaccgg cggacgcaat 360
gcttgggact ctaggttttt ttactttgtt gaccggctgg cggctgggct ttttcctaca 420
ggcccaaagt tggtcggcag ccactaggcc acacgtcaca ggcagcccac aagtaaatgt 480
cgttggattg ctggatggtg gaataaaaat cctagatgct agattgttct ggttccgggt 540
atttttctcc atggctaatc gggtttgggt ttagccctcc caaacccgaa cccgccatac 600
ccgatgggta agggatttat tccaaatcta tacccatggg gatttgtttt aacccatacc 660
ttaaccctaa tagaggaatt ccccacgggt aatcgggttt cggggcccat tgacatctct 720
agactgaagg cgtccaactc aaatcattaa aaagtgttga cgcacgcgct gatgcgccgg 780
ccgcacagca caggctgcac agcccgttta atcagcgatg gagccccggc cgtcagccag 840
ccaggtccgg cgtccgggtc tgcgccctgc ggcgtcactg ctgtcgccac cgtctccgat 900
ggtcccacat ccatccagcg ggccgcgcgt ggtacaaaag gctcttcctc gccgtcaggt 960
gcagctgccc aaacaccaga cacagactcc accaccccgc ttcgatcttc tgttgcagct 1020
gaaatctgtc agattctgca gttcattcc 1049
<210> 18
<211> 1746
<212> DNA
<213> 玉蜀黍
<220>
<221> 尚未归类的特征
<222> (11746)..()
<223> 1.7 KB ZmCAS1启动子
<400> 18
ggatccgggg cggaagatgg cagggacgcg gattcagggc ggacgcgctt gccgagggcg 60
cgggggacca cagcgtgcgt tacggggaca gggcgggcat cgcgaggacg ggtgcgggag 120
cggagccaca tctggtggtg gacgcctact ttgctctctt atagagtagt aaagattcgt 180
ggaccaaaca acaccctagc ttgtacaaat attcttaggc agttgctact gatgagagaa 240
aaataacatc actccactgc atttgcgtga tttattgaac agatcacaat tacatctatt 300
caaatttatt tacctgtacg tgtccgattt ttaggggagg atttttttac ggtatttttt 360
ttttaaaaaa ataaatttag gcaacaattt tatagaatcg agtgctttat ctattatctt 420
ttacaaggca cacgcgtaca ataaggtttg gtcgttcgtg acttggatag tggttttggt 480
tgcaattccg taattcttgg cataggatac agcccaaccc agaaaaaaat aatgttgcgg 540
tcagttctgg ctttgagatt cggagtacca cgtggcgtaa aggcaggccg tgtcttacag 600
atgaataaag gacctgggtc tcacgtgatt ggtttccagt ttcgtgcatc aagatgtgga 660
attttcaaac tgccgtcgtg tttgtttcgt cacataaaag ctttttggaa ggctaaggag 720
aggaagccgg cgagaaggag ggggcgtttt acgtgtcact gtcctgtcgt gttggctgtt 780
gacacgaatc atttcttccg cgcgtgggaa gaagaagatg cacattagcg gcctgaagta 840
gagatgtcaa tggggaattc cccagcgggg attaactccc cagacccgta cccatgaaca 900
tagaccggcc cccatccccg aacccgaacc cgacctcggg tacgaaaatc ctcccatacc 960
cattcccgac cgggtactaa atacccatgg gtatccatac ccgacccgat tattcaaaaa 1020
ttaatgggct ttttatttgt taaccggcgg acgcaatgct tgggactcta ggttttttta 1080
ctttgttgac cggctggcgg ctgggctttt tcctacaggc ccaaagttgg tcggcagcca 1140
ctaggccaca cgtcacaggc agcccacaag taaatgtcgt tggattgctg gatggtggaa 1200
taaaaatcct agatgctaga ttgttctggt tccgggtatt tttctccatg gctaatcggg 1260
tttgggttta gccctcccaa acccgaaccc gccatacccg atgggtaagg gatttattcc 1320
aaatctatac ccatggggat ttgttttaac ccatacctta accctaatag aggaattccc 1380
cacgggtaat cgggtttcgg ggcccattga catctctaga ctgaaggcgt ccaactcaaa 1440
tcattaaaaa gtgttgacgc acgcgctgat gcgccggccg cacagcacag gctgcacagc 1500
ccgtttaatc agcgatggag ccccggccgt cagccagcca ggtccggcgt ccgggtctgc 1560
gccctgcggc gtcactgctg tcgccaccgt ctccgatggt cccacatcca tccagcgggc 1620
cgcgcgtggt acaaaaggct cttcctcgcc gtcaggtgca gctgcccaaa caccagacac 1680
agactccacc accccgcttc gatcttctgt tgcagctgaa atctgtcaga ttctgcagtt 1740
cattcc 1746
<210> 19
<211> 2000
<212> DNA
<213> 水稻
<220>
<221> 尚未归类的特征
<222> (1)..(2000)
<223> 来自水稻的甘露醇脱氢酶 5' UTR-启动子
<400> 19
cagtcacaaa ttttttggta attccgagaa aatttccgga aactccgaga acatttccag 60
aaagtttccg accatttccg agttccgacg gaaactgccc ttatcatttc cgattccgtt 120
tccgagaaaa tattttcgaa ttcgtttccg tttccgaaaa atccgaaaaa attctgaccg 180
acagattccg tttccgaaaa taggtccgga atccggaaag tttccgtacc gttttcaccc 240
ctaactggga caaaatgatt attttagtct aacatacatt gttaagtata ttaaagtcta 300
cggtctatct cacagcttac aaatggtgag atatgatatc ttttaacatt atttcataaa 360
acagtaaata agatgcccgg catcaagggg tgaaaacgat attgaaattt cccgaccata 420
ccgataccgt tttcggaaat ctaatataat aataatattt ttaccaatgg ctaccatttt 480
caaaatttag tttttttcta atttctatca gcgtggcatt gaagttaaca ctaaatatat 540
gaattcgtaa acattaaaat tttccgaccg tttcggttcg ttttcgaaaa aataataaaa 600
taatgatatc gtttccgacc atttctgata gttttcatcc ctaacggcat ccacgtgggc 660
tttcttccta gttgagtaaa aagtggagta ttgagagttt acacgagaga attattagtg 720
agattaagat ggaaatttga tttttagtcc taatatcttg tttagtaaat atggcggaaa 780
ttgacaggga gtttcgttgg agattatgtc attaataaaa acggatggct gagatttgtt 840
tatgcaaatt aaaggaggaa ttccccctat ccacgtattg aaagaggtgt tccttactca 900
attctccatt cccatctcat taaaattatc gtgttttcca actaaacaaa acaaacaaaa 960
cagataactt atccatctaa agttctaaac acctaatcac tcctcaaaaa ctacctccaa 1020
ccaaaacagg gccgtaaagg aaaatcttcc gtgtcgtcgt ctcctccgct ccttgcgcca 1080
agacgagtcg cggctcaaca gcggagaggc ggcgatctcc catctggcga gcagagcagg 1140
ggaggggaag ggatcttggt gagcatccac atcctcttcc tgactcatct ctctcccacc 1200
gggagtactt ctgtctggaa tttgcttgcg ttaaccctag cttctgttct aggtttggaa 1260
gaagctcttc tcttaatttc agagccttaa tcttaataca agtgacagtt tgtttgttcc 1320
ccaaaaagct gaatccgccc ctgtccagtg gtacgaattc agtttctgta gctgccagaa 1380
gaagtaaatt aaatttcatg ttataccatg ttctgaaact ctcaagaatg ttgatggaag 1440
ttgatggggt tctagtgtat aaaactggat cagtatttct ggttattgat tgggtttcac 1500
aaactgtgga agtataaatt ggatattata gagtacaagg agcagagatg gggcctaaca 1560
catgacacgt gcgttacaaa ggagaactgg agaagaggtg gattccttct caaattcccc 1620
gcccacagat tcccatctcc aacctccatc tccgtctcct cagagatcca catagcgact 1680
cccgatccag actaagcttg caaaactccc ttgccccagc agcgtcgaca gtgtggtgct 1740
gaccggcggc ttctgatcaa aatagtcagt tggattggtc ctgtcctgtc ctgtcctggt 1800
cctgaacctc taatctcttc atttcaaaac gaatagatga ctggattcat tttcctgcat 1860
tttaaactac tggtttttct ttttgttgtt tttgacattg ttcattgctg atataagtat 1920
caggggtata agattatgat ggatttatgg cattatgggt tcatctgagt tgattttttt 1980
ctatctgcag ttagagtggc 2000
<210> 20
<211> 2300
<212> DNA
<213> 双色高粱
<220>
<221> 尚未归类的特征
<222> (1)..(2300)
<223> 来自高粱属的甘露醇脱氢酶 5' UTR-启动子
<400> 20
aaaagtcaaa cgtcttataa tttgggatgg agtattaaac atgcataaac ctaggtaaat 60
taatatttca atcatacatg gtccaatgag tcttaatttt ttagcatagc taaagcatac 120
aattagtagc ctaccataaa agttttacca caatcaaagc acaaagagct acaattatga 180
attaaacaca aaaacacata tatctacagc tacaacaaaa atgttaaact aaagcatgtc 240
atattatata tctattatat agagcttgtc atgtggagtc taacaaaact gaattttcgt 300
ttttacaaat tttctatgat tttatagaat ttttttaaag ttttagtcag tttatgaaat 360
aaaaaagagc atgtgggcca catcagcaac cacattggca ggagagtcct tcgtgattgg 420
atggtggcta ggttctagac aaagtttatg gatctagatg agcgaaaaaa gtttatggac 480
atatgtgaga agtggagaaa agtttaagaa ccctcaacac atttgactca agaaagaata 540
acataaaacc aaccacacac taaatttaag gttgaaatcc aaatgatatg atatatgatg 600
aaatacaaac attcatgaga tttttataaa agaataaaga catagtaaat aaagcaaaga 660
atatataaaa aataagtata tagttatctg ttgacaaatt ttatatagta tattttataa 720
atacgaacta gtagatagtt ctagccaatc ctaaaacata atcaaacaca tagaaatcta 780
acatatttaa ggggtgtttg gttggaggtg ttaaagttta atatgtatta taacattttc 840
gttttatttg acaattagtg tctaatcatt gactaactag gcttaaaaga tttgtctggc 900
aaattacttt ctagttatgt ttttagtttc ataaataatc tatatttagt actttatgca 960
tatgtccaaa cattcgatgt gacgagagtt aaagtttaac tatggaaacc aaggccctta 1020
ctaaagaaat ctgttaacag atcaataaca gaagtcatat aaaaatcaaa tatcagaaaa 1080
taatgatcta tctatattat gaaaaaaaca agcgttcatg agtttgagtt ttttttaccg 1140
tgtttgttat ttactaaaag aaaactacaa gtacttttat ctgttctatt tacaaggcac 1200
gggtctaatt ataagtttct tttacctttg aaattcttaa tattccgacg gtagtattag 1260
tcgtatgata caatactccc attcggccat tccattagct gaggccttgt ttagttccta 1320
aaaagttttg ccaaattttc agatttttcg tcacatcaaa ttttacggca tatgcatgaa 1380
acattaaata tagataaaaa gaataactaa ttacatagtt taactgtaat ttgtgagacg 1440
aatttttaaa atctaattaa tctataatta aataatattt gtcaaataca aacgtggtat 1500
aatgcctatt ttactaattt ttttgaaact acttcctccg tcccataaat aattgcattt 1560
ctttaacttc tatagtttat gtttgaccgt tcgtcttatt aaaaaatttt taataaatat 1620
tatttatttt ttcatgactt attttattgt tagatatatt ttttatgata atttatttat 1680
tttattattt gtacaaaaat ttaaataaaa taaatggtca aacattacta ttagcagtcg 1740
aagaaatgca tttatttatg ggacgaagag agtaaacaag gcctgaagct gaagcctgaa 1800
ggaagaaagg gaaaggggat tgacgcatgc actgatggtt cggccaggca caatcagcga 1860
tgaactcatg gctgacgaga agccccgtaa ctccggaagc caggtccgcg acgtcactgc 1920
tgtcggcacc ctctccaatc caatccatcc acccgtcaac ggagcatgat ccggtctgcg 1980
cccttccaac ttcttcccca ttataatttg ctcactcgcc ggcggccgct acctgctgca 2040
acccggcgac acccgaccga cagcctgctt gccacgcttg catcgaggag agttcgggga 2100
ccgcccggtg cagaaggaat cgacgcaggg gtgagtcttt tcccctcccc tcccatgtac 2160
ttcccgcctc gattcgactc caagggtcag cgatttcact gcgcttttcc ttagcatagg 2220
ctatctgaaa tttccttctg ttagagccga gtctttcgat ctgctgactt gtcacgaatt 2280
cattctgcag ttcagttcga 2300
<210> 21
<211> 4293
<212> DNA
<213> 玉蜀黍
<220>
<221> 尚未归类的特征
<222> (1)..(4293)
<223> 玉蜀黍优化的Cas9核苷酸序列 (有内含子)
<400> 21
atggacaaga agtacagcat cggcctcgac atcggcacca actcggtggg ctgggccgtc 60
atcacggacg aatataaggt cccgtcgaag aagttcaagg tcctcggcaa tacagaccgc 120
cacagcatca agaaaaactt gatcggcgcc ctcctgttcg atagcggcga gaccgcggag 180
gcgaccaggc tcaagaggac cgccaggaga cggtacacta ggcgcaagaa caggatctgc 240
tacctgcagg agatcttcag caacgagatg gcgaaggtgg acgactcctt cttccaccgc 300
ctggaggaat cattcctggt ggaggaggac aagaagcatg agcggcaccc aatcttcggc 360
aacatcgtcg acgaggtaag tttctgcttc tacctttgat atatatataa taattatcat 420
taattagtag taatataata tttcaaatat ttttttcaaa ataaaagaat gtagtatata 480
gcaattgctt ttctgtagtt tataagtgtg tatattttaa tttataactt ttctaatata 540
tgaccaaaac atggtgatgt gcaggtggcc taccacgaga agtacccgac aatctaccac 600
ctccggaaga aactggtgga cagcacagac aaggcggacc tccggctcat ctaccttgcc 660
ctcgcgcata tgatcaagtt ccgcggccac ttcctcatcg agggcgacct gaacccggac 720
aactccgacg tggacaagct gttcatccag ctcgtgcaga cgtacaatca actgttcgag 780
gagaacccca taaacgctag cggcgtggac gccaaggcca tcctctcggc caggctctcg 840
aaatcaagaa ggctggagaa ccttatcgcg cagttgccag gcgaaaagaa gaacggcctc 900
ttcggcaacc ttattgcgct cagcctcggc ctgacgccga acttcaaatc aaacttcgac 960
ctcgcggagg acgccaagct ccagctctca aaggacacct acgacgacga cctcgacaac 1020
ctcctggccc agataggaga ccagtacgcg gacctcttcc tcgccgccaa gaacctctcc 1080
gacgctatcc tgctcagcga catccttcgg gtcaacaccg aaattaccaa ggcaccgctg 1140
tccgccagca tgattaaacg ctacgacgag caccatcagg acctcacgct gctcaaggca 1200
ctcgtccgcc agcagctccc cgagaagtac aaggagatct tcttcgacca atcaaaaaac 1260
ggctacgcgg gatatatcga cggcggtgcc agccaggaag agttctacaa gttcatcaaa 1320
ccaatcctgg agaagatgga cggcaccgag gagttgctgg tcaagctcaa cagggaggac 1380
ctcctcagga agcagaggac cttcgacaac ggctccatcc cgcatcagat ccacctgggc 1440
gaactgcatg ccatcctgcg gcgccaggag gacttctacc cgttcctgaa ggataaccgg 1500
gagaagatcg agaagatctt gacgttccgc atcccatact acgtgggccc gctggctcgc 1560
ggcaactccc ggttcgcctg gatgacccgg aagtcggagg agaccatcac accctggaac 1620
tttgaggagg tggtcgataa gggcgctagc gctcagagct tcatcgagcg catgaccaac 1680
ttcgataaaa acctgcccaa tgaaaaagtc ctccccaagc actcgctgct ctacgagtac 1740
ttcaccgtgt acaacgagct caccaaggtc aaatacgtca ccgagggcat gcggaagccg 1800
gcgttcctga gcggcgagca gaagaaggcg atagtggacc tcctcttcaa gaccaacagg 1860
aaggtgaccg tgaagcaatt aaaagaggac tacttcaaga aaatagagtg cttcgactcc 1920
gtggagatct cgggcgtgga ggatcggttc aacgcctcac tcggcacgta tcacgacctc 1980
ctcaagatca ttaaagacaa ggacttcctc gacaacgagg agaacgagga catcctcgag 2040
gacatcgtcc tcaccctgac cctgttcgag gaccgcgaaa tgatcgagga gaggctgaag 2100
acctacgcgc acctgttcga cgacaaggtc atgaaacagc tcaagaggcg ccgctacact 2160
ggttggggaa ggctgtcccg caagctcatt aatggcatca gggacaagca gagcggcaag 2220
accatcctgg acttcctcaa gtccgacggg ttcgccaacc gcaacttcat gcagctcatt 2280
cacgacgact cgctcacgtt caaggaagac atccagaagg cacaggtgag cgggcagggt 2340
gactccctcc acgaacacat cgccaacctg gccggctcgc cggccattaa aaagggcatc 2400
ctgcagacgg tcaaggtcgt cgacgagctc gtgaaggtga tgggccggca caagcccgaa 2460
aatatcgtca tagagatggc cagggagaac cagaccaccc aaaaagggca gaagaactcg 2520
cgcgagcgga tgaaacggat cgaggagggc attaaagagc tcgggtccca gatcctgaag 2580
gagcaccccg tggaaaatac ccagctccag aatgaaaagc tctacctcta ctacctgcag 2640
aacggccgcg acatgtacgt ggaccaggag ctggacatta atcggctatc ggactacgac 2700
gtcgaccaca tcgtgccgca gtcgttcctc aaggacgata gcatcgacaa caaggtgctc 2760
acccggtcgg ataaaaatcg gggcaagagc gacaacgtgc ccagcgagga ggtcgtgaag 2820
aagatgaaaa actactggcg ccagctcctc aacgcgaaac tgatcaccca gcgcaagttc 2880
gacaacctga cgaaggcgga acgcggtggc ttgagcgaac tcgataaggc gggcttcata 2940
aaaaggcagc tggtcgagac gcgccagatc acgaagcatg tcgcccagat cctggacagc 3000
cgcatgaata ctaagtacga tgaaaacgac aagctgatcc gggaggtgaa ggtgatcacg 3060
ctgaagtcca agctcgtgtc ggacttccgc aaggacttcc agttctacaa ggtccgcgag 3120
atcaacaact accaccacgc ccacgacgcc tacctgaatg cggtggtcgg gaccgccctg 3180
atcaagaagt acccgaagct ggagtcggag ttcgtgtacg gcgactacaa ggtctacgac 3240
gtgcgcaaaa tgatcgccaa gtccgagcag gagatcggca aggccacggc aaaatacttc 3300
ttctactcga acatcatgaa cttcttcaag accgagatca ccctcgcgaa cggcgagatc 3360
cgcaagcgcc cgctcatcga aaccaacggc gagacgggcg agatcgtctg ggataagggc 3420
cgggatttcg cgacggtccg caaggtgctc tccatgccgc aagtcaatat cgtgaaaaag 3480
acggaggtcc agacgggcgg gttcagcaag gagtccatcc tcccgaagcg caactccgac 3540
aagctcatcg cgaggaagaa ggattgggac ccgaaaaaat atggcggctt cgacagcccg 3600
accgtcgcat acagcgtcct cgtcgtggcg aaggtggaga agggcaagtc aaagaagctc 3660
aagtccgtga aggagctgct cgggatcacg attatggagc ggtcctcctt cgagaagaac 3720
ccgatcgact tcctagaggc caagggatat aaggaggtca agaaggacct gattattaaa 3780
ctgccgaagt actcgctctt cgagctggaa aacggccgca agaggatgct cgcctccgca 3840
ggcgagttgc agaagggcaa cgagctcgcc ctcccgagca aatacgtcaa tttcctgtac 3900
ctcgctagcc actatgaaaa gctcaagggc agcccggagg acaacgagca gaagcagctc 3960
ttcgtggagc agcacaagca ttacctggac gagatcatcg agcagatcag cgagttctcg 4020
aagcgggtga tcctcgccga cgcgaacctg gacaaggtgc tgtcggcata taacaagcac 4080
cgcgacaaac caatacgcga gcaggccgaa aatatcatcc acctcttcac cctcaccaac 4140
ctcggcgctc cggcagcctt caagtacttc gacaccacga ttgaccggaa gcggtacacg 4200
agcacgaagg aggtgctcga tgcgacgctg atccaccaga gcatcacagg gctctatgaa 4260
acacgcatcg acctgagcca gctgggcgga gac 4293
<210> 22
<211> 21
<212> DNA
<213> 玉蜀黍
<400> 22
ggtgccaatc atgcgtcgcg g 21
<210> 23
<211> 23
<212> DNA
<213> 玉蜀黍
<400> 23
gctgctcgat tccgtcccca tgg 23
<210> 24
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> ALS多核苷酸修饰修复DNA模板
<400> 24
aaccttgtct ccgcgctcgc cgacgcgttg ctggactccg tgccgatggt cgccatcacg 60
ggacaggtgt cccgacgcat gattggcacc gacgccttcc aggagacgcc catcgtcgag 120
gtcaccc 127

Claims (20)

1.一种用于在植物细胞中进行指导RNA/Cas内切核酸酶复合物的调节型表达的方法,该方法包括:
a.向植物细胞提供指导RNA,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述植物细胞的基因组中的靶位点处引入双链断裂;并且,
b.通过对该植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致该Cas内切核酸酶的表达。
2.如权利要求1所述的方法,其中该诱导型启动子是通过热处理诱导的。
3.如权利要求2所述的方法,其中所述热处理包括高于26℃的温度。
4.如权利要求1所述的方法,其中该植物细胞来源于单子叶植物或双子叶植物。
5.如权利要求1所述的方法,其中该植物细胞是体细胞胚细胞。
6.如权利要求1所述的方法,其中经由能够表达该指导RNA的DNA表达盒提供该指导RNA。
7.如权利要求1所述的方法,其中该指导RNA作为单链RNA分子抑或双链RNA分子被直接提供至该细胞。
8.如权利要求1所述的方法,其中该植物细胞进一步包括可选择标记表达盒。
9.如权利要求8所述的方法,其中该可选择标记盒包含中断的可见标记盒,该中断的可见标记盒包含中断可见标记基因的间隔子核苷酸序列,其中所述可见标记基因可以通过表达该Cas内切核酸酶进行恢复。
10.如权利要求9所述的方法,该方法进一步包括c)对表达所恢复的可见标记基因的植物细胞进行选择。
11.如权利要求10所述的方法,该方法进一步包括d)使c)的植物细胞生长成植物。
12.由权利要求11所述的方法产生的植物或植物细胞,其中所述植物具有稳定并入其基因组中的所述诱导型启动子。
13.由权利要求12所述的植物产生的种子,其中所述种子具有稳定并入其基因组中的所述诱导型启动子。
14.如权利要求1所述的方法,其中该诱导型启动子包括:
d)包含SEQ ID NO:17或SEQ ID NO:18的全部或功能片段的核苷酸序列;
e)包含核苷酸序列(a)的全长互补序列的核苷酸序列;或,
f)基于BLASTN比对法,当与(a)或(b)的核苷酸序列相比时,包含具有至少90%序列同一性的序列的核苷酸序列;并且,
其中所述核苷酸序列是启动子。
15.一种用于在植物细胞的基因组中修饰靶DNA序列的方法,该方法包括:
a)提供植物细胞,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子;
b)向(a)的植物细胞提供指导RNA,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述靶DNA序列处引入双链断裂;并且,
c)通过对(b)的植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致(a)的Cas内切核酸酶的表达。
16.如权利要求15所述的方法,该方法进一步包括d)鉴定在所述靶标处具有修饰的植物细胞,其中该修饰包括在所述靶DNA序列中的一个或多个核苷酸的至少一个缺失或取代。
17.如权利要求15所述的方法,其中经由能够表达该指导RNA的DNA表达盒提供该指导RNA。
18.如权利要求15所述的方法,其中能够表达该指导RNA的该DNA表达盒稳定并入所述植物细胞基因组中。
19.如权利要求15所述的方法,其中将该指导RNA作为单链RNA分子或双链RNA分子进行提供。
20.一种用于在植物细胞中改变至少一个目的多核苷酸表达的方法,该方法包括:
a)提供植物细胞,该植物细胞具有稳定并入其基因组中的重组DNA构建体,该重组DNA构建体包含有效地连接至Cas内切核酸酶的诱导型启动子;
b)向(a)的植物细胞提供至少一个指导RNA,其中所述指导RNA和Cas内切核酸酶能够形成复合物,该复合物使得该Cas内切核酸酶能够在所述靶DNA序列处引入双链断裂;
c)通过对(b)的植物细胞进行化学或胁迫处理来诱导该诱导型启动子,其中所述诱导导致(a)的Cas内切核酸酶的表达;并且,
d)对植物细胞进行选择,在该植物细胞中该至少一个目的多核苷酸的表达被增加或减少。
CN201680012247.2A 2015-02-25 2016-02-15 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法 Pending CN107406858A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562120421P 2015-02-25 2015-02-25
US62/120421 2015-02-25
PCT/US2016/017937 WO2016137774A1 (en) 2015-02-25 2016-02-15 Composition and methods for regulated expression of a guide rna/cas endonuclease complex

Publications (1)

Publication Number Publication Date
CN107406858A true CN107406858A (zh) 2017-11-28

Family

ID=55538592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680012247.2A Pending CN107406858A (zh) 2015-02-25 2016-02-15 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法

Country Status (9)

Country Link
US (1) US20180002715A1 (zh)
EP (1) EP3262176A1 (zh)
CN (1) CN107406858A (zh)
AU (1) AU2016223151A1 (zh)
BR (1) BR112017018327A2 (zh)
CA (1) CA2985991A1 (zh)
MX (1) MX2017010746A (zh)
WO (1) WO2016137774A1 (zh)
ZA (1) ZA201704779B (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
WO2015026883A1 (en) 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CN107567499A (zh) 2015-03-27 2018-01-09 纳幕尔杜邦公司 大豆u6核小rna基因启动子及其在植物小rna基因的组成型表达中的用途
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
IL264565B1 (en) 2016-08-03 2024-03-01 Harvard College Adenosine nuclear base editors and their uses
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
EP3601562A1 (en) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
WO2019104161A1 (en) * 2017-11-21 2019-05-31 Monsanto Technology Llc Modified plants with enhanced traits
WO2019154285A1 (zh) * 2018-02-08 2019-08-15 中国科学院上海生命科学研究院 一种无标签用于基因编辑的试剂组合及其应用
JP6614622B2 (ja) * 2018-04-17 2019-12-04 国立大学法人名古屋大学 植物ゲノム編集方法
AU2019398351A1 (en) 2018-12-14 2021-06-03 Pioneer Hi-Bred International, Inc. Novel CRISPR-Cas systems for genome editing
WO2020191246A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
US11473086B2 (en) * 2019-06-19 2022-10-18 Ut-Battelle, Llc Loss of function alleles of PtEPSP-TF and its regulatory targets in rice
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013173535A2 (en) * 2012-05-18 2013-11-21 E. I. Du Pont De Nemours And Company Inducible promoter sequences for regulated expression and methods of use
WO2014144155A1 (en) * 2013-03-15 2014-09-18 Regents Of The University Of Minnesota Engineering plant genomes using crispr/cas systems
WO2014186686A2 (en) * 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
US5110732A (en) 1989-03-14 1992-05-05 The Rockefeller University Selective gene expression in plants
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5240855A (en) 1989-05-12 1993-08-31 Pioneer Hi-Bred International, Inc. Particle gun
US5310667A (en) 1989-07-17 1994-05-10 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
DE69133128T2 (de) 1990-04-12 2003-06-18 Syngenta Participations Ag Gewebe-spezifische Promotoren
US5466597A (en) 1990-04-26 1995-11-14 Plant Genetic Systems, N.V. Bacillus thuringiensis strains and their genes encoding insecticidal toxins
US5478369A (en) 1990-06-12 1995-12-26 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5866775A (en) 1990-09-28 1999-02-02 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
US5277905A (en) 1991-01-16 1994-01-11 Mycogen Corporation Coleopteran-active bacillus thuringiensis isolate
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
WO1993003154A1 (en) 1991-08-02 1993-02-18 Mycogen Corporation Novel microorganism and insecticide
HU219057B (hu) 1991-08-27 2001-02-28 Novartis Ag. Inszekticid hatású proteinek Homoptera rovarok ellen és alkalmazásuk a növényvédelemben
JPH06511152A (ja) 1991-10-04 1994-12-15 ノースカロライナ ステイト ユニバーシティー 病原体耐性トランスジェニック植物
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5324646A (en) 1992-01-06 1994-06-28 Pioneer Hi-Bred International, Inc. Methods of regeneration of Medicago sativa and expressing foreign DNA in same
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
EP0652965A1 (en) 1992-07-27 1995-05-17 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
AU5676394A (en) 1992-11-20 1994-06-22 Agracetus, Inc. Transgenic cotton plants producing heterologous bioplastic
IL108241A (en) 1992-12-30 2000-08-13 Biosource Genetics Corp Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus
CA2161881C (en) 1993-01-13 2001-03-27 A. Gururaj Rao High lysine derivatives of alpha-hordothionin
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5593881A (en) 1994-05-06 1997-01-14 Mycogen Corporation Bacillus thuringiensis delta-endotoxin
US5633363A (en) 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
US5792931A (en) 1994-08-12 1998-08-11 Pioneer Hi-Bred International, Inc. Fumonisin detoxification compositions and methods
CA2160529A1 (en) 1994-10-14 1996-04-15 Toshihiko Iizuka Bacillus strain and harmful organism controlling agents
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
HUP9900876A2 (hu) 1995-06-02 1999-07-28 Pioneer Hi-Bred International, Inc. Az alfa-hordotionin nagy treonintartalmú származékai
CA2222600A1 (en) 1995-06-02 1996-12-05 Pioneer Hi-Bred International, Inc. High methionine derivatives of .alpha.-hordothionin
US5837876A (en) 1995-07-28 1998-11-17 North Carolina State University Root cortex specific gene promoter
US5703049A (en) 1996-02-29 1997-12-30 Pioneer Hi-Bred Int'l, Inc. High methionine derivatives of α-hordothionin for pathogen-control
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
AU3495297A (en) 1996-07-08 1998-02-02 Pioneer Hi-Bred International, Inc. Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
ATE336580T1 (de) 1998-02-26 2006-09-15 Pioneer Hi Bred Int Mais met-1 promoter
DE69928264T2 (de) 1998-08-20 2006-07-13 Pioneer Hi-Bred International, Inc. Samen-bevorzugende promotoren
CZ20013860A3 (cs) 1999-04-29 2002-04-17 Syngenta Ltd. Herbicidně rezistentní rostliny
WO2002026789A2 (en) 2000-09-26 2002-04-04 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US7612251B2 (en) 2000-09-26 2009-11-03 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US7517975B2 (en) 2000-09-26 2009-04-14 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
AU2001287862B2 (en) 2000-09-29 2006-12-14 Syngenta Limited Herbicide resistant plants
US7045684B1 (en) 2002-08-19 2006-05-16 Mertec, Llc Glyphosate-resistant plants
CA2619833C (en) 2005-08-26 2017-05-09 Danisco A/S Use of crispr associated genes (cas)
CA2691440A1 (en) 2007-06-29 2009-01-08 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
US7919676B2 (en) 2007-08-03 2011-04-05 Pioneer Hi-Bred International, Inc. Msca1 nucleotide sequences impacting plant male fertility and method of using same
AR085533A1 (es) 2011-03-23 2013-10-09 Pioneer Hi Bred Int Metodos de produccion de un locus de rasgos transgenicos complejo
US9574208B2 (en) 2011-06-21 2017-02-21 Ei Du Pont De Nemours And Company Methods and compositions for producing male sterile plants
AR089793A1 (es) 2012-01-27 2014-09-17 Du Pont Metodos y composiciones para generar locus de rasgos transgenicos complejos

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013173535A2 (en) * 2012-05-18 2013-11-21 E. I. Du Pont De Nemours And Company Inducible promoter sequences for regulated expression and methods of use
WO2014144155A1 (en) * 2013-03-15 2014-09-18 Regents Of The University Of Minnesota Engineering plant genomes using crispr/cas systems
WO2014186686A2 (en) * 2013-05-17 2014-11-20 Two Blades Foundation Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DOW ET AL.,: "Inducible in vivo genome editing with CRISPR/Cas9.", 《NAT BIOTECHNOL》 *
MAO ET AL.,: "Application of the CRISPR-Cas system for efficient genome engineering in plants.", 《MOL PLANT》 *
MIAO ET AL.,: "Targeted mutagenesis in rice using CRISPR-Cas system", 《CELL RESEARCH》 *

Also Published As

Publication number Publication date
US20180002715A1 (en) 2018-01-04
MX2017010746A (es) 2017-11-28
BR112017018327A2 (pt) 2018-04-17
CA2985991A1 (en) 2016-09-01
WO2016137774A1 (en) 2016-09-01
ZA201704779B (en) 2019-06-26
AU2016223151A1 (en) 2017-08-03
EP3262176A1 (en) 2018-01-03

Similar Documents

Publication Publication Date Title
CN107406858A (zh) 用于指导rna/cas内切核酸酶复合物的调节型表达的组合物和方法
US20220177900A1 (en) Genome modification using guide polynucleotide/cas endonuclease systems and methods of use
US20220364107A1 (en) Agronomic trait modification using guide rna/cas endonuclease systems and methods of use
US20230212595A1 (en) Generation of site specific integration sites for complex trait loci in corn and soybean, and methods of use
CN107709562A (zh) 指导rna/cas内切核酸酶***
CN106687594A (zh) 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
CN101849010A (zh) 用于改变单子叶植物细胞的基因组的方法
CN104080914A (zh) 产生雄性不育植物的组合物和方法
US20210348179A1 (en) Compositions and methods for regulating gene expression for targeted mutagenesis
WO2019074841A1 (en) TYPE I-E CRISPR-CAS SYSTEMS FOR EUCARYOTE GENOME EDITION
WO2013072914A2 (en) Plant rad52 and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171128

WD01 Invention patent application deemed withdrawn after publication