CN110066824B - 一套用于水稻的碱基编辑人工*** - Google Patents

一套用于水稻的碱基编辑人工*** Download PDF

Info

Publication number
CN110066824B
CN110066824B CN201810069129.6A CN201810069129A CN110066824B CN 110066824 B CN110066824 B CN 110066824B CN 201810069129 A CN201810069129 A CN 201810069129A CN 110066824 B CN110066824 B CN 110066824B
Authority
CN
China
Prior art keywords
leu
lys
glu
nucleotide sequence
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810069129.6A
Other languages
English (en)
Other versions
CN110066824A (zh
Inventor
周焕斌
严芳
旷永洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Plant Protection of Chinese Academy of Agricultural Sciences filed Critical Institute of Plant Protection of Chinese Academy of Agricultural Sciences
Priority to CN201810069129.6A priority Critical patent/CN110066824B/zh
Publication of CN110066824A publication Critical patent/CN110066824A/zh
Application granted granted Critical
Publication of CN110066824B publication Critical patent/CN110066824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请涉及一套用于水稻的碱基编辑人工***,其包括:第I调节元件,其包括能够编码如氨基酸序列I的核苷酸序列;其中所述氨基酸序列I包括如SEQ ID No.1所示的氨基酸序;第II调节元件,其包括依次从5’端到3’端的第II‑1核苷酸序列和第II‑2核苷酸序列;所述第II‑1核苷酸序列包括靶核苷酸序列;所述第II‑2核苷酸序列包括来源于化脓链球菌的sgRNA核酸序列;所述第II‑1核苷酸序列和所述第II‑2核苷酸序列转录融合。

Description

一套用于水稻的碱基编辑人工***
技术领域
本申请涉及一套用于水稻的碱基编辑人工***。
背景技术
水稻(Oryza sativa L.)是世界主要粮食作物之一,养活了世界上近一半人口,包括几乎整个东亚和东南亚的人口。中国是世界上水稻总产量最高的国家,水稻产量占全球总量的30%左右。在生产过程中,以稻瘟病、稻曲病和纹枯病为主的水稻三大病害严重制约着水稻的生长发育,导致水稻产量和品质降低,威胁着全球的粮食安全。因此,提高产量,改善稻米品质,增加水稻植株抗病、抗逆性等研究以保证粮食的稳定供给是人类社会可持续性发展的重大课题。水稻作为单子叶植物的模式植物,其研究技术、方法、理论和成果对其它禾本科植物,如小麦、玉米、高粱等具有重要指导作用。
随着全基因组测序等现代生物技术的发展,基因编辑在农业上的应用也逐渐受到研究者的青睐,但是伴随产生的大量植物基因组序列的解读,基因的挖掘和应用严重滞后以及转基因生物安全生产问题严重制约着其在农业应用上的发展。近年来,以ZFN、TALEN和CRISPR为主的人工核酸酶技术陆续开发成功。尤其CRISPR/Cas9技术,因其易操作、效率高以及普适性受到了研究人员的广泛关注。目前,CRISPR/Cas9技术已广泛应用于拟南芥、烟草、水稻、大豆、番茄、玉米、大麦、小麦、马铃薯、蘑菇等模式植物和农作物上,获得了大量基因功能丧失性突变体。
相对于目前广泛的基因功能缺失突变体材料的定制应用,基因功能获得性突变体材料的创制的意义更为重大。迄今为止,研究人员主要利用同源重组机制等传统的方法获得基因功能获得性突变体,而在包含水稻在内的大部分高等生物体内,非同源末端连接修复机制在外源DNA片段的***过程中占主导地位,同源重组定制突变体的效率仅有千分之一到百分之二。
发明内容
由于现有技术中的碱基编辑***对水稻基因组中碱基A的编辑具有不敏感性,为了解决这一技术难题,本申请提供了一套人工***,所述人工***包括
第I调节元件,其包括能够编码如氨基酸序列I的核苷酸序列;其中所述氨基酸序列I包括如SEQ ID No.1所示的氨基酸序列;
第II调节元件,其包括依次从5’端到3’端的第II-1核苷酸序列和第II-2核苷酸序列;所述第II-1核苷酸序列包括靶核苷酸序列;所述第II-2核苷酸序列包括来源于化脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列;所述第II-1核苷酸序列和所述第II-2核苷酸序列转录融合,其产物能引导第I调控元件编码的蛋白至目标生物基因组中待突变的靶位点处,并将所述靶核苷酸序列中的靶位点处的A突变为G,或将所述靶核苷酸序列中的靶位点处的T突变为C;
当所述第II调节元件为多个时,包含在其中的多个第II-1核苷酸序列两两不相同。另外,当所述第II调节元件为多个时,它们可以串联的形成连接在一起。
在一个具体实施方式中,所述靶核苷酸序列中的靶位点处于所述靶核苷酸序列的从5′端到3′端方向的4至7位置。
通过利用本申请的人工***,可以将水稻基因组内源位点的特定的A定点突变为G,筛选得到水稻基因功能获得性突变体;或T定点突变为C,筛选得到水稻基因功能获得性突变体,此时,使用的靶核苷酸序列为靶位点处为A那条链上的核苷酸序列。
在一个具体实施方式中,所述第I调节元件的核苷酸序列为能够适于在水稻中表达的核苷酸序列,所述第II调节元件的核苷酸序列为能够适于在水稻中发生转录的核苷酸序列。
在一个具体实施方式中,能够编码如SEQ ID No.1所示氨基酸序列的核苷酸编码序列如SEQ ID No.2所示。如SEQ ID No.2所示核苷酸编码序列能够较优的在水稻中使用。
在一个具体实施方式中,所述第II-2核苷酸序列如SEQ ID No.3所示。
在一个具体实施方式中,所述第II-1核苷酸序列还包括含有IIS型限制性内切酶的酶切位点的克隆位点,所述靶核苷酸序列通过所述第II-1核苷酸序列上的所述克隆位点而被克隆到其中(例如通过酶切-连接的方式将所述靶核苷酸序列连接到所述克隆位点上),以使所述第II-1核苷酸序列与第II-2序列转录融合;当所述第II调节元件为多个时,用于克隆不同靶核苷酸序列的所述IIS型限制性内切酶的酶切位点两两不相同。
其中,由于所述靶核苷酸序列是根据碱基编辑位点而变化的,因此可以将其他元件构建好,包括事先克隆到相关位置的限制性内切酶的酶切位点。在使用的之前,再根据碱基编辑目的将所述靶核苷酸序列通过限制性内切酶的酶切位点的切割而被克隆。当所述第II调节元件为多个时,包含在其中的多个第II-1核苷酸序列中的限制性内切酶的酶切位点两两不相同,如此,可以有效的保障不同的靶核苷酸顺利的被克隆到目标位置。多个靶核苷酸序列可用于目标生物基因组上的多个待突变的靶位点的碱基替换。
在一个具体实施方式中,优选所述克隆位点的核苷酸序列包括SEQ ID No.4和/或SEQID No.5。
在一个具体实施方式中,通过如下方式确定所述靶核苷酸序列:
1)确定水稻基因组上需要被改造的核苷酸序列;
2)判断步骤1)中确定的需要被改造的核苷酸序列或其反向互补序列中是否携带有待突变的核苷酸A,并判断所述待突变的核苷酸A突变为G、或所述待突变的核苷酸T突变为C后引起的改变是否符合预期;
3)在需要被改造的核苷酸序列或其反向互补序列中筛选靶标序列:向所述待突变的核苷酸A的3′端方向搜索以确认存在能够被氨基酸序列I识别的识别模序,且所述待突变的核苷酸A处在所述识别模序5′端上游的-19至-13的位置,由此确定的所述识别模序5′端上游17至21个核苷酸序列(不含识别模序)为所述靶核苷酸序列。
在一个具体实施方式中,所识别模序为5′-NGG-3′、5′-NGA-3′、5′-GAGN-3′、5′-AAGN-3′中的一种,所述靶核苷酸序列上游的17至21个核苷酸序列,淘汰含有连续五个T的核苷酸序列;其中,所述N为A、G、C和T中的一种。
在一个具体实施方式中,所述靶核苷酸序列如SEQ ID No.14、SEQ ID No.17和SEQID No.24中所示的至少一种。
在一个具体实施方式中,所述人工***还包括在所述第I调节元件的5’端的能够用于水稻中的,且能够启动所述第I调节元件转录的第一启动子;和/或所述人工***还包括在所述第II调节元件的5’端的能够用于水稻中的,且能够启动所述第II调节元件转录的第二启动子。
在一个具体实施方式中,所述第一启动子为RNA聚合酶II型启动子;和/或第二启动子为RNA聚合酶III型启动子。
在一个具体实施方式中,第一启动子为SEQ ID No.6;和/或第二启动子为SEQ IDNo.7。
在一个具体实施方式中,所述人工***还包括在所述第I调节元件的3’端的能够终止所述第I调节元件转录的第一终止子;和/或所述人工***还包括在所述第II调节元件的3’端的能够终止所述第II调节元件转录的第二终止子。
在一个具体实施方式中,第一终止子为SEQ ID No.8;和/或第二终止子为SEQ IDNo.9。
在一个具体实施方式中,所述第I调节元件和所述第II元件能够被克隆到至少一个载体上。例如,所述第I调节元件表达框架和所述第II调节元件转录框架能够被克隆或整合到同一个载体上,或第I调节元件表达框架和第II调节元件转录框架分别位于不同的载体上时,可以采用基因枪法、农杆菌侵染法或PEG介导转化法将两个框架或含有两个框架的载体导入到水稻的愈伤组织或水稻原生质体中。
在一个具体实施方式中,所述第I调节元件能够被克隆到pCAMBIA1300上;所述第II调节元件被克隆到入门载体pENTR4上。pCAMBIA1300为基于Gateway反应并用于水稻遗传转化的双元载体,也可以使用其他类似的双元载体。
在一个具体实施方式中,所述第一启动子、第I调节元件和第一终止子能够被克隆到pCAMBIA1300载体上。
在一个具体实施方式中,第二启动子、第II调节元件和第二终止子被克隆到pENTR4载体上。当所述第II调节元件为多个时,其5’端的第二启动子和其3’端的终止子也为多个。即第二启动子、第II调节元件和第二终止子形成一组,成套出现。含有不同第II调节元件的多个组可以串联的形成连接在一起。其中,第II调节元件的不同,主要指的是第II-1核苷酸序列的不同。
在一个具体实施方式中,所述第I调节元件和所述第II调节元件能够被整合到同一个载体上,或被分布在多个载体上一起使用。
本申请之二提供了一种如本申请之一中任意一人工***在用于将水稻基因组中的A定点突变为G,或将水稻基因组中的T定点突变为C中的一种的应用。
本申请之三提供了一种将水稻基因组上的A定点突变为G的方法,其包括如下步骤:
1)将本申请之一中任意一人工***通过农杆菌介导的方法导入到水稻愈伤组织,然后培养以获得水稻植株;
2)筛选获得含有定点突变的水稻植株。
进一步地,所述水稻植株能够产生含有定点替换碱基的种子,水稻获得了新的经济性状。
在进行所述的人工***导入时,可以采用农杆菌侵染法,也可以采用基因枪法或PEG介导转化的方法中的一种将所述的人工***导入到水稻愈伤组织或水稻原生质体中,这是本领域技术人员容易理解的。
本领域的技术人员公知,水稻基因组DNA由两条链组成,因此,所述靶核苷酸序列可以在其中的任意一条链上,并且靶位点处为A。例如,当所述靶核苷酸序列位于某一功能基因的一条链中时,该功能基因的特定位点上的A被定点突变为G后,如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,则可以采用此***来实现,即可以通过直接的碱基替换三联体密码子中的A为G,得到水稻基因功能获得性突变体;或当所述靶核苷酸序列位于某一功能基因的另一条链中时,该功能基因的特定位点上的T被定点突变为C后,如果其中的一种突变能够获得预期的其对应的功能蛋白中的氨基酸,也可以采用此***来实现,即可以通过将该链中的T替换为C来改变该链中的所述三联体密码子编码氨基酸,得到水稻基因功能获得性突变体。
本申请的有益效果在于:
a)第II调节元件可以为多个,这样可以同时编辑水稻细胞内多个基因靶位点。
b)本申请的人工***不但实现了对水稻基因组中碱基A的编辑,而且该人工***的碱基编辑效率非常高,可达32-62%。
c)该全新碱基编辑工具盒,其能广泛地应用于水稻基因组中靶标基因单碱基定向突变,以此创制基因功能获得性突变体材料。此碱基编辑器在植物中的应用比通过HR的基因替换或通过NHEJ的基因***更加有效和经济;通过农杆菌介导的植物转化也容易分离到携带有预期遗传变异的植物材料。该碱基编辑工具盒的成功开发,为植物研究领域科研人员提供一个重要的基因功能研究工具,并在水稻基因功能研究和分子育种方向上为培育水稻新品种提供了新的策略。
附图说明
图1显示rBE14在OsWRKY45基因靶位点处的编辑效果图。
图2显示rBE14在OsSERK2基因靶位点处的编辑效果图。
图3显示rBE14和rBE17在OsMPK6基因靶位点处的编辑效果图。
具体实施方式
以下通过优选的实施例的形式对本申请的上述内容作进一步的详细说明,但不构成对本发明的限制。
如无特别说明,本申请的实施例中的试剂均可通过商业途径购买。
pCAMBIA1300来源于BioVector NTCC典型培养物保藏中心。在pCAMBIA1300中***了attR1-ccdB-attR2模块,用于gateway反应接受来自于入门载体的attL1-靶向序列转录模块-attL2模块。
pENTR4载体的来源:购自美国Invitrogen公司。
实施例1
1.1pUbi:rBE14和pUbi:rBE17的构建
首先,将SEQ ID No.2分段进行人工合成,然后将其克隆到克隆载体pUC57(该载体可商业获得)上,得到pUC57-2。其中SEQ ID No.2编码的氨基酸序列如SEQ ID No.1所示。将SEQ ID No.10分段进行人工合成,然后将其克隆到克隆载体pUC57上,得到pUC57-10。其中SEQ ID No.10编码的氨基酸序列如SEQ ID No.11所示。
然后,将SEQ ID No.6(玉米的泛素启动子UbiP)、SEQ ID No.2、SEQ ID No.8(Nos终止子)按照从5’到3’的方向克隆到pCAMBIA 1300载体,命名为pUbi:rBE14。将SEQ IDNo.6(玉米的泛素启动子UbiP)、SEQ ID No.10、SEQ ID No.8(Nos终止子)按照从5’到3’的方向克隆到pCAMBIA 1300载体,命名为pUbi:rBE17。
1.2pENTR4:sgRNA的构建
按照从5’端到3’端的方向,将依次连接的U6启动子序列(SEQ ID No.7)、含有两个BtgZI酶切位点的核苷酸序列(SEQ ID No.4)、sgRNA序列(SEQ ID No.3)、(T)8终止序列(SEQ ID No.9)、U6启动子序列(SEQ ID No.7)、含有两个BsaI酶切位点的核苷酸序列(SEQID No.5)、sgRNA序列(SEQ ID No.3)、(T)8终止序列(SEQ ID No.9)进行人工合成,将序列克隆到pENTR4载体中,命名为pENTR4:sgRNA。其中的两个BtgZI或两个BsaI酶切位点用于克隆中特定基因的识别序列(靶核苷酸序列)。
实施例2
使用pUbi:rBE14对OsWRKY45和OsSERK2进行碱基编辑
2.1针对OsWRKY45、OsSERK2基因的识别序列设计和克隆
每个基因的转录序列和基因组序列从MSU/TIGR水稻基因组数据库中获得(http://rice.plantbiology.msu.edu/)。设计靶序列的原则:1)判断编辑位点是否含有核苷酸碱基A或T,以及相应碱基A突变为G或相应碱基T突变为C后引起的氨基酸改变是否符合预期;对于含有T的核苷酸序列,作为靶核苷酸序列使用时,使用其反向互补序列进行碱基编辑;2)在3′端方向搜索PAM motif序列,使突变碱基A或T处在靶核苷酸序列5′端方向的4至7位置。其中,pUbi:rBE14***识别的PAM motif为NGG、NAG、GAGN和AAGN等,所述N是A或G或C或T;3)合成18-20bp的靶核苷酸序列,将其克隆到pENTR4:sgRNA相应的酶切位点处完成载体的构建。
对于OsWRKY45基因,设计含有与BtgZI酶切位点末端连接匹配的靶核苷酸序列引物如下:gOsWRKY45-F8(SEQ ID No.12)和gOsWRKY45-R8(SEQ ID No.13)。
合成引物后,使用T4多聚核苷酸激酶将引物对gWRKY45-F8和gWRKY45-R8进行磷酸化处理,退火形成双链,再将gOsWRKY45-F8/R8克隆到pENTR4:sgRNA载体上的BtgZI位点,测序确认***完全正确。其中以正向引物表示***pENTR4:sgRNA载体上的BtgZI位点的靶核苷酸序列,如SEQ ID No.14所示。将克隆好的载体用AatII酶切进行线性化,再通过Gateway的LR反应分别转移到pUbi:rBE14中。其中,在靶核苷酸序列中从5’端到3’端方向的第4位和第7位均含有碱基A。
对于OsSERK2基因,设计含有与BsaI酶切位点末端连接匹配的靶核苷酸序列引物如下:gOsSERK2-F4(SEQ ID No.15)和gOsSERK2-R4(SEQ ID No.16)
合成引物后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链,将gOsSERK2-F4/R4克隆到pENTR4:sgRNA载体的BsaI酶切位点中,测序确认***片段完全正确。其中以正向引物表示***pENTR4:sgRNA载体上的BsaI位点的靶核苷酸序列,如SEQ IDNo.17所示。将克隆好的载体用AatII酶切进行线性化,再通过Gateway的LR反应克隆至pUbi:rBE14中。其中,在靶核苷酸序列中从5’端到3’端方向的第6位含有碱基A。
2.2rBE***转化粳稻品种Kitaake
1)水稻愈伤诱导:
去壳的未成熟的水稻种子用50%的市售消毒液处理25分钟;无菌水清洗3-5次,然后将种子转移至无菌的培养皿中,吸出多余的水份;将种子放置于MSD平板上(4.43g/L MS粉;30g/L蔗糖;2ml/L 2,4-D;8g/L植物凝胶;pH5.7),于光照培养室培养10天,诱导愈伤组织形成;去除种子的胚和芽,将愈伤组织转移至一个新的MSD培养皿上,培养5天,直至能够用于农杆菌的转化
2)农杆菌转化:
将最终载体通过电击法转入到农杆菌菌株EHA105中,在LB培养基中过夜培养12小时;收集农杆菌,用MSD溶液重悬,使其OD600=0.1,待用。
3)水稻愈伤的农杆菌侵染:
将愈伤组织置于上述农杆菌悬浮液中30分钟;除去农杆菌悬浮液,将愈伤组织转移至无菌的吸水纸上;将愈伤组织转移至新的含有100μM乙酰丁香酮的MSD培养基上,室温避光培养3天。
4)水稻抗性愈伤筛选:
将暗培养后的愈伤组织转移至MSD培养基(200mg/L特美汀;50mg/L潮霉素B)上培养2周至2个月,直至愈伤组织的表面出现抗性愈伤,转移抗性愈伤到新的MSD培养基(200mg/L特美汀,50mg/L潮霉素B)上,每2周换一次培养基。
5)抗性愈伤分化与生根
将抗性愈伤组织转移至再生培养基上(4.43g/L MS粉;30g/L蔗糖;25g/L山梨醇;0.5mg/L NAA;3mg/L BA;100mg/L特美汀;50mg/L潮霉素B;12g/L琼脂粉;pH=5.7),直至长成植株幼苗,每7-10天转移一次;转移幼苗至1/2MS培养基(2.21g/L MS粉;15g/L蔗糖;8g/L植物凝胶;pH5.7)中生根。
2.3对T0代转基因水稻中OsWRKY45、OsSERK2基因靶位点进行鉴定
用CTAB法提取抗性愈伤的基因组DNA。
根据OsWRKY45基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物:OsWRKY45-F1(SEQ ID No.18),OsWRKY45-R1(SEQ ID No.19),利用I-5高保真酶混合液(MACLAB)进行PCR扩增目的片段500bp,PCR产物直接测序。分析测序后的OsWRKY45靶核苷酸序列正向引物可知,在其第4位和7位都含有碱基A,通过对53个水稻抗性愈伤检测发现,第4位和第7位碱基A都能突变为G,33个抗性愈伤的第7位碱基A突变为T,13个抗性愈伤的第4位碱基A突变为G。pUbi:rBE14***对OsWRKY45的靶位点总编辑效率高达62%。
根据OsSERK2基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物:OsSERK2-F2(SEQ ID No.20),OsSERK2-R2(SEQ ID No.21),利用I-5高保真酶混合液(MACLAB)进行PCR扩增目的片段498bp,PCR产物直接测序。分析测序后的OsSERK2靶核苷酸序列正向引物可知,在其第6位含有碱基A,通过对78株水稻幼苗检测发现有25株水稻第6位碱基A突变为G,结果显示pUbi:rBE14***对OsSERK2靶位点编辑效率高达33.25%。
实施例3
使用pUbi:rBE14和pUbi:rBE17分别对OsMPK6进行碱基编辑
pUbi:rBE14***和pUbi:rBE17***识别的PAM motif为NGG、NAG、GAGN和AAGN等,所述N是A或G或C或T。
按照实施例2中靶核苷酸序列引物设计原则设计OsMPK6的靶核苷酸序列的含有与BsaI酶切位点末端连接匹配的引物:gOsMPK6-F1(SEQ ID No.22)和gOsMPK6-R1(SEQIDNo.23)。
合成引物后,使用T4多聚核苷酸激酶将引物进行磷酸化处理,退火形成双链,将gOsMPK6-F1/R1克隆到pENTR4:sgRNA载体的BsaI酶切位点中,测序确认***片段完全正确。其中以正向引物表示***pENTR4:sgRNA载体上的BsaI位点的靶核苷酸序列,如SEQIDNo.24所示。其中,在靶核苷酸序列中从5’端到3’端方向的第2位、第4位和第7位均含有碱基A。
其他操作同实施例2。
根据OsMPK6基因的靶位点DNA序列设计用于鉴定的特异性的PCR引物:OsMPK6-F3(SEQ ID No.25),OsMPK6-R3(SEQ ID No.26),利用I-5高保真酶混合液(MACLAB)进行PCR扩增目的片段467bp,PCR产物直接测序。分析测序后的OsMPK6靶核苷酸序列正向引物可知:对于pUbi:rBE14***,通过对68株水稻幼苗检测发现有12株水稻第6位碱基A突变为G,结果显示pUbi:rBE14***对OsMPK6靶位点编辑效率位16.67%;对于pUbi:rBE17***,通过对60株水稻幼苗检测没有发现第2位、第4位和第7位碱基A突变位G,结果显示pUbi:rBE17***对OsMPK6靶位点编辑效率位0%。这表明pUbi:rBE14高效特异性的编辑靶序列第4至7位碱基A,而pUbi:rBE17在此编辑框内并不发挥作用。
序列表
<110> 中国农业科学院植物保护研究所
<120> 一套用于水稻的碱基编辑人工***
<130> LHA1860032
<160> 26
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1775
<212> PRT
<213> 人工序列(non)
<400> 1
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Gly Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Asn Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Gly Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys
385 390 395 400
Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val
405 410 415
Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly
420 425 430
Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu
435 440 445
Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala
450 455 460
Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu
465 470 475 480
Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg
485 490 495
Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His
500 505 510
Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr
515 520 525
Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys
530 535 540
Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe
545 550 555 560
Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp
565 570 575
Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe
580 585 590
Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu
595 600 605
Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln
610 615 620
Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
625 630 635 640
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu
645 650 655
Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp
660 665 670
Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala
675 680 685
Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val
690 695 700
Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg
705 710 715 720
Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg
725 730 735
Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys
740 745 750
Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe
755 760 765
Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu
770 775 780
Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr
785 790 795 800
Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His
805 810 815
Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn
820 825 830
Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val
835 840 845
Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys
850 855 860
Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
865 870 875 880
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys
885 890 895
Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu
900 905 910
Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu
915 920 925
Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile
930 935 940
Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu
945 950 955 960
Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
965 970 975
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp
980 985 990
Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn
995 1000 1005
Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1010 1015 1020
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp
1025 1030 1035 1040
Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly
1045 1050 1055
Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly
1060 1065 1070
Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn
1075 1080 1085
Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile
1090 1095 1100
Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1105 1110 1115 1120
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr
1125 1130 1135
Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro
1140 1145 1150
Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys
1155 1160 1165
Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1170 1175 1180
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr
1185 1190 1195 1200
Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
1205 1210 1215
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr
1220 1225 1230
Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1235 1240 1245
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp
1250 1255 1260
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1265 1270 1275 1280
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1285 1290 1295
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe
1300 1305 1310
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1315 1320 1325
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys
1330 1335 1340
Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1345 1350 1355 1360
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1365 1370 1375
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1380 1385 1390
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp
1395 1400 1405
Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1410 1415 1420
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1425 1430 1435 1440
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1445 1450 1455
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1460 1465 1470
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1475 1480 1485
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1490 1495 1500
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1505 1510 1515 1520
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1525 1530 1535
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1540 1545 1550
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1555 1560 1565
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1570 1575 1580
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1585 1590 1595 1600
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1605 1610 1615
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1620 1625 1630
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn
1635 1640 1645
Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1650 1655 1660
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1665 1670 1675 1680
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1685 1690 1695
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1700 1705 1710
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1715 1720 1725
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1730 1735 1740
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1745 1750 1755 1760
Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1765 1770 1775
<210> 2
<211> 5298
<212> DNA/RNA
<213> 人工序列(non)
<400> 2
atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60
agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120
atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180
atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240
tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300
cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360
ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420
tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480
aaagcacaat cctctactga ctccggcggc tcctccggcg gctcctccgg cggcgaaact 540
ccaggcactt ccgaatccgc gactccagaa tcctccggcg gctcctccgg cggctcctcc 600
gaagtcgagt tttcccatga gtactggatg agacacgcat tgactctcgc aaagagggct 660
agagatgaac gcgaggtgcc cgtgggggca gtactcgtgc tcaacaatcg cgtaatcggc 720
gaaggttgga atagggctat cggactccac gaccccactg cacatgcgga aatcatggcc 780
cttcgacagg gagggcttgt gatgcagaat tatcgactta tcgatgcgac gctgtacgtc 840
acgtttgaac cttgcgtaat gtgcgcggga gctatgattc actcccgcat tggacgagtt 900
gtattcggtg ttcgcaatgc caagacgggt gccgcaggtt cactgatgga cgtgctgcat 960
tacccaggca tgaaccaccg ggtagaaatc acagaaggca tattggcgga cgaatgtgcc 1020
gcgctgttgt gttacttttt tcgcatgaat aggcaggtgt ttaatgccca gaaaaaagca 1080
caatcctcta ctgactccgg cggctcctcc ggcggctcct ccggcggcga aactccaggc 1140
acttccgaat ccgcgactcc agaatcctcc ggcggctcct ccggcggctc cattgggaca 1200
aactctgtgg gctgggcggt aattaccgac gagtacaagg tgcctagtaa gaaatttaaa 1260
gtgctcggaa acactgacag gcactctata aagaagaacc tgatcggggc actgcttttc 1320
gactccggag agacggcgga ggcgacgcgt ctcaagcgta ccgcgcgccg caggtacaca 1380
agaaggaaga ataggatctg ctacttgcag gaaatcttca gtaacgagat ggcgaaggtc 1440
gacgatagtt tctttcatcg gttggaagaa tcgttcctcg tagaggagga caaaaagcac 1500
gagcgtcacc caatattcgg gaatattgtt gacgaggttg cctaccatga gaaatatcct 1560
acaatatatc acctccgtaa gaagcttgtc gattcaactg ataaggctga tctcagactc 1620
atctatcttg ccctcgcaca tatgattaag tttcgtggcc acttcttgat tgaaggcgac 1680
ctcaacccgg acaactcaga tgttgacaag ctttttatac agctcgtcca gacatataac 1740
cagctgtttg aagagaatcc catcaatgcg agtggggttg atgctaacgc cattttgtcc 1800
gccaggttgt ccaaatctcg cagactggaa aacctgatcg cacagcttcc cggtgaaaag 1860
aaaaacgggc tcttcggcaa tctcatcgca ctgtccctcg gcctcacccc aaacttcaag 1920
tctaacttcg acctggccga ggatgcgaag ctccagctgt caaaagatac atacgacgac 1980
gatttggaca atctgcttgc gcaaataggc gaccagtatg cggacctgtt cctggctgcc 2040
aaaaatctgt cagatgcaat cctcctgtcc gatatattgc gtgtgaacac cgaaatcacg 2100
aaggcaccgc ttagcgcatc catgatcaag agatacgacg agcaccatca ggacctcaca 2160
ctcctcaagg cgcttgttcg tcagcagctt cccgagaaat ataaggaaat ttttttcgat 2220
caaagcaaga atggatatgc tggctatatt gacggtggcg cttcgcagga ggagttctat 2280
aaattcatta agccgattct ggagaagatg gacggaacgg aggagctcct cgtcaagctt 2340
aaccgggaag acctgttgcg gaagcagagg acttttgata acggctctat tccgcaccaa 2400
atccatctgg gtgagttgca cgcaatcttg agaagacaag aggatttcta cccgttcctt 2460
aaggataaca gagagaagat agaaaaaata ctgaccttca ggataccata ctatgtgggc 2520
ccactggcgc gcggaaatag tcgtttcgca tggatgacta gaaagtccga agaaacgatc 2580
acgccatgga attttgagga agtggtcgac aagggcgcct ctgcccagag cttcatcgaa 2640
aggatgacca attttgacaa aaatctgcct aacgaaaagg tgcttccgaa gcacagcctg 2700
ttgtatgaat acttcacagt ttataacgag ctcactaagg tcaagtacgt cacggagggc 2760
atgcgtaagc ctgctttcct gtctggtgaa caaaaaaagg cgattgtgga cctccttttc 2820
aagacgaacc gtaaagttac tgtgaagcaa ctgaaagagg attactttaa gaaaattgag 2880
tgcttcgaca gtgtggagat ttccggtgtc gaggaccggt ttaacgccag cctgggtacg 2940
tatcatgacc tgcttaaaat tatcaaggat aaagatttcc tggataatga agagaacgaa 3000
gatatactgg aggacattgt gttgactttg accctcttcg aggacagaga gatgattgag 3060
gaaagactga agacctacgc acaccttttt gatgacaagg tcatgaaaca actcaagcgc 3120
cggcgctata ctggctgggg ccggctttct cgcaagctca tcaatgggat tcgggataag 3180
caatcaggca agacaatttt ggacttcctc aaatccgacg gattcgcaaa taggaatttt 3240
atgcagctga tacatgacga ctctttgaca ttcaaagaag acatacagaa ggctcaggtc 3300
tccggccaag gagattcttt gcacgagcat atcgctaact tggcaggtag ccccgccata 3360
aaaaagggca ttcttcaaac ggtaaaagtt gttgacgaac tcgtgaaggt tatgggccgt 3420
cataagccgg aaaacattgt tattgaaatg gctagggaaa atcagacgac ccagaaggga 3480
cagaaaaata gcagggagcg gatgaagaga attgaagagg gaattaagga gcttggatct 3540
cagattctta aggagcaccc tgtggagaac acccaacttc agaatgaaaa gctctacctt 3600
tactaccttc aaaacggccg ggatatgtac gtcgatcagg aacttgacat taaccggttg 3660
agcgattatg acgttgacca tattgtgccc caatctttcc ttaaagacga ctctatcgac 3720
aataaagtgc tgacgcgcag cgataaaaat cgcggtaagt cggataatgt cccgtcggaa 3780
gaggtggtta aaaaaatgaa gaactattgg aggcaactcc tgaatgccaa gctgatcact 3840
cagaggaaat tcgacaatct caccaaggca gaaaggggtg gacttagcga gctcgacaag 3900
gccggtttta tcaaaagaca gctggtggag acacgccaaa tcaccaaaca cgttgcccag 3960
atcctggatt cgaggatgaa cacgaagtat gacgagaacg acaagttgat tagggaagtc 4020
aaggtcatca ctttgaagtc caagctggtg agcgactttc gcaaagactt ccagttttac 4080
aaagtcaggg aaattaataa ctaccaccac gcccacgacg cctaccttaa cgccgtggtt 4140
ggcacagcac tcatcaagaa ataccctaag ctcgaatctg agttcgtcta tggcgactat 4200
aaggtctacg acgttagaaa aatgatcgcg aaatctgagc aggaaatagg caaggcaact 4260
gccaagtact tcttctattc caatatcatg aactttttta agacggagat taccctggcg 4320
aatggtgaga tccgcaagcg ccctttgatt gagacaaacg gagaaacagg agagatcgta 4380
tgggacaaag ggcgggactt tgctactgtt aggaaggtgc tctctatgcc acaagttaac 4440
attgtcaaaa aaactgaagt gcagacaggt gggtttagca aggaatctat cctgccgaag 4500
aggaactctg acaagctgat cgcccgcaag aaagattggg atccgaaaaa gtacggagga 4560
ttcgactccc ccacagttgc gtactccgtg cttgtcgtgg ccaaagtgga gaagggcaag 4620
tctaagaagc tcaagagcgt caaagagttg ttggggatca cgattatgga gcggtcgtct 4680
ttcgaaaaga atccgataga ttttctcgag gccaagggtt ataaagaagt caagaaggat 4740
cttatcatca agctccctaa gtactccctc tttgagcttg aaaacggacg gaaaagaatg 4800
ctggcttcag cgggtgaact tcagaagggt aatgaactcg ctctgccctc aaaatatgtg 4860
aatttccttt acctggcatc acactatgag aagcttaagg ggtctccaga ggacaacgag 4920
cagaagcaac tgttcgttga acaacacaag cactaccttg acgagattat cgagcaaatc 4980
agcgagttta gcaagcgcgt tatactggca gacgcaaatc ttgataaggt ccttagcgcc 5040
tacaacaagc atagagacaa acccatccgg gagcaggccg agaacattat tcatctcttc 5100
accttgacga atcttggggc cccggccgcg ttcaagtact tcgatactac catagacaga 5160
aagcgctata catcgacaaa ggaagttctt gacgccacgc tgatccacca aagtataaca 5220
ggcctctatg agacacgcat cgacctttcg cagttgggcg gtgaccgccc caaaaagaag 5280
aggaaagttg gcgggtga 5298
<210> 3
<211> 76
<212> DNA/RNA
<213> 化脓链球菌(Streptococcus pyogenes)
<400> 3
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 4
<211> 41
<212> DNA
<213> 人工序列(non)
<400> 4
tgttggctag gatccatcgc agtcagcgat gagtacagca a 41
<210> 5
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 5
gtgtagagac caaaggaggt ctca 24
<210> 6
<211> 1765
<212> DNA
<213> 人工序列(non)
<400> 6
gcagcgtgac ccggtcgtgc ccctctctag agataatgag cattgcatgt ctaagttata 60
aaaaattacc acatattttt tttgtcacac ttgtttgaag tgcagtttat ctatctttat 120
acatatattt aaactttact ctacgaataa tataatctat agtactacaa taatatcagt 180
gttttagaga atcatataaa tgaacagtta gacatggtct aaaggacaat tgagtatttt 240
gacaacagga ctctacagtt ttatcttttt agtgtgcatg tgttctcctt tttttttgca 300
aatagcttca cctatataat acttcatcca ttttattagt acatccattt agggtttagg 360
gttaatggtt tttatagact aattttttta gtacatctat tttattctat tttagcctct 420
aaattaagaa aactaaaact ctattttagt ttttttattt aataatttag atataaaata 480
gaataaaata aagtgactaa aaattaaaca aatacccttt aagaaattaa aaaaactaag 540
gaaacatttt tcttgtttcg agtagataat gccagcctgt taaacgccgt cgacgagtct 600
aacggacacc aaccagcgaa ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg 660
gcatctctgt cgctgcctct ggacccctct cgagagttcc gctccaccgt tggacttgct 720
ccgctgtcgg catccagaaa ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc 780
ggcctcctcc tcctctcacg gcacggcagc tacgggggat tcctttccca ccgctccttc 840
gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct ctttccccaa 900
cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc cacccgtcgg 960
cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta ccttctctag 1020
atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat gtttgtgtta 1080
gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg acctgtacgt 1140
cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct gggatggctc 1200
tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc atagggtttg 1260
gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc 1320
atgctttttt tttgtcttgg ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt 1380
ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt ttggaactgt 1440
atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat atcgatctag 1500
gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc atatgcagca 1560
tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt atgttttata 1620
attattttga tcttgatata cttggatgat ggcatatgca gcagctatat gtggattttt 1680
ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt cgatgctcac 1740
cctgttgttt ggtgttactt ctgca 1765
<210> 7
<211> 326
<212> DNA
<213> 人工序列(non)
<400> 7
aagaacgaac taagccggac aaaaaaagga gcacatatac aaaccggttt tattcatgaa 60
tggtcacgat ggatgatggg gctcagactt gagctacgag gccgcaggcg agagaagcct 120
agtgtgctct ctgcttgttt gggccgtaac ggaggatacg gccgacgagc gtgtactacc 180
gcgcgggatg ccgctgggcg ctgcgggggc cgttggatgg ggatcggtgg gtcgcgggag 240
cgttgagggg agacaggttt agtaccacct cgcctaccga acaatgaaga acccacctta 300
taaccccgcg cgctgccgct tgtgtt 326
<210> 8
<211> 253
<212> DNA
<213> 人工序列(non)
<400> 8
gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg 60
atgattatca tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc 120
atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac 180
gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct 240
atgttactag atc 253
<210> 9
<211> 8
<212> DNA
<213> 人工序列(non)
<400> 9
tttttttt 8
<210> 10
<211> 5298
<212> DNA/RNA
<213> 人工序列(non)
<400> 10
atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60
agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120
atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180
atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240
tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300
cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360
ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420
tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480
aaagcacaat cctctactga ctccggcggc tcctccggcg gctcctccgg cggcgaaact 540
ccaggcactt ccgaatccgc gactccagaa tcctccggcg gctcctccgg cggctcctca 600
gaagtcgagt tctcccatga gtattggatg aggcacgccc tcactcttgc gaagagggcc 660
agggacgaga gggaggtgcc ggtcggtgct gtcctggtct tgaataacag ggtgataggc 720
gaaggttgga acagggctat tggccttcat gaccctactg ctcatgcgga aatcatggca 780
cttagacagg ggggcctcgt tatgcaaaat taccgcctga tcgacgccac tctttatgtc 840
acatttgaac catgtgttat gtgtgcgggc gctatgatcc attcacgcat aggtcgcgtg 900
gtttttggag ttcgcaacgc gaaaacaggg gctgcaggct ctctgatgga cgttttgcac 960
tatccgggaa tgaaccatag agtcgaaatc acagaaggga ttttggcaga cgaatgccgc 1020
gctcttcttt gttatttttt cagaatgaac cgccaagtgt ttaatgctca aaagaaagcg 1080
cagagtagca cagactccgg cggctcctcc ggcggctcct ccggcggcga aactccaggc 1140
acttccgaat ccgcgactcc agaatcctcc ggcggctcct ccggcggctc cattgggaca 1200
aactctgtgg gctgggcggt aattaccgac gagtacaagg tgcctagtaa gaaatttaaa 1260
gtgctcggaa acactgacag gcactctata aagaagaacc tgatcggggc actgcttttc 1320
gactccggag agacggcgga ggcgacgcgt ctcaagcgta ccgcgcgccg caggtacaca 1380
agaaggaaga ataggatctg ctacttgcag gaaatcttca gtaacgagat ggcgaaggtc 1440
gacgatagtt tctttcatcg gttggaagaa tcgttcctcg tagaggagga caaaaagcac 1500
gagcgtcacc caatattcgg gaatattgtt gacgaggttg cctaccatga gaaatatcct 1560
acaatatatc acctccgtaa gaagcttgtc gattcaactg ataaggctga tctcagactc 1620
atctatcttg ccctcgcaca tatgattaag tttcgtggcc acttcttgat tgaaggcgac 1680
ctcaacccgg acaactcaga tgttgacaag ctttttatac agctcgtcca gacatataac 1740
cagctgtttg aagagaatcc catcaatgcg agtggggttg atgctaacgc cattttgtcc 1800
gccaggttgt ccaaatctcg cagactggaa aacctgatcg cacagcttcc cggtgaaaag 1860
aaaaacgggc tcttcggcaa tctcatcgca ctgtccctcg gcctcacccc aaacttcaag 1920
tctaacttcg acctggccga ggatgcgaag ctccagctgt caaaagatac atacgacgac 1980
gatttggaca atctgcttgc gcaaataggc gaccagtatg cggacctgtt cctggctgcc 2040
aaaaatctgt cagatgcaat cctcctgtcc gatatattgc gtgtgaacac cgaaatcacg 2100
aaggcaccgc ttagcgcatc catgatcaag agatacgacg agcaccatca ggacctcaca 2160
ctcctcaagg cgcttgttcg tcagcagctt cccgagaaat ataaggaaat ttttttcgat 2220
caaagcaaga atggatatgc tggctatatt gacggtggcg cttcgcagga ggagttctat 2280
aaattcatta agccgattct ggagaagatg gacggaacgg aggagctcct cgtcaagctt 2340
aaccgggaag acctgttgcg gaagcagagg acttttgata acggctctat tccgcaccaa 2400
atccatctgg gtgagttgca cgcaatcttg agaagacaag aggatttcta cccgttcctt 2460
aaggataaca gagagaagat agaaaaaata ctgaccttca ggataccata ctatgtgggc 2520
ccactggcgc gcggaaatag tcgtttcgca tggatgacta gaaagtccga agaaacgatc 2580
acgccatgga attttgagga agtggtcgac aagggcgcct ctgcccagag cttcatcgaa 2640
aggatgacca attttgacaa aaatctgcct aacgaaaagg tgcttccgaa gcacagcctg 2700
ttgtatgaat acttcacagt ttataacgag ctcactaagg tcaagtacgt cacggagggc 2760
atgcgtaagc ctgctttcct gtctggtgaa caaaaaaagg cgattgtgga cctccttttc 2820
aagacgaacc gtaaagttac tgtgaagcaa ctgaaagagg attactttaa gaaaattgag 2880
tgcttcgaca gtgtggagat ttccggtgtc gaggaccggt ttaacgccag cctgggtacg 2940
tatcatgacc tgcttaaaat tatcaaggat aaagatttcc tggataatga agagaacgaa 3000
gatatactgg aggacattgt gttgactttg accctcttcg aggacagaga gatgattgag 3060
gaaagactga agacctacgc acaccttttt gatgacaagg tcatgaaaca actcaagcgc 3120
cggcgctata ctggctgggg ccggctttct cgcaagctca tcaatgggat tcgggataag 3180
caatcaggca agacaatttt ggacttcctc aaatccgacg gattcgcaaa taggaatttt 3240
atgcagctga tacatgacga ctctttgaca ttcaaagaag acatacagaa ggctcaggtc 3300
tccggccaag gagattcttt gcacgagcat atcgctaact tggcaggtag ccccgccata 3360
aaaaagggca ttcttcaaac ggtaaaagtt gttgacgaac tcgtgaaggt tatgggccgt 3420
cataagccgg aaaacattgt tattgaaatg gctagggaaa atcagacgac ccagaaggga 3480
cagaaaaata gcagggagcg gatgaagaga attgaagagg gaattaagga gcttggatct 3540
cagattctta aggagcaccc tgtggagaac acccaacttc agaatgaaaa gctctacctt 3600
tactaccttc aaaacggccg ggatatgtac gtcgatcagg aacttgacat taaccggttg 3660
agcgattatg acgttgacca tattgtgccc caatctttcc ttaaagacga ctctatcgac 3720
aataaagtgc tgacgcgcag cgataaaaat cgcggtaagt cggataatgt cccgtcggaa 3780
gaggtggtta aaaaaatgaa gaactattgg aggcaactcc tgaatgccaa gctgatcact 3840
cagaggaaat tcgacaatct caccaaggca gaaaggggtg gacttagcga gctcgacaag 3900
gccggtttta tcaaaagaca gctggtggag acacgccaaa tcaccaaaca cgttgcccag 3960
atcctggatt cgaggatgaa cacgaagtat gacgagaacg acaagttgat tagggaagtc 4020
aaggtcatca ctttgaagtc caagctggtg agcgactttc gcaaagactt ccagttttac 4080
aaagtcaggg aaattaataa ctaccaccac gcccacgacg cctaccttaa cgccgtggtt 4140
ggcacagcac tcatcaagaa ataccctaag ctcgaatctg agttcgtcta tggcgactat 4200
aaggtctacg acgttagaaa aatgatcgcg aaatctgagc aggaaatagg caaggcaact 4260
gccaagtact tcttctattc caatatcatg aactttttta agacggagat taccctggcg 4320
aatggtgaga tccgcaagcg ccctttgatt gagacaaacg gagaaacagg agagatcgta 4380
tgggacaaag ggcgggactt tgctactgtt aggaaggtgc tctctatgcc acaagttaac 4440
attgtcaaaa aaactgaagt gcagacaggt gggtttagca aggaatctat cctgccgaag 4500
aggaactctg acaagctgat cgcccgcaag aaagattggg atccgaaaaa gtacggagga 4560
ttcgactccc ccacagttgc gtactccgtg cttgtcgtgg ccaaagtgga gaagggcaag 4620
tctaagaagc tcaagagcgt caaagagttg ttggggatca cgattatgga gcggtcgtct 4680
ttcgaaaaga atccgataga ttttctcgag gccaagggtt ataaagaagt caagaaggat 4740
cttatcatca agctccctaa gtactccctc tttgagcttg aaaacggacg gaaaagaatg 4800
ctggcttcag cgggtgaact tcagaagggt aatgaactcg ctctgccctc aaaatatgtg 4860
aatttccttt acctggcatc acactatgag aagcttaagg ggtctccaga ggacaacgag 4920
cagaagcaac tgttcgttga acaacacaag cactaccttg acgagattat cgagcaaatc 4980
agcgagttta gcaagcgcgt tatactggca gacgcaaatc ttgataaggt ccttagcgcc 5040
tacaacaagc atagagacaa acccatccgg gagcaggccg agaacattat tcatctcttc 5100
accttgacga atcttggggc cccggccgcg ttcaagtact tcgatactac catagacaga 5160
aagcgctata catcgacaaa ggaagttctt gacgccacgc tgatccacca aagtataaca 5220
ggcctctatg agacacgcat cgacctttcg cagttgggcg gtgaccgccc caaaaagaag 5280
aggaaagttg gcgggtga 5298
<210> 11
<211> 1769
<212> PRT
<213> 人工序列(non)
<400> 11
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Gly Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Arg Ala Leu Leu Cys Tyr Phe Phe Arg Met Asn Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
355 360 365
Gly Gly Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
370 375 380
Gly Gly Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
385 390 395 400
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
405 410 415
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
420 425 430
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
435 440 445
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
450 455 460
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
465 470 475 480
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
485 490 495
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
500 505 510
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
515 520 525
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
530 535 540
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
545 550 555 560
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
565 570 575
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
580 585 590
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
595 600 605
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
610 615 620
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
625 630 635 640
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
645 650 655
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
660 665 670
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
675 680 685
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
690 695 700
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
705 710 715 720
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
725 730 735
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
740 745 750
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
755 760 765
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
770 775 780
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
785 790 795 800
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
805 810 815
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
820 825 830
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
835 840 845
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
850 855 860
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
865 870 875 880
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
885 890 895
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
900 905 910
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
915 920 925
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
930 935 940
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
945 950 955 960
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
965 970 975
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
980 985 990
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
995 1000 1005
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1010 1015 1020
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
1025 1030 1035 1040
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
1045 1050 1055
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
1060 1065 1070
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
1075 1080 1085
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
1090 1095 1100
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
1105 1110 1115 1120
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
1125 1130 1135
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
1140 1145 1150
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1155 1160 1165
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1170 1175 1180
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1185 1190 1195 1200
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
1205 1210 1215
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
1220 1225 1230
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
1235 1240 1245
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1250 1255 1260
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1265 1270 1275 1280
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
1285 1290 1295
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
1300 1305 1310
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1315 1320 1325
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
1330 1335 1340
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1345 1350 1355 1360
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
1365 1370 1375
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1380 1385 1390
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1395 1400 1405
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1410 1415 1420
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1425 1430 1435 1440
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1445 1450 1455
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1460 1465 1470
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1475 1480 1485
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1490 1495 1500
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1505 1510 1515 1520
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1525 1530 1535
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu
1540 1545 1550
Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1555 1560 1565
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1570 1575 1580
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1585 1590 1595 1600
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1605 1610 1615
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1620 1625 1630
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1635 1640 1645
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1650 1655 1660
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1665 1670 1675 1680
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1685 1690 1695
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1700 1705 1710
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1715 1720 1725
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1730 1735 1740
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1745 1750 1755 1760
Gly Ser Pro Lys Lys Lys Arg Lys Val
1765
<210> 12
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 12
tgttgggagg acgtgacatc gccc 24
<210> 13
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 13
aaacgggcga tgtcacgtcc tccc 24
<210> 14
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 14
gggaggacgt gacatcgccc 20
<210> 15
<211> 23
<212> DNA
<213> 人工序列(non)
<400> 15
gtgtgccgga cagctccatt gcc 23
<210> 16
<211> 23
<212> DNA
<213> 人工序列(non)
<400> 16
aaacggcaat ggagctgtcc ggc 23
<210> 17
<211> 19
<212> DNA
<213> 人工序列(non)
<400> 17
gccggacagc tccattgcc 19
<210> 18
<211> 18
<212> DNA
<213> 人工序列(non)
<400> 18
acgaccagca cgatcacc 18
<210> 19
<211> 21
<212> DNA
<213> 人工序列(non)
<400> 19
tgctagcatg tctgcagctt a 21
<210> 20
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 20
gcacgcatga cttagcaaaa 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 21
cctccagatt tgccagctat 20
<210> 22
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 22
gtgtgacata ctcagtcata aaat 24
<210> 23
<211> 24
<212> DNA
<213> 人工序列(non)
<400> 23
aaacatttta tgactgagta tgtc 24
<210> 24
<211> 20
<212> DNA
<213> 人工序列(non)
<400> 24
gacatactca gtcataaaat 20
<210> 25
<211> 21
<212> DNA
<213> 人工序列(non)
<400> 25
ctctcccttt cttgagtgga a 21
<210> 26
<211> 21
<212> DNA
<213> 人工序列(non)
<400> 26
ccaggaaaca aaggtttacg a 21

Claims (14)

1.一套碱基编辑人工***,所述人工***包括:
第I调节元件,其为编码如氨基酸序列I的核苷酸序列;其中所述氨基酸序列I为如SEQID No. 1所示的氨基酸序列;编码如SEQ ID No. 1所示氨基酸序列的核苷酸编码序列如SEQ ID No. 2所示;
第II调节元件,其由依次从5’端到3’端的第II-1核苷酸序列和第II-2核苷酸序列组成;所述第II-1核苷酸序列包括靶核苷酸序列;所述第II-2核苷酸序列为来源于化脓链球菌(Streptococcus pyogenes)的sgRNA核酸序列;所述第II-1核苷酸序列和所述第II-2核苷酸序列转录融合,其产物能引导第I调控元件编码的蛋白至目标生物基因组中待突变的靶位点处,并将所述靶核苷酸序列中的靶位点处的A突变为G;或将所述靶核苷酸序列中的靶位点处的T突变为C;当所述第II调节元件为多个时,包含在其中的多个第II-1核苷酸序列两两不相同;所述第II-2核苷酸序列如SEQ ID No. 3所示;所述靶核苷酸序列中的靶位点处于所述靶核苷酸序列的从5ʹ端到3ʹ端方向的4至7位置;
通过如下方式确定所述靶核苷酸序列:
1)确定水稻基因组上需要被改造的核苷酸序列;
2)判断步骤1)中确定的需要被改造的核苷酸序列或其反向互补序列中是否携带有待突变的核苷酸A,并判断所述待突变的核苷酸A突变为G,或所述待突变的核苷酸T突变为C后引起的改变是否符合预期;
3)在需要被改造的核苷酸序列或其反向互补序列中筛选靶标序列:向所述待突变的核苷酸A的3ʹ端方向搜索以确认存在被氨基酸序列I识别的识别模序,且所述待突变的核苷酸A处在所述识别模序5ʹ端上游的-19至-13的位置,由此确定的所述识别模序5ʹ端上游17至21个核苷酸序列为所述靶核苷酸序列;
所述识别模序为5ʹ-NGG-3ʹ、5ʹ-NGA-3ʹ、5ʹ- GAGN-3ʹ、5ʹ-AAGN-3ʹ中的一种,所述靶核苷酸序列为所述识别模序5ʹ端上游的17至21个核苷酸序列,淘汰含有连续五个T的核苷酸序列;
其中,所述N为A、G、C和T中的一种。
2.根据权利要求1所述的人工***,其特征在于,所述第II-1核苷酸序列还包括含有IIS型限制性内切酶的酶切位点的克隆位点,所述靶核苷酸序列通过所述第II-1核苷酸序列上的所述克隆位点而被克隆到其中,以使所述第II-1核苷酸序列与第II-2序列转录融合;
当所述第II调节元件为多个时,用于克隆不同靶核苷酸序列的所述IIS型限制性内切酶的酶切位点两两不相同。
3.根据权利要求1所述的人工***,其特征在于,所述人工***还包括在所述第I调节元件的5ʹ端的用于水稻中的,且启动所述第I调节元件转录的第一启动子;所述人工***还包括在所述第II调节元件的5ʹ端的用于水稻中的,且启动所述第II调节元件转录的第二启动子;
所述人工***还包括在所述第I调节元件的3’端的终止所述第I调节元件转录的第一终止子;所述人工***还包括在所述第II调节元件的3’端的终止所述第II调节元件转录的第二终止子。
4.根据权利要求3所述的人工***,其特征在于,所述第一启动子为RNA聚合酶II型启动子;所述第二启动子为RNA聚合酶III型启动子。
5.根据权利要求3所述的人工***,其特征在于,所述第一启动子为SEQ ID No. 6;所述第二启动子为SEQ ID No. 7。
6.根据权利要求3所述的人工***,其特征在于,所述第一终止子为SEQ ID No. 8;第二终止子为SEQ ID No. 9。
7.根据权利要求1-6中任意一项所述的人工***,其特征在于,所述第I调节元件和所述第II元件被克隆到至少一个载体上。
8.根据权利要求7所述的人工***,其特征在于,所述第I调节元件被克隆到pCAMBIA1300上,所述第II调节元件被克隆到载体pENTR4上。
9.根据权利要求8所述的人工***,其特征在于,所述第一启动子、第I调节元件和第一终止子被克隆到pCAMBIA1300载体上。
10.根据权利要求8所述的人工***,其特征在于,所述第二启动子、第II调节元件和第二终止子被克隆到pENTR4载体上。
11.根据权利要求7所述的人工***,其特征在于,所述第I调节元件和所述第II调节元件被整合到同一个载体上,或被分布在多个载体上一起使用。
12.如权利要求1-11中任意一项所述的人工***在用于将水稻基因组中的A定点突变为G、或将水稻基因组中的T定点突变为C的应用。
13.一种将水稻基因组上的A定点突变为G,或将水稻基因组中的T定点突变为C的方法,其包括如下步骤:
1)将如权利要求1-11中任意一项所述的人工***通过农杆菌介导、基因枪轰击或PEG介导转化的方法中的一种导入到水稻愈伤组织或水稻原生质体中,然后培养获得水稻植株;
2)筛选获得含有定点突变的水稻植株。
14.根据权利要求13所述的方法,其特征在于,所述水稻植株产生含有定点替换碱基的水稻种子。
CN201810069129.6A 2018-01-24 2018-01-24 一套用于水稻的碱基编辑人工*** Active CN110066824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810069129.6A CN110066824B (zh) 2018-01-24 2018-01-24 一套用于水稻的碱基编辑人工***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810069129.6A CN110066824B (zh) 2018-01-24 2018-01-24 一套用于水稻的碱基编辑人工***

Publications (2)

Publication Number Publication Date
CN110066824A CN110066824A (zh) 2019-07-30
CN110066824B true CN110066824B (zh) 2021-06-08

Family

ID=67365650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810069129.6A Active CN110066824B (zh) 2018-01-24 2018-01-24 一套用于水稻的碱基编辑人工***

Country Status (1)

Country Link
CN (1) CN110066824B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110760540A (zh) * 2019-11-29 2020-02-07 中国农业科学院植物保护研究所 一套用于水稻的基因编辑人工***及其应用
CN111100852B (zh) * 2019-12-16 2021-04-13 中国农业科学院植物保护研究所 OsALS1的定向突变及农作物内源基因定向进化的方法
BR112022017704A2 (pt) * 2020-03-04 2022-11-01 Suzhou Qi Biodesign Biotechnology Company Ltd Método e sistema de edição de genoma multiplex
CN111549054A (zh) * 2020-05-22 2020-08-18 中国农业科学院植物保护研究所 CRISPR/RfxCas13d抗植物RNA病毒载体及其构建方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106916852A (zh) * 2017-04-13 2017-07-04 上海科技大学 一种碱基编辑***及其构建和应用方法
CN107177625A (zh) * 2017-05-26 2017-09-19 中国农业科学院植物保护研究所 一种定点突变的人工载体***及定点突变方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106916852A (zh) * 2017-04-13 2017-07-04 上海科技大学 一种碱基编辑***及其构建和应用方法
CN107177625A (zh) * 2017-05-26 2017-09-19 中国农业科学院植物保护研究所 一种定点突变的人工载体***及定点突变方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Programmable base editing of A•T to G•C in genomic DNA without DNA cleavage;Gaudelli NM等;《Nature》;20171025;第551卷(第7681期);全文 *
基因编辑之"新宠"—单碱基基因组编辑***;魏瑜等;《遗传》;20171231;第39卷(第12期);第1117-118页2嘌呤碱基转换的新工具—ABEs图1参考文献7第466页左栏第1段 *

Also Published As

Publication number Publication date
CN110066824A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
CN107177625B (zh) 一种定点突变的人工载体***及定点突变方法
AU2021225142B2 (en) Generation of haploid plants
CN110066824B (zh) 一套用于水稻的碱基编辑人工***
CN112500463B (zh) 控制玉米株高和穗位高基因ZmCOL14及其应用
CN114045303B (zh) 一套用于水稻的人工基因编辑***
EP3752621A1 (en) Compositions and methods for improving crop yields through trait stacking
CN110283838A (zh) 一种高剪切效率ScCas9基因及其应用
CN111718954B (zh) 一种基因组编辑工具及其应用
CN113994007B (zh) 一种核酸表达的方法
CN110592134A (zh) 一种sdg40基因或其编码蛋白的应用
CN111100852B (zh) OsALS1的定向突变及农作物内源基因定向进化的方法
CN113265403A (zh) 大豆Dt1基因编辑位点及其应用
CN109971763A (zh) 花期调控基因cmp1和相关的载体及其应用
CN114540406A (zh) 基因组编辑表达框、载体及其应用
CN115466747B (zh) 糖基转移酶ZmKOB1基因及其在调控玉米雌穗结实性状或发育上的应用
WO2019161150A1 (en) Compositions and methods for improving crop yields through trait stacking
CN116064568A (zh) 紫花苜蓿MsASG166基因及在提高植物耐旱中的用途
CN111875689B (zh) 一种利用番茄绿茎紧密连锁标记创制雄性不育系的方法
CN114395580A (zh) 用于控制玉米株高的基因
CN112080513A (zh) 一套编辑范围扩展的水稻人工基因组编辑***及其应用
RUZYATI et al. Construction of CRISPR/Cas9_gRNA-OsCKX2 module cassette and its introduction into rice cv. Mentik Wangi mediated by Agrobacterium tumefaciens
CN110760540A (zh) 一套用于水稻的基因编辑人工***及其应用
CN110295178A (zh) 敲降甘蓝型油菜及其亲本物种myb43的表达在提高植物抗病性中的应用
CN115894646B (zh) OsJDG1基因及其在调控水稻粒型和千粒重中的应用
CN112646014B (zh) 改变玉米开花期的基因及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant