CN113774082A - 一种核酸表达的方法 - Google Patents

一种核酸表达的方法 Download PDF

Info

Publication number
CN113774082A
CN113774082A CN202010442805.7A CN202010442805A CN113774082A CN 113774082 A CN113774082 A CN 113774082A CN 202010442805 A CN202010442805 A CN 202010442805A CN 113774082 A CN113774082 A CN 113774082A
Authority
CN
China
Prior art keywords
leu
glu
lys
arg
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010442805.7A
Other languages
English (en)
Inventor
谢洪涛
李羽
张洋扬
刘帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shunfeng Biotechnology Co Ltd
Original Assignee
Shandong Shunfeng Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shunfeng Biotechnology Co Ltd filed Critical Shandong Shunfeng Biotechnology Co Ltd
Priority to CN202010442805.7A priority Critical patent/CN113774082A/zh
Priority to CN202180003994.0A priority patent/CN113994007B/zh
Priority to PCT/CN2021/095310 priority patent/WO2021233442A1/zh
Publication of CN113774082A publication Critical patent/CN113774082A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8206Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8206Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated
    • C12N15/8207Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by physical or chemical, i.e. non-biological, means, e.g. electroporation, PEG mediated by mechanical means, e.g. microinjection, particle bombardment, silicon whiskers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明提供了一种核酸表达的方法,具体地,本发明提供了一种核酸构建物,本发明采用特定启动子驱动的核酸构建物,在植物中成功实现了gRNA引导的高效的碱基定点突变。

Description

一种核酸表达的方法
技术领域
本发明涉及生物技术领域,具体地,涉及一种核酸表达的方法。
背景技术
目前在双子叶植物中单碱基编辑效率低,大部分双子叶植物如大豆目前还不能进行单碱基编辑,而拟南芥/番茄等植物,单碱基编辑效率很低,严重影响了生物技术育种在农业生产上的应用。因此,提高在双子叶植物中的单碱基编辑编辑效率在农业生产中具有极大的商业价值。
因此,本领域迫切需要开发一种提高在植物中的单碱基编辑效率的方法。
发明内容
本发明的目的在于提供一种提高在植物中的单碱基编辑效率的方法。
本发明第一方面提供了一种核酸构建物,所述核酸构建物具有5’-3’(5’至3’)的式I结构:
P1-S1-L1-S2-S3 (I);
式中,
P1、S1、L1、S2、S3分别为用于构成所述构建物的元件;
P1为第一启动子序列,所述第一启动子包括延伸因子的启动子;
S1、S2各自独立地为一个或多个(a)基因编辑酶的编码序列、(b)腺嘌呤脱氨酶的编码序列和/或胞嘧啶脱氨酶的编码序列;
L1为无或连接肽的编码序列;
S3为无或尿嘧啶糖苷酶抑制剂UGI的编码序列;
并且,各“-”独立地为键或核苷酸连接序列。
在另一优选例中,所述的S1为腺嘌呤脱氨酶的编码序列和/或胞嘧啶脱氨酶的编码序列,所述S2为基因编辑酶的编码序列。
在另一优选例中,当S1为腺嘌呤脱氨酶的编码序列,S3为无。
在另一优选例中,当S1为胞嘧啶脱氨酶的编码序列,S3为尿嘧啶糖苷酶抑制剂UGI的编码序列。
在另一优选例中,所述延伸因子包括真核延伸因子或原核延伸因子。
在另一优选例中,所述真核延伸因子包括EF1α、EF1β、EF2。
在另一优选例中,所述原核延伸因子包括EF-Tu、EF-Ts、EF-G;优选地,包括EF1α;优选地,包括植物中的EF1α。
在另一优选例中,所述植物选自下组:玉米、水稻、大豆、拟南芥、烟草、番茄、或其组合。
在另一优选例中,所述第一启动子来源于选自下组的一种或多种植物:玉米、水稻、大豆、拟南芥、烟草、番茄。
在另一优选例中,所述第一启动子为番茄EF1a的启动子。
在另一优选例中,所述第一启动子的序列如SEQ ID NO.:1所示。
在另一优选例中,所述的L1核苷酸序列长度各自独立地为3-120nt,较佳的为3-96nt,并且优选为3的倍数。
在另一优选例中,所述的L1编码的氨基酸序列长度各自独立的为3-40aa,较佳的为6-32aa,较佳的为18-32aa,较佳的为24-32aa。
在另一优选例中,所述的核苷酸连接序列长度为1-300nt,较佳地1-100nt。
在另一优选例中,所述核苷酸连接序列不影响各元件的正常转录和翻译。
在另一优选例中,所述基因编辑酶为选自下组的编辑工具的酶:CRISPR酶、TALEN酶、ZFN酶、或其组合。
在另一优选例中,所述基因编辑酶来源于微生物;优选地来源于细菌。
在另一优选例中,所述基因编辑酶的来源选自下组:酿脓链球菌(Streptococcuspyogenes)、葡萄球菌(Staphylococcus aureus)、犬链球菌(Streptococcus canis)、或其组合。
在另一优选例中,所述基因编辑酶具有双链或单链DNA切割活性、或无切割活性。
在另一优选例中,所述基因编辑酶为具有单链DNA切割活性的CRISPR酶。
在另一优选例中,所述基因编辑酶包括野生型或突变型的基因编辑酶。
在另一优选例中,所述的基因编辑酶与所述的突变的基因编辑酶的同一性≥80%,较佳地≥90%;更佳地≥95%,更佳地,≥98%或99%。
在另一优选例中,所述突变的基因编辑酶由所述的野生型的基因编辑酶经过一个或多个,较佳地1-15个,较佳地1-10个,较佳的1-7个,更佳地2-5个,氨基酸取代、缺失;和/或经过1-5,较佳地1-4个,更佳地1-3个,最佳地1-2个氨基酸的添加形成的。
在另一优选例中,所述基因编辑酶选自下组:Cas9、Cas12、Cas13、Cms1、MAD7、或其组合。
在另一优选例中,所述基因编辑酶选自下组:nCas9、dCas9、nCas9NG、nCas9X、nCas12、nCas13、或其组合。
在另一优选例中,所述基因编辑酶的氨基酸序列如SEQ ID NO.:2所示。
在另一优选例中,所述基因编辑酶的编码序列选自下组:
(i)序列如SEQ ID NO.:3所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:3所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:3所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述基因编辑酶的编码序列如SEQ ID NO.:3所示。
在另一优选例中,所述腺嘌呤脱氨酶包括野生型和突变型。
在另一优选例中,所述腺嘌呤脱氨酶包括野生型和/或突变型的TadA。
在另一优选例中,所述腺嘌呤脱氨酶包括TadA。
在另一优选例中,所述腺嘌呤脱氨酶的突变型包括TadA7-10。
在另一优选例中,所述腺嘌呤脱氨酶为TadA与TadA7-10形成的融合蛋白。
在另一优选例中,所述腺嘌呤脱氨酶的编码序列选自下组:
(i)序列如SEQ ID NO.:5或19所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:5或19所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:5或19所示多核苷酸的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述腺嘌呤脱氨酶的编码序列如SEQ ID NO.5或19所示。
在另一优选例中,所述腺嘌呤脱氨酶的氨基酸序列如SEQ ID NO.:4所示。
在另一优选例中,所述胞嘧啶脱氨酶包括野生型和突变型。
在另一优选例中,所述胞嘧啶脱氨酶包括APOBEC。
在另一优选例中,所述APOBEC选自下组:APOBEC1(A1)、APOBEC2(A2)、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3E、APOBEC3F、APOBEC3H、APOBEC4(A4)、活化诱导脱氨酶(activation induced cytidine deaminase,AID)、或其组合。
在另一优选例中,所述胞嘧啶脱氨酶的突变型包括CBE2.0、CBE2.1、CBE2.2、CBE2.3、CBE2.4。
在另一优选例中,所述胞嘧啶脱氨酶的氨基酸序列如SEQ ID NO.:6、8-11中任一所示。
在另一优选例中,所述核酸构建物还可与一个或多个定位信号序列可操作的连接。
在另一优选例中,所述的定位信号选自下组:核定位信号、叶绿体定位信号、线粒体定位信号、或其组合。
在另一优选例中,所述的定位信号包括核定位信号,优选地,包括1-2个核定位信号。
在另一优选例中,所述核定位信号包括bpNLS、SV40。
在另一优选例中,所述核定位信号的核苷酸序列如SEQ ID NO.:12-14中任一所示。
在另一优选例中,所述核定位信号的氨基酸序列如SEQ ID NO.:15所示。
在另一优选例中,所述S3元件的核苷酸序列如SEQ ID NO.:16所示。
在另一优选例中,所述的核酸构建物还进一步可操作地与一个或多个式II所示的第二核酸构建物相连:
P2-Y1(II)
式中,
P2为第二启动子序列;
Y1为gRNA的编码序列;
并且,各“-”独立地为键或核苷酸连接序列。
在另一优选例中,当含有至少两个式II核酸构建物时,其gRNA序列可以互不相同。
在另一优选例中,所述式II核酸构建物位于式I核酸构建物的5’端或3’端或分布于其两端。
在另一优选例中,所述gRNA包括crRNA、tracrRNA、sgRNA。
在另一优选例中,所述第二启动子来源于选自下组的一种或多种植物:水稻、玉米、大豆、拟南芥、烟草或番茄。
在另一优选例中,所述第二启动子包括RNA聚合酶III依赖的启动子。
在另一优选例中,所述第二启动子为RNA聚合酶III依赖的启动子。
在另一优选例中,所述第二启动子选自下组:U6、U3、U6a、U6b、U6c、U6-1、U3b、U3d、U6-26、U6-29、H1、或其组合。
在另一优选例中,所述第二启动子包括U6启动子。
在另一优选例中,本发明的上述核苷酸元件是按阅读框(in-frame)连接的,从而表达氨基酸序列正确的融合蛋白。
在另一优选例中,所述的式I核酸构建物和式II核酸构建物还各自独立地具有终止子。
在另一优选例中,所述的式I核酸构建物和式II核酸构建物共用相同的终止子。
在另一优选例中,所述终止子包括适用于植物基因编辑的终止子。
在另一优选例中,所述终止子选自下组:NOS、Poly A、T-UBQ、rbcS、或其组合。
在另一优选例中,所述的构建物具有式IIIa或式IIIb结构:
P1-S1-L1-S2-S3-P2-Y1 (IIIa);
P2-Y1-P1-S1-L1-S2-S3 (IIIb);
式中,各元件的定义如上所述。
在另一优选例中,所述的核酸构建物还可操作地连接第一整合元件(I1)和第二整合元件(I2)。
在另一优选例中,所述第一整合元件包括5’同源臂序列。在另一优选例中,所述第二整合元件包括3’同源臂序列。
在另一优选例中,在所述的I1和I2元件之间,还含有额外***的一个或多个额外的表达盒。
在另一优选例中,所述的额外表达盒是独立于含有式I核酸构建物的表达盒和含有式II核酸构建物的表达盒的。
在另一优选例中,所述的额外表达盒表达选自下组的物质:标记基因。
在另一优选例中,所述标记基因包括抗性基因(如潮霉素抗性基因、除草剂抗性基因)、荧光基因、或其组合。
本发明第二方面提供了一种载体,所述载体含有本发明第一方面所述的核酸构建物。
在另一优选例中,所述载体为植物表达载体。
在另一优选例中,所述的载体为可转染或转化植物细胞的表达载体。
在另一优选例中,所述的载体为农杆菌Ti载体。
在另一优选例中,所述的构建物整合到所述载体的T-DNA区。
在另一优选例中,所述载体是环状的或线性的。
本发明第三方面提供了一种宿主细胞,所述细胞含有本发明第一方面所述的核酸构建物,或其基因组整合有一个或多个本发明第一方面所述的核酸构建物。
在另一优选例中,所述的细胞为植物细胞。
在另一优选例中,所述的植物选自下组:单子叶植物、双子叶植物、裸子植物、或其组合。
在另一优选例中,所述的植物选自下组:禾本科植物、豆科植物、十字花科植物、茄科、伞形科、或其组合。
在另一优选例中,所述的植物选自下组:拟南芥、小麦、大麦、燕麦、玉米、水稻、高粱、粟、大豆、花生、烟草、番茄、白菜、油菜、菠菜、生菜、黄瓜、茼蒿、空心菜、芹菜、油麦菜、或其组合。
在另一优选例中,所述的宿主细胞是用选自下组的方法将权利要求1所述的核酸构建物导入细胞的:农杆菌转化法、基因枪法、显微注射法、电击法、超声波法和聚乙二醇(PEG)介导法。
本发明第四方面提供了一种试剂组合,包括:
(i)第一核酸构建物,或含有所述第一核酸构建物的第一载体,所述第一核酸构建物具有从5’-3’的式I结构:
P1-S1-L1-S2-S3 (I)
其中,
P1为第一启动子序列,所述第一启动子包括延伸因子的启动子;
S1、S2各自独立地为一个或多个(a)基因编辑酶的编码序列、(b)腺嘌呤脱氨酶的编码序列和/或胞嘧啶脱氨酶的编码序列;
L1为无或连接肽的编码序列;
S3为无或尿嘧啶糖苷酶抑制剂UGI的编码序列;
并且,“-”为键或核苷酸连接序列;
(ii)第二核酸构建物,或含有所述第二核酸构建物的第二载体,所述第二核酸构建物具有从5’-3’的式(II)所示的结构:
P2-Y1 (II);
其中,P2为第二启动子;
Y1为gRNA的编码序列;
并且,“-”为键或核苷酸连接序列。
在另一优选例中,所述第一载体和所述第二载体为不同的载体。
在另一优选例中,所述第一核酸构建物和所述第二核酸构建物位于不同的载体上。
在另一优选例中,所述第一载体和所述第二载体为同一载体。
在另一优选例中,所述第一核酸构建物和所述第二核酸构建物位于同一载体上。
本发明第五方面提供了一种试剂盒,所述试剂盒含有本发明第四方面所述的试剂组合。
在另一优选例中,所述试剂盒还含有标签或说明书。
本发明第六方面提供了一种对植物进行基因编辑的方法,包括步骤:
(i)提供待编辑植物;和
(ii)将本发明第一方面所述的核酸构建物、本发明第二方面所述的载体或本发明第四方面所述的试剂组合导入所述待编辑植物的植物细胞,从而在所述植物细胞内进行基因编辑。
在另一优选例中,所述导入为通过农杆菌导入。
在另一优选例中,所述导入为通过基因枪导入。
在另一优选例中,所述的基因编辑为定点碱基替换(或突变)。
在另一优选例中,所述定点替换(或突变)包括将A突变为G。
在另一优选例中,所述定点替换(或突变)包括将C突变为T。
在另一优选例中,所述的植物包括任何可进行转化技术的高等植物类型,包括单子叶植物、双子叶植物和裸子植物。
在另一优选例中,所述的植物为双子叶植物。
在另一优选例中,所述的植物选自下组:禾本科植物、豆科植物、十字花科植物、茄科、伞形科、或其组合。
在另一优选例中,所述的植物选自下组:拟南芥、小麦、大麦、燕麦、玉米、水稻、高粱、粟、大豆、花生、烟草、番茄、白菜、油菜、菠菜、生菜、黄瓜、茼蒿、空心菜、芹菜、油麦菜、或其组合。
本发明第七方面提供了一种制备经基因编辑的植物细胞的方法,包括步骤:
将本发明第一方面所述的核酸构建物、本发明第二方面所述的载体或本发明第四方面所述的试剂组合转染植物细胞,使得所述植物细胞中的染色体发生定点替换(或突变),从而制得所述经基因编辑的植物细胞。
在另一优选例中,所述的转染采用农杆菌转化法或基因枪轰击法。
本发明第八方面提供了一种本发明第一方面所述的核酸构建物、本发明第二方面所述的载体、本发明第三方面所述的宿主细胞、本发明第四方面所述的试剂组合、本发明第五方面所述的试剂盒的用途,用于对植物进行基因编辑。
本发明第九方面提供了一种制备经基因编辑的植物的方法,包括步骤:
将本发明第七方面所述方法制备的所述经基因编辑的植物细胞再生为植物体,从而获得所述经基因编辑的植物。
本发明第十方面提供了一种经基因编辑的植物,所述的植物是用本发明第九方面所述的方法制备的。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了含有slEF1a的ABE单碱基编辑器的结构。
图2显示了不同启动子在番茄中单碱基编辑中的效率。
图3显示了利用不同启动子和不同的碱基编辑器在大豆中的单碱基编辑效率。
具体实施方式
本发明人经过广泛而深入地研究,首次意外地发现一种高效的EF启动子(如番茄EF启动子),将该启动子构建于ABE和CBE的单碱基编辑***中,用以驱动(a)基因编辑酶与(b)腺嘌呤脱氨酶和/或胞嘧啶脱氨酶共同构成的融合蛋白的表达,该启动子在植物中显著提高了编辑效率。在此基础上,本发明人完成了本发明。
术语
如本文所用,术语“同源臂”指打靶载体上待***的外源序列两侧的与基因组序列完全一致的侧翼序列,用于识别并发生重组的区域。
如本文所用,术语“植物启动子”指能够在植物细胞中启动核酸转录的核酸序列。该植物启动子可以是来源于植物、微生物(如细菌、病毒)或动物等,或者是人工合成或改造过的启动子。
如本文所用,术语“基因编辑”或“碱基突变”或“碱基编辑”指核苷酸序列的某一位置处发生碱基的替换(substitution)、***(insertion)和/或缺失(deletion)。本发明中所述“编辑”或“突变”优选为单碱基突变。
如本文所用,术语“碱基替换”指核苷酸序列的某一位置处的碱基突变为另一不同的碱基,比如A突变为G。
如本文所用,术语“A.T到G.C”指在双链核酸序列(尤其是基因组序列)中,某一位置上的A-T碱基对突变为或替换为G-C碱基对。
如本文所用,术语“C.G到T.A”指在双链核酸序列(尤其是基因组序列)中,某一位置上的C-G碱基对突变为或替换为T-A碱基对。
如本文所用,术语“基因编辑酶”指适用于CRISPR(规律成簇间隔短回文重复序列Clustered Regularly Interspaced Short Palindromic Repeats)、TALEN(转录激活因子样效应物核酸酶技术Tanscription Activator-like(TAL)effector nucleases)、ZFN(锌指核酸技术,Zinc finger nuclease)等编辑工具的核酸酶。优选地,所述基因编辑酶为CRISPR酶,又名Cas蛋白,其种类包括但并不限于:Cas9蛋白、Cas12蛋白、Cas13蛋白、Cas14蛋白、Csm1蛋白、FDK1蛋白。所述的Cas蛋白是指蛋白家族,可以根据其来源不同而具有不同的结构,如来源于酿脓链球菌(Streptococcus pyogenes)的SpCas9、来源于葡萄球菌(Staphylococcus aureus)的SaCas9;还可以根据结构特征(如结构域)进行下位分类,如Cas12家族包括Cas12a(又名Cpf1)、Cas12b、Cas12c、Cas12i等。所述的Cas蛋白可以具有双链或单链或无切割活性。本发明所述的Cas蛋白可以是野生型或其突变体,所述的突变体的突变类型包括氨基酸的替换、取代或缺失,所述的突变体可以改变也可以不改变Cas蛋白的酶切活性。优选地,本发明所述的Cas蛋白只具有单链切割活性或无切割活性,其为野生型Cas蛋白的一种突变体。优选地,本发明Cas蛋白为具有单链切割活性的Cas9、Cas12、Cas13或Cas14。在一优选实施方式中,本发明的Cas9蛋白包括SpCas9n(D10A)、nSpCas9NG、SaCas9n、ScCas9n、XCas9n,其中“n”表示nick,即只具有单链切割活性的Cas蛋白。突变已知Cas蛋白获得具有单链或无切割活性的Cas蛋白为本领域的常规技术手段。本领域技术人员所知,现有技术中已报到的多种具有核酸切割活性的Cas蛋白,该公知蛋白或其改造后的变体均可以实现本发明的功能,本文通过引用方式将其纳入保护范围。
如本文所用,术语“Cas蛋白的编码序列”指编码Cas蛋白的核苷酸序列。在***的多聚核苷酸序列被转录和翻译从而产生功能性Cas蛋白的情况下,技术人员会认识到,因为密码子的简并性,有大量多聚核苷酸序列可以编码相同的多肽。另外,技术人员也会认识到不同物种对于密码子具有一定的偏好性,可能会根据在不同物种中表达的需要,会对Cas蛋白的密码子进行优化,这些变异体都被术语“Cas蛋白的编码序列”所具体涵盖。此外,术语特定地包括了全长的、与Cas基因序列基本相同的序列,以及编码出保留Cas蛋白功能的蛋白质的序列。
如本文所用,所述的“gRNA”又称为guide RNA或导向RNA,并且具有本领域技术人员通常理解的含义。一般而言,导向RNA可以包含同向(direct)重复序列和导向序列(guidesequence),或者基本上由或由同向重复序列和导向序列(在内源性CRISPR***背景下也称为间隔序列(spacer))组成。gRNA在不同的CRISPR***中,依据其所依赖的Cas蛋白的不同,可以包括crRNA和tracrRNA,也可以只含有crRNA。crRNA和tracrRNA可以经过人工改造融合形成single guide RNA(sgRNA)。本发明所述的gRNA可以是天然的,也可以是经过人工改造或设计合成的。在某些情况下,导向序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列,通常具有17-23nt的序列长度。在某些实施方案中,当最佳比对时,导向序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。
如本文所用,术语“植物”包括全植株、植物器官(如叶、茎、根等)、种子和植物细胞以及它们的子代。可用于本发明方法的植物的种类没有特别限制,一般包括任何可进行基因编辑技术的植物类型,包括单子叶、双子叶植物和裸子植物、被子植物,主要包括木本植物。
如本文所用,术语“表达盒”是指含有待表达基因以及表达所需元件的序列组件的一段多聚核苷酸序列。表达所需的组件包括启动子和聚腺苷酸化信号序列。此外,本发明的表达盒还任选地含有其他序列,包括(但并不限于):增强子、分泌信号肽序列等。
在本发明中,核苷酸序列的描述是从5’至3’方向,除非特别注明。
如本文所用,“尿嘧啶糖苷酶抑制剂(uracil DNA glycosylase inhibitor,UGI)”能够抑制胞内的尿嘧啶DNA糖苷酶将U再催化回C。
EF启动子
EF启动子是指延伸因子的启动子,延伸因子(elongation factors,EF)是指在mRNA翻译时促进多肽链延伸的蛋白质因子。真核生物中延伸因子包括:EF1α、EF1β和EF2。原核生物中延伸因子包括EF-Tu、EF-Ts以及EF-G。EF1a是真核延伸因子1α,它是蛋白质生物合成的重要组成部分。EF1A通过GTP依赖性机制催化氨酰基tRNA与核糖体A位点的结合。EF1A占可溶性蛋白总量的3-10%,被认为是细胞质中最丰富的可溶性蛋白之一。
在一优选实施方式中,EF启动子包括,但并不限于:EF1a启动子、EF1β启动子、EF2启动子、EF-Tu、EF-Ts、EF-G。
在一优选实施方式中,本发明的启动子指来源于茄科植物(较佳地,来自番茄或类似植物)的EF1a启动子元件。
一种典型的本发明的启动子的序列如SEQ ID NO.:1所示。
应理解,该术语还包括来自其他不同茄科植物的与SEQ ID NO.:1所示启动子同源的启动子。此外,该术语还包括SEQ ID NO.:1所示启动子或其同源启动子的衍生启动子或活性片段,主要这些衍生启动子或活性片段保留了高效的基因编辑效率的功能,例如保留至少50%SEQ ID NO.:1所示启动子的特异启动功能(以可以被启动的外源基因的表达量进行表示)。
如本文所用,术语“茄科植物”包括番茄、马铃薯、茄子、辣椒、枸杞、烟草。
如本文所用,术语“启动子”或“启动子区(域)”是指一种准确有效起始基因转录功能的核酸序列,引导基因核酸序列转录为mRNA,其通常存在于目的基因编码序列的上游(5’端),一般地,启动子或启动子区域提供RNA聚合酶和正确起始转录所必需的其它因子的识别位点。
在本文中,所述启动子或启动子区(域)包括启动子的变体,启动子变体可以通过***或删除调控区域,进行随机或定点突变等来获得。
本发明还包括与本发明的优选启动子序列(SEQ ID NO.:1)具有50%或以上(优选60%以上,70%以上,80%以上,更优选90%以上,更优选95%以上,最优选98%以上,如99%)同源性的核酸,所述核酸也具有特异性提高植物基因编辑效率的功能。“同源性”是指按照位置相同的百分比,两条或多条核酸之间的相似水平(即序列相似性或同一性)。
应理解,尽管本发明的实例中提供了来源于茄科,比如番茄的启动子EF1a,但是来源于其它类似的植物(尤其是与番茄属于同一科)的、与本发明启动子具有一定同源性(保守性)的启动子,也包括在本发明的范围内,只要本领域技术人员在阅读了本申请后根据本申请提供的信息可以方便地从其它植物中分离得到该启动子。
如本文所用,“外源的”或“异源的”是指不同来源的两条或多条核酸或蛋白质序列之间的关系。例如,如果启动子与目的基因序列的组合通常不是天然存在的,则启动子对于该目的基因来说是外源的。特定序列对于其所***的细胞或生物体来说是“外源的”。
如本文所用,“顺式调控元件”是指对基因的转录起始和转录效率起调节作用的保守性碱基序列。
本发明的启动子可以被可操作地与外源基因连接,该外源基因相对于启动子而言可以是外源(异源)的。本发明所述的外源基因(也称为目的基因)没有特别的限制,可以为编码具有特定功能蛋白的基因,比如(a)基因编辑酶和(b)腺嘌呤脱氨酶和/或胞嘧啶脱氨酶。
所述外源基因的代表性例子包括(但不限于):抗性基因、筛选标记基因、表位标签、报告基因序列、核定位信号序列、转录激活结构域(例如,转录激活结构域(例如,VP64)、转录抑制结构域(例如,KRAB结构域或SID结构域)、核酸酶结构域(例如,Fok1),病毒衣壳蛋白基因,抗体基因;以及具有选自下列的活性的结构域:核苷酸脱氨酶,甲基化酶活性,去甲基化酶,转录激活活性,转录抑制活性,转录释放因子活性,组蛋白修饰活性,核酸酶活性,单链RNA切割活性,双链RNA切割活性,单链DNA切割活性,双链DNA切割活性和核酸结合活性。
所述的抗性基因选自下组:抗除草剂基因、抗病毒基因、耐寒基因、耐高温基因、抗旱基因、抗涝基因、或抗虫基因。所述的筛选标记基因选自下组:gus(β-葡萄糖苷酸酶)基因、hyg(潮霉素)基因、neo(新霉素)基因、或gfp(绿色荧光蛋白)基因。
本发明还提供了一种基因表达盒,所述表达盒从5’-3’依次具有下列元件:启动子、基因ORF序列、和终止子。优选地,所述启动子序列如SEQ ID NO.:1所示或与SEQ IDNO.:1所示序列的同源性≥90%,较佳地≥95%,更佳地≥98%。
本发明还提供了一种包括本发明的启动子和/或基因表达盒的重组载体。作为一种优选的方式,重组载体的启动子下游包含多克隆位点或至少一个酶切位点。当需要表达目的基因时,将目的基因连接入适合的多克隆位点或酶切位点内,从而将目的基因与启动子可操作地连接。作为另一种优选方式,所述的重组载体包括(从5’到3’方向):启动子、目的基因、和终止子。如果需要,所述的重组载体还可以包括选自下组的元件:3’多聚核苷酸化信号;非翻译核酸序列;转运和靶向核酸序列;抗性选择标记(二氢叶酸还原酶、新霉素抗性、潮霉素抗性以及绿色荧光蛋白等);增强子;或操作子。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的启动子和/或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
本发明的启动子、表达盒或载体,可以用于转化适当的宿主细胞,以使宿主表达蛋白质。宿主细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。本领域一般技术人员都清楚如何选择适当的载体和宿主细胞。用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。对于转化的植物细胞、组织或器官可以用常规方法再生成植株,从而获得转基因的植物。
作为本发明的一种优选方式,制备转基因植物的方法是:将携带启动子和目的基因(两者可操作地连接)的载体转入农杆菌,农杆菌再将含启动子和目的基因的载体片段整合到植物的染色体上。涉及的转基因受体植物例如是拟南芥、小麦、大麦、燕麦、玉米、水稻、高粱、粟、大豆、花生、烟草、番茄、白菜、油菜、菠菜、生菜、黄瓜、茼蒿、空心菜、芹菜、油麦菜等。在本发明的实例中,所述的重组载体是pCAMBIA1300载体,将本发明的启动子构建到该载体中,转化植株。
在一优选实施方式中,本发明克隆了EF启动子(如番茄SlEF1a启动子),并使用该启动子驱动Cas酶与脱氨酶的融合蛋白编码序列的表达,最终获得了一种对双子叶植物高效率单碱基替换和基因敲除的***。
腺嘌呤脱氨酶
如本文所用,术语“腺嘌呤脱氨酶”为催化腺嘌呤水解脱氨基生成次黄嘌呤和氨的酶。将腺嘌呤A转变为次黄嘌呤I,次黄嘌呤I可与胞嘧啶配对,在DNA水平被当成鸟嘌呤(G)进行读码与复制,导致A·T配对转换为G·C配对。TadA腺嘌呤脱氨酶,来源于大肠杆菌,经过人工改造目前已获的ecTadA突变体。TadA与ecTadA的二聚体为目前常用的腺嘌呤脱氨酶。
在本发明中,适用的TadA既包含野生型的形式也包含其特定的突变形式TadA7-10,也可包含野生型的形式和突变形式的组合。TadA7-10能够以DNA作为底物进行脱氨反应。
在本发明中,核酸构建物中腺嘌呤脱氨酶编码序列可以根据适用宿主的不同,而采用宿主偏好的方式进行密码子优化。
胞嘧啶脱氨酶
如本文所用,术语“胞嘧啶脱氨酶(APOBEC)”为能够催化细胞内胞嘧啶脱氨形成尿嘧啶的酶,将胞嘧啶C转变为尿嘧啶U,损伤DNA在重新复制过程中被聚合酶作用,尿嘧啶在DNA复制过程中会被识别成T,导致C·G配对转换为T·A配对。已发现的APOBECs家族成员有11个,包括APOBEC1(A1)、APOBEC2(A2)、APOBEC3A~H(3A、3B、3C、3D、3E、3F、3H)、APOBEC4(A4)以及活化诱导脱氨酶(activation induced cytidine deaminase,AID)。
在本发明中,适用的胞嘧啶脱氨酶既包含野生型的形式也包含其特定的突变形式(如CBE2.0、CBE2.1、CBE2.2、CBE2.3、CBE2.4),也可包含野生型的形式和突变形式的组合。突变形式的胞嘧啶脱氨酶能够以DNA作为底物进行脱氨反应。
在本发明中,核酸构建物中胞嘧啶脱氨酶编码序列可以根据适用宿主的不同,而采用宿主偏好的方式进行密码子优化。
在本发明的一个优选的实施方式中,优选的胞嘧啶脱氨酶为CBE2.0、CBE2.1、CBE2.2、CBE2.3、CBE2.4。
CBE2.0的氨基酸序列如SEQ ID NO.:6所示,其核苷酸序列如SEQ ID NO.:7所示。
CBE2.1的氨基酸序列如SEQ ID NO.:8所示。
CBE2.2的氨基酸序列如SEQ ID NO.:9所示。
CBE2.3的氨基酸序列如SEQ ID NO.:10所示。
CBE2.4的氨基酸序列如SEQ ID NO.:11所示。
本发明的构建物
本发明提供了一种核酸构建物,用于对植物进行基因编辑,所述的核酸构建物具有5’-3’的式I结构:
P1-S1-L1-S2-S3 (I);
式中,
P1、S1、L1、S2、S3分别为用于构成所述构建物的元件
,其定义如本发明第一方面所述;
并且,各“-”为键或核苷酸连接序列。
在一优选实施方式中,所述的核酸构建物还进一步可操作地与一个或多个式II所示的第二核酸构建物相连:
P2-Y1(II);
式中,P2、Y1的定义如本发明第一方面所述。
在一优选实施方式中,所述的核酸构建物还可操作地连接第一整合元件(I1)和第二整合元件(I2)。
其中,I1元件(或左侧整合元件)和I2元件(或右侧整合元件)可协同作用,从而将位于其间的元件(即从P1至Y1的核苷酸序列)整合到植物细胞的基因组中。
代表性的I1和I2是来自于农杆菌的Ti元件。当然,其他可起到类似整合作用的元件也可用于本发明。
本发明的构建物中所用的各种元件或者是本领域中已知的,或者可用本领域技术人员已知的方法制备。例如,可通过常规方法,如PCR方法、全人工化学合成法、酶切方法获得相应的元件,然后通过熟知的DNA连接技术连接在一起,就形成了本发明的构建物。
将本发明的构建物***外源载体(尤其是适合转基因植物操作的载体),就构成了本发明的载体。
将本发明的载体转化植物细胞从而介导本发明的载体对植物细胞染色体进行整合,并在植物体内表达,制得经基因编辑的植物细胞。
将本发明的经基因编辑的植物细胞再生为植物体,从而获得经基因编辑的植物。
将本发明构建好的上述核酸构建物,通过常规的植物重组技术(例如农杆菌转让技术),可以导入植物细胞,从而获得携带所述核酸构建物(或带有所述核酸构建物的载体)的植物细胞,或获得基因组中整合有所述核酸构建物的植物细胞。
本发明中整合有所述核酸构建物的植物个体,在其子代可通过常规筛选或采用本领域已知的其他手段进行分离或去除,从而制得经基因编辑且不含有核酸构建物的植物体。
具体地,本发明是将一种特定的EF启动子,如番茄EF1a驱动基因编辑酶(如Cas9)与脱氨酶融合蛋白编码序列的表达,从而提高基因编辑效率。
载体构建
该载体的主要特征是将特定的EF启动子(如番茄EF1a)、脱氨酶和Cas融合蛋白的编码序列,任选地还包括核定位信号、UGI编码序列连接在一起,从而形成本发明的特定的核酸构建物。当该核酸构建物在细胞质中表达后,该核酸构建物所编码的融合蛋白可以非常高效地被转移至细胞核内,并由式II构建物所编码的guide RNA引导至基因组中的靶点位置,从而在靶点位置进行A.T到G.C或C.G到T.A的碱基替换,并基本上避免或消除了发生***/缺失的风险,并且可显著提高基因编辑的效率。
由于腺嘌呤脱氨基酶将A突变为G,胞嘧啶脱氨基酶将C突变为T并不需要Cas蛋白的DNA双链切割活性。因此,在本发明中Cas蛋白是无切割活性或具有单链切割活性的突变的Cas蛋白。在一优选实施方式中,本发明的Cas蛋白可以是nCas9,其氨基酸序列如SEQ IDNO.:2所示。一般的,为了增加融合蛋白的活性,蛋白间一般通过一些柔性短肽连接,即Linker(连接肽序列)。优选的,该Linker可以选用XTEN,其编码序列如SEQ ID NO.:17所示,其氨基酸序列如SEQ ID NO.:18所示。
选择适用于植物细胞的guide RNA的表达框,并将其与上述融合蛋白的开放表达框(ORF)构建在同一载体。
本发明中,载体可以是例如质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的,在本领域中众多描述。优选地,本发明中的表达载体是质粒。表达载体可包含启动子、翻译起始的核糖体结合位点、聚腺苷酸化位点、转录终止子、增强子等。表达载体中也可以含有一个或多个可选择标记基因以便用于选择包含载体的宿主细胞。这种可选择的标记包括编码二氢叶酸还原酶的基因,或赋予新霉素耐受性的基因,赋予对四环素或氨苄青霉素耐受性的基因等。
本发明的核酸构建物可通过多种方法***载体中,例如通过用适当的限制性核酸内切酶消化***物和载体后进行连接。多种克隆技术在本领域中是已知的,这些均在本领域技术人员的知识范围内。
本发明中适用的载体包括可从商业渠道获得的质粒,例如但不限于:pBR322(ATCC37017),pCAMBIA1300,pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden),GEM1(Promega Biotec,Madison,WI,USA)pQE70,pQE60,pQE-9(Qiagen),pD10,psiX174pBluescript II KS,pNH8A,pNH16a,pNH18A,pNH46A(Stratagene),ptrc99a,pKK223-3,pKK233-3,pDR540,pRIT5(Pharmacia),pKK232-8,pCM7,pSV2CAT,pOG44,pXT1,pSG(Stratagene),pSVK3,pBPV,pMSG,和pSVL(Pharmacia)等。
遗传转化
在本发明中,对于将本发明的式I构建物导入细胞或整合到基因组的方法,没有特别限制。可以用常规的方法进行,例如将式I构建物或相应的载体通过合适的方法导入到植物细胞中。代表性的导入方法包括但并不限于:农杆菌转染法、基因枪法、显微注射法、电击法、超声波法、和聚乙二醇(PEG)介导法等。
在本发明中,对于受体植物没有特别限制,其中包括各种不同的农作物植物(如禾本科植物)、林业植物、园艺植物(如花卉植物)等。代表性的例子包括但不限于:水稻、大豆、番茄、玉米、烟草、小麦、高粱、马铃薯等。
上述DNA载体或片段导入植物细胞后,使转化的植物细胞中的DNA表达该融合蛋白和gRNA。融合腺嘌呤脱氨基酶和/或胞嘧啶脱氨酶的基因编辑酶(如Cas9核酸酶)在相应gRNA的引导下,将靶点位置的A突变为G(进而使得互补链的T突变为C)或将靶点位置的C突变为T(进而使得互补链的G突变为A)。
对于用本发明方法进行植物基因组定点替换后的植物细胞或组织或器官,可以用常规方法再生获得相应的经基因编辑的植株。例如,通过组织培养,再生获得碱基替换后的植株。
应用
本发明可以用于植物基因工程领域,用于植物研究和育种,尤其是具有经济价值的农作物、林业作物或园艺植物的遗传改良。
本发明的主要优点包括:
(1)本发明首次将特定的启动子(如Ef1a启动子)与基因编辑酶(如Cas9核酸酶)、腺嘌呤脱氨酶和/或胞嘧啶脱氨酶,任选地还包括核定位信号、UGI的编码序列连接在一起,从而形成本发明的特定的核酸构建物,本发明的核酸构建物在植物中成功实现了gRNA引导的碱基定点突变(如A突变为G),并且突变效率非常高(可高达≥70%或更高)。
(2)本发明的特定的核酸构建物可以编辑一些其他启动子不起作用的基因位点,破除基因编辑受基因型限制的障碍。
(3)本发明的特定的核酸构建物可编辑一些其他启动子不起作用的植物,如大豆,有效扩大了基因编辑***的使用范围,破除物种障碍。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明中所涉及的实验材料和试剂如无特殊说明均可从市售渠道获得。
实施例1不同启动子在番茄中的单碱基编辑效率
1、靶标选择
选择番茄中影响果实发育的Solyc05g012020作为靶标基因,选择6个靶位点设计sgRNA,所设计的6个sgRNA的序列如下:sgRNA1:TACTGGAGTTGTACCTGGA(SEQ ID NO.:20),sgRNA2:GGAACAGCTTGAACGTCAAT(SEQ ID NO.:21),sgRNA3:GAACAGCCTTCTCATCATGA(SEQ IDNO.:22),sgRNA4:GGTGAGGATTTGGGACAATT(SEQ ID NO.:23),sgRNA5:CTGTGAATCTGATGAAGTTT(SEQ ID NO.:24),sgRNA6:GAAAAGTAATAACAAAGGGC(SEQ ID NO.:25)。
2、载体构建
通过同源重组技术获得ABE单碱基编辑器的表达盒(参见图1),所述腺嘌呤脱氨酶ABE7.10的核苷酸序列如SEQ ID NO.:5或19所示,所述SlEF1a启动子的核苷酸序列如SEQID NO.:1所示,具体操作如下:
A)以番茄基因组DNA为模版,用正/反向引物pSlEF1a-F/pSlEF1a-R对目标片段进行扩增,获得PCR产物(长度约1583bp,引物退火温度为58)。
Figure BDA0002504566540000191
PCR反应条件为:95℃预变性5分钟,98℃变性30秒,58℃退火30秒,72℃延伸45s,35个循环,72℃后延伸5分钟
B)用限制内切酶Sbf1和SalI酶切回收载体骨架
proAtU6-gRNA-pro35S-ABE7.10-nspCas9
C)通过同源重组将A获得PCR产物连入B获得的骨架载体中,获得单碱基编辑载体proAtU6-gRNA-proSlEF1a-ABE7.10-nspCas9
Figure BDA0002504566540000201
PCR反应条件为:50℃30min
D)转化大肠杆菌,挑单克隆测序验证片段成功连入载体。
以同样方法构建含有35S、UBI、AtRPS5A、SlRPS5A1、SlRPS5A2、SlTCTP启动子的单碱基编辑载体。
3、遗传转化
(A)上述构建质粒直接转化农杆菌EHA105:
(1)农杆菌感受态细胞中加入质粒DNA,之后冰浴30min,放入液氮中5min,然后立即放入37℃水浴锅中水浴5min,冰上放置5min
(2)取出离心管,加入700ul YEP培养基,振荡培养2~4hr。
(3)取出菌液与含相应抗生素的YEP培养基平板上涂板,在培养箱中倒置培养,2天左右菌落可见。
(B)番茄转基因
(1)取7-10d苗龄的番茄无菌幼苗(子叶完全展开,第一真叶微露),将子叶剪成5mm见方的叶片(切去叶片尖端和少部分基部,留取中间部分),正面朝上放置在预培养培养基中,25℃暗培养2d。
(2)将-80℃保存的菌液在固体YEB培养基上划线,28℃暗培养2d。挑取单菌落加入5ml液体YEB培养基,28℃,200rpm,培养1d。取2ml菌液加入50ml新鲜的YEB培养基,28℃,200rpm。4℃,5000rpm离心10min,用侵染缓冲液重悬菌体,将OD600调至0.6-0.8左右。
(3)将预培养2d的子叶在菌液中侵染5-10min,在滤纸皿上吸干多余菌液后,正面朝上放置于共培养培养基(也可用不带菌的侵染液浸湿的滤纸)上,25℃暗培养2d。
(4)将共培养2d的子叶转移至除菌培养基中,25℃培养7d,前2-3d暗培养,后4-5d光照培养。共培养7d后,将子叶转移至筛选培养基中,培养30-45d。每15d继代一次。
(5)在除菌结束后进行标记基因的检测(以GUS为例),取数片除菌7d后的子叶进行GUS染色,根据染色面积大小调整侵染时间。(不用每批都进行,定期进行以检查菌的活性)。
(6)检测农杆菌对子叶的伤害,取除菌7d后的子叶若干,使其继续在除菌培养基中生长30d左右,每15天继代一次,观察子叶分化率,判断菌液对子叶的伤害程度,调整侵染时间。
(7)待分化出的幼菌长至约2cm时,将幼苗切下,转移至生根培养基中,培养至根长出
(8)将分化出的健壮幼苗转移至含抗生素的生根培养基中生根培养一周,室温练苗2-3天后,温室基质栽培。
(9)基因编辑检测。取每株植物的叶片,提取基因组DNA,在gRNA的靶向位点两侧设计引物。扩增得到的片段进行Sanger测序,确定每株植物的基因型。
4、实验结果
slEF1a启动子在单碱基编辑中最高达到70%编辑效率,相比其他启动子提高2-20倍(参见图2)。
5、实验结论
slEF1a启动子可以高效驱动脱氨酶与Cas9的融合蛋白的表达,有效扩大单碱基编辑工具的适用范围,对植物性状改良、品种培育具有重要意义。
实施例2不同启动子在大豆中的单碱基编辑效率
选择大豆中的GmELF3a和GmALS1基因,选择不同的启动子以及不同的碱基编辑器考察不同启动子在大豆中的单碱基编辑效率,所使用的gRNA如下表所示:
Figure BDA0002504566540000211
首选,按照实施例1的方式,考察SlEF1a启动子(pSlEF1a)、CaMV35S启动子(35S)以及AA6启动子(pAA6,参考文献:CN101370939A)在和ABE7.10(SEQ ID NO.:5或19)以及Cas9配合使用时的编辑效率;如图3所示,所述“A to G gRNA1”即为利用不同启动子与上述腺嘌呤脱氨酶配合使用时的结果,在大豆中,利用SlEF1a启动子所产生的编辑效率要远高于CaMV35S启动子以及AA6启动子。
另外,采用上述方式,将上述腺嘌呤脱氨酶替换为胞嘧啶脱氨酶,所述胞嘧啶脱氨酶的氨基酸序列如SEQ ID NO.:6、8-11所示,本实施例优选SEQ ID NO.:6所示的胞嘧啶脱氨酶,考察不同的启动子在与胞嘧啶脱氨酶和Cas9配合使用时的编辑效率;如图3所示,所述“C to T gRNA2”即为利用不同启动子与上述胞嘧啶脱氨酶配合使用时的结果,在大豆中,利用SlEF1a启动子所产生的编辑效率要远高于CaMV35S启动子以及AA6启动子。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 山东舜丰生物科技有限公司
<120> 一种核酸表达的方法
<130> P2020-0390
<160> 27
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1583
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
gattagtttg tcaaatagta gagttcattt aaaattcttc agccatatag ttctattttt 60
aagctagtcg actttttttt tcttactgaa aattaatatt tttttctttt tgaaatacta 120
atacatctaa atttaacaat tgccaaagtg atttttaatt agcttgctgg ctaatcacaa 180
taaaaattac tctcctttac tatataagta aatttttatt gctatatttg ttattattat 240
tattattatt aatatttatt ttctacaaat ttaataatat tttattttat atcattttaa 300
aaagataagt aatgaaatat taagaattcg tttataattc ttttgcaggt gggtttctat 360
ttgtaagcta atctttttca gttatccttt ttttaaaatc tttattatta ttatagctat 420
atcttttatc ttttaaaatt aacattatct attaaagata atttcaataa aagagtaaaa 480
attaatttag agttctactg tcttcaaatt tctattttaa aaaatacttt taaaacttga 540
tgtatttttt acgtggtttt tcactatgac ttaatttctg ttttattata atatgtataa 600
atataaaaat agattttcca taacatatta taaaaaatgt aaggggcatt tacgtaaata 660
gatagactta aaagaggcac cgagtgaacc ctaattctca tcgttgagac tataaaatgc 720
ccattatccc attcgcacag tctcttcatt acttttgctg ttatttctcc tcagctgtgc 780
cgcatatcgc ctaatttttc ttctctaagg tttcatcatc ttcaccaatt tctttaatct 840
cgattcaatt ttttatgttt gatctgttat tgttctgtca ctacatgtgt ttttcagttg 900
ttttactaga tgattttcac tgtcttcttg ttagatcata catatattga aaatgttttg 960
gattgacttt tttgtattgt gaatatctgt tattgtttga ttgttgttca gtatttacac 1020
acccgatctg tgttatgagc ttggtcataa ctatttctct gtatgtaaat acagatctgt 1080
taatgtttgt aatcaatttt tcatatgcac tgttgatatt gttctctctc ctgtcctgtt 1140
atatgttgat atgattcggt ttttgtataa cttgaactaa acactagtcc taaatgtttt 1200
ttttactatt taagatttat ataatatgga tagatttttt gagttcctag tctctgaaga 1260
ggttaagctt gctgtagttg tttaccagtt gaggtgcaat actaaaaatc aattcaatta 1320
ctgatatttt ttgctgttta ggtttttgac aaagtacttt aatttgcttt attgaactaa 1380
aaacgtagtc ctgaattcat tgcaagtgtg aaagctatag ttcattgttt ttgttgcaat 1440
tcttgaaaaa ttaattggtc aagctataat ggattttact ttttctgttt taatattgaa 1500
tttgctgaat ttatgaatgg gttgcatggt ttttgaaata tgttgttgtg tgttgtgtaa 1560
atgcagtttc ttagtgtctc aag 1583
<210> 2
<211> 1368
<212> PRT
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 3
<211> 4101
<212> DNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 3
gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga c 4101
<210> 4
<211> 364
<212> PRT
<213> 人工序列(artificial sequence)
<400> 4
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1 5 10 15
Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val
20 25 30
Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile
35 40 45
Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
50 55 60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65 70 75 80
Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
85 90 95
Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala
100 105 110
Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg
115 120 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
130 135 140
Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys
145 150 155 160
Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly
165 170 175
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly
180 185 190
Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp
195 200 205
Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu
210 215 220
Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu
225 230 235 240
Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu
245 250 255
Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu
260 265 270
Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala
275 280 285
Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg
290 295 300
Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His Tyr
305 310 315 320
Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp
325 330 335
Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln Val
340 345 350
Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp
355 360
<210> 5
<211> 1092
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
tctgaagtcg agtttagcca cgagtattgg atgaggcacg cactgaccct ggcaaagcga 60
gcatgggatg aaagagaagt ccccgtgggc gccgtgctgg tgcacaacaa tagagtgatc 120
ggagagggat ggaacaggcc aatcggccgc cacgacccta ccgcacacgc agagatcatg 180
gcactgaggc agggaggcct ggtcatgcag aattaccgcc tgatcgatgc caccctgtat 240
gtgacactgg agccatgcgt gatgtgcgca ggagcaatga tccacagcag gatcggaaga 300
gtggtgttcg gagcacggga cgccaagacc ggcgcagcag gctccctgat ggatgtgctg 360
caccaccccg gcatgaacca ccgggtggag atcacagagg gaatcctggc agacgagtgc 420
gccgccctgc tgagcgattt ctttagaatg cggagacagg agatcaaggc ccagaagaag 480
gcacagagct ccaccgactc tggaggatct agcggaggtt cctctggaag cgagacacca 540
ggcacaagcg agtccgccac accagagagc tccggcggct cctccggagg ctcctctgag 600
gtggagtttt cccacgagta ctggatgaga catgccctga ccctggccaa gagggcacgc 660
gatgagaggg aggtgcctgt gggagccgtg ctggtgctga acaatagagt gatcggcgag 720
ggctggaaca gagccatcgg cctgcacgac ccaacagccc atgccgaaat tatggccctg 780
agacagggcg gcctggtcat gcagaactac agactgattg acgccaccct gtacgtgaca 840
ttcgagcctt gcgtgatgtg cgccggcgcc atgatccact ctaggatcgg ccgcgtggtg 900
tttggcgtga ggaacgcaaa aaccggcgcc gcaggctccc tgatggacgt gctgcactac 960
cccggcatga atcaccgcgt cgaaattacc gagggaatcc tggcagatga atgtgccgcc 1020
ctgctgtgct atttctttcg gatgcctaga caggtgttca atgctcagaa gaaggcccag 1080
agctccaccg ac 1092
<210> 6
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 6
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His Lys
35 40 45
Ile Trp Arg His Ser Ser Lys Asn Thr Thr Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Thr Ser
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Lys Ala Ile Thr Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu Val
100 105 110
Ile Tyr Val Ala Arg Leu Tyr His His Met Asp Gln Gln Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Ala Pro Glu Tyr Asp Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro
145 150 155 160
Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys Leu
165 170 175
Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 7
<211> 684
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
agcagtgaaa ccggaccagt ggcagtggac ccaaccctga ggagacggat tgagccccat 60
gaatttgaag tgttctttga cccaagggag ctgaggaagg agacatgcct gctgtacgag 120
atcaagtggg gcacaagcca caagatctgg cgccacagct ccaagaacac cacaaagcac 180
gtggaagtga atttcatcga gaagtttacc tccgagcggc acttctgccc ctctaccagc 240
tgttccatca catggtttct gtcttggagc ccttgcggcg agtgttccaa ggccatcacc 300
gagttcctgt ctcagcaccc taacgtgacc ctggtcatct acgtggcccg gctgtatcac 360
cacatggacc agcagaacag gcagggcctg cgcgatctgg tgaattctgg cgtgaccatc 420
cagatcatga cagccccaga gtacgactat tgctggcgga acttcgtgaa ttatccacct 480
ggcaaggagg cacactggcc aagataccca cccctgtgga tgaagctgta tgcactggag 540
ctgcacgcag gaatcctggg cctgcctcca tgtctgaata tcctgcggag aaagcagccc 600
cagctgacat ttttcaccat tgctctgcag tcttgtcact atcagcggct gcctcctcat 660
attctgtggg ctacaggcct taaa 684
<210> 8
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 8
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Thr Ser His Lys
35 40 45
Ile Trp Arg Asn Ser Gly Lys Asn Thr Thr Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Ser Glu Arg His Phe Cys Pro Ser Ile Ser
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys Ser
85 90 95
Lys Ala Ile Arg Glu Phe Leu Ser Gln His Pro Asn Val Thr Leu Val
100 105 110
Ile Tyr Val Ala Arg Leu Phe Gln His Met Asp Gln Gln Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Ala Ser Glu Tyr Asp His Cys Trp Arg Asn Phe Val Asn Tyr Pro Pro
145 150 155 160
Gly Lys Glu Ala His Trp Pro Arg Tyr Pro Pro Leu Trp Met Lys Leu
165 170 175
Tyr Ala Leu Glu Leu His Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 9
<211> 150
<212> PRT
<213> 人工序列(artificial sequence)
<400> 9
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro Glu Phe Phe Asn Arg Asn Tyr Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Tyr Leu Leu Tyr Glu Ile Lys Trp Gly Lys Glu Ser Lys
35 40 45
Ile Trp Arg His Thr Ser Asn Asn Arg Thr Gln His Ala Glu Val Asn
50 55 60
Phe Leu Glu Asn Phe Phe Asn Glu Leu Tyr Phe Asn Pro Ser Thr His
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Lys Ala Ile Val Glu Phe Leu Lys Glu His Pro Asn Val Asn Leu Glu
100 105 110
Ile Tyr Val Ala Arg Leu Tyr Leu Cys Glu Asp Glu Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Arg Ile Met Asn
130 135 140
Leu Pro Asp Tyr Asn Tyr
145 150
<210> 10
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 10
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro Phe Tyr Phe Gln Phe Asn Asn Asp Pro Arg Ala Cys Arg
20 25 30
Arg Lys Thr Tyr Leu Cys Tyr Glu Leu Lys Gln Asp Gly Ser Thr Trp
35 40 45
Val Trp Lys Arg Thr Leu His Asn Lys Gly Arg His Ala Glu Ile Cys
50 55 60
Phe Leu Glu Lys Ile Ser Ser Leu Glu Lys Leu Asp Pro Ala Gln His
65 70 75 80
Tyr Arg Ile Thr Trp Tyr Met Ser Trp Ser Pro Cys Ser Asn Cys Ala
85 90 95
Gln Lys Ile Val Asp Phe Leu Lys Glu His Pro His Val Asn Leu Arg
100 105 110
Ile Tyr Val Ala Arg Leu Tyr Tyr His Glu Glu Glu Arg Tyr Gln Glu
115 120 125
Gly Leu Arg Asn Leu Arg Arg Ser Gly Val Ser Ile Arg Val Met Asp
130 135 140
Leu Pro Asp Phe Glu His Cys Trp Glu Thr Phe Val Asp Asn Gly Gly
145 150 155 160
Gly Pro Phe Gln Pro Trp Pro Gly Leu Glu Glu Leu Asn Ser Lys Gln
165 170 175
Leu Ser Arg Arg Leu Gln Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 11
<211> 228
<212> PRT
<213> 人工序列(artificial sequence)
<400> 11
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro Phe His Phe Gln Phe Asn Asn Asp Pro Arg Ala Tyr Arg
20 25 30
Arg Lys Thr Tyr Leu Cys Tyr Glu Leu Lys Gln Asp Gly Ser Thr Trp
35 40 45
Val Leu Asp Arg Thr Leu Arg Asn Lys Gly Arg His Ala Glu Ile Cys
50 55 60
Phe Leu Asp Lys Ile Asn Ser Trp Glu Arg Leu Asp Pro Ala Gln His
65 70 75 80
Tyr Arg Val Thr Trp Tyr Met Ser Trp Ser Pro Cys Ser Asn Cys Ala
85 90 95
Gln Gln Val Val Asp Phe Leu Lys Glu His Pro His Val Asn Leu Arg
100 105 110
Ile Phe Ala Ala Arg Leu Tyr Tyr His Glu Gln Arg Arg Tyr Gln Glu
115 120 125
Gly Leu Arg Ser Leu Arg Gly Ser Gly Val Pro Val Ala Val Met Thr
130 135 140
Leu Pro Asp Phe Glu His Cys Trp Glu Thr Phe Val Asp His Gly Gly
145 150 155 160
Arg Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu Leu Asn Ser Arg Ser
165 170 175
Leu Ser Arg Arg Leu Gln Ala Gly Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 12
<211> 57
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtc 57
<210> 13
<211> 51
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
aaaagaaccg ccgacggcag cgaattcgag cccaagaaga agaggaaagt c 51
<210> 14
<211> 66
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
gcttctccaa agcgtccgcg tgaccgtcac gatggagaat tgggtggacg caaacgtgca 60
agaggt 66
<210> 15
<211> 22
<212> PRT
<213> 人工序列(artificial sequence)
<400> 15
Ala Ser Pro Lys Arg Pro Arg Asp Arg His Asp Gly Glu Leu Gly Gly
1 5 10 15
Arg Lys Arg Ala Arg Gly
20
<210> 16
<211> 579
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
agcggcggga gcggcgggag cggcgggagc ggggggagca ctaatctgag cgacatcatt 60
gagaaggaga ctgggaaaca gctggtcatt caggagtcca tcctgatgct gcctgaggag 120
gtggaggaag tgatcggcaa caagccagag tctgacatcc tggtgcacac cgcctacgac 180
gagtccacag atgagaatgt gatgctgctg acctctgacg cccccgagta taagccttgg 240
gccctggtca tccaggattc taacggcgag aataagatca agatgctgag cggaggctcc 300
ggaggatctg gaggcagcac caacctgtct gacatcatcg agaaggagac aggcaagcag 360
ctggtcatcc aggagagcat cctgatgctg cccgaagaag tcgaagaagt gatcggaaac 420
aagcctgaga gcgatatcct ggtccatacc gcctacgacg agagtaccga cgaaaatgtg 480
atgctgctga catccgacgc cccagagtat aagccctggg ctctggtcat ccaggattcc 540
aacggagaga acaaaatcaa aatgctgtct ggcggctca 579
<210> 17
<211> 96
<212> DNA
<213> 人工序列(artificial sequence)
<400> 17
tctggagggt cctccggcgg atcgtccggc agcgagacgc caggcacctc cgagagcgct 60
acgcctgaat cctccggggg atcttcagga ggatca 96
<210> 18
<211> 32
<212> PRT
<213> 人工序列(artificial sequence)
<400> 18
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 19
<211> 1092
<212> DNA
<213> 人工序列(artificial sequence)
<400> 19
tccgaagtcg agttttccca tgagtactgg atgagacacg cattgactct cgcaaagagg 60
gcttgggatg aacgcgaggt gcccgtgggg gcagtactcg tgcataacaa tcgcgtaatc 120
ggcgaaggtt ggaataggcc gatcggacgc cacgacccca ctgcacatgc ggaaatcatg 180
gcccttcgac agggagggct tgtgatgcag aattatcgac ttatcgatgc gacgctgtac 240
gtcacgcttg aaccttgcgt aatgtgcgcg ggagctatga ttcactcccg cattggacga 300
gttgtattcg gtgcccgcga cgccaagacg ggtgccgcag gttcactgat ggacgtgctg 360
catcacccag gcatgaacca ccgggtagaa atcacagaag gcatattggc ggacgaatgt 420
gcggcgctgt tgtccgactt ttttcgcatg cggaggcagg agatcaaggc ccagaaaaaa 480
gcacaatcct ctactgactc tggagggtcc tccggcggat cgtccggcag cgagacgcca 540
ggcacctccg agagcgctac gcctgaatcc tccgggggat cttcaggagg atcatccgaa 600
gtcgagtttt cccatgagta ctggatgaga cacgcattga ctctcgcaaa gagggctcgg 660
gatgaacgcg aggtgcccgt gggggcagta ctcgtgctta acaatcgcgt aatcggcgaa 720
ggttggaata gggcgatcgg actccacgac cccactgcac atgcggaaat catggccctt 780
cgacagggag ggcttgtgat gcagaattat cgacttatcg atgcgacgct gtacgtcacg 840
tttgaacctt gcgtaatgtg cgcgggagct atgattcact cccgcattgg acgagttgta 900
ttcggtgtcc gcaacgccaa gacgggtgcc gcaggttcac tgatggacgt gctgcattac 960
ccaggcatga accaccgggt agaaatcaca gaaggcatat tggcggacga atgtgcggcg 1020
ctgttgtgct acttttttcg catgccgagg caggtgttca atgcccagaa aaaagcacaa 1080
tcctctactg ac 1092
<210> 20
<211> 19
<212> DNA
<213> 人工序列(artificial sequence)
<400> 20
tactggagtt gtacctgga 19
<210> 21
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 21
ggaacagctt gaacgtcaat 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 22
gaacagcctt ctcatcatga 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 23
ggtgaggatt tgggacaatt 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 24
ctgtgaatct gatgaagttt 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 25
gaaaagtaat aacaaagggc 20
<210> 26
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 26
aaatatccac accttactaa gg 22
<210> 27
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 27
aggtcccccg ccggatgatc gg 22

Claims (10)

1.一种核酸构建物,其特征在于,所述核酸构建物具有5’-3’(5’至3’)的式I结构:
P1-S1-L1-S2-S3(I);
式中,
P1、S1、L1、S2、S3分别为用于构成所述构建物的元件;
P1为第一启动子序列,所述第一启动子包括延伸因子的启动子;
S1、S2各自独立地为一个或多个(a)基因编辑酶的编码序列、(b)腺嘌呤脱氨酶的编码序列和/或胞嘧啶脱氨酶的编码序列;
L1为无或连接肽的编码序列;
S3为无或尿嘧啶糖苷酶抑制剂UGI的编码序列;
并且,各“-”独立地为键或核苷酸连接序列。
2.如权利要求1所述的核酸构建物,其特征在于,所述的S1为腺嘌呤脱氨酶的编码序列和/或胞嘧啶脱氨酶的编码序列,所述S2为基因编辑酶的编码序列。
3.一种载体,其特征在于,所述载体含有权利要求1所述的核酸构建物。
4.一种宿主细胞,其特征在于,所述细胞含有权利要求1所述的核酸构建物,或其基因组整合有一个或多个权利要求1所述的核酸构建物。
5.一种试剂组合,其特征在于,包括:
(i)第一核酸构建物,或含有所述第一核酸构建物的第一载体,所述第一核酸构建物具有从5’-3’的式I结构:
P1-S1-L1-S2-S3 (I)
其中,
P1为第一启动子序列,所述第一启动子包括延伸因子的启动子;
S1、S2各自独立地为一个或多个(a)基因编辑酶的编码序列、(b)腺嘌呤脱氨酶的编码序列和/或胞嘧啶脱氨酶的编码序列;
L1为无或连接肽的编码序列;
S3为无或尿嘧啶糖苷酶抑制剂UGI的编码序列;
并且,“-”为键或核苷酸连接序列;
(ii)第二核酸构建物,或含有所述第二核酸构建物的第二载体,所述第二核酸构建物具有从5’-3’的式(II)所示的结构:
P2-Y1 (II);
其中,P2为第二启动子;
Y1为gRNA的编码序列;
并且,“-”为键或核苷酸连接序列。
6.一种试剂盒,其特征在于,所述试剂盒含有权利要求5所述的试剂组合。
7.一种对植物进行基因编辑的方法,其特征在于,包括步骤:
(i)提供待编辑植物;和
(ii)将权利要求1所述的核酸构建物、权利要求3所述的载体或权利要求5所述的试剂组合导入所述待编辑植物的植物细胞,从而在所述植物细胞内进行基因编辑。
8.一种制备经基因编辑的植物细胞的方法,其特征在于,包括步骤:
将权利要求1所述的核酸构建物、权利要求3所述的载体或权利要求5所述的试剂组合转染植物细胞,使得所述植物细胞中的染色体发生定点替换(或突变),从而制得所述经基因编辑的植物细胞。
9.一种权利要求1所述的核酸构建物、权利要求3所述的载体、权利要求4所述的宿主细胞、权利要求5所述的试剂组合、权利要求6所述的试剂盒的用途,其特征在于,用于对植物进行基因编辑。
10.一种制备经基因编辑的植物的方法,其特征在于,包括步骤:
将权利要求8所述方法制备的所述经基因编辑的植物细胞再生为植物体,从而获得所述经基因编辑的植物。
CN202010442805.7A 2020-05-22 2020-05-22 一种核酸表达的方法 Pending CN113774082A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010442805.7A CN113774082A (zh) 2020-05-22 2020-05-22 一种核酸表达的方法
CN202180003994.0A CN113994007B (zh) 2020-05-22 2021-05-21 一种核酸表达的方法
PCT/CN2021/095310 WO2021233442A1 (zh) 2020-05-22 2021-05-21 一种核酸表达的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010442805.7A CN113774082A (zh) 2020-05-22 2020-05-22 一种核酸表达的方法

Publications (1)

Publication Number Publication Date
CN113774082A true CN113774082A (zh) 2021-12-10

Family

ID=78707733

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010442805.7A Pending CN113774082A (zh) 2020-05-22 2020-05-22 一种核酸表达的方法
CN202180003994.0A Active CN113994007B (zh) 2020-05-22 2021-05-21 一种核酸表达的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180003994.0A Active CN113994007B (zh) 2020-05-22 2021-05-21 一种核酸表达的方法

Country Status (2)

Country Link
CN (2) CN113774082A (zh)
WO (1) WO2021233442A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115851784B (zh) * 2022-08-02 2023-06-27 安徽农业大学 一种利用Lbcpf1变体构建的植物胞嘧啶碱基编辑***及其应用
CN117402855B (zh) * 2023-12-14 2024-03-19 中国农业科学院植物保护研究所 一种Cas蛋白、基因编辑***及应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015007194A1 (zh) * 2013-07-16 2015-01-22 中国科学院上海生命科学研究院 植物基因组定点修饰方法
US11542509B2 (en) * 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN106609282A (zh) * 2016-12-02 2017-05-03 中国科学院上海生命科学研究院 一种用于植物基因组定点碱基替换的载体
CN109321584B (zh) * 2017-12-27 2021-07-16 华东师范大学 一种简单定性/定量检测单碱基基因编辑技术工作效率的报告***
CN110157726B (zh) * 2018-02-11 2023-06-23 中国科学院分子植物科学卓越创新中心 植物基因组定点替换的方法
CN110835634B (zh) * 2018-08-15 2022-07-26 华东师范大学 一种新型碱基转换编辑***及其应用
CN110526993B (zh) * 2019-03-06 2020-06-16 山东舜丰生物科技有限公司 一种用于基因编辑的核酸构建物
CN110527695B (zh) * 2019-03-07 2020-06-16 山东舜丰生物科技有限公司 一种用于基因定点突变的核酸构建物
CN110129363A (zh) * 2019-06-11 2019-08-16 先正达作物保护股份公司 提高番茄CRISPR/Cas9基因编辑效率的方法

Also Published As

Publication number Publication date
WO2021233442A1 (zh) 2021-11-25
CN113994007B (zh) 2023-07-04
CN113994007A (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN107177625B (zh) 一种定点突变的人工载体***及定点突变方法
WO2018086623A1 (en) A method for base editing in plants
AU2008264202B2 (en) Enhanced silk exsertion under stress
CN110526993B (zh) 一种用于基因编辑的核酸构建物
WO2014144094A1 (en) Tal-mediated transfer dna insertion
CN107567499A (zh) 大豆u6核小rna基因启动子及其在植物小rna基因的组成型表达中的用途
CN110527695B (zh) 一种用于基因定点突变的核酸构建物
CN113994007B (zh) 一种核酸表达的方法
CN116179589B (zh) SlPRMT5基因及其蛋白在调控番茄果实产量中的应用
CN110066824B (zh) 一套用于水稻的碱基编辑人工***
AU2017234672B2 (en) Zea mays regulatory elements and uses thereof
CN112805385A (zh) 基于人apobec3a脱氨酶的碱基编辑器及其用途
CN116694661A (zh) 一种调控植物萌发速率的ShN/AINV5-4D基因及其应用
CN114686456B (zh) 基于双分子脱氨酶互补的碱基编辑***及其应用
US9777286B2 (en) Zea mays metallothionein-like regulatory elements and uses thereof
CN113293174B (zh) 一种用于碱基编辑的核酸构建物
CN105585623A (zh) 抗病转TaMYB-KW基因小麦的培育方法及相关生物材料与应用
AU2014329590A1 (en) Zea mays metallothionein-like regulatory elements and uses thereof
WO2022055751A1 (en) Plastid transformation by complementation of nuclear mutations
CN115466747A (zh) 糖基转移酶ZmKOB1基因及其在调控玉米雌穗结实性状或发育上的应用
CN108841840B (zh) 蛋白TaNADH-GoGAT在调控植物产量中的应用
CN112080513A (zh) 一套编辑范围扩展的水稻人工基因组编辑***及其应用
CN112813092A (zh) GbBCCP5蛋白质及其编码基因在调控生物油脂含量中的应用
WO2020177751A1 (zh) 一种用于基因编辑的核酸构建物
CN114214342B (zh) NtFBA1基因在调控烟草PVY抗性方面的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination