CN110951700B - 一种Diels-Alder反应酶及其应用 - Google Patents

一种Diels-Alder反应酶及其应用 Download PDF

Info

Publication number
CN110951700B
CN110951700B CN201911136243.7A CN201911136243A CN110951700B CN 110951700 B CN110951700 B CN 110951700B CN 201911136243 A CN201911136243 A CN 201911136243A CN 110951700 B CN110951700 B CN 110951700B
Authority
CN
China
Prior art keywords
leu
ser
ile
gly
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911136243.7A
Other languages
English (en)
Other versions
CN110951700A (zh
Inventor
雷晓光
戴均贵
高磊
苏聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Institute of Materia Medica of CAMS
Original Assignee
Peking University
Institute of Materia Medica of CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Institute of Materia Medica of CAMS filed Critical Peking University
Priority to CN201911136243.7A priority Critical patent/CN110951700B/zh
Publication of CN110951700A publication Critical patent/CN110951700A/zh
Priority to US16/951,916 priority patent/US11293015B2/en
Priority to EP20208549.4A priority patent/EP3825398A1/en
Application granted granted Critical
Publication of CN110951700B publication Critical patent/CN110951700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/06Oxygen as only ring hetero atoms containing a six-membered hetero ring, e.g. fluorescein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供一种Diels‑Alder反应酶及其应用,属于基因工程技术领域。所述的Diels‑Alder反应酶为MaDA酶,其氨基酸序列如SEQ ID No.1所示,编码其的基因序列如SEQ ID No.2所示。本发明还提供了MaDA酶的同源蛋白MaDA‑1和MaDA‑2,其氨基酸序列分别如SEQ ID No.10、12所示。本发明发现来源于桑树的MaDA酶及其同源蛋白能够以查尔酮和含有脱氢异戊烯基化合物为底物,立体专一性合成endo构型天然产物,体外制备D‑A类型天然产物及其类似物,有助于开发和利用这类天然产物的药用价值,为其他含有六元环的重要化工前体或天然产物的合成提供了可能性。

Description

一种Diels-Alder反应酶及其应用
技术领域
本发明属于基因工程技术领域,具体地说,涉及一种来源于桑树的Diels-Alder反应酶及其在促进Diels-Alder(D-A)反应中的应用。
背景技术
Diels-Alder(D-A)反应是共轭二烯(diene)与亲二烯体(dienophile)间发生的[4+2]环化反应,是有机化学中构建碳-碳键的重要方法之一,它能一步构建新的六元环和多个手性中心,迅速提高分子的复杂程度,在合成化学中扮演者重要的角色。自然界中存在大量含有六元环骨架的天然产物,这类分子往往结构复杂,但却具有良好的生物学活性,例如抗癌明星分子紫杉醇(taxol)以及dynemycin A。这类天然产物的全合成往往依赖D-A反应作为关键步骤来构建六元环骨架以及新的手性中心,但由于D-A反应缺乏良好催化剂来控制该反应的区域、endo/exo以及立体选择性,在合成过程中会出现很多副产物从而降低目标产物的产率以及立体选择性,如图1所示,这大大降低了D-A反应在全合成以及药物合成中的应用价值。因此开发和利用能够催化D-A反应进行的酶,使之能够选择性地产生某种特定立体结构(例如图1中圆框所示)的D-A产物不仅具有科学创新的价值,也具有很强的工业应用价值,但遗憾的是,目前从自然界中还未发现能够选择性催化分子间D-A反应的酶。
桑白皮(桑树的根皮或者茎皮)是传统中药,具有抗炎,利尿、平喘等等用途,同时也是治疗艾滋病的复方药物(司艾特散)中的有效成分。桑白皮中富含D-A类型的黄酮类天然产物,这些天然产物结构独特,具有良好的抗菌、抗病毒以及抗糖尿病等的生物活性,推测其是由桑树中的氧化酶以及D-A反应酶(DAase)共同参与而生成的,如图2所示。由于其结构复杂,含有多个手性中心,实现这类天然产物的不对称全合成面临着很大的挑战。虽然有少数几例利用手性硼酸复合物促进的不对称D-A反应来实现该类天然产物不对称全合成的报导,但合成化学仍然面临合成路线长,选择性差以及产率低的难题。相比于化学催化剂,酶具有高效性以及立体选择性,因此,发现桑树中分子间D-A反应酶不仅能够绿色高效实现桑树中endo-类型D-A天然产物及其类似物的合成,为开发和利用这类天然产物的药用价值奠定了基础,同时也为其他含有六元环的重要化工前体或天然产物的合成提供了新的可能性。
发明内容
本发明的目的是提供一种D-A反应酶及其在促进D-A反应中的应用。
第一方面,本发明提供了一种Diels-Alder反应酶,其来源于桑树,命名为MaDA酶,具有:1)如SEQ ID No.1所示的氨基酸序列;或2)SEQ ID No.1所示的氨基酸序列经取代、缺失和/或增加一个或多个氨基酸的序列与SEQ ID No.1同源性为80%、85%、90%、95%、98%、99%,且具有同等活性的由1)衍生的蛋白质。
进一步地,本发明还提供了MaDA酶的同源蛋白,其分别为MaDA-1、MaDA-2,分别具有:如SEQ ID No.10、12所示的氨基酸序列;其核苷酸序列分别如SEQ ID No.9、11所示。
本发明进一步提供编码所述Diels-Alder反应酶的基因,其具有:
1)SEQ ID No.2所示的核苷酸序列;或
2)SEQ ID No.2所示核苷酸序列经取代、缺失和/或增加一个或几个核苷酸;或
3)在严格条件下与1)限定的DNA序列杂交的核苷酸序列。
本发明从桑树中cDNA中扩增出MaDA基因,其核苷酸序列如SEQ ID No.2所示,该序列为一个完整的开放阅读框(ORF),该开放阅读框是从ATG起始,以TGA结束,共有1653个核苷酸。其中,前81个核苷酸ATGCAGTACTTTTCCTTCCCTTCATCGTTAGCCAAAATCACCATCTTTCTGATCTTTTCATTTGTATTCGCAAGTTCAGCT为信号肽序列。
如SEQ ID No.1所示Diels-Alder反应酶MaDA含有550个氨基酸,其中前27个氨基酸(MQYFSFPSSLAKITIFLIFSFVFASSA)为基因编码的信号肽,其在成熟酶蛋白分泌到细胞外的过程中会被切除。因此成熟的MaDA是从Asn28开始,共计523个氨基酸,其理论分子量(MWt)为59075.78,酶蛋白的理论等电点(pI)为6.62。
第二方面,本发明还提供了含有MaDA酶编码基因的生物材料,所述生物材料为表达盒、质粒、载体、微生物、昆虫细胞、动物细胞、植物细胞。
优选地,所述生物材料为表达载体pI-sec-sumostar-tev2,其核苷酸序列如SEQID No.3所示。
本发明提供了表达载体pI-sec-sumostar-tev2在昆虫细胞中表达不含信号肽的成熟MaDA酶蛋白中的应用。
本发明实施例中构建包含MaDA基因序列的表达载体pI-sec-sumostar-tev2,并实现在昆虫细胞(Hi5)的大量表达。利用该载体在昆虫中表达出来的SUMO-MaDA蛋白在N端包含了信号肽、6×His标签以及SUMO标签,其氨基酸序列如SEQ ID No.4所示。
其中,前20个氨基酸(MVSAIVLYVLLAAAAHSAFA)为信号肽,HHHHHH为6×His标签,D SEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQTPE DLDMEDNDIIEAHREQIGGSUMO标签,ENLYFQG为TEV酶切位点。利用昆虫表达体系表达纯化出来的成熟蛋白不含信号肽,其蛋白理论分子量(MWt)为73288.49,酶蛋白的理论等电点(pI)为5.76,利用TEV酶水解后,能得到MaDA不带信号肽的成熟蛋白。
第三方面,本发明提供了所述Diels-Alder反应酶或其编码基因或含有其的生物材料在催化Diels-Alder反应中的应用。
本发明提供了所述Diels-Alder反应酶或其编码基因或含有其的生物材料在催化Diels-Alder反应制备含有六元环骨架的天然产物,或制备立体专一性合成endo构型天然产物中的应用,优选在制备黄酮类天然产物或其类似物中的应用。
具体而言,上述应用是以亲二烯体和二烯体为底物,以本发明所述Diels-Alder反应酶MaDA、MaDA-1、MaDA-2或其编码基因或含有所述酶编码基因的生物材料为催化酶,进行反应,立体专一性合成桑树中存在的endo构型天然产物及其衍生物。
进一步地,对所述亲二烯体查尔酮来说,其苯环上不同位置可以有不同的取代基;对于二烯体来说,桑科植物中存在的含有脱氢异戊烯基结构单元的化合物,因此所述二烯体为包括脱氢异戊烯基黄酮类(dehydroprenyl flavonoids)、脱氢异戊烯基二苯乙烯类(dehydroprenyl stilbenes)、脱氢异戊烯基查尔酮(dehydroprenyl chalcone)以及脱氢异戊烯基苯并呋喃类(dehydroprenyl benzofurans)化合物,它们均可作为该类D-A反应酶的底物。
本发明的有益效果进一步地发现,来源于桑树的MaDA酶最适反应温度为50℃,反应pH为8.0,其催化形成chalcomoracin的效率非常高。
本发明的有益效果在于,本发明发现来/源于桑树的MaDA酶能够以查尔酮或其衍生物和含有脱氢异戊烯基化合物为底物,立体专一性合成endo构型天然产物,能够体外制备桑树中D-A类型天然产物及其衍生物。MaDA酶底物适应性良好,可识别不同取代的查尔酮及其衍生物作为亲二烯体生成天然产物mulberrofurans E/O,和chalcomoracin以及其衍生物,转化率达70%以上;本发明提供的MaDA酶对于桑科植物中含有脱氢异戊烯基结构单元的不同二烯体(dehydroprenyl-benzene diene)均具有一定的活性,能够特异性生成endo产物,展现出良好的底物适应性以及选择性。通过碱性条件下水解原位生成不稳定二烯体以及MaDA催化的不对称D-A反应这两步串联反应,能够以较高的收率(最高可达62%)得到桑科植物来源的不同类型的D-A类型天然产物。为开发和利用桑科中这类天然产物的药用价值奠定了基础,同时也为其他含有六元环的重要化工前体或天然产物的合成提供了新的可能性。
附图说明
图1为D-A反应以及其选择性。当催化剂不能很好的控制D-A反应的选择性时,理论上会有八种不同异构体同时生成。
图2为桑科植物中代表性的D-A类型天然产物及其生物合成途径。桑科植物来源的D-A类型天然产物是由相同的亲二烯体——查尔酮和不同二烯体,包括脱氢异戊烯基黄酮(dehydroprenyl flavonoids),脱氢异戊烯基查尔酮(dehydroprenyl chalcone),脱氢异戊烯基二苯乙烯(dehydroprenyl stilbenes),脱氢异戊烯基苯并呋喃(dehydroprenylbenzofurans)。
图3为昆虫表达载体pI-secSUMOstar的图谱。
图4为桑树愈伤组织粗提物的HPLC成分分析图。A为桑树愈伤组织化学成分的高效液相色谱(HPLC)分析图;B为天然产物chalcomoracin的标准品。
图5为不同纯化组分的活性测试结果图。A为阴性对照,该体系中没有任何蛋白;B中加入了桑树悬浮细胞粗酶液;C中加入了疏水柱纯化后的活性蛋白;D中加入了离子交换柱层析纯化后的活性蛋白;E中加入了分子筛柱层析纯化后的活性蛋白。
图6为不同蛋白活性组分的12%SDS-PAGE图。i)展示的是桑树悬浮细胞粗酶液中总蛋白;ii)展示的是桑树悬浮细胞粗酶液经过疏水柱层析纯化后的活性总蛋白;iii)展示的是在上一步疏水柱层析纯化中所得到的总蛋白又经过离子交换柱层析纯化后的活性总蛋白;iv)展示的桑树悬浮细胞粗酶液依次经过疏水柱层析、离子交换柱层析和分子筛柱层析纯化后得到的活性蛋白。
图7为被富集条带的质谱鉴定结果图。
图8为桑树中reticuline oxidase-like enzyme家族蛋白的转录水平。
图9为MaDA基因的琼脂糖凝胶电泳图。M为核酸marker,1为MaDA基因核酸
图10为SUMO-MaDA蛋白SDS-PAGE图。
图11A为不同亲二烯体以及对应D-A产物的结构;图11B为D-A产物的紫外吸收和质谱结果;图11C为活性测试的高效液相色谱结果。
图12为一些亲二烯体的转化率测定结果图。
图13为D-A类型天然产物的酶法合成。
图14为D-A产物chalcomoracin(4)对应立体选择性的测定。I)展示的是酶催化合成的chalcomoracin(4)的手性HPLC分析图;II)展示的是外消旋的chalcomoracin的手性HPLC分析图。
图15为MaDA蛋白的最适温度测定结果。
图16为MaDA蛋白的最适pH测定结果。
图17为MaDA-1与MaDA的蛋白序列比对分析。
图18为MaDA-1的活性测试结果。
图19为MaDA-2与MaDA的蛋白序列比对分析。
图20为MaDA-2催化的亲二烯体1与不同二烯体间的活性测试结果。
图21为MaDA-2催化的亲二烯体5与不同二烯体间的活性测试结果。
具体实施方式
以下实施例对本发明进行详细且具体的说明,但应理解本发明并不限定于以下的例子。若未特别说明,以下实施例所用的试剂、原料均为市售可得。以下实施例所用的菌株、载体、培养基和试剂主要为:
大肠杆菌E.coli DH5α以及DH10Bac的感受态细胞均买自庄盟生物有限公司。表达用昆虫细胞Sf21以及Hi5购买自invitrogen公司。
昆虫表达载体pI-secSUMOstar购买自LifeSensors公司,其谱图如图3所示,将上述pI-secSUMOstar载体中的一段核苷酸序列(AGAGACGATCTGCCGTCTCTCTAGAGCGGCC)置换成含有TEV酶切位点的核苷酸序列(GATTACGATATCCCAACGACCGAAAACCTGTATTTTCAGGGATCCGGAATTCAAAGGCCTACGTCGACGAGCTCACTAGTCGCGGCCGCTTTCGAATCTAGAGCCTGCAGTCTCGAGGCAT,SEQID No.15),从而构建出pI-sec-SUMOstar-tev2载体。使用pI-sec-SUMOstar-tev2载体表达蛋白时,SUMO标签蛋白和目标蛋白之间新增TEV酶切位点,方便后续切除N端的SUMO标签。该载体的核苷酸序列如SEQ ID NO.3所示。
LB固体培养基:蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L,1.5%的琼脂。
LB液体培养基:蛋白胨10g/L,酵母粉5g/L,NaCl 10g/L。
植物总RNA提取试剂盒、质粒小提试剂盒、胶回收试剂盒均买自天根生化有限公司;逆转录试剂盒买自Thermo公司。同源重组酶买自诺唯赞公司。PCR高保真酶买自全是金公司。PCR引物合成及质粒测序由金唯智生物技术有限公司完成。MS培养基购自北京索莱宝科技有限公司。SIM SF培养基购买自北京义翘神州科技有限公司。化合物2,亲二烯体6购买自云南西力公司。
亲二烯体1根据文献(Romano,J.J.&Casillas,E.A short synthesis ofmorachalcone A.Tetrahedron Lett.2005,46,2323-2326)合成。亲二烯体5根据文献(Han,J.,et al.Enantioselective biomimetic total syntheses of kuwanons I and J andbrosimones A and B,Angew.Chem.Int.Ed.2014,53,9257-9261)进行合成。亲二烯体11根据文献(Lee,Y.R.,et al.An Efficient and Rapid Synthetic Route to BiologicallyInteresting Pyranochalcone Natural Products,Molecules 2007,12,1420-1429)合成。
亲二烯体7的合成
Figure BDA0002279675230000061
在封管中将S1(29.3mg,0.055mmol)溶于丙酮(3mL),然后加入1,4-环己二烯(52μL,0.27mmol),甲酸(2μL,0.027mmol),甲酸铵(3.5mg,0.056mmol)和钯/碳(11.6mg,0.011mmol)。干冰丙酮浴除氧后40℃搅拌反应2小时。冷却到室温后,硅藻土过滤,旋干溶剂。柱色谱纯化(乙酸乙酯/石油醚=1/4)得到亲二烯体7(8.7mg,45%)。
1H NMR(400MHz,Acetone-d6)δ14.11(s,1H),8.22(d,J=15.4Hz,1H),7.89(d,J=8.8Hz,1H),7.83(d,J=15.4Hz,1H),7.76(d,J=8.4Hz,1H),6.62–6.38(m,3H),5.28(t,J=7.2Hz,1H),3.81(s,3H),3.37(d,J=7.2Hz,2H),1.78(s,3H),1.64(s,3H);
13C NMR(101MHz,Acetone-d6)δ193.4,165.1,164.1,162.5,159.7,140.4,131.5,131.4,130.0,123.3,118.4,116.2,114.5,107.9,107.5,102.2,55.7,25.8,22.3,17.9。
亲二烯体8的合成
Figure BDA0002279675230000062
在封管中将S2(175mg,0.32mmol)溶于丙酮(7mL),然后加入1,4-环己二烯(150μL,1.59mmol),甲酸(6μL,0.16mmol),甲酸铵(20mg,0.32mmol)和钯/碳(67mg,0.064mmol)。干冰丙酮浴除氧后40℃搅拌反应2小时。冷却到室温后,硅藻土过滤,旋干溶剂。柱色谱纯化(乙酸乙酯/石油醚=1/4)得到亲二烯体8(56mg,50%)。
1H NMR(400MHz,Acetone-d6)δ14.11(s,1H),8.18(d,J=15.6Hz,1H),7.91(d,J=8.8Hz,1H),7.77(d,J=15.6Hz,1H),7.73(d,J=8.4,Hz,1H),6.57(s,1H),6.52(m,2H),5.28(t,J=6.6Hz,1H),3.93(s,3H),3.38(d,J=7.0Hz,2H),1.78(s,3H),1.64(s,3H);
13C NMR(101MHz,Acetone-d6)δ193.4,165.1,162.6,162.5,161.7,140.2,131.6,131.4,130.0,123.3,118.1,116.5,116.1,114.5,109.0,107.9,99.9,56.0,25.9,22.3,17.9。
亲二烯体9的合成
Figure BDA0002279675230000063
在封管中将S3(80.2mg,0.15mmol)溶于丙酮(4mL),然后加入1,4-环己二烯(70.9μL,0.75mmol),甲酸(2.8μL,0.075mmol),甲酸铵(9.5mg,0.15mmol)和钯/碳(31.8mg,0.030mmol)。干冰丙酮浴除氧后40℃搅拌反应2小时。冷却到室温后,硅藻土过滤,旋干溶剂。柱色谱纯化(二氯甲烷/甲醇=19/1)得到亲二烯体9(25mg,47%)。
1H NMR(400MHz,Acetone-d6)δ13.92(s,1H),8.24(d,J=15.4Hz,1H),8.05(d,J=9.2Hz,1H),7.83(d,J=15.4Hz,1H),7.70(d,J=8.6Hz,1H),6.65(d,J=9.0Hz,1H),6.52(d,J=2.4Hz,1H),6.47(dd,J=8.6,2.4Hz,1H),5.21(t,J=7.2Hz,1H),3.93(s,3H),3.35(d,J=7.2Hz,2H),1.77(s,3H),1.63(s,3H);
13C NMR(101MHz,Acetone-d6)δ193.8,163.9,163.7,162.4,160.0,141.2,131.8,131.5,130.4,123.2,117.5,117.4,115.5,115.2,109.2,103.6,103.0,56.2,25.8,22.2,17.8。
亲二烯体10的合成
Figure BDA0002279675230000071
0℃下将S4(26.5mg,0.048mmol)溶于四氢呋喃(0.6mL)和异丙醇(0.6mL)。缓慢加入3M盐酸(0.4mL)。缓慢升至室温,搅拌32小时后,加入水淬灭反应。乙酸乙酯萃取,无水硫酸钠干燥。制备TLC纯化得到亲二烯体10(16.5mg,74%)。
1H NMR(400MHz,Acetone-d6)δ13.95(s,1H),8.25(d,J=15.4Hz,1H),8.04(d,J=9.2Hz,1H),7.84(d,J=15.4Hz,1H),7.71(d,J=8.6Hz,1H),6.63(d,J=9.0Hz,1H),6.53(d,J=2.0Hz,1H),6.47(dd,J=8.6,2.0Hz,1H),5.30(t,J=7.0Hz,1H),3.44(d,J=7.2Hz,2H),2.12–2.03(m,5H),2.01(t,J=6.0Hz,2H),1.81(s,3H),1.77(t,J=7.6Hz,2H),1.65(s,3H);
13C NMR(101MHz,Acetone-d6)δ193.8,163.8,162.8,162.4,160.0,141.3,131.8,131.5,130.3,123.4,117.8,117.4,115.6,115.2,109.2,103.7,103.6,83.5,70.6,64.0,54.9,33.4,33.1,25.9,22.4,18.1,13.6。
二烯体3的合成
Figure BDA0002279675230000072
S5(191.5mg,0.39mmol)和S6(301.2mg,1.53mmol)溶于二甲基甲酰胺(40mL)中,然后加入磷酸钾(823mg,3.9mmol),三苯基胂(16.6mg,0.054mmol)和三(二亚苄基茚丙酮)二钯(24.8mg,0.027mmol),向溶液中通入半小时氩气,然后50℃下搅拌5小时后,加入水淬灭反应,然后用乙酸乙酯萃取,无水硫酸钠干燥。旋干溶剂后,溶于二氯甲烷(20mL),之后加入三乙胺(539μL,3.9mmol)和乙酸酐(220μL,2.33mmol)。室温搅拌5小时后,加入水淬灭反应,然后用二氯甲烷萃取,无水硫酸钠干燥。柱色谱纯化(乙酸乙酯/石油醚=1/10)得到二烯体前体S7(155.3mg,92%)。
1H NMR(400MHz,CDCl3)δ7.54(dd,J=8.6,4.8Hz,1H),7.45(d,J=5.2Hz,2H),7.45(s,1H),7.26(s,1H),7.08–6.96(m,2H),6.92(d,J=16.6Hz,1H),5.13(d,J=9.6Hz,2H),2.34(s,3H),2.33(s,6H),1.93(s,3H);
13C NMR(101MHz,CDCl3)δ169.7,168.8,154.8,153.0,149.5,148.3,142.1,138.3,129.8,126.8,124.3,121.2,119.1,117.8,117.4,116.9,116.5,105.2,102.6,21.0,18.0。
Figure BDA0002279675230000081
二烯体3不稳定,只能通过原位水解其乙酰基前体S7来获取:将5体积的甲醇,3体积的水和1体积的碳酸钾水溶液(1M)混匀,然后加入1体积的S7 DMSO母液(100mM),混匀后静置反应35分钟左右得到10mM的二烯体3的溶液。该溶液直接用于活性测试。二烯体23以及其乙酰基前体S10的合成:
Figure BDA0002279675230000082
化合物S8(15.9mg,0.0322mmol)和化合物S9(17.0mg,0.0476mmol)溶解在0.6毫升DMF中,然后在氩气的保护下向该溶液中加入三苯基砷(1.4mg,4.5μmol)和Pd2(dba)3(2.1mg,2.2μmol)。该混合液室温反应3.5小时后用饱和氯化铵溶液淬灭,然后用***萃取。有机相合并后旋干,经柱层析纯化后(乙酸乙酯/石油醚=1/4)得到二烯体前体S10(13mg,0.03mmol,93%)。
1H NMR(400MHz,CDCl3)δ7.75(s,1H),7.45(d,J=2.1Hz,2H),7.22(s,1H),6.99(s,1H),6.93(t,J=2.0Hz,1H),6.86(d,J=16.1Hz,1H),6.58(d,J=16.1Hz,1H),5.14(s,1H),5.10(s,1H),2.38(s,3H),2.33(s,6H),1.97(s,3H);
13C NMR(101MHz,CDCl3)δ169.5,169.0,155.4,154.2,151.5,146.2,142.0,133.4,132.2,127.4,126.5,122.2,118.1,117.9,115.7,115.5,105.8,102.7,21.2,21.0,18.6;
Figure BDA0002279675230000091
二烯体前体S10(10.3mg,0.024mmol)溶解在0.8毫升甲醇和0.2毫升水的混合液中,然后在氩气的保护下向该溶液中加入碳酸钾(16.4mg,0.119mmol)。该混合液室温反应30分钟后用饱和氯化铵溶液淬灭,然后用乙酸乙酯萃取。有机相合并后旋干,经柱层析纯化后(乙酸乙酯/石油醚=1/4)得到二烯体23(2.6mg,0.0084mmol,35%)。
1H NMR(600MHz,Acetone-d6)δ8.78(s,1H),8.35(d,J=6.3Hz,2H),7.74(s,1H),7.04(s,2H),7.02(s,1H),7.00(s,1H),6.86(d,J=2.2Hz,2H),6.37(t,J=2.2Hz,1H),5.11(d,J=1.7Hz,1H),5.03(s,1H),1.99(s,3H);
13C NMR(125MHz,Acetone-d6)159.8,156.1,155.9,154.3,143.6,133.2,131.2,124.8,123.1,122.7,118.4,116.5,103.8,103.6,102.3,98.4,18.8。
二烯体24以及其乙酰基前体S13的合成
Figure BDA0002279675230000092
化合物S11(68.8mg,0.194mmol)溶解在5毫升甲醇和5毫升二氯甲烷的混合液中,然后向该溶液中加入BTMA·ICl2(67.5mg,0.194mmol)和碳酸钙(194mg,1.94mmol)。该混合液室温反应15小时后过滤除去碳酸钙,然后加入二氯甲烷萃取。有机相合并后旋干,经柱层析纯化后(甲醇/二氯甲烷=1/10)得到S12的粗品。
将上诉S12(70mg,0.146mmol)的粗品和S6(113mg,0.584mmol)溶解在2毫升DMF中,然后加入磷酸钾(318mg,1.46mmol)和三苯基砷(6.4mg,0.0204mmol)。向该溶液中通入半小时氩气以除去溶液中的氧气,随后加入Pd2(dba)3(9.4mg,0.0102mol)。该反应液在50℃下反应5小时后过滤,收集滤液。滤液旋干后溶解在4毫升二氯甲烷中,然后加入三乙胺(122μL,0.875mmol)和醋酸酐(55.2μL,0.584mmol),室温反应过夜。反应结束后,用二氯甲烷萃取,旋干。柱层析纯化后(丙酮/石油醚=1/4)得到二烯体前体S13(12.0mg,三步总收率15%)。
1H NMR(400MHz,Acetone-d6)δ13.97(s,1H),8.15(d,J=8.6Hz,2H),7.38(dd,J=12.5,9.2Hz,3H),7.03(s,1H),6.94(s,1H),6.56(d,J=16.5Hz,1H),5.16(s,1H),5.12(s,1H),2.39(s,3H),2.31(s,3H),1.96(s,3H);
13C NMR(101MHz,Acetone-d6)δ184.1,169.3,168.8,164.8,160.8,155.7,155.0,154.9,143.7,137.4,129.1,128.9,123.5,118.4,118.3,114.8,109.2,106.4,103.2,21.0,20.9,18.1。
Figure BDA0002279675230000101
二烯体24不稳定,只能通过原位水解其乙酰基前体S13来获取:将4体积的甲醇,3体积的水和1体积的碳酸钾水溶液(1M)混匀,然后加入2体积的S13 DMSO母液(50mM),混匀后静置反应35分钟左右得到10mM的二烯体24的溶液。该溶液直接用于活性测试。
二烯体25和22的合成
Figure BDA0002279675230000102
二烯体前体S14参照文献(Gao,L.,Han,J.,Lei,X.Enantioselective totalsyntheses of kuwanon X,kuwanon Y,and kuwanol A,Org.Lett.2016,18,360-363)进行合成,然后利用碳酸钾原位水解生成二烯体25,其操作与合成二烯体3相同。二烯体前体S15参照文献(Han,J.,et al.Enantioselective biomimetic total syntheses of kuwanonsI and J and brosimones A and B,Angew.Chem.Int.Ed.2014,53,9257-9261)进行合成,然后利用碳酸钾原位水解生成二烯体22,其操作与合成二烯体3相同。
外消旋chalcomoracin(4)的合成
Figure BDA0002279675230000111
化合物S16参照文献(Han,J.,et al.Enantioselective biomimetic totalsyntheses of kuwanons I and J and brosimones A and B,Angew.Chem.Int.Ed.2014,53,9257-9261)进行合成。
(±)-BINOL(25.4mg,0.107mmol)溶解在1.5毫升THF中,然后加入BH3·THF(51.5μL,0.0515mmol)和醋酸(3.0μL,0.0515mmol)。该反应液在室温下搅拌25分钟,然后抽干。向该固体中加入2.5毫升THF中,然后加入200毫克
Figure BDA0002279675230000112
分子筛和亲二烯体S16(20.0mg,0.0429mmol),随后室温反应1.5小时后加入S7(22.4mg,0.0515mmol)。该混合物反应72小时后,用水淬灭。过滤后收集滤液,并用乙酸乙酯萃取后旋干。经过初步柱层析纯化后(乙酸乙酯/石油醚=1/5到1/2)得到S17粗品。
将消旋体S17(4.4mg,0.00489mmol)加入到0.5毫升甲醇和0.25毫升的THF混合溶液中,然后加入碳酸钾(6.7mg,0.0489mmol),室温下反应1小时后加入0.9毫升0.1N盐酸淬灭反应。该混合液用乙酸乙酯萃取后旋干。经柱层析纯化后(甲醇/二氯甲烷=5:95)得到外消旋天然产物chalcomoracin(4)。其NMR数据与文献一致(Takasugi,M.,Nagao,S.,Masamune,T.,Shirata,A.,Takahashi,K.Chalcomoracin,a natural Diels-Alder adductfrom diseased mulberry.Chem.Lett.1980,9,1573-1576)。
实施例1
1、桑树愈伤组织的诱导和培养
将采集回来的幼叶用70%乙醇表面灭菌30s后,用饱和的次氯酸钠溶液灭菌10min,然后用5倍量的蒸馏水漂洗3次。将灭菌后的外植体剪成1cm2左右的小块,接种在MS+NAA(萘乙酸)0.5mg·L-1+6-BA(6-苄氨基腺嘌呤)0.5mg·L-1+2,4-D(2,4-二氯苯氧乙酸)0.2mg·L-1,pH 5.8固体培养基上,在黑暗条件下进行愈伤组织的诱导,将诱导出的愈伤组织接种于上述MS固体培养基进行扩大培养,每4周继代1次,培养温度为(25±1)℃。选择生长状况良好的愈伤组织接种到相同的MS液体培养基中,建立桑树悬浮细胞系于(25±1)℃黑暗条件下110r·min-1的摇床上培养。
2、桑树愈伤组织中D-A类型天然产物的成分分析。
称取烘干后的桑树愈伤组织0.1克,加入至1.5EP管中,然后加入1mL甲醇水溶液(甲醇:水=4:1)后超声2次,用0.22微米滤膜过滤后得到愈伤组织粗提物。该粗提物用HPLC分析,得到如图4的A所示的结果,通过与chalcomoracin标准品的对照(图4的B)可以看出,桑树愈伤组织中富含D-A类型天然产物chalcomoracin。这说明在我们的桑树愈伤组织中催化chalcomoracin合成的D-A反应酶存在且可能高表达。
3、活性导向蛋白分离
1)细胞粗酶液的制备
将新鲜桑树细胞培养物(200g)添加到由50μM磷酸钠、pH 7.4、1μM EDTA、3μm巯基乙醇和100μM PMSF按1:100(vol/vol)的比例组成的破碎缓冲液(400ml)中,并在4℃下用温拌机处理。混合物在9000g下离心4C,30min,将上清液收集到500ml锥形瓶中作为沉淀。将固体硫酸铵加入到上清中,使其达到80%的饱和。在4℃下轻轻搅拌12小时后,将混合物分配到试管中,并在4℃下在9000g下离心30分钟。所得颗粒再悬浮在含有20mM Tris HCl、pH7.4、2mM EDTA和3mm 2-巯基乙醇的缓冲液中,并转移到新试管中。将蛋白质样品在160,000g、4℃下离心2h以去除微粒体,收集上清液并使用Amicon Ultra-30K(微孔)浓缩管离心浓缩得到细胞粗酶液。
2)疏水柱层析纯化
Hitrap Butyl FF柱(5ml)先用50mM磷酸钠缓冲液(pH=7.0,含1.5M硫酸铵)平衡,然后再将上述细胞粗酶液装载到Hitrap Butyl FF柱(5ml)上,该柱使用50mM磷酸钠缓冲液(pH=7.0)进行蛋白质洗脱。洗脱的梯度为0-20min 0%50mM磷酸钠缓冲液(pH=7.0)(vol/vol),20-70min 20%50mM磷酸钠缓冲液(pH=7.0(vol/vol),70-120min 100%50mM磷酸钠缓冲液(pH=7.0)。流速为2mL/min。
3)离子交换柱层析纯化
将上述Hitrap Butyl FF色谱的活性组分收集,缓冲液交换至20mM Tris HCl,pH值8.0,并装载至事先用20mM Tris HCl,pH值8.0的缓冲液平衡后的Hitrap Q FF(5ml)柱(GE Healthcare,USA)上。蛋白质洗脱以2mL/min的流速进行,使用含有20mM Tris HCl、pH8.0和1M NaCl的缓冲液作为洗脱缓冲液,洗脱梯度为:0%(vol/vol)时梯度为0-20min,在10%(vol/vol)时梯度为20-40min,在20%(vol/vol)时梯度为40-60min,在100%时梯度为60-100min。
4)分子筛柱层析纯化
将上述Hitrap Q色谱的活性组分使用串联的SuperDextm 200Increase 10/300GL柱(GE Healthcare,USA)进行浓缩和分离。在0.25ml/min的流速下,使用含有20m m TrisHCl、pH 7.2、0.15M NaCl的缓冲液进行等比例蛋白质洗脱。用安捷伦1260高效液相色谱法测试洗脱部分的活性。使用NGCTM色谱***(bio-rad)进行凝胶过滤层析(size-exclusionchromatography)。
5)将上述纯化之后的不同蛋白组分进行活性测试
向含有100μM亲二烯体morachalcone A(1)和100μM moracin C(2)的20mM Tris·HCl(pH 7.5)的反应液中加入9.8μg上述步骤1-4中的不同蛋白,最终体积为100μL。该反应混合物在30℃下孵育1小时后加入200μL冰甲醇终止反应,15000g离心30min,上清用HPLC-MS分析。当在反应液中不加入细胞粗酶液或者经过纯化后的活性蛋白组分时,亲二烯体1和二烯体前体moracin C(2)不会发生任何变化,如图5的A所示;加入细胞裂解液后,能检测到二烯体(diene)3以及对应的D-A天然产物chalcomoracin(4)的产生,如图5的B所示;将用疏水柱纯化后的活性蛋白组分加入反应液中,也能检测到二烯体(diene)3以及D-A天然产物chalcomoracin(4),如图5的C所示;将用离子交换柱纯化之后的活性蛋白组分加入反应液中,天然产物4的含量增加,如图5的D所示;将经过凝胶过滤层析后的活性蛋白成分加入到反应液中,天然产物4的含量明显增加,如图5的E所示,这说明在这个活性组分中,D-A反应酶可能被富集。
4、不同蛋白活性组分的SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)
将各活性组份蛋白的浓度统一稀释到0.4μg/μL,取25μL的蛋白样品,加入5μLloading buffer,随后100℃处理5min后进行12%的SDS-PAGE电泳检测。结束电泳后,进行考马斯亮蓝染色,得到如图6所示的结果。通过比较不同组分中的蛋白条带,在凝胶柱纯化后的组分中看到明显的富集条带,如图6中箭头所示,该条带作为候选的蛋白条带,送交蛋白质谱检测。
5、LC-MS/MS蛋白质谱测定
将上述富集的条带切下后,送至北京生命科学研究所进行LC-MS/MS质谱鉴定,所得的肽段信息与川桑(Morus notabilis)蛋白序列做比对,从而得到该富集条带中的蛋白质信息,如图7所示。认为被富集出来的条带最有可能是桑树中一类reticuline oxidase-like protein,推测这类蛋白很可能就是催化分子间D-A反应的酶。
实施例2 桑树愈伤组织的转录组分析
向生长了10天左右的桑树愈伤组织培养液中加入0.1mM的茉莉酸甲酯,诱导培养20小时后,将愈伤组织送去华大基因公司进行转录组测序。在所得的转录组序列信息中,共找到了14个注释为reticuline oxidase-like oxidase或其同源蛋白(Cannabidiolicacid synthase)的转录本,根据其fragments per kilobase of exon per million readsmapped(FPKM)的大小,将这些蛋白根据转录水平的高低进行排序,得到图8所示结果。
1、桑树愈伤组织总RNA的提取
取大约100克新鲜愈伤组织放入研钵中,加入液氮后研末至粉末状,然后依照天根生化公司的植物总RNA提取试剂盒说明书提取桑树叶片总RNA。详细操作如下:
1)取大约100毫克磨碎后的样品加入至1.5mL的EP管中,加入450μL的裂解液,剧烈振荡混匀后离心(15,000×g,5min),收集上清。
2)将上述上清转移至过滤柱CS上(过滤柱CS放在收集管中),12,000rpm(13,400×g)离心2-5min,小心吸取收集管中的上清至RNase-Free的离心管中,吸头尽量避免接触收集管中的细胞碎片沉淀
3)缓慢加入0.5倍上清体积的无水乙醇(大约为225μL),混匀,将得到的溶液和沉淀一起转入吸附柱CR3中,12,000rpm(~13,400×g)离心30-60sec,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
4)向吸附柱CR3中加入350μL去蛋白液RW1,12,000rpm(~13,400×g)离心30-60sec,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
5)向吸附柱CR3中央加入80μL的DNase I工作液,室温放置15min。
6)向吸附柱CR3中加入350μL去蛋白液RW1,12,000rpm(~13,400×g)离心30-60sec,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
7)向吸附柱CR3中加入500μL漂洗液RW,室温静置2min,12,000rpm(~13,400×g)离心30-60sec,倒掉收集管中的废液,将吸附柱CR3放回收集管中。
8)重复步骤7.
9)12,000rpm(~13,400×g)离心2min,倒掉废液。将吸附柱CR3置于室温放置数分钟,以彻底晾干吸附材料中残余的漂洗液。
10)将吸附柱CR3放入一个新的RNase-Free离心管中,向吸附膜的中间部位悬空滴加30-100μL RNase-Free ddH2O,室温放置2min,12,000rpm(~13,400×g)离心2min,得到RNA溶液。
2、桑树愈伤组织cDNA的制备
提取的总RNA用DNAase37℃处理半个小时后,用RNA纯化试剂盒进行纯化,用nanodrop测定回收浓度。用Thermo Scientific RevertAid First Strand cDNASynthesis Kit逆转得到cDNA。
3、MaDA基因的扩增
上游引物序列:
5’-AACCTGTATTTTCAGGGATCCAACGACACTCATGAAGCCTTTCTTG-3’(SEQ ID No.5)
下游引物序列:
5’-CTCGAGACTGCAGGCTCTAGATCACATTGCTGAATGTAGAGGAGGAAGAG-3’(SEQ ID No.6)
PCR反应体系(50μL):
Figure BDA0002279675230000151
PCR循环条件(50μl体系):95℃2min;98℃30s,52℃30s,72℃1min,共32个循环,72℃5min。
PCR结束后,对PCR产物进行1%的琼脂糖凝胶电泳,如图9所示,并回收该特异性条带,纯化。
4、杆状病毒构建
采用Invivogen公司所开发的“Bac-to-bac”方法:
pI-sec-sumostar-tev2空载用BamHI和XbaI双酶切过夜,1%琼脂糖凝胶电泳后,用胶回收试剂盒回收单一条带,用nanodrop测定回收的DNA浓度。利用Vazyme同源重组酶构建pI-sec-sumostar-tev2-MaDA质粒,10μL连接体系包括:1μL Exnase II酶,2μL 5×CEbuffer,3μL线性化载体,4μL MaDA PCR产物。
上述连接体系中,MaDA与线性化pI-sec-sumostar-tev2载体的摩尔数之比大致为2:1。上述反应体系在37℃反应30min后,立即置于冰上,随后将连接产物加入100μL DH5α感受态中,冰浴30min后42℃热激1min,然后立即冰浴3min,加入1mL LB培养基37℃,220rpm培养。大约1小时后,离心弃900μL培养基,将菌体重悬在剩余的100μL培养基中,然后用移液枪全部取出并涂布于含有氨苄青霉素(100μg/mL)的固体LB平板。37℃过夜培养后,挑取固体培养基上的单克隆于LB液体培养基中培养12-16小时后提取质粒并送测序。
1μg pI-sec-sumostar-tev2-MaDA加入到100μL DH10Bac的感受态细胞中,冰浴30min后42℃热激1min,随后冰上放置大约3min后,加入1mL LB液体培养基,37℃,220rpm培养大约4小时后,将菌液用5mL液体LB稀释,取100μL稀释后的菌液涂布在含有卡那霉素(50μg/mL)、庆大霉素(7μg/mL)、四环素(10μg/mL)、IPTG(40μg/mL)以及Bluo-gal(100μg/mL)的固体LB平板上。37℃静置过夜培养后,挑取3-4个大的白色克隆接种到含有卡那霉素(50μg/mL)、庆大霉素(7μg/mL)、四环素(10μg/mL)的液体LB中过夜培养。收集上述过夜培养的大肠杆菌,利用异丙醇沉淀的方法提取杆粒并进行PCR鉴定,PCR所用引物序列为:
上游引物序列:5’-AAATGATAACCATCTCGC-3’(SEQ ID No.7)
下游引物序列:5’-GGAGGATAACGATATTATTGAGGC-3’(SEQ ID No.8)
PCR体系为:
Figure BDA0002279675230000161
将含有目的基因的杆粒(PCR验证为阳性)转染昆虫细胞sf21,使用SIM-SF培养基贴壁培养96小时后得到P1代杆状病毒。悬浮培养sf21细胞,当细胞密度达到1.5×106至2.5×106个每毫升时,按1:200的体积比加入P1代杆状病毒,96小时后得到P2代杆状病毒。
5、分泌蛋白表达
采用昆虫细胞Hi5作为蛋白表达体系。Hi5细胞采用SIM-HF培养基悬浮培养,细胞密度在1.5×105至2.5×106个每毫升时感染杆状病毒,48小时后离心去掉细胞,收集上清。利用Sartorius公司的viva flow 200浓缩装置对上清进行浓缩和缓冲液置换,然后通过镍离子螯合亲和层析纯化带有His标签的目的蛋白,如图10所示。
实施例3 MaDA的酶活测试
1)亲二烯体底物适用范围的测定
向97μL反应缓冲液(20mM Tris·HCl,pH=8.0)中加入1μL二烯体3(终浓度100μM)以及1μL不同查尔酮或其衍生物(终浓度100μM),然后加入1μL带有SUMO标签的MaDA蛋白(终浓度2.7nM),50℃下反应10分钟后,加入200μL甲醇淬灭反应,13,000rpm离心30min后,利用HPLC分析。
HPLC分析的条件为:
色谱柱:Shiseido MGIII C18(250mm×4.6mm,5μm);流动相:甲醇-水(0.1%甲酸)梯度洗脱,0~15min,40→70%甲醇;15~35min,70→100%甲醇,35~45min,100→40%甲醇;流速:1.0mL·min-1,检测波长:340nm,柱温:25℃;进样体积为10μL。
不同亲二烯体以及对应D-A产物的结构见图11A;D-A产物的紫外吸收和质谱结果见图11B,HPLC分析结果如图11C所示,MaDA可以识别不同取代的查尔酮及其衍生物(化合物1,6-11)生成天然产物mulberrofurans E/O,和chalcomoracin以及其衍生物,展现出良好的底物适应性,但不能识别不带异戊烯基的查尔酮5。为了进一步确定产物结构,本发明通过酶促的大量反应对天然产物chalcomoracin(4)以及其衍生物13进行了制备与结构鉴定,确定了其结构与报道的结构一致,详见实施例3。
2)一些亲二烯体底物转化率测定
本实施例还测定了亲二烯体1、5-9在酶促D-A反应条件下的转化率,测试条件如下:向96μL反应缓冲液(20Mm Tris·HCl,pH=8.0)中加入2μL二烯体3(终浓度200μM)以及1μL不同查尔酮或其衍生物(即亲二烯体1,5-9,终浓度100μM),然后加入1μL MaDA或者带有SUMO标签的MaDA蛋白(终浓度540nM),50℃下反应5分钟后,加入200μL甲醇淬灭反应,用上述HPLC分析条件分析该反应液。经过三次重复实验后,计算可得到亲二烯体1、7、8、9、5、6的转化率为74%,55%,13%,78%,0%,71%,如图12所示。结果显示,在该反应条件下,MaDA蛋白能够比较高效识别并利用亲二烯体1、6、9合成对应的天然产物或者其衍生物。
3)二烯体底物适用范围的测定
本实施例通过化学合成的方式,还得到了许多带有脱氢异戊烯基的二烯体。随后测定了不同二烯体与亲二烯体1之间的反应效率,其反应条件和实验结果如图13所示,具体操作为:对应二烯体的乙酰基前体(0.026mmol,1.2当量)溶解在1毫升水和甲醇的混合溶液中(水:甲醇=1:4),然后加入碳酸钾(0.087mmol,5.0当量),室温搅拌35分钟后,加入到48毫升的反应缓冲液中(20mM Tris·HCl,pH=8.0),再向该反应体系中加入0.35毫克SUMO-MaDA酶和7.4毫克亲二烯体1(0.022mmol,1.0当量,溶解于0.34毫升的DMSO中),混匀后37℃静置培养14-18小时,随后加入50毫升饱和氯化铵溶液淬灭反应,再用乙酸乙酯(50mL)萃取三次后旋干。旋干后利用C18反向高效液相色谱HPLC(Waters,XBridge@pre C18 OBDTM,150mm×19mm i.d.,5μm)进行分离纯化得到最终的产物,如图13所示,液相制备体系为水(A)和乙腈(B),梯度为:50%-80%B,0-5min,80%-95%B,5-12min,95%-95%B,12-15min,95-50%B,15-16min,50%B,16-18min。
由上述结果可以看出,MaDA酶对于含有五种不同二烯体3、22-25均具有一定的活性,能够特异性生成endo产物,展现出良好的底物适应性以及选择性。通过碱性条件下水解原位生成不稳定二烯体以及MaDA催化的不对称D-A反应这两步串联反应,能够以较高的收率(最高可达62%)得到五种不同类型的D-A类型天然产物。
通过测定酶法制备的产物chalcomoracin(4)的ee值,证明了MaDA催化D-A反应除了具备endo选择性外,还具有立体专一性,如图14所示。这说明MaDA在立体专一性地合成D-A类型天然产物中具有一定的应用价值。
4)MaDA最适温度和最适pH的测定
以二烯体3和亲二烯体1为底物考察不同反应温度(25、30、35、40、45、50、55、60、70℃)对MaDA催化[4+2]环化反应的影响。反应体系如下0.1mM的二烯体3和亲二烯体1,0.02μg的MaDA总体积100μL在Tris-HCl在pH 7.5的缓冲溶液(缓冲液提前在不同温度下平衡15min)条件下反应5min,反应结束后加入200μL的冷甲醇终止反应,涡旋混匀,高速离心机15000g离心30min,取上清液,利用HPLC进行检测。每组反应三个平行。底物的转化率通过产物的峰面积代入标准曲线计算底物的减少量来计算,最终得到在不同温度下MaDA的相对活性,如图15所示。
以二烯体3和亲二烯体1为底物考察不同pH缓冲溶液(pH 4.0-6.0,柠檬酸-柠檬酸钠缓冲液;6.0-7.0,磷酸氢二钠-磷酸二氢钠缓冲液;7.0-9.0,Tris-HCl缓冲液;9.0-11.0,碳酸钠-碳酸氢钠缓冲液)对MaDA催化[4+2]环化反应的影响。反应体系如下:0.1mM的二烯体3和亲二烯体1,0.02μg的MaDA总体积100μL在不同pH和不同缓冲溶液(缓冲液提前在不同温度下平衡15min)条件下反应5min,反应结束后加入200μL的冷甲醇终止反应,涡旋混匀,高速离心机15000g离心30min,取上清液,利用HPLC进行检测。每组反应三个平行。底物的转化率通过产物的峰面积代入标准曲线计算底物的减少量来计算,得到MaDA在不同pH下得到相对活性,如图16所示。
实施例4 MaDA酶的应用
1、利用MaDA酶作为催化剂制备chalcomoracin(4)
Figure BDA0002279675230000191
二烯体前体S7(11.3mg,0.0261mmol)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(18.0mg,0.131mmol)。该反应液在室温下反应大概35分钟后原位产生二烯体3,然后将该溶液加入到98毫升的反应液(59nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体morachalcone A(1,7.4毫克,溶解在0.37毫升的DMSO中)。该反应液在37℃下反应过夜后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到天然产物chalcomoracin(4)(7.2mg,51%)。
[α]D 20+178.8°(c 0.10,MeOH);
1H NMR(600MHz,Acetone-d6)δ8.44(1H,d,J=9.0Hz,H-14″),7.34(1H,d,J=8.4Hz,H-4),6.98(1H,d,J=8.4Hz,H-20″),6.93(1H,s,H-7),6.92(1H,s,H-3),6.76(2H,s,H-2′,H-6′),6.75(1H,dd,J=8.4,2.4Hz,H-5),6.52(1H,d,J=2.4Hz,H-17″),6.46(1H,d,J=9.0Hz,H-13″),6.31(1H,dd,J=8.4,2.0Hz,H-19″),5.77(1H,br s,H-2″),5.16(1H,t,J=7.2Hz,H-22″),4.65(1H,t,J=4.8Hz,H-4″),4.10(1H,br s,H-3″),3.75(1H,br s,H-5″),3.25(2H,d,J=7.2Hz,H-21″),2.48(1H,m,H-6″),2.11(1H,m,H-6″),1.94(3H,s,H-7″),1.71(3H,s,H-24″),1.57(3H,s,H-25″);
13C NMR(150MHz,Acetone-d6)δ:155.4(C-2),101.9(C-3),121.9(C-4),113.2(C-5),156.6(C-6),98.4(C-7),122.7(C-3a),156.7(C-7a),131.6(C-1′),113.5(C-2′),157.9(C-3′,C-5′),116.6(C-4′),104.9(C-6′),133.8(C-1″),124.4(C-2″),33.2(C-3″),47.8(C-4″),36.6(C-5″),32.2(C-6″),23.9(C-7″),209.9(C-8″),113.2(C-9″),164.7(C-10″),116.0(C-11″),163.3(C-12″),108.2(C-13″),132.2(C-14″),122.7(C-15″),157.9(C-16″),103.6(C-17″),157.8(C-18″),107.6(C-19″),128.8(C-20″),22.2(C-21″),123.2(C-22″),131.8(C-23″),17.9(C-24″),25.9(C-25″);
HRMS(ESI)理论值C39H37O9[M+H]+649.2432,实际值649.2405。
2、利用MaDA酶作为催化剂制备18″-O-methychalcomoracin(13)
Figure BDA0002279675230000201
二烯体前体S7(10.0mg,0.023mmol)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(12.7mg,0.092mmol)。该反应液在室温下反应大概35分钟后原位产生二烯体3,然后将该溶液加入到98毫升的反应液(118nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体7(6.8毫克,溶解在1毫升的DMSO中)。该反应液在37℃下反应过夜后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到18″-O-methychalcomoracin(13)(1.6mg,13%)。
[α]D 20+180.2°(c 0.10,MeOH);
1H NMR(Acetone-d6,400MHz)δ:8.42(1H,d,J=8.0Hz,H-14″),7.35(1H,d,J=8.4Hz,H-4),7.09(1H,d,J=8.4Hz,H-20″),6.93(1H,s,H-7),6.93(1H,s,H-3),6.77(2H,s,H-2′,H-6′),6.77(1H,dd,J=8.4,2.4Hz,H-5),6.55(1H,d,J=2.4Hz,H-17″),6.44(1H,d,J=9.0Hz,H-13″),6.40(1H,dd,J=8.4,2.0Hz,H-19″),5.78(1H,br s,H-2″),5.16(1H,t,J=7.2Hz,H-22″),4.65(1H,t,J=4.2Hz,H-4″),4.11(1H,br s,H-3″),3.79(1H,br s,H-5″),3.25(2H,d,J=7.2Hz,H-21″),2.52(1H,m,H-6″),2.24(1H,m,H-6″),1.94(3H,s,H-7″),1.71(3H,s,H-24″),1.57(3H,s,H-25″),3.73(OCH3);
13C NMR(Acetone-d6,100MHz)δ:155.3(C-2),101.9(C-3),121.9(C-4),113.0(C-5),156.5(C-6),98.3(C-7),122.6(C-3a),156.6(C-7a),131.5(C-1′),113.9(C-2′),157.6(C-3′,C-5′),117.7(C-4′),105.4(C-6′),133.8(C-1″),124.3(C-2″),33.2(C-3″),47.7(C-4″),36.5(C-5″),32.3(C-6″),23.8(C-7″),209.6(C-8″),113.4(C-9″),164.6(C-10″),115.9(C-11″),163.3(C-12″),108.1(C-13″),132.1(C-14″),123.1(C-15″),157.7(C-16″),102.4(C-17″),160.3(C-18″),107.1(C-19″),128.8(C-20″),22.2(C-21″),123.2(C-22″),132.1(C-23″),17.8(C-24″),25.8(C-25″),55.3(OCH3);
HRMS(ESI)理论值C40H39O9[M+H]+663.2589,实际值663.2549。
3、利用MaDA酶作为催化剂制备guangsangon E(18)
Figure BDA0002279675230000211
二烯体前体S10(9.2mg,0.0212mmol)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(12.0mg,0.0870mmol)。该反应液在室温下反应大概35分钟后原位产生二烯体23,然后将该溶液加入到48毫升的反应液(118nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体1(5.2毫克,溶解在0.26毫升的DMSO中)。该反应液在37℃下反应过夜后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到guangsangon E(13)(6.0mg,62%)。
[α]D 20+376.6°(c 0.11,MeOH);
1H NMR(Acetone-d6,600MHz)δ:13.04(1H,s),9.04(1H,s),8.38(2H,br s),8.29(1H,s),8.02(1H,d,J=8.8Hz,H-14″),7.99(1H,s),7.86(1H,s),7.46(1H,s,H-4),7.04(1H,d,J=0.7Hz,H-3),6.87(1H,d,J=8.4Hz,H-20″),6.84(2H,d,J=2.2Hz,H-2',6'),6.82(1H,s,H-7),6.44(1H,d,J=8.8Hz,H-13″),6.34(1H,t,J=2.2Hz,H-4'),6.27(1H,d,J=2.4Hz,H-17″),6.14(1H,dd,J=8.4,2.4Hz,H-19″),5.57-5.56(1H,m,H-2″),5.17-5.09(1H,m,H-22″),4.70(1H,dd,J=9.7,5.4Hz,H-4″),4.39(1H,brs,H-3″),3.71-3.67(1H,m,H-5″),3.20(2H,d,J=7.0Hz,H-21″),2.48-2.44(1H,m,H-6″),2.07-2.06(1H,m,H-6″),1.90(3H,s,H-7″),1.67(3H,s,H-24″),1.57(3H,s,H-25″);
13C NMR(Acetone-d6,150MHz)δ:155.1(C-2),102.6(C-3),123.8(C-4),125.5(C-5),156.4(C-6),97.2(C-7),121.9(C-3a),154.7(C-7a),129.7(C-1'),103.7(C-2'),159.7(C-3'),103.3(C-4'),159.7(C-5'),103.7(C-6'),135.1(C-1″),125.5(C-2″),37.8(C-3″),48.4(C-4″),33.5(C-5″),37.3(C-6″),23.6(C-7″),207.0(C-8″),115.7(C-9″),163.8(C-10″),115.3(C-11″),161.8(C-12″),107.2(C-13″),130.5(C-14″),123.1(C-15″),155.2(C-16″),103.8(C-17″),156.4(C-18″),107.5(C-19″),129.7(C-20″),22.2(C-21″),123.5(C-22″),131.1(C-23″),17.8(C-24″),25.8(C-25″);
HRMS(ESI)理论值C39H37O9[M+H]+649.2438,实际值649.2435。
4、利用MaDA酶作为催化剂制备kuwanol E(21)
Figure BDA0002279675230000221
乙酰基保护的前体S14(12.5mg,0.0261mmol)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(21.6mg,0.1567mmol)。该反应液在室温下反应大概35分钟后原位产生二烯体25,然后将该溶液加入到98毫升的反应液(59nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体1(7.4毫克,溶解在0.37毫升的DMSO中)。该反应液在37℃下反应过夜后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到kuwnaol E(21)(6.4mg,45%)。
[α]D 20+160.0°(c 0.03,MeOH);
1H NMR(Acetone-d6,600MHz)δ:13.00(1H,s),8.42(1H,d,J=9.0Hz,H-14″),6.76(1H,d,J=15.6Hz,H-β),6.43(1H,H-6′),7.21(1H,d,J=15.6Hz,H-α),7.36(1H,d,J=9.0Hz,H-6),6.99(1H,d,J=8.0Hz,H-20″),6.50(1H,d,J=2.4Hz,H-17″),6.40(1H,d,J=2.4Hz,H-3),6.43(1H,H-2′),6.35(1H,dd,J=2.4,9.0Hz,H-5),6.43(1H,d,J=9.0Hz,H-13″),6.31(1H,dd,J=2.4,8.4Hz,H-19″),5.77(1H,s,H-2″),5.17(1H,t,J=7.2Hz,H-22″),4.61(1H,t,J=4.0Hz,H-4″),4.08(1H br s,H-3″),3.74(1H br s,H-5″),3.27(2H,d,J=7.2Hz,H-21″),2.50(1H,br d,J=18.0Hz,H-6″),2.17(1H,br d,J=18.0Hz,H-6″),1.92(3H,s,H-7″),1.71(3H,s,H-24″),1.58(3H,s,H-25″);
13C NMR(Acetone-d6,150MHz)δ:117.4(C-1),157.4(C-2),103.5(C-3),158.9(C-4),108.4(C-5),124.8(C-6),126.1(C-α),126.8(C-β),139.2(C-1′),106.6(C-2′),157.5(C-3′),115.8(C-4′),157.5(C-5′),106.6(C-6′),133.6(C-1″),123.9(C-2″),33.2(C-3″),47.9(C-4″),36.5(C-5″),32.3(C-3″,C-6″),23.9(C-7″),209.9(C-8″),113.6(C-9″),164.7(C-10″),115.9(C-11″),164.4(C-12″),108.1(C-13″),132.3(C-14″),122.0(C-15″),156.8(C-16″),103.5(C-17″),157.9(C-18″),107.5(C-19″),128.8(C-20″),22.3(C-21″),123.2(C-22″),131.6(C-23″),17.9(C-24″),25.9(C-25″).
HRMS(ESI)理论值C39H39O9[M+H]+651.2549,实际值651.2589。
5、利用MaDA酶作为催化剂制备Kuwanon J(19)
Figure BDA0002279675230000231
乙酰基保护的前体S15(8.5mg,0.017mmol)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(11.2mg,0.081mmol)。该反应液在室温下反应大概35分钟后原位产生二烯体22,然后将该溶液加入到98毫升的反应液(59nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体1(4.8毫克,溶解在0.5毫升的DMSO中)。该反应液在37℃下反应过夜后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到kuwanon J(19)(1.8mg,19%)。
[α]D 20+90.0°(c 0.03,MeOH);
1H NMR(Acetone-d6,600MHz)δ:14.37(1H,s),12.88(1H,s),8.39(1H,d,J=9.0Hz,H-14″),8.15(1H,d,J=15.6Hz,H-β),7.85(1H,d,J=9.0Hz,H-6′),7.72(1H,d,J=15.6Hz,H-α),7.66(1H,d,J=9.0Hz,H-6),6.98(1H,d,J=8.0Hz,H-20″),6.53(1H,d,J=2.4Hz,H-17″),6.48(1H,d,J=2.4Hz,H-3),6.43(1H,d,J=9.0Hz,H-5′),6.43(1H,dd,J=2.4,9.0Hz,H-5),6.36(1H,d,J=9.0Hz,H-13″),6.32(1H,dd,J=2.4,8.4Hz,H-19″),5.68(1H,s,H-2″),5.16(1H,t,J=7.2Hz,H-22″),4.67(1H,t,J=4.0Hz,H-4″),4.14(1H br s,H-3″),3.78(1H br s,H-5″),3.26(2H,d,J=7.2Hz,H-21″),2.53(1H,br d,J=18.0Hz,H-6″),2.25(1H,br d,J=18.0Hz,H-6″),1.92(3H,s,H-7″),1.71(3H,s,H-24″),1.58(3H,s,H-25″);
13C NMR(Acetone-d6,150MHz)δ:114.4(C-1),160.7(C-2),108.0(C-3),162.7(C-4),103.7(C-5),132.3(C-6),117.8(C-α),141.9(C-β),115.6(C-1′),163.9(C-2′),116.7(C-3′),165.8(C-4′),110.0(C-5′),131.0(C-6′),134.7(C-1″),123.9(C-2″),33.3(C-3″,C-6″),47.9(C-4″),36.7(C-5″),23.8(C-7″),209.8(C-8″),113.9(C-9″),164.5(C-10″),116.1(C-11″),163.9(C-12″),109.0(C-13″),132.3(C-14″),122.9(C-15″),157.0(C-16″),103.5(C-17″),157.8(C-18″),107.3(C-19″),129.0(C-20″),22.4(C-21″),123.6(C-22″),131.8(C-23″),17.9(C-24″),25.9(C-25″).
HRMS(ESI)理论值C40H39O10[M+H]+679.2498,实际值679.2489。
6、利用MaDA酶作为催化剂制备deoxy-artonin I(20)
Figure BDA0002279675230000241
乙酰基保护的前体S13(11.0mg,0.0262mmol)加入到1毫升的甲醇水溶液中(甲醇/水=4:1),然后加入碳酸钾(11.1mg,0.105mmol)。该反应液在室温下反应大概35分钟后原位产生二烯体24,然后将该溶液加入到150毫升的反应液(118nM MaDA,20mM Tris-HCl,pH=8.0)中,最后加入亲二烯体1(7.4毫克,溶解在0.37毫升的DMSO中)。该反应液在37℃下反应过夜后用乙酸乙酯萃取,合并有机相并旋干,最后通过HPLC纯化得到deoxy-artonin I(20)(6.9mg,47%)。
[α]D 20+176.8°(c 0.23,MeOH);
1H NMR(Acetone-d6,600MHz)δ:13.46(1H,s),12.86(1H,s),9.42(1H,br s),9.22(1H,br s),8.89(1H,d,J=4.9Hz),8.68(1H,br s),8.38-8.33(1H,m),8.10(1H,s),7.89(2H,d,J=8.6Hz),7.02-6.98(2H,m),6.97(1H,d,J=8.4Hz),6.55(1H,d,J=2.5Hz),6.51(1H,s),6.46-6.44(2H,m),6.30(1H,dd,J=2.4,8.4Hz),5.66(1H,s),5.15(1H,ddd,J=1.3,4.2,7.1Hz),4.66(1H,t,J=5.1Hz),4.15(1H,s),3.84(1H,s),3.25(2H,d,J=7.2Hz),2.48(1H,br d,J=17.9Hz),
2.25(1H,br d,J=18.0Hz),1.92(3H,s),1.70(3H,s),1.58(3H,s);
13C NMR(Acetone-d6,150MHz)δ:209.3,183.1,164.9,164.5,163.4,163.3,161.9,161.1,157.9,156.9,156.5,134.8,132.0,131.4,129.2,128.8,123.3,123.1,123.0,121.9,116.8,115.8,113.5,112.4,108.1,107.6,104.8,103.8,103.7,95.8,47.8,36.3,32.9,32.6,25.8,23.8,22.1,17.8;HRMS(ESI)理论值C40H37O10[M+H]+677.2387,实际值677.2383。
实施例5 MaDA的同源蛋白MaDA-1及其酶活测试结果
在桑树愈伤组织的转录组中,发明人除了对MaDA进行了表达和功能验证外,还对MaDA的同源蛋白MaDA-1进行了外源表达以及酶活测试。
1、MaDA-1基因的扩增
上游引物序列:5’-AACCTGTATTTTCAGGGATCCGATCAAATTGGTCATGAAGGC-3’(SEQ IDNo:13)
下游引物序列:5’-CTCGAGACTGCAGGCTCTAGATTACCTTTTGTAATGTGGTGAAAGAG-3’(SEQ ID No:14)
PCR扩增体系和方法同MaDA,扩增出来的MaDA-1不带信号肽的核苷酸序列如SEQID No:9。
2、pI-sec-sumostar-tev2-MaDA-1质粒的构建以及蛋白的表达
根据构建pI-sec-sumostar-tev2-MaDA质粒的方法,将MaDA-1基因序列***到pI-sec-sumostar-tev2载体上,并在昆虫细胞中进行表达,所得的蛋白氨基酸序列如SEQ IDNo:16所示。SEQ ID No:16所示序列中,前20个氨基酸(MVSAIVLYVLLAAAAHSAFA)为载体本身所含的信号肽,HHHHHH为6×His标签,DSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQTPEDLDMEDNDIIEAHREQIGG为SUMO标签,ENLYFQG为TEV酶切位点。利用昆虫表达体系表达纯化出来的带有SUMO标签的成熟蛋白不含信号肽,共含648个氨基酸,其蛋白理论分子量(MWt)为73679.52,酶蛋白的理论等电点(pI)为5.96。利用TEV酶切去N端后,得到MaDA-1蛋白,其氨基酸序列如SEQ ID No:10所示。MaDA-1蛋白共含有524个氨基酸,其蛋白理论分子量(MWt)为59553.88,酶蛋白的理论等电点(pI)为7.19。通过对成熟MaDA蛋白和MaDA-1蛋白的氨基酸序列比对后发现,两者氨基酸序列高度相似,如图17所示,其中序列相同性(identity)为74%,这说明MaDA-1是MaDA的同源蛋白,可能也具有催化分子间D-A反应的活性。
3、MaDA-1酶活的测试对MaDA-1进行如下的活性测试:向97μL反应缓冲液(20mMTris·HCl,pH=8.0)中加入1μL二烯体3(终浓度100μM)以及1μL亲二烯体1(终浓度100μM),然后加入1μL带有SUMO标签的MaDA蛋白(终浓度27nM)或者MaDA-1蛋白(终浓度27nM),50℃下反应10分钟后,加入200μL甲醇淬灭反应,13,000rpm离心30min后,利用HPLC分析。在对照组不加入任何蛋白,作为空白对照。当加入MaDA或者MaDA-1时,二烯体3和亲二烯体1基本消耗完全,均能产生对应的天然产物chalcomoracin(4),如图18所示。
实施例6 MaDA的同源蛋白MaDA-2及其酶活测试结果
在桑树愈伤组织的转录组中,对MaDA的另一个同源蛋白MaDA-2进行了外源表达以及酶活测试。
1、MaDA-2基因的扩增
上游引物序列:5’-AACCTGTATTTTCAGGGATCCCATGAAGAGTTTCTTCAGTG
CC-3’(SEQ ID No:18)
下游引物序列:5’-CTCGAGACTGCAGGCTCTAGATTAATGGTGAAGAATAGGTGG-3’(SEQ IDNo:19)
PCR扩增体系和方法同MaDA,扩增出来的MaDA-2不带信号肽的核苷酸序列如SEQID No:11所示。
2、pI-sec-sumostar-tev2-MaDA-2质粒的构建以及蛋白的表达
根据构建pI-sec-sumostar-tev2-MaDA质粒的方法,将上述MaDA-2基因序列***到pI-sec-sumostar-tev2载体上,并在昆虫细胞中进行表达,所得的蛋白氨基酸序列如SEQID No:17所示。其中,前20个氨基酸(MVSAIVLYVLLAAAAHSAFA)为载体本身所含的信号肽,HHHHHH为6×His标签,DSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQTPEDLDMEDNDIIEAHREQIGG为SUMO标签,ENLYFQG为TEV酶切位点。利用昆虫表达体系表达纯化出来的带有SUMO标签的成熟蛋白不含信号肽,共含638个氨基酸,其蛋白理论分子量(MWt)为72487.69,酶蛋白的理论等电点(pI)为6.13。利用TEV酶切去N端后,得到MaDA-2蛋白,其氨基酸序列SEQ ID No:12为:
MaDA-2蛋白共含有513个氨基酸,其蛋白理论分子量(MWt)为58274.97,酶蛋白的理论等电点(pI)为8.42。通过对成熟MaDA蛋白和MaDA-2蛋白的氨基酸序列比对后发现,两者氨基酸序列高度相似,如图19所示,其中序列相同性(identity)为72%,这说明MaDA-2是MaDA的同源蛋白,具有催化分子间D-A反应的活性。
3、MaDA-2的活性测试
测定了亲二烯体1与不同的二烯体3、22、23、24在MaDA-2存在下的反应活性,具体操作为:向98μL反应缓冲液(20Mm Tris·HCl,pH=8.0)中加入1μL亲二烯体1(终浓度100μM)以及1μL不同的二烯体3、22、23、24(终浓度100μM),然后加入1μL带有SUMO标签的MaDA-2蛋白(终浓度54nM),50℃下反应5分钟后,加入200μL甲醇淬灭反应,用上述HPLC分析条件分析该反应液,得到如图20所示的活性测试结果。由图20可以看出,MaDA-2也可以催化亲二烯体1与不同的二烯体发生反应,形成对应的天然产物。除此之外,本发明还发现,MaDA-2还能识别亲二烯体5与不同的二烯体反应,生成对应天然产物,如图21所示。这些数据说明,MaDA-2与MaDA具有相同的功能,均能催化查尔酮类亲二烯体1与不同二烯体反应,生成D-A类型天然产物或者其类似物。但与MaDA不同的是,MaDA-2还能识别和利用亲二烯体5生成对应的天然产物或者其类似物。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 北京大学
<120> 一种Diels-Alder反应酶及其应用
<130> KHP191114998.3
<160> 19
<170> SIPOSequenceListing 1.0
<210> 1
<211> 550
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Gln Tyr Phe Ser Phe Pro Ser Ser Leu Ala Lys Ile Thr Ile Phe
1 5 10 15
Leu Ile Phe Ser Phe Val Phe Ala Ser Ser Ala Asn Asp Thr His Glu
20 25 30
Ala Phe Leu Glu Cys Leu Thr Thr Arg Ile Pro Ser Asn Ser Thr Phe
35 40 45
Thr Pro Gln Ser Ile Ile Tyr Thr Pro Asp Asn Pro Ser Tyr Ser Thr
50 55 60
Ile Leu Asp Ser Thr Thr Gln Asn Pro Arg Phe Leu Ser Ser Ser Thr
65 70 75 80
Arg Asn Pro Phe Ala Ile Ile Thr Pro Leu His Ala Ser His Ile Gln
85 90 95
Ala Ala Leu Tyr Cys Ser Gln Lys His Gly Glu Gln Met Arg Ile Arg
100 105 110
Ser Gly Gly His Asp Tyr Glu Gly Leu Ser Tyr Gln Ser Ser Val Pro
115 120 125
Phe Phe Ile Leu Asp Leu Arg Asn Leu Ser Ser Ile Ser Ile Asp Ala
130 135 140
Lys Ser Lys Ser Ala Trp Val Gln Ala Gly Ala Thr Ile Gly Glu Leu
145 150 155 160
Tyr Tyr Gly Ile Ala Lys Thr Ser Leu Asn Leu Ser Phe Pro Gly Gly
165 170 175
Val Ala His Thr Ile Gly Val Gly Gly Gln Leu Gly Gly Gly Gly Tyr
180 185 190
Gly Tyr Ser Thr Arg Lys Tyr Gly Leu Ala Ser Asp Asn Val Ile Asp
195 200 205
Ala Gln Leu Ile Asp Ala Arg Gly Arg Ile Leu Asp Arg Lys Thr Met
210 215 220
Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Ala Gly Ser Phe
225 230 235 240
Gly Ile Val Leu Ala Trp Lys Ile Arg Leu Val Asn Thr Pro Ser Thr
245 250 255
Val Thr Ile Phe Glu Ala Val Arg Ser Trp Glu Asn Asn Thr Thr Lys
260 265 270
Lys Phe Ile Arg Arg Tyr Gln Arg Arg Ala Ser Lys Thr Asp Lys Asp
275 280 285
Leu Thr Ile Phe Val Gly Phe Arg Thr Thr Ser Ser Thr Asp Glu Glu
290 295 300
Gly Asn Glu Arg Ile Ser Ile Leu Thr Ile Val Ser Ala Thr Phe His
305 310 315 320
Gly Ser Lys Asp Arg Leu Leu Gln Leu Val Gln Lys Glu Phe Pro Asp
325 330 335
Leu Gly Leu Val Ser Glu Glu Cys Thr Glu Met Ser Trp Val Arg Ser
340 345 350
Ile Ile His Phe Asn Leu Phe Gly Asp Glu Val Pro Leu Glu Val Leu
355 360 365
Leu Asn Arg Thr Leu Asn Phe Glu Met Lys Ala Phe Lys Leu Arg Ser
370 375 380
Asp Tyr Val Gln Lys Pro Ile Pro Asp Asp Val Leu Glu Lys Leu Leu
385 390 395 400
Ser Lys Leu Tyr Asp Glu Glu Thr Gly Glu Gly Tyr Ile Glu Phe Phe
405 410 415
Pro Tyr Gly Gly Lys Met Ser Lys Ile Ser Glu Ser Glu Ile Pro Phe
420 425 430
Pro Tyr Arg Ala Gly Asn Leu Tyr Asn Leu Arg Tyr Met Val Ser Trp
435 440 445
Lys Asp Asp Gly Asn Ile Thr Arg Thr Asn Met His Leu Ser Trp Ile
450 455 460
Lys Asp Ala Tyr Asp Tyr Met Thr Pro Tyr Val Ser Lys Asp Pro Arg
465 470 475 480
Gly Ala Tyr Leu Asn Phe Arg Asp Leu Asp Ile Gly Val Asn Val Asn
485 490 495
Glu Ser Asp Tyr Asp Tyr Val Ala Lys Ala Ser Val Trp Gly Thr Lys
500 505 510
Tyr Phe Arg Asn Asn Phe Tyr Arg Leu Val Asp Ile Lys Thr Ile Val
515 520 525
Asp Pro Thr Asn Phe Phe Lys Tyr Glu Gln Ser Ile Pro Pro Leu Pro
530 535 540
Pro Leu His Ser Ala Met
545 550
<210> 2
<211> 1653
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgcagtact tttccttccc ttcatcgtta gccaaaatca ccatctttct gatcttttca 60
tttgtattcg caagttcagc taacgacact catgaagcct ttcttgagtg cctgaccact 120
cgtataccct ccaactccac cttcaccccg caatccatca tctacactcc agataatccg 180
tcgtattcaa ctatattgga ttcaacgact caaaatcctc gttttctttc ttcttcgaca 240
agaaatccat ttgccatcat cacaccactt cacgcctccc acatacaagc cgctctttat 300
tgttcccaga aacatggcga gcagatgaga atccgaagcg gcggccatga ttatgaaggc 360
ctttcttacc agtccagtgt gccgtttttc atacttgact tgagaaactt gagttctatt 420
agtattgacg cgaagagcaa gtctgcgtgg gttcaggccg gagcgacgat tggtgaactt 480
tattatggga tagctaaaac gagcctgaat cttagctttc ccggcggcgt tgctcacact 540
atcggcgttg ggggacagtt aggtggagga ggctatggct attcgacgag aaaatatggg 600
ctcgcgtccg ataacgtcat cgacgcacag ttaatcgatg ctcgaggaag aattctcgat 660
cgaaaaacca tgggggaaga tttgttttgg gccatccgcg gtggtggagc gggaagcttc 720
ggaatcgttc ttgcctggaa aattcgcctt gttaacacac catcgacagt gactatattt 780
gaagccgtga ggagttggga aaacaataca acaaaaaagt tcatccgtcg atatcaacgt 840
cgcgcttcca aaaccgataa ggatctaacc atcttcgtcg gattccgaac tacgagttct 900
acagatgaag aagggaatga gagaatttca atactaacta tcgtctcggc cacattccac 960
ggcagcaagg ataggctcct tcagttagtg caaaaggagt ttcccgactt gggtttggtt 1020
agtgaagagt gcaccgaaat gtcatgggtt cgatccatta tccatttcaa tttattcggg 1080
gacgaagtac ccttggaggt tctactcaat agaacgctca atttcgaaat gaaggctttt 1140
aaattgagat ctgactatgt acaaaagcct attccagatg acgtgttaga aaaattattg 1200
agtaagttgt atgatgaaga gacaggagaa ggttacatcg aattttttcc ttatggagga 1260
aaaatgagta agatttcaga atctgaaatc ccgttcccat accgagccgg aaacctctac 1320
aaccttcggt acatggtgtc atggaaggat gatggaaaca ttacaagaac caacatgcat 1380
cttagctgga taaaagatgc ttacgattac atgacacctt acgtgtcaaa agatccgagg 1440
ggcgcatatc tgaacttcag agatctcgac atcggagtta atgtcaatga gagcgactac 1500
gattacgtcg cgaaagcaag cgtttggggt actaagtatt ttaggaataa tttttataga 1560
ttagttgata taaagacaat agttgatcca actaatttct ttaaatacga gcaaagtatc 1620
ccacctcttc ctcctctaca ttcagcaatg tga 1653
<210> 3
<211> 5254
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 1020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 1080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 1140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 1200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 1260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 1320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 1380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 1440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 1500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 1560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 1620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 1680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 1740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 1800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 1860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 1920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 1980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg 2040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 2100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 2160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 2220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 2280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 2340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg 2400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct 2460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga 2520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag 2580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt 2640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga 2700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac 2760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg 2820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg 2880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca 2940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact 3000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc 3060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta 3120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacatca 3180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg 3240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg 3300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca 3360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa 3420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa 3480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca 3540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac 3600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc 3660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg 3720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt 3780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt 3840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa 3900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt 3960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca 4020
ccatcgggcg cggatctagg tatgctacta gtaaatcagt cacaccaagg cttcaataag 4080
gaacacacaa gcaagatggt aagcgctatt gttttatatg tgcttttggc ggcggcggcg 4140
cattctgcct ttgcggcagg tatgggtcat caccatcatc atcacgggtc cctgcaggac 4200
tcagaagtca atcaagaagc taagccagag gtcaagccag aagtcaagcc tgagactcac 4260
atcaatttaa aggtgtccga tggatcttca gagatcttct tcaagatcaa aaagaccact 4320
cctttaagaa ggctgatgga agcgttcgct aaaagacagg gtaaggaaat ggactcctta 4380
acgttcttgt acgacggtat tgaaattcaa gctgatcaga cccctgaaga tttggacatg 4440
gaggataacg atattattga ggctcacaga gaacagattg gaggtgatta cgatatccca 4500
acgaccgaaa acctgtattt tcagggatcc ggaattcaaa ggcctacgtc gacgagctca 4560
ctagtcgcgg ccgctttcga atctagagcc tgcagtctcg aggcatgcgg taccaagctt 4620
gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt tttacttgct 4680
ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 4740
gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 4800
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 4860
tcttatcatg tctggatctg atcactgctt gagcctagga gatccgaacc agataagtga 4920
aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg acgctacacc 4980
cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc atttccaccc 5040
ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc tgttatgttt 5100
ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta ctttttctct 5160
gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat 5220
atcaacgctt atttgcagcc tgaatggcga atgg 5254
<210> 4
<211> 668
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Ala Gly Met Gly His His His His His His Gly Ser
20 25 30
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
35 40 45
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
50 55 60
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
65 70 75 80
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
85 90 95
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
100 105 110
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
115 120 125
Gly Gly Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Gly
130 135 140
Ser Asn Asp Thr His Glu Ala Phe Leu Glu Cys Leu Thr Thr Arg Ile
145 150 155 160
Pro Ser Asn Ser Thr Phe Thr Pro Gln Ser Ile Ile Tyr Thr Pro Asp
165 170 175
Asn Pro Ser Tyr Ser Thr Ile Leu Asp Ser Thr Thr Gln Asn Pro Arg
180 185 190
Phe Leu Ser Ser Ser Thr Arg Asn Pro Phe Ala Ile Ile Thr Pro Leu
195 200 205
His Ala Ser His Ile Gln Ala Ala Leu Tyr Cys Ser Gln Lys His Gly
210 215 220
Glu Gln Met Arg Ile Arg Ser Gly Gly His Asp Tyr Glu Gly Leu Ser
225 230 235 240
Tyr Gln Ser Ser Val Pro Phe Phe Ile Leu Asp Leu Arg Asn Leu Ser
245 250 255
Ser Ile Ser Ile Asp Ala Lys Ser Lys Ser Ala Trp Val Gln Ala Gly
260 265 270
Ala Thr Ile Gly Glu Leu Tyr Tyr Gly Ile Ala Lys Thr Ser Leu Asn
275 280 285
Leu Ser Phe Pro Gly Gly Val Ala His Thr Ile Gly Val Gly Gly Gln
290 295 300
Leu Gly Gly Gly Gly Tyr Gly Tyr Ser Thr Arg Lys Tyr Gly Leu Ala
305 310 315 320
Ser Asp Asn Val Ile Asp Ala Gln Leu Ile Asp Ala Arg Gly Arg Ile
325 330 335
Leu Asp Arg Lys Thr Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly
340 345 350
Gly Gly Ala Gly Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Arg Leu
355 360 365
Val Asn Thr Pro Ser Thr Val Thr Ile Phe Glu Ala Val Arg Ser Trp
370 375 380
Glu Asn Asn Thr Thr Lys Lys Phe Ile Arg Arg Tyr Gln Arg Arg Ala
385 390 395 400
Ser Lys Thr Asp Lys Asp Leu Thr Ile Phe Val Gly Phe Arg Thr Thr
405 410 415
Ser Ser Thr Asp Glu Glu Gly Asn Glu Arg Ile Ser Ile Leu Thr Ile
420 425 430
Val Ser Ala Thr Phe His Gly Ser Lys Asp Arg Leu Leu Gln Leu Val
435 440 445
Gln Lys Glu Phe Pro Asp Leu Gly Leu Val Ser Glu Glu Cys Thr Glu
450 455 460
Met Ser Trp Val Arg Ser Ile Ile His Phe Asn Leu Phe Gly Asp Glu
465 470 475 480
Val Pro Leu Glu Val Leu Leu Asn Arg Thr Leu Asn Phe Glu Met Lys
485 490 495
Ala Phe Lys Leu Arg Ser Asp Tyr Val Gln Lys Pro Ile Pro Asp Asp
500 505 510
Val Leu Glu Lys Leu Leu Ser Lys Leu Tyr Asp Glu Glu Thr Gly Glu
515 520 525
Gly Tyr Ile Glu Phe Phe Pro Tyr Gly Gly Lys Met Ser Lys Ile Ser
530 535 540
Glu Ser Glu Ile Pro Phe Pro Tyr Arg Ala Gly Asn Leu Tyr Asn Leu
545 550 555 560
Arg Tyr Met Val Ser Trp Lys Asp Asp Gly Asn Ile Thr Arg Thr Asn
565 570 575
Met His Leu Ser Trp Ile Lys Asp Ala Tyr Asp Tyr Met Thr Pro Tyr
580 585 590
Val Ser Lys Asp Pro Arg Gly Ala Tyr Leu Asn Phe Arg Asp Leu Asp
595 600 605
Ile Gly Val Asn Val Asn Glu Ser Asp Tyr Asp Tyr Val Ala Lys Ala
610 615 620
Ser Val Trp Gly Thr Lys Tyr Phe Arg Asn Asn Phe Tyr Arg Leu Val
625 630 635 640
Asp Ile Lys Thr Ile Val Asp Pro Thr Asn Phe Phe Lys Tyr Glu Gln
645 650 655
Ser Ile Pro Pro Leu Pro Pro Leu His Ser Ala Met
660 665
<210> 5
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aacctgtatt ttcagggatc caacgacact catgaagcct ttcttg 46
<210> 6
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ctcgagactg caggctctag atcacattgc tgaatgtaga ggaggaagag 50
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
aaatgataac catctcgc 18
<210> 8
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggaggataac gatattattg aggc 24
<210> 9
<211> 1575
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gatcaaattg gtcatgaagg ctttcttaag tgcctgatca ctcgtatatc caaatccaac 60
tctacctcca cttctgaatc cattatctac actcaaaata atccctctta ttcaactata 120
ttgacttcaa cgatgcagaa tcctcgtttt ctttctcttc caatcccaaa accattcgtt 180
atcgtaacac cattacatgt ctcccacgtc caagccactc tttactgcgc caagaaacat 240
gacatacaaa tcagaatccg aagtggtggc catgattacg agggcctttc ttatatgtct 300
aatgtcactt ttgtcatact tgacttgaga aacttaagtt ctattaacat tgacgtgaag 360
aggaagtctg catgggttca gtccggagca accattggcg aactttatta taggattgct 420
gagaaaagcc taagtcttgc cttccctgga gggcttggcc acactattgg tgttggagga 480
cagttaggtg gaggaggcta tggctattcg acgcgaaagt acgggctcgc atctgataat 540
attattgacg cccaatttat ggacgtgcaa ggaagaattc tcaatcggaa atctatgggg 600
gaagatttgt tttgggccat acgcggtggt ggagctggaa gcttcggaat tgttctcgcc 660
tggaaaatcc gactggtgga cgtgcctacg acagtgaccg tatttgaagc cgtaaggaag 720
tgggaaaaca atgcaacaaa gaagtttgtt catcggtatc aacgccgtat tgccgacatc 780
gataaggatc taactatctt tcttggattc caaactgcga atactggcga tgaacaaggg 840
aacacgaaaa ttgaagtatt agctgtcatc tcagcaacat ttcacggcag tcaagataag 900
gtccttccat tgatgcagaa ggagtttccc gagttgggtt tgcttaaaga agaatgcata 960
gaaatgccgt gggtccgatc cattatgcat tacaactttt tccgaaacgg agagccctta 1020
gaagttctac tcaatagaac acttaatttc gagatgaagg ctttcaaatt gaaatctgac 1080
tacgtgaaag agcctattcc agatgacgtg ttggaaaaat tgttgggcaa gttgtatgag 1140
gaagaaatag gagaaggtta cattgaactt tttccttatg gagggaagat gaatgagatt 1200
tcagaatctg aaattccgtt cccacatcga gctgggaacc tctacaacct tcggtacttg 1260
gtgtcatgga tagacgatgg aaatattacg agaaccaacg agcatattcg ctgggtaaga 1320
agtgcttacg attacatgac tccttttgtt tcaaagaatc ctaggggtgc gtatctcaac 1380
ttcagagacc ttgacatcgg gattaattcc gatgaggatg attacaacta tgttgcacaa 1440
gcaagcattt ggggcactaa gtattttaaa agcaatttct ataggttggt ttatgtaaag 1500
actttagttg atccgactaa tttctttaca tacgaacaaa gcatcccacc tctttcacca 1560
cattacaaaa ggtaa 1575
<210> 10
<211> 524
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Asp Gln Ile Gly His Glu Gly Phe Leu Lys Cys Leu Ile Thr Arg Ile
1 5 10 15
Ser Lys Ser Asn Ser Thr Ser Thr Ser Glu Ser Ile Ile Tyr Thr Gln
20 25 30
Asn Asn Pro Ser Tyr Ser Thr Ile Leu Thr Ser Thr Met Gln Asn Pro
35 40 45
Arg Phe Leu Ser Leu Pro Ile Pro Lys Pro Phe Val Ile Val Thr Pro
50 55 60
Leu His Val Ser His Val Gln Ala Thr Leu Tyr Cys Ala Lys Lys His
65 70 75 80
Asp Ile Gln Ile Arg Ile Arg Ser Gly Gly His Asp Tyr Glu Gly Leu
85 90 95
Ser Tyr Met Ser Asn Val Thr Phe Val Ile Leu Asp Leu Arg Asn Leu
100 105 110
Ser Ser Ile Asn Ile Asp Val Lys Arg Lys Ser Ala Trp Val Gln Ser
115 120 125
Gly Ala Thr Ile Gly Glu Leu Tyr Tyr Arg Ile Ala Glu Lys Ser Leu
130 135 140
Ser Leu Ala Phe Pro Gly Gly Leu Gly His Thr Ile Gly Val Gly Gly
145 150 155 160
Gln Leu Gly Gly Gly Gly Tyr Gly Tyr Ser Thr Arg Lys Tyr Gly Leu
165 170 175
Ala Ser Asp Asn Ile Ile Asp Ala Gln Phe Met Asp Val Gln Gly Arg
180 185 190
Ile Leu Asn Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg
195 200 205
Gly Gly Gly Ala Gly Ser Phe Gly Ile Val Leu Ala Trp Lys Ile Arg
210 215 220
Leu Val Asp Val Pro Thr Thr Val Thr Val Phe Glu Ala Val Arg Lys
225 230 235 240
Trp Glu Asn Asn Ala Thr Lys Lys Phe Val His Arg Tyr Gln Arg Arg
245 250 255
Ile Ala Asp Ile Asp Lys Asp Leu Thr Ile Phe Leu Gly Phe Gln Thr
260 265 270
Ala Asn Thr Gly Asp Glu Gln Gly Asn Thr Lys Ile Glu Val Leu Ala
275 280 285
Val Ile Ser Ala Thr Phe His Gly Ser Gln Asp Lys Val Leu Pro Leu
290 295 300
Met Gln Lys Glu Phe Pro Glu Leu Gly Leu Leu Lys Glu Glu Cys Ile
305 310 315 320
Glu Met Pro Trp Val Arg Ser Ile Met His Tyr Asn Phe Phe Arg Asn
325 330 335
Gly Glu Pro Leu Glu Val Leu Leu Asn Arg Thr Leu Asn Phe Glu Met
340 345 350
Lys Ala Phe Lys Leu Lys Ser Asp Tyr Val Lys Glu Pro Ile Pro Asp
355 360 365
Asp Val Leu Glu Lys Leu Leu Gly Lys Leu Tyr Glu Glu Glu Ile Gly
370 375 380
Glu Gly Tyr Ile Glu Leu Phe Pro Tyr Gly Gly Lys Met Asn Glu Ile
385 390 395 400
Ser Glu Ser Glu Ile Pro Phe Pro His Arg Ala Gly Asn Leu Tyr Asn
405 410 415
Leu Arg Tyr Leu Val Ser Trp Ile Asp Asp Gly Asn Ile Thr Arg Thr
420 425 430
Asn Glu His Ile Arg Trp Val Arg Ser Ala Tyr Asp Tyr Met Thr Pro
435 440 445
Phe Val Ser Lys Asn Pro Arg Gly Ala Tyr Leu Asn Phe Arg Asp Leu
450 455 460
Asp Ile Gly Ile Asn Ser Asp Glu Asp Asp Tyr Asn Tyr Val Ala Gln
465 470 475 480
Ala Ser Ile Trp Gly Thr Lys Tyr Phe Lys Ser Asn Phe Tyr Arg Leu
485 490 495
Val Tyr Val Lys Thr Leu Val Asp Pro Thr Asn Phe Phe Thr Tyr Glu
500 505 510
Gln Ser Ile Pro Pro Leu Ser Pro His Tyr Lys Arg
515 520
<210> 11
<211> 1542
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
catgaagagt ttcttcagtg cctgagctct cgtataccca agtccattat ctatgcttca 60
aataacccct cgtattcaaa tgtattagat tcgacgactc aaaatcctcg tttcctttct 120
tcttcgacca gaaatccatc tgttatcgtc acaccgttta aaatctccca catacaaccc 180
accatttact gctccaagaa acatggcgtg cagataagaa ttcgaagcgg tgggcatgat 240
tatgaaggcc tttcttatca gtccagtgtc ccatttttca tactcgactt gagaaacata 300
aattccattc aagttgatgt ggagaagaag agtgcatggg ttgaggcagg tgcgacgctc 360
ggcgaacttt actacagtat cgctaaaaaa agcaaaacgc ttggcttccc tggcggtctt 420
tgcagcaccg ttggtgtcgg tggacagtta ggtggaggag gctatggcta tcaatcgcga 480
acatatgggc tcgcatctga taatattatt gatgcgcaat taatcgacgc tcgaggaaga 540
attctcaatc ggaaatccat gggggaggat ttgttctggg ccattcgcgg tggtggagca 600
ggaagcttcg gaattgtaat tgcctggaag gttcgactca ttgacgtgcc ttcgacagtg 660
actgtctttg aaactgtacg catgtgggaa gataatgtaa cgaagaagtt tgttcatcga 720
tatcaacgtc gtgcttccaa catcgataag gatctaacta tcttcttggg attccgaacc 780
acaaatacta gtgatgaaca agggaattca aagattcaaa taataaccat catctcagcc 840
acattccatg gcagcaggga taggctcctt ccattgatgc aagaggagtt tcccgagttg 900
ggtttgggca aagaagattt caaagaaatg tcatgggtcc aatctattgt ccattacaat 960
aattacaaag acgatgatcc cttggaagtt ctactcaaca aaacagtcaa tttcgaaccc 1020
aaccctttca aattgaaatc tgactatgtg aaaaagccta ttccagatga cgtgttggaa 1080
aaattgctgg ctcggttgta cgaagaagac ataggatatg attttgtgga attttttcca 1140
tatggaggaa aattgagcga gatttcagaa tctgaaatcc cattcccaca tcgagctgga 1200
aacctctaca accttcggta catggcttca tggaaacaag gcgaaaatac tacaagaatc 1260
aacaaccatc ttagctgggt aagaagtgtt tatgattcca tgactcctta tgtgtcaaag 1320
aatccaaggg gtgcatatct caactttaga gaccttgaca tcggggttaa tcctaatgag 1380
agtgacccca caagtgctta taactatgtt aaacaagcaa gcgtttgggg tactaagtat 1440
tttaagaaca atttctacaa aatggtgttt ataaagactt tagttgatcc aactaatttc 1500
tttacatacg aacaaagcat cccacctatt cttcaccatt aa 1542
<210> 12
<211> 513
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 12
His Glu Glu Phe Leu Gln Cys Leu Ser Ser Arg Ile Pro Lys Ser Ile
1 5 10 15
Ile Tyr Ala Ser Asn Asn Pro Ser Tyr Ser Asn Val Leu Asp Ser Thr
20 25 30
Thr Gln Asn Pro Arg Phe Leu Ser Ser Ser Thr Arg Asn Pro Ser Val
35 40 45
Ile Val Thr Pro Phe Lys Ile Ser His Ile Gln Pro Thr Ile Tyr Cys
50 55 60
Ser Lys Lys His Gly Val Gln Ile Arg Ile Arg Ser Gly Gly His Asp
65 70 75 80
Tyr Glu Gly Leu Ser Tyr Gln Ser Ser Val Pro Phe Phe Ile Leu Asp
85 90 95
Leu Arg Asn Ile Asn Ser Ile Gln Val Asp Val Glu Lys Lys Ser Ala
100 105 110
Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Leu Tyr Tyr Ser Ile Ala
115 120 125
Lys Lys Ser Lys Thr Leu Gly Phe Pro Gly Gly Leu Cys Ser Thr Val
130 135 140
Gly Val Gly Gly Gln Leu Gly Gly Gly Gly Tyr Gly Tyr Gln Ser Arg
145 150 155 160
Thr Tyr Gly Leu Ala Ser Asp Asn Ile Ile Asp Ala Gln Leu Ile Asp
165 170 175
Ala Arg Gly Arg Ile Leu Asn Arg Lys Ser Met Gly Glu Asp Leu Phe
180 185 190
Trp Ala Ile Arg Gly Gly Gly Ala Gly Ser Phe Gly Ile Val Ile Ala
195 200 205
Trp Lys Val Arg Leu Ile Asp Val Pro Ser Thr Val Thr Val Phe Glu
210 215 220
Thr Val Arg Met Trp Glu Asp Asn Val Thr Lys Lys Phe Val His Arg
225 230 235 240
Tyr Gln Arg Arg Ala Ser Asn Ile Asp Lys Asp Leu Thr Ile Phe Leu
245 250 255
Gly Phe Arg Thr Thr Asn Thr Ser Asp Glu Gln Gly Asn Ser Lys Ile
260 265 270
Gln Ile Ile Thr Ile Ile Ser Ala Thr Phe His Gly Ser Arg Asp Arg
275 280 285
Leu Leu Pro Leu Met Gln Glu Glu Phe Pro Glu Leu Gly Leu Gly Lys
290 295 300
Glu Asp Phe Lys Glu Met Ser Trp Val Gln Ser Ile Val His Tyr Asn
305 310 315 320
Asn Tyr Lys Asp Asp Asp Pro Leu Glu Val Leu Leu Asn Lys Thr Val
325 330 335
Asn Phe Glu Pro Asn Pro Phe Lys Leu Lys Ser Asp Tyr Val Lys Lys
340 345 350
Pro Ile Pro Asp Asp Val Leu Glu Lys Leu Leu Ala Arg Leu Tyr Glu
355 360 365
Glu Asp Ile Gly Tyr Asp Phe Val Glu Phe Phe Pro Tyr Gly Gly Lys
370 375 380
Leu Ser Glu Ile Ser Glu Ser Glu Ile Pro Phe Pro His Arg Ala Gly
385 390 395 400
Asn Leu Tyr Asn Leu Arg Tyr Met Ala Ser Trp Lys Gln Gly Glu Asn
405 410 415
Thr Thr Arg Ile Asn Asn His Leu Ser Trp Val Arg Ser Val Tyr Asp
420 425 430
Ser Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Gly Ala Tyr Leu Asn
435 440 445
Phe Arg Asp Leu Asp Ile Gly Val Asn Pro Asn Glu Ser Asp Pro Thr
450 455 460
Ser Ala Tyr Asn Tyr Val Lys Gln Ala Ser Val Trp Gly Thr Lys Tyr
465 470 475 480
Phe Lys Asn Asn Phe Tyr Lys Met Val Phe Ile Lys Thr Leu Val Asp
485 490 495
Pro Thr Asn Phe Phe Thr Tyr Glu Gln Ser Ile Pro Pro Ile Leu His
500 505 510
His
<210> 13
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aacctgtatt ttcagggatc cgatcaaatt ggtcatgaag gc 42
<210> 14
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ctcgagactg caggctctag attacctttt gtaatgtggt gaaagag 47
<210> 15
<211> 121
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gattacgata tcccaacgac cgaaaacctg tattttcagg gatccggaat tcaaaggcct 60
acgtcgacga gctcactagt cgcggccgct ttcgaatcta gagcctgcag tctcgaggca 120
t 121
<210> 16
<211> 669
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Ala Gly Met Gly His His His His His His Gly Ser
20 25 30
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
35 40 45
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
50 55 60
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
65 70 75 80
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
85 90 95
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
100 105 110
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
115 120 125
Gly Gly Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Gly
130 135 140
Ser Asp Gln Ile Gly His Glu Gly Phe Leu Lys Cys Leu Ile Thr Arg
145 150 155 160
Ile Ser Lys Ser Asn Ser Thr Ser Thr Ser Glu Ser Ile Ile Tyr Thr
165 170 175
Gln Asn Asn Pro Ser Tyr Ser Thr Ile Leu Thr Ser Thr Met Gln Asn
180 185 190
Pro Arg Phe Leu Ser Leu Pro Ile Pro Lys Pro Phe Val Ile Val Thr
195 200 205
Pro Leu His Val Ser His Val Gln Ala Thr Leu Tyr Cys Ala Lys Lys
210 215 220
His Asp Ile Gln Ile Arg Ile Arg Ser Gly Gly His Asp Tyr Glu Gly
225 230 235 240
Leu Ser Tyr Met Ser Asn Val Thr Phe Val Ile Leu Asp Leu Arg Asn
245 250 255
Leu Ser Ser Ile Asn Ile Asp Val Lys Arg Lys Ser Ala Trp Val Gln
260 265 270
Ser Gly Ala Thr Ile Gly Glu Leu Tyr Tyr Arg Ile Ala Glu Lys Ser
275 280 285
Leu Ser Leu Ala Phe Pro Gly Gly Leu Gly His Thr Ile Gly Val Gly
290 295 300
Gly Gln Leu Gly Gly Gly Gly Tyr Gly Tyr Ser Thr Arg Lys Tyr Gly
305 310 315 320
Leu Ala Ser Asp Asn Ile Ile Asp Ala Gln Phe Met Asp Val Gln Gly
325 330 335
Arg Ile Leu Asn Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile
340 345 350
Arg Gly Gly Gly Ala Gly Ser Phe Gly Ile Val Leu Ala Trp Lys Ile
355 360 365
Arg Leu Val Asp Val Pro Thr Thr Val Thr Val Phe Glu Ala Val Arg
370 375 380
Lys Trp Glu Asn Asn Ala Thr Lys Lys Phe Val His Arg Tyr Gln Arg
385 390 395 400
Arg Ile Ala Asp Ile Asp Lys Asp Leu Thr Ile Phe Leu Gly Phe Gln
405 410 415
Thr Ala Asn Thr Gly Asp Glu Gln Gly Asn Thr Lys Ile Glu Val Leu
420 425 430
Ala Val Ile Ser Ala Thr Phe His Gly Ser Gln Asp Lys Val Leu Pro
435 440 445
Leu Met Gln Lys Glu Phe Pro Glu Leu Gly Leu Leu Lys Glu Glu Cys
450 455 460
Ile Glu Met Pro Trp Val Arg Ser Ile Met His Tyr Asn Phe Phe Arg
465 470 475 480
Asn Gly Glu Pro Leu Glu Val Leu Leu Asn Arg Thr Leu Asn Phe Glu
485 490 495
Met Lys Ala Phe Lys Leu Lys Ser Asp Tyr Val Lys Glu Pro Ile Pro
500 505 510
Asp Asp Val Leu Glu Lys Leu Leu Gly Lys Leu Tyr Glu Glu Glu Ile
515 520 525
Gly Glu Gly Tyr Ile Glu Leu Phe Pro Tyr Gly Gly Lys Met Asn Glu
530 535 540
Ile Ser Glu Ser Glu Ile Pro Phe Pro His Arg Ala Gly Asn Leu Tyr
545 550 555 560
Asn Leu Arg Tyr Leu Val Ser Trp Ile Asp Asp Gly Asn Ile Thr Arg
565 570 575
Thr Asn Glu His Ile Arg Trp Val Arg Ser Ala Tyr Asp Tyr Met Thr
580 585 590
Pro Phe Val Ser Lys Asn Pro Arg Gly Ala Tyr Leu Asn Phe Arg Asp
595 600 605
Leu Asp Ile Gly Ile Asn Ser Asp Glu Asp Asp Tyr Asn Tyr Val Ala
610 615 620
Gln Ala Ser Ile Trp Gly Thr Lys Tyr Phe Lys Ser Asn Phe Tyr Arg
625 630 635 640
Leu Val Tyr Val Lys Thr Leu Val Asp Pro Thr Asn Phe Phe Thr Tyr
645 650 655
Glu Gln Ser Ile Pro Pro Leu Ser Pro His Tyr Lys Arg
660 665
<210> 17
<211> 658
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 17
Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala Ala His
1 5 10 15
Ser Ala Phe Ala Ala Gly Met Gly His His His His His His Gly Ser
20 25 30
Leu Gln Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro
35 40 45
Glu Val Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser
50 55 60
Ser Glu Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu
65 70 75 80
Met Glu Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr
85 90 95
Phe Leu Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Thr Pro Glu Asp
100 105 110
Leu Asp Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile
115 120 125
Gly Gly Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Gly
130 135 140
Ser His Glu Glu Phe Leu Gln Cys Leu Ser Ser Arg Ile Pro Lys Ser
145 150 155 160
Ile Ile Tyr Ala Ser Asn Asn Pro Ser Tyr Ser Asn Val Leu Asp Ser
165 170 175
Thr Thr Gln Asn Pro Arg Phe Leu Ser Ser Ser Thr Arg Asn Pro Ser
180 185 190
Val Ile Val Thr Pro Phe Lys Ile Ser His Ile Gln Pro Thr Ile Tyr
195 200 205
Cys Ser Lys Lys His Gly Val Gln Ile Arg Ile Arg Ser Gly Gly His
210 215 220
Asp Tyr Glu Gly Leu Ser Tyr Gln Ser Ser Val Pro Phe Phe Ile Leu
225 230 235 240
Asp Leu Arg Asn Ile Asn Ser Ile Gln Val Asp Val Glu Lys Lys Ser
245 250 255
Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Leu Tyr Tyr Ser Ile
260 265 270
Ala Lys Lys Ser Lys Thr Leu Gly Phe Pro Gly Gly Leu Cys Ser Thr
275 280 285
Val Gly Val Gly Gly Gln Leu Gly Gly Gly Gly Tyr Gly Tyr Gln Ser
290 295 300
Arg Thr Tyr Gly Leu Ala Ser Asp Asn Ile Ile Asp Ala Gln Leu Ile
305 310 315 320
Asp Ala Arg Gly Arg Ile Leu Asn Arg Lys Ser Met Gly Glu Asp Leu
325 330 335
Phe Trp Ala Ile Arg Gly Gly Gly Ala Gly Ser Phe Gly Ile Val Ile
340 345 350
Ala Trp Lys Val Arg Leu Ile Asp Val Pro Ser Thr Val Thr Val Phe
355 360 365
Glu Thr Val Arg Met Trp Glu Asp Asn Val Thr Lys Lys Phe Val His
370 375 380
Arg Tyr Gln Arg Arg Ala Ser Asn Ile Asp Lys Asp Leu Thr Ile Phe
385 390 395 400
Leu Gly Phe Arg Thr Thr Asn Thr Ser Asp Glu Gln Gly Asn Ser Lys
405 410 415
Ile Gln Ile Ile Thr Ile Ile Ser Ala Thr Phe His Gly Ser Arg Asp
420 425 430
Arg Leu Leu Pro Leu Met Gln Glu Glu Phe Pro Glu Leu Gly Leu Gly
435 440 445
Lys Glu Asp Phe Lys Glu Met Ser Trp Val Gln Ser Ile Val His Tyr
450 455 460
Asn Asn Tyr Lys Asp Asp Asp Pro Leu Glu Val Leu Leu Asn Lys Thr
465 470 475 480
Val Asn Phe Glu Pro Asn Pro Phe Lys Leu Lys Ser Asp Tyr Val Lys
485 490 495
Lys Pro Ile Pro Asp Asp Val Leu Glu Lys Leu Leu Ala Arg Leu Tyr
500 505 510
Glu Glu Asp Ile Gly Tyr Asp Phe Val Glu Phe Phe Pro Tyr Gly Gly
515 520 525
Lys Leu Ser Glu Ile Ser Glu Ser Glu Ile Pro Phe Pro His Arg Ala
530 535 540
Gly Asn Leu Tyr Asn Leu Arg Tyr Met Ala Ser Trp Lys Gln Gly Glu
545 550 555 560
Asn Thr Thr Arg Ile Asn Asn His Leu Ser Trp Val Arg Ser Val Tyr
565 570 575
Asp Ser Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Gly Ala Tyr Leu
580 585 590
Asn Phe Arg Asp Leu Asp Ile Gly Val Asn Pro Asn Glu Ser Asp Pro
595 600 605
Thr Ser Ala Tyr Asn Tyr Val Lys Gln Ala Ser Val Trp Gly Thr Lys
610 615 620
Tyr Phe Lys Asn Asn Phe Tyr Lys Met Val Phe Ile Lys Thr Leu Val
625 630 635 640
Asp Pro Thr Asn Phe Phe Thr Tyr Glu Gln Ser Ile Pro Pro Ile Leu
645 650 655
His His
<210> 18
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aacctgtatt ttcagggatc ccatgaagag tttcttcagt gcc 43
<210> 19
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ctcgagactg caggctctag attaatggtg aagaataggt gg 42

Claims (14)

1.一种Diels-Alder反应酶,其来源于桑树,命名为MaDA酶,氨基酸序列如SEQ ID No.1所示。
2.权利要求1所述Diels-Alder反应酶的同源蛋白,其为MaDA-1,其氨基酸序列如SEQID No.10所示。
3.权利要求1所述Diels-Alder反应酶的同源蛋白,其为MaDA-2,其氨基酸序列如SEQID No.12所示。
4.编码权利要求1所述Diels-Alder反应酶的基因,所述基因的核苷酸序列如SEQ IDNo.2所示。
5.编码权利要求2所述同源蛋白的基因,所述基因的核苷酸序列如SEQ ID No.9所示。
6.编码权利要求3所述同源蛋白的基因,所述基因的核苷酸序列如SEQ ID No.11所示。
7.含有权利要求4-6任一项所述基因的生物材料,所述生物材料为表达盒、质粒或载体。
8.如权利要求7所述的生物材料,其特征在于,所述生物材料为含有权利要求4-6任一项所述基因的表达载体pI-sec-sumostar-tev2,所述表达载体pI-sec-sumostar-tev2的核苷酸序列如SEQ ID No.3所示。
9.权利要求7所述的生物材料在昆虫细胞中表达MaDA酶蛋白的应用,所述MaDA酶蛋白的氨基酸序列如SEQ ID No.1所示;或如SEQ ID No.10所示;或如SEQ ID No.12所示。
10.权利要求1所述Diels-Alder反应酶或其编码基因或权利要求7所述的生物材料在催化Diels-Alder反应制备含有六元环骨架的桑树天然产物,或制备立体专一性合成endo构型的桑树天然产物中的应用。
11.如权利要求10所述的应用,其特征在于,所述桑树天然产物为黄酮类天然产物或其类似物。
12.如权利要求11所述的应用,其特征在于,以亲二烯体和二烯体为底物,以权利要求1所述Diels-Alder反应酶为催化酶,进行反应,立体专一性合成endo构型天然产物;所述二烯体为含有脱氢异戊烯基的化合物。
13.如权利要求12所述的应用,其特征在于,所述亲二烯体为查尔酮或其衍生物,所述二烯体为含有脱氢异戊烯基的黄酮、二苯乙烯、查尔酮或苯并呋喃。
14.如权利要求12所述的应用,其特征在于,所述反应的温度为50℃, pH为8.0。
CN201911136243.7A 2019-11-19 2019-11-19 一种Diels-Alder反应酶及其应用 Active CN110951700B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201911136243.7A CN110951700B (zh) 2019-11-19 2019-11-19 一种Diels-Alder反应酶及其应用
US16/951,916 US11293015B2 (en) 2019-11-19 2020-11-18 Diels-Alderase and use thereof
EP20208549.4A EP3825398A1 (en) 2019-11-19 2020-11-19 Diels-alderase and use thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911136243.7A CN110951700B (zh) 2019-11-19 2019-11-19 一种Diels-Alder反应酶及其应用

Publications (2)

Publication Number Publication Date
CN110951700A CN110951700A (zh) 2020-04-03
CN110951700B true CN110951700B (zh) 2021-10-08

Family

ID=69977752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911136243.7A Active CN110951700B (zh) 2019-11-19 2019-11-19 一种Diels-Alder反应酶及其应用

Country Status (3)

Country Link
US (1) US11293015B2 (zh)
EP (1) EP3825398A1 (zh)
CN (1) CN110951700B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113943716B (zh) * 2021-10-21 2023-12-26 北京大学 一种分子间exo选择性Diels-Alder反应酶及其应用
CN114438060B (zh) * 2022-02-18 2023-07-21 嘉兴维亚生物科技有限公司 一种重组改性ulp1蛋白酶及其制备方法
CN114480346B (zh) * 2022-02-18 2023-07-21 嘉兴维亚生物科技有限公司 一种dna水解酶及其制备方法
WO2024054685A2 (en) * 2022-09-09 2024-03-14 Arkansas State Universtiy-Jonesboro Botanical compositions and methods of production and use thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4528373A (en) * 1982-03-02 1985-07-09 Plastics Engineering Company Vinylacetylene-terminated polyimide derivatives
WO2010077470A3 (en) * 2008-11-19 2010-10-21 University Of Washington Enzyme catalysts for diels-alder reactions
CN102271712A (zh) * 2008-10-31 2011-12-07 通用医疗公司 用于将物质递送至生物靶标的组合物和方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2220222A4 (en) * 2007-11-19 2011-10-12 Univ California NEW ANALYSIS FOR EGFR INHIBITORS
US20090264317A1 (en) * 2008-04-18 2009-10-22 University Of Massachusetts Functionalized nanostructure, methods of manufacture thereof and articles comprising the same
US9650656B2 (en) * 2012-04-04 2017-05-16 The Regents Of The University Of Michigan Biosynthetic systems producing fungal indole alkaloids
WO2014201603A1 (en) * 2013-06-17 2014-12-24 Shanghai Pengxin Advanced Materials Technologies, Ltd. A general method for functionalizing carbon nanotubes via solvent free diels-alder reactions
EP3230457B1 (en) * 2014-12-09 2021-06-30 New York University Clostridial neurotoxin fusion proteins, propeptide fusions, their expression, and use

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4528373A (en) * 1982-03-02 1985-07-09 Plastics Engineering Company Vinylacetylene-terminated polyimide derivatives
CN102271712A (zh) * 2008-10-31 2011-12-07 通用医疗公司 用于将物质递送至生物靶标的组合物和方法
WO2010077470A3 (en) * 2008-11-19 2010-10-21 University Of Washington Enzyme catalysts for diels-alder reactions

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
光酶诱导桑叶中Diels-Alderase的分离鉴定及克隆表达研究;虞姣姣;《中国优秀硕士学位论文全文数据库基础科学辑》;20181115;全文 *
桑叶中Diels-Alderase的提取与初步纯化;傅铮铮;《中国优秀硕士学位论文全文数据库医药卫生科技辑》;20170815;全文 *

Also Published As

Publication number Publication date
US11293015B2 (en) 2022-04-05
CN110951700A (zh) 2020-04-03
EP3825398A1 (en) 2021-05-26
US20210147820A1 (en) 2021-05-20

Similar Documents

Publication Publication Date Title
CN110951700B (zh) 一种Diels-Alder反应酶及其应用
CN110923183A (zh) 产羊毛甾醇大肠杆菌菌株的构建方法
CN110229838B (zh) 一种生物转化类固醇类化合物获取羟基化化合物的方法
CN110964702B (zh) 一种Diels-Alder反应酶的应用及其突变体的制备方法与应用
CN112553176A (zh) 一种热稳定性提高的谷氨酰胺转氨酶
CN114426957B (zh) 一种糖醛酸脱氢酶突变体及其在制备糖二酸中的应用
CN106755031B (zh) 鼠李糖脂生产质粒及其构建方法与大肠杆菌工程菌和应用
CN115247173A (zh) 构建tmprss6基因突变的缺铁性贫血猪核移植供体细胞的基因编辑***及其应用
CN113755512B (zh) 一种制备串联重复蛋白质的方法与应用
CN111748034A (zh) 一种滑液囊支原体单克隆抗体的制备方法
CN107075495B (zh) 裂解酶和编码该裂解酶的dna、含该dna的载体以及用于不对称合成(s)-苯基乙酰基甲醇的方法
CN106715689B (zh) 裂解酶以及不对称合成(s)-苯基乙酰基甲醇的方法
CN113980883B (zh) 一种高产羟基化甾体原料药的重组大肠杆菌及其应用
RU2774333C1 (ru) Рекомбинантная плазмида pET-GST-3CL-GPG, обеспечивающая синтез протеазы 3CL SARS-CoV-2 в клетках E.coli в растворимой форме
CN107354172B (zh) 重组表达载体及其构建方法和应用
CN112553177B (zh) 一种热稳定性提高的谷氨酰胺转氨酶变体
CN114317473B (zh) 一种催化活性和热稳定性提高的谷氨酰胺转氨酶变体
RU2792132C1 (ru) Рекомбинантная плазмида pET-GST-3CL, обеспечивающая синтез протеазы 3CL SARS-CoV-2 в клетках E.coli в растворимой форме
CN115161335B (zh) 用于构建tardbp基因突变的als模型猪核移植供体细胞的基因编辑***及其应用
KR101137021B1 (ko) 퓨조박테리움 뉴클레텀 유래의 신규 글리코실트랜스퍼라제및 이를 이용한 올리고당 제조방법
CN115247191A (zh) 基因编辑***及其在构建双基因突变的痣样基底细胞癌综合征猪核移植供体细胞中的应用
CN115232818A (zh) 构建dok7基因突变的先天性肌无力模型猪核移植供体细胞的基因编辑***及其应用
CN115232811A (zh) 用于构建hbb基因突变的镰刀型细胞贫血症模型猪核移植供体细胞的方法及应用
CN115232815A (zh) 构建mip基因突变的白内障疾病模型猪核移植供体细胞的基因编辑***及其应用
CN115247153A (zh) 用于构建hnf1a基因突变的糖尿病模型猪核移植供体细胞的基因编辑***及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210108

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant after: Peking University

Applicant after: INSTITUTE OF MATARIA MEDICA, CHINESE ACADEMY OF MEDICAL SCIENCES

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant before: Peking University

GR01 Patent grant
GR01 Patent grant