CN114317470B - 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用 - Google Patents

化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用 Download PDF

Info

Publication number
CN114317470B
CN114317470B CN202111627219.0A CN202111627219A CN114317470B CN 114317470 B CN114317470 B CN 114317470B CN 202111627219 A CN202111627219 A CN 202111627219A CN 114317470 B CN114317470 B CN 114317470B
Authority
CN
China
Prior art keywords
compound
oxal
gene
protein
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111627219.0A
Other languages
English (en)
Other versions
CN114317470A (zh
Inventor
余利岩
张涛
张德武
谷国威
苏静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medicinal Biotechnology of CAMS
Original Assignee
Institute of Medicinal Biotechnology of CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medicinal Biotechnology of CAMS filed Critical Institute of Medicinal Biotechnology of CAMS
Priority to CN202111627219.0A priority Critical patent/CN114317470B/zh
Publication of CN114317470A publication Critical patent/CN114317470A/zh
Application granted granted Critical
Publication of CN114317470B publication Critical patent/CN114317470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了化合物oxalicine B生物合成基因簇和C‑15羟基化酶OxaL以及应用。本发明提供了序列3所示OxaL蛋白或其相关生物材料的应用:作为羟化酶的应用;(a2)在制备羟化酶中的应用。本发明还保护序列1所示15‑deoxyoxalicine B生物合成基因簇。本发明还保护所述15‑deoxyoxalicine B生物合成基因簇在合成化合物oxalicine B中的应用。本发明所提供的所有基因和蛋白信息可以帮助人们理解a‑吡喃酮类杂萜家族天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。

Description

化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以 及应用
技术领域
本发明属于微生物基因资源、基因工程和生物酶开发领域,具体涉及抗艾滋病病毒(HIV-1)的化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用。
背景技术
Oxalicine B具有独特的化学结构,是由吡啶基-α-吡喃酮单元和二萜单元聚合而成的六环系骨架的新颖结构化合物,分子式为C30H33NO7,分子量为519。
Oxalicine B属于含a-吡喃酮类杂萜化合物家族(含a-吡喃酮类杂萜化合物家族的结构示意图见图1)。随着该家族其他化合物的发现和鉴定,这一独特的化学结构吸引了许多有机化学家从事其化学合成研究。Oxalicines是真菌的次生代谢产物,主要分离自青霉属,此类化合物最早是由Ubillas于1989年首次从草酸青霉(Penicillium oxalicum)的菌丝体中提取到。至今为止,研究者已经陆续从青霉菌P.thiersii,P.decaturense和一株曲霉菌中分离得到了oxalicines类分子。oxalicines类化合物主要有抗虫活性,研究发现,化合物oxalicine B对草地贪夜蛾Spodoptera frugiperda具有很强的杀虫活性,该类化合物还有一定的细胞毒活性。同时,实验室前期研究发现oxalicine类化合物具有抗病毒活性,oxalicine B具有抗艾滋病病毒(HIV-1)活性,oxalicine A具有良好的抗甲型流感病毒(H1N1)活性。
2015年,Yaegashi,J等从青霉菌P.canescens ATCC 10419中鉴定到15-deoxyoxalicine B的生物合成基因簇(olc),并利用生物信息学与基因敲除策略对15-deoxyoxalicine B生物合成途径进行了阐述和解析。15-deoxyoxalicine B的生物合成基因簇的生物合成途径如图2所示。杂萜分子15-deoxyoxalicine B生物合成中非萜部分(a-吡喃酮和烟酰胺元件)的来源和pyripyropene A相同,但在生成中间体化合物分子4-hydroxyl-6-(3-pyridinyl)-2H-pyran-2-one(HPPO)后发生显著差异。以牻牛儿基焦磷酸(GGPP)为供体,在UbiA类蛋白异戊烯基转移酶OlcH的作用下,将其与HPPO进行连接,GGPP由olcC基因编码的二萜合酶完成。继而,依赖黄素FAD的单加氧酶OlcE与二萜环化酶OlcD联合发挥作用形成关键的五元环中间体化合物分子predecaturin E,其中,OlcE参与长链二萜末端双键氧化形成三元氧环,萜环化酶OlcD将长链二萜环化。P450氧化酶OlcG参与15-deoxyoxalicine B分子右侧螺环形成,生成decaturin E中间体。此后,多个氧化还原酶参与的级联反应***包括P450氧化酶(OlcJ)和短链脱氢酶/还原酶(OlcF)的作用下,生成具有半缩醛结构的中间体化合物decaturin C。最后,在依赖Fe2+的a-KG双加氧酶(OlcK)、跨膜蛋白耐药泵(OlcL)和P450氧化酶(OlcB)的联合作用下,生成目标化合物分子15-deoxyoxalicine B。
发明内容
本发明的目的是提供化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用。
本发明提供了OxaL蛋白或OxaL蛋白相关生物材料的应用,为如下(a1)或(a2):
(a1)OxaL蛋白或OxaL蛋白相关生物材料作为羟化酶的应用;
(a2)OxaL蛋白或OxaL蛋白相关生物材料在制备羟化酶中的应用;
所述OxaL蛋白为序列表的序列3所示的蛋白质;
所述OxaL蛋白相关生物材料为编码所述OxaL蛋白的基因、表达所述OxaL蛋白的表达盒、表达所述OxaL蛋白的表达载体或表达所述OxaL蛋白的重组微生物。
示例性的,所述羟化酶具有如下功能:将化合物3转换为化合物8。
示例性的,所述羟化酶具有如下功能:将化合物2转换为化合物9。
示例性的,所述羟化酶具有如下功能:将化合物4转换为化合物oxalicine B。
本发明还保护15-deoxyoxalicine B生物合成基因簇,其中具有如下13个基因:oxaM基因、oxaE基因、oxaD基因、oxaC基因、oxaF基因、oxaG基因、oxaL基因、oxaH基因、oxaA基因、oxaI基因、oxaJ基因、oxaK基因和oxaB基因;
所述oxaM基因(编码链)如序列表的序列1中第409-1287位所示;所述oxaE基因(模板链)具有四个外显子,依次对应于序列表的序列1第1819-1889位、第1966-2227位、第2280-2650位、第2717-3392位;所述oxaD基因(模板链)具有两个外显子,依次对应于序列表的序列1第3699-3900位、第3965-4476位;所述oxaC基因(编码链)具有四个外显子,依次对应于序列表的序列1第4847-4897位、第4956-5110位、第5165-5491位、第5551-6001位;所述oxaF基因(模板链)具有四个外显子,依次对应于序列表的序列1第6024-6250位、第6311-6397位、第6453-6891位、第6945-6971位;所述oxaG基因(编码链)具有五个外显子,依次对应于序列表的序列1第7344-7568位、第7620-7736位、第7800-7971位、第8033-8647位、第8706-9145位;所述oxaL基因(模板链)具有三个外显子,依次对应于序列表的序列1第9903-10063位、第10112-10563位、第10625-11535位;所述oxaH基因(编码链)具有两个外显子,依次对应于序列表的序列1第11801-11912位、第11971-12911位;所述oxaA基因(编码链)如序列表的序列1中第13529-20836位所示;所述oxaI基因(编码链)具有两个外显子,依次对应于序列表的序列1第21517-21729位、第21798-23435位;所述oxaJ基因(模板链)具有两个外显子,依次对应于序列表的序列1第23483-24757位、第24824-25174位;所述oxaK基因(模板链)如序列表的序列1中第25296-26171位所示;所述oxaB基因(编码链),具有两个外显子,依次对应于序列表的序列1第26443-27567位、第27628-27975位。
所述15-deoxyoxalicine B生物合成基因簇具体如序列表的序列1所示。
本发明还保护所述15-deoxyoxalicine B生物合成基因簇在合成化合物oxalicine B中的应用。
所述应用中,合成化合物oxalicine B是在青霉中进行的。
所述应用中,合成化合物oxalicine B是在草酸青霉中进行的。
所述应用中,合成化合物oxalicine B是在P.oxalicum 114-2中进行的。
本发明还保护OxaL蛋白,如序列表的序列3所示。
本发明还保护编码所述OxaL蛋白的基因。
编码所述OxaL蛋白的基因具体可如序列表的序列2所示。
编码所述OxaL蛋白的基因(模板链)具有三个外显子,依次对应于序列表的序列1第9903-10063位、第10112-10563位、第10625-11535位。
本发明还保护表达所述OxaL蛋白的重组微生物。
所述重组微生物具体是将编码所述OxaL蛋白的基因导入宿主微生物得到的重组微生物。
所述宿主微生物可为酵母,具体可为酿酒酵母,更具体可为S.cerevisiae RC01。
编码所述OxaL蛋白的基因具体可以通过表达所述OxaL蛋白的表达载体导入所述宿主微生物。
所述表达所述OxaL蛋白的表达载体具体可为oxaL基因过表达载体。
所述表达所述OxaL蛋白的表达载体具体可为:将酵母表达质粒pXW06的NdeI和PmeI酶切位点之间的小片段替换为序列表的序列2所示的DNA分子得到的重组质粒pXW06-oxaL。
本发明还保护所述OxaL蛋白在参与化合物oxalicine B的合成中的应用。
本发明还保护所述重组微生物的应用,为如下(b1)或(b2)或(b3):
(b1)在将化合物3转换为化合物8中的应用;
(b2)在将化合物2转换为化合物9中的应用;
(b3)在将化合物4转换为化合物oxalicine B中的应用。
本发明还保护所述重组微生物的总蛋白。
所述总蛋白为微粒体形式的总蛋白。
所述总蛋白的制备方法依次包括如下步骤:
(1)培养所述重组微生物,然后离心收集菌体,用微粒体提取液重悬;
(2)进行细胞壁破碎;
(3)离心并收集含有总蛋白的上清液;
(4)离心收集沉淀,即为总蛋白。
步骤(1)中,培养所述重组微生物采用液体YPD培养基。
步骤(1)中,培养所述重组微生物的条件为:28℃、200rpm振荡培养2天。
步骤(2)中,通过加入玻璃珠并涡旋振荡进行细胞壁破碎。
步骤(3)中,所述离心的条件为:4℃、4000rpm离心5min。
步骤(4)中,所述离心的条件为:4℃、17000rpm离心50min。
微粒体提取液:含10g/L牛血清蛋白,2mMβ-巯基乙醇,余量为pH7.5的TES缓冲液。
本发明还保护所述总蛋白的应用,为如下(b1)或(b2)或(b3):
(b1)在将化合物3转换为化合物8中的应用;
(b2)在将化合物2转换为化合物9中的应用;
(b3)在将化合物4转换为化合物oxalicine B中的应用。
化合物3如式Ⅰ所示。化合物8如式Ⅱ所示。
化合物2如式Ⅲ所示。化合物9如式Ⅳ所示。
化合物4如式Ⅴ所示。化合物oxalicine B如式Ⅵ所示。
本发明的发明人以草酸青霉来源的oxalicine B化合物为目标分子,结合基因组挖掘定位oxalicine B生物合成基因簇oxa。对比发现,oxa基因簇中的oxaL(编码P450氧化酶)和oxaM(编码NADPH依赖的P450氧化还原酶)是15-deoxyoxalicine B的生物合成基因簇olc中不存在的。结合生物信息学比对分析,推测OxaL可能负责oxalicine B化合物分子中C-15位羟基化反应。同时,采用分子遗传学、生物信息学、生物化学及天然产物化学相结合的方法研究其生物合成。通过对该家族天然产物的生物合成研究,从基因及酶催化两个层次进行探讨可以帮助人们理解自然界是如何合成如此众多结构复杂而且类似的化合物。在阐明了自然界的生物合成途径、理解自然界a-吡喃酮类杂萜化合物天然组合生物合成机理的基础上,人们可以利用组合生物合成的方法,生产很多自然界不存在的结构类似物,为新活性“非天然”产物的发现和药物开发提供分子和活性多样性。
本发明的贡献如下:提供了草酸青霉P.oxalicum 114-2中产生具有抗HIV-1活性的抗生素-oxalicine B的生物合成基因簇、对其中编码的OxaL蛋白进行了功能研究和应用。本发明首次报道了oxalicine B的生物合成基因簇oxa,并第一次对oxalicines类化合物分子中C-15羟基化反应酶-P450氧化酶OxaL的功能、酶催化机制做了阐明解析。本发明所提供的包含oxalicine B生物合成相关的所有基因和蛋白信息可以帮助人们理解a-吡喃酮类杂萜家族天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
附图说明
图1为含a-吡喃酮类杂萜化合物家族的结构示意图。
图2为15-deoxyoxalicine B的生物合成基因簇的生物合成途径示意图。
图3为15-deoxyoxalicine B生物合成基因簇与oxalicine B生物合成基因簇的元件示意图。
图4为实施例2和实施例3中PCR扩增产物的电泳图。
图5为实施例4的HPLC谱图。
图6为实施例5制备得到的各个化合物的结构式。
图7为实施例6的结果图。
图8为实施例7中推测的oxalicine B生物合成后期从decaturin C到目标化合物oxalicine B的可能的4种生物合成途径。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。酵母转化试剂盒(Frozen-EZ Yeast Transformation IIKit):ZYMO公司;cat.no.T2001。Solution I、Solution II和Solution III均为酵母转化试剂盒的组件。如无特殊说明,以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
草酸青霉(Penicillium oxalicum)114-2,又称为P.oxalicum 114-2,记载于如下文献:Production of a high-efficiency cellulase complex viaβ-glucosidaseengineering in Penicillium oxalicum;Guangshan Yao,Ruimei Wu,Qinbiao Kan,LiweiGao,Meng Liu,Piao Yang,Jian Du,Zhonghai Li,Yinbo Qu;Yao et al.BiotechnolBiofuels(2016)9:78。
酵母表达质粒pXW06(Yeast expression plasmid pXW06)记载于如下文献:Biosynthesis of Heptacyclic Duclauxins Requires Extensive Redox Modificationsof the Phenalenone Aromatic Polyketide;Shu-Shan,Gao,Tao,Zhang,Marc,Garcia-Borràs,Yiu-Sun,Hung,John,M;10.1021/jacs.8b03705;2018。
酿酒酵母(Saccharomyces cerevisiae)RC01,又称为S.cerevisiae RC01,记载于如下文献:Genome Mining and Assembly-Line Biosynthesis of the UCS1025APyrrolizidinone Family of Fungal Alkaloids;Li Li,Man-Cheng Tang,Shoubin Tang,Shushan Gao,Sameh Soliman,Leibniz Hang,Wei Xu,Tao Ye,Kenji Watanabe,YiTang.J.Am.Chem.Soc.2018,140,6,2067–2071。
MEPA培养基(100ml):malt extract 1.5g,黄豆饼粉0.2g,琼脂2g,余量为水。二氯甲烷-甲醇:由1体积份二氯甲烷和1体积份甲醇混合得到。
液体Trp-营养缺陷型培养基(100mL):含DifcoTM酵母基础氮源(BD,239210)0.67g,Yeast synthetic Drop-out Medium supplements(Sigma,Y2001)0.14g,L-亮氨酸0.02g,尿嘧啶0.02g,葡萄糖0.8g,余量为水。固体Trp-营养缺陷型培养基与液体Trp-营养缺陷型培养基的区别仅在于加入了琼脂。
实施例1、从P.oxalicum114-2中发现oxalicine B生物合成基因簇
利用15-deoxyoxalicine B生物合成关键聚酮合酶(OlcA)编码基因,从P.oxalicum 114-2的基因组DNA中筛选获得一段contig区域。利用基因组和微生物次级代谢产物合成基因簇预测。通过antiSMASH和Softberry(http://www.softberry.com/)数据库在线工具进行分析。蛋白功能注释借助BLAST程序(http://www.ncbi.nlm.nih.gov/Blastp/)在GenBank蛋白数据库中进行氨基酸序列的同源性搜索。用Clustalx程序进行氨基酸序列比对。从P.oxalicum 114-2中发现了oxalicine B生物合成基因簇。oxalicine B生物合成基因簇具有13个基因,如序列表的序列1所示(序列1中,部分基因为编码链,部分基因为模板链)。
15-deoxyoxalicine B生物合成基因簇与本发明获得的oxalicine B生物合成基因簇的元件示意图见图3。
oxalicine B生物合成基因簇中的13个基因为:oxaM基因、oxaE基因、oxaD基因、oxaC基因、oxaF基因、oxaG基因、oxaL基因、oxaH基因、oxaA基因、oxaI基因、oxaJ基因、oxaK基因、oxaB基因。
各个基因编码的蛋白见表1。
表1oxalicine B生物合成基因簇的基因及功能注释
oxaM基因,如序列表的序列1中第409-1287位核苷酸所示(编码链;无内含子);oxaM基因编码NADPH-P450氧化还原酶。oxaE基因,如序列表的序列1中第1819-3392位核苷酸所示(模板链;具有内含子;外显子:1819-1889,1966-2227,2280-2650,2717-3392);oxaE基因编码FAD依赖的单加氧酶。oxaD基因,如序列表的序列1中第3699-4476位核苷酸所示(模板链;具有内含子;外显子:3699-3900,3965-4476);oxaD基因编码萜环化酶。oxaC基因,如序列表的序列1中第4847-6001位核苷酸所示(编码链;具有内含子;外显子:4847-4897,4956-5110,5165-5491,5551-6001);oxaC基因编码二萜合酶。oxaF基因,如序列表的序列1中第6024-6971位核苷酸所示(模板链;具有内含子;外显子:6024-6250,6311-6397,6453-6891,6945-6971);oxaF基因编码短链脱氢酶/还原酶。oxaG基因,如序列表的序列1中第7344-9145位核苷酸所示(编码链;具有内含子;外显子:7344-7568,7620-7736,7800-7971,8033-8647,8706-9145);oxaG基因编码P450氧化酶。oxaL基因,如序列表的序列1中第9903-11535位核苷酸所示(模板链;具有内含子;外显子:9903-10063,10112-10563,10625-11535);oxaL基因编码序列表的序列3所示的P450氧化酶。oxaH基因,如序列表的序列1中第11801-12911核苷酸所示(编码链;具有内含子;外显子:11801-11912,11971-12911);oxaH基因编码异戊烯基转移酶。oxaA基因,如序列表的序列1中第13529-20836位核苷酸所示(编码链;无内含子);oxaA基因编码聚酮合酶。oxaI基因,如序列表的序列1中第21517-23435核苷酸所示(编码链;具有内含子;外显子:21517-21729,21798-23435);oxaI基因编码CoA连接酶。oxaJ基因,如序列表的序列1中第23483-25174位核苷酸所示(模板链;具有内含子;外显子:23483-24757,24824-25174);oxaJ基因编码P450氧化酶。oxaK基因,如序列表的序列1中第25296-26171位核苷酸所示(模板链;无内含子);oxaK基因编码Fe(Ⅱ)/a-KG依赖的双加氧酶。oxaB基因,如序列表的序列1中第26443-27975核苷酸所示(编码链;具有内含子;外显子:26443-27567,27628-27975);oxaB基因编码P450氧化酶。
P.oxalicum114-2中oxalicine B的生物合成途径如下:①oxaA基因编码的聚酮合酶作用下,形成a-吡喃酮;②oxaI基因编码的CoA连接酶将尼克酰胺连接到a-吡喃酮,形成HPPO中间体化合物;③oxaC基因编码的二萜合酶负责从前体物质甲羟戊酸到长链二萜合成;④oxaH基因编码的异戊烯基转移酶负责将长链二萜转移到HPPO生物合成中间体;⑤oxaE基因编码的单加氧酶和oxaD基因编码的萜环化酶负责中间体长链二萜末端双键氧化形成三元氧环和二萜环化形成中间体predecaturin E;⑥oxaG基因、oxaJ基因和oxaF基因编码的三个氧化还原酶参与predecaturin E到decaturin C级联反应***,其中,P450氧化酶(OxaG)参与oxalicine B分子右侧螺环形成;⑦此后,在P450氧化酶(OxaL)、依赖Fe2+的a-KG双加氧酶(OxaK)和P450氧化酶(OxaB)的联合作用下,生成目标化合物分子oxalicine B,其中,OxaL负责C-15羟基化反应,OxaK负责C-23羟基基团引入,OxaB参与oxalicine B分子左侧螺环形成。oxaM编码的NADPH-P450氧化还原酶不参与oxalicineB分子生物合成途径中具体的骨架合成、连接或修饰反应,作为P450氧化酶的伴侣蛋白。
实施例2、制备oxaA基因敲除株
一、敲除载体的构建
oxaA基因敲除载体:是将酵母表达质粒pXW06的NdeI和PmeI酶切位点之间的小片段替换为序列表的序列4所示的DNA分子得到的重组质粒pXW06-△oxaA。序列表的序列4所示的DNA分子中,第1-2200位核苷酸为oxaA基因上游同源臂oxaA-UP,第2201-3802位核苷酸为潮霉素抗性基因,第3803-5926位核苷酸为oxaA基因下游同源臂oxaA-DN。
二、原生质体转化
1、取P.oxalicum 114-2的孢子,用Osmotic buffer清洗,然后用10mL木霉裂解酶溶液悬浮,30℃、120rpm振荡培养4h。
Osmotic buffer(pH5.8):含1.2M MgSO4和20mM磷酸钠,余量为水。10mL木霉裂解酶溶液:由10mg木霉裂解酶和10mL Osmotic buffer组成。木霉裂解酶(1U/mg):Sigma,L1412-5G。
2、完成步骤1后,收集包含原生质体的上层液体,加入等体积的STC缓冲液,3000rpm离心5min,收集沉淀(沉淀即为原生质体)。
STC缓冲液(pH7.0):含1.0M山梨醇和0.1M Tris-HCl,余量为水。
3、将步骤2得到的沉淀悬浮于200-500μL STC缓冲液,然后加入50μL oxaA基因敲除载体,冰上静置20min,然后加入1.0mL 60%PEG6000缓冲液,然后涂布于筛选培养基平板上,28℃正置培养。
60%PEG6000缓冲液(pH7.5):含5mM CaCl2、50mM Tris-HCl和60g/100mL PEG6000,余量为水。
筛选培养基:含200μg/ml潮霉素B的PDA培养基。
4、将步骤3中可以正常生长的克隆一一转接至新的筛选培养基平板上,28℃正置培养。
完成步骤4后,筛选到130个可以正常生长的潮霉素抗性转化子。
三、筛选重组菌
从步骤二的4获得的潮霉素抗性转化子中随机挑取10个,将P.oxalicum 114-2作为野生株对照(WT),分别进行分子鉴定。
1、提取基因组DNA。
2、以基因组DNA为模板,采用hph-for和hph-rev组成的引物对(靶序列位于潮霉素抗性基因)进行PCR扩增,然后将扩增产物进行测序。10个转化子均显示预期大小(515bp)的扩增产物,测序结果显示确实为目标扩增产物。
hph-for:TCGTTATGTTTATCGGCACT;hph-rev:TGTTGGCGACCTCGTATT。
3、以基因组DNA为模板,采用Check ALs for和Check hph rev组成的引物对进行PCR扩增。Check ALs for来源于左侧同源臂上游区域,Check hph rev来源于潮霉素抗性基因区域。oxaA基因敲除株能扩增出PCR片段(3065bp),野生株无法实现扩增。
Check ALs for:GCAGATTTGATGCGAAGG;Check hph rev:GAACCCGCTCGTCTGGCTAAG。
4、以基因组DNA为模板,采用Check hph for和Check ARs rev组成的引物对进行PCR扩增。Check hph for来源于潮霉素抗性基因区域,Check ARs rev来源于右侧同源臂下游区域。oxaA基因敲除株能扩增出PCR片段(2524bp),野生株无法实现扩增。
Check hph for:TGGCTGTGTAGAAGTACTCGC;Check ARs rev:TTCCTATCACGGGTCAGC。
5、以基因组DNA为模板,采用Check ALs for和Check ALs rev组成的引物对进行PCR扩增。野生株能扩增出PCR片段(2467bp),oxaA基因敲除株无法实现扩增。
Check ALs rev:CTGTGGACTGGCATTGATA。
各个扩增产物的电泳图见图4的A。图4的A中,泳道1和泳道5均为采用Check ALsfor和Check hph rev组成的引物对进行PCR扩增的扩增产物,泳道2和泳道6均为采用Checkhph for和Check ARs rev组成的引物对进行PCR扩增的扩增产物,泳道3和泳道7均为采用Check ALs for和Check ALs rev组成的引物对进行PCR扩增的扩增产物。
实施例3、制备oxaL基因敲除株
一、敲除载体的构建
oxaL基因敲除载体:是将酵母表达质粒pXW06的NdeI和PmeI酶切位点之间的小片段替换为序列表的序列5所示的DNA分子得到的重组质粒pXW06-△oxaL。序列表的序列5所示的DNA分子中,第1-2090位核苷酸为oxaL基因上游同源臂oxaL-UP,第2091-3692位核苷酸为潮霉素抗性基因,第3693-至5716位为oxaL基因下游同源臂oxaL-DN。
二、原生质体转化
用oxaL基因敲除载体代替oxaA基因敲除载体,其他同实施例2的步骤二。
完成步骤4后,筛选到120个可以正常生长的潮霉素抗性转化子。
三、筛选重组菌
从步骤二的4获得的潮霉素抗性转化子中随机挑取10个,将P.oxalicum 114-2作为野生株对照(WT),分别进行分子鉴定。
1、提取基因组DNA。
2、以基因组DNA为模板,采用hph-for和hph-rev组成的引物对(靶序列位于潮霉素抗性基因)进行PCR扩增,然后将扩增产物进行测序。10个转化子均显示预期大小(515bp)的扩增产物,测序结果显示确实为目标扩增产物。
hph-for:TCGTTATGTTTATCGGCACT;hph-rev:TGTTGGCGACCTCGTATT。
3、以基因组DNA为模板,采用Check LLs for和Check hph rev组成的引物对进行PCR扩增。Check LLs for来源于左侧同源臂上游区域,Check hph rev来源于潮霉素抗性基因区域。oxaL基因敲除株能扩增出PCR片段(2994bp),野生株无法实现扩增。
Check LLs for:TCACGCTATACGAAACGA;Check hph rev:GAACCCGCTCGTCTGGCTAAG。
4、以基因组DNA为模板,采用Check hph for和Check LRs rev组成的引物对进行PCR扩增。Check hph for来源于潮霉素抗性基因区域,Check LRs rev来源于右侧同源臂下游基因区域。oxaL基因敲除株能扩增出PCR片段(2607bp),野生株无法实现扩增。
Check hph for:TGGCTGTGTAGAAGTACTCGC;Check LRs rev:TGGGCTGATGCTGAAGAAA。
5、以基因组DNA为模板,采用Check LRs for和Check LRs rev组成的引物对进行PCR扩增。野生株能扩增出PCR片段(2532bp),oxaL基因敲除株无法实现扩增。
Check LRs for:TGCGGTAGGATGACGACG。
结果见图4的B。图4的B中,泳道1和泳道5均为采用Check LLs for和Check hphrev组成的引物对进行PCR扩增的扩增产物,泳道2和泳道6均为采用Check hph for和CheckLRs rev组成的引物对进行PCR扩增的扩增产物,泳道3和泳道7均为采用Check LRs for和Check LRs rev组成的引物对进行PCR扩增的扩增产物。
实施例4、代谢谱HPLC分析
供试株:分别为P.oxalicum 114-2(WT)、实施例2制备的oxaA基因敲除株(△oxaA)或实施例3制备的oxaL基因敲除株(△oxaL)。
将供试株接种至MEPA培养基平板(平板直径为3cm),28℃静置培养6天。然后将所有培养物(含培养基在内的整个培养体系)收集至15ml离心管中,加入5ml乙酸乙酯室温超声提取30min(超声波频率25KHz,超声波功率800W)。然后5000rpm离心10min,收集上清液,用溶剂蒸发工作站(GeneVac EZ-2)蒸干溶剂,然后加入500μL乙腈(色谱纯)以溶解残留物,然后13000rpm离心10min,收集上清液。
将上清液上样于安捷伦1290进行HPLC检测分析。
色谱仪:高效液相色谱仪(Agilent1290串联液相蒸发光散射检测器ELSD);
色谱柱:Agilent ZORBAX SB-C18,5μm,4.6×250mm;流速1mL/min。
洗脱过程:洗脱时间为30min;洗脱液由乙腈和水组成;初始时刻至终止时刻,洗脱液中乙腈所占的体积分数由5%线性上升至99%。
结果见图5。P.oxalicum 114-2可以产生目标化合物分子oxalicine B(对应峰标注为1)。oxaA基因敲除株不能产生oxalicine B,进一步证实了本发明实施例1发现的基因簇为oxalicine B生物合成基因簇。oxaL基因敲除株同样不能产生oxalicine B,同时积累中间体化合物分子(对应峰标注为2、3、和4;2即实施例5中的化合物2,3即实施例5中的化合物3,4即实施例5中的化合物4)。
实施例5、oxaL基因敲除株产生的中间体化合物的分离纯化和结构鉴定
一、化合物的制备和分离纯化
1、实施例3制备的oxaL基因敲除株(△oxaL),收集孢子,用无菌水悬浮,得到孢子浓度为(1-2)×106个/ml的孢子悬液;将300-400μl孢子悬液接种至MEPA培养基平板(直径为15cm),28℃静置培养6天。设置至少150个重复处理。
2、将150个平板完成步骤1的所有培养物(含培养基在内的整个培养体系)混合,加入5L乙酸乙酯室温超声提取3h,收集有机相;剩余物加入5L乙酸乙酯室温超声提取3h,收集有机相;剩余物加入5L乙酸乙酯室温超声提取3h,收集有机相;将三次提取获得的有机相合并,40℃减压浓缩至恒重,得到12g浸膏。超声提取的超声参数:超声波频率25KHz,超声波功率800W。
3、将步骤2得到的浸膏溶于二氯甲烷-甲醇中,用20g正相硅胶(60-100目)拌匀,然后采用旋转蒸发仪浓缩至恒重,得到固体样品,将固体样品填充至样品柱,然后连接色谱柱,用色谱仪进行分离。
色谱柱为正相硅胶色谱柱,填充介质为柱层析硅胶(200-300目,330g)。
色谱仪为美国TELEDYNE ISCO公司Combiflash Rf200制备型色谱仪。
流动相A:二氯甲烷;流动相B:丙酮。流动相流速:30mL/min。检测波长:230nm。
洗脱过程:0-5min,流动相全部为流动相A;5-80min,流动相B占流动相的体积分数由0%线性上升至100%,相应的流动相A占流动相的体积分数由100%线性下降至0%;80-105min,流动相全部为流动相B。
整个洗脱过程持续收集过柱后的洗脱液,每150mL收集1瓶,共收集21瓶。第1-4瓶合并作为流份Fr.1,第5-9瓶合并作为流份Fr.2,第10-12瓶合并合并作为流份Fr.3,第13-14瓶合并作为流份Fr.4,第15-19瓶合并作为流份Fr.5,第20-21瓶合并作为流份Fr.6。
将各个流份分别采用旋转蒸发仪浓缩至恒重,得到干物质。
4、将步骤3中得到的流份Fr.2的干物质(79mg)溶于二氯甲烷-甲醇中,然后上样并通过凝胶柱层析分离。凝胶柱层析的柱子规格为30×1700mm(直径×长度),填充介质为Sephadex LH-20(80g)。流动相为:二氯甲烷-甲醇。整个洗脱过程持续收集过柱后的洗脱液,第1-100mL收集1瓶(即流份Fr.2-1),之后每20mL收集1瓶共收集10瓶(依次为流份Fr.2-2至Fr.2-11)。
将各个流份分别采用旋转蒸发仪浓缩至恒重,得到干物质。
5、将步骤4中得到的流份Fr.2-5的干物质(16mg)溶于0.5mL甲醇,然后采用色谱仪进行分离纯化。
色谱仪:汉邦NP7000。
色谱柱:SunFire C18,10mm*250mm,孔径5μm,Waters公司。
流动相:由45体积份乙腈和55体积份水组成。流动相流速:6mL/min。检测波长:230nm。
收集峰值对应的保留时间为12.1min的洗脱峰的过柱后洗脱液,采用旋转蒸发仪浓缩至恒重,得到2.3mg黄色固体状产物,即为化合物3。
6、将步骤3中得到的流份Fr.3的干物质(117.8mg)溶于二氯甲烷-甲醇中,然后上样并通过凝胶柱层析分离。凝胶柱层析的柱子规格为30×1700mm(直径×长度),填充介质为Sephadex LH-20(80g)。流动相为:二氯甲烷-甲醇。整个洗脱过程持续收集过柱后的洗脱液,第1-100mL收集1瓶(即流份Fr.3-1),之后每20mL收集1瓶共收集11瓶(依次为流份Fr.3-2至Fr.3-12)。
将各个流份分别采用旋转蒸发仪浓缩至恒重,得到干物质。
7、将步骤6中得到的流份Fr.3-5的干物质(20mg)溶于0.5mL甲醇,然后采用色谱仪进行分离纯化。
色谱仪:汉邦NP7000。
色谱柱:SunFire C18,10mm*250mm,孔径5μm,Waters公司。
流动相:由45体积份乙腈和55体积份水组成。流动相流速:6mL/min。检测波长:230nm。
收集峰值对应的保留时间为8.7min的洗脱峰的过柱后洗脱液,采用旋转蒸发仪浓缩至恒重,得到8.7mg黄色固体状产物,即为化合物4。
8、将步骤3中得到的流份Fr.5的干物质(115mg)溶于二氯甲烷-甲醇中,然后上样并通过凝胶柱层析分离。凝胶柱层析的柱子规格为30×1700mm(直径×长度),填充介质为Sephadex LH-20(80g)。流动相为:二氯甲烷-甲醇。整个洗脱过程持续收集过柱后的洗脱液,第1-100mL收集1瓶(即流份Fr.5-1),之后每20mL收集1瓶共收集14瓶(依次为流份Fr.5-2至Fr.5-15)。
将各个流份分别采用旋转蒸发仪浓缩至恒重,得到干物质。
9、将步骤8中得到的流份Fr.5-5的干物质(26.5mg)溶于0.7mL甲醇,然后采用色谱仪进行分离纯化。
色谱仪:汉邦NP7000。
色谱柱:SunFire C18,10mm*250mm,孔径5μm,Waters公司。
流动相:由40体积份乙腈和60体积份水组成。流动相流速:6mL/min。检测波长:230nm。
收集峰值对应的保留时间为7.0min的洗脱峰的过柱后洗脱液,采用旋转蒸发仪浓缩至恒重,得到13.9mg黄色固体状产物,即为化合物2。
10、将步骤3中得到的流份Fr.6的干物质(185.8mg)溶于二氯甲烷-甲醇中,然后上样并通过凝胶柱层析分离。凝胶柱层析的柱子规格为30×1700mm(直径×长度),填充介质为Sephadex LH-20(80g)。流动相为:二氯甲烷-甲醇。整个洗脱过程持续收集过柱后的洗脱液,第1-100mL收集1瓶(即流份Fr.6-1),之后每20mL收集1瓶共收集10瓶(依次为流份Fr.6-2至Fr.6-11)。
将各个流份分别采用旋转蒸发仪浓缩至恒重,得到干物质。
11、将步骤10中得到的流份Fr.6-6的干物质(15mg)溶于0.5mL甲醇,然后采用色谱仪进行分离纯化。
色谱仪:安捷伦1100。
色谱柱:YMC-C18,10mm*250mm,孔径5μm,日本YMC公司。
流动相:由35体积份乙腈和65体积份水组成。流动相流速:4mL/min。检测波长:230nm。
收集峰值对应的保留时间为17.4min的洗脱峰的过柱后洗脱液,采用旋转蒸发仪浓缩至恒重,得到1mg淡黄色固体状产物,即为化合物7。
12、将步骤3中得到的流份Fr.1的干物质(138.1mg)溶于二氯甲烷-甲醇中,然后上样并通过凝胶柱层析分离。凝胶柱层析的柱子规格为30×1700mm(直径×长度),填充介质为Sephadex LH-20(80g)。流动相为:二氯甲烷-甲醇。整个洗脱过程持续收集过柱后的洗脱液,第1-100mL收集1瓶(即流份Fr.1-1),之后每20mL收集1瓶共收集11瓶(依次为流份Fr.1-2至Fr.1-12)。
将各个流份分别采用旋转蒸发仪浓缩至恒重,得到干物质。
13、将步骤12中得到的流份Fr.1-3的干物质(0.8mg)溶于0.3mL甲醇,采用色谱仪进行分离纯化。
色谱仪:汉邦NP7000。
色谱柱:SunFire C18,10mm*250mm,孔径5μm,Waters公司。
流动相:由50体积份乙腈和50体积份水组成。流动相流速:6mL/min。检测波长:230nm。
收集峰值对应的保留时间为22.5min的洗脱峰的过柱后洗脱液,采用旋转蒸发仪浓缩至恒重,得到0.4mg黄色固体状产物,即为化合物6。
14、将步骤12中得到的流份Fr.1-5的干物质(22.8mg)溶于0.5mL甲醇,采用色谱仪进行分离纯化。
色谱仪:汉邦NP7000。
色谱柱:SunFire C18,10mm*250mm,孔径5μm,Waters公司。
流动相:由45体积份乙腈和55体积份水组成。流动相流速:6mL/min。检测波长:230nm。
收集峰值对应的保留时间为17.4min的洗脱峰的过柱后洗脱液,采用旋转蒸发仪浓缩至恒重,得到4.5mg产物,即为产物Fr.1-5-1。
15、将步骤14中得到的全部产物Fr.1-5-1溶于0.3mL甲醇,采用色谱仪进行分离纯化。
色谱仪:安捷伦1100。
色谱柱:YMC-C18,10mm*250mm,孔径5μm,日本YMC公司。
流动相A:水;流动相B:乙腈。流动相流速:4mL/min。检测波长:230nm。
洗脱程序:0-10min,流动相B占流动相的体积分数由70%线性上升至100%,相应的流动相A占流动相的体积分数由30%线性下降至0%。
收集峰值对应的保留时间为4.1min的洗脱峰的过柱后溶液,采用旋转蒸发仪浓缩至恒重,得0.9mg黄色固体状产物,即为化合物5。
二、化合物的鉴定
步骤一中分离得到1个oxalicine类化合物(化合物4)和5个decaturin类似物(化合物2、化合物3、化合物7、化合物5和化合物6)。通过核磁共振和质谱分析,鉴定出3种主要化合物为15-deoxyoxalicine B(化合物4)、decaturin C(化合物3)和decaturin A(化合物2),它们都是化合物oxalicine B生物合成的中间体。通过核磁共振和质谱分析,确定了另外3个化合物,分别为decaturin H(化合物5)、decaturin I(化合物6)和decaturin F(化合物7)。decaturin I(化合物6)和decaturin F(化合物7)为新的decaturin衍生物。
各个化合物的鉴定数据如下:
化合物5的HRESIMS离子峰为M/Z 504.2369[M+H]+,对应于不饱和度为15的分子式C30H33NO6。化合物5的1H、13C和HSQC NMR数据显示存在4个甲基[δH 0.84(3H,s),δC17.1;δH1.04(3H,s),δC 26.1;δH 1.05(3H,s),δC 15.5;δH 1.64(3H,s),δC 18.0],一个烯次甲基[δH5.72(1H,d,J=5.4Hz),δC 128.4],以及典型的吡啶-α-吡咯烷基团[δH 7.27(1H,s),δC94.1;δH 7.56(1H,br s),δC 124.1;δH 8.23(1H,d,J=7.8Hz),δC 133.1;δH 8.71(1H,brs),δC 151.4;δH 9.10(1H,br s),δC 146.7;δC 169.8,159.6,159.5,127.3,and 101.3]。化合物5的1H和13C NMR谱相似于decaturin C(化合物3),明显的区别在于化合物3中的羰基信号(δC 173.5),而不是像化合物3中有一个含氧亚甲基信号[(δH 4.07(1H,dd,J=9.0,3.0Hz),3.73(1H,d,J=9.0Hz);δC 66.3]。通过HMBC中C-29/H-19、H-23和H-25的相关性进一步证实了羰基的位置。通过对DEPT,1H-1H COSY,HSQC,HMBC谱的详细分析建立了化合物5的完整的赋值。通过分析1H和13C NMR数据、NOESY相关性和ECD谱以及生物遗传学基础,化合物5的相对构型和绝对构型与化合物3相同。总之,化合物化合物5可能不是oxalicine B的前体,而明显其它途径的产物。
化合物6的HRESIMS离子峰为M/Z 518.2528[M+H]+,与C31H35NO6的分子式一致,表明与化合物5相比,可能引入了一个甲基。化合物6的1H和13C NMR数据类似于化合物5,除了甲氧基部分的存在(δH 3.30;δC 50.5)。从HMBC谱中H-34到C-27的相关证实了甲氧基的位置。根据核磁共振数据、NOESY实验和ECD光谱以及生物遗传学基础,化合物6的立体化学与化合物5类似。
化合物5和化合物6的1H-NMR和13C-NMR数据见表3。
表3化合物5和化合物6的1H-NMR和13C-NMR数据
/>
化合物2的波谱数据:(+)ESI-MS m/z 506.5[M+H]+1H-NMR(600MHz,DMSO-d6)δ:9.09(1H,d,J=2.4Hz),8.38(1H,dd,J=4.8,1.8Hz),8.24(1H,ddd,J=8.4,1.8,1.8Hz),7.55(1H,dd,J=8.4,4.8Hz),7.35(1H,s),5.67(1H,d,J=5.4Hz),3.98(1H,dd,J=9.0,3.0Hz),3.73(1H,d,J=9.0Hz),3.05(1H,d,J=16.2Hz),2.84(1H,d,J=16.2Hz),2.17(1H,dd,J=12.6,5.4Hz),1.99(1H,m),1.95(1H,m),1.93(1H,m),1.84(1H,m),1.80(1H,m),1.69(1H,m),1.61(3H,s),1.54(1H,m),1.48(1H,m),1.46(1H,m),1.19(1H,m),0.93(3H,s),0.83(3H,s),0.81(3H,s);13C-NMR(150MHz,DMSO-d6)δ:170.1,159.6,159.5,151.4,146.7,133.0,131.0,128.2,127.2,124.0,101.2,99.7,97.5,94.1,72.9,66.4,46.3,40.0,38.9,37.7,29.1,28.5,27.7,24.7,24.5,22.6,21.1,20.0,18.4,15.3。
化合物3的波谱数据:(+)ESI-MS m/z 490.6[M+H]+1H-NMR(600MHz,DMSO-d6)δ:9.09(1H,br s),8.70(1H,br s),8.25(1H,br d,J=7.8Hz),7.56(1H,dd,J=7.8,4.8Hz),7.30(1H,s),5.68(1H,br d,J=5.4Hz),4.07(1H,dd,J=9.0,2.4Hz),3.73(1H,d,J=9.0Hz),3.04(1H,d,J=16.2Hz),2.85(1H,d,J=16.2Hz),2.10(1H,m),2.08(1H,m),1.99(1H,m),1.78(1H,m),1.67(1H,dd,J=12.0,4.2Hz),1.64(1H,m),1.61(3H,s),1.55(1H,m),1.50(2H,m),1.25(1H,m),1.23(1H,m),1.12(1H,m),0.91(3H,s),0.88(3H,s),0.83(3H,s);13C-NMR(150MHz,DMSO-d6)δ:169.9,159.5,159.5,151.2,146.5,133.3,131.1,128.1,127.3,124.1,101.3,99.5,96.9,94.2,66.2,49.5,41.8,40.1,40.1,34.4,34.1,29.8,29.5(C-26),27.6,27.2,22.7,18.6,18.5,17.9,15.8。
化合物4的波谱数据:(+)ESI-MS m/z 504.5[M+H]+1H-NMR(600MHz,DMSO-d6)δ:9.10(1H,br s),8.69(1H,d,J=4.8Hz),8.27(1H,ddd,J=8.4,2.4,1.8Hz),7.57(1H,dd,J=8.4,4.8Hz),7.36(1H,s),5.71(1H,br d,J=5.4Hz),5.09(1H,s),4.88(1H,s),4.48(1H,d,J=12.6Hz),4.43(1H,d,J=12.6Hz),3.07(1H,d,J=16.2Hz),2.87(1H,d,J=16.2Hz),2.61(1H,dd,J=12.0,4.8Hz),2.42(1H,dd,J=16.0,6.0,6.0Hz),2.33(1H,m),2.27(2H,m),2.17(1H,m),2.10(1H,m),1.94(1H,m),1.79(3H,s),1.65(3H,s),1.45(1H,m),1.41(1H,m),1.22(1H,m),0.85(1H,m);13C-NMR(150MHz,DMSO-d6)δ:173.5,170.1,159.5,159.4,151.1,150.5,146.4,133.3,130.7,127.8,127.3,124.1,114.3,101.2,99.9,94.2,75.0,66.9,43.6,41.6,40.1,29.6,27.9,27.6,25.7,24.8,23.5,21.6),18.1,15.2。
化合物7的波谱数据:(+)ESI-MS m/z 492.4[M+H]+1H-NMR(600MHz,DMSO-d6)δ:9.08(1H,br s),8.68(1H,br s),8.24(1H,ddd,J=8.4,1.8,1.8Hz),7.54(1H,dd,J=8.4,4.8Hz),7.36(1H,s),5.65(1H,br s),3.79(1H,d,J=12.0Hz),3.76(1H,d,J=12.0Hz),3.04(1H,d,J=16.2Hz),3.01(1H,dd,J=11.4,4.8Hz),2.88(1H,d,J=16.2Hz),2.65(1H,m),2.24(1H,ddd,J=13.2,3.6,3.6Hz),2.05(1H,m),1.61(3H,s),1.60(1H,overlap),1.58(1H,m),1.55(1H,m),1.44(2H,m),1.42(1H,m),1.34(1H,m),1.02(3H,s),0.89(3H,s),0.78(1H,dd,J=11.4,2.4Hz),0.71(3H,s),0.68(1H,dd,J=13.2,3.6Hz);13C-NMR(150MHz,DMSO-d6)δ:170.0,159.6,159.5,151.4,146.7,133.1,130.3,129.4,127.2,123.9,101.1,100.6,94.3,77.1,59.3,54.7,48.1,40.5,40.5),38.4,32.7,32.1,29.0,27.9,27.5,24.6,18.1,17.2,16.5,16.4。
根据鉴定结果,各个化合物的结构式见图6。
实施例6、P450氧化酶OxaL的异源表达和功能鉴定
一、构建重组质粒
oxaL基因过表达载体:是将酵母表达质粒pXW06的NdeI和PmeI酶切位点之间的小片段替换为序列表的序列2所示的DNA分子得到的重组质粒pXW06-oxaL。序列表的序列2所示的DNA分子编码序列表的序列3所示的OxaL蛋白。
二、P450氧化酶OxaL的异源表达和功能鉴定(Agilent1290串联液相蒸发光散射检测器ELSD检测分析)
1、将S.cerevisiae RC01用Solution I洗涤,然后用Solution II重悬,然后加入oxaL基因过表达载体,然后加入Solution III并涡悬混匀,然后30℃孵育1h(期间涡悬1~3次),然后涂布Trp-营养缺陷型培养基平板上,30℃培养过夜。
2、收集平板上正常生长的克隆(酵母基因工程菌RC01-oxaL),接种于100ml液体Trp-营养缺陷型培养基,30℃、150rpm振荡培养1天,即为种子液。
3、将2mL步骤2得到的种子液接种到20mL液体YPD培养基,28℃、200rpm振荡培养36h。
4、完成步骤3后,体系中加入0.1mg供试化合物,28℃、200rpm振荡培养1天。
供试化合物分别为:实施例5制备的化合物2、化合物3、化合物4或化合物7。
设置不加入供试化合物的对照。
5、完成步骤4后,收集所有培养物(含培养基在内的整个培养体系),加入等体积乙酸乙酯室温超声提取1小时,收集有机相;剩余物加入等体积乙酸乙酯室温超声提取1小时,收集有机相;将两次提取获得的有机相合并,采用旋转蒸发仪浓缩至恒重,即为萃取物。超声提取的超声参数:超声波频率25KHz,超声波功率800W。
6、取步骤5的萃取物,加入500μL乙腈(色谱纯)以溶解,然后13000rpm离心10min,收集上清液;将上清液上样于安捷伦1290进行HPLC检测分析。
色谱仪:高效液相色谱仪(Agilent1290串联液相蒸发光散射检测器ELSD);
色谱柱:Agilent ZORBAX SB-C18,5μm,4.6×250mm;流速1mL/min。
洗脱过程:洗脱时间为30min;洗脱液由乙腈和水组成;初始时刻至终止时刻,洗脱液中乙腈所占的体积分数由5%线性上升至99%。
结果见图7的A。图7的A中:ⅰOxaL+3表示以上方法中加入化合物3的结果,ⅳOxaL+4表示以上方法中加入化合物4的结果,ⅴOxaL+2表示以上方法中加入化合物2的结果,ⅵOxaL+7表示以上方法中加入化合物7的结果,ⅱ8表示化合物8(标准品),ⅲ表示化合物3(标准品),ⅶOxaL表示以上方法中不加入化合物的对照的结果。结果表明,化合物3经过酵母基因工程菌RC01-oxaL生物转化可以完全生成化合物8;对比化合物3,化合物8在C-15位发生羟基化,表明OxaL蛋白为羟基化酶。从图7的A来看,化合物2、化合物4和化合物7未见明显转化。
三、P450氧化酶OxaL的异源表达和功能鉴定(UPLC-MS鉴定分析)
步骤1至5同步骤二的1至5。
6、将步骤5的产物溶于200μl乙腈,然后进行UPLC-MS鉴定分析。
仪器:超高效液相质谱检测仪(Waters ACQUITY UPLC-Class-MS串联Xevo-G2-SQ-TOF)。
色谱柱:Waters ACQUITY UPLC-BEH-C18,1.7μm,2.1×100mm;
流动相A:含0.02%(体积比)甲酸的乙腈;流动相B:0.02%(体积比)甲酸水溶液。
流动相流速:0.5mL/min。
流动相:0-5min,流动相A占流动相的体积分数由10%线性上升至20%,相应的流动相B占流动相的体积分数由90%线性下降至80%;5-7min,流动相A占流动相的体积分数为20%,相应的流动相B占流动相的体积分数为80%;7-25min,流动相A占流动相的体积分数由20%线性上升至100%,相应的流动相B占流动相的体积分数由80%线性下降至0%。
ESI正负离子检测模式。
结果见图7的B。图7的B中:ⅰ表示以上方法中加入化合物3的结果,ⅴ表示以上方法中加入化合物2的结果,ⅳ表示以上方法中加入化合物4的结果。结果表明:化合物3经过酵母基因工程菌RC01-oxaL生物转化可以完全生成化合物8(m/z 504.2380[M-H]-),同时对比保留时间和紫外吸收光谱(λmax 205,235,335nm),OxaL催化化合物3生成的产物与标准品化合物8相同,进一步证实OxaL为羟基化酶;化合物2经过酵母基因工程菌RC01-oxaL生物转化可以部分生成化合物9(m/z 564.2224[M+HCOOH-H]-);化合物4经过酵母基因工程菌RC01-oxaL生物转化可以部分生成化合物1(化合物1即oxalicine B)(m/z 566.2399[M+HCOOH-H]-);酵母基因工程菌RC01-oxaL不能对化合物7进行生物转化。
化合物8的波谱数据:(+)ESI-MS m/z 506.6[M+H]+1H-NMR(600MHz,DMSO-d6)δ:9.13(1H,br s),8.74(1H,br s),8.27(1H,d,J=7.8Hz),7.59(1H,dd,J=8.4,4.8Hz),7.32(1H,s),5.74(1H,d,J=5.4Hz),5.17(1H,s),4.08(1H,d,J=8.4Hz),3.73(1H,overlap),2.60(1H,m),2.08(1H,m),2.04(1H,m),1.99(1H,m),1.86(1H,m),1.66(1H,m),1.63(1H,m),1.50(1H,m),1.42(1H,m),1.46(3H,s),1.15(1H,m),1.11(3H,s),0.92(3H,s),0.85(3H,s);13C-NMR(150MHz,DMSO-d6)δ:170.1,160.6,158.9,151.4,146.7,133.5,130.6,130.3,127.2,124.2,105.6,99.6,96.9,94.4,73.0,66.4,49.5,43.6,40.1,39.8,39.3,34.7,34.5,29.9,29.4,27.2,23.0,18.9,18.6,15.7。
化合物9的波谱数据:(+)ESI-MS m/z 522.4[M+H]+1H-NMR(600MHz,DMSO-d6)δ:9.11(1H,d,J=4.8Hz),8.70(1H,dd,J=4.8,1.8Hz),8.27(1H,ddd,J=8.4,2.4,1.8Hz),7.57(1H,dd,J=8.4,4.8Hz),7.34(1H,s),5.72(1H,dd,J=4.2,1.8Hz),5.16(1H,s),4.00(1H,dd,J=9.0,2.4Hz),3.73(1H,d,J=9.0Hz),2.25(1H,dt,J=13.2,3.6Hz),2.14(1H,t,J=9.0Hz),2.03(1H,m),1.98(1H,m),1.92(1H,m),1.91(1H,m),1.68(1H,m),1.53(1H,m),1.48(1H,m),1.47(3H,s),1.37(1H,dt,J=14.4,3.6Hz),1.07(3H,s),0.93(3H,s),0.84(3H,s);13C-NMR(150MHz,DMSO-d6)δ:170.3,160.6,158.9,151.5,146.8,133.3,130.4,130.4,127.2,124.1,105.5,99.9,97.5,94.3,73.0,72.5,66.5,46.0,40.0,39.8,39.3,29.2,28.6,24.8,24.1,22.9,21.1,20.1,19.0,15.6。
化合物1(化合物1即oxalicine B)的波谱数据:(+)ESI-MS m/z 520.4[M+H]+1H-NMR(600MHz,CDCl3)δ:9.03(1H,br s),8.71(1H,d,J=4.8Hz),8.13(1H,ddd,J=7.8,1.8,1.8Hz),7.42(1H,dd,J=8.4,4.8Hz),6.70(1H,s),5.82(1H,br d,J=5.4Hz),5.52(1H,s),5.20(1H,s),5.08(1H,s),4.51(1H,d,J=12.6Hz),4.41(1H,d,J=12.6Hz),2.65(1H,dd,J=12.6,4.8Hz),2.53(1H,ddd,J=14.4,14.4,4.8Hz),2.45(1H,m),2.43(1H,m),2.33(1H,m),2.33(1H,m),2.26(1H,ddd,J=13.2,13.2,3.6Hz),2.16(1H,ddd,J=18.0,5.4,5.4Hz),1.90(3H,s),1.61(1H,m),1.61(3H,s),1.45(1H,ddd,J=14.4,3.6,3.6Hz),1.30(1H,m),1.20(1H,s);13C-NMR(150MHz,CDCl3)δ:173.4,170.4,161.9,160.1,152.0,150.7,147.2,133.4,130.7,129.9,127.3,123.7,115.1,105.6,101.1,93.9,76.3,74.4,67.8,44.6,43.6,41.1,29.9,29.3,26.0,24.5,24.5,21.7,19.4,15.9。
四、UPLC-MS鉴定OxaL微粒体体外生化
1、将S.cerevisiae RC01用Solution I洗涤,然后用Solution II重悬,然后加入oxaL基因过表达载体,然后加入Solution III并涡悬混匀,然后30℃孵育1h(期间涡悬1~3次),然后涂布Trp-营养缺陷型培养基平板上,30℃培养过夜。
2、收集平板上正常生长的克隆(酵母基因工程菌RC01-oxaL),接种于100ml液体Trp-营养缺陷型培养基,30℃、150rpm振荡培养1天,即为种子液。
3、将2mL步骤2得到的种子液接种到20mL液体YPD培养基,28℃、200rpm振荡培养2天。
4、完成步骤3后,4℃离心收集菌体,用2mL微粒体提取液重悬。
微粒体提取液:含10g/L牛血清蛋白,2mMβ-巯基乙醇,余量为pH7.5的TES缓冲液。
5、取2mL的Eppendorf离心管,加入1ml步骤4的重悬液,再加入2/3高度的玻璃珠(Sigma,G9268,425μm-600μm),涡旋震荡(1min/次,共6次,每次震荡完置冰上冷却)以破碎细胞壁。
6、完成步骤5后,取750μl悬液,4℃、4000rpm离心5min,收集上清。
7、取步骤6得到的上清,4℃、17000rpm离心50min,弃上清,收集沉淀。
8、向步骤7获得的沉淀中加入适量TEG缓冲液,轻轻搅匀,分装于1.5ml Eppendorf离心管,100μl/管。
TEG缓冲液(pH7.5):含50mM Tris-HCl、1mM EDTA、30%甘油,余量为水。
9、制备反应体系并进行反应。
反应体系:50μl步骤8得到的溶液,1μl供试化合物母液,49μl 50mM Tris-HCl缓冲液(pH7.5)。
反应条件:30℃静置反应12小时。
供试化合物分别为:实施例5制备的化合物2、化合物3、化合物4或化合物7。
将供试化合物溶于DMSO,得到化合物浓度为50mg/ml的供试化合物母液。
10、完成步骤9后,向体系中加入50μl甲醇,涡旋震荡1min,然后13000rpm离心10min,取30μl上清液进行UPLC-MS鉴定分析。
UPLC-MS鉴定分析的参数同步骤三的6。
结果见图7的C。结果与步骤三的结果一致。
结果表明:化合物3经过oxaL催化能生成化合物8(m/z 504.2392[M-H]-);化合物2经过oxaL催化能部分生成化合物9(m/z 564.2217[M+HCOOH-H]-);化合物4经过oxaL催化能部分生成化合物1(m/z 520.2348[M-H]-)。OxaL不能催化化合物7生成其他化合物。
实施例7、Oxalicine B生物合成后期途径解析
结合基因敲除株ΔoxaL等中间体化合物的分离鉴定,通过对P450氧化酶OxaL、依赖Fe2+的a-KG双加氧酶OxaK和P450氧化酶OxaB酶功能的解析,推测了oxalicine B生物合成后期从decaturin C到目标化合物oxalicine B的可能的4种生物合成途径,但以第1种途径为主,如图8所示。OxaL负责C-15羟基化反应,OxaK负责C-23羟基基团引入,OxaB参与oxalicine B分子左侧螺环形成。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国医学科学院医药生物技术研究所
<120> 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用
<130> GNCYX213577
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 28137
<212> DNA
<213> Penicillium oxalicum
<400> 1
cagggagatc acgaggaaga cacaggaaaa caaaagttgc gtgaatagac ccacaagcat 60
gatattttgt ccgacgtccg ccatcgatgc ttgggttatc atgccgccac cgccggcttg 120
gagaaggatg gcaataacgt caccgcatac aaagacttta gtcactcgag ccgaaggaat 180
catgcttgtc ttaggcgtgc tgacgaagag cgcaatacat ccgtacatca tatcatagag 240
agttgcagcg taaaggtggg tggggggggg gggggggtgg gcaggacgac gagcagagat 300
tcaatgcatg atgtatgggc ctaggtcgaa aggtgacttg gcggaaaaga tctcgcaatg 360
taaccggtgg tcatccctac ctaagaacag ggattatgag ctgcatcgat gggggagatt 420
caagacggac tcctcctgca tatggagttc gacacgagat ccggaggtca gactatccaa 480
tatgaaagcg aggatcacct tgcgacatgg caaatcaacc caaacggtga agtcattctc 540
atcgcaagcc tgttcaagtg ggacaagaag accttgaagg caaacattga aatcagaccg 600
catggttctg cccttgacgg ctccgtcgca gtcttcggcg ttgcaccaac cacaagggaa 660
acactgctac attatcagct cgacatctgc ggaccagtca ctcctgaaat gctggagctg 720
cttgccgcct atagcccggg gccagcagcc aagaagtatc taaatcgcta ccgattcgaa 780
tgcctgagta cctcggacat ctccagaaat ctcctcaccc gtgggcagct gatgaagcag 840
gctgccagca aagcagtgtg gcccgaggaa gaattctcta ccttgatctc cattatgccg 900
agactccgcc tgtggtattt ctccatcgtc tcctcgcctc gtgtgaaccc atcttccatc 960
gccatcaccg ctggtgtcct cgaaacaaca attgcacaca ctgatcgagg attcattggc 1020
ttgacggcgg gctacctgca ttctttgcac ctgaaagaaa accaactcaa ctcaagcgat 1080
gaacctgagt cttccaacaa ccttgaagga ccacgatcta tcgtgaaaga ccacaagcta 1140
ttcgcccaca tccgcaaatc aaggttcagg cttccagaca gtgatgagac tccaattatc 1200
ttcatcgctg ccggaagtgg catcacacca ttcagagcct ttgttcagaa gcggaagctt 1260
ctttcaagta agggtatcag tgggtaagat ggttcttttc tatgagtctc gctccgagga 1320
ggattgtctg taaaaggacg tctagatgga agtggaggcg atagggatct tagacaccca 1380
cttcgtgtac tcgtctcgat tggtggatgg aaagaatttc tacgtgcagg acaaaatgta 1440
cacattttgc agagaccatg aatcaattga ttcagacgga ggatgcgtca atttatgtct 1500
gcggaggctc tagcatggcc aatgatgtga aagccatcac ggtcactcga gtccttggcg 1560
gcatcggggc tgtccagcaa ttgaagagat ctagacggct ataggaaggt gtttgggggt 1620
agcaagtgtt tcattcatgc tatttgtttc tccgcaatga caagatctac atattgaaca 1680
aaaacgtatg gaaagtgtga ccttcatgac tcacatgagt ctgcatgtca ggctagcaag 1740
tcaaggcccg aattttgaac gctagagatc ttctagatgc tcatcctctc cgtgtccaaa 1800
ttagccctag tacaaacatc aatcccagaa taacgcccca tatttctttt ccactccctg 1860
tagtattttc agtccatcca ttggcggccc tagttggaat tggaatgaag ttcaaccttg 1920
cagcgccttt aattgcttgt gatgctcccc tggcttgtat tttaccggca tatggtaata 1980
catatcgggc gaaaaagcgg aggaagaaag tgtcccgcgc ttgtaaacgg acaaccagcc 2040
gcgcaacttt gtgaatttta tgcattcgtg cttttcgctc agccgtatac cgccttagcc 2100
tattgtccaa ttgttccgtg cttggtttgc tgcttgggct ggcaatgagg aattcatgaa 2160
gcagattggc taggccggcg gcatcttcaa tagcacaatt ggcgccttgt ccggtgttgg 2220
gggcgatcta cctggagtta gcttctgctt tgatgtagga aaattaaggt ggtatgtacc 2280
ttatgtatac tgtccccaat gcaaactatg cgcttatgat gccagttctc aaatacattc 2340
tcttcgagaa ctgtcatgtt atgccttgtt ctccgagtcc agaggtcgcg aaacgccacc 2400
tcgccccaga taatatcgtt tgcgtatttt tcaaccacgg atgccacatc ggttgttgcg 2460
aaacgaggca tatcgccatc ggaatagagc cgatcaagtt tccagatcaa aaaccaaaat 2520
gtgcgatcat ggtttccagg aaaggttaag aatgaccgtt tgtcgttgag gctggcaacg 2580
tgctcgccgg gtgggaatcc cggcactgcg gaggatatgc cgaaaacgca gccatactcc 2640
gctgtgagac ctgttcactg ttagctgcct tctttgatgt atgaagtata ttcaacaagg 2700
gacaattggc acaaaccgtc tctcccaaca ggttccataa tttctccgtc ttcggcagag 2760
attctccaca tttcccggcg gacaatgcta tgcaccccat cacaacccac cactagatct 2820
cccttatagt cttctccatc cttcgttctt accaagactc cttctcgctt tcctcccgaa 2880
tcagcaatga gctcaacccg tgcaacttcc ttatcacaga gaacctggct gccttcaccc 2940
ccgtctttag tcactttccc acgttgccca agaccaagcc tatcagcaag aatacacaat 3000
agcgtcctcc gctctaaaaa tgcaaagggg aacccaaagc tctcgccgat tacccgagga 3060
gagtcattcg tcagcacaaa cctatttgtg tccgggaagc gaagatgagc ggtatgtagg 3120
ggagcaatct ccttctcaac gcactcgaag agccctagct ggtcgagaat ccgaccgcca 3180
tgggggagaa tcccgatgga ggcaccttct tgtggtgtaa gtgacgtgcg cttttcgagc 3240
accgtgaatc gaatttttgc tctgtgtgtt tgggtgttgt cttggagaag agaggtattg 3300
agggcagtca gagcgtgtgc gagcgttaga ccagcgatgg agcctccaat aatgataata 3360
tgcagctcgt ctgatgcaga cttctcggtc atcgcgaatc atggattccc ccgcggagaa 3420
tggcacttat gatggtagtg cggcgtagag agttcgtaga ggcagtgtgc tattgcaagt 3480
aggtaaaaaa gtaacgctcc ttgattgact acagggatag ccattgtacg ttaggtctag 3540
ccgagaggcg taatagtagg atgatgtaag tcgtgtatta ttgtaagcat aaatttgatt 3600
taatacatcg gctcatcagg cgagactgta gatcttatcg ttacctaact cataccttgc 3660
ttaatgatga atcaatagca aacatgctct gtgaaatctc actcagtctt tttgccagcc 3720
tttgcttcag cctgtttcac aaaggcaaaa aacaagccgt acgccccatc aaagattaca 3780
aatgctgcgg tggaccagta gaacaacggg ttcatcgtcc acgcccacag ctcaggccag 3840
tagtgtgcac gaaaaaacac acctgcaagg gcacttcctg tcccagtcac acgagacgac 3900
ctatctctca gtcagcaagg caaggaagtt cgttgtcgaa gtcaggggga cggaagaaac 3960
gtaccagatg agccaactag caccacgcga ttggctcgat cgcacgagct cacacagcgc 4020
ggtcacactg gtcatgatct ggcagcccag tccaccatag tagaacgctg taaggggtcc 4080
cacgaggttt gcgagggaga catgtcccgc agcccagata gcggtgacga tgacgaaggt 4140
aagatagaag taatagccgc ggagcatcga atcatccccc aatgctaggg gatggtattt 4200
gagagccgca tatattgaag caaggttcag cataaaccat gcggtgacta ttggaaggcg 4260
gggcggggga tagagagtcg cgtagacgag ctcccaggcg aggttacagg atactgggac 4320
gatggggacc cagcaggctt tgtcgcggca agcggtgcga atcgtggcgg cgtagcaagt 4380
cagccagccc gctgccatgg cgaagagcag tgtgtcggat atccatttaa ccgattgaaa 4440
ggattcgggc gctttggtga aatccagtga gtccatagtc actttgaagg gtgagcgtgt 4500
tggtggctgc aagagggaat ggggttgatc cttgaaatat tatcctgcac aacacagtcg 4560
aagtggaacc aaaggcgccc tccaggagga actcatattt atgagaatgc gtacactttc 4620
aagtcgcaca ccgtcctcgc aaggaaatat gcaggggtac cgttgtggag ccctccttgc 4680
atcgcgtgct ccaacttgat aagccatagg tccaagctgt cacacctgac gagatgaagg 4740
gttgctcaca acgaaaaacc tttcacatcg atttcgaaga cccgtggcga atcttgcctc 4800
taggttcacc gtcacgacga ccccgagcat cgcagcgcct ctagctatga ctggtcaagg 4860
tgtcacccag cagaaggcga ctctaagtcc cgagaaggta tcgaagcata tcacttcacc 4920
ttatgtcttc gaattttaat actcacaaac aatagatcat agcagccccg atagactacc 4980
tcttatccca accaggaaag gacctccgca gccgcctaat cactgctttc aacgagtggc 5040
tgaatgtccc agaggagaag ctcgatctca tcagaagagt gattgagctt ctgcacacgg 5100
cctcactcct gtaggcttct ttaatcgttc gcacaagttg aaaatgccta attcagcgtc 5160
ctagaattga tgacattcag gactcctcta agctgcgccg gggtcaacca gtcgcccaca 5220
gtctatttgg gattccacag actatcaact ctgcgaacaa tgcatatttc gaagcgcaaa 5280
atgaactgca caagctgaat gacccgcgag cagtccagat cttcacagag gagcttctcc 5340
ggctgcatcg cgggcaggga atggatttgt actggcgaga ctccatgatc tgcccgtccg 5400
aagaagaata cctcgatatg gtagctgata agacgggagg tctgtttcga ctcgcgatca 5460
agttgatgca gtgttcaagc tttagtacat agtaagctgg cacgtctgac tctgggcaaa 5520
cggtttgaat gagctgacta gagataatag cgactacgtt cccctggttg acttgatggg 5580
cgtcatcttc cagattcggg acgactacca gaatctccag agcggaacat atattcagaa 5640
caaaggtttt ggagaggatt tgactgaggg aaagttttca ttcccaatca tccatggact 5700
caatcatggg acgcagagcc tgcagctttt caatatcctg aagcagaaga cggaggatgt 5760
gtctgtcaaa cgatacgcgc taagcatcat ggaagcagct ggaagctttg catattgccg 5820
cgcaaggctc gcggaactgg ggacggaggc gaggttgatg cttcaggaaa ttgagcgtac 5880
cacagaggga gcatgcgccg gtgacacaaa aggcaaagct gtcgccgaat ttttggattt 5940
gctcgagatc aaacaggaca gctcatgttc caactgtgct aattgcacac aaggcttatg 6000
aatgttctag tgtgcgagtg ttattaaata gtagaccagc catcgtcaat aggaagaaca 6060
gctccattta tccgcgaagc ctgatctgag cacatgaaca caataataga cgctacttcg 6120
tccggcatca tcatcgcgta tccatctctc cggttggcat acacagcgga aagaacaggc 6180
ttgattgtcg aagtggcttc cggatcaaac cttgatggat caacactgtt taatataccg 6240
gtcgccactc ctactgatag tgagtgcctg taacaaaata tgggcttaat ggaagaacaa 6300
gacatcttac ctcctgggca cagcacgttg catcgtatgt tctccccttt gaatctccag 6360
gccacgttct tcgtcgctcc gataaggcca tgcttaccta cgactggtta gaggtatctt 6420
ttaatgagac tgaccaagaa agagaaacgt actcgccgta tacgccacgc ctgctgcagc 6480
accgctcatt ccagctcgac tcgccatgtt caagatcaca ccagacttct gcatcctcat 6540
ctccccgata acctctctca tcagtctcac cggtgccgta aggttcacag ccatacaacg 6600
attccagtct gcgtctgtga ctgtgtccac actggcattg tgatcgagga ctccagcgat 6660
attcatgaga atgtcaatcc ggttaccgaa ggctgaaaga caagctttga caattgtctt 6720
agggatatct aggtctgtga ggtcacattg catcgtctga cagttctcgt tggcttccag 6780
gacggctgga aatggcgata tgtcaacggc gaatacattg gccccagcct ctaaagcagc 6840
ctcagcagca gccagcccaa tgcctgagga ggcgccggtg atgattgcga cctgccctga 6900
gtgttactat gccatcgatt ggcgattatt cgggcaatac taacacgatt ttgaagacag 6960
cctgattcca tcgtgatagt cattctgcct ctctgtgcag aggacgtgag ttacacgtag 7020
ctcaattctc acccaggtac tgagcgcaga tcatttcaca aaatgactta aagcttttct 7080
agaagtgaca ttgaccgccc agatggggcc agttcccatt tagttggcag acaccctaag 7140
aggaagttct ccatcaggta tgtggtgtat ctgatgcgga ctggacccct tgcattagtg 7200
ttacacaggg gaactacacc gcttcactag tgcagcgact acatattgat atcacaaata 7260
ttttcaagga cagtacaatg ctctttccag gccgtatatt ctacgctttg caaaggttgt 7320
ctacgtcgga tagacaagca atcatgattg caagtatact tgaaaagtcc cgagatgctg 7380
accacttcac tattatcatc gccgcatctt ttctcttgag cgtcgcgatt tctcttgtct 7440
ttttacgttc aactacgcct cagctgcctt tgttaaatgg acccaagcgt tgggaattca 7500
cgttcacgaa tgcgaagaag cgctattact tgaatgcgaa tcaaattata caagatggat 7560
tcaagaaggt ctttcctcca tctgcgacag aatactagca agatctcact aagccacagt 7620
ctaaagatgg gttttatgct gtcaccgaga atggaatcga gctgattctc gcaccgaaat 7680
atgctcacgc tatacgaaac gacaagagac tcgactttca cacttacagg acgcatgtaa 7740
gtatagtagc tatacttatc tggtcttttt gccctttctc atttaaaaat cactcacaga 7800
ctatgctccc caatgtcgca ggcctgaaag tctttgagat ggatcaggtc ggaagggaga 7860
taatgagtta catcatccgc caaaaactaa cacatcattt ggtcgatctc atcagaccgc 7920
tgtctgagga ggccgatgat tgtttacacc ggagttggac agataattca ggtactccaa 7980
atctccatgt cgtagctcgt ccatgaggat ccattcactt attaatcctt agattggcac 8040
gaaatttctc tcaaatccac cctcctcgac atgatatccc agcaatcggc ccacgtcttc 8100
ctcggccgca gcttttccca taacgtgagt tggctagcgc tgtcgcgcag cataaccttg 8160
caggccttcg gcgccgtccg cgagcttcgc gtatacccat ccttcatacg cccgcttgtt 8220
ggctggtttc tccccgcatg taaatcactt cgcggagaga ttgccaaagc ccggaagctt 8280
gttgagcccc ttatactagc tcgaagactc gaaagagagc gatgcatcgc cagtggccgg 8340
gaaccacccg tctatcatga cactattgca tgggcagagg aatgtgcacg tggacgaaaa 8400
tacgatccag ctcttattca gctcacgctc gcgctttcgg ctatgcacaa cacctctgac 8460
tttctcacgc aagtaatata tgacatagcg gcgaggccga aactcgtgga ggagttgagg 8520
aaagagatca tcgatgttcg gacgtgtgga gatgcaacag agtcatggaa taagggggcg 8580
gttcacaagt tgaagttgat ggatagtgtc atgaaagaaa gtcagcgatt gaagcctacg 8640
ggattgggta agttttgctg ggatcaacgc ttattctcta caaggctaat atgctaatca 8700
tatagtaaac atgcggcgct atgcaactga ggacatccag ctctcttccg tcattcccga 8760
gcacaaggaa ggcagcatca caatccgaaa gggggatctg gtcatgatat cgcaacacag 8820
ccactgggac gaggatattt accaagacgc ggcgtctttc aacccatacc gattctgcag 8880
gatgcgcgaa caacccacgc aggagcacac agcacacttt gtcgccacaa gtgtcaacca 8940
tatcggcttc gggcatgggg tgcatggctg tcctggtcga ttctttgccg ccgctgagac 9000
gaagcttgca atgtgtcaca ttttgatgaa atacgacatt aagcttatcg atcagcctaa 9060
ggtcctcaat gtaggttcgc ttatggttgc aaatcccgtt gcgaaggttg cagtgagaag 9120
gaggaaggag gaggtttcat tgtgattgtg aacagtgagc tcgcccacat ctcactcagc 9180
ccaaggagta ccaaaggtag gtggagatgg accgtaacca cattactgct ttcggacaaa 9240
ctcaatttac tacatacctc gtggaatact caccttcgcg taaatgaaag tctcccaacc 9300
tttgtaatca cagtatatat tgggcttcca agcttccgtc tatgtctgtg aattctaaag 9360
cgttactatc gtcccttgaa cctctgtccc aaacttgaat gatatccttt ctcgtccatc 9420
atgttgtcaa tgatcgtaag gggaagaatg ataaaataaa ttgaagtatg gttattcagt 9480
tgaatctctg gcagactcaa attcacctat tcaatctgaa ttctaacttg tccaggttcc 9540
atgtccgggt ggtttgtgac cgttgatata cctatcgagc atacgtaatc ttccaaagtt 9600
taaggttgcg acccaccaat acctgaacca gggcgtagat cacacctaga tacgtgtaca 9660
acggctcata ttcgatcggt gtatcatata tgcctaggat aatggctaaa tgcagcctgc 9720
ctaagaagcg gtcgggagac ggtgctccac ctacctagta gtagtagtag gactaggtac 9780
tccctatgct acgtgtgtaa tgactcaaca ctttctcttg gctatgaccg cctctctgga 9840
tgcaggtgaa ttcacaatta ctaagtaagg tcaagaaagc ggacataatg caagagtgga 9900
cattatgctc ttcttcgcac tctcactacc acatccggag gcacagcatg ctctcccatg 9960
aaaaagttcg gaggccgtcc atcaatctct tcgatgtcgt aatgcaggac gatgtaagaa 10020
agcatcattt tcaatatgcg ggttgcaaac tgtcttccgg cgctacaaaa ccattagaat 10080
tacatagaaa atgagaggta tcagacctac caggccgagc gaccgtgtcc aaaggacaga 10140
aatgtgtcgc ttgtcgagac acaagactct gatttcccat cctgcacaaa acgaaaaggc 10200
ttgaattgtt ctgcattctc gtagaatctc ttatcgttat gaatgggaat tgaaggaaca 10260
gccagccagc tgcctttgtt aaggagttgt ccatttggca gcgccagccc atctcgggga 10320
acgacctcgc gcaacagagc catcgaggtg ggtggcgccc gccgcagact ctctcgaagg 10380
gtgctatcga tgtatcctaa acgatgaaca gtagctgggt cagcccattt agcaggacca 10440
tcaaacaccg actcagcctc gcttcgaaga atttggtaaa tctctgcctt ttcgctcgag 10500
ccgagtatgt cgagcaaggc atggtgcgcc gtcaatacgg tacttgtaaa tgcagctcca 10560
agctggcgga agttgtcaga tcatgataga atcttccaga tgaggtagag ttgataaccg 10620
taccagtaag ttaaaagcgt cagcgaacac cccctcagct ccttctgggc cgcgtgtctt 10680
gaggatggct tgacagagcc aagtgaccat gtcttccggg acctgtgaat cctcctgcaa 10740
tttgttcaat ctctctttta caattggcat caggtaagcc aggtaccggc gctggacata 10800
tccgatgggc ttctgcagca cccacccgat gacgcctcga aaaggggccg gcaaacattg 10860
ccctgttatc gtagaggccg ccccaaacca ctgtgagctc gatatgatcg cctctacaaa 10920
gcgctcattt ttggccaatt cgcgacccgc cagaacggga accaaggtat ggtaaacggc 10980
gtagcgcaac gcgtcgccaa gtgacacctt actgacacag tttgcggtgc caaaactgcg 11040
atcaatcgcc caactcagtt ggtcatacat agccggttgc aacctgtcaa acttcttgtt 11100
caggtggact ttgatcgcgg tgtgcagtat ctcacttgtg gctggtgtga agccaggcgc 11160
cacgtaccgc acgcccatcc gggagtatgc ggcgcggcgt gggcacagga ccgtgggcgg 11220
ttgatcgata atccattgta tgtgctcttg cggtaggatg acgacgggct caaaactaat 11280
caacggcata agaaaggctt tgccagtttt gttgaaggct ttgtagccgg cctcgaggat 11340
ggccggattg tactgccatt gagcaagaca ggcacggaac gcgctgagca agccctgctc 11400
gcgacctatc catgagatgt cctttggccg gcgttggaga ggaaaacagg ctcgggcgag 11460
atggtatagg ctgagtccca ggactaaggg agctatgagg atgagaatgg ttggggctga 11520
aagttggtac tgcatcttgg tcacggcggt catgggcacg ccacggagca aggaattacc 11580
actgtttagt atgagagact gaaaatatag atggtcgatc ccgattgccc tgattaaaga 11640
gcggtatgga tggtgtgacg tccttgcatc aagttttctt cgactttgca tgtaaggggt 11700
ccctagccac ggactcgcct gttctgagaa tgctgatata agaggcacag ctctctatca 11760
tggaattatt tacaggccac agttctatcc cttcgtcaca atgatccgca gtcccactgc 11820
cccaagcagg cccctaggcc agatctcgtg ggacctgatc cgcatctcgc gatttgacaa 11880
gtacaactca tttctagccc tctttgccgg aggttagtcc acccatccca aattcataca 11940
ctctaggcag tgggtgctaa caacacacag tatggtcaac ccttcttgcg gggagcgcac 12000
gacttcgcga agaccctgag cacgtctccg ttcaatatat ccttagtcgt gcttttctgt 12060
gctccatagc cgcatatata ttctctgggg caggcatggt gtggaatgac tgggttgacc 12120
gggacatcga tgctcgcgtg gcacgcacca aggatcgtcc tttagctgca ggcagactga 12180
gcacagaaga agcaatgctt tggatgctgc ttcaagctgg tgtagcaacg acatttttgt 12240
attggatgat ggacggacaa catgtgttcg tgagcccctg gaaaagtcat ctctctctct 12300
ctgctgtacc aaggtcgact aacgaagcgg ggctacctag cttgcattcc atgattcctc 12360
caacattagg aacattgata tatccatatt gcaagcgtcc tctcgctcgc cgacttggta 12420
tctaccctca atatgttctc ggtctgacag cttcctgccc tgtcctcttt ggccgtgctt 12480
cgatataccc tgatatagaa tccttctctc gactcgtatc gtctagcctc ccgctttgcc 12540
tagtggtgtt tacatggact ctctatttca ataccgcata cagctaccag gacatcgttg 12600
atgacaagaa attgggggtg aactcactat acaaccttgc gggaaagcac atacatggcg 12660
tgcttgtggc cctcgtgaca atcatggtga gcgcactgtg gtgggcactg taccccttgg 12720
gatcagcttg gttgtggatc tcttggatgg gagtctggat cgtgggatgt gtggaccaaa 12780
tgcgcagatt tgatgcgaag gatccttcaa gtggacagta cgtcttccgt agcaatgtcc 12840
ttatggggct ctggacgatg cttgcttgtc ttttggaggt tttttctaca gggaagagag 12900
tggctttgtg aacgaaatgg ggaagacata gcgacacaaa taaatattag ctgccagccc 12960
agcaagcgca gagcaagatc atgtgagact ggatgaagca cctgctagaa atatcatggc 13020
atttgatcag gttgaagtga gatcagtatc ccagtagagt agcggggtgt tcttttccaa 13080
aggaatgttc caccctggcc gaacgttctt ctcttccttg cccgtgaatc tttaatgttc 13140
tagcaaccac agacggagaa agactcagct gagaccagcg gctatacagg aacaccagct 13200
actatttaca cgtgttatgc tagattgatg gatatttgag tcatttgtct ttgacatctg 13260
cgctcaagac ttgacgaaga aagggcaaat tcaaaaaccc acagagaccg aacaacaggc 13320
tgaaagccct gatgggagtt cataggttgg taatgagcag taaaactggt actgggcagt 13380
catatgcaat tattcctgta ggagtaaggg gctcgcctag cccaattgcc ttgcaagata 13440
agctagtcac caaataaata tagatcaatt cggttggttt ggactctcat ctccatttct 13500
tgtcttcatc atcctgtaga tatcgccaat gtccctcgag cccatagcta ttgttggaac 13560
aggatgccgc tttccgggtt cctcttcctc accgaatcgt ctctggcact tgcttcaaaa 13620
tccgcaaaat gtcgcctcca aagtccccag tgagcgcttc aacgtggact cattctacca 13680
ccctaatagc cagcagcatg gctcgacaag cgtggccgag tcttattttc ttgaggaaga 13740
tataagagcc tttgacgcgc ctttcttcag catcagccca gcggaagcgg ctgccatgga 13800
tccacagcaa cgcttgcttc tggagacggt ttatcactcc ctcgaggccg gtggccatag 13860
acttgacgct ttgcagggct cggccacagg agtctactgt ggctttctcc ggactgatta 13920
cagccagata cagtttacag acccggactc gttgccaccg tacacggtta caggaaattc 13980
tcccgcaatc atggcaaacc gcatctcata ctttttcaac tggactgggc catcgttcgc 14040
ggtggatacc gggtgctctt cgagcttgct ggcagttcac ctggctgttg aatcgttgag 14100
gaaaagagac tgtgatttgg ctgtcgcggt ggggagtaat ctgcttctat cgcccaaccc 14160
ttatatcgcg gatgcaaaga cgggaatgtt gtcagctaca ggccgatcgc ggatgtggga 14220
tgcatccgcg gatggctacg cgcgcggaga aggggttgcg tcggtagtac tcaagcgatt 14280
gagcgacgcc gtcgctgcag gggacgagat tgagtgtgta attcgagcta cagggatgaa 14340
cagcgacggc cggacaatgg gtatcaccat gcccagtgga gaggcacagc ggaaactgat 14400
tgagtcgacc tatgccagta ttggacttga tcccaaaaat gctcaggaca gatgtcaata 14460
tttcgaggcg cacgggacgg gaacgcaggc gggagatcca caagaggcca gtgcgattca 14520
tgcggcattc tttgggaacg aagctgaaaa cgacagctct aacgtcctgc atgtcggttc 14580
aatcaagaca gtaatcggtc atacggaagc aactgctggc ctggctggct tgatcaaggc 14640
atctctgtgt ctacagcatg gggagatcac accgaacctt ctgttctcca cgcctaaccc 14700
tcgcataaca ccgcatctta ctcgactcca ggtgccgagt gagtctgtag catggcctac 14760
cctgccgccc ggggcaccac gtagggcttc ggtgaactcg tttggctttg gcggtgctaa 14820
tgttcatgcc atcctggaaa gctatgaacc cccttcttca tctcgccgag gctcagaaga 14880
tgcagaggcg gattgtttgc ttcttccctt tgtggtttca gcggcatcag aaccctcatt 14940
gaggacagca ctggagaggc ttttccaatt ccttgaggat cagccggtga caaacatgat 15000
cgactttgct cagaccctct tgacgcggcg ttcgtgccat aaacatcgta tagtatttat 15060
cgctagctca tcggacgagc tcagagacaa gattctgcat gaaatatcct acccatccag 15120
tggccagata tccgcgaaaa ttcatcgccc tgtccaggca aatcggagct ttggcatatt 15180
gggaatattc actggccagg gggcacagtg gccgcagatg agtctcgata ttatcaatgc 15240
cagtccacag gctcaaaggt ggatggctga tatgcagaaa gcccttgaca cgctccctca 15300
acaataccgg cctgattttg atctattggc agaacttgca gtcccaaagt ccgactctcg 15360
aattcatgaa gctagaatct cacaggttct acgcactgct gttcagatcg tgcaaaccaa 15420
cctccttcgt acccttgggg tcaactttga tactgtgatt ggccactcat cgggcgaaat 15480
cgccgccgct tttgctgctg ggattctcga cctctcagat accatccgga ttgcttacct 15540
acgagggtgg gcgatcaaac agtctcaaaa tcagcaacaa tgcccaggga gcatgattgc 15600
agtgatgctt gattggaacc aagcagaggc catttgctgc aaccttgccc agtacacagg 15660
gaagattcaa atagcagcct acaattccct cagaagtgtc acactatctg gcgaccgcaa 15720
catgatcgat gaactggcct ggctactttc aagtttgggt catgctgtgc accggctcca 15780
cgttgatact gcgtaccatt cccaccacat ggagcctgcc gccaagctgt atcggcaagc 15840
cttgaaagct tgcaacatcc aggcaaaaaa gcccagatcg acaatgcgct ggttttcatc 15900
cgttcatcct ggggtagacc tcaatgctac cgggatttct caaccgaggg agtactgggt 15960
agccaatatg ctggagtcag tttcattctc acaagctgtt tcgaccgcgc tcctgtcatc 16020
ttcagatacc cagtatagct gtgccattga gattggtccg caccctgtgc tcggtggacc 16080
agtcaagcag atccttgagg ggatggcgag accgatagac ctgccgtatt ttggcctagc 16140
gaggcgcgcc acatcaggaa tacaatcatt cgccttggcg attggacaac tctggactat 16200
ctttggtcct ggcgaactag atttccaggg ctatctccgc gcattcaata tcaatgcttc 16260
accttctctg ttgaaagacc tgccgagtta cccatttgac catagccaat catattgggc 16320
cgagtcacga ttatcacgag ctcgcttacg tgcacaaaat cctccaaatg cattgttagg 16380
ccgattgctt cccacctctg gccaaggaga acgacgctgg agaaattatt tgcgccccga 16440
ggagcttttg tggttggatg ggtacaaatt agaggggagg ccagttcttc cgccagcaac 16500
atacgtctcc atgatggttg aagcggccct tgagatttcc ggggtatctc cagtacaact 16560
actcgagctt cgtgatctag aattctatca agatgtcccg ctcccatcag atcaggctgg 16620
acttgaggta ttgttcgctg cggaggtaag ctcaaatgaa tctcatgcgt tgggcaggtt 16680
cagctgtcaa gcagctgttg atggtgagct ttgccgtgct gcttcaggcc aattcgaaat 16740
tacctatgat gtacctggct ttcaagctct ggctgcacga gccacacctc tgacgctcca 16800
gccaatggat gtgaacggat tttaccgcga tttatctgct ctaggtcatg acagatgtgg 16860
agatttcaaa ggcctttcta cacttgcttg caatcggaaa gtcgcttctg caaccatagt 16920
ccatccaggc agcaacagcc atcaaccctt gaattttcac cctgccacaa tcgaccacgc 16980
ttttcagact gtattagcaa cttcgatctc caaaacgagg gatcaggcca ccggctcgcg 17040
ctacacaatc tccagaatat cttatttggg catcaatccg accttgcgcc cggcagatag 17100
cgaagcactg aacattgacg gctcaatcgt tactaaagtc ccgggtttga tcaccggcgc 17160
tgcagaaatt ttccggtcaa atgacgagtg cctgctatct tgcgagggaa tacaaatctc 17220
tagaaccgcc aatgcctcca gcccacctca attgtttagc accattgact ggatacctct 17280
tcaacccagc gcaaccgcag gtggaaatgt actatgccga ccaggggccg tgaggacgct 17340
gatggctcgt gaacagctcg cactactgct cctgcgtgat atatgcagga aagatgcgcg 17400
gaagtcaagg gaaaccctcc cagaaggcaa ggctgcattc ctaaactggg ctgatcatgt 17460
cctggcccat gtcagagagg gcatgcatcc agtctgtcgc ccggagtggc tcgcgggtaa 17520
atctgacgag atctgcacac ctccacttga acctctgatg cgcattggtg aagattgggg 17580
aaaccttctc gcttctgagt gtgaggatgt tattcctgct gtggagcttc tggatcgata 17640
ctacgctaca aatatgcaag acttcaaccc gtggtattac cgcttcgtgt cgctagtcaa 17700
acagctgaca gcactctatc cagtgatgga tatcattgag gtgacagtca gtccgagtta 17760
tcgactgaca aaccgtgttt tgagcgagat cgggactgcc tataagacct atacacgcgc 17820
ggtggtcaac atgtccacgg cagcatcaag cacgaagcca gctgcacaac cacaaatcca 17880
cgagaagaac ttcgaggccg acgcgttcaa gcagaattcc gtcgatctaa ttatcgtcca 17940
tcaggcgctt tacagcacaa agtcgttaga cgatgccttc aaaagactgc gccgaatgat 18000
caagcctggc ggctacctcc tcattcttga agatacaaac cccaacctca ttcatcggaa 18060
actgctgctt ccattcagcg gctggaaaaa gacaagtaca gaacatctgt ccaatggccc 18120
tattcagaca cgtgacgcat ggaaatccct ccttttcaag catggtttca gcgggattga 18180
ttcaataacc tcaattcatg acgaggtgat agctggtctt tccatcatgg taagccgcgc 18240
ggtggaacct gcggcccaag agattcaaag tccatctcac gagtcaaaca agcccagcga 18300
tttggtgatc gtggcggcgc agaataagtg gatgaatcgt acatggattg ccgtctctga 18360
gcgctttcgc cgtatggaac tagtcgagaa tattcgcgag attaaatttg ggacaggaag 18420
aaatccgcct gtcgtccttg ttgtgacaga ctctttgcag ccaacagtct tttcagggcc 18480
ccatgaggag gagaaacagc taagacggtt gtttgctggg gccagcaaag ttctctgggt 18540
tgtttctcgc tctgatttca gaagccctgt ggctttgtcc aacgctgtta cagcgggaat 18600
tctttctagc ctctcagttg agtacccaga cacaatgttc cagcgcctcg agcttccctg 18660
cgatctgcct tctaaggaaa atgtcgatgc tgtggtcacc cttctgatgc gcctggtgtt 18720
cacatcttca aaagaaagtc tctcgctaga atcgcacatg cgactgtctg agaagggtgt 18780
ccttcatgtt ccgcgtcata catattccga ctctatgaat cagcgctgtc tagcagcgca 18840
cgtcgaagtt caaggtgaca ttttgttcaa tcggaatcaa aaatatactg tactgcaggt 18900
tgagcatgtg ggaacgaccg agaaacaagt cgctcgcctg catgcatatc catccatcgg 18960
actcatgtct ggtgtctcga gaacaaatat cgaggtcgaa gttgattatt ccacagcaca 19020
tagtatcaaa attgaagggg cgggatcttt ctacctttct ttaggtacag cctcccgtca 19080
tagcagcggt ctccaccctc gcacgggaaa aggccactcc agtcgcgtct tcgcactctc 19140
tgagcgcaat gcgtcacgcg tgcatacccc aatcttgtgg tgctgggatg tccctgccgc 19200
tgtttccgcg gcgcaggaag ctgggttcct agcgaatata gtggctgtct tgatcgcgaa 19260
agatatccta tccaagactg aacccgactc ttcaatattg cttttagaac ctgatgtgac 19320
catcctgaag atcctcgatt cactcgcgcc tttgcacaag acaaagatta tatcggtcac 19380
acacaaggca actgccaaag ccaacagaaa gagtctgatt tatatccccg agcgtacgcc 19440
ctctcatcgc atacggcaaa tgattccaca caaaaaagtt gtcagagccg ttgtttttga 19500
ttctaaccgc gtctgtaacg gacgaaatga tcgcatctgc aacctctttc cgaatgctcg 19560
acagcttgat atcgcgtcct tctatcaaac tgtgccgatg ccaaactcac cagaacatgg 19620
ttccatactg tgtattcctg cagcggttca gagtgtagcg gggtggcttc accccgaaga 19680
ttccactttt gcagtaacct cgatcacaaa acttatttca gaagaaatcg atctacgacc 19740
aacctctgtg atcaaatggt catctgagac tcagaacccg atcaaagcgc agatacgttc 19800
agcgacagat gcggtcaatt tgtcgcaaca aggcgcatat gttttgtggg agctgcccaa 19860
ggccttgaga aggaccgttg ccgattggct tgtctcccat ggagcgcagc atcttgtttt 19920
tgttcagaaa attcccgatg atacccagtg ggtgtccagc attacatgtg gtggtgcaga 19980
agttgttatt gtgcctcctc aggaagatct cgttcacacg gttcttgcgc tccgagacca 20040
ctcgtctgtg ccgcttgttc ggggtattgt atttactggg gcactcgata atgctgtggc 20100
tgctgagacg atccaacggg ctaaatgctt gtcccaacat tacgactctc ccaatctaga 20160
gatgttcttg agcattgact gctgcccagc gataccgaat ccgcagcagt gcgctgtgac 20220
cgaatttctc gcagcactag cacatcaacg agcaatgatc aatcttgcgg caagtgtcct 20280
ctgtcttgga cccgggtttg atctcgacaa tccacacgga gatgatattg cggagatact 20340
tgcagaggct gccttagccg gccatccctt tgccggtggc gatcgcgtgg ttacagctgg 20400
cctctgtccc ggtactggca gtccagagta caaggcgtgg gacactatcc actcgcggaa 20460
cccagcaatg tcgaacatcc ttgctttgtc aaggaaaggt gggcaagaag agactgctgg 20520
cgttgaggca gccacggagc atatcccttt gaaagtccaa ctcgagcgtg ctaaagaaac 20580
cacatcggca gccttggctg tgcgggctat tttgaatcag tactttacca gatacctccg 20640
gatgcggctc cagtccacgg ccgagatcaa tgagaatacc ttattcaacg aacttggtgt 20700
ggactcgatg gtcgcggcac agttggttgg gtggtttatg aaagaagttg gcgtggaggt 20760
ttcggttgtt ttcattctcg ctggcgcatc tgttggcgag gtcctccagg atgtcacgga 20820
gaagcttatc ccttgaggtc gagatttttc tgtgtgaata aatatagctc tcctgacgcg 20880
accttagaaa accacatgcg taccagatgc aaatttttag gtcattcaat attaacatct 20940
acatgcagaa gcaattactt ccttcattat cagtctcatt tataatctgt gcactagact 21000
gtaatagagg ctgtgcagca tgactcaaaa actaggaaaa ggtcacttca acaggctagg 21060
tacgtttatc accaacaaaa gatggaatct gatccactca gctcatttga tgtagacatg 21120
gataaatatt ggcaccgaag gcatatttac actactgccg gcgagattga gccaaacata 21180
acaagctgcc cgaggtgcgg atttgcaatt gatccgtgac atttccttga aggacccaac 21240
cgcctcccat cacaacgccc cagctgaggc aaaacggcgc tcggagaaga cttgaacgta 21300
aattgaacga gagttcctaa ggaatttcac gcaatggaaa gcgccgcccg ctcagcccag 21360
acgtaggtgt ggtatacccg ctgacccgtg ataggaagct cagcgaccac ctatttctat 21420
aagcttttgc ccctcgcatg ggtaagtcct ataaaaaaga gccctcttcg gttcgatgca 21480
atcccttctg tgtttacttt caagtatcaa gtgatcatgt ctgactctaa ctgttacgac 21540
ctggtcagct ttgccttcaa cgggccgttc ctccacagcg aacagccacc gattttcatc 21600
gatgccaaaa gtccctctcg agcgttgagt gccgggccgt tcaagcgact tctttgctcg 21660
ctgattgccg gtctcactgc tcaccagatc cagccagggg actgcgtgct tgttcaaatg 21720
gataactatg taactgaacc tggacctagg cctcagtctg tggatgagac ctttactgac 21780
ggatgcgcga gcaccagatc cttcattccg ccgtctatct cgcaatcatc ggtgcaggag 21840
gtgtctacat gggctgtagc ccgacgactc ctcgccacga gctcgagcat tttgtgaagc 21900
tctctgatcc acgtatcatt ttgacagcag agagtgctct ccctctggtt cgagaagtct 21960
gcgcttcttc tccttcgccg cgccaaatct gcctcgtcac cgaaactgga attgatgagc 22020
ttattgcctt cgcgaacgaa cacgacccta gcaacggttc tctgtcctcg acggggaaca 22080
aaaatgacgg aagaaacaat gacccggagt tgcagcctga ataccccatc actgaactta 22140
caggccatgg ctcagccccc tggcgtcgta tacccacatt ggaacttgcc aaaacgacac 22200
cagcggccat gtttactact agtggcacta gcggactccc caaagcagcg atccgcacgc 22260
accacaccat catctcgcag cacctgagcg tctactacca gaccccctac agcatctcca 22320
ccgagatcac agaggaaggt gtcgaaattg acgcaagttc aaaaacccaa catggtcgaa 22380
tccgtcgcct tctcgccctt cccgcctacc attccttcgg tgacttctgg aataacctgt 22440
tcccgctccg ctatggcgag ccgctataca tcgtcccacg cttcgatctc gctgacttca 22500
tcgccgcggt cgagcgcttc cgcatcacgg agacctatct cgtccccgtc gcggtgcaga 22560
tgctcgcgca ggcgggccgg gcagccaatg gtgcgcgggt ccgcgagggt ctcgcctcgt 22620
tgcgatatat cggtgtgtcg ggggcgccgg tcgatgcggc ctctttgcaa agatgtgagg 22680
aggtcttgca tccagatgcg tgtgtgagtc agctgtgggg gatgaccgag gttggggtcg 22740
ttttccaaaa tcgctatggg gatcgcctgc atcctggaag tttgggaatg ctgcttgacc 22800
ggtacgaggt gcgattggtg gatcccgttg ggggtgaggg agttgatgga tcgcttggtg 22860
aacttgggtc agggcaacca gccacaggag agctgtatgt tcgtggaccg gggctcatgg 22920
ctgggtacaa aggacgaagt gaccccgttg tggatgcgga ggggtggttc ccgaccggag 22980
acatggtcta cgagaaagac ggacactggt ttattgtggg tcggaccaag gagctgatta 23040
aggtaagggg gtactcggtc gctccggcag agatcgaggc gcttctgctc gacaaggagg 23100
agggcatagc agacgtggct gttttaggag tcaaatcggg gaatggggac ggagaggaag 23160
tcccacgggc ctacgtggtc cgttcaaagg agcaaagtca aggcagtggt aagatagcaa 23220
cgtccggggt agtcaccgag gagcggattc gggcgatcat gcagcaacat ctggccagct 23280
acaaggcgtt ggaaggcggc gtggtctttg tcgacagcat tccacgcaca gacatcggga 23340
agccggctcg gtccaagctg gcgagattga atcagcagcg tgacgagctg gcagccttgc 23400
tccaggcgac ttgtacaagt gtcagagaga agtagaagat agaatggcac actctagcgg 23460
tggtttattc acttatatat gactacgttg atgagtttcg ccgcttcatc aagacttggg 23520
cctgcggatc cgccagaaga atctcatcga tcatcatatt cctcggtcgc tccttcccat 23580
caggcaagcg gaactcatac ccgaccaaca aatgggccag gatgatcttg atctcgttgg 23640
cagcaaagaa tctcccgggg caagcgtact tgccatggcc aaagtgaaga ctatttttgt 23700
cggttgtggc gaactgatgc cggtgtgctt ctgcgggatc gaccctacgc cgccgtgagt 23760
agcgatatcc gtcgaactcg gggtcataat ctgtgctatt ggtgatatct gcagcgggta 23820
ccgcgagatg tgtccccttg gggagaacgg tgccgtcaga tagggtaaga tcgcgcatga 23880
cgatgcgttg gaagctcact aaagcagggt tagatcggag ttggcccaaa gaactcggtg 23940
ggatgattaa agacttgggg ggtaacgaac gtagagcagg cgggttcaaa cgctgcactt 24000
ccttgatgaa gctgtcgaga tcccacatct tcgtcagagt cgtcttctta tattcgccgc 24060
catcttcgac gagggcctga agcacctctc gacgtaaggg ctcaatatag tcttggtgcg 24120
cgcagagatc gtatacagcc tgggttgccg aggcggtagt ggtgtggatt gctgccagac 24180
tgaggatgag ctgacgatgc gcgagttttt cgggctgact gtcatacgga ttcgccttgt 24240
ccatcatcca ctgcaggaga tcggctggct ttttcttctc cgcatcgcct gggctcgtgg 24300
attgctggga tcgtcgctca cgaaccaagg tgccgatgat tcgatttccc gtcgagagcc 24360
cgcggcggat cgccctgtat cgaggaataa gaggagcgat gagcgggcgc atccagcgtg 24420
gaaagcgacg caggatggcc agggtaagga aaacatcctc ggtaaaatgg atcgagagat 24480
tgagccattc ctcattacgg caggtaggga gcccgacaaa gacgcgtgcc gaaatgcgcg 24540
cgacgatgcg cagaatgacc tcgtagatac aaactggagt ccattcgtcg atagtgagat 24600
tgcttggccg gaactcctgc gcgaaagcaa agtctagctc ggatttgaca tcgtggatca 24660
gattgccgag tcgcggggtc aactcggttt gcaagacgtg tgtatgcagg gtcccctcat 24720
caaggatgtc gatggtcgaa tacctgccga gaagattctg cagagttcaa aattcaaggg 24780
gtcattgaca tgctcgatcg agagcaatat gtgtaagaag taccttcata tgtgccttga 24840
tcgcactcag ctgctcatcc ggcttggagt gtagctcgtc cacaaatcgc cttggaacga 24900
ccagaatgtt cgtgtccacg cgtgcgatcc tgaacatccc atccttgtat tgtcgacacc 24960
cctgcgtgat ctggtggagc gcatcttgcg aaaaacggac agcaaccagc cagcggggct 25020
cccagcgaga gcggaaacca acaaaaggcg cttgcaggcg atgtgagtgg aagaccaact 25080
tctgcaggaa tacaatgcct agggcgacca ggctgatttg gacgagggaa ctcgactcta 25140
cgagccagga agtggtgagg tccagtttcg tcatattcag tgaacgtgta ggtagctagc 25200
ggaagggaaa atggtaaaga gggcttgcca actatgccta catcgcatca aacgacttta 25260
taagaggcac acgctgaagc ctgcaagggg ctctatcagg cagacttcaa cgccagctca 25320
tcctccatcc tgcgatctct caccgtccac accggcactc catgataccc gcaccaactc 25380
cgccacgcga tcatcttctg cgcgaggggc gtcatttctt ccagaatatc tcgcgacagg 25440
tcaacatggg cctccatcgg ggtaaaatgc gcgggatgca tcgtcacact caacccacgg 25500
cggctctgca tggactgatt ctcgccagcc ccatgccaga cgcttcccaa gtacaagaca 25560
gcgtcacccg gccgcatcac cgcgcccact gtgttttctg gaactgcccc ggaaatctcg 25620
tctccactcc agcgatggct cccgggaatc agcctggtgg caccattatc ctcgcgaaat 25680
tcggtcagcg cgatgaaaaa gttcatcatg agttctggcg cgcccggtcc cagatacttc 25740
gtgaccccgt atagactgtc atcgcggtgc agaccctggg gtttctcacc gggttcaacc 25800
tggagaacgg cggctcggtt gacccaatag tcgccaaagg gtgcggtgaa gaaagagtcg 25860
gagacggcat gcatcatagg gtggttcagg atagtcgtgc ggtatgtcgg ggagatggcg 25920
gctaggtttc ccatatgctt cgtgcgcgag ccgacggtct ttttgtacaa ctcgccggat 25980
cttgcctggg ggccggtgat ggtggcattc aggtatgggt cgacttcttc attgagggca 26040
gcgacaaccg agattggaac aaactgtcgc acgatgacgg cgccgtcact cacgatgagc 26100
ttgctgattt cctctgtgga cgttgagggg tcgacagtac ggatggcctt tggagaaacc 26160
gagacagtca tggcgacgga gatcccagcg tgcacttctt tgaaatgagc tgatgcttgg 26220
attctttgaa cgagcttata acttagcttg atcgcaccaa atgcaatggt gaacggcggt 26280
gtgatgttga tctattagag gccatgttta tcccactgga aatgcaaggg gtagttagta 26340
gcgaaggggg cggatcaggg gagacagact tataatcatt gatgcaatca gggtcgtgac 26400
ggagagaagg aggcttgtcg taacagcgcc caccaaacca agatgatcgc ttttgtgctc 26460
tgtgcggtga tcacggtact gtatgtgatc ggaaccgccc ttcgagacct ttacctccac 26520
cctctgcgtc gagtcccttg ccactggcca tgggtggctt ttcctctgct ccgtcatata 26580
tccgccgtgc gcggcaacgt tgacctcgac atcaaacaat ggcacgaccg atacggcccg 26640
gtggtccggt tctctccaaa tgaggtctcc ttcaccacct ctgaagcctg gagtgaaatc 26700
tacggccgcc atggccgata ccaatgcctc ccaaagacca agttctcaaa cacgagcaca 26760
atagatctca tccacgcaaa cgatgcggat catgcccgat accgcaaggc tctcgcccat 26820
ggcttctcta ccaagggtgt tcgcgagcaa gagtccctaa ttcagggtta tatcgacaag 26880
ctcgtctccc aacttcaagc gtttgcagat gcacaccagc aggtagatct ggtgatttgg 26940
taccgactca ccactttcga tatcattggc gatttggcat ttggcgagca ctttggtggc 27000
ctcgacaagg ggcgctatca tccctgggtt accttcatga ccgggtacac gcgcatgatt 27060
cctttcttca aagcaatgga tgcgtatcca gctatctttc gcaccgcatt cgctttcatg 27120
tcatcctcat ctcaggcaat tgcgcagcag atgcagtaca gtcgggaact agtccagaaa 27180
cggatcaaat cggcctcatc gagccgtccg gactttgtgg actcgatcat gcgccagcag 27240
ggaaccaagg atgagctctc cgatgcggaa atcgaggcaa acgctagtgt cattataatt 27300
gctggaagtg agaccccggc tgatctgcta tgttcggtga catattggct cttacggact 27360
cccaacgttt ttgctcgtgt acggaatgag ttgcaagatg cgatcacctg cccagcggat 27420
ataacttttc agaccgtcac tcaaggacta cctctcctca cagcatgcct gaatgaggct 27480
ctgcggctct atccctctgt acctgggggc ctacagcgcg atacagtggg ctcggccacc 27540
ctctcgggat ataccatcgc tcccaatgtg aggaatccaa agatattggc catcagtgtc 27600
ctctgctgat cataaaaaaa acaacagacg caggtcggcc ttcatcaata cgcagcctac 27660
acttcgtcat ccaacttcca tctgcctgag tccttttgcc cagaacgctg ggacccagat 27720
gtgccgaata atccggcgtc cctgttttac aacgacaatc gtgacgtatt tcagcccttc 27780
tcggctggac cccggaattg tatcggcaag aacctggcgt acgcgatcat gcgaacggct 27840
ttagcaagag ttctatggga attcgaccta aagttgtgcc ctgaaagtga gaattggcat 27900
gtccagaaaa cttatgggct atgggacaag gggccgctgc tttgtcaact gagccgaagg 27960
gaatgcagaa agtgattctt gttggaagct ttacgtctca atgccagtag atcattgtcc 28020
aggagaatgt cccttcattc tggaattttc taatacaatc cgaacaagtt gttctattcg 28080
ttaacgctgg tatggtggct ttgacttgtt gtgtgaacac gcagtacaat ggtctag 28137
<210> 2
<211> 1524
<212> DNA
<213> Penicillium oxalicum
<400> 2
atgcagtacc aactttcagc cccaaccatt ctcatcctca tagctccctt agtcctggga 60
ctcagcctat accatctcgc ccgagcctgt tttcctctcc aacgccggcc aaaggacatc 120
tcatggatag gtcgcgagca gggcttgctc agcgcgttcc gtgcctgtct tgctcaatgg 180
cagtacaatc cggccatcct cgaggccggc tacaaagcct tcaacaaaac tggcaaagcc 240
tttcttatgc cgttgattag ttttgagccc gtcgtcatcc taccgcaaga gcacatacaa 300
tggattatcg atcaaccgcc cacggtcctg tgcccacgcc gcgccgcata ctcccggatg 360
ggcgtgcggt acgtggcgcc tggcttcaca ccagccacaa gtgagatact gcacaccgcg 420
atcaaagtcc acctgaacaa gaagtttgac aggttgcaac cggctatgta tgaccaactg 480
agttgggcga ttgatcgcag ttttggcacc gcaaactgtg tcagtaaggt gtcacttggc 540
gacgcgttgc gctacgccgt ttaccatacc ttggttcccg ttctggcggg tcgcgaattg 600
gccaaaaatg agcgctttgt agaggcgatc atatcgagct cacagtggtt tggggcggcc 660
tctacgataa cagggcaatg tttgccggcc ccttttcgag gcgtcatcgg gtgggtgctg 720
cagaagccca tcggatatgt ccagcgccgg tacctggctt acctgatgcc aattgtaaaa 780
gagagattga acaaattgca ggaggattca caggtcccgg aagacatggt cacttggctc 840
tgtcaagcca tcctcaagac acgcggccca gaaggagctg agggggtgtt cgctgacgct 900
tttaacttac tgcttggagc tgcatttaca agtaccgtat tgacggcgca ccatgccttg 960
ctcgacatac tcggctcgag cgaaaaggca gagatttacc aaattcttcg aagcgaggct 1020
gagtcggtgt ttgatggtcc tgctaaatgg gctgacccag ctactgttca tcgtttagga 1080
tacatcgata gcacccttcg agagagtctg cggcgggcgc cacccacctc gatggctctg 1140
ttgcgcgagg tcgttccccg agatgggctg gcgctgccaa atggacaact ccttaacaaa 1200
ggcagctggc tggctgttcc ttcaattccc attcataacg ataagagatt ctacgagaat 1260
gcagaacaat tcaagccttt tcgttttgtg caggatggga aatcagagtc ttgtgtctcg 1320
acaagcgaca catttctgtc ctttggacac ggtcgctcgg cctgcgccgg aagacagttt 1380
gcaacccgca tattgaaaat gatgctttct tacatcgtcc tgcattacga catcgaagag 1440
attgatggac ggcctccgaa ctttttcatg ggagagcatg ctgtgcctcc ggatgtggta 1500
gtgagagtgc gaagaagagc ataa 1524
<210> 3
<211> 507
<212> PRT
<213> Penicillium oxalicum
<400> 3
Met Gln Tyr Gln Leu Ser Ala Pro Thr Ile Leu Ile Leu Ile Ala Pro
1 5 10 15
Leu Val Leu Gly Leu Ser Leu Tyr His Leu Ala Arg Ala Cys Phe Pro
20 25 30
Leu Gln Arg Arg Pro Lys Asp Ile Ser Trp Ile Gly Arg Glu Gln Gly
35 40 45
Leu Leu Ser Ala Phe Arg Ala Cys Leu Ala Gln Trp Gln Tyr Asn Pro
50 55 60
Ala Ile Leu Glu Ala Gly Tyr Lys Ala Phe Asn Lys Thr Gly Lys Ala
65 70 75 80
Phe Leu Met Pro Leu Ile Ser Phe Glu Pro Val Val Ile Leu Pro Gln
85 90 95
Glu His Ile Gln Trp Ile Ile Asp Gln Pro Pro Thr Val Leu Cys Pro
100 105 110
Arg Arg Ala Ala Tyr Ser Arg Met Gly Val Arg Tyr Val Ala Pro Gly
115 120 125
Phe Thr Pro Ala Thr Ser Glu Ile Leu His Thr Ala Ile Lys Val His
130 135 140
Leu Asn Lys Lys Phe Asp Arg Leu Gln Pro Ala Met Tyr Asp Gln Leu
145 150 155 160
Ser Trp Ala Ile Asp Arg Ser Phe Gly Thr Ala Asn Cys Val Ser Lys
165 170 175
Val Ser Leu Gly Asp Ala Leu Arg Tyr Ala Val Tyr His Thr Leu Val
180 185 190
Pro Val Leu Ala Gly Arg Glu Leu Ala Lys Asn Glu Arg Phe Val Glu
195 200 205
Ala Ile Ile Ser Ser Ser Gln Trp Phe Gly Ala Ala Ser Thr Ile Thr
210 215 220
Gly Gln Cys Leu Pro Ala Pro Phe Arg Gly Val Ile Gly Trp Val Leu
225 230 235 240
Gln Lys Pro Ile Gly Tyr Val Gln Arg Arg Tyr Leu Ala Tyr Leu Met
245 250 255
Pro Ile Val Lys Glu Arg Leu Asn Lys Leu Gln Glu Asp Ser Gln Val
260 265 270
Pro Glu Asp Met Val Thr Trp Leu Cys Gln Ala Ile Leu Lys Thr Arg
275 280 285
Gly Pro Glu Gly Ala Glu Gly Val Phe Ala Asp Ala Phe Asn Leu Leu
290 295 300
Leu Gly Ala Ala Phe Thr Ser Thr Val Leu Thr Ala His His Ala Leu
305 310 315 320
Leu Asp Ile Leu Gly Ser Ser Glu Lys Ala Glu Ile Tyr Gln Ile Leu
325 330 335
Arg Ser Glu Ala Glu Ser Val Phe Asp Gly Pro Ala Lys Trp Ala Asp
340 345 350
Pro Ala Thr Val His Arg Leu Gly Tyr Ile Asp Ser Thr Leu Arg Glu
355 360 365
Ser Leu Arg Arg Ala Pro Pro Thr Ser Met Ala Leu Leu Arg Glu Val
370 375 380
Val Pro Arg Asp Gly Leu Ala Leu Pro Asn Gly Gln Leu Leu Asn Lys
385 390 395 400
Gly Ser Trp Leu Ala Val Pro Ser Ile Pro Ile His Asn Asp Lys Arg
405 410 415
Phe Tyr Glu Asn Ala Glu Gln Phe Lys Pro Phe Arg Phe Val Gln Asp
420 425 430
Gly Lys Ser Glu Ser Cys Val Ser Thr Ser Asp Thr Phe Leu Ser Phe
435 440 445
Gly His Gly Arg Ser Ala Cys Ala Gly Arg Gln Phe Ala Thr Arg Ile
450 455 460
Leu Lys Met Met Leu Ser Tyr Ile Val Leu His Tyr Asp Ile Glu Glu
465 470 475 480
Ile Asp Gly Arg Pro Pro Asn Phe Phe Met Gly Glu His Ala Val Pro
485 490 495
Pro Asp Val Val Val Arg Val Arg Arg Arg Ala
500 505
<210> 4
<211> 5926
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cgacacaaat aaatattagc tgccagccca gcaagcgcag agcaagatca tgtgagactg 60
gatgaagcac ctgctagaaa tatcatggca tttgatcagg ttgaagtgag atcagtatcc 120
cagtagagta gcggggtgtt cttttccaaa ggaatgttcc accctggccg aacgttcttc 180
tcttccttgc ccgtgaatct ttaatgttct agcaaccaca gacggagaaa gactcagctg 240
agaccagcgg ctatacagga acaccagcta ctatttacac gtgttatgct agattgatgg 300
atatttgagt catttgtctt tgacatctgc gctcaagact tgacgaagaa agggcaaatt 360
caaaaaccca cagagaccga acaacaggct gaaagccctg atgggagttc ataggttggt 420
aatgagcagt aaaactggta ctgggcagtc atatgcaatt attcctgtag gagtaagggg 480
ctcgcctagc ccaattgcct tgcaagataa gctagtcacc aaataaatat agatcaattc 540
ggttggtttg gactctcatc tccatttctt gtcttcatca tcctgtagat atcgccaatg 600
tccctcgagc ccatagctat tgttggaaca ggatgccgct ttccgggttc ctcttcctca 660
ccgaatcgtc tctggcactt gcttcaaaat ccgcaaaatg tcgcctccaa agtccccagt 720
gagcgcttca acgtggactc attctaccac cctaatagcc agcagcatgg ctcgacaagc 780
gtggccgagt cttattttct tgaggaagat ataagagcct ttgacgcgcc tttcttcagc 840
atcagcccag cggaagcggc tgccatggat ccacagcaac gcttgcttct ggagacggtt 900
tatcactccc tcgaggccgg tggccataga cttgacgctt tgcagggctc ggccacagga 960
gtctactgtg gctttctccg gactgattac agccagatac agtttacaga cccggactcg 1020
ttgccaccgt acacggttac aggaaattct cccgcaatca tggcaaaccg catctcatac 1080
tttttcaact ggactgggcc atcgttcgcg gtggataccg ggtgctcttc gagcttgctg 1140
gcagttcacc tggctgttga atcgttgagg aaaagagact gtgatttggc tgtcgcggtg 1200
gggagtaatc tgcttctatc gcccaaccct tatatcgcgg atgcaaagac gggaatgttg 1260
tcagctacag gccgatcgcg gatgtgggat gcatccgcgg atggctacgc gcgcggagaa 1320
ggggttgcgt cggtagtact caagcgattg agcgacgccg tcgctgcagg ggacgagatt 1380
gagtgtgtaa ttcgagctac agggatgaac agcgacggcc ggacaatggg tatcaccatg 1440
cccagtggag aggcacagcg gaaactgatt gagtcgacct atgccagtat tggacttgat 1500
cccaaaaatg ctcaggacag atgtcaatat ttcgaggcgc acgggacggg aacgcaggcg 1560
ggagatccac aagaggccag tgcgattcat gcggcattct ttgggaacga agctgaaaac 1620
gacagctcta acgtcctgca tgtcggttca atcaagacag taatcggtca tacggaagca 1680
actgctggcc tggctggctt gatcaaggca tctctgtgtc tacagcatgg ggagatcaca 1740
ccgaaccttc tgttctccac gcctaaccct cgcataacac cgcatcttac tcgactccag 1800
gtgccgagtg agtctgtagc atggcctacc ctgccgcccg gggcaccacg tagggcttcg 1860
gtgaactcgt ttggctttgg cggtgctaat gttcatgcca tcctggaaag ctatgaaccc 1920
ccttcttcat ctcgccgagg ctcagaagat gcagaggcgg attgtttgct tcttcccttt 1980
gtggtttcag cggcatcaga accctcattg aggacagcac tggagaggct tttccaattc 2040
cttgaggatc agccggtgac aaacatgatc gactttgctc agaccctctt gacgcggcgt 2100
tcgtgccata aacatcgtat agtatttatc gctagctcat cggacgagct cagagacaag 2160
attctgcatg aaatatccta cccatccagt ggccagatat ggaggtcaac acatcaatgc 2220
ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg acaagatggt 2280
tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc gctcgaagtg 2340
tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt ggtgcacgat 2400
aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt cttaagttcg 2460
cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa gcatccaaat 2520
gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag 2580
cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt 2640
aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg 2700
ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg 2760
ggagttcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca 2820
agacctgcct gaaaccgaac tgcccgctgt tctccagccg gtcgcggagg ccatggatgc 2880
gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat 2940
cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca 3000
ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct 3060
gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcatgcgg atttcggctc 3120
caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat 3180
gttcggggat tcccaatacg aggtcgccaa catcctcttc tggaggccgt ggttggcttg 3240
tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg 3300
cctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg 3360
caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc 3420
cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg 3480
tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga 3540
atagctcgag tttctccata ataatgtgtg agtagttccc agataaggga attagggttc 3600
ctatagggtt tcgctcatgt gttgagcata taagaaaccc ttagtatgta tttgtatttg 3660
taaaatactt ctatcaataa aatttctaat tcctaaaacc aaaatccagt actaaaatcc 3720
agatcccccg aattaattcg gcgttaattc agtacattaa aaacgtccgc aatgtgttat 3780
taagttgtct aagcgtcaat ttgtttccgc ggcgcaggaa gctgggttcc tagcgaatat 3840
agtggctgtc ttgatcgcga aagatatcct atccaagact gaacccgact cttcaatatt 3900
gcttttagaa cctgatgtga ccatcctgaa gatcctcgat tcactcgcgc ctttgcacaa 3960
gacaaagatt atatcggtca cacacaaggc aactgccaaa gccaacagaa agagtctgat 4020
ttatatcccc gagcgtacgc cctctcatcg catacggcaa atgattccac acaaaaaagt 4080
tgtcagagcc gttgtttttg attctaaccg cgtctgtaac ggacgaaatg atcgcatctg 4140
caacctcttt ccgaatgctc gacagcttga tatcgcgtcc ttctatcaaa ctgtgccgat 4200
gccaaactca ccagaacatg gttccatact gtgtattcct gcagcggttc agagtgtagc 4260
ggggtggctt caccccgaag attccacttt tgcagtaacc tcgatcacaa aacttatttc 4320
agaagaaatc gatctacgac caacctctgt gatcaaatgg tcatctgaga ctcagaaccc 4380
gatcaaagcg cagatacgtt cagcgacaga tgcggtcaat ttgtcgcaac aaggcgcata 4440
tgttttgtgg gagctgccca aggccttgag aaggaccgtt gccgattggc ttgtctccca 4500
tggagcgcag catcttgttt ttgttcagaa aattcccgat gatacccagt gggtgtccag 4560
cattacatgt ggtggtgcag aagttgttat tgtgcctcct caggaagatc tcgttcacac 4620
ggttcttgcg ctccgagacc actcgtctgt gccgcttgtt cggggtattg tatttactgg 4680
ggcactcgat aatgctgtgg ctgctgagac gatccaacgg gctaaatgct tgtcccaaca 4740
ttacgactct cccaatctag agatgttctt gagcattgac tgctgcccag cgataccgaa 4800
tccgcagcag tgcgctgtga ccgaatttct cgcagcacta gcacatcaac gagcaatgat 4860
caatcttgcg gcaagtgtcc tctgtcttgg acccgggttt gatctcgaca atccacacgg 4920
agatgatatt gcggagatac ttgcagaggc tgccttagcc ggccatccct ttgccggtgg 4980
cgatcgcgtg gttacagctg gcctctgtcc cggtactggc agtccagagt acaaggcgtg 5040
ggacactatc cactcgcgga acccagcaat gtcgaacatc cttgctttgt caaggaaagg 5100
tgggcaagaa gagactgctg gcgttgaggc agccacggag catatccctt tgaaagtcca 5160
actcgagcgt gctaaagaaa ccacatcggc agccttggct gtgcgggcta ttttgaatca 5220
gtactttacc agatacctcc ggatgcggct ccagtccacg gccgagatca atgagaatac 5280
cttattcaac gaacttggtg tggactcgat ggtcgcggca cagttggttg ggtggtttat 5340
gaaagaagtt ggcgtggagg tttcggttgt tttcattctc gctggcgcat ctgttggcga 5400
ggtcctccag gatgtcacgg agaagcttat cccttgaggt cgagattttt ctgtgtgaat 5460
aaatatagct ctcctgacgc gaccttagaa aaccacatgc gtaccagatg caaattttta 5520
ggtcattcaa tattaacatc tacatgcaga agcaattact tccttcatta tcagtctcat 5580
ttataatctg tgcactagac tgtaatagag gctgtgcagc atgactcaaa aactaggaaa 5640
aggtcacttc aacaggctag gtacgtttat caccaacaaa agatggaatc tgatccactc 5700
agctcatttg atgtagacat ggataaatat tggcaccgaa ggcatattta cactactgcc 5760
ggcgagattg agccaaacat aacaagctgc ccgaggtgcg gatttgcaat tgatccgtga 5820
catttccttg aaggacccaa ccgcctccca tcacaacgcc ccagctgagg caaaacggcg 5880
ctcggagaag acttgaacgt aaattgaacg agagttccta aggaat 5926
<210> 5
<211> 5716
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atcatccgcc aaaaactaac acatcatttg gtcgatctca tcagaccgct gtctgaggag 60
gccgatgatt gtttacaccg gagttggaca gataattcag gtactccaaa tctccatgtc 120
gtagctcgtc catgaggatc cattcactta ttaatcctta gattggcacg aaatttctct 180
caaatccacc ctcctcgaca tgatatccca gcaatcggcc cacgtcttcc tcggccgcag 240
cttttcccat aacgtgagtt ggctagcgct gtcgcgcagc ataaccttgc aggccttcgg 300
cgccgtccgc gagcttcgcg tatacccatc cttcatacgc ccgcttgttg gctggtttct 360
ccccgcatgt aaatcacttc gcggagagat tgccaaagcc cggaagcttg ttgagcccct 420
tatactagct cgaagactcg aaagagagcg atgcatcgcc agtggccggg aaccacccgt 480
ctatcatgac actattgcat gggcagagga atgtgcacgt ggacgaaaat acgatccagc 540
tcttattcag ctcacgctcg cgctttcggc tatgcacaac acctctgact ttctcacgca 600
agtaatatat gacatagcgg cgaggccgaa actcgtggag gagttgagga aagagatcat 660
cgatgttcgg acgtgtggag atgcaacaga gtcatggaat aagggggcgg ttcacaagtt 720
gaagttgatg gatagtgtca tgaaagaaag tcagcgattg aagcctacgg gattgggtaa 780
gttttgctgg gatcaacgct tattctctac aaggctaata tgctaatcat atagtaaaca 840
tgcggcgcta tgcaactgag gacatccagc tctcttccgt cattcccgag cacaaggaag 900
gcagcatcac aatccgaaag ggggatctgg tcatgatatc gcaacacagc cactgggacg 960
aggatattta ccaagacgcg gcgtctttca acccataccg attctgcagg atgcgcgaac 1020
aacccacgca ggagcacaca gcacactttg tcgccacaag tgtcaaccat atcggcttcg 1080
ggcatggggt gcatggctgt cctggtcgat tctttgccgc cgctgagacg aagcttgcaa 1140
tgtgtcacat tttgatgaaa tacgacatta agcttatcga tcagcctaag gtcctcaatg 1200
taggttcgct tatggttgca aatcccgttg cgaaggttgc agtgagaagg aggaaggagg 1260
aggtttcatt gtgattgtga acagtgagct cgcccacatc tcactcagcc caaggagtac 1320
caaaggtagg tggagatgga ccgtaaccac attactgctt tcggacaaac tcaatttact 1380
acatacctcg tggaatactc accttcgcgt aaatgaaagt ctcccaacct ttgtaatcac 1440
agtatatatt gggcttccaa gcttccgtct atgtctgtga attctaaagc gttactatcg 1500
tcccttgaac ctctgtccca aacttgaatg atatcctttc tcgtccatca tgttgtcaat 1560
gatcgtaagg ggaagaatga taaaataaat tgaagtatgg ttattcagtt gaatctctgg 1620
cagactcaaa ttcacctatt caatctgaat tctaacttgt ccaggttcca tgtccgggtg 1680
gtttgtgacc gttgatatac ctatcgagca tacgtaatct tccaaagttt aaggttgcga 1740
cccaccaata cctgaaccag ggcgtagatc acacctagat acgtgtacaa cggctcatat 1800
tcgatcggtg tatcatatat gcctaggata atggctaaat gcagcctgcc taagaagcgg 1860
tcgggagacg gtgctccacc tacctagtag tagtagtagg actaggtact ccctatgcta 1920
cgtgtgtaat gactcaacac tttctcttgg ctatgaccgc ctctctggat gcaggtgaat 1980
tcacaattac taagtaaggt caagaaagcg gacataatgc aagagtggac attatgctct 2040
tcttcgcact ctcactacca catccggagg cacagcatgc tctcccatga ggaggtcaac 2100
acatcaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 2160
acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 2220
gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 2280
ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 2340
cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 2400
gcatccaaat gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 2460
agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 2520
gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 2580
acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 2640
ttgacattgg ggagttcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg 2700
tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctccagccg gtcgcggagg 2760
ccatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 2820
cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 2880
atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 2940
tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcatgcgg 3000
atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 3060
gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcctcttc tggaggccgt 3120
ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 3180
gatcgccgcg cctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 3240
tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 3300
gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 3360
ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 3420
gggcaaagga atagctcgag tttctccata ataatgtgtg agtagttccc agataaggga 3480
attagggttc ctatagggtt tcgctcatgt gttgagcata taagaaaccc ttagtatgta 3540
tttgtatttg taaaatactt ctatcaataa aatttctaat tcctaaaacc aaaatccagt 3600
actaaaatcc agatcccccg aattaattcg gcgttaattc agtacattaa aaacgtccgc 3660
aatgtgttat taagttgtct aagcgtcaat tttgagaatg gttggggctg aaagttggta 3720
ctgcatcttg gtcacggcgg tcatgggcac gccacggagc aaggaattac cactgtttag 3780
tatgagagac tgaaaatata gatggtcgat cccgattgcc ctgattaaag agcggtatgg 3840
atggtgtgac gtccttgcat caagttttct tcgactttgc atgtaagggg tccctagcca 3900
cggactcgcc tgttctgaga atgctgatat aagaggcaca gctctctatc atggaattat 3960
ttacaggcca cagttctatc ccttcgtcac aatgatccgc agtcccactg ccccaagcag 4020
gcccctaggc cagatctcgt gggacctgat ccgcatctcg cgatttgaca agtacaactc 4080
atttctagcc ctctttgccg gaggttagtc cacccatccc aaattcatac actctaggca 4140
gtgggtgcta acaacacaca gtatggtcaa cccttcttgc ggggagcgca cgacttcgcg 4200
aagaccctga gcacgtctcc gttcaatata tccttagtcg tgcttttctg tgctccatag 4260
ccgcatatat attctctggg gcaggcatgg tgtggaatga ctgggttgac cgggacatcg 4320
atgctcgcgt ggcacgcacc aaggatcgtc ctttagctgc aggcagactg agcacagaag 4380
aagcaatgct ttggatgctg cttcaagctg gtgtagcaac gacatttttg tattggatga 4440
tggacggaca acatgtgttc gtgagcccct ggaaaagtca tctctctctc tctgctgtac 4500
caaggtcgac taacgaagcg gggctaccta gcttgcattc catgattcct ccaacattag 4560
gaacattgat atatccatat tgcaagcgtc ctctcgctcg ccgacttggt atctaccctc 4620
aatatgttct cggtctgaca gcttcctgcc ctgtcctctt tggccgtgct tcgatatacc 4680
ctgatataga atccttctct cgactcgtat cgtctagcct cccgctttgc ctagtggtgt 4740
ttacatggac tctctatttc aataccgcat acagctacca ggacatcgtt gatgacaaga 4800
aattgggggt gaactcacta tacaaccttg cgggaaagca catacatggc gtgcttgtgg 4860
ccctcgtgac aatcatggtg agcgcactgt ggtgggcact gtaccccttg ggatcagctt 4920
ggttgtggat ctcttggatg ggagtctgga tcgtgggatg tgtggaccaa atgcgcagat 4980
ttgatgcgaa ggatccttca agtggacagt acgtcttccg tagcaatgtc cttatggggc 5040
tctggacgat gcttgcttgt cttttggagg ttttttctac agggaagaga gtggctttgt 5100
gaacgaaatg gggaagacat agcgacacaa ataaatatta gctgccagcc cagcaagcgc 5160
agagcaagat catgtgagac tggatgaagc acctgctaga aatatcatgg catttgatca 5220
ggttgaagtg agatcagtat cccagtagag tagcggggtg ttcttttcca aaggaatgtt 5280
ccaccctggc cgaacgttct tctcttcctt gcccgtgaat ctttaatgtt ctagcaacca 5340
cagacggaga aagactcagc tgagaccagc ggctatacag gaacaccagc tactatttac 5400
acgtgttatg ctagattgat ggatatttga gtcatttgtc tttgacatct gcgctcaaga 5460
cttgacgaag aaagggcaaa ttcaaaaacc cacagagacc gaacaacagg ctgaaagccc 5520
tgatgggagt tcataggttg gtaatgagca gtaaaactgg tactgggcag tcatatgcaa 5580
ttattcctgt aggagtaagg ggctcgccta gcccaattgc cttgcaagat aagctagtca 5640
ccaaataaat atagatcaat tcggttggtt tggactctca tctccatttc ttgtcttcat 5700
catcctgtag atatcg 5716

Claims (3)

1.OxaL蛋白或OxaL蛋白相关生物材料的应用,为如下(a1)或(a2):
(a1)OxaL蛋白或OxaL蛋白相关生物材料作为羟化酶的应用;
(a2)OxaL蛋白或OxaL蛋白相关生物材料在制备羟化酶中的应用;
所述OxaL蛋白为序列表的序列3所示的蛋白质;
所述OxaL蛋白相关生物材料为编码所述OxaL蛋白的基因、表达所述OxaL蛋白的表达盒、表达所述OxaL蛋白的表达载体或表达所述OxaL蛋白的重组微生物。
2.OxaL蛋白在参与化合物oxalicine B的合成中的应用;所述OxaL蛋白如序列表的序列3所示。
3.重组微生物的应用,为如下(b1)或(b2)或(b3):
(b1)在将化合物3转换为化合物8中的应用;
(b2)在将化合物2转换为化合物9中的应用;
(b3)在将化合物4转换为化合物oxalicineB中的应用;
所述重组微生物为表达OxaL蛋白的重组微生物;
所述OxaL蛋白如序列表的序列3所示;
化合物3如式Ⅰ所示;化合物8如式Ⅱ所示;化合物2如式Ⅲ所示;化合物9如式Ⅳ所示;化合物4如式Ⅴ所示;化合物oxalicineB如式Ⅵ所示;
式Ⅰ;/>式Ⅱ;
式Ⅲ; />式Ⅳ;
式Ⅴ;/>式Ⅵ。
CN202111627219.0A 2021-12-28 2021-12-28 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用 Active CN114317470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111627219.0A CN114317470B (zh) 2021-12-28 2021-12-28 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111627219.0A CN114317470B (zh) 2021-12-28 2021-12-28 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用

Publications (2)

Publication Number Publication Date
CN114317470A CN114317470A (zh) 2022-04-12
CN114317470B true CN114317470B (zh) 2024-04-30

Family

ID=81015106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111627219.0A Active CN114317470B (zh) 2021-12-28 2021-12-28 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用

Country Status (1)

Country Link
CN (1) CN114317470B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107699581A (zh) * 2017-08-21 2018-02-16 上海交通大学 3,7‑二羟基卓酚酮生物合成基因簇及其应用
CN110777155A (zh) * 2019-11-22 2020-02-11 武汉大学 最小霉素生物合成基因簇、重组菌及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107699581A (zh) * 2017-08-21 2018-02-16 上海交通大学 3,7‑二羟基卓酚酮生物合成基因簇及其应用
CN110777155A (zh) * 2019-11-22 2020-02-11 武汉大学 最小霉素生物合成基因簇、重组菌及其应用

Also Published As

Publication number Publication date
CN114317470A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
Tsunematsu et al. Yeast-based genome mining, production and mechanistic studies of the biosynthesis of fungal polyketide and peptide natural products
CN111778167B (zh) 高产桦木酸的酿酒酵母工程菌及其构建方法与应用
CN106754993B (zh) 一种基因、重组酿酒酵母菌株及其构建方法与应用
US10519460B2 (en) Use of heterologous expressed polyketide synthase and small molecule foldases to make aromatic and cyclic compounds
CN111434773A (zh) 一种高产檀香油的重组酵母菌及其构建方法与应用
CN112280698B (zh) 高产雅槛蓝醇型倍半萜的酿酒酵母工程菌及其构建方法与应用
CN115197172B (zh) 二倍半萜化合物、其合成基因簇与合成方法
CN114507648B (zh) 一类p450酶突变体及其应用
CN108676766A (zh) 基因修饰的应用及其获得的菌株
CA2964634A1 (en) Noscapinoid-producing microbes and methods of making and using the same
US20190071474A1 (en) Production of gibberellins in recombinant hosts
CN114940980A (zh) 一类倍半萜聚酮合成基因及其应用
Wu et al. Identification of a Prunus MAX1 homolog as a unique strigol synthase
CN109136119B (zh) 微生物及其用途
CN114317470B (zh) 化合物oxalicine B生物合成基因簇和C-15羟基化酶OxaL以及应用
CN115335514A (zh) 罗汉果甙的生物合成
CN114134054B (zh) 一种高产萜类化合物的米曲霉底盘菌株及萜类天然产物自动化高通量挖掘平台的搭建
CN108060143B (zh) 一种参与紫草素生物合成的cyp76b74蛋白及其编码基因与应用
JP4668176B2 (ja) トリテルペン水酸化酵素
CN115161208B (zh) 酿酒酵母基因工程菌及其生产葫芦素中间体的应用
CN114875077A (zh) 一种氧化酶催化羟化维生素d3合成阿法骨化醇及骨化三醇的方法
CN111363753B (zh) 异源生产线性三萜的方法
CN113493756A (zh) 一种基因工程菌及其应用
CN114774443B (zh) 生产小白菊内酯的重组酿酒酵母菌株及其构建方法
Li et al. Genome mining of fungal globin-like enzymes for catalyzing the synthesis of linear terpenes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant