CN112708602B - 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用 - Google Patents

盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用 Download PDF

Info

Publication number
CN112708602B
CN112708602B CN201911021712.0A CN201911021712A CN112708602B CN 112708602 B CN112708602 B CN 112708602B CN 201911021712 A CN201911021712 A CN 201911021712A CN 112708602 B CN112708602 B CN 112708602B
Authority
CN
China
Prior art keywords
protein
nucleic acid
acid molecule
leu
recombinant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911021712.0A
Other languages
English (en)
Other versions
CN112708602A (zh
Inventor
张学礼
陈晶
程健
江会锋
樊飞宇
戴住波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN201911021712.0A priority Critical patent/CN112708602B/zh
Publication of CN112708602A publication Critical patent/CN112708602A/zh
Application granted granted Critical
Publication of CN112708602B publication Critical patent/CN112708602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • C12P33/20Preparation of steroids containing heterocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/03Oxidoreductases acting on the CH-OH group of donors (1.1) with a oxygen as acceptor (1.1.3)
    • C12Y101/03006Cholesterol oxidase (1.1.3.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/01072DELTA24-sterol reductase (1.3.1.72)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用。本发明提供的盾叶薯蓣来源的薯蓣皂素合成相关蛋白为SEQ ID No.9和SEQ ID No.7所示的两个蛋白质。利用本发明所提供的盾叶薯蓣来源的薯蓣皂素合成相关基因,与细胞色素P450还原酶编码基因一起导入能够合成胆固醇的酿酒酵母菌,能够得到能够合成薯蓣皂素的酿酒酵母工程菌株。本发明实现了酿酒酵母薯蓣皂素的生物合成。

Description

盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用
技术领域
本发明涉及生物技术领域,特别涉及一种盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用。
背景技术
薯蓣属植物含有丰富的淀粉或甾体皂苷,在世界范围内已被广泛应用于食品和医药工业(Piperno,D.R.,Ranere,A.J.,Holst,I.,Hansell,P.,2000.Starch grains revealearly root crop horticulture in the Panamanian tropical forest.Nature.407,894-7.)。其中,盾叶薯蓣(Dioscorea zingiberensis)是一种重要的中药,广泛应用于类风湿性关节炎、炭疽热、咳嗽、心脏病等的治疗(Jesus,M.,Martins,A.P.,Gallardo,E.,Silvestre,S.,2016.Diosgenin:Recent Highlights on Pharmacology and AnalyticalMethodology.J Anal Methods Chem.2016,4156293.)。薯蓣皂素又称薯蓣皂苷元,是盾叶薯蓣根茎中积累的一种甾体皂苷元,是合成多种甾体激素类药物的重要前体,包括抗氧化剂、消炎药、性激素、甾体、可的松、避孕药、节育化合物和合成代谢药物等(Willaman,J.J.,Fenske,C.S.,Correll,D.S.,1953.Occurrence of alkaloids inDioscorea.Science.118,329-30.)。
目前我国薯蓣皂素的生产主要采用从薯蓣科植物直接提取的方式,其源植物黄姜主要生长种植于我国长江中下游及南水北调区,但由于其种植状态不稳定并且周期较长(超2年)以及提取工艺复杂并对环境造成较大污染(提取1吨薯蓣皂苷元产生约400吨酸性废水,化学需氧量(COD)>30000mg/L)等因素的影响(Bai,Y.,Zhang,L.,Jin,W.,Wei,M.,Zhou,P.,Zheng,G.,Niu,L.,Nie,L.,Zhang,Y.,Wang,H.,Yu,L.,2015.In situ high-valued utilization and transformation of sugars from Dioscorea zingiberensisC.H.Wright for clean production of diosgenin.Bioresour Technol.196,642-7.),导致薯蓣皂素的供给和价格的波动,对甾体激素产业带来一定程度的冲击。甾体激素是目前仅次于抗生素的第二大激素类药物,而我国又是甾体激素类原料药以及中间体的出口大国。稳定高效的薯蓣皂苷及相关替代原料的供给和输出是维持我国甾体激素工业持续健康发展的基础。所以实现甾体药物使用的上游原料由植物资源提取向微生物合成的转变是革命性的变革,将引领我国甾体激素工业的进一步跨越式发展。利用生物转化和化学合成相结合的方法实现甾体激素的合成,替代高污染、高成本的植物原料,具有显著的经济效益和社会效益。
在植物中,薯蓣皂苷元是由前体胆固醇经十余步生物合成而成的(如图1),在前体胆固醇的C-22、C-26、C-16上至少发生了三步氧化反应,随后发生两步环化反应,最终合成薯蓣皂素(Sonawane,P.D.,Pollier,J.,Panda,S.,Szymanski,J.,Massalha,H.,Yona,M.,Unger,T.,Malitsky,S.,Arendt,P.,Pauwels,L.,Almekias-Siegl,E.,Rogachev,I.,Meir,S.,Cardenas,P.D.,Masri,A.,Petrikov,M.,Schaller,H.,Schaffer,A.A.,Kamble,A.,Giri,A.P.,Goossens,A.,Aharoni,A.,2016.Plant cholesterol biosynthetic pathwayoverlaps with phytosterol metabolism.Nat Plants.3,16205.)。目前,在重楼(Parispolyphylla)和葫芦巴(Trigonella foenumgraecum)中都已成功鉴定出了薯蓣皂素的合成途径。经鉴定,上述两种植物的薯蓣皂素的合成都需要两个关键的P450蛋白(PpCYP90G4/TfCYP90B50和PpCYP94D108/TfCYP82J17)其中前者负责同时催化胆固醇的C-16,C-22的双氧化而后者负责完成C-26的羟基化,即可完成胆固醇到薯蓣皂素的生物合成。盾叶薯蓣做为我国薯蓣皂素的主要来源植物,其薯蓣皂素合成途径至今并未解析,没有鉴定出相关的重要P450蛋白,所以完成对于盾叶薯蓣中薯蓣皂素合成相关P450基因的鉴定并将其应用于酿酒酵母薯蓣皂素生物合成具有重要意义。
发明内容
本发明的目的是提供一种盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用。
第一方面,本发明要求保护蛋白质或成套蛋白质。
本发明所要求保护的蛋白质为蛋白质A或蛋白质B。
本发明所要求保护的成套蛋白质为成套蛋白质甲或成套蛋白质乙或成套蛋白质丙。
所述成套蛋白质甲由所述蛋白质A和所述蛋白质B组成。
所述成套蛋白质乙由所述蛋白质A、所述蛋白质B和蛋白质C组成。
所述成套蛋白质丙由所述蛋白质A、所述蛋白质B、所述蛋白质C、蛋白质D和蛋白质E组成。
所述蛋白质A(来源于盾叶薯蓣的胆固醇16位和22位双氧化酶,命名为DGCYP033)为如下(A1)-(A4)中任一所示的蛋白质:
(A1)氨基酸序列如SEQ ID No.9所示的蛋白质;
(A2)将(A1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
(A3)与(A1)或(A2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质。
(A4)在(A1)-(A3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白;
所述蛋白质B(来源于盾叶薯蓣的胆固醇26位氧化酶,命名为DGCYP029)为如下(B1)-(B4)中任一所示的蛋白质:
(B1)氨基酸序列如SEQ ID No.7所示的蛋白质;
(B2)将(B1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
(B3)与(B1)或(B2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;
(B4)在(B1)-(B3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。
所述蛋白质C(来源于葡萄的细胞色素P450还原酶,命名为VvCPR)为如下(C1)-(C4)中任一所示的蛋白质:
(C1)氨基酸序列如SEQ ID No.11所示的蛋白质;
(C2)将(C1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
(C3)与(C1)或(C2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;
(C4)在(C1)-(C3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。
所述蛋白质D(来源于斑马鱼的甾醇7位还原酶,命名为DrDHCR7)为如下(D1)-(D4)中任一所示的蛋白质:
(D1)氨基酸序列如SEQ ID No.1所示的蛋白质;
(D2)将(D1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
(D3)与(D1)或(D2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;
(D4)在(D1)-(D3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。
所述蛋白质E(来源于斑马鱼的甾醇24位还原酶,命名为DrDHCR24)为如下(E1)-(E4)中任一所示的蛋白质:
(E1)氨基酸序列如SEQ ID No.2所示的蛋白质;
(E2)将(E1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;
(E3)与(E1)或(E2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;
(E4)在(E1)-(E3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。
上述蛋白质中,所述标签是指利用DNA体外重组技术,与目的蛋白一起融合表达的一种多肽或者蛋白,以便于目的蛋白的表达、检测、示踪和/或纯化。所述蛋白标签可为His标签、Flag标签、MBP标签、HA标签、myc标签、GST标签和/或SUMO标签等。
第二方面,本发明要求保护核酸分子或成套核酸分子。
本发明要求保护的核酸分子为编码前文所述蛋白质的核酸分子。
所述核酸分子为核酸分子A或核酸分子B。
本发明要求保护的成套核酸分子为成套核酸分子甲或成套核酸分子乙或成套核酸分子丙。
所述成套核酸分子甲由所述核酸分子A和所述核酸分子B组成。
所述成套核酸分子乙由所述核酸分子A、所述核酸分子B和核酸分子C组成。
所述成套核酸分子丙由所述核酸分子A、所述核酸分子B、所述核酸分子C、核酸分子D和核酸分子E组成。
所述核酸分子A为编码前文所述蛋白质A的核酸分子。
所述核酸分子B为编码前文所述蛋白质B的核酸分子。
所述核酸分子C为编码前文所述蛋白质C的核酸分子。
所述核酸分子D为编码前文所述蛋白质D的核酸分子。
所述核酸分子E为编码前文所述蛋白质E的核酸分子。
进一步地,所述核酸分子A编码DGCYP033,为如下(a1)-(a3)中任一所示的DNA分子:
(a1)核苷酸序列如SEQ ID No.10的第11-1477位所示的DNA分子;
(a2)在严格条件下与(a1)限定的DNA分子杂交且编码前文所述(A1)-(A4)中任一所示的蛋白质的DNA分子;
(a3)与(a1)或(a2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述(A1)-(A4)中任一所示的蛋白质的DNA分子。
所述核酸分子B编码DGCYP029,为如下(b1)-(b3)中任一所示的DNA分子:
(b1)核苷酸序列如SEQ ID No.8的第11-1501位所示的DNA分子;
(b2)在严格条件下与(b1)限定的DNA分子杂交且编码前文所述蛋白质B的DNA分子;
(b3)与(b1)或(b2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白质B的DNA分子。
所述核酸分子C编码VvCPR,为如下(c1)-(c3)中任一所示的DNA分子:
(c1)核苷酸序列如SEQ ID No.12的第11-2125位所示的DNA分子;
(c2)在严格条件下与(c1)限定的DNA分子杂交且编码前文中所述蛋白质C的DNA分子;
(c3)与(c1)或(c2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白质C的DNA分子。
所述核酸分子D编码DrDHCR7,为如下(d1)-(d3)中任一所示的DNA分子:
(d1)核苷酸序列如SEQ ID No.3的第813-2249位所示的DNA分子;
(d2)在严格条件下与(d1)限定的DNA分子杂交且编码前文所述蛋白质D的DNA分子;
(d3)与(d1)或(d2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白质D的DNA分子。
所述核酸分子E编码DrDHCR24,为如下(e1)-(e3)中任一所示的DNA分子:
(e1)核苷酸序列如SEQ ID No.4的第493-2043位所示的DNA分子;
(e2)在严格条件下与(e1)限定的DNA分子杂交且编码前文所述蛋白质E的DNA分子;
(e3)与(e1)或(e2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白质E的DNA分子。
其中,所述严格条件可为如下:50℃,在7%十二烷基硫酸钠(SDS)、0.5M Na3PO4和1mM EDTA的混合溶液中杂交,在50℃,2×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M Na3PO4和1mM EDTA的混合溶液中杂交,在50℃,1×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M Na3PO4和1mM EDTA的混合溶液中杂交,在50℃,0.5×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M Na3PO4和1mM EDTA的混合溶液中杂交,在50℃,0.1×SSC,0.1%SDS中漂洗;还可为:50℃,在7%SDS、0.5M Na3PO4和1mM EDTA的混合溶液中杂交,在65℃,0.1×SSC,0.1%SDS中漂洗;也可为:在6×SSC,0.5%SDS的溶液中,在65℃下杂交,然后用2×SSC,0.1%SDS和1×SSC,0.1%SDS各洗膜一次。
第三方面,本发明要求保护如下生物材料中的任一种:
(c1)重组载体,为含有前文所述核酸分子的重组载体。
(c2)表达盒,为含有前文所述核酸分子的表达盒。
(c3)转基因细胞系,为含有前文所述核酸分子的转基因细胞系。
(c4)重组菌,为含有前文所述核酸分子的重组菌。
(c5)成套重组载体,为成套载体甲或成套载体乙或成套载体丙。
所述成套载体甲由重组载体A和重组载体B组成。
所述成套载体乙由所述重组载体A、所述重组载体B和重组载体C组成。
所述成套载体丙由所述重组载体A、所述重组载体B、所述重组载体C、重组载体D和重组载体E组成。
所述重组载体A为含有前文所述核酸分子A的重组载体;所述重组载体B为含有前文所述核酸分子B的重组载体;所述重组载体C为含有前文所述核酸分子C的重组载体;所述重组载体D为含有前文所述核酸分子D的重组载体;所述重组载体E为含有前文所述核酸分子E的重组载体。
(c6)成套表达盒,为成套表达盒甲或成套表达盒乙或成套表达盒丙。
所述成套表达盒甲由表达盒A和表达盒B组成。
所述成套表达盒乙由所述表达盒A、所述表达盒B和表达盒C组成。
所述成套表达盒丙由所述表达盒A、所述表达盒B、所述表达盒C、表达盒D和表达盒E组成。
所述表达盒A为含有前文所述核酸分子A的表达盒;所述表达盒B为含有前文所述核酸分子B的表达盒;所述表达盒C为含有前文所述核酸分子C的表达盒;所述表达盒D为含有前文所述核酸分子D的表达盒;所述表达盒E为含有前文所述核酸分子E的表达盒。
(c7)成套转基因细胞系,为成套转基因细胞系甲或成套转基因细胞系乙或成套转基因细胞系丙。
所述成套转基因细胞系甲由转基因细胞系A和转基因细胞系B组成。
所述成套转基因细胞系乙由所述转基因细胞系A、所述转基因细胞系B和转基因细胞系C组成。
所述成套转基因细胞系丙由所述转基因细胞系A、所述转基因细胞系B、所述转基因细胞系C、转基因细胞系D和转基因细胞系E组成。
所述转基因细胞系A为含有前文所述核酸分子A的转基因细胞系;所述转基因细胞系B为含有前文所述核酸分子B的转基因细胞系;所述转基因细胞系C为含有前文所述核酸分子C的转基因细胞系;所述转基因细胞系D为含有前文所述核酸分子D的转基因细胞系;所述转基因细胞系E为含有前文所述核酸分子E的转基因细胞系。
(c8)成套重组菌,为成套重组菌甲或成套重组菌乙或成套重组菌丙。
所述成套重组菌甲由重组菌A和重组菌B组成。
所述成套重组菌乙由所述重组菌A、所述重组菌B和重组菌C组成。
所述成套重组菌丙由所述重组菌A、所述重组菌B、所述重组菌C、重组菌D和重组菌E组成。
所述重组菌A为含有前文所述核酸分子A的重组菌;所述重组菌B为含有前文所述核酸分子B的重组菌;所述重组菌C为含有前文所述核酸分子C的重组菌;所述重组菌D为含有前文所述核酸分子D的重组菌;所述重组菌E为含有前文所述核酸分子E的重组菌。
第四方面,本发明要求保护一种构建工程菌的方法。
本发明要求保护的构建用于合成薯蓣皂素的酵母工程菌的方法,可包括如下步骤:对能够合成胆固醇的酵母菌进行改造,使其表达前文所述的蛋白质A、前文所述的蛋白质B以及细胞色素P450还原酶,改造后的酵母菌即为目的工程菌。
进一步地,所述能够合成胆固醇的酵母菌可按照包括如下步骤的方法制备:对出发酵母菌进行改造,使其表达甾醇7位还原酶和甾醇24位还原酶,改造后的酵母菌即为所述能够合成胆固醇的酵母菌。
对应于基因水平,所述方法可包括如下步骤:将前文所述的核酸分子A、前文所述的核酸分子B以及所述细胞色素P450还原酶的编码基因导入所述能够合成胆固醇的酵母菌,得到表达所述蛋白质A、所述蛋白质B以及所述细胞色素P450还原酶的重组酵母菌,即为所述目的工程菌。
进一步地,所述能够合成胆固醇的酵母菌可按照包括如下步骤的方法制备:将所述甾醇7位还原酶的编码基因和所述甾醇24位还原酶的编码基因导入所述出发酵母菌,得到表达所述甾醇7位还原酶和所述甾醇24位还原酶的重组酵母菌,即为所述能够合成胆固醇的酵母菌。
其中,所述细胞色素P450还原酶可为前文所述的蛋白质C;所述甾醇7位还原酶可为前文所述的蛋白质D;所述甾醇24位还原酶可为前文所述的蛋白质E。
对应于基因水平,所述细胞色素P450还原酶的编码基因可为前文所述的核酸分子C;所述甾醇7位还原酶的编码基因可为前文所述的核酸分子D;所述甾醇24位还原酶的编码基因可为前文所述的核酸分子E。
进一步地,各所述核酸分子或编码基因可通过重组载体或表达盒的形式导入相应的受体酵母菌中。
在本发明的具体实施方式中,所述核酸分子A和所述核酸分子B以及所述细胞色素P450还原酶的编码基因(如前文所述核酸分子C)被整合到所述能够合成胆固醇的酵母菌的基因组的Gal80位点。所述甾醇7位还原酶的编码基因(如前文所述核酸分子D)和所述甾醇24位还原酶的编码基因(如前文所述核酸分子E)被整合到所述出发酵母菌的基因组的Gal7位点。
更进一步地,所述酵母菌可为酿酒酵母等。
在本发明的具体实施方式中,所述出发酵母菌具体为酿酒酵母BY-T3。
在本发明的具体实施方式中,前文所述核酸分子D和所述核酸分子E是通过表达盒的形式导入所述出发酵母菌中的。所述表达盒为表达盒Ppgk-DrDHCR7-ADH1t和表达盒pGal1-DrDHCR24-CYC1t。所述表达盒Ppgk-DrDHCR7-ADH1t的序列为SEQ ID No.3;所述表达盒pGal1-DrDHCR24-CYC1t的序列为SEQ ID No.4。当向所述出发酵母菌中导入所述表达盒Ppgk-DrDHCR7-ADH1t和所述表达盒pGal1-DrDHCR24-CYC1t的同时,还导入了同源臂marker片段gal7-URA3-up和同源臂marker片段gal7-URA3-down(实现了整合于酿酒酵母的Gal7位点);所述同源臂marker片段gal7-URA3-up的序列如SEQ ID No.5所示;所述同源臂marker片段gal7-URA3-down的序列如SEQ ID No.6所示。
在本发明的具体实施方式中,前文所述核酸分子A、所述核酸分子B和所述核酸分子C是通过表达盒的形式导入所述能够合成胆固醇的酵母菌中的。所述表达盒为表达盒pPgk-DGCYP029-ADH1t、表达盒pTDH3-VvCPR-TPI1t和表达盒pTEF-DGCYP033-CYC1t。
所述表达盒pPgk-DGCYP029-ADH1t以是质粒pM2-DGCYP029-sy-Sc为模板使用引物1-M-pEASY-PGK1-F和引物3G-1-M-ADHt-TDH3-R进行PCR扩增,扩增获得的片段。所述引物1-M-pEASY-PGK1-F的序列如SEQ ID No.15所示;所述引物3G-1-M-ADHt-TDH3-R的序列如SEQID No.16所示。所述质粒pM2-DGCYP029-sy-Sc为将SEQ ID No.8的第11-1501位所示DNA片段(DGCYP029-sy-Sc)替换pM2质粒的酶切位点SexA1和Asc1之间的小片段后得到的重组质粒。
所述表达盒pTDH3-VvCPR-TPI1t以是质粒pM4-VvCPR-sy-Sc为模板使用引物3G-3-M-ADHt-TDH3-F和引物3G-3-M-TPI1t-TEF1-R进行PCR扩增,扩增获得的片段。所述引物3G-3-M-ADHt-TDH3-F的序列如SEQ ID No.17所示;所述引物3G-3-M-TPI1t-TEF1-R的序列如SEQ ID No.18所示。所述质粒pM4-VvCPR-sy-Sc为将SEQ ID No.12的第11-2125位所示DNA片段(VvCPR-sy-Sc)替换pM4质粒的酶切位点SexA1和Asc1之间的小片段后得到的重组质粒。
所述表达盒pTEF-DGCYP033-CYC1t以是质粒pM3-DGCYP033-sy-Sc为模板使用引物3G-2-M-TPI1t-TEF1-F和引物M-CYC1t-pEASY-R进行PCR扩增,扩增获得的片段。所述引物3G-2-M-TPI1t-TEF1-F的序列如SEQ ID No.19所示;所述引物M-CYC1t-pEASY-R的序列如SEQ ID No.20所示。所述质粒pM3-DGCYP033-sy-Sc为将SEQ ID No.10的第11-1477位所示DNA片段(DGCYP033-sy-Sc)替换pM3质粒的酶切位点SexA1和Asc1之间的小片段后得到的重组质粒。
当向所述能够合成胆固醇的酵母菌中导入所述表达盒pPgk-DGCYP029-ADH1t、所述表达盒pTDH3-VvCPR-TPI1t和所述表达盒pTEF-DGCYP033-CYC1t的同时,还导入了同源臂marker片段gal80-Leu-up和同源臂marker片段gal80-Leu-down(实现了整合于酿酒酵母的Gal80位点);所述同源臂marker片段gal80-Leu-up的序列如SEQ ID No.13所示;所述同源臂marker片段gal80-Leu-down的序列如SEQ ID No.14所示。
第五方面,本发明要求保护利用前文第四方面中所述方法制备得到的工程菌。
在本发明的具体实施方式中,所述工程菌为工程菌DG001;所述工程菌DG001是按照包括如下步骤的得到制备获得的:
(d1)向酿酒酵母BY-T3导入所述表达盒Ppgk-DrDHCR7-ADH1t(SEQ ID No.3)、所述表达盒pGal1-DrDHCR24-CYC1t(SEQ ID No.4)、所述同源臂marker片段gal7-URA3-up(SEQID No.5)以及所述同源臂marker片段gal7-URA3-down(SEQ ID No.6)后得到的重组菌为所述能够合成胆固醇的酵母菌;
(d2)向所述能够合成胆固醇的酵母菌导入所述表达盒pPgk-DGCYP029-ADH1t、所述表达盒pTDH3-VvCPR-TPI1t和所述表达盒pTEF-DGCYP033-CYC1t、所述同源臂marker片段gal80-Leu-up(SEQ ID No.13)以及所述同源臂marker片段gal80-Leu-down(SEQ IDNo.14)后得到的重组菌即为所述工程菌DG001。
第六方面,本发明要求保护前文所述的蛋白质或所述的成套蛋白质或所述的核酸分子或所述的成套核酸分子或所述的生物材料或所述的工程菌在制备薯蓣皂素中的应用。
第七方面,本发明要求保护一种制备薯蓣皂素的方法。
本发明所要求保护的制备薯蓣皂素的方法,可包括如下步骤:对前文第五方面中所述的工程菌进行发酵培养,收集发酵产物;所述发酵产物中即含有薯蓣皂素。
进一步地,所述培养的温度为30℃。
更进一步地,所述培养的条件为:1)以2%(百分号表示g/100mL)葡萄糖作为碳源的选择性培养基于30℃250rpm培养30h。2)转至以2%(百分号表示g/100mL)半乳糖为碳源的选择培养基于30℃250rpm培养90h。
实验证明,利用本发明所提供的盾叶薯蓣来源的薯蓣皂素合成相关基因,与细胞色素P450还原酶编码基因一起导入能够合成胆固醇的酿酒酵母菌,能够得到能够合成薯蓣皂素的酿酒酵母工程菌株。本发明实现了酿酒酵母薯蓣皂素的生物合成。
附图说明
图1为从胆固醇出发的薯蓣皂素合成途径。
图2为菌株DG-Cho发酵产物GC-MS鉴定。
图3为菌株DG001发酵产物GC-MS鉴定。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
质粒pM2:在peasy-Blunt-simple载体(全式金生物有限公司)的多克隆位点按顺序***了SexA1酶切位点,pPGK1启动子,绿色荧光蛋白(GFP)基因,以及终止子ADHt和Asc1酶切位点。
质粒pM3:在peasy-Blunt-simple载体(全式金生物有限公司)的多克隆位点按顺序***了SexA1酶切位点,pTEF1启动子,绿色荧光蛋白(GFP)基因,以及终止子CYC1t和Asc1酶切位点。
质粒pM4:在peasy-Blunt-simple载体(全式金生物有限公司)的多克隆位点按顺序***了SexA1酶切位点,pTDH3启动子,绿色荧光蛋白(GFP)基因,以及终止子TPI1t和Asc1酶切位点。
质粒pYES2.0:为Addgene产品。
酿酒酵母(Saccharomyces cerevisiae)BY-T3:Dai,Z.et al.Identification ofa novel cytochrome P450enzyme that catalyzes the C-2αhydroxylation ofpentacyclic triterpenoids and its application in yeast cellfactories.Metabolic engineering 51,70-78(2019).来源于本实验戴住波老师2019年文献。公众可从申请人处获得,仅可用于重复本发明实验使用,不得他用。
实施例1、酿酒酵母胆固醇合成底盘菌株DG-Cho的构建
1、构建酵母多基因整合片段
选取斑马鱼(Danio rerio)来源的甾醇7位还原酶(DrDHCR7)和24位还原酶(DrDHCR24)对上述两个蛋白进行密码子优化,该优化与基因合成工作委托南京金斯瑞生物科技有限公司完成,获得的优化后的基因命名为DrDHCR7-sy-Sc,DrDHCR24-sy-Sc。DrDHCR7-sy-Sc基因的序列如SEQ ID No.3的第813-2249位所示,编码SEQ ID No.1所示的蛋白质;DrDHCR24-sy-Sc基因的序列如SEQ ID No.4的第493-2043位所示,编码SEQ IDNo.2所示的蛋白质。用Thermo公司SexA1和Asc1酶切克隆载体质粒pM2,pYES2.0和基因片段DrDHCR7-sy-Sc,DrDHCR24-sy-Sc,酶切产物用上海生工生物工程有限公司的PCR产物胶回收试剂盒进行胶回收备用。将酶切载体pM2与上述所得DrDHCR7-sy-Sc基因片段各50ng加入连接体系:5μL 2×Quick ligation Buffer(NEB公司)、0.5μL Quick ligase(NEB公司,400,000cohesive end units/ml),补充蒸馏水至10μL,室温反应10min得到连接产物,转入Trans1-T1感受态细胞并冰浴30分钟,42℃热激30秒,立即至于冰上2分钟。加入800μl LB培养基,250rpm,37℃孵育1小时,菌液涂在含有氨苄青霉素的LB平板上,过夜培养后,PCR筛选5个阳性单菌落,将阳性克隆进行液体培养,提取阳性克隆质粒进行测序验证,测序结果表明在载体pM2上***目的片段,得到质粒pM2-DrDHCR7-sy-Sc。用于上述相同的方法应用酶切备用的pYES2.0载体和DrDHCR24-sy-Sc基因片段构建质粒pYes-DrDHCR24-sy-Sc。
以构建好的质粒pM2-DrDHCR7-sy-Sc为模板使用引物1-M-pEASY-PGK1-F和1-M-ADHt-Gal1-R(见表2)进行PCR扩增,扩增体系为TAKARA
Figure BDA0002247419530000112
HS DNA聚合酶5×Buffer 10μL,Dntp mix 4μl,引物(见表1)各1μL,质粒pM2-DrDHCR7-sy-Sc模板0.5μl,PrimerSTAR HS聚合酶(2.5U/μL)0.5μL,补加蒸馏水至总体积50μl。扩增条件为98℃预变性3分钟(1个循环);98℃变性10秒、56℃退火15秒、72℃延伸2分钟(30个循环);72℃延伸10分钟(1个循环)。所得扩增产物命名为Ppgk-DrDHCR7-ADH1t(SEQ ID No.3),该片段包含Pgk启动子(SEQ ID No.3的第63-812位),斑马鱼来源的DrDHCR7基因(SEQ ID No.3的第813-2249位)以及ADH1终止子(SEQ ID No.3的第2250-2407位)将得到的PCR扩增产物,进行胶回收纯化备用。以构建好的质粒pYes-DrDHCR24-sy-Sc为模板使用引物2-M-ADHt-Gal1-F和M-CYC1t-pEASY-R(见表1)用上述相同方法进行PCR扩增,获得pGal1-DrDHCR24-CYC1t片段(SEQ ID No.4),该片段包含Gal1启动子(SEQ ID No.4的第51-492位),斑马鱼来源的DrDHCR24基因(SEQ ID No.4的第493-2043位)以及CYC1终止子(SEQ ID No.4的第2044-2243位)。同样对扩增获得的目的片段进行胶回收处理备用。
表1 DrDHCR7-sy-Sc和DrDHCR24-sy-Sc基因整合片段扩增引物
Figure BDA0002247419530000111
2、酿酒酵母菌株DG-Cho的构建
出发菌株酿酒酵母(Saccharomyces cerevisiae)BY-T3于接种液体筛选培养基(配方:0.8%SD-His(北京泛基诺(功能基因组)科技有限公司),2%葡萄糖(各百分号均表示g/100mL);各百分号均表示g/100mL)过夜培养。取1mL(OD600约0.6-1.0)分装到1.5mL EP管中,4℃、10000g离心1min,弃上清,沉淀用无菌水(4℃)洗涤,同样条件下离心,弃上清。菌体加入1mL处理液(配方:10mM LiAc;10mM DTT;0.6M山梨醇;10mM Tris-HCl(pH7.5),处理液使用时才加DTT),25℃下放置20min。离心,弃上清,菌体中加入1mL 1M山梨醇(0.22μm水系膜过膜除菌)重悬,离心,弃上清(用1M山梨醇缓冲液重悬两次),到最终体积约为90μL。加入步骤1获得的片段Ppgk-DrDHCR7-ADH1t,pGal1-DrDHCR24-CYC1t以及同源臂marker片段gal7-URA3-up(SEQ ID No.5;该同源臂片段包含Gal7位点上游400bp同源区域,URA3marker基因,以及Pgk启动子400bp同源区域),gal7-URA3-down(SEQ ID No.6;该同源臂片段包含CYC1终止子200bp同源区域,以及Gal7位点下游300bp同源区域)(实现将DrDHCR7-sy-Sc和DrDHCR24-sy-Sc基因片段整合于酿酒酵母BY-T3的Gal7位点)各1.5μL,混匀后转移至电转杯中,2.7kv电击5.7ms,加入1mL 1M山梨醇,30℃复苏1h,涂布于固体筛选培养基(配方:0.8%酵母筛选培养基SD-His-Ura-Trp-Leu,2%葡萄糖,0.01%Trp,0.01%Leu,1.5%琼脂;各百分号均表示g/100mL)。筛选培养的条件为:30℃,培养36h以上。PCR鉴定出正确的阳性克隆,命名为菌株DG-Cho。
实施例2、酿酒酵母菌株DG-Cho发酵生产胆固醇
在固体选择培养基(同实施例1步骤2)中活化酿酒酵母菌株DG-Cho以及对照菌株BY-T3,于相应液体选择培养基(同实施例1步骤2)中制备种子液(30℃,250rpm,12h),以1%接种量将种子液分别接种于含有15mL相应的液体选择培养基的100mL三角瓶,30℃,250rpm培养30h后5000rpm离心收集菌体用15mL相应的2%(百分号表示g/100mL)半乳糖为碳源的液体选择培养基重悬于100mL三角瓶,30℃,250rpm继续振荡培养90h得到发酵液,对细胞生长(OD600)及产物进行测定。
取6mL的发酵液于破碎管中,13000rpm离心1min,弃上清;沉淀用无菌水清洗后,同样条件下离心,弃上清;加入适量玻璃珠(直径0.5mm),1mL萃取液(甲醇:丙酮=1:1),震荡破碎5min,超声破碎30min,13000rpm离心2min,取上清过0.22μm有机滤膜至液相瓶中进行GC-MS检测。GC-MS检测方法:气相质谱串联-质谱(GC-MS)安捷伦科技5975C与三轴***xlMSD探测器,配备色谱柱:HP-5ms(30m*0.25mm*0.5μm)。GC-MS测定条件:进样口温度300℃,进样体积1μL,不分流,溶剂延时5min;色谱条件:240℃维持5min,10℃/min加热至300℃,300℃保持25min,总共36min。MS条件:SIM:69,139,282和414。
检测结果:经检测将斑马鱼来源的DrDHCR7和DrDHCR24整合进酿酒酵母BY-T3后,获得的菌株DG-Cho的发酵产物通过GC-MS检测定性分析有胆固醇生成(图2)。所以成功构建可以体内合成胆固醇的酿酒酵母底盘菌株DG-Cho。
实施例3、薯蓣皂素从头合成工程菌株的构建
1、构建酵母多基因整合片段
选取盾叶薯蓣(D.zingiberensis)来源的胆固醇16位和22位双氧化酶(DGCYP033)和26位氧化酶(DGCYP029)以及葡萄来源的细胞色素P450还原酶(VvCPR)对上述3个蛋白进行密码子优化,该优化与基因合成工作委托南京金斯瑞生物科技有限公司完成,获得的优化后的基因命名为DGCYP029-sy-Sc,DGCYP033-sy-Sc和VvCPR-sy-Sc。两端分别带有酶切位点SexA1和Asc1识别序列的DGCYP029-sy-Sc基因的序列如SEQ ID No.8所示,SEQ ID No.8的第11-1501位编码SEQ ID No.7所示的蛋白质;两端分别带有酶切位点SexA1和Asc1识别序列的DGCYP033-sy-Sc基因的序列如SEQ ID No.10所示,SEQ ID No.10的第11-1477位编码SEQ ID No.9所示的蛋白质,两端分别带有酶切位点SexA1和Asc1识别序列的VvCPR-sy-Sc基因的序列如SEQ ID No.12所示,SEQ ID No.12的第11-2125位编码SEQ ID No.11所示的蛋白质。用Thermo公司SexA1和Asc1酶切克隆载体质粒pM2,pM3,pM4和两端分别带有酶切位点SexA1和Asc1识别序列的基因片段DGCYP029-sy-Sc,DGCYP033-sy-Sc,VvCPR-sy-Sc,酶切产物用上海生工生物工程有限公司的PCR产物胶回收试剂盒进行胶回收备用。将酶切载体pM2与上述所得DGCYP029-sy-Sc基因片段,酶切载体pM3与基因片段DGCYP033-sy-Sc,酶切载体pM4与基因片段VvCPR-sy-Sc进行连接(方法同实施例1步骤1),最终获得构建好的质粒pM2-DGCYP029-sy-Sc(将SEQ ID No.8的第11-1501位所示DNA片段替换pM2质粒的酶切位点SexA1和Asc1之间的小片段后得到的重组质粒),pM3-DGCYP033-sy-Sc(将SEQ ID No.10的第11-1477位所示DNA片段替换pM3质粒的酶切位点SexA1和Asc1之间的小片段后得到的重组质粒),pM4-VvCPR-sy-Sc(将SEQ ID No.12的第11-2125位所示DNA片段替换pM4质粒的酶切位点SexA1和Asc1之间的小片段后得到的重组质粒)。
以构建好的质粒pM2-DGCYP029-sy-Sc为模板使用引物1-M-pEASY-PGK1-F和3G-1-M-ADHt-TDH3-R,以质粒pM4-VvCPR-sy-Sc为模板使用引物3G-3-M-ADHt-TDH3-F和3G-3-M-TPI1t-TEF1-R,以质粒pM3-DGCYP033-sy-Sc为模板使用引物3G-2-M-TPI1t-TEF1-F和M-CYC1t-pEASY-R进行PCR扩增,扩增获得的片段分别为pPgk-DGCYP029-ADH1t,pTDH3-VvCPR-TPI1t和pTEF-DGCYP033-CYC1t,扩增好的片段进行胶回收纯化备用(上述使用的引物见表1、2)。
表2 VcCYP94N-sy-Sc,DGCYP033-sy-Sc和VvCPR-sy-Sc基因整合片段扩增引物
Figure BDA0002247419530000141
2、酿酒酵母菌株DG-001的构建
出发菌株酿酒酵母DG-Cho接种于液体筛选培养基(配方:0.8%SD-His-Ura(北京泛基诺(功能基因组)科技有限公司),2%葡萄糖;各百分号均表示g/100mL)过夜培养。取1mL(OD600约0.6-1.0)分装到1.5mL EP管中,4℃、10000g离心1min,弃上清,沉淀用无菌水(4℃)洗涤,同样条件下离心,弃上清。菌体加入1mL处理液(10mM LiAc;10mM DTT;0.6M山梨醇;10mM Tris-HCl(pH7.5),处理液使用时才加DTT),25℃下放置20min。离心,弃上清,菌体中加入1mL 1M山梨醇(0.22μm水系膜过膜除菌)重悬,离心,弃上清(用1M山梨醇重悬二次),到最终体积约为90μL。加入步骤1获得的片段pPgk-DGCYP029-ADH1t,pTDH3-VvCPR-TPI1t和pTEF-DGCYP033-CYC1t以及同源臂marker片段gal80-Leu-up(SEQ ID No.13;该同源臂片段包含Gal80位点上游400bp同源区域,Leu2marker基因,以及Pgk启动子400bp同源区域),gal80-Leu-down(SEQ ID No.14;该同源臂片段包含CYC1终止子200bp同源区域,以及Gal80位点下游300bp同源区域)(实现将VcCYP94N-sy-Sc,VvCPR-sy-Sc和DGCYP033-sy-Sc基因片段整合于酿酒酵母DG-Cho的Gal80位点)各1.5μL,混匀后转移至电转杯中,2.7kV电击5.7ms,加入1mL 1M山梨醇,30℃复苏1h,涂布于固体筛选培养基(配方:0.8%酵母筛选培养基SD-His-Ura-Trp-Leu,2%葡萄糖,0.01%Trp,1.5%琼脂;各百分号均表示g/100mL)。筛选培养的条件为:30℃,培养36h以上。PCR鉴定出正确的阳性克隆,命名为菌株DG001。
实施例4、酿酒酵母菌株DG001发酵生产薯蓣皂素
在固体选择培养基(同实施例1步骤2)中活化酿酒酵母菌株DG001以及对照菌株DG-Cho,于相应液体选择培养基(同实施例1步骤2)中制备种子液(30℃,250rpm,12h),以1%接种量将种子液分别接种于含有15mL相应的液体选择培养基的100mL三角瓶,30℃,250rpm培养30h后5000rpm离心收集菌体用15mL相应的2%(百分号表示g/100mL)半乳糖为碳源的液体选择培养基重悬于100mL三角瓶,30℃,250rpm继续振荡培养90h得到发酵液,对细胞生长(OD600)及产物进行测定(产物提取及测定方法同实施例2)。
检测结果:经检测将DGCYP029-sy-Sc、VvCPR-sy-Sc和DGCYP033-sy-Sc基因片段整合于酿酒酵母DG-Cho,获得的菌株DG-001的发酵产物通过GC-MS检测定性分析有薯蓣皂素的生成(图3)。所以成功构建可以体内从头合成薯蓣皂素的酿酒酵母底盘菌株DG001,其薯蓣皂素产量为3.2mg/L。
<110> 中国科学院天津工业生物技术研究所
<120> 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用
<130> GNCLN192228
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 478
<212> PRT
<213> Artificial sequence
<400> 1
Met Met Ala Ser Asp Arg Val Arg Lys Arg His Lys Gly Ser Ala Asn
1 5 10 15
Gly Ala Gln Thr Val Glu Lys Glu Pro Ser Lys Glu Pro Ala Gln Trp
20 25 30
Gly Arg Ala Trp Glu Val Asp Trp Phe Ser Leu Ser Gly Val Ile Leu
35 40 45
Leu Leu Cys Phe Ala Pro Phe Leu Val Ser Phe Phe Ile Met Ala Cys
50 55 60
Asp Gln Tyr Gln Cys Ser Ile Ser His Pro Leu Leu Asp Leu Tyr Asn
65 70 75 80
Gly Asp Ala Thr Leu Phe Thr Ile Trp Asn Arg Ala Pro Ser Phe Thr
85 90 95
Trp Ala Ala Ala Lys Ile Tyr Ala Ile Trp Val Thr Phe Gln Val Val
100 105 110
Leu Tyr Met Cys Val Pro Asp Phe Leu His Lys Ile Leu Pro Gly Tyr
115 120 125
Val Gly Gly Val Gln Asp Gly Ala Arg Thr Pro Ala Gly Leu Ile Asn
130 135 140
Lys Tyr Glu Val Asn Gly Leu Gln Cys Trp Leu Ile Thr His Val Leu
145 150 155 160
Trp Val Leu Asn Ala Gln His Phe His Trp Phe Ser Pro Thr Ile Ile
165 170 175
Ile Asp Asn Trp Ile Pro Leu Leu Trp Cys Thr Asn Ile Leu Gly Tyr
180 185 190
Ala Val Ser Thr Phe Ala Phe Ile Lys Ala Tyr Leu Phe Pro Thr Asn
195 200 205
Pro Glu Asp Cys Lys Phe Thr Gly Asn Met Phe Tyr Asn Tyr Met Met
210 215 220
Gly Ile Glu Phe Asn Pro Arg Ile Gly Lys Trp Phe Asp Phe Lys Leu
225 230 235 240
Phe Phe Asn Gly Arg Pro Gly Ile Val Ala Trp Thr Leu Ile Asn Leu
245 250 255
Ser Tyr Ala Ala Lys Gln Gln Glu Leu Tyr Gly Tyr Val Thr Asn Ser
260 265 270
Met Ile Leu Val Asn Val Leu Gln Ala Val Tyr Val Val Asp Phe Phe
275 280 285
Trp Asn Glu Ala Trp Tyr Leu Lys Thr Ile Asp Ile Cys His Asp His
290 295 300
Phe Gly Trp Tyr Leu Gly Trp Gly Asp Cys Val Trp Leu Pro Phe Leu
305 310 315 320
Tyr Thr Leu Gln Gly Leu Tyr Leu Val Tyr Asn Pro Ile Gln Leu Ser
325 330 335
Thr Pro His Ala Ala Gly Val Leu Ile Leu Gly Leu Val Gly Tyr Tyr
340 345 350
Ile Phe Arg Val Thr Asn His Gln Lys Asp Leu Phe Arg Arg Thr Glu
355 360 365
Gly Asn Cys Ser Ile Trp Gly Lys Lys Pro Thr Phe Ile Glu Cys Ser
370 375 380
Tyr Gln Ser Ala Asp Gly Ala Ile His Lys Ser Lys Leu Met Thr Ser
385 390 395 400
Gly Phe Trp Gly Val Ala Arg His Met Asn Tyr Thr Gly Asp Leu Met
405 410 415
Gly Ser Leu Ala Tyr Cys Leu Ala Cys Gly Gly Asn His Leu Leu Pro
420 425 430
Tyr Phe Tyr Ile Ile Tyr Met Thr Ile Leu Leu Val His Arg Cys Ile
435 440 445
Arg Asp Glu His Arg Cys Ser Asn Lys Tyr Gly Lys Asp Trp Glu Arg
450 455 460
Tyr Thr Ala Ala Val Ser Tyr Arg Leu Leu Pro Asn Ile Phe
465 470 475
<210> 2
<211> 516
<212> PRT
<213> Artificial sequence
<400> 2
Met Asp Pro Leu Leu Tyr Leu Gly Gly Leu Ala Val Leu Phe Leu Ile
1 5 10 15
Trp Ile Lys Val Lys Gly Leu Glu Tyr Val Ile Ile His Gln Arg Trp
20 25 30
Ile Phe Val Cys Leu Phe Leu Leu Pro Leu Ser Val Val Phe Asp Val
35 40 45
Tyr Tyr His Leu Arg Ala Trp Ile Ile Phe Lys Met Cys Ser Ala Pro
50 55 60
Lys Gln His Asp Gln Arg Val Arg Asp Ile Gln Arg Gln Val Arg Glu
65 70 75 80
Trp Arg Lys Asp Gly Gly Lys Lys Tyr Met Cys Thr Gly Arg Pro Gly
85 90 95
Trp Leu Thr Val Ser Leu Arg Val Gly Lys Tyr Lys Lys Thr His Lys
100 105 110
Asn Ile Met Ile Asn Met Met Asp Ile Leu Glu Val Asp Thr Lys Arg
115 120 125
Lys Val Val Arg Val Glu Pro Leu Ala Asn Met Gly Gln Val Thr Ala
130 135 140
Leu Leu Asn Ser Ile Gly Trp Thr Leu Pro Val Leu Pro Glu Leu Asp
145 150 155 160
Asp Leu Thr Val Gly Gly Leu Val Met Gly Thr Gly Ile Glu Ser Ser
165 170 175
Ser His Ile Tyr Gly Leu Phe Gln His Ile Cys Val Ala Phe Glu Leu
180 185 190
Val Leu Ala Asp Gly Ser Leu Val Arg Cys Thr Glu Lys Glu Asn Ser
195 200 205
Asp Leu Phe Tyr Ala Val Pro Trp Ser Cys Gly Thr Leu Gly Phe Leu
210 215 220
Val Ala Ala Glu Ile Arg Ile Ile Pro Ala Gln Lys Trp Val Lys Leu
225 230 235 240
His Tyr Glu Pro Val Arg Gly Leu Asp Ala Ile Cys Lys Lys Phe Ala
245 250 255
Glu Glu Ser Ala Asn Lys Glu Asn Gln Phe Val Glu Gly Leu Gln Tyr
260 265 270
Ser Arg Asp Glu Ala Val Ile Met Thr Gly Val Met Thr Asp His Ala
275 280 285
Glu Pro Asp Lys Thr Asn Cys Ile Gly Tyr Tyr Tyr Lys Pro Trp Phe
290 295 300
Phe Arg His Val Glu Ser Phe Leu Lys Gln Asn Arg Val Ala Val Glu
305 310 315 320
Tyr Ile Pro Leu Arg His Tyr Tyr His Arg His Thr Arg Ser Ile Phe
325 330 335
Trp Glu Leu Gln Asp Ile Ile Pro Phe Gly Asn Asn Pro Leu Phe Arg
340 345 350
Tyr Val Phe Gly Trp Met Val Pro Pro Lys Ile Ser Leu Leu Lys Leu
355 360 365
Thr Gln Gly Glu Thr Ile Arg Lys Leu Tyr Glu Gln His His Val Val
370 375 380
Gln Asp Met Leu Val Pro Met Lys Asp Ile Lys Ala Ala Ile Gln Arg
385 390 395 400
Phe His Glu Asp Ile His Val Tyr Pro Leu Trp Leu Cys Pro Phe Leu
405 410 415
Leu Pro Asn Gln Pro Gly Met Val His Pro Lys Gly Asp Glu Asp Glu
420 425 430
Leu Tyr Val Asp Ile Gly Ala Tyr Gly Glu Pro Lys Val Lys His Phe
435 440 445
Glu Ala Thr Ser Ser Thr Arg Gln Leu Glu Lys Phe Val Arg Asp Val
450 455 460
His Gly Phe Gln Met Leu Tyr Ala Asp Val Tyr Met Glu Arg Lys Glu
465 470 475 480
Phe Trp Glu Met Phe Asp Gly Thr Leu Tyr His Lys Leu Arg Glu Glu
485 490 495
Leu Gly Cys Lys Asp Ala Phe Pro Glu Val Phe Asp Lys Ile Cys Lys
500 505 510
Ser Ala Arg His
515
<210> 3
<211> 2460
<212> DNA
<213> Artificial sequence
<400> 3
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccttaatt 60
aaacgcacag atattataac atctgcacaa taggcatttg caagaattac tcgtgagtaa 120
ggaaagagtg aggaactatc gcatacctgc atttaaagat gccgatttgg gcgcgaatcc 180
tttattttgg cttcaccctc atactattat cagggccaga aaaaggaagt gtttccctcc 240
ttcttgaatt gatgttaccc tcataaagca cgtggcctct tatcgagaaa gaaattaccg 300
tcgctcgtga tttgtttgca aaaagaacaa aactgaaaaa acccagacac gctcgacttc 360
ctgtcttcct attgattgca gcttccaatt tcgtcacaca acaaggtcct agcgacggct 420
cacaggtttt gtaacaagca atcgaaggtt ctggaatggc gggaaagggt ttagtaccac 480
atgctatgat gcccactgtg atctccagag caaagttcgt tcgatcgtac tgttactctc 540
tctctttcaa acagaattgt ccgaatcgtg tgacaacaac agcctgttct cacacactct 600
tttcttctaa ccaagggggt ggtttagttt agtagaacct cgtgaaactt acatttacat 660
atatataaac ttgcataaat tggtcaatgc aagaaataca tatttggtct tttctaattc 720
gtagtttttc aagttcttag atgctttctt tttctctttt ttacagatca tcaaggaagt 780
aattatctac tttttacaac aaatataaaa caatgatggc atctgataga gttagaaaaa 840
gacataaagg ttcagcaaat ggtgctcaaa ctgttgaaaa agaaccatct aaagaaccag 900
cacaatgggg tagagcttgg gaagttgatt ggttctcttt gtcaggtgtt attttgttgt 960
tgtgtttcgc accatttttg gtttctttct ttatcatggc ttgtgatcaa taccaatgtt 1020
ctatctcaca tccattgttg gatttgtata atggtgacgc aactttgttt actatttgga 1080
atagagctcc atcttttact tgggctgcag ctaagatcta tgctatctgg gttacattcc 1140
aagttgtttt gtacatgtgt gttccagatt tcttgcataa aattttgcca ggttatgttg 1200
gtggtgttca agatggtgca agaacaccag ctggtttgat taataagtac gaagttaacg 1260
gtttgcaatg ttggttgatc actcatgttt tgtgggtttt gaacgcacaa catttccatt 1320
ggttctctcc aacaatcatc atcgataact ggatcccatt gttgtggtgt actaacatct 1380
tgggttacgc tgtttcaaca ttcgctttta ttaaggctta cttatttcca actaatccag 1440
aagattgtaa gtttactggt aacatgttct acaactacat gatgggtatc gaattcaatc 1500
caagaatcgg taaatggttc gatttcaagt tgtttttcaa tggtagacca ggaattgttg 1560
cttggacttt gattaatttg tcttacgcag ctaagcaaca agaattgtac ggttacgtta 1620
caaactcaat gatcttggtt aacgttttgc aagcagttta cgttgttgat ttcttttgga 1680
acgaagcttg gtacttgaag actatcgata tctgtcatga tcatttcggt tggtatttgg 1740
gttggggtga ctgtgtttgg ttgccatttt tatacacttt gcaaggtttg tatttggttt 1800
acaacccaat ccaattgtct acaccacatg cagctggtgt tttgatcttg ggtttggttg 1860
gttactacat ttttagagtt actaaccatc aaaaggattt gtttagaaga acagagggta 1920
actgttcaat ctggggtaaa aagccaactt ttattgaatg ttcttaccaa tcagcagatg 1980
gtgctatcca taagtctaag ttgatgactt caggtttctg gggtgttgct agacatatga 2040
attatactgg tgacttgatg ggttctttgg catactgttt agcttgtggt ggtaatcatt 2100
tgttgccata cttctacatc atctatatga ctatcttatt ggttcataga tgtatcagag 2160
atgaacatag atgttctaat aagtacggta aagattggga aagatataca gcagctgttt 2220
catacagatt attgccaaat attttctaaa gttataaaaa aaataagtgt atacaaattt 2280
taaagtgact cttaggtttt aaaacgaaaa ttcttattct tgagtaactc tttcctgtag 2340
gtcaggttgc tttctcaggt atagcatgag gtcgctctta ttgaccacac ctctaccggc 2400
atgccgacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 2460
<210> 4
<211> 2297
<212> DNA
<213> Artificial sequence
<400> 4
ggtatagcat gaggtcgctc ttattgacca cacctctacc ggcatgccga cggattagaa 60
gccgccgagc gggtgacagc cctccgaagg aagactctcc tccgtgcgtc ctcgtcttca 120
ccggtcgcgt tcctgaaacg cagatgtgcc tcgcgccgca ctgctccgaa caataaagat 180
tctacaatac tagcttttat ggttatgaag aggaaaaatt ggcagtaacc tggccccaca 240
aaccttcaaa tgaacgaatc aaattaacaa ccataggatg ataatgcgat tagtttttta 300
gccttatttc tggggtaatt aatcagcgaa gcgatgattt ttgatctatt aacagatata 360
taaatgcaaa aactgcataa ccactttaac taatactttc aacattttcg gtttgtatta 420
cttcttattc aaatgtaata aaagtatcaa caaaaaattg ttaatatacc tctatacttt 480
aacgtcaagg agatggatcc attgttatac ttgggtggtt tagctgtttt gtttttaatc 540
tggatcaagg ttaaaggttt agaatatgtt attattcatc aaagatggat ttttgtttgt 600
ttatttttgt tgccattgtc agttgttttc gatgtttact accatttgag agcttggatc 660
atttttaaga tgtgttctgc accaaagcaa catgatcaaa gagttagaga tatccaaaga 720
caagttagag aatggagaaa agatggtggt aaaaagtaca tgtgtactgg tagaccagga 780
tggttgacag tttcattaag agttggtaaa tacaagaaaa ctcataagaa catcatgatt 840
aatatgatgg atattttaga agttgataca aagagaaagg ttgttagagt tgaaccattg 900
gctaatatgg gtcaagttac tgcattgttg aactctatcg gttggacatt gccagtttta 960
ccagaattgg atgatttgac tgttggtggt ttagttatgg gtacaggtat cgaatcttca 1020
tctcatatct atggtttgtt ccaacatatc tgtgttgctt tcgaattggt tttagcagat 1080
ggttctttag ttagatgtac tgaaaaggaa aactcagatt tgttttacgc tgttccatgg 1140
tcttgtggta cattgggttt cttggttgct gcagaaatca gaatcatccc agctcaaaag 1200
tgggttaagt tgcattacga accagttaga ggtttggatg caatctgtaa gaaattcgct 1260
gaagaatcag caaataagga aaaccaattc gttgaaggtt tacaatactc tagagatgaa 1320
gctgttatta tgactggtgt tatgacagat catgcagaac cagataagac taactgtatc 1380
ggttactact acaagccatg gtttttcaga catgttgaat catttttaaa gcaaaacaga 1440
gttgcagttg aatacatccc attgagacat tactaccata gacatacaag atctattttc 1500
tgggaattgc aagatatcat cccattcggt aacaacccat tgtttagata cgtttttggt 1560
tggatggttc caccaaagat ctcattgttg aagttgactc aaggtgaaac aatcagaaag 1620
ttgtacgaac aacatcatgt tgttcaagat atgttggttc caatgaagga tatcaaggct 1680
gcaatccaaa gattccatga agatatccat gtttacccat tgtggttgtg tccatttttg 1740
ttaccaaatc aaccaggaat ggttcatcca aaaggtgacg aagatgaatt gtacgttgat 1800
attggtgctt acggtgaacc aaaggttaag catttcgaag caacttcatc tacaagacaa 1860
ttggaaaagt ttgttagaga tgttcatggt ttccaaatgt tgtacgctga tgtttacatg 1920
gaaagaaagg aattctggga aatgttcgat ggtactttgt accataagtt gagagaagaa 1980
ttgggttgta aggatgcttt tccagaagtt tttgataaaa tttgtaaatc tgcaagacat 2040
taaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 2100
atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca ttatactgaa 2160
aaccttgctt gagaaggttt tgggacgctc gaaggcttta atttgcaagc tgcggccctg 2220
cattaatgaa tcggccaacg cgccagggtt ttcccagtca cgacgttgta aaacgacggc 2280
cagtgaattg taatacg 2297
<210> 5
<211> 1604
<212> DNA
<213> Artificial sequence
<400> 5
ggaaaagttg taaatattat tggtagtatt cgtttggtaa agtagagggg gtaatttttc 60
ccctttattt tgttcataca ttcttaaatt gctttgcctc tccttttgga aagctatact 120
tcggagcact gttgagcgaa ggctcattag atatattttc tgtcattttc cttaacccaa 180
aaataaggga aagggtccaa aaagcgctcg gacaactgtt gaccgtgatc cgaaggactg 240
gctatacagt gttcacaaaa tagccaagct gaaaataatg tgtagctatg ttcagttagt 300
ttggctagca aagatataaa agcaggtcgg aaatatttat gggcattatt atgcagagca 360
tcaacatgat aaaaaaaaac agttgaatat tccctcaaaa atgtcgaaag ctacatataa 420
ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata tcatgcacga 480
aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat tactggagtt 540
agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata tcttgactga 600
tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt acaatttttt 660
actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc agtactctgc 720
gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg tggtgggccc 780
aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac ctagaggcct 840
tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat atactaaggg 900
tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg ctcaaagaga 960
catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg tgggtttaga 1020
tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg tctctacagg 1080
atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg ctaaggtaga 1140
gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg gccagcaaaa 1200
ctaaacgcac agatattata acatctgcac aataggcatt tgcaagaatt actcgtgagt 1260
aaggaaagag tgaggaacta tcgcatacct gcatttaaag atgccgattt gggcgcgaat 1320
cctttatttt ggcttcaccc tcatactatt atcagggcca gaaaaaggaa gtgtttccct 1380
ccttcttgaa ttgatgttac cctcataaag cacgtggcct cttatcgaga aagaaattac 1440
cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa aaacccagac acgctcgact 1500
tcctgtcttc ctattgattg cagcttccaa tttcgtcaca caacaaggtc ctagcgacgg 1560
ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg gcgg 1604
<210> 6
<211> 499
<212> DNA
<213> Artificial sequence
<400> 6
agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 60
tcaaattttt cttttttttc tgtacagacg cgtgtacgca tgtaacatta tactgaaaac 120
cttgcttgag aaggttttgg gacgctcgaa ggctttaatt tgcaagctgc ggccctgcat 180
taatgaatcg gccaacgcgc aaagaaagtg gaatattcat tcatatcata ttttttctat 240
taactgcctg gtttctttta aattttttat tggttgtcga cttgaacgga gtgacaatat 300
atatatatat atatttaata atgacatcat tatctgtaaa tctgattctt aatgctattc 360
tagttatgta agagtggtcc tttccataaa aaaaaaaaaa aagaaaaaag aattttagga 420
atacaatgca gcttgtaagt aaaatctgga atattcatat cgccacaact tcttatgctt 480
ataaaagcac taatgcctg 499
<210> 7
<211> 496
<212> PRT
<213> Artificial sequence
<400> 7
Met Gly Leu Met Gly Pro Leu Leu Leu Thr Leu Ala Ala Leu Ala Val
1 5 10 15
Thr Val Phe Leu Leu Arg Arg Arg Arg Gln Pro Ser Ser Lys Thr Ser
20 25 30
Lys Pro Leu Ala Ser Ser Gly Thr Leu Ser Glu Leu Met Lys Asn Gly
35 40 45
His Arg Ile Leu Asp Trp Thr Thr Glu Leu Leu Ser Ser Ser Gln Thr
50 55 60
Gly Thr Val Thr Thr Phe Met Gly Val Val Thr Ala Asn Pro Ser Asn
65 70 75 80
Val Glu His Ile Leu Lys Ser His Phe Pro Asn Tyr Pro Lys Gly Ser
85 90 95
His Ser Thr Thr Ile Leu Ser Asp Phe Leu Gly Ala Gly Ile Phe Asn
100 105 110
Ser Asp Gly Glu His Trp Arg Leu Gln Arg Lys Thr Ala Ser Leu Glu
115 120 125
Phe Thr Thr Lys Ser Ile Arg Ser Phe Val Ser Ser Asn Val Arg Leu
130 135 140
Glu Thr Ser Ser Arg Leu Leu Pro Val Leu His Ser Phe Ala Arg Ser
145 150 155 160
Gly Gln Ile Val Asp Leu Gln Asp Leu Phe Asp Cys Leu Ala Phe Asp
165 170 175
Asn Val Cys Gln Val Thr Phe Gly Tyr Asp Pro Ala Arg Leu Asp Ser
180 185 190
Ser Gly Asp Pro Asp Ser Val Ala Phe Ser Arg Ala Phe Asp Arg Ala
195 200 205
Thr Ala Leu Ser Val Arg Arg Phe Ser His Pro Phe Pro Phe Thr Trp
210 215 220
Lys Leu Leu Arg Phe Leu Asn Ala Gly Tyr Glu Arg Glu Leu Lys Ala
225 230 235 240
Glu Val Ala Lys Val His Arg Phe Ala Met Gln Val Val Arg Arg Arg
245 250 255
Lys Lys Asp Gly Asp Leu Gly Asp Asp Leu Leu Ser Arg Phe Ile Ala
260 265 270
Glu Ala Asp Tyr Ser Asp Glu Phe Leu Arg Asp Ile Ile Ile Ser Phe
275 280 285
Val Leu Ala Gly Arg Asp Thr Thr Ser Ala Thr Leu Thr Trp Phe Phe
290 295 300
Trp Leu Ile Ala Ser Arg Pro Glu Val Lys Ala Arg Val Leu Asp Glu
305 310 315 320
Ile Arg Ala Ala Arg Glu Gln Glu Arg Glu Arg Thr Gly Thr Ala Thr
325 330 335
Ser Glu Ala Val Leu Thr Leu Asp Gln Val Arg Gly Met Asp Tyr Leu
340 345 350
His Ala Ala Leu Ser Glu Thr Leu Arg Leu Tyr Pro Pro Val Pro Leu
355 360 365
Gln Thr Arg Ala Cys Ala Glu Asp Asp Leu Leu Pro Asp Gly Thr Pro
370 375 380
Val Lys Lys Gly Ser Thr Val Met Tyr Ser Ala Tyr Ala Met Gly Arg
385 390 395 400
Ser Glu Ser Ile Trp Gly Glu Asp Trp Lys Glu Phe Arg Pro Glu Arg
405 410 415
Trp Leu Glu Asn Gly Val Phe Arg Pro Ala Ser Ser Phe Arg Phe Pro
420 425 430
Val Phe His Ala Gly Pro Arg Met Cys Leu Gly Lys Asp Met Ala Tyr
435 440 445
Ile Gln Met Lys Ala Val Ala Ala Ala Val Met Glu Arg Phe Glu Leu
450 455 460
Glu Val Val Asp Glu Glu Lys Pro Arg Glu Pro Glu Phe Thr Met Ile
465 470 475 480
Leu Arg Met Lys Gly Gly Leu Pro Val Arg Ile Arg Glu Lys Glu Phe
485 490 495
<210> 8
<211> 1509
<212> DNA
<213> Artificial sequence
<400> 8
gcgaccaggt atgggtttga tgggtccttt attattgact ttagccgctt tagccgttac 60
agtattttta ttgagaagaa gaagacaacc tagtagtaaa acatcaaaac cattggcttc 120
ttcaggtact ttgtctgaat tgatgaagaa cggtcataga atcttggatt ggactacaga 180
attgttatct tcatctcaaa ctggtacagt tactactttt atgggtgttg ttacagctaa 240
tccatcaaac gttgaacata tcttgaagtc tcatttccca aactacccaa agggttcaca 300
ttctactaca atcttgtcag atttcttggg tgcaggtatt ttcaattctg atggtgaaca 360
ttggagattg caaagaaaga cagcttcttt ggaattcact acaaagtcaa tcagatcttt 420
cgtttcatct aacgttagat tggaaacttc atctagattg ttgccagttt tgcattcatt 480
tgctagatct ggtcaaatcg ttgatttgca agatttgttc gattgtttgg cattcgataa 540
cgtttgtcaa gttactttcg gttacgatcc agctagatta gattcatctg gtgacccaga 600
ttcagttgca ttttctagag cttttgatag agcaacagct ttgtcagtta gaagattttc 660
tcatccattc ccttttactt ggaagttgtt gagatttttg aacgcaggtt acgaaagaga 720
attgaaggca gaagttgcta aggttcatag atttgctatg caagttgtta gaagaagaaa 780
gaaagatggt gacttgggtg acgatttgtt atcaagattc attgcagaag ctgattactc 840
tgatgaattc ttgagagata tcatcatctc atttgtttta gcaggtagag atactacatc 900
tgctactttg acttggtttt tctggttaat tgcatctaga ccagaagtta aggctagagt 960
tttggatgaa atcagagctg caagagaaca agaaagagaa agaactggta cagcaacttc 1020
agaagctgtt ttgacattgg atcaagttag aggcatggat tatttgcatg ctgcattatc 1080
tgaaacattg agattatacc caccagttcc attacaaact agagcatgtg ctgaagatga 1140
tttgttacca gatggtacac cagttaagaa aggttcaact gttatgtatt ctgcatacgc 1200
tatgggtaga tcagaatcta tttggggtga agactggaaa gaattcagac cagaaagatg 1260
gttggaaaat ggtgttttta gaccagcatc atcttttaga tttccagttt ttcatgctgg 1320
tccaagaatg tgtttgggta aagatatggc atacatccaa atgaaggctg ttgctgcagc 1380
tgttatggaa agattcgaat tggaagttgt tgatgaagaa aagccaagag aaccagaatt 1440
tactatgatt ttgagaatga aaggtggttt gccagttaga ataagagaaa aggaattttg 1500
aggcgcgcc 1509
<210> 9
<211> 488
<212> PRT
<213> Artificial sequence
<400> 9
Met Phe Pro Leu Ala Ile Ile Val Leu Leu Phe Pro Thr Leu Leu Leu
1 5 10 15
Leu Phe Ile Gly Val Ala Leu Gly Leu Arg Ser Gly Ala Asn Glu Ser
20 25 30
Trp Lys Lys Arg Gly Leu Asn Ile Pro Pro Gly Ser Met Gly Trp Pro
35 40 45
Leu Leu Gly Glu Thr Ile Ala Phe Arg Lys Leu His Pro Cys Thr Ser
50 55 60
Leu Gly Glu Tyr Met Glu Asp Arg Leu Gln Arg Tyr Gly Lys Ile Tyr
65 70 75 80
Arg Ser Asn Leu Phe Gly Ala Pro Thr Val Val Ser Ala Asp Ala Glu
85 90 95
Leu Asn Arg Phe Val Leu Met Asn Asp Gly Lys Leu Phe Glu Pro Ser
100 105 110
Trp Pro Lys Ser Val Ala Asp Ile Leu Gly Lys Thr Ser Met Leu Val
115 120 125
Leu Thr Gly Glu Met His Arg Tyr Met Lys Ser Leu Ser Val Asn Phe
130 135 140
Met Gly Ile Ala Arg Leu Arg Asn His Phe Leu Gly Asp Ser Glu Arg
145 150 155 160
Tyr Ile Leu Glu Asn Leu Ala Thr Trp Lys Glu Gly Val Pro Phe Pro
165 170 175
Ala Lys Glu Glu Ala Cys Lys Ile Thr Phe Asn Leu Met Val Lys Asn
180 185 190
Ile Leu Ser Met Asn Pro Gly Glu Pro Glu Thr Glu Arg Leu Arg Ile
195 200 205
Leu Tyr Met Ser Phe Met Lys Gly Val Ile Ala Met Pro Leu Asn Phe
210 215 220
Pro Gly Thr Ala Tyr Arg Lys Ala Ile Gln Ser Arg Ala Thr Ile Leu
225 230 235 240
Lys Thr Ile Glu His Leu Met Glu Asp Arg Leu Glu Lys Lys Lys Ala
245 250 255
Gly Thr Asp Asn Ile Gly Glu Ala Asp Leu Leu Gly Phe Ile Leu Glu
260 265 270
Gln Ser Asn Leu Asp Ala Glu Gln Phe Gly Asp Leu Leu Leu Gly Leu
275 280 285
Leu Phe Gly Gly His Glu Thr Ser Ser Thr Ala Ile Thr Leu Ala Ile
290 295 300
Tyr Phe Leu Glu Gly Cys Pro Lys Ala Val Gln Glu Leu Arg Glu Glu
305 310 315 320
His Leu Asn Leu Val Arg Met Lys Lys Gln Arg Gly Glu Ser Lys Ala
325 330 335
Leu Thr Trp Glu Asp Tyr Lys Ser Met Asp Phe Ala Gln Cys Val Val
340 345 350
Ser Glu Thr Leu Arg Leu Gly Asn Ile Ile Lys Phe Val His Arg Lys
355 360 365
Ala Asn Thr Asp Val Gln Phe Lys Gly Tyr Asp Ile Pro Ser Gly Trp
370 375 380
Ser Val Ile Pro Val Phe Ala Ala Ala His Leu Asp Pro Thr Val Tyr
385 390 395 400
Asp Asn Pro Gln Lys Phe Asp Pro Trp Arg Trp Gln Thr Ile Ser Ser
405 410 415
Ser Thr Ala Arg Ile Asp Asn Tyr Met Pro Phe Gly Gln Gly Leu Arg
420 425 430
Asn Cys Ala Gly Leu Glu Leu Ala Lys Met Glu Ile Ala Val Phe Leu
435 440 445
His His Leu Val Leu Asn Phe Asp Trp Glu Leu Ala Glu Pro Asp His
450 455 460
Pro Leu Ala Tyr Ala Phe Pro Glu Phe Glu Lys Gly Leu Pro Ile Lys
465 470 475 480
Val Arg Lys Leu Ser Ile Leu Glu
485
<210> 10
<211> 1485
<212> DNA
<213> Artificial sequence
<400> 10
gcgaccaggt atgtttcctc tagctatcat cgtcttgcta tttcccacac tgctgctcct 60
cttcatagga gtggccctgg gtttgagaag tggagccaat gagagctgga agaagagggg 120
gctcaacatt cccccaggaa gcatgggctg gccgctcctc ggcgagacca tcgccttccg 180
gaagctccat ccctgcacct ctctcggcga gtacatggag gatcgtctcc agaggtatgg 240
aaagatctac cgctcgaact tgttcggcgc gccgacggtg gtttcggcgg atgcagagct 300
gaaccggttc gtgctgatga acgacgggaa gctgttcgag ccgagctggc cgaagagcgt 360
ggcggacata ctgggaaaga cgtcgatgct ggtgctcaca ggggagatgc atcgctacat 420
gaagtccttg tccgtcaact tcatggggat cgctaggctt cggaatcact tccttgggga 480
ctctgagcgc tatatcttgg agaaccttgc gacctggaag gagggcgttc ctttccctgc 540
taaagaagaa gcttgcaaga taaccttcaa tttaatggtg aagaacatac tgagtatgaa 600
tcctggggag ccagagaccg agaggttgcg cattctctac atgtccttca tgaagggagt 660
gatagctatg cctctcaatt tccctggaac tgcatacagg aaagccattc agtctagagc 720
tacaatcctg aaaaccattg agcatttgat ggaggatagg ctggagaaga agaaggcagg 780
cactgataat atcggagaag ctgatcttct aggtttcatt ctagagcagt cgaacttgga 840
tgctgaacaa ttcggagact tgctgttagg tttgcttttt ggtggccatg agacctcctc 900
cactgccatc actctggcta tctacttcct tgaaggatgc cctaaagctg tacaagaact 960
aagggaagag catttgaacc tggtgaggat gaagaagcag agaggagagt ccaaagcact 1020
cacttgggaa gactacaaat ccatggactt tgcacagtgt gtggtgagtg agactctaag 1080
gctgggaaac atcatcaagt ttgtgcacag gaaggctaac actgatgtcc aatttaaagg 1140
atatgacata ccgagtggct ggagtgtgat tccggtgttc gccgcagctc atttagatcc 1200
tactgtctat gacaatcctc agaaatttga tccttggaga tggcagacaa tctcctccag 1260
cactgctagg attgacaatt acatgccatt cggtcagggg ctgcgcaact gtgctggcct 1320
tgagctcgcc aagatggaga tcgccgtgtt ccttcaccac cttgtcctta acttcgactg 1380
ggagcttgct gagccagatc accccctcgc ctacgccttc cctgaattcg aaaagggcct 1440
tcctatcaaa gttcgcaagc tatccatcct agaatgaggc gcgcc 1485
<210> 11
<211> 704
<212> PRT
<213> Artificial sequence
<400> 11
Met Gln Ser Ser Ser Val Lys Val Ser Pro Phe Asp Leu Met Ser Ala
1 5 10 15
Ile Ile Lys Gly Ser Met Asp Gln Ser Asn Val Ser Ser Glu Ser Gly
20 25 30
Gly Ala Ala Ala Met Val Leu Glu Asn Arg Glu Phe Ile Met Ile Leu
35 40 45
Thr Thr Ser Ile Ala Val Leu Ile Gly Cys Val Val Val Leu Ile Trp
50 55 60
Arg Arg Ser Gly Gln Lys Gln Ser Lys Thr Pro Glu Pro Pro Lys Pro
65 70 75 80
Leu Ile Val Lys Asp Leu Glu Val Glu Val Asp Asp Gly Lys Gln Lys
85 90 95
Val Thr Ile Phe Phe Gly Thr Gln Thr Gly Thr Ala Glu Gly Phe Ala
100 105 110
Lys Ala Leu Ala Glu Glu Ala Lys Ala Arg Tyr Glu Lys Ala Ile Phe
115 120 125
Lys Val Val Asp Leu Asp Asp Tyr Ala Gly Asp Asp Asp Glu Tyr Glu
130 135 140
Glu Lys Leu Lys Lys Glu Thr Leu Ala Phe Phe Phe Leu Ala Thr Tyr
145 150 155 160
Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr Lys Trp Phe
165 170 175
Ala Glu Gly Lys Glu Arg Gly Glu Trp Leu Gln Asn Leu Lys Tyr Gly
180 185 190
Val Phe Gly Leu Gly Asn Arg Gln Tyr Glu His Phe Asn Lys Val Ala
195 200 205
Lys Val Val Asp Asp Ile Ile Thr Glu Gln Gly Gly Lys Arg Ile Val
210 215 220
Pro Val Gly Leu Gly Asp Asp Asp Gln Cys Ile Glu Asp Asp Phe Ala
225 230 235 240
Ala Trp Arg Glu Leu Leu Trp Pro Glu Leu Asp Gln Leu Leu Arg Asp
245 250 255
Glu Asp Asp Ala Thr Thr Val Ser Thr Pro Tyr Thr Ala Ala Val Leu
260 265 270
Glu Tyr Arg Val Val Phe His Asp Pro Glu Gly Ala Ser Leu Gln Asp
275 280 285
Lys Ser Trp Gly Ser Ala Asn Gly His Thr Val His Asp Ala Gln His
290 295 300
Pro Cys Arg Ala Asn Val Ala Val Arg Lys Glu Leu His Thr Pro Ala
305 310 315 320
Ser Asp Arg Ser Cys Thr His Leu Glu Phe Asp Ile Ser Gly Thr Gly
325 330 335
Leu Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr Cys Glu Asn Leu
340 345 350
Pro Glu Thr Val Glu Glu Ala Glu Arg Leu Leu Gly Phe Ser Pro Asp
355 360 365
Val Tyr Phe Ser Ile His Thr Glu Arg Glu Asp Gly Thr Pro Leu Ser
370 375 380
Gly Ser Ser Leu Ser Pro Pro Phe Pro Pro Cys Thr Leu Arg Thr Ala
385 390 395 400
Leu Thr Arg Tyr Ala Asp Val Leu Ser Ser Pro Lys Lys Ser Ala Leu
405 410 415
Val Ala Leu Ala Ala His Ala Ser Asp Pro Ser Glu Ala Asp Arg Leu
420 425 430
Lys Tyr Leu Ala Ser Pro Ser Gly Lys Asp Glu Tyr Ala Gln Trp Val
435 440 445
Val Ala Ser Gln Arg Ser Leu Leu Glu Ile Met Ala Glu Phe Pro Ser
450 455 460
Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Val Ala Pro Arg Leu
465 470 475 480
Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Lys Met Val Pro Ser
485 490 495
Arg Ile His Val Thr Cys Ala Leu Val Cys Asp Lys Met Pro Thr Gly
500 505 510
Arg Ile His Lys Gly Ile Cys Ser Thr Trp Met Lys Tyr Ala Val Pro
515 520 525
Leu Glu Glu Ser Gln Asp Cys Ser Trp Ala Pro Ile Phe Val Arg Gln
530 535 540
Ser Asn Phe Lys Leu Pro Ala Asp Thr Ser Val Pro Ile Ile Met Ile
545 550 555 560
Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe Leu Gln Glu Arg
565 570 575
Phe Ala Leu Lys Glu Ala Gly Ala Glu Leu Gly Ser Ser Ile Leu Phe
580 585 590
Phe Gly Cys Arg Asn Arg Lys Met Asp Tyr Ile Tyr Glu Asp Glu Leu
595 600 605
Asn Gly Phe Val Glu Ser Gly Ala Leu Ser Glu Leu Ile Val Ala Phe
610 615 620
Ser Arg Glu Gly Pro Thr Lys Glu Tyr Val Gln His Lys Met Met Glu
625 630 635 640
Lys Ala Ser Asp Ile Trp Asn Val Ile Ser Gln Gly Gly Tyr Ile Tyr
645 650 655
Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val His Arg Thr Leu
660 665 670
His Thr Ile Leu Gln Glu Gln Gly Ser Leu Asp Ser Ser Lys Ala Glu
675 680 685
Ser Met Val Lys Asn Leu Gln Met Thr Gly Arg Tyr Leu Arg Asp Val
690 695 700
<210> 12
<211> 2133
<212> DNA
<213> Artificial sequence
<400> 12
gcgaccaggt atgcaatcat cctccgtaaa ggtatcccca ttcgacttaa tgtcagcaat 60
catcaagggt tctatggacc aatcaaacgt atcatcagaa tcaggtggtg ctgcagccat 120
ggttttggaa aacagagaat tcattatgat cttgactaca tccattgctg ttttgatcgg 180
ttgtgttgtc gtattgatat ggagaagatc aggtcaaaaa caatccaaga ctccagaacc 240
acctaaacct ttgattgtta aggatttgga agtagaagtt gatgacggta aacaaaaggt 300
tacaatattt ttcggtacac aaaccggtac tgctgaaggt ttcgcaaaag ccttggctga 360
agaagcaaag gccagatacg aaaaggcaat ttttaaggtt gtcgatttgg atgactatgc 420
cggtgacgac gatgaatacg aagaaaaatt gaaaaaggaa actttggcct ttttcttttt 480
ggctacatat ggtgacggtg aaccaaccga caatgctgca agattctaca aatggtttgc 540
tgagggtaaa gaacgtggtg aatggttgca aaacttaaag tatggtgttt tcggtttggg 600
taacagacaa tacgaacatt tcaacaaagt tgcaaaggta gttgacgata taatcacaga 660
acaaggtggt aaaagaatcg tcccagtagg tttgggtgac gatgaccaat gtattgaaga 720
tgacttcgcc gcttggagag aattattatg gcctgaatta gatcaattgt taagagacga 780
agatgacgct accactgtat ctacaccata taccgcagcc gttttggaat acagagtcgt 840
atttcatgat cctgaaggtg catcattaca agacaagtca tggggttccg ccaatggtca 900
tactgttcac gatgctcaac acccatgtag agccaacgtt gctgtcagaa aagaattgca 960
tactcctgct agtgatagat cttgcacaca cttggaattc gacatttctg gtactggttt 1020
aacatatgaa accggtgacc atgtaggtgt ttactgtgaa aatttgccag aaacagtcga 1080
agaagcagaa agattgttag gtttctcacc tgatgtatat ttttccatac acaccgaaag 1140
agaagacggt actccattaa gtggttcttc attgtctcca ccttttccac cttgcacttt 1200
gagaacagca ttaaccagat acgccgatgt tttgtccagt cctaaaaagt ctgcattggt 1260
cgccttagct gcacatgcat cagatccatc cgaagccgac agattgaaat atttggctag 1320
tccttctggt aaagatgaat acgctcaatg ggttgtcgca agtcaaagat ctttgttaga 1380
aattatggcc gaatttccat ctgctaagcc acctttgggt gtcttctttg ccgctgtagc 1440
tccaagattg caacctagat actacagtat ctcttcatcc ccaaagatgg ttccttctag 1500
aatacatgtt acctgtgcat tggtctgcga taaaatgcca actggtagaa tccacaaggg 1560
tatttgttca acatggatga aatatgccgt tccattagaa gaatcacaag attgctcctg 1620
ggcacctatc ttcgttagac aatcaaactt caaattgcca gctgatacct ccgtccctat 1680
cattatgatt ggtccaggta caggtttagc tcctttcaga ggtttcttgc aagaaagatt 1740
tgcattgaag gaagctggtg cagaattggg tagttctatc ttgttctttg gttgtagaaa 1800
cagaaagatg gattacatct acgaagacga attgaacggt ttcgtagaaa gtggtgcttt 1860
gtctgaattg atcgttgcat tttcaagaga aggtccaact aaggaatacg ttcaacataa 1920
gatgatggaa aaggctagtg atatctggaa cgtcatctct caaggtggtt atatatacgt 1980
atgcggtgac gctaagggta tggcaagaga cgttcataga actttgcaca caatcttaca 2040
agaacaaggt tctttagatt catccaaggc tgaatcaatg gtaaagaact tacaaatgac 2100
tggtagatac ttgagagatg tctaaggcgc gcc 2133
<210> 13
<211> 1775
<212> DNA
<213> Artificial sequence
<400> 13
gcgcaagttt tccgctttgt aatatatatt tatacccctt tcttctctcc cctgcaatat 60
aatagtttaa ttctaatatt aataatatcc tatattttct tcatttaccg gcgcactctc 120
gcccgaacga cctcaaaatg tctgctacat tcataataac caaaagctca taactttttt 180
ttttgaacct gaatatatat acatcacata tcactgctgg tccttgccga ccagcgtata 240
caatctcgat agttggtttc ccgttctttc cactcccgtc atgtctgccc ctaagaagat 300
cgtcgttttg ccaggtgacc acgttggtca agaaatcaca gccgaagcca ttaaggttct 360
taaagctatt tctgatgttc gttccaatgt caagttcgat ttcgaaaatc atttaattgg 420
tggtgctgct atcgatgcta caggtgttcc acttccagat gaggcgctgg aagcctccaa 480
gaaggctgat gccgttttgt taggtgctgt gggtggtcct aaatggggta ccggtagtgt 540
tagacctgaa caaggtttac taaaaatccg taaagaactt caattgtacg ccaacttaag 600
accatgtaac tttgcatccg actctctttt agacttatct ccaatcaagc cacaatttgc 660
taaaggtact gacttcgttg ttgtcagaga attagtggga ggtatttact ttggtaagag 720
aaaggaagac gatggtgatg gtgtcgcttg ggatagtgaa caatacaccg ttccagaagt 780
gcaaagaatc acaagaatgg ccgctttcat ggccctacaa catgagccac cattgcctat 840
ttggtccttg gataaagcta atgttttggc ctcttcaaga ttatggagaa aaactgtgga 900
ggaaaccatc aagaacgaat tccctacatt gaaggttcaa catcaattga ttgattctgc 960
cgccatgatc ctagttaaga acccaaccca cctaaatggt attataatca ccagcaacat 1020
gtttggtgat atcatctccg atgaagcctc cgttatccca ggttccttgg gtttgttgcc 1080
atctgcgtcc ttggcctctt tgccagacaa gaacaccgca tttggtttgt acgaaccatg 1140
ccacggttct gctccagatt tgccaaagaa taaggtcaac cctatcgcca ctatcttgtc 1200
tgctgcaatg atgttgaaat tgtcattgaa cttgcctgaa gaaggtaagg ccattgaaga 1260
tgcagttaaa aaggttttgg atgcaggtat cagaactggt gatttaggtg gttccaacag 1320
taccaccgaa gtcggtgatg ctgtcgccga agaagttaag aaaatccttg cttaaacgca 1380
cagatattat aacatctgca caataggcat ttgcaagaat tactcgtgag taaggaaaga 1440
gtgaggaact atcgcatacc tgcatttaaa gatgccgatt tgggcgcgaa tcctttattt 1500
tggcttcacc ctcatactat tatcagggcc agaaaaagga agtgtttccc tccttcttga 1560
attgatgtta ccctcataaa gcacgtggcc tcttatcgag aaagaaatta ccgtcgctcg 1620
tgatttgttt gcaaaaagaa caaaactgaa aaaacccaga cacgctcgac ttcctgtctt 1680
cctattgatt gcagcttcca atttcgtcac acaacaaggt cctagcgacg gctcacaggt 1740
tttgtaacaa gcaatcgaag gttctggaat ggcgg 1775
<210> 14
<211> 532
<212> DNA
<213> Artificial sequence
<400> 14
agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 60
tcaaattttt cttttttttc tgtacagacg cgtgtacgca tgtaacatta tactgaaaac 120
cttgcttgag aaggttttgg gacgctcgaa ggctttaatt tgcaagctgc ggccctgcat 180
taatgaatcg gccaacgcgc aagcatcttg ccctgtgctt ggcccccagt gcagcgaacg 240
ttataaaaac gaatactgag tatatatcta tgtaaaacaa ccatatcatt tcttgttctg 300
aactttgttt acctaactag ttttaaattt ccctttttcg tgcatgcggg tgttcttatt 360
tattagcata ctacatttga aatatcaaat ttccttagta gaaaagtgag agaaggtgca 420
ctgacacaaa aaataaaatg ctacgtataa ctgtcaaaac tttgcagcag cgggcatcct 480
tccatcatag cttcaaacat attagcgttc ctgatcttca tacccgtgct ca 532
<210> 15
<211> 80
<212> DNA
<213> Artificial sequence
<400> 15
ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccttaatt 60
aaacgcacag atattataac 80
<210> 16
<211> 74
<212> DNA
<213> Artificial sequence
<400> 16
cctccgcgtc attaaacttc ttgttgttga cgctaacatc aacgctagta ttcggcatgc 60
cggtagaggt gtgg 74
<210> 17
<211> 76
<212> DNA
<213> Artificial sequence
<400> 17
caggtatagc atgaggtcgc tcttattgac cacacctcta ccggcatgcc gaatactagc 60
gttgaatgtt agcgtc 76
<210> 18
<211> 75
<212> DNA
<213> Artificial sequence
<400> 18
aggagtagaa acattttgaa gctatggtgt gtgggggatc actttaatta atctatataa 60
cagttgaaat ttgga 75
<210> 19
<211> 76
<212> DNA
<213> Artificial sequence
<400> 19
gtcattttcg cgttgagaag atgttcttat ccaaatttca actgttatat agattaatta 60
aagtgatccc ccacac 76
<210> 20
<211> 78
<212> DNA
<213> Artificial sequence
<400> 20
cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgcgt 60
tggccgattc attaatgc 78

Claims (22)

1.蛋白质,为蛋白质A或蛋白质B;
所述蛋白质A为如下(A1)-(A3)中任一所示的蛋白质:
(A1)氨基酸序列如SEQ ID No.9所示的蛋白质;
(A2)与(A1)所限定的氨基酸序列具有99%以上同源性且来源于盾叶薯蓣具有胆固醇16位和22位双氧化酶功能的蛋白质;
(A3)在(A1)-(A2)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白;
所述蛋白质B为如下(B1)-(B3)中任一所示的蛋白质:
(B1)氨基酸序列如SEQ ID No.7所示的蛋白质;
(B2)与(B1)所限定的氨基酸序列具有99%以上同源性且来源于盾叶薯蓣具有胆固醇26位氧化酶功能的蛋白质;
(B3)在(B1)所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。
2.成套蛋白质,其特征在于:
所述成套蛋白质为成套蛋白质甲或成套蛋白质乙或成套蛋白质丙;
所述成套蛋白质甲由蛋白质A和蛋白质B组成;
所述成套蛋白质乙由蛋白质A、蛋白质B和蛋白质C组成;
所述成套蛋白质丙由蛋白质A、蛋白质B、蛋白质C、蛋白质D和蛋白质E组成;
所述蛋白质A为如下(A1)-(A3)中任一所示的蛋白质:
(A1)氨基酸序列如SEQ ID No.9所示的蛋白质;
(A2)与(A1)所限定的氨基酸序列具有99%以上同源性且来源于盾叶薯蓣具有胆固醇16位和22位双氧化酶功能的蛋白质;
(A3)在(A1)-(A2)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白;
所述蛋白质B为如下(B1)-(B3)中任一所示的蛋白质:
(B1)氨基酸序列如SEQ ID No.7所示的蛋白质;
(B2)与(B1)所限定的氨基酸序列具有99%以上同源性且来源于盾叶薯蓣具有胆固醇26位氧化酶功能的蛋白质;
(B3)在(B1)-(B2)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白;
所述蛋白质C为如下(C1)-(C3)中任一所示的蛋白质:
(C1)氨基酸序列如SEQ ID No.11所示的蛋白质;
(C2)与(C1)所限定的氨基酸序列具有99%以上同源性且来源于葡萄具有细胞色素P450还原酶功能的蛋白质;
(C3)在(C1)-(C2)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白;
所述蛋白质D为如下(D1)-(D3)中任一所示的蛋白质:
(D1)氨基酸序列如SEQ ID No.1所示的蛋白质;
(D2)与(D1)所限定的氨基酸序列具有99%以上同源性且来源于斑马鱼具有甾醇7位还原酶功能的蛋白质;
(D3)在(D1)-(D2)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白;
所述蛋白质E为如下(E1)-(E3)中任一所示的蛋白质:
(E1)氨基酸序列如SEQ ID No.2所示的蛋白质;
(E2)与(E1)所限定的氨基酸序列具有99%以上同源性且来源于斑马鱼具有甾醇24位还原酶功能的蛋白质;
(E3)在(E1)-(E2)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。
3.核酸分子,为核酸分子A或核酸分子B;
所述核酸分子A为编码权利要求1中所述蛋白质A的核酸分子;
所述核酸分子B为编码权利要求1中所述蛋白质B的核酸分子。
4.根据权利要求3所述的核酸分子,其特征在于:
所述核酸分子A为如下(a1)-(a3)中任一所示的DNA分子:
(a1)核苷酸序列如SEQ ID No.10的第11-1477位所示的DNA分子;
(a2)在严格条件下与(a1)限定的DNA分子杂交且编码权利要求1中所述蛋白质A的DNA分子;
(a3)与(a1)或(a2)所限定的DNA序列具有80%以上同源性且编码权利要求1中所述蛋白质A的DNA分子;
所述核酸分子B为如下(b1)-(b3)中任一所示的DNA分子:
(b1)核苷酸序列如SEQ ID No.8的第11-1501位所示的DNA分子;
(b2)在严格条件下与(b1)限定的DNA分子杂交且编码权利要求1中所述蛋白质B的DNA分子;
(b3)与(b1)或(b2)所限定的DNA序列具有80%以上同源性且编码权利要求1中所述蛋白质B的DNA分子。
5.成套核酸分子,其特征在于:所述成套核酸分子为成套核酸分子甲或成套核酸分子乙或成套核酸分子丙;
所述成套核酸分子甲由核酸分子A和核酸分子B组成;
所述成套核酸分子乙由核酸分子A、核酸分子B和核酸分子C组成;
所述成套核酸分子丙由核酸分子A、核酸分子B、核酸分子C、核酸分子D和核酸分子E组成;
所述核酸分子A为编码权利要求2中所述蛋白质A的核酸分子;
所述核酸分子B为编码权利要求2中所述蛋白质B的核酸分子;
所述核酸分子C为编码权利要求2中所述蛋白质C的核酸分子;
所述核酸分子D为编码权利要求2中所述蛋白质D的核酸分子;
所述核酸分子E为编码权利要求2中所述蛋白质E的核酸分子。
6.根据权利要求5所述的成套核酸分子,其特征在于:
所述核酸分子A为如下(a1)-(a3)中任一所示的DNA分子:
(a1)核苷酸序列如SEQ ID No.10的第11-1477位所示的DNA分子;
(a2)在严格条件下与(a1)限定的DNA分子杂交且编码权利要求2中所述蛋白质A的DNA分子;
(a3)与(a1)或(a2)所限定的DNA序列具有80%以上同源性且编码权利要求2中所述蛋白质A的DNA分子;
所述核酸分子B为如下(b1)-(b3)中任一所示的DNA分子:
(b1)核苷酸序列如SEQ ID No.8的第11-1501位所示的DNA分子;
(b2)在严格条件下与(b1)限定的DNA分子杂交且编码权利要求2中所述蛋白质B的DNA分子;
(b3)与(b1)或(b2)所限定的DNA序列具有80%以上同源性且编码权利要求2中所述蛋白质B的DNA分子;
所述核酸分子C为如下(c1)-(c3)中任一所示的DNA分子:
(c1)核苷酸序列如SEQ ID No.12的第11-2125位所示的DNA分子;
(c2)在严格条件下与(c1)限定的DNA分子杂交且编码权利要求2中所述蛋白质C的DNA分子;
(c3)与(c1)或(c2)所限定的DNA序列具有80%以上同源性且编码权利要求2中所述蛋白质C的DNA分子;
所述核酸分子D为如下(d1)-(d3)中任一所示的DNA分子:
(d1)核苷酸序列如SEQ ID No.3的第813-2249位所示的DNA分子;
(d2)在严格条件下与(d1)限定的DNA分子杂交且编码权利要求2中所述蛋白质D的DNA分子;
(d3)与(d1)或(d2)所限定的DNA序列具有80%以上同源性且编码权利要求2中所述蛋白质D的DNA分子;
所述核酸分子E为如下(e1)-(e3)中任一所示的DNA分子:
(e1)核苷酸序列如SEQ ID No.4的第493-2043位所示的DNA分子;
(e2)在严格条件下与(e1)限定的DNA分子杂交且编码权利要求2中所述蛋白质E的DNA分子;
(e3)与(e1)或(e2)所限定的DNA序列具有80%以上同源性且编码权利要求2中所述蛋白质E的DNA分子。
7.如下生物材料中的任一种:
(c1)重组载体,为含有权利要求3或4所述核酸分子的重组载体;
(c2)表达盒,为含有权利要求3或4所述核酸分子的表达盒;
(c3)转基因细胞系,为含有权利要求3或4所述核酸分子的转基因细胞系;
(c4)重组菌,为含有权利要求3或4所述核酸分子的重组菌;
(c5)成套重组载体,为成套载体甲或成套载体乙或成套载体丙;
所述成套载体甲由重组载体A和重组载体B组成;
所述成套载体乙由所述重组载体A、所述重组载体B和重组载体C组成;
所述成套载体丙由所述重组载体A、所述重组载体B、所述重组载体C、重组载体D和重组载体E组成;
所述重组载体A为含有权利要求5或6中所述核酸分子A的重组载体;所述重组载体B为含有权利要求5或6中所述核酸分子B的重组载体;所述重组载体C为含有权利要求5或6中所述核酸分子C的重组载体;所述重组载体D为含有权利要求5或6中所述核酸分子D的重组载体;所述重组载体E为含有权利要求5或6中所述核酸分子E的重组载体;
(c6)成套表达盒,为成套表达盒甲或成套表达盒乙或成套表达盒丙;
所述成套表达盒甲由表达盒A和表达盒B组成;
所述成套表达盒乙由所述表达盒A、所述表达盒B和表达盒C组成;
所述成套表达盒丙由所述表达盒A、所述表达盒B、所述表达盒C、表达盒D和表达盒E组成;
所述表达盒A为含有权利要求5或6中所述核酸分子A的表达盒;所述表达盒B为含有权利要求5或6中所述核酸分子B的表达盒;所述表达盒C为含有权利要求5或6中所述核酸分子C的表达盒;所述表达盒D为含有权利要求5或6中所述核酸分子D的表达盒;所述表达盒E为含有权利要求5或6中所述核酸分子E的表达盒;
(c7)成套转基因细胞系,为成套转基因细胞系甲或成套转基因细胞系乙或成套转基因细胞系丙;
所述成套转基因细胞系甲由转基因细胞系A和转基因细胞系B组成;
所述成套转基因细胞系乙由所述转基因细胞系A、所述转基因细胞系B和转基因细胞系C组成;
所述成套转基因细胞系丙由所述转基因细胞系A、所述转基因细胞系B、所述转基因细胞系C、转基因细胞系D和转基因细胞系E组成;
所述转基因细胞系A为含有权利要求5或6中所述核酸分子A的转基因细胞系;所述转基因细胞系B为含有权利要求5或6中所述核酸分子B的转基因细胞系;所述转基因细胞系C为含有权利要求5或6中所述核酸分子C的转基因细胞系;所述转基因细胞系D为含有权利要求5或6中所述核酸分子D的转基因细胞系;所述转基因细胞系E为含有权利要求5或6中所述核酸分子E的转基因细胞系;
(c8)成套重组菌,为成套重组菌甲或成套重组菌乙或成套重组菌丙;
所述成套重组菌甲由重组菌A和重组菌B组成;
所述成套重组菌乙由所述重组菌A、所述重组菌B和重组菌C组成;
所述成套重组菌丙由所述重组菌A、所述重组菌B、所述重组菌C、重组菌D和重组菌E组成;
所述重组菌A为含有权利要求5或6中所述核酸分子A的重组菌;所述重组菌B为含有权利要求5或6中所述核酸分子B的重组菌;所述重组菌C为含有权利要求5或6中所述核酸分子C的重组菌;所述重组菌D为含有权利要求5或6中所述核酸分子D的重组菌;所述重组菌E为含有权利要求5或6中所述核酸分子E的重组菌。
8.一种构建用于合成薯蓣皂素的酵母工程菌的方法,包括如下步骤:对能够合成胆固醇的酵母菌进行改造,使其表达权利要求1中所述的蛋白质A、权利要求1中所述的蛋白质B以及细胞色素P450还原酶,改造后的酵母菌即为目的工程菌。
9.根据权利要求8所述的方法,其特征在于:所述能够合成胆固醇的酵母菌按照包括如下步骤的方法制备:对出发酵母菌进行改造,使其表达甾醇7位还原酶和甾醇24位还原酶,改造后的酵母菌即为所述能够合成胆固醇的酵母菌。
10.根据权利要求8所述的方法,其特征在于:所述方法包括如下步骤:将权利要求5或6中所述的核酸分子A、权利要求5或6中所述的核酸分子B以及所述细胞色素P450还原酶的编码基因导入所述能够合成胆固醇的酵母菌,得到表达所述蛋白质A、所述蛋白质B以及所述细胞色素P450还原酶的重组酵母菌,即为所述目的工程菌。
11.根据权利要求9所述的方法,其特征在于:所述能够合成胆固醇的酵母菌按照包括如下步骤的方法制备:将所述甾醇7位还原酶的编码基因和所述甾醇24位还原酶的编码基因导入所述出发酵母菌,得到表达所述甾醇7位还原酶和所述甾醇24位还原酶的重组酵母菌,即为所述能够合成胆固醇的酵母菌。
12.根据权利要求8所述的方法,其特征在于:所述细胞色素P450还原酶为权利要求2中所述的蛋白质C。
13.根据权利要求9所述的方法,其特征在于:所述甾醇7位还原酶为权利要求2中所述的蛋白质D。
14.根据权利要求9所述的方法,其特征在于:所述甾醇24位还原酶为权利要求2中所述的蛋白质E。
15.根据权利要求10所述的方法,其特征在于:所述细胞色素P450还原酶的编码基因为权利要求5或6中所述的核酸分子C。
16.根据权利要求11所述的方法,其特征在于:所述甾醇7位还原酶的编码基因为权利要求5或6中所述的核酸分子D。
17.根据权利要求11所述的方法,其特征在于:所述甾醇24位还原酶的编码基因为权利要求5或6中所述的核酸分子E。
18.根据权利要求10所述的方法,其特征在于:所述核酸分子A和所述核酸分子B以及所述细胞色素P450还原酶的编码基因被整合到所述能够合成胆固醇的酵母菌的基因组的Gal80位点。
19.根据权利要求11所述的方法,其特征在于:所述甾醇7位还原酶的编码基因和所述甾醇24位还原酶的编码基因被整合到所述出发酵母菌的基因组的Gal7位点。
20.工程菌,为利用权利要求8-19任一中所述方法制备得到的工程菌。
21.权利要求1所述的蛋白质或权利要求2所述的成套蛋白质或权利要求3或4所述的核酸分子或权利要求5或6所述的成套核酸分子或权利要求7所述的生物材料或权利要求20所述的工程菌在制备薯蓣皂素中的应用。
22.一种制备薯蓣皂素的方法,包括如下步骤:对权利要求20中所述的工程菌进行发酵培养,收集发酵产物;所述发酵产物中即含有薯蓣皂素。
CN201911021712.0A 2019-10-25 2019-10-25 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用 Active CN112708602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911021712.0A CN112708602B (zh) 2019-10-25 2019-10-25 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911021712.0A CN112708602B (zh) 2019-10-25 2019-10-25 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用

Publications (2)

Publication Number Publication Date
CN112708602A CN112708602A (zh) 2021-04-27
CN112708602B true CN112708602B (zh) 2022-04-05

Family

ID=75541389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911021712.0A Active CN112708602B (zh) 2019-10-25 2019-10-25 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用

Country Status (1)

Country Link
CN (1) CN112708602B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113817692B (zh) * 2021-08-27 2023-01-20 上海大学 薯蓣皂素合成相关蛋白、其编码基因及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101705275A (zh) * 2009-10-30 2010-05-12 陕西科技大学 薯蓣皂素生产工艺及提取薯蓣皂素后盾叶薯蓣的处理方法
CN109097343A (zh) * 2018-08-09 2018-12-28 中国科学院天津工业生物技术研究所 新月弯胞霉中甾类11β-羟化酶及其编码基因与应用
CN110396403A (zh) * 2018-04-24 2019-11-01 上海交通大学 靶向cyp1b1酶的近红外荧光探针及其制备和用途

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2357766A (en) * 1999-12-24 2001-07-04 Univ Wales Aberystwyth Production of heterologous proteins

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101705275A (zh) * 2009-10-30 2010-05-12 陕西科技大学 薯蓣皂素生产工艺及提取薯蓣皂素后盾叶薯蓣的处理方法
CN110396403A (zh) * 2018-04-24 2019-11-01 上海交通大学 靶向cyp1b1酶的近红外荧光探针及其制备和用途
CN109097343A (zh) * 2018-08-09 2018-12-28 中国科学院天津工业生物技术研究所 新月弯胞霉中甾类11β-羟化酶及其编码基因与应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
NP_001008645.1;NCBI;《NCBI》;20190324;全文 *
Q7SXF1.1;NCBI;《NCBI》;20190731;全文 *
The effect of crude diosgenin extract from purple and yellow greater yams (Dioscorea alata) on the lipid profile of dyslipidemia rats;Harijono等;《EMIRATES JOURNAL OF FOOD AND AGRICULTURE》;20160630;第28卷(第7期);全文 *
XP_002270732.2;NCBI;《NCBI》;20161122;全文 *
植物天然产物合成生物学研究;戴住波等;《中国科学院院刊》;20181120;第33卷(第11期);全文 *

Also Published As

Publication number Publication date
CN112708602A (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN109402212B (zh) 生物转化制备牛磺熊去氧胆酸的方法及其应用
CN109097343B (zh) 新月弯胞霉中甾类11β-羟化酶及其编码基因与应用
CN108060092B (zh) 一种重组菌及其用途
CN108085262B (zh) 对萜类或含萜精油耐受性提高或萜类产量提高的重组宿主细胞、其产生方法及其用途
CN111434773B (zh) 一种高产檀香油的重组酵母菌及其构建方法与应用
CN111205993B (zh) 生产熊果酸和齐墩果酸的重组酵母菌及其构建方法和应用
CN110607286B (zh) 灰树花麦角硫因基因Gfegt1和Gfegt2在合成麦角硫因中的应用
CN115011616B (zh) 一种乙醛脱氢酶基因rkaldh及其应用
CN110747178B (zh) 雷公藤细胞色素p450氧化酶在制备松香烷型二萜化合物中的应用
CN109097342B (zh) 蓝色犁头霉中甾类11β-羟化酶及其编码基因与应用
CN110628738B (zh) 提高葡萄糖氧化酶活性的方法、突变体及其应用
CN116987603A (zh) 一种高产***萜酚酸的重组酿酒酵母菌株及其构建方法与应用
CN112708602B (zh) 盾叶薯蓣来源的薯蓣皂素合成相关蛋白及编码基因与应用
CN108034667A (zh) 一种红色红曲霉α-淀粉酶基因、其制备方法及应用
JP2022530774A (ja) イソオイゲノールからのバニリンの生合成
CN107488638B (zh) 一种15α-羟化酶及其制备方法和应用
CN111334522B (zh) 生产龙涎香醇的重组酿酒酵母菌及构建方法
CN112080479A (zh) 一种17β-羟基类固醇脱氢酶突变体及其应用
CN109628476B (zh) 一种利用全细胞转化生产4-羟基异亮氨酸的方法
CN110904062B (zh) 一株高产l-丙氨酸的菌株
CN114854727A (zh) 生产原萜烷三萜的三萜环化酶及其编码序列、表达载体和应用
CN107287172B (zh) 一种利用大肠杆菌发酵生产胸苷磷酸化酶的方法
CN111808836B (zh) 耐热的i型普鲁兰酶的突变体酶及其制备方法与应用
CN115976118A (zh) 一种生物合成诺卡酮的方法及载体
CN115873836A (zh) 一种橙花叔醇合成酶及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant