CN115380109A - 用于将d-果糖生物转化为d-阿洛酮糖的d-阿洛酮糖3-差向异构酶 - Google Patents

用于将d-果糖生物转化为d-阿洛酮糖的d-阿洛酮糖3-差向异构酶 Download PDF

Info

Publication number
CN115380109A
CN115380109A CN202180026890.1A CN202180026890A CN115380109A CN 115380109 A CN115380109 A CN 115380109A CN 202180026890 A CN202180026890 A CN 202180026890A CN 115380109 A CN115380109 A CN 115380109A
Authority
CN
China
Prior art keywords
seq
ala
gly
leu
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180026890.1A
Other languages
English (en)
Inventor
毛国红
M·巴滕
T·J·汉利
P·宏特
刘红芳
骆洋
O·余
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Conagen Inc
Original Assignee
Conagen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Conagen Inc filed Critical Conagen Inc
Publication of CN115380109A publication Critical patent/CN115380109A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/24Preparation of compounds containing saccharide radicals produced by the action of an isomerase, e.g. fructose
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/84Pichia

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文提供了用于从广泛多种微生物中鉴定和分离编码具有D‑阿洛酮糖3‑差向异构酶活性的多肽的多核苷酸的方法。还提供了包含编码D‑阿洛酮糖3‑差向异构酶活性的多核苷酸的核酸构建体、载体和重组宿主细胞,以及用于使用具有D‑阿洛酮糖3‑差向异构酶活性的所述重组宿主细胞或具有D‑阿洛酮糖3‑差向异构酶活性的所述重组宿主细胞的D‑阿洛酮糖3‑差向异构酶酶由果糖生产阿洛酮糖的方法。

Description

用于将D-果糖生物转化为D-阿洛酮糖的D-阿洛酮糖3-差向异 构酶
相关申请
本申请根据35U.S.C.§119(e)要求2020年5月11日提交的标题为“D-ALLULOSE 3-EPIMERASES FOR BIOCONVERSION OF D-FRUCTOSE TO D-ALLULOSE”的美国临时申请号63/022,617的权益,其内容特此通过引用整体并入。
发明领域
本发明涉及一种使用D-阿洛酮糖3-差向异构酶酶由果糖生产D-阿洛酮糖的方法。本发明提供了具有D-阿洛酮糖3-差向异构酶活性的多肽,以及编码所述多肽的核酸分子。本发明还涉及包含载体的重组核酸构建体和包含重组核酸构建体的重组宿主细胞。
背景技术
D-阿洛酮糖(D-allulose),也称为D-阿洛酮糖(D-psicose),是一类结构类似于果糖的糖,果糖是水果中天然存在的糖。D-阿洛酮糖可以颗粒形式获得并且看起来像蔗糖晶体。阿洛酮糖是一种低热量甜味剂,具有蔗糖甜度的70%。根据美国食品和药品管理局(FDA),阿洛酮糖提供约0.4卡路里/克,显著低于蔗糖所提供的4卡路里/克。虽然人体有吸收阿洛酮糖的能力,但却缺乏代谢阿洛酮糖的能力。因此,阿洛酮糖对血糖或胰岛素水平几乎没有影响。由于这个原因,阿洛酮糖被认为是一种低热量甜味剂。
阿洛酮糖以极少的量天然存在于一些食物,诸如干果、红糖和枫糖浆中。阿洛酮糖难以化学合成,并且在本领域中存在对使用重组微生物由容易获得的糖诸如果糖生产阿洛酮糖的需要。
发明内容
来自酮糖3-差向异构酶家族的酶,包括D-阿洛酮糖3-差向异构酶(D-allulose 3-epimerase,DAE;也称为D-阿洛酮糖3-差向异构酶(D-psicose 3-epimerase,DPE)),可以催化D-果糖可逆地转化为D-阿洛酮糖。D-阿洛酮糖3-差向异构酶对于D-果糖向D-阿洛酮糖的生物转化可以具有高活性。本发明尤其提供了一种用于使用具有D-阿洛酮糖3-差向异构酶活性的重组多肽由D-果糖生产D-阿洛酮糖的方法。
在一个实施方案中,本发明方法涉及使果糖底物与包含酶***的反应混合物在使得D-果糖底物转化为D-阿洛酮糖的条件下接触,所述酶***包含具有D-阿洛酮糖3-差向异构酶酶活性的重组多肽。在本发明的一个方面,酶***提供了具有D-阿洛酮糖3-差向异构酶酶活性的重组多肽和作为底物的D-果糖以生产作为产物的D-阿洛酮糖。在本发明的另一方面,本发明方法可以包括使果糖底物与反应混合物接触,所述反应混合物包含能够表达外源性D-阿洛酮糖3-差向异构酶的宿主细胞或所述宿主细胞的裂解物作为D-阿洛酮糖3-差向异构酶酶的来源。在该实施方案的某些方面,酶***中存在的D-阿洛酮糖3-差向异构酶酶是纯化的酶,并且它可以使用本领域已知的一种或多种生化技术衍生自表达D-阿洛酮糖3-差向异构酶酶的宿主细胞的裂解物。在本发明的另一方面,D-阿洛酮糖3-差向异构酶的纯化形式固定化在固体支持物上。在各种实施方案中,本发明方法还可以包括向反应***中添加至少一种类型的金属离子。例如,金属离子可以选自由以下组成的组:镁离子、锰离子、铜离子、锌离子、镍离子、钴离子、铁离子、铝离子和钙离子。在一些优选实施方案中,向反应***中添加锰离子和/或镁离子。金属离子可以以约0.01mM至约5mM(例如,0.01mM、0.05mM、0.1mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、2mM、3mM、4mM或5mM)的浓度添加。在各个方面,本发明方法可以包括移除反应***中包含不含剩余果糖的阿洛酮糖的产物流。
在另一个实施方案中,本发明提供了编码具有D-阿洛酮糖3-差向异构酶活性的多肽的多核苷酸序列。在该实施方案的一个方面,将编码具有D-阿洛酮糖3-差向异构酶活性的多肽的多核苷酸克隆到具有所需调控元件诸如启动子和终止子的适当的质粒表达载体中。在一个方面,质粒表达载体具有诱导型启动子,从而可以通过使用某些化学品来诱导D-阿洛酮糖3-差向异构酶酶活性的表达。
在另一个实施方案中,使用包含编码具有D-阿洛酮糖3-差向异构酶活性的多肽的多核苷酸序列的表达质粒载体转化宿主细胞,包括原核微生物细胞或真核微生物细胞或真核动物细胞或真核植物细胞。在一个方面,转化的宿主细胞内的表达质粒载体作为自我复制的核酸实体存在。在该实施方案的另一方面,表达质粒载体被整合到宿主染色体DNA中。
在另一个实施方案中,本发明提供了一种用于在涉及D-阿洛酮糖3-差向异构酶的反应中回收不含作为底物的D-果糖的D-阿洛酮糖的方法。
在一些实施方案中,本文所述的生产阿洛酮糖的方法包括使果糖底物与反应混合物在使得果糖底物转化为阿洛酮糖的条件下接触,所述反应混合物包含:
(a)包含D-阿洛酮糖3-差向异构酶酶的酶***;
(b)用包含编码D-阿洛酮糖3-差向异构酶酶的核酸分子的重组载体转化的宿主细胞;和/或
(c)(b)的宿主细胞的裂解物,其中D-阿洛酮糖3-差向异构酶酶包含与选自由SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43组成的组的多肽具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)序列同一性的氨基酸序列。在一些实施方案中,反应混合物包含D-阿洛酮糖3-差向异构酶酶,所述酶包含与选自由SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25组成的组的多肽具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)序列同一性的氨基酸序列。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含与选自由SEQ ID NO:1、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25组成的组的多肽具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、00%或100%)序列同一性的氨基酸序列。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含与选自由SEQ ID NO:1、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25组成的组的多肽具有至少95%(例如,95%、96%、97%、98%、00%或100%)序列同一性的氨基酸序列。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的氨基酸序列。在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含SEQ ID NO:5的氨基酸序列。
在一些实施方案中,反应混合物包含D-阿洛酮糖3-差向异构酶酶,所述酶包含与选自由SEQ ID NO:3、SEQ ID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43组成的组的多肽具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)序列同一性的氨基酸序列。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含与选自由SEQ ID NO:3、SEQID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43组成的组的多肽具有至少90%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、00%或100%)序列同一性的氨基酸序列。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含与选自由SEQ ID NO:3、SEQID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43组成的组的多肽具有至少95%(例如,95%、96%、97%、98%、00%或100%)序列同一性的氨基酸序列。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶包含SEQ ID NO:3、SEQ ID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43的氨基酸序列。
在一些实施方案中,条件包括将酶***和果糖底物维持在25℃与75℃之间的温度下(例如,25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃或75℃)。
在一些实施方案中,条件包括将酶***和果糖底物维持在4与10之间的pH下(例如,4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10)。
在一些实施方案中,D-阿洛酮糖3-差向异构酶酶为分离形式。在一些实施方案中,D-阿洛酮糖3-差向异构酶酶固定化在固体基质上。
在一些实施方案中,反应混合物包含用包含编码D-阿洛酮糖3-差向异构酶酶的核酸分子的重组载体转化的宿主细胞或所述宿主细胞的裂解物,其中编码D-阿洛酮糖3-差向异构酶酶的核酸分子包含与选自由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42和SEQID NO:44组成的组的多核苷酸序列具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)序列同一性的多核苷酸序列。在一些实施方案中,编码D-阿洛酮糖3-差向异构酶酶的核酸分子包含SEQ ID NO:44的多核苷酸序列。
在一些实施方案中,宿主细胞选自由以下组成的组:酵母细胞、丝状真菌细胞、细菌细胞、哺乳动物细胞、植物细胞以及网粘菌纲(Labryinthulomycetes)细胞。在一些实施方案中,宿主细胞是大肠杆菌(E.coli)或巴斯德毕赤酵母(P.pastoris)。在一些实施方案中,重组载体在宿主细胞内作为自我复制的核酸分子存在。在一些实施方案中,重组载体被整合到宿主细胞染色体中。
在一些实施方案中,所述方法还包括向反应***中添加至少一种类型的金属离子,所述至少一种类型的金属离子选自由以下组成的组:镁离子、锰离子、铜离子、锌离子、镍离子、钴离子、铁离子、铝离子和钙离子。在一些实施方案中,金属离子以约0.01mM至约5mM(例如,0.01mM、0.05mM、0.1mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、2mM、3mM、4mM或5mM)的浓度添加。在一些实施方案中,所述方法还包括在果糖底物转化为阿洛酮糖时从反应***中移除包含阿洛酮糖的产物流。
附图说明
以下附图构成本说明书的一部分并且被包括在内以进一步展示本公开的某些方面,通过参考这些附图中的一个或多个并结合本文呈现的具体实施方案的详细描述可以更好地理解这些方面。
图1.通过D-阿洛酮糖3-差向异构酶(DAE)将D-果糖生物转化为D-阿洛酮糖。
图2A-2B.D-阿洛酮糖3-差向异构酶候选物的酶促筛选。将具有D-阿洛酮糖3-差向异构酶活性的纯化的候选重组多肽针对50mM磷酸盐缓冲液(pH 7.2)透析,并使用D-果糖作为底物测定D-阿洛酮糖合成。通常,重组多肽(5-10μg)在200μl体外反应***中进行测试。反应***含有20mM Tris-HCl缓冲液pH 8.0、3mM MgCl2或MnSO4、20g/L D-果糖。反应在60℃进行并且在2小时(图2A)和16小时(图2B)时通过加热10min终止反应。通过HPLC分析样品以确定D-果糖和D-阿洛酮糖的量。
图3.pHKA-AL39质粒构建体的图谱。
图4A-4B.由工程化的巴斯德毕赤酵母菌株产生的AL酶的鉴定和表征。图4A示出来自工程化的巴斯德毕赤酵母菌株的培养基的分泌性AL39酶的SDS-PAGE(16%)分析。AL39酶由箭头指示。M:蛋白质阶梯(Protein ladder);S:工程化的巴斯德毕赤酵母菌株的培养基样品(12μL)。图4B示出DAE活性。在反应1小时后分析培养基中果糖和阿洛酮糖的存在。
图5.固定化的AL39酶在重复使用循环(1-5)中的DAE活性比较。
具体实施方式
根据本发明的用于生产阿洛酮糖的方法包括使果糖底物与包含具有D-阿洛酮糖3-差向异构酶活性的多肽的反应混合物接触。D-果糖是优选底物并且D-阿洛酮糖3-差向异构酶是优选酶。根据本发明的反应混合物还可以包含一种或多种辅因子。在根据本发明的反应混合物中,二价阳离子是优选的辅因子。锰和镁是优选的二价阳离子并且它们可以分别以MgCl2和MnSO4的形式提供。其他合适的二价阳离子可以包括铜离子、锌离子、镍离子、钴离子、铁离子、铝离子和钙离子。在本发明的一个实施方案中,根据本发明使用的D-阿洛酮糖3-差向异构酶作为在合适缓冲液中的高度纯化的同源重组蛋白提供。在本发明的另一个实施方案中,根据本发明使用的D-阿洛酮糖3-差向异构酶作为固定化在固体支持物上的高度纯化的重组蛋白提供。在本发明的另一个实施方案中,反应混合物包含表达重组D-阿洛酮糖3-差向异构酶的重组原核细胞或重组真核细胞并且所述重组原核细胞或重组真核细胞用作D-阿洛酮糖3-差向异构酶的来源。
根据本发明的宿主细胞是适用于表达具有D-阿洛酮糖3-差向异构酶活性的异源蛋白质的任何细胞。这样的表达具有3-差向异构酶活性的异源蛋白质的宿主细胞是用包含编码具有D-阿洛酮糖3-差向异构酶活性的多肽的多核苷酸序列的重组质粒转化宿主细胞得到的,并且这样的宿主细胞在本发明中称为重组宿主细胞。适用于本发明的宿主细胞的列表包括但不限于细菌细胞、酵母细胞、植物细胞、动物细胞以及网粘菌纲细胞。在一些实施方案中,细胞***包括细菌细胞、酵母细胞或其组合。适用于本发明的细菌细胞包括但不限于埃希氏菌属物种(Escherichia spp.)、链霉菌属物种(Streptomyces spp.)、发酵单胞菌属物种(Zymomonas spp.)、醋杆菌属物种(Acetobacter spp.)、柠檬酸杆菌属物种(Citrobacter spp.)、集胞藻属物种(Synechocystis spp.)、根瘤菌属物种(Rhizobiumspp.)、梭菌属物种(Clostridium spp.)、棒状杆菌属物种(Corynebacterium spp.)、链球菌属物种(Streptococcus spp.)、黄单胞菌属物种(Xanthomonas spp.)、乳杆菌属物种(Lactobacillus spp.)、乳球菌属物种(Lactococcus spp.)、芽孢杆菌属物种(Bacillusspp.)、产碱杆菌属物种(Alcaligenes spp.)、假单胞菌属物种(Pseudomonas spp.)、气单胞菌属物种(Aeromonas spp.)、固氮菌属物种(Azotobacter spp.)、丛毛单胞菌属物种(Comamonas spp.)、分枝杆菌属物种(Mycobacterium spp.)、红球菌属物种(Rhodococcusspp.)、葡糖杆菌属物种(Gluconobacter spp.)、罗尔斯通氏菌属物种(Ralstonia spp.)、硫杆菌属物种(Acidithiobacillus spp.)、小月菌属物种(Microlunatus spp.)、地杆菌属物种(Geobacter spp.)、地芽胞杆菌属物种(Geobacillus spp.)、节杆菌属物种(Arthrobacter spp.)、黄杆菌属物种(Flavobacterium spp.)、沙雷氏菌属物种(Serratiaspp.)、糖多孢菌属物种(Saccharopolyspora spp.)、栖热菌属物种(Thermus spp.)、寡养单胞菌属物种(Stenotrophomonas spp.)、色杆菌属物种(Chromobacterium spp.)、中华根瘤菌属物种(Sinorhizobium spp.)、糖多孢菌属物种(Saccharopolyspora spp.)、土壤杆菌属物种(Agrobacterium spp.)、泛菌属物种(Pantoea spp.)以及需钠弧菌(Vibrionatriegens)。适用于本发明的酵母细胞包括但不限于工程化的酵母属物种(Saccharomyces spp.)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、耶氏酵母属(Yarrowia)、博伊丁假丝酵母(Candida boidinii)以及毕赤酵母属(Pichia)。
术语细胞培养物是指处于培养物中的任何一个或多个细胞,包括重组宿主细胞。培养是使细胞在受控条件下(通常在其自然环境之外)生长的过程。例如,细胞,诸如酵母细胞,可作为在液体营养肉汤中的细胞悬液生长。细胞培养物包括但不限于细菌细胞培养物、酵母细胞培养物、植物细胞培养物和动物细胞培养物。
在一些实施方案中,在16℃至40℃的温度下培养细胞。例如,可在16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃或40℃的温度下培养细胞。
在一些实施方案中,将细胞培养12小时至72小时或更长的时间段。例如,可将细胞培养12、18、24、30、36、42、48、54、60、66或72小时的时间段。通常,将细胞,诸如细菌细胞,培养12至24小时的时间段。在一些实施方案中,将细胞在37℃的温度下培养12至24小时。在一些实施方案中,将细胞在16℃的温度下培养12至24小时。
在一些实施方案中,将细胞培养至每毫升细胞培养基1x108(OD600<1)至2x1011(ODˉ200)个活细胞的密度。在一些实施方案中,将细胞培养至1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011或2x1011个活细胞/毫升的密度。(转化因子:OD 1=8x108个细胞/毫升)。
为了诱导宿主细胞表达蛋白质,添加0.5mM的异丙基β-D-1-硫代半乳糖苷(IPTG),并使培养物在16℃下进一步生长22hr。通过离心(3,000x g;10min;4℃)收获细胞。收集细胞沉淀并立即使用或储存于-80℃。
在一些实施方案中,从表达具有D-阿洛酮糖3-差向异构酶活性的多肽的宿主细胞收获细胞沉淀。在一些实施方案中,可以各种浓度重悬宿主细胞沉淀。在一些实施方案中,以1g/L至250g/L的浓度重悬宿主细胞沉淀。在一些实施方案中,将从细胞***收获的宿主细胞沉淀以1g/L、10g/L、25g/L、50g/L、75g/L、100g/L、125g/L、150g/L、175g/L、200g/L、225g/L或250g/L的浓度重悬。
如本文所用,术语“孵育(incubating)”和“孵育(incubation)”是指将两种或更多种化学或生物实体或至少一种化学实体和至少一种生物实体(诸如化合物和酶)混合并允许它们在有利于产生如本文所述的产物诸如D-阿洛酮糖的条件下相互作用的过程。
术语“下游分离过程”是指从原始底物D-果糖中回收最终产物D-阿洛酮糖。当果糖在酶促反应中用作底物以产生D-阿洛酮糖时,果糖在反应中并未完全消耗,并且在酶促反应结束时,反应介质中仍存在大量果糖。D-果糖和D-阿洛酮糖具有相似的物理和化学性质,并且在包括D-阿洛酮糖3-差向异构酶和作为底物的果糖的酶促反应结束时很难将它们分开。回收不含D-果糖的D-阿洛酮糖的一种可能的方式是将剩余的果糖转化为甘露糖醇并将D-阿洛酮糖与甘露糖醇分开。NADPH或NADH依赖性甘露糖醇脱氢酶可以用于将D-果糖转化为甘露糖醇。甘露糖醇脱氢酶可以连同甲酸脱氢酶一起在双酶***中使用,以再生甘露糖醇脱氢酶的作用所需要的还原辅因子NADH。甲酸脱氢酶将甲酸盐转化为二氧化碳并将NAD还原为NADH。甘露糖醇可以通过冷结晶从水溶液中结晶出来,并且可以以不含D-果糖的形式回收D-阿洛酮糖。(Saha,B.C.和Racine,F.M.(2011)Biotechnological production ofmannitol and its applications.Appl Microbiol Biotechnol.89:879–891;美国专利号10266862B2)。
术语固定化是指使用本领域众所周知的一种或其他方法将表达D-阿洛酮糖3-差向异构酶的宿主细胞或具有D-阿洛酮糖3-差向异构酶活性的纯化多肽结合至固体支持物。源自海藻的海藻酸钠可以用作固体支持物以固定化表达D-阿洛酮糖3-差向异构酶的宿主细胞或具有D-阿洛酮糖3-差向异构酶活性的纯化多肽,如专利文件US2019169591A1中所详细描述的。
术语“核酸”和“核苷酸”根据本领域普通技术人员所理解的它们各自的普通和习惯含义使用,并且不受限制地用于指代单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。除非特别限定,否则该术语涵盖含有天然核苷酸的已知类似物的核酸,其具有与参考核酸相似的结合特性并且以与天然存在的核苷酸相似的方式代谢。除非另外指明,否则具体核酸序列还隐含地涵盖其保守修饰或简并变体(例如,简并密码子取代)和互补序列,以及明确指明的序列。
术语“多肽”、“蛋白质”和“肽”根据本领域普通技术人员所理解的它们各自的普通和习惯含义使用;这三个术语有时可互换使用,并且不受限制地用于指代氨基酸聚合物或氨基酸类似物,无论其大小或功能如何。尽管“蛋白质”通常关于相对较大的多肽使用,而“肽”通常关于小多肽使用,但这些术语在本领域中的用法是重叠和变化的。如本文所用,术语“多肽”是指肽、多肽和蛋白质,除非另外指明。当提及多肽产物时,术语“蛋白质”、“多肽”和“肽”在本文中可互换使用。因此,示例性多肽包括多肽产物、天然存在的蛋白质、同源物、直系同源物、旁系同源物、片段以及前述各项的其他等效物、变体和类似物。
多肽或蛋白质的术语“功能片段”是指作为全长多肽或蛋白质的一部分的肽片段,并且其具有与全长多肽或蛋白质基本上相同的生物学活性,或执行基本上相同的功能(例如,进行相同的酶促反应)。
术语“功能变体”还包括保守取代变体。术语“保守取代变体”是指所具有的氨基酸序列与参考肽相差一个或多个保守氨基酸取代并保持参考肽的一些或全部活性的肽。“保守氨基酸取代”是用功能相似的残基取代氨基酸残基。保守取代的实例包括用一个非极性(疏水性)残基(诸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸)取代另一个残基;用一个带电或极性(亲水性)残基取代另一个残基,诸如在精氨酸与赖氨酸之间、在谷氨酰胺与天冬酰胺之间、在苏氨酸与丝氨酸之间;用一个碱性残基(诸如赖氨酸或精氨酸)取代另一个残基;或用一个酸性残基(诸如天冬氨酸或谷氨酸)取代另一个残基;或用一个芳香族残基(诸如苯丙氨酸、酪氨酸或色氨酸)取代另一个残基。预期此类取代对蛋白质或多肽的表观分子量或等电点几乎没有影响。短语“保守取代变体”还包括其中残基被化学衍生的残基替换的肽,条件是所得的肽保持如本文所述的参考肽的一些或全部活性。
与主题技术的多肽有关的术语“变体”还包括所具有的氨基酸序列与参考多肽的氨基酸序列具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%以及甚至100%同一性的功能活性多肽。
术语“同源”在其所有语法形式和拼写变型中是指具有“共同进化起源”的多核苷酸或多肽之间的关系,包括来自超家族的多核苷酸或多肽以及来自不同物种的同源多核苷酸或蛋白质(Reeck等人,Cell 50:667,1987)。此类多核苷酸或多肽具有序列同源性,正如它们的序列相似性所反映的,无论是就同一性百分比还是特定氨基酸或基序在保守位置的存在而言。例如,两个同源多肽可以具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%以及甚至100%相同的氨基酸序列。
关于主题技术的变体多肽序列的“氨基酸序列同一性百分比(%)”是指在比对序列并引入空位(如果需要的话)以实现最大的序列同一性百分比之后,并在不将任何保守取代视为序列同一性的一部分的情况下,候选序列中与参考多肽的氨基酸残基相同的氨基酸残基的百分比。
用于确定氨基酸序列同一性百分比的比对可以通过本领域技术范围内的多种方式实现,例如,使用可公开获得的计算机软件诸如BLAST、BLAST-2、ALIGN、ALIGN-2或Megalign(DNASTAR)软件。本领域技术人员可以确定用于测量比对的适当参数,包括在所比较序列的全长上实现最大比对所需要的任何算法。例如,可使用序列比较程序NCBI-BLAST2确定%氨基酸序列同一性。NCBI-BLAST2序列比较程序可从ncbi.nlm.nih.gov.下载。NCBIBLAST2使用若干检索参数,其中所有那些检索参数都设置为默认值,包括例如无屏蔽是(unmask yes)、链=全部(strand=all)、期望发生(expected occurrences)10、最小低复杂度长度(minimum low complexity length)=15/5、多遍e值(multi-pass e-value)=0.01、多遍常数(constant for multi-pass)=25、最终空位化比对的下降值(drop offfor final gapped alignment)=25以及评分矩阵=BLOSUM62。在使用NCBI-BLAST2进行氨基酸序列比较的情况下,给定氨基酸序列A与、和,或对给定氨基酸序列B的%氨基酸序列同一性(可以替代地表述为给定氨基酸序列A与、和,或对给定氨基酸序列B具有或包括一定的%氨基酸序列同一性)计算如下:100乘以分数X/Y,其中X是在NCBI-BLAST2程序的A和B比对时通过该序列比对程序评为相同配对的氨基酸残基的数目;并且其中Y是B中的氨基酸残基的总数。应当理解,当氨基酸序列A的长度不等于氨基酸序列B的长度时,A与B的%氨基酸序列同一性将不等于B与A的%氨基酸序列同一性。
用于确定氨基酸序列“相似性”的技术是本领域众所周知的。一般而言,“相似性”是指两个或更多个多肽在适当位置的精确氨基酸与氨基酸比较,其中氨基酸是相同的或具有相似的化学和/或物理性质,诸如电荷或疏水性。然后可确定所比较的多肽序列之间的“相似性百分比”。用于确定核酸和氨基酸序列同一性的技术也是本领域众所周知的,并且包括确定所述基因的mRNA的核苷酸序列(通常通过cDNA中间体)和确定其中编码的氨基酸序列,并将其与第二氨基酸序列相比较。一般而言,“同一性”是指两个多核苷酸或多肽序列相应的精确的核苷酸与核苷酸或氨基酸与氨基酸对应。可以通过确定它们的“同一性百分比”来比较两个或更多个多核苷酸序列,两个或更多个氨基酸序列也可以这样。Wisconsin序列分析软件包版本8(可从Genetics Computer Group,Madison,Wis.获得)中可获得的程序,例如GAP程序,能够分别计算两个多核苷酸之间的同一性以及两个多肽序列之间的同一性和相似性。用于计算序列之间的同一性或相似性的其他程序是本领域技术人员已知的。
“对应于”参考位置的氨基酸位置是指与参考序列对齐的位置,如通过比对氨基酸序列所鉴定的。此类比对可以手动完成,或可以使用众所周知的序列比对程序(诸如ClustalW2、Blast 2等)完成。
除非另外指明,否则两个多肽或多核苷酸序列的同一性百分比是指在两个序列中的较短序列的整个长度上相同氨基酸残基或核苷酸的百分比。
如本文所用,术语“表达”根据本领域普通技术人员所理解的其普通和***。
“转化”根据本领域普通技术人员所理解的其普通和习惯含义使用,并且不受限制地用于指代将多核苷酸转移到靶细胞中。转移的多核苷酸可以掺入靶细胞的基因组或染色体DNA中,从而导致基因稳定遗传,或者它可以独立于宿主染色体DNA进行复制。含有转化的核酸片段的宿主生物体被称为“转基因的”或“重组的”或“转化的”生物体。
术语“转化的”、“转基因的”和“重组的”当在本文中与宿主细胞结合使用时,根据本领域普通技术人员所理解的它们的普通和习惯含义使用,并且不受限制地用于指代其中已引入异源核酸分子的宿主生物体的细胞,诸如植物或微生物细胞。核酸分子可以稳定地整合到宿主细胞的基因组中,或者核酸分子可以作为染色体外分子存在。这样的染色体外分子可以自我复制。转化的细胞、组织或受试者被理解为不仅包括转化过程的最终产物,而且还包括其转基因后代。
术语“重组的”、“异源的”和“外源的”,当在本文中与多核苷酸结合使用时,根据本领域普通技术人员所理解的它们的普通和习惯含义使用,并且不受限制地用于指代源自对于特定宿主细胞而言为外来的来源或者如果源自相同的来源,则由其原始形式修饰得到的多核苷酸(例如,DNA序列或基因)。因此,宿主细胞中的异源基因包括对于特定宿主细胞而言为内源的但已通过例如使用定点诱变或其他重组技术进行修饰的基因。该术语还包括天然存在的DNA序列的非天然存在的多个拷贝。因此,所述术语是指对于细胞而言是外来的或异源的,或与细胞同源但在宿主细胞内处于通常不存在该元件的位置或形式的DNA链段。
类似地,术语“重组的”、“异源的”和“外源的”,当在本文中与多肽或氨基酸序列结合使用时,是指源自对于特定宿主细胞而言为外来的来源,或者如果源自相同来源,则由其原始形式修饰得到的多肽或氨基酸序列。因此,重组DNA链段可以在宿主细胞中表达以产生重组多肽。
术语“质粒”、“载体”和“盒”根据本领域普通技术人员所理解的它们的普通和习惯含义使用,并且不受限制地用于指代常常携带不是细胞中心代谢的一部分的基因并且通常为环状双链DNA分子形式的染色体外元件。此类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组为独特构造,所述独特构造能够将所选基因产物的启动子片段和DNA序列连同适当的3’非翻译序列一起引入细胞中。“转化盒”是指含有外来基因并且除了外来基因之外还具有有利于转化特定宿主细胞的元件的特定载体。“表达盒”是指含有外来基因并且除了外来基因之外还具有使得所述基因在外来宿主中的表达增强的元件的特定载体。
本文使用的标准重组DNA和分子克隆技术是本领域众所周知的,并且描述于,例如,Sambrook,J.、Fritsch,E.F.和Maniatis,T.Molecular Cloning:A LaboratoryManual,第2版;Cold Spring Harbor Laboratory:Cold Spring Harbor,N.Y.,1989(下文为“Maniatis”);和Silhavy,T.J.、Bennan,M.L.和Enquist,L.W.Experiments with GeneFusions;Cold Spring Harbor Laboratory:Cold Spring Harbor,N.Y.,1984;以及Ausubel,F.M.等人,在Current Protocols in Molecular Biology中,由GreenePublishing and Wiley-Interscience出版,1987;在与本文一致的范围内,它们中的每一个的全部内容特此通过引用并入本文。
除非另外定义,本文所用的所有技术和科学术语均具有与本公开所属领域中的普通技术人员通常所理解的相同含义。虽然在本公开的实践或测试中可使用类似于或等效于本文所描述的那些方法和材料的任何方法和材料,但下文描述优选的方法和材料。
实施例
实施例1:构建用于表达D-阿洛酮糖3-差向异构酶的质粒载体
D-阿洛酮糖3-差向异构酶(DAE)具有将D-果糖转化为D-阿洛酮糖的能力(图1)。为了鉴定使用D-果糖作为底物产生D-阿洛酮糖的特定D-阿洛酮糖3-差向异构酶酶,使用多基因(polygenetic)和BLAST分析鉴定了编码具有D-阿洛酮糖3-差向异构酶活性的多肽的多核苷酸序列。所有候选的D-阿洛酮糖3-差向异构酶基因的全长DNA片段都是商业合成的。将几乎所有的cDNA密码子都变成大肠杆菌(E.coli)偏好的那些(Twist Bioscience,CA)。将合成DNA克隆到细菌表达载体中以生成表达构建体。
实施例2:重组大肠杆菌细胞中D-阿洛酮糖3-差向异构酶酶活性的测量
将如实施例1中那样制备的具有编码具有D-阿洛酮糖3-差向异构酶活性的多肽的多核苷酸的各表达载体构建体转化到大肠杆菌T7表达细胞(Biolabs,MA)中,随后使所述细胞在含有50μg/mL氨苄青霉素的Terrific Broth培养基中在37℃下生长,直到达到0.8-1.0的OD600。通过添加0.5mM异丙基β-D-1-硫代半乳糖苷(IPTG)诱导蛋白质表达,并使培养物在16℃下进一步生长22hr。通过离心(3,000x g;10min;4℃)收获细胞。收集细胞沉淀并立即使用或储存于-80℃。
通过提取缓冲液(BugBuster Master Mix,EMD Millipore,US)提取细胞沉淀。离心后,将上清液添加到反应混合物中用于活性测定。通常,上清液(5μl)在200μl体外反应***中进行测试。反应***含有20mM Tris-HCl缓冲液pH 8.0、1mM MgCl2或MnSO4、10g/L D-果糖。反应在60℃下进行并且通过加热10min终止反应。通过HPLC分析样品。
D-果糖和D-阿洛酮糖的浓度通过配备有RefractorMax521检测器(IDEX Health&Science KK,Japan)的HPLC***(Vanquish,Thermo Scientific,USA)确定。使用RezexRCM-单糖Ca2+柱(100x7.8mm,Phenomenex,CA)进行色谱分离。柱在80℃下用水以0.5ml/min的流速洗脱。通过对D-阿洛酮糖3-差向异构酶酶活性的分析,共鉴定了21种具有将D-果糖生物转化为D-阿洛酮糖的适当酶活性的候选D-阿洛酮糖3-差向异构酶酶(表1)。
实施例3:重组D-阿洛酮糖3-差向异构酶的纯化
为了纯化重组蛋白,通常将细胞沉淀重悬于裂解缓冲液(50mM磷酸钾缓冲液pH7.2、25mg/ml溶菌酶、5mg/ml DNA酶I、20mM咪唑、500mM NaCl、10%甘油和0.4%Triton X-100)中。在4℃下通过超声破碎细胞,并通过离心(18,000xg;30min)澄清细胞碎片。将上清液加载到用含有50mM磷酸钾缓冲液pH 7.2、20mM咪唑、500mM NaCl和10%甘油的平衡缓冲液平衡的亲和柱Ni-NTA(Qiagen)中。加载蛋白质样品后,用平衡缓冲液洗涤柱以去除未结合的污染蛋白。具有D-阿洛酮糖3-差向异构酶活性的带His标签的重组多肽用含有250mM咪唑的平衡缓冲液洗脱。
将具有D-阿洛酮糖3-差向异构酶活性的纯化的候选重组多肽针对50mM磷酸盐缓冲液(pH 7.2)透析,并使用D-果糖作为底物测定D-阿洛酮糖合成。通常,重组多肽(5-10μg)在200μl体外反应***中进行测试。反应***含有20mM Tris-HCl缓冲液pH 8.0、3mM MgCl2或MnSO4、20g/L D-果糖。反应在60℃进行并且在2小时和16小时时通过加热10min终止反应。通过HPLC分析样品。
这些具有D-阿洛酮糖3-差向异构酶活性的候选重组多肽具有产生阿洛酮糖的不同酶活性,并且对二价金属因子的偏好不同。如图2A-2B所示,所有选定的候选物在2hr时具有D-阿洛酮糖3-差向异构酶活性(图2A)并且当反应延长至16hr时可以产生更多的D-阿洛酮糖(图2B)。与添加Mg2+相比,添加Mn2+可以增加大多数酶(AL28、35、39、42、50和51)的活性,表明这些酶偏好Mn2+辅因子。
实施例4:生成工程化的巴斯德毕赤酵母菌株以产生DAE酶
合成了AL39基因的全长DNA片段(SEQ ID NO:43)以用于转化巴斯德毕赤酵母细胞。具体而言,针对巴斯德毕赤酵母表达对cDNA进行密码子优化以产生AL39酶(SEQ ID NO:5)。将AL39基因***具有α交配因子信号肽的框中。使用EcoRI和NotI限制性消化,将合成的融合基因克隆到pHKA载体(修饰的巴斯德毕赤酵母表达载体)中。在表达质粒(pHKA-AL39,图3)中,表达盒含有AOX1启动子、α-交配因子信号肽、AL39基因以及AOX1转录终止子。
使用本领域已知的方法(Lin-Cereghino等人,Biotechniques,38(1):44-48,2005)将线性化的pHKA-AL39质粒转化到巴斯德毕赤酵母(GS115)细胞中,并将表达盒整合到巴斯德毕赤酵母基因组中的HIS4基因座处。
为了证明分泌性AL39酶的产生,将巴斯德毕赤酵母菌株pHKA-AL39的单个菌落接种在带挡板烧瓶中的BMGY培养基中,并使其在振荡培养箱(250-300rpm)中在28-30℃下生长,直到培养物达到2-6的OD600(对数期生长)。通过离心收获pHKA-AL39细胞并在BMMY培养基中重悬至OD600为1.0以诱导表达。每24小时向BMMY培养基中添加100%甲醇至最终浓度为1%甲醇,以维持表达的诱导。通过离心收获来自pHKA-AL39培养物的培养基并如下所述对其进行DAE活性分析和SDS-PAGE分析。
离心后,将上清液添加到反应混合物中用于活性测定。通常,上清液(65μl)在200μl体外反应***中进行测试。反应***含有20mM Tris-HCl缓冲液pH 8.0、1mM MnSO4、30g/LD-果糖。反应在55-60℃下进行并且通过加热10min终止反应。通过HPLC分析样品。
D-果糖和D-阿洛酮糖的浓度通过配备有RefractorMax521检测器(IDEX Health&Science KK,Japan)的HPLC***(Vanquish,Thermo Scientific,USA)确定。使用RezexRCM-单糖Ca2+柱(100x7.8mm,Phenomenex,CA)进行色谱分离。柱在80℃下用水以0.5ml/min的流速洗脱。
通过SDS-PAGE分析确定AL39蛋白的存在(图4A)。使用本领域已知的方法通过SDS-PAGE分离培养基样品(Laemmli,Nature,227(5259):680-685,1970)。所产生的AL39蛋白在用染色溶液染色后可见。基于SDS-PAGE分析,所产生的AL39是培养基样品中的主要蛋白质(图4A)。
在SDS-PAGE和DAE活性筛选后,最佳菌株被鉴定为具有高分泌性AL39酶产量。所产生的AL39酶具有将D-果糖生物转化为D-阿洛酮糖的活性。如图4A所示,通过SDS-PAGE分析可以在发酵培养基中检测到所产生的AL39蛋白,表明所产生的AL39酶可以分泌到工程化的巴斯德毕赤酵母菌株的细胞外空间。通过离心去除细胞沉淀后,可以很容易地从发酵培养基中收集和浓缩所产生的酶。可以在培养基样品中检测到DAE活性。如图4B所示,反应1hr后,大约25%的果糖可以转化为阿洛酮糖。
实施例5:使用固定化的DAE酶的生物转化
酶固定化为增加酶对其底物的可获得性提供了优异的基础,并且在相当长的时间段内具有更大的周转率。下文描述一种用于有效产生固定化的D-阿洛酮糖差向异构酶的方法,所述酶对于果糖向阿洛酮糖的生物转化具有高活性和优异的持久性。
通过过滤浓缩AL39蛋白。将所提取的AL39溶解到20mM磷酸盐缓冲液(pH 8.0)中以用于固定化。一个单位的DAE活性定义为在pH8.0和55℃下每分钟催化形成1μmol D-阿洛酮糖的酶量。固定化的DAE酶的比活性定义为每毫克酶的单位。
将所制备的AL39蛋白与水预处理的离子交换树脂(LXP-505,SUNRESIN)在20mM磷酸盐缓冲液(pH 8.0)中混合并在反应器中在25℃下缓慢搅拌24小时。随后,去除上清液,并将所得混合物用20mM磷酸盐缓冲液(pH 8.0)洗涤以获得固定化的DAE酶。
将固定化的DAE酶添加到反应混合物中用于活性测定。固定化的酶在1ml体外反应***中进行测试。反应***含有20mM磷酸盐缓冲液pH 8.0、1mM MnSO4、500g/L D-果糖。反应在55℃进行并且通过加热10min终止反应。通过HPLC分析样品。3小时后,固定化的酶将多于23%的果糖转化为阿洛酮糖。
为了确定AL39在使用后是否能够保持活性,测试了固定化的AL39的重复使用循环。在含有20mM磷酸盐缓冲液(pH 8.0)、1mM MnSO4、500g/L D-果糖的1L反应液中添加180mg固定化的AL39。反应在55℃进行。反应5小时后,通过过滤收集固定化的酶。通过HPLC分析上清液以测量阿洛酮糖的产生,并用20mM磷酸盐缓冲液(pH 8.0)洗涤固定化的酶5次以用于下一循环反应。5个循环后,比较每个循环的活性。如图5所示,与第一循环相比,固定化的AL39的活性在第五循环仅损失10.76%,表明固定化的AL39对于阿洛酮糖的生物转化是稳定的。
参考文献:
1.Lin-Cereghino J,Wong WW,Xiong S,et al.Condensed protocol forcompetent cell preparation and transformation of the methylotrophic yeastPichia pastoris.Biotechniques.2005;38(1):44-48.
2.Laemmli,U.K.(1970).″Cleavage of Structural Proteins during theAssembly of the Head of Bacteriophage T4″.Nature.227(5259):680-685.
Figure BDA0003875822340000201
Figure BDA0003875822340000211
序列信息
SEQ ID NO:1;蛋白质;西尔瓦诺斯亚栖热菌
MPRFGAHAFIWAAEWNPEAAEKVIQGATRVGLDFVEIPLLHPESFDVELTRRLLNGYGVGCTCSLGLPREASLPEHPEAATRFLIQALNVAHQIGSEVLTGVTYATLGTLSGRAPREADYQAVVKALKPAARHAAALGMRLGIEPVNRYETYLINLAAQGLELIRRLDEPNVFLHLDTYHMNIEEKGFRGPIVEAGAHLGYIHLSESDRGTPGTGNVHWDAVFAGLREIGFSGDLVMESFVALNPDIARATCMWRDVVGDPQALVQEGLAFLRGKASEYGLLG
SEQ ID NO:2;DNA;西尔瓦诺斯亚栖热菌
ATGCCACGCTTCGGAGCTCATGCGTTCATTTGGGCCGCTGAGTGGAACCCGGAAGCGGCAGAGAAAGTGATTCAGGGTGCAACCCGTGTTGGCCTCGACTTCGTTGAAATTCCGCTCTTGCACCCGGAATCCTTCGATGTCGAGCTCACACGTCGTTTACTAAACGGGTACGGCGTCGGTTGTACGTGTTCTCTGGGCTTGCCGCGTGAAGCGTCCCTGCCGGAGCACCCCGAAGCCGCGACTCGTTTTCTGATTCAGGCCCTGAATGTTGCACATCAGATTGGCTCAGAGGTGCTGACCGGGGTAACCTACGCGACTTTAGGCACTTTATCTGGCCGGGCGCCGCGCGAAGCTGATTATCAAGCAGTCGTAAAAGCACTGAAACCGGCGGCTAGACATGCAGCAGCACTGGGTATGCGCCTCGGCATTGAACCCGTTAATCGTTATGAAACTTATTTAATTAACCTGGCCGCTCAGGGCCTGGAGTTAATCCGTCGTCTGGACGAACCGAATGTGTTCCTGCACCTGGATACGTACCACATGAATATTGAAGAGAAAGGTTTCCGGGGCCCGATCGTGGAAGCGGGCGCCCACCTGGGGTATATTCATCTGAGCGAGAGTGATCGCGGCACCCCTGGAACGGGCAACGTCCATTGGGACGCGGTGTTCGCGGGGCTGCGTGAAATTGGCTTCTCAGGCGATTTGGTCATGGAAAGCTTCGTCGCACTGAACCCTGATATTGCGCGCGCTACATGCATGTGGCGGGACGTCGTTGGCGATCCCCAGGCGCTGGTCCAGGAAGGCTTAGCATTTCTCCGTGGCAAGGCTAGCGAGTATGGCCTACTCGGTtaa
SEQ ID NO:3;蛋白质;深海热泉宏基因组
MEGFGVHTSMWTMSWDKKGAEYAVSQAVRYQMDFLEIALLSPLDVDAQHSRRLLEKNHMRAICSLGLPEGAWLSNNPQAGVEYLKIALEKTAEMGCEALSGVIYGGIGERTGFPPTEKELDNVVRALGEAASYAKSLGLLLGIEPVNRYESHLINTGRQSVEMIEKVGASNMFVHLDTYHMNIEEKGVAQGILDAREHIKYIHLSESDRGTPGAGTCDWDEIFAVLAAINFKGGLAMESFVNMPPEIAYGLSIWRPVAKSADEVMENGLPFLRNKARQYQLL
SEQ ID NO:4;DNA;深海热泉宏基因组
ATGGAAGGTTTTGGAGTGCACACGAGCATGTGGACTATGAGTTGGGATAAGAAGGGTGCGGAGTATGCTGTAAGCCAGGCGGTGCGCTATCAGATGGATTTTCTTGAAATCGCTCTGCTGAGTCCACTGGATGTCGATGCCCAGCATAGTCGCCGTCTGCTAGAGAAGAACCACATGCGCGCGATTTGCAGCCTTGGGTTACCGGAAGGTGCGTGGCTCAGTAATAACCCTCAGGCCGGAGTGGAATACCTGAAGATCGCCCTGGAAAAGACTGCGGAGATGGGTTGCGAAGCGCTGTCCGGCGTAATCTACGGCGGCATTGGCGAAAGAACAGGTTTTCCGCCGACGGAGAAAGAGCTGGACAATGTCGTGCGCGCGCTGGGTGAAGCGGCATCTTACGCAAAATCGTTAGGCCTTCTGCTCGGTATTGAACCGGTGAACCGGTATGAGTCTCATCTGATTAATACGGGACGTCAGAGTGTGGAAATGATTGAAAAGGTCGGTGCCTCTAACATGTTTGTTCACCTTGACACATACCACATGAATATTGAAGAAAAGGGTGTGGCACAAGGGATTCTGGACGCGCGCGAACACATAAAATATATCCACCTGTCAGAGTCTGACCGAGGGACTCCGGGCGCAGGCACGTGTGACTGGGATGAGATTTTCGCAGTCCTGGCCGCAATTAACTTTAAAGGCGGCTTAGCGATGGAATCGTTCGTGAACATGCCGCCGGAAATTGCCTATGGTCTGTCCATTTGGCGTCCGGTGGCTAAATCGGCTGATGAAGTCATGGAAAACGGCCTGCCGTTTCTACGCAACAAAGCGCGCCAGTATCAGCTGCTGtaa
SEQ ID NO:5;Protein;污泥嗜热梭菌
MKYGIFYAYWEKEWKGDFITYIEKVKKLGFDILEVGCGDFHKQPDSYFHTLRDAAREYDIILTGGYGPRAEHNLCSPDTAVVENALAFYSDIFRKMEIAGIRSIGGGLYAYWPVDYSREPDKAGDLERSIKNMRRLADIAERHGITLNMEVLNRFEGYLINDTNEGLAYIRAVDKPNVKLMLDTFHMNIEEDSFTEPILQAGKYLGHVHVGEPNRKPPREGRIPWGEIGKALRQIGYDGPVVMEPFVTMGGQVGKDICVWRDLSQGATEEDLDRDAEKSLAFLKGMFEA
SEQ ID NO:6;DNA;污泥嗜热梭菌
ATGAAATATGGTATATTTTACGCATATTGGGAGAAAGAATGGAAAGGCGACTTTATCACATACATTGAGAAAGTTAAGAAATTAGGCTTTGACATTTTGGAAGTCGGCTGCGGTGATTTTCATAAACAGCCGGATTCATACTTCCACACCCTGCGTGATGCCGCTCGCGAATACGACATTATTCTGACCGGCGGCTATGGGCCGCGCGCCGAACACAACTTGTGTAGCCCGGATACAGCGGTCGTTGAAAATGCCCTGGCATTTTACTCCGATATATTTCGCAAAATGGAAATTGCCGGCATCCGTTCGATCGGCGGCGGTCTATATGCGTATTGGCCAGTTGATTACAGCCGTGAACCCGACAAAGCCGGCGATTTAGAACGTTCCATTAAGAACATGCGTCGCTTAGCCGATATTGCGGAACGGCATGGTATCACGCTGAATATGGAAGTGCTCAATCGCTTCGAAGGTTACCTTATTAATGATACCAATGAAGGTCTGGCCTACATTCGTGCCGTCGATAAACCCAACGTAAAGTTGATGCTGGATACATTTCACATGAACATTGAGGAAGATAGCTTTACCGAACCCATTCTCCAGGCTGGTAAGTACCTGGGCCATGTACATGTCGGCGAACCAAATCGTAAACCACCACGGGAAGGTCGTATTCCGTGGGGCGAGATTGGCAAAGCGCTGCGCCAGATTGGGTACGACGGTCCCGTGGTGATGGAACCGTTTGTTACCATGGGCGGCCAAGTGGGGAAAGACATTTGTGTGTGGCGGGACCTTAGCCAAGGTGCGACCGAAGAAGATCTGGATCGCGATGCTGAGAAAAGCCTGGCCTTTCTGAAAGGAATGTTTGAAGCCtaa
SEQ ID NO:7;蛋白质;深海热泉宏基因组
MNLPAKKMVLGVHTFAVAPFWDLEVMRHEARRLKSHGVGLLEIPLLRPEEINIKATRAFAREFGFELVTSLGLPSNIDAVEDPQSALAFLEPAFKVAAEIGSNMLSGVTYAPIGKISGQPVTQREKDGICRFLQQAAALAANHGLKLGVEPCNRYETHLMNTAAQAVEYVEAVAAENLFIHLDTYHMNIEEESFAAGFAKAAPYLGYVHLSESNRGVPGRAMINWDAVMGALADIGYHGALTLESMNYVDPDIATALAVWRPVAKNPDDVIDFGLAFLLKAAADAGLTFG
SEQ ID NO:8;DNA;深海热泉宏基因组
ATGAACCTGCCGGCTAAGAAGATGGTCCTGGGAGTCCATACGTTCGCAGTCGCCCCGTTTTGGGATCTTGAAGTAATGCGCCACGAGGCCCGCCGTTTAAAGAGCCATGGCGTAGGGTTATTGGAAATCCCACTTCTCCGGCCAGAAGAAATTAATATTAAAGCGACCCGCGCATTTGCTCGTGAATTTGGGTTTGAATTAGTGACCAGTTTAGGCCTGCCTTCGAATATCGACGCTGTAGAAGATCCGCAGTCTGCTTTAGCCTTTCTGGAACCGGCGTTCAAAGTGGCTGCTGAAATTGGTAGCAATATGCTTTCAGGCGTTACCTATGCTCCGATTGGAAAGATAAGTGGTCAGCCGGTGACCCAGCGTGAGAAGGATGGTATTTGTCGGTTCCTACAACAAGCGGCTGCGTTGGCCGCGAACCATGGGTTGAAACTGGGCGTAGAGCCTTGTAATCGCTATGAAACGCATCTGATGAACACAGCAGCCCAAGCAGTTGAATACGTTGAGGCTGTGGCAGCGGAAAACCTTTTCATCCACTTAGATACCTACCACATGAACATCGAAGAAGAAAGTTTTGCAGCAGGGTTTGCGAAAGCGGCGCCTTATCTGGGGTACGTGCATCTGAGCGAGAGCAATCGCGGCGTACCGGGCCGCGCCATGATCAATTGGGATGCAGTGATGGGTGCCCTTGCCGACATCGGGTATCATGGGGCACTGACTCTGGAGTCTATGAATTATGTGGATCCGGATATTGCGACTGCCCTTGCGGTCTGGCGTCCGGTTGCCAAGAACCCGGACGATGTGATAGACTTTGGCCTGGCGTTTCTGCTGAAGGCCGCAGCGGATGCGGGTTTGACATTCGGTtaa
SEQ ID NO:9;蛋白质;谷粒亚栖热菌
MARFGAHAFIWSADWTPQAAEKVAAGAAAAGLDFVEIPLLRPEAFDSTLTRRLLEHHGLGCTCSLGLPTEAALPDHPQAAARFLIQALDVAHQMGSPVLSGVTYATLGALSGRPPTEADYETLAKTLKPVAQHAARLGMRLGLEPVNRYETYLINLGSQALDLIQRIGEPNVFVHLDTYHMNIEEKGFKNPIVTVGKHLGYIHLSESDRGTPGSGNVHWDEVFSGLQAIGFQGDLVMESFVALNPDIARATCMWRDVVGDPKTLVHDGLAFLRGKAREYGLL
SEQ ID NO:10;DNA;谷粒亚栖热菌
ATGGCGCGCTTTGGTGCGCATGCTTTTATTTGGAGTGCTGATTGGACCCCTCAAGCCGCCGAAAAGGTCGCAGCGGGAGCAGCGGCGGCGGGACTGGATTTTGTCGAAATACCGCTTCTTCGTCCAGAGGCGTTCGATTCGACACTTACCCGTAGGTTATTAGAGCATCATGGACTGGGATGCACCTGCTCTCTGGGTCTGCCTACCGAGGCAGCACTCCCGGACCATCCTCAAGCAGCAGCCCGTTTTCTCATCCAGGCCTTGGATGTAGCCCATCAAATGGGCAGCCCGGTCCTGAGTGGGGTCACCTACGCAACCCTGGGCGCACTGTCAGGCCGCCCGCCGACCGAGGCCGATTATGAAACCCTGGCGAAAACACTGAAGCCAGTAGCGCAGCACGCCGCCCGCCTGGGTATGCGACTCGGGCTTGAACCGGTTAACCGCTATGAAACATACCTGATAAACTTAGGGTCACAGGCGCTGGATCTCATCCAACGTATCGGCGAACCGAACGTGTTCGTACACCTGGATACTTATCACATGAACATCGAAGAGAAAGGTTTTAAGAACCCGATTGTTACCGTCGGTAAACATCTTGGTTATATTCACCTGTCTGAAAGCGACCGTGGTACCCCAGGTAGCGGTAATGTGCATTGGGATGAAGTGTTCTCCGGCCTGCAAGCAATCGGTTTTCAGGGTGACCTTGTGATGGAGTCGTTTGTGGCACTGAATCCGGATATTGCCCGCGCCACGTGCATGTGGCGGGATGTTGTGGGAGATCCGAAAACACTGGTGCATGATGGCCTAGCTTTCCTGCGCGGTAAAGCTCGCGAATACGGACTGCTGtaa
SEQ ID NO:11;蛋白质;嗜热微红微菌
MQGFGVHTSMWTMHWDRAGAERTIPAAAAYKMDFIEIALLDTAIVDAAHTRALLEKHGLRAVCSLGLPEPVWASVNPEGAIAHLKRALDKTAEMGAEALSGVTYGGIGQRTGVPPTPQEYDNIARALEAAAKHAKALGLAFGIEPVNRYENHLINTGRQAVEMIEKVGADNIFIHLDTYHMNIEEKGVANGILDAREHLRYIHLSESDRGTPGEGTCDWDEIFAALAAIGFKGGLAMESFINMPPQVAYGLAVWRPVAESFEEVMDRGLPFLRNKARQYRLIA
SEQ ID NO:12;DNA;嗜热微红微菌
ATGCAAGGTTTCGGCGTACACACTAGCATGTGGACGATGCATTGGGATCGCGCGGGCGCCGAGCGCACCATTCCGGCCGCCGCCGCCTACAAAATGGACTTTATCGAAATTGCGCTGCTGGATACAGCTATAGTCGATGCAGCGCACACCCGTGCGCTGCTGGAGAAGCACGGCCTGCGTGCAGTTTGTTCACTCGGATTACCGGAGCCGGTCTGGGCCTCTGTGAACCCGGAAGGGGCCATTGCTCACCTGAAACGCGCGCTGGACAAGACCGCAGAGATGGGAGCTGAAGCTCTGTCTGGTGTGACTTACGGCGGTATCGGCCAGCGCACAGGCGTACCACCAACGCCCCAAGAATACGATAACATTGCCCGTGCCCTTGAAGCAGCTGCGAAACATGCCAAAGCCTTAGGCCTGGCCTTTGGTATCGAACCGGTTAACAGGTATGAAAACCATTTGATAAACACCGGACGTCAAGCTGTAGAAATGATCGAAAAGGTCGGGGCAGATAACATTTTCATACACCTGGATACGTATCACATGAATATCGAAGAGAAAGGTGTGGCAAACGGTATCCTGGATGCCCGAGAACACCTTCGTTATATTCACCTGTCAGAAAGCGATCGCGGCACTCCTGGCGAAGGGACGTGTGATTGGGACGAAATCTTCGCTGCGTTGGCCGCCATCGGTTTTAAAGGCGGCCTTGCTATGGAATCCTTTATTAACATGCCGCCTCAAGTCGCTTACGGCCTGGCGGTGTGGCGTCCTGTTGCCGAATCTTTTGAAGAAGTCATGGACCGTGGCCTGCCGTTTCTACGTAACAAGGCTCGTCAGTATAGATTGATCGCTtaa
SEQ ID NO:13;蛋白质;暂定纲Thermofons ia分支1细菌
MPTFGAHAFVWIGDWTTESGNYAIAQAGALGFDFIEIPLLAPQRFDAASHRQALAQAGIQATCSLVLPKGAHMPRYPERARQFLYEALEKVEAVGSQYLGGCIAYELGYLTGQPPTPEERQVVVEVLRDVAAEARRRGIQLALEACNRYETYLYNTLADVRETVLAVGAPNLKLHADTYHMNIEEEGFAQPLIACADVLDYIHMSESHRGLVGSGNVNWAQVWQALAAIRFNGKLVLESFAAINPDLQAATCLWRPPNQPPEVLAREGLRFLREGAAQAQLP
SEQ ID NO:14;DNA;暂定纲Thermofons ia分支1细菌
ATGCCAACCTTCGGCGCCCATGCATTTGTGTGGATTGGAGATTGGACGACAGAATCGGGAAACTATGCGATCGCGCAAGCCGGCGCACTGGGCTTCGACTTCATTGAGATTCCGCTTTTGGCACCGCAGCGTTTTGATGCCGCTTCCCACCGTCAAGCCCTGGCGCAGGCCGGCATTCAGGCGACGTGCAGCCTGGTATTGCCAAAAGGCGCTCACATGCCCAGGTATCCAGAACGTGCGCGTCAGTTCTTGTATGAAGCGTTAGAAAAGGTAGAGGCGGTTGGAAGTCAATACTTGGGCGGTTGCATCGCGTACGAACTTGGGTATCTTACCGGTCAGCCACCGACCCCGGAAGAGCGTCAGGTTGTTGTGGAAGTGCTGCGCGATGTAGCCGCAGAAGCACGCCGTCGCGGCATTCAGTTGGCACTGGAAGCATGCAATCGCTATGAGACTTACCTGTACAACACGCTGGCGGACGTGCGCGAAACGGTTTTAGCGGTGGGCGCGCCAAACTTGAAGCTGCATGCGGATACCTACCACATGAACATCGAAGAAGAAGGCTTTGCCCAGCCGCTTATTGCCTGTGCCGACGTGCTGGATTATATCCACATGTCGGAATCCCATCGCGGCCTGGTCGGAAGCGGCAACGTTAATTGGGCGCAGGTCTGGCAAGCGCTCGCCGCAATTCGCTTCAATGGCAAACTGGTGCTGGAATCGTTTGCCGCGATTAACCCGGACCTTCAGGCCGCTACTTGTCTGTGGCGCCCGCCCAACCAGCCGCCGGAAGTGCTGGCCCGCGAAGGACTGCGATTTCTCCGAGAAGGTGCGGCACAGGCCCAACTACCGtaa
SEQ ID NO:15;蛋白质;韩国异常球菌
MLKFGAHAFCWEGDWTDEIGDRVIEQAARAGLDFIEIPLLHPETFDARRHRRHLEAVGLACVSSLGLPRDAHMPHEPEKAVTFLTGVLDRMEELGARDLTGCTGYSIGVLTGQGPTSQELDRMVDGLARVTEDARSRGIGVGLEAINRYETYMVNTLDDALAVVNRVGSDNLRVHADTYHMNIEETNLREALGRVKGKLNFIHMSESHRGLVGTGTVPWEDVWQGLADIEFSGYLTLESFAAPNAELAAATCIWKPPRHSGQELAQGGLAFLREGATRHGLM
SEQ ID NO:16;DNA;韩国异常球菌
ATGTTGAAGTTCGGCGCGCACGCCTTTTGCTGGGAAGGCGATTGGACCGATGAAATTGGCGATCGCGTCATCGAGCAAGCGGCGCGGGCCGGATTGGATTTCATTGAAATCCCGCTCTTGCACCCTGAAACCTTCGATGCGCGCCGTCATCGTCGCCATCTTGAGGCTGTGGGCCTGGCGTGCGTTTCCAGCCTGGGCCTTCCGCGTGACGCCCACATGCCACATGAACCGGAGAAAGCGGTAACATTCCTTACCGGCGTACTGGATCGCATGGAAGAACTGGGCGCTCGCGACCTTACCGGTTGTACCGGTTATAGCATTGGCGTACTGACCGGCCAGGGTCCGACCTCTCAAGAGCTCGATCGTATGGTGGATGGTCTGGCTCGTGTGACTGAAGATGCACGGTCGCGCGGGATTGGCGTAGGCCTTGAAGCCATCAATCGTTATGAAACTTATATGGTAAACACGCTGGACGATGCGTTAGCGGTCGTGAATCGTGTCGGGAGTGACAATCTTCGCGTTCATGCCGATACATACCACATGAACATAGAAGAAACCAACCTGCGTGAGGCGCTTGGGCGAGTTAAGGGTAAGCTGAACTTCATTCACATGAGTGAAAGTCATCGTGGTCTGGTTGGTACCGGGACAGTTCCATGGGAAGATGTTTGGCAGGGTCTGGCGGATATTGAGTTCAGCGGGTATCTTACTCTTGAATCGTTTGCAGCTCCGAATGCCGAGTTGGCGGCAGCTACCTGTATCTGGAAACCACCACGGCATAGCGGCCAGGAACTGGCGCAGGGTGGCCTAGCTTTTCTGCGCGAGGGCGCGACTCGCCACGGCTTAATGtaa
SEQ ID NO:17;蛋白质;阿氏厄尔巴线虫螺旋体内共生体
MKFGAHAFVWEPEWNDTTSRRVISEAARIGLDFVEIPLLRPERFDGAATKVLLDEHAVGATYSLGLPSDKSLPERPYLAEPFLRSAIDAIESAGGDTLTGVLYGTLGELPGRPPNEKDYKVIAQVLRSVADYAKDRGIKLGIEPVNRYETFLVNTAEQAITLLDRIESDNVFIHLDTYHVNIEEDSFGAAIRLAGDRLGYIHLSESHRGTPGKGTVDWDDVFGALSDIGFAGPLVMESFVKLNADIARATCMWRDIVKDPEALIRDGIAFLEGKAKGYGLF
SEQ ID NO:18;DNA;阿氏厄尔巴线虫螺旋体内共生体
ATGAAATTTGGTGCGCATGCTTTCGTCTGGGAACCAGAATGGAATGATACCACCTCGCGCCGTGTGATTTCAGAGGCCGCGCGCATCGGCCTGGATTTTGTGGAAATACCGCTCCTTCGCCCAGAACGCTTTGACGGCGCCGCTACCAAAGTCTTGCTGGATGAACATGCCGTGGGCGCCACTTATTCATTGGGCCTGCCCAGTGACAAAAGCCTGCCAGAACGCCCGTATCTGGCTGAACCCTTCTTACGGTCTGCAATCGACGCCATTGAATCCGCAGGCGGTGATACACTGACAGGCGTGCTGTATGGCACTCTGGGTGAGCTGCCGGGCCGCCCGCCGAACGAAAAGGACTACAAAGTGATTGCGCAGGTATTACGTAGTGTTGCTGATTACGCGAAAGACCGTGGCATCAAACTGGGCATTGAGCCGGTAAACCGTTATGAAACCTTTCTGGTGAATACCGCAGAGCAGGCGATCACATTGTTAGACCGTATCGAAAGCGACAATGTCTTTATTCATCTGGATACCTATCACGTGAACATCGAAGAAGATAGTTTTGGCGCGGCTATCCGCCTGGCTGGGGATCGTTTAGGCTACATCCACCTGTCCGAAAGCCACCGTGGCACGCCAGGCAAGGGTACTGTGGATTGGGACGACGTTTTCGGAGCGCTTTCCGATATTGGTTTCGCAGGCCCTCTTGTGATGGAAAGCTTTGTCAAGCTGAATGCAGACATTGCACGTGCGACCTGCATGTGGCGTGATATTGTGAAAGACCCAGAAGCCCTGATTCGCGATGGTATTGCGTTTCTCGAGGGGAAAGCGAAAGGCTATGGTCTGTTTtaa
SEQ ID NO:19;蛋白质;嗜酸菌属(Acidiphilium)
MKGFGIHTSLWAHDWTEQAARLAIPEAAKHGLAFVEIALIEPDRAETEVTRGLLEQHGLAACCSLGLPEEARPTTNPDKALEFVTLALEKTAAIGASLFTGVTYGSIGERTGQPPTAAELDAVARFLDKAAAVARGFGIIFGIEVVNRYESHLFNTTEQAVALIERVGAPNIVLHLDTYHMNIEATGQANAIRAAGAHLAYIHLSESHRGVPGTGTIAWDEVFAGLAGLGFTGGMALESFIHMPPRLAAALSVWRPVAPSRAAIIDEGLPFLRNKARQYGLI
SEQ ID NO:20;DNA;嗜酸菌属
ATGAAAGGCTTTGGCATTCATACAAGTCTGTGGGCCCATGACTGGACCGAGCAAGCGGCTCGTTTAGCAATTCCGGAAGCGGCAAAACATGGCCTGGCGTTTGTCGAAATTGCTTTAATTGAACCAGATCGCGCGGAAACTGAAGTTACCCGCGGGCTGCTGGAACAGCACGGCTTGGCTGCCTGCTGCTCTCTGGGCTTACCTGAGGAAGCGCGGCCAACGACGAACCCGGATAAAGCGTTGGAGTTCGTCACTTTAGCTCTGGAAAAGACCGCGGCGATAGGGGCTAGCCTGTTTACCGGTGTGACCTACGGGAGCATTGGCGAACGTACGGGCCAGCCACCTACTGCCGCCGAACTTGATGCAGTAGCAAGGTTCTTGGATAAGGCTGCCGCAGTAGCGCGCGGTTTCGGTATCATTTTCGGTATCGAAGTAGTGAATCGGTACGAGTCTCATCTGTTTAACACCACCGAACAGGCCGTTGCACTGATCGAACGTGTCGGCGCACCGAACATAGTGCTGCACTTAGACACGTATCACATGAACATCGAAGCCACGGGCCAGGCCAACGCAATACGCGCGGCGGGTGCACATCTGGCCTATATTCACCTGAGTGAATCGCACAGGGGTGTTCCGGGCACAGGGACCATCGCCTGGGACGAGGTGTTTGCAGGTCTTGCCGGCCTGGGCTTTACCGGCGGGATGGCCCTCGAATCATTTATTCACATGCCGCCCCGCCTGGCCGCCGCGCTGAGCGTCTGGCGTCCAGTTGCACCGAGTCGCGCGGCCATCATCGATGAAGGCCTTCCATTTCTGCGAAATAAAGCCCGTCAATACGGCCTCATTtaa
SEQ ID NO:21;蛋白质;红杆菌目细菌
MLSLGLHALAAAPEWRPDLWAAILPRMAAHGVSVIEIPLLRPAELDIAGTRALAAKHDVELVCSLGLPATLNVAERPDEAFDFIRVALEVTASAGATALSGVTFGVIGQTTGAAPTTREIDAMTRHVSRSAALAKKLGLRFGIEPCNRYETHLLNTGAAARAVIERSGADNAFIHLDTYHMNIEEVSHAQGFADAGDLLGYVHLSESNRGVPGRGTVDWANVFQGLKAAGFDGCAALESFVFVDADLASGLAIWRPVAENPDDVIDVGFPFLRTAGEAAGLRWAR
SEQ ID NO:22;DNA;红杆菌目细菌
ATGCTTTCTCTGGGACTGCATGCGCTTGCAGCCGCCCCTGAATGGCGCCCGGATCTGTGGGCGGCGATCCTGCCGCGTATGGCGGCCCACGGTGTTAGCGTTATCGAAATTCCGCTGCTCCGTCCTGCTGAACTGGATATTGCGGGCACGCGGGCTTTAGCGGCTAAACATGATGTTGAACTCGTTTGTTCATTGGGGCTGCCAGCCACCCTCAATGTTGCGGAACGCCCTGATGAGGCGTTTGATTTTATCCGCGTGGCGTTAGAAGTGACCGCGAGCGCGGGTGCGACCGCGCTGTCAGGAGTGACATTTGGCGTGATTGGGCAGACGACGGGCGCCGCCCCAACCACGCGCGAAATCGATGCTATGACCCGGCATGTGAGCCGTAGCGCAGCCCTCGCCAAGAAACTGGGCTTGCGCTTTGGCATTGAGCCGTGCAACCGCTACGAAACCCACTTACTGAATACTGGCGCAGCCGCTCGGGCCGTGATAGAACGCTCAGGCGCTGATAACGCCTTCATCCATTTGGATACATATCACATGAATATCGAAGAAGTGTCTCATGCTCAGGGTTTTGCAGATGCGGGCGACCTGCTGGGATATGTGCACTTGTCAGAAAGCAATCGAGGCGTCCCGGGGCGTGGTACCGTCGATTGGGCGAATGTATTTCAGGGTCTGAAAGCCGCCGGATTCGATGGTTGCGCCGCACTCGAAAGTTTCGTGTTCGTTGACGCGGACTTAGCATCCGGACTTGCCATCTGGCGTCCTGTTGCTGAAAACCCAGATGACGTGATTGACGTAGGTTTCCCGTTCTTGCGGACAGCCGGAGAGGCGGCGGGCTTGCGCTGGGCGCGTtaa
SEQ ID NO:23;蛋白质;绿弯菌门细菌
MVLFGAHTFIWSAEWNPETAEHVIDGAARAGLDFVEIPLLHPDQMDAGGTRRLLENYGLQCTCSLGLPREAHLPFAPDKATGFLEQAVDVTSDLGSPVLTGCLYTHLGTLTGKPPTDEEIDLVVRVLKRIARYAQDRGISLGIEPVNRYETYLLNLAEQASALLDRIDEANVFVHLDTYHMNIEEKGFYTPIVDTGPRLQYIHLSESDRGIPGTGNVHWDEVFRGLKAVKYEGRLVMESFAAVNEDLMGATAMWRDVVGDPDRLVTEGLAFLRGKAIEYGLL
SEQ ID NO:24;DNA;绿弯菌门细菌
ATGGTACTGTTTGGGGCGCATACCTTTATTTGGAGCGCCGAATGGAACCCAGAAACGGCGGAACATGTAATTGATGGCGCAGCTCGCGCCGGCCTGGATTTCGTTGAGATTCCGTTGCTGCATCCCGATCAGATGGACGCAGGCGGCACGCGCCGGCTTTTGGAAAACTATGGTCTGCAATGCACATGTAGCTTGGGCCTGCCGCGCGAAGCGCATCTGCCATTCGCCCCTGACAAGGCAACAGGCTTTCTGGAACAGGCCGTCGATGTGACAAGTGACCTGGGTAGCCCTGTTTTGACCGGCTGTTTATATACCCACTTAGGAACGCTGACAGGAAAGCCGCCTACCGACGAAGAGATTGATTTGGTCGTTCGTGTCCTGAAGCGAATTGCGCGCTACGCCCAGGACCGAGGGATTAGTCTGGGCATCGAACCGGTCAACCGCTATGAAACCTATCTTCTGAATCTGGCGGAGCAAGCGTCTGCACTGCTCGATCGTATTGACGAAGCCAATGTATTTGTGCATCTGGATACCTATCACATGAACATTGAAGAAAAGGGCTTTTATACTCCGATCGTTGATACCGGGCCGCGTTTACAGTACATTCACCTGTCCGAATCGGACCGCGGTATCCCGGGTACTGGCAACGTTCATTGGGACGAGGTGTTTCGAGGCCTCAAGGCCGTTAAATACGAAGGCCGTCTTGTGATGGAATCTTTCGCCGCAGTCAACGAAGATCTGATGGGTGCAACGGCGATGTGGCGGGATGTGGTGGGTGATCCGGATCGATTAGTCACGGAAGGCCTGGCGTTCTTACGTGGAAAGGCGATTGAGTACGGCCTGCTGtaa
SEQ ID NO:25;蛋白质;螺旋杆菌属物种E85
MAEFGAHAFIWESDWNPASARRVIAGAAAAGLDFVEIPLLRPESMDTAGTRRLLAEHRLGVRCSLGLPPAASLPAHPQAAEAFLCRALDVTRALGGPVLTGVIYGTLGQLPGHPPRPGDLDIVAQTLRRVAAYAADQGLALGIEPVNRYETHLVNLTDQALELLDAIGADNVFLHLDTYHMNVEEKGFRGPVEAAGKRLRYIHLSESDRGTPGTGNVHWDEVFDGLAAIGYRGDLVMESFAAVNEDIARATCIWRQVAPDPDTLVREGLAFLRGKATARGLIP
SEQ ID NO:26;DNA;螺旋杆菌属物种E85
ATGGCGGAGTTCGGTGCACATGCTTTCATTTGGGAGTCTGACTGGAATCCGGCGTCAGCTCGCCGTGTCATTGCCGGCGCCGCTGCCGCCGGCCTAGATTTCGTCGAGATCCCACTGCTCCGCCCGGAATCCATGGACACCGCGGGAACCCGCAGATTACTTGCTGAACATCGCCTCGGCGTGCGCTGTTCACTGGGCCTGCCGCCGGCAGCGAGTCTACCCGCTCATCCGCAGGCCGCAGAAGCATTCCTTTGCCGCGCCCTAGACGTTACGCGTGCGTTGGGCGGACCCGTACTCACTGGTGTCATCTATGGCACTCTGGGCCAGTTACCGGGTCACCCGCCACGCCCTGGCGATCTTGACATTGTCGCACAGACCTTACGGCGCGTGGCAGCGTACGCCGCAGATCAGGGTCTGGCCCTGGGCATTGAACCAGTGAACCGTTATGAAACACATTTAGTGAATCTCACGGATCAAGCCCTAGAACTGTTAGATGCGATTGGCGCCGACAATGTATTCCTGCATCTGGATACCTATCACATGAACGTGGAAGAGAAAGGTTTTCGTGGTCCAGTTGAAGCAGCTGGTAAACGTTTGAGATACATTCATCTTTCGGAGTCAGATCGTGGTACCCCGGGGACAGGCAACGTTCACTGGGATGAAGTATTCGACGGTCTGGCTGCAATCGGATACCGTGGGGATCTGGTGATGGAAAGTTTTGCGGCCGTGAATGAGGACATTGCGCGTGCGACCTGCATCTGGCGTCAAGTTGCCCCAGACCCGGACACTCTGGTTAGAGAAGGCTTGGCGTTTCTTCGCGGCAAAGCGACCGCCCGCGGCCTTATCCCTtaa
SEQ ID NO:27;蛋白质;大不里士杆菌属物种TH137
MEGFGVHTSMWTMHWDRAGAERTIPAAAAYRMDFIEIALLNTAIVDAAHTRALLERHGMRAVCSLGLPERNWASVNPEGAIAHLCDCIDTAAAMGAEALSGVTYGGIGQRTGLPPTMAEYDNIARALAAVAKHAKARGIAFGIEPVNRYENHLINTAAQAKWMIEKVGADNIFIHLDTYHMNIEEKGAGNGILDARDHLRYIHLSESDRGTPGEGTCDWDEVYATLAAIGFKGGLAMESFINMPPEVAYGLAVWRPVAENFEEVMDKGLPFLRNKARQYRLI
SEQ ID NO:28;DNA;大不里士杆菌属物种TH137
ATGGAAGGATTTGGTGTACATACTTCCATGTGGACAATGCACTGGGATCGCGCGGGCGCTGAACGTACCATTCCTGCCGCAGCTGCGTACCGCATGGATTTCATAGAGATTGCTTTATTAAACACAGCCATTGTTGACGCGGCACACACGAGGGCTCTCCTTGAACGGCATGGCATGCGCGCAGTGTGTTCATTGGGCTTACCTGAACGCAATTGGGCGAGCGTGAACCCGGAAGGCGCCATCGCACATCTGTGCGATTGTATTGACACAGCAGCAGCCATGGGCGCCGAAGCCCTATCCGGCGTCACGTATGGCGGCATCGGGCAACGTACGGGGCTCCCGCCTACGATGGCCGAATACGATAACATTGCCCGCGCTCTGGCAGCTGTGGCGAAACATGCTAAAGCACGCGGCATTGCGTTTGGTATCGAACCCGTGAATCGCTACGAAAATCACTTGATTAATACCGCCGCACAAGCTAAATGGATGATCGAAAAGGTTGGGGCTGATAATATATTTATTCATCTGGACACCTATCACATGAACATAGAGGAAAAGGGAGCCGGCAATGGGATCCTCGATGCGCGTGATCATTTGAGATATATCCACTTATCGGAATCGGATCGCGGCACTCCGGGCGAAGGCACGTGTGACTGGGATGAGGTATATGCTACCCTGGCCGCCATTGGTTTTAAAGGCGGTTTGGCTATGGAATCGTTTATTAATATGCCACCGGAAGTGGCCTATGGTCTTGCCGTCTGGCGTCCGGTGGCGGAAAATTTTGAGGAAGTGATGGATAAAGGACTCCCGTTCTTGCGTAATAAAGCGCGCCAATATCGCCTGATAtaa
SEQ ID NO:29;蛋白质;异食烷烃热带单胞菌
MKGFGVHTSMWTMHWDRDGAERTIPATAAYGMDFVEIALLDTSIVDAAHTRALLEKHELRAVCSLGLPEGSWPSVAPEAAVAHLKDVFETAAAMGAEAVSGVTYGGIGQRSGVPPTEEEYDNVARALQQAAAYAKRLGLAFGIEPVNRYENHLINTAWQARDMIEKVGSDNIFIHLDTYHMNIEEKGVANGILDARDHLRYIHLSESDRGTPGEGCCDWNEVFGTLSAIGFEGGMAMESFINMPPQIAYGLAVWRPVADSFEDVMDRGLPFLRNKARQYRLA
SEQ ID NO:30;DNA;异食烷烃热带单胞菌
ATGAAGGGTTTCGGGGTGCACACGAGTATGTGGACGATGCATTGGGACCGGGATGGCGCGGAACGTACAATTCCAGCGACGGCCGCGTATGGCATGGATTTTGTCGAGATCGCTCTGTTGGATACCTCTATCGTTGATGCTGCGCACACCCGGGCGCTCCTGGAGAAACACGAGCTGCGCGCCGTTTGCTCGTTGGGCCTGCCGGAAGGCTCGTGGCCTTCGGTTGCCCCAGAGGCGGCGGTAGCGCATCTGAAAGACGTATTTGAAACCGCAGCCGCGATGGGCGCCGAAGCGGTTTCGGGCGTCACATACGGCGGTATTGGCCAACGTTCCGGTGTGCCGCCCACCGAGGAAGAATATGACAACGTAGCTCGTGCCCTGCAACAGGCAGCGGCTTACGCCAAACGCTTAGGCTTAGCCTTTGGCATTGAACCTGTGAACCGCTACGAAAACCATTTGATCAACACTGCATGGCAGGCCCGTGACATGATTGAAAAGGTAGGCTCGGACAATATTTTCATCCATTTAGATACTTACCACATGAATATAGAAGAGAAAGGTGTGGCGAACGGTATCTTAGACGCACGTGATCACCTTCGTTATATTCATCTTTCAGAGAGCGACCGTGGCACTCCGGGTGAAGGTTGCTGCGATTGGAACGAAGTTTTCGGGACCTTGAGCGCTATTGGGTTTGAAGGTGGTATGGCGATGGAATCGTTTATTAACATGCCGCCGCAGATAGCTTACGGCCTGGCCGTTTGGCGACCAGTTGCGGACTCCTTCGAAGATGTGATGGATCGCGGGCTGCCGTTTCTGCGTAACAAAGCGCGTCAGTACCGTCTGGCTtaa
SEQ ID NO:31;蛋白质;红杆菌科细菌
MQGFGVHTSMWTMHWDRLGAERTIPAAAAYKMDFIEIALLDTSVVDAHHTRDLLAKHEMRAVCSLGLPRESWASVNPDGAIAHLIDAMDYTKEMGGEALSGVTYGGIGERSGVPPTEAEYDNIARALEVAAKYAKTLGIAFGIEPVNRYESHLINTSWQAKEMIDKIGADNIFIHLDTYHMNIEEKGAGNGILAAREHLRYIHLSESDRGTPGEGTCDWDEIFATLAAVEFKGGLAMESFINMPPQVGYGLGIWRPVANSFEEVMDKGLPFLRNKAAQYRLI
SEQ ID NO:32;DNA;红杆菌科细菌
ATGCAAGGTTTTGGTGTCCATACCAGTATGTGGACAATGCACTGGGATCGCCTGGGCGCGGAACGAACCATTCCGGCCGCGGCTGCGTACAAAATGGACTTTATTGAAATTGCTCTTCTGGACACCAGCGTCGTGGATGCGCATCACACTCGTGATCTTCTGGCGAAACATGAAATGCGTGCGGTTTGCTCGCTGGGCTTGCCTCGCGAATCTTGGGCCAGTGTTAACCCGGATGGTGCCATAGCTCACCTTATAGATGCAATGGACTATACTAAAGAGATGGGCGGCGAGGCACTGTCTGGCGTCACCTATGGCGGTATCGGTGAACGTAGCGGTGTTCCGCCGACGGAAGCTGAATATGATAATATCGCACGTGCCCTAGAAGTTGCCGCCAAATACGCCAAAACGCTGGGCATTGCCTTTGGCATTGAACCCGTGAACCGCTATGAAAGCCACCTGATTAATACCAGTTGGCAGGCTAAAGAAATGATTGATAAAATCGGTGCAGATAACATCTTCATTCACTTAGATACCTACCACATGAACATTGAAGAGAAAGGCGCCGGTAATGGAATCCTGGCAGCTCGGGAACACCTTCGCTACATTCATTTGAGCGAAAGCGACCGGGGTACACCCGGCGAAGGCACCTGTGATTGGGACGAAATATTTGCGACCCTTGCTGCCGTTGAGTTCAAAGGTGGCTTGGCCATGGAGAGTTTCATTAATATGCCGCCGCAAGTGGGATATGGCTTGGGTATCTGGCGCCCGGTCGCCAATTCATTCGAGGAAGTGATGGATAAAGGCCTGCCGTTCCTGCGTAACAAAGCGGCCCAGTATCGTCTTATTtaa
SEQ ID NO:33;蛋白质;红细菌属物种SW2
MEGFGVHTSMWTMQWDRAGAERTIPAAAAYKMDFIEIALLNTAIVDAPHTRALLQKHGLRAVASLGLPQQNWASVNPEGAIEQLCRSLDTAAAMGCEALSGVTYGGIGERSGLPPTMAEYDNVARALAAAAKHAKKLGLAFGIEPVNRYESHLINTGWQAKWMIEKVGADNIFIHLDTYHMNIEEKGAGNGILDAREHLRYVHLSESDRGTPGEGTVDWDEIFATLAAVGFKGGLAMESFINMPPELGYGLAVWRPVAESFQAVMDKGLPFLRNKARQYRLI
SEQ ID NO:34;DNA;红细菌属物种SW2
ATGGAAGGTTTCGGTGTCCATACTTCCATGTGGACCATGCAATGGGACCGTGCTGGTGCCGAACGGACGATACCAGCCGCTGCGGCATATAAGATGGATTTCATCGAAATCGCGCTGCTGAATACGGCCATTGTGGATGCCCCGCATACCCGCGCACTGTTACAGAAACATGGTCTGCGCGCCGTTGCGAGTCTGGGCCTGCCACAACAGAACTGGGCGAGTGTCAATCCTGAGGGTGCCATTGAGCAGTTATGCCGCTCACTGGACACCGCTGCCGCGATGGGTTGCGAAGCCCTGTCAGGGGTTACCTACGGCGGCATCGGAGAGCGCAGCGGTCTGCCGCCAACAATGGCAGAATATGACAACGTGGCCCGTGCGTTGGCGGCGGCAGCAAAACACGCTAAGAAACTGGGCCTGGCGTTTGGAATCGAACCTGTGAACAGATATGAGTCTCACTTGATCAACACCGGATGGCAAGCAAAATGGATGATTGAAAAGGTGGGTGCGGATAACATCTTTATCCACCTGGATACTTATCACATGAATATTGAGGAAAAGGGTGCAGGCAACGGCATTCTCGATGCGCGCGAACACCTGCGTTACGTGCATCTTAGCGAAAGCGACCGTGGGACCCCTGGAGAAGGTACTGTTGACTGGGATGAAATATTCGCGACACTCGCCGCAGTTGGATTTAAAGGCGGATTAGCAATGGAAAGCTTTATCAACATGCCACCGGAACTGGGATATGGCCTGGCAGTATGGCGCCCGGTGGCGGAATCCTTTCAAGCAGTAATGGATAAAGGTTTACCTTTTCTGCGGAACAAAGCGCGTCAGTATCGTCTGATCtaa
SEQ ID NO:35;蛋白质;甲型变形菌纲细菌HGW-甲型变形菌-8
MRGFGVHTSMWTMKWDRAGAERAVAAAAHYKMDFIEIALLNAPGVDAPHSRALLEKHGLRAVCSLGLPEAAWPSRNPEAAVAHLKVALDKTAEMGCEALTGVTYGGIGERTGLPPSATELDNVARALREAAAHAKKLGLLFGIEPVNRYETHLINTGRQAVEMIEKVGAENMFIHLDTYHMNIEEKGAANGILDAREHIKYIHLSESDRGTPGWGTCDWDEIFAVLSAIGFKGGLAMESFINMPPEVAYGLSVWRPVARDEAEVMDNGLPFLRGKARQYRLI
SEQ ID NO:36;DNA;甲型变形菌纲细菌HGW-甲型变形菌-8
ATGCGTGGTTTTGGCGTCCATACATCTATGTGGACTATGAAATGGGACCGTGCAGGTGCCGAGCGTGCCGTGGCGGCGGCAGCCCACTATAAGATGGACTTCATCGAAATTGCGCTGCTGAACGCGCCGGGTGTCGATGCACCGCATAGTCGGGCACTCCTGGAGAAACATGGACTGCGCGCGGTCTGTTCATTGGGGCTTCCGGAAGCCGCTTGGCCGAGCCGCAACCCGGAAGCCGCCGTTGCTCATCTGAAAGTGGCGCTCGATAAAACCGCTGAAATGGGTTGTGAAGCGCTGACCGGAGTCACCTACGGCGGCATCGGGGAACGGACCGGCCTGCCACCGTCTGCCACCGAACTGGATAACGTGGCACGCGCTTTACGCGAAGCCGCAGCACACGCTAAGAAGCTGGGGCTCCTCTTCGGCATCGAACCGGTTAACCGCTACGAAACCCATCTGATTAACACTGGTCGGCAAGCCGTTGAAATGATTGAGAAAGTCGGCGCAGAGAATATGTTTATTCACCTGGACACCTATCACATGAACATCGAGGAAAAGGGCGCAGCGAATGGTATTCTGGATGCACGCGAACACATTAAATATATCCATCTTTCAGAATCTGATCGCGGTACCCCGGGCTGGGGTACCTGCGATTGGGATGAAATTTTCGCAGTGCTGAGCGCAATTGGATTTAAAGGTGGTTTGGCGATGGAAAGTTTTATTAACATGCCGCCGGAAGTTGCGTATGGCCTGTCAGTATGGCGACCAGTCGCACGGGATGAAGCGGAAGTTATGGATAACGGCCTTCCGTTTCTTCGTGGTAAAGCCCGCCAGTACCGCTTAATTtaa
SEQ ID NO:37;蛋白质;中温微红微菌
MQGFGVHTSMWTMNWDRAGAERTIPAASAYGMDFIEIALLNAPAVDAPHTRALLEKHGMRAVCSLGLPERNWASVNPEGAIEHLRQALEVTAALGAEALSGVTYGGIGQRTGVPPTAGEYDNIARALEAAARYARELGIAFGIEPVNRYENHLVNTAAQAKWMIEKVGADNIFIHLDTYHMNIEEKGVGNGILDAREHLRYIHLSESDRGTPGEGTCDWDEVFATLAAIGFKGGLAMESFINMPPEIGYGLAVWRPVAESFEEVMDRGLPFLRNKAKQYRLV
SEQ ID NO:38;DNA;中温微红微菌
ATGCAAGGGTTTGGCGTCCACACTTCGATGTGGACCATGAACTGGGATCGTGCCGGCGCCGAACGTACAATCCCGGCCGCGAGCGCATACGGTATGGATTTTATTGAAATTGCGCTGCTGAATGCCCCGGCGGTGGACGCTCCACATACGCGCGCCCTTCTTGAAAAGCACGGGATGCGTGCAGTTTGCAGTTTGGGTTTGCCTGAGCGTAATTGGGCAAGCGTCAACCCTGAAGGCGCGATCGAGCACCTTCGACAAGCCCTCGAAGTGACCGCCGCCCTTGGGGCAGAAGCGTTAAGCGGTGTCACATACGGCGGTATAGGTCAGCGCACAGGGGTGCCACCCACCGCTGGCGAGTATGATAACATCGCCCGTGCACTGGAAGCCGCTGCACGCTATGCACGAGAACTGGGTATCGCCTTTGGTATCGAACCGGTTAACCGGTACGAGAACCATCTGGTGAACACCGCGGCCCAAGCTAAATGGATGATAGAAAAGGTTGGCGCGGATAATATTTTCATCCATTTGGATACATATCACATGAACATTGAGGAGAAAGGTGTCGGCAACGGTATCCTGGATGCGCGTGAGCACCTGCGCTATATTCATCTGTCTGAGAGCGATCGCGGCACACCAGGCGAGGGTACTTGCGATTGGGACGAAGTATTCGCAACCCTGGCAGCAATTGGTTTCAAAGGCGGACTTGCTATGGAATCGTTTATCAACATGCCGCCAGAAATTGGATACGGCTTGGCCGTTTGGCGACCTGTGGCAGAGAGTTTTGAAGAAGTCATGGACCGCGGCCTGCCGTTCCTGCGGAACAAGGCGAAACAGTACCGTCTTGTGtaa
SEQ ID NO:39;蛋白质;红杆菌目细菌
MEGFGVHTSMWTMHWDRAGAERTIPAAAAYKMDFIEIALLNAAMIDPPHTRALLEKHNMRAVASLGLPQRNWASVNPDGAAAHLIEAMDVAAAMGAEALSGVTYGGIGERTGLPPTMAEYDNIARALGQAAKHAKKLGIAFGIEPVNRYENHLINTGWQAKWMIEKVGADNIFIHLDTYHMNIEEKGAGNGILDAREHLRYIHLSESDRGTPGEGTCDWDEVYATLAAIGFKGGLAMESFINMPPEVGYGLAVWRPVANSFEEVMDKGLPFLRNKARQYRLI
SEQ ID NO:40;DNA;红杆菌目细菌
ATGGAAGGCTTCGGTGTGCACACGAGTATGTGGACGATGCACTGGGATCGTGCTGGTGCTGAACGTACGATTCCGGCCGCCGCCGCGTACAAGATGGACTTCATTGAAATTGCGCTGCTGAACGCAGCGATGATCGATCCGCCACATACTCGCGCGCTTCTGGAGAAACATAACATGCGGGCTGTTGCGAGTCTCGGACTTCCACAACGCAATTGGGCCTCGGTTAATCCAGATGGTGCCGCGGCCCATCTTATCGAGGCGATGGACGTGGCGGCAGCAATGGGTGCCGAAGCGCTTTCCGGAGTGACATACGGCGGAATCGGTGAACGCACTGGCCTGCCGCCAACTATGGCAGAGTACGATAACATTGCACGAGCACTCGGGCAGGCCGCCAAACATGCCAAGAAGCTTGGGATCGCTTTCGGCATAGAGCCGGTGAATCGCTATGAGAATCATCTGATCAACACTGGCTGGCAGGCCAAATGGATGATTGAGAAAGTGGGTGCTGATAACATCTTTATCCATCTGGATACATATCACATGAATATCGAGGAAAAGGGCGCTGGTAATGGTATTTTAGATGCACGTGAACACCTGCGTTATATTCATTTGTCTGAGTCCGATCGCGGCACGCCGGGTGAAGGCACGTGTGACTGGGATGAAGTTTACGCGACACTGGCAGCCATTGGCTTTAAAGGTGGACTCGCGATGGAATCATTCATCAACATGCCGCCGGAAGTGGGTTATGGTCTGGCAGTTTGGCGCCCGGTGGCGAACAGCTTTGAAGAAGTTATGGACAAAGGTCTGCCGTTTCTCCGCAATAAAGCGCGGCAGTACCGCCTGATCtaa
SEQ ID NO:41;蛋白质;红杆菌目细菌RIFCSPHIGHO2_02_FULL_62_130>
MEGFGVHTSMWTMKWDREGTERAVQAAVDYKMDFLEIALLDAPSVDAAHTRKLLEDNDMRAVCSLGLPEAVWPSRDPESAIAFMKGVFDKANEMGAEAVSGVTYGGIGERTDMPPTEAELSNVARALEACASYAKSLGLRFGIEPVNRYETHLLNTGWQARDMIERIGSDNIFIHLDTYHMNIEEKGAASGILDAREHLKYIHLSESDRGTPGEGCCDWDEIFATLAAINFTGGLAMESFINMPPELAHGLSVWRPVAPDFQAVMDKGLPFLRNKAAQYRLV
SEQ ID NO:42;DNA;红杆菌目细菌RIFCSPHIGHO2_02_FULL_62_130
ATGGAAGGTTTTGGGGTACACACCAGCATGTGGACGATGAAATGGGATCGTGAGGGCACCGAGCGGGCTGTACAGGCGGCAGTTGATTACAAAATGGATTTTCTGGAAATTGCTCTGCTTGACGCTCCGAGCGTGGACGCGGCACACACGCGCAAACTCCTGGAAGATAACGATATGCGTGCGGTGTGCAGTTTAGGGTTACCAGAAGCGGTGTGGCCGAGTCGCGACCCAGAGAGCGCAATTGCTTTTATGAAAGGAGTATTCGATAAGGCCAACGAAATGGGCGCCGAGGCAGTGAGTGGGGTCACGTATGGCGGCATAGGCGAACGCACAGACATGCCACCGACAGAAGCGGAGCTGAGCAACGTAGCCCGCGCACTGGAAGCGTGCGCGAGTTATGCAAAATCATTAGGTCTGCGATTTGGCATTGAGCCTGTGAATCGTTATGAAACCCATCTGCTGAATACCGGTTGGCAAGCACGCGATATGATCGAACGTATCGGTTCAGATAACATTTTCATTCATTTGGATACGTACCACATGAATATCGAAGAGAAAGGCGCGGCCTCTGGTATTTTAGATGCCCGTGAACACTTGAAATACATCCATTTATCTGAAAGTGACAGAGGCACGCCAGGCGAAGGTTGTTGCGACTGGGATGAAATTTTCGCCACCCTCGCCGCCATTAATTTTACCGGCGGTCTTGCCATGGAAAGTTTCATTAACATGCCGCCAGAGCTGGCGCATGGTCTGAGCGTGTGGCGCCCCGTGGCCCCGGACTTCCAAGCGGTGATGGATAAAGGCCTGCCGTTCCTGCGAAACAAAGCCGCGCAGTACCGCCTGGTCtaa
SEQ ID NO:43;蛋白质;污泥嗜热梭菌,由经密码子优化的DNA序列SEQ ID NO:44编码
KYGIFYAYWEKEWKGDFITYIEKVKKLGFDILEVGCGDFHKQPDSYFHTLRDAAREYDI ILTGGYGPRAEHNLCSPDTAVVENALAFYSDIFRKMEIAGIRSIGGGLYAYWPVDYSREPDKAGDLERSIKNMRRLADIAERHGITLNMEVLNRFEGYLINDTNEGLAYIRAVDKPNVKLMLDTFHMNIEEDSFTEPILQAGKYLGHVHVGEPNRKPPREGRIPWGEIGKALRQIGYDGPVVMEPFVTMGGQVGKDICVWRDLSQGATEEDLDRDAEKSLAFLKGMFEA
SEQ ID NO:44;DNA;污泥嗜热梭菌,经密码子优化
AAGTACGGTATCTTCTATGCTTATTGGGAAAAGGAATGGAAGGGTGACTTCATTACTTACATTGAAAAGGTTAAGAAGCTGGGATTCGATATTCTTGAAGTTGGTTGTGGTGACTTCCATAAACAACCTGATTCTTACTTCCATACTCTTAGAGATGCTGCTAGAGAATATGATATTATTCTTACTGGTGGTTACGGTCCTAGAGCTGAACATAACTTGTGTTCTCCAGATACTGCTGTTGTTGAAAACGCTCTTGCCTTCTATTCTGATATCTTCAGAAAAATGGAGATCGCTGGTATTAGATCCATTGGTGGTGGTCTGTATGCTTACTGGCCTGTTGATTATTCTAGAGAACCTGATAAGGCTGGTGATCTTGAAAGATCCATTAAGAACATGAGAAGATTGGCTGATATTGCTGAAAGACATGGTATTACTCTTAATATGGAAGTTCTTAACAGATTCGAAGGTTATCTTATTAACGATACTAACGAAGGTCTTGCTTATATTAGAGCTGTTGATAAACCAAACGTTAAATTGATGTTGGATACCTTCCACATGAACATTGAAGAAGATTCCTTCACTGAACCTATTCTTCAAGCTGGTAAGTATCTTGGTCATGTTCATGTTGGTGAACCTAATAGAAAGCCACCTAGAGAAGGTAGAATCCCTTGGGGTGAAATTGGTAAAGCTCTTAGACAAATTGGTTACGATGGTCCTGTTGTTATGGAACCATTCGTTACTATGGGTGGTCAAGTTGGTAAGGATATCTGTGTCTGGAGAGACTTATCTCAAGGTGCTACTGAAGAGGATCTTGATAGAGATGCTGAAAAGTCTCTTGCCTTCTTGAAAGGTATGTTCGAAGCT
其他实施方案
本说明书中公开的所有特征可以任何组合进行组合。本说明书中公开的每个特征可被用于相同、等效或类似目的的替代特征替换。因此,除非另外明确说明,否则所公开的每个特征仅是一系列等效或相似特征的实例。从以上描述,本领域的技术人员可以容易地确定本公开的必需特征,并且在不脱离本公开的精神和范围的情况下,可以对本公开进行各种变化和修改以使其适于各种用法和条件。因此,其他实施方案也在权利要求的范围内。
等效物和范围
本领域技术人员仅使用常规实验将认识到或能够确定本文所述的本公开的具体实施方案的许多等效方案。本公开的范围并不旨在局限于以上描述,而是如随附权利要求中所阐述。
如本文在说明书和权利要求中所使用的不定冠词“一个”和“一种”,除非有相反的明确说明,应理解为意指“至少一个/种”。
如本文在说明书和权利要求中所使用的短语“和/或”应理解为是指这样结合的元素中的“一者或两者”,即,在一些情况下结合存在并且在其他情况下分离存在的元素。用“和/或”列出的多个元素应以相同的方式解释,即“一个或多个/一种或多种”这样结合的元素。除了通过“和/或”子句具体标识的元素之外,可任选地存在其他元素,无论与那些具体标识的元素相关还是不相关。因此,作为一个非限制性实例,当与诸如“包括”之类的开放式语言结合使用时,对“A和/或B”的引用在一个实施方案中可以仅指A(任选地包括除B之外的元素);在另一个实施方案中,仅指B(任选地包括除A之外的元素);在另一个实施方案中,指A和B两者(任选地包括其他元素);等等。
如本文在说明书和权利要求中所使用的,“或”应理解为具有与如上定义的“和/或”相同的含义。例如,当分隔列表中的项目时,“或”或“和/或”应解释为是包含性的,即包括多个元素或元素列表中的至少一个,但也包括其中的多于一个,以及(任选地)其他未列出的项目。只有明确指出相反的术语,诸如“仅一个”或“恰好一个”,或当在权利要求中使用时,“由...组成”将指包括多个元素或元素列表中的恰好一个元素。一般而言,在后面有排他性术语,诸如“任一个”、“中的一个”、“中的仅一个”或“中的恰好一个”时,如本文所用的术语“或”应仅解释为表示排他性替代方案(即“一个或另一个但不是两者”)。当在权利要求中使用时,“基本上由……组成”应具有专利法领域中所使用的其普通含义。
如本文在说明书和权利要求中所使用的,短语“至少一个”在提及一个或多个元素的列表时,应理解为是指选自元素列表中的任何一个或多个元素的至少一个元素,但不必须包括元素列表中具体列出的每一个元素中的至少一个,并且不排除元素列表中的元素的任何组合。该定义还允许除了在短语“至少一个”所指的元素列表中具体标识的元素之外的元素可任选存在,无论与那些具体标识的元素相关还是不相关。因此,作为一个非限制性实例,“A和B中的至少一个”(或等效地,“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)可以指,在一个实施方案中,至少一个,任选地包括多于一个A,不存在B(并且任选地包括除B之外的元素);在另一个实施方案中,至少一个,任选地包括多于一个B,不存在A(并且任选地包括除A之外的元素);在另一个实施方案中,至少一个,任选地包括多于一个A,以及至少一个,任选地包括多于一个B(并且任选地包括其他元素);等等。
还应该理解的是,除非有相反的明确说明,否则在本文要求保护的任何包括多于一个步骤或动作的方法中,所述方法的步骤或动作的顺序不必须局限于所列举的方法的步骤或动作的顺序。
在权利要求以及以上说明书中,所有连接词诸如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“持有”、“由……构成”等应被理解为是开放式的,即意味着包括但不限于。如美国专利局专利审查程序手册第2111.03节中所阐述,只有连接词“由……组成”和“基本上由……组成”应分别为封闭或半封闭的连接词。应当理解的是,在本文件中使用开放式连接词(例如,“包含”)描述的实施方案在替代实施方案中也被设想为“由通过开放式连接词描述的特征组成”和“基本上由其组成”。例如,如果本公开描述了“一种包含A和B的组合物”,则本公开还设想了替代实施方案“一种由A和B组成的组合物”和“一种基本上由A和B组成的组合物”。
此外,本公开涵盖所有变型、组合和排列,其中将来自一个或多个所列权利要求的一个或多个限制、元素、条款和描述性术语引入另一权利要求中。例如,可以修改从属于另一权利要求的任何权利要求以包括在从属于同一基本权利要求的任何其他权利要求中存在的一个或多个限制。在元素被呈现为列表的情况下,例如,以马库什(Markush)组的格式,元素的每个子组也被公开,并且任何一个或多个元素可以从组中去除。应当理解,一般而言,在本公开或本公开的方面被称为包括特定元素和/或特征的情况下,本公开或本公开的方面的某些实施方案由此类元素和/或特征组成,或基本上由其组成。为简单起见,那些实施方案并未在本文中用同样的话具体阐述。还应注意,术语“包含”和“含有”旨在为开放的并允许包括另外的元素或步骤。在给出范围的情况下,端点被包括在内。此外,除非另外指出或从上下文和本领域普通技术人员的理解以其他方式显而易见,表示为范围的值可以在本公开的不同实施方案中假设所述范围内的任何特定值或子范围,至范围下限单位的十分之一,除非上下文另外明确指出。
本申请参考了各种授权专利、公布的专利申请、杂志文章以及其他出版物,所有这些均通过引用并入本文。本文公开的所有参考文献、专利和专利申请均相对于引用每一个所针对的主题通过引用并入,在一些情况下,可涵盖整个文件。如果任何并入的参考文献与本说明书之间存在冲突,应以本说明书为准。此外,本公开落入现有技术的任何特定实施方案可明确地排除在任何一项或多项权利要求之外。因为此类实施方案被认为是本领域普通技术人员已知的,所以即使在本文没有明确阐述排除,它们也可被排除在外。本公开的任何特定实施方案可以出于任何原因从任何权利要求中排除,无论是否与现有技术的存在有关。
本领域技术人员仅使用常规实验就将认识到或将能够确定本文所述的具体实施方案的许多等效方案。本文所述的本发明实施方案的范围不旨在局限于以上具体实施方式,而是如所附权利要求中所阐述。然而,本领域普通技术人员将了解,可在不脱离如以下权利要求所定义的本公开的精神或范围的情况下对本说明书做出各种改变和修改。
序列表
<110> 康纳根有限公司(Conagen Inc.)
<120> 用于将D-果糖生物转化为D-阿洛酮糖的D-阿洛酮糖3-差向异构酶
<130> C1497.70057WO00
<140> 尚未分配
<141> 同时随同提交
<150> US 63/022,617
<151> 2020-05-11
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 283
<212> PRT
<213> 未知(Unknown)
<220>
<223> 西尔瓦诺斯亚栖热菌(Meiothermus silvanus)
<400> 1
Met Pro Arg Phe Gly Ala His Ala Phe Ile Trp Ala Ala Glu Trp Asn
1 5 10 15
Pro Glu Ala Ala Glu Lys Val Ile Gln Gly Ala Thr Arg Val Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu His Pro Glu Ser Phe Asp Val Glu
35 40 45
Leu Thr Arg Arg Leu Leu Asn Gly Tyr Gly Val Gly Cys Thr Cys Ser
50 55 60
Leu Gly Leu Pro Arg Glu Ala Ser Leu Pro Glu His Pro Glu Ala Ala
65 70 75 80
Thr Arg Phe Leu Ile Gln Ala Leu Asn Val Ala His Gln Ile Gly Ser
85 90 95
Glu Val Leu Thr Gly Val Thr Tyr Ala Thr Leu Gly Thr Leu Ser Gly
100 105 110
Arg Ala Pro Arg Glu Ala Asp Tyr Gln Ala Val Val Lys Ala Leu Lys
115 120 125
Pro Ala Ala Arg His Ala Ala Ala Leu Gly Met Arg Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr Tyr Leu Ile Asn Leu Ala Ala Gln Gly
145 150 155 160
Leu Glu Leu Ile Arg Arg Leu Asp Glu Pro Asn Val Phe Leu His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Arg Gly Pro Ile
180 185 190
Val Glu Ala Gly Ala His Leu Gly Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Thr Gly Asn Val His Trp Asp Ala Val Phe Ala
210 215 220
Gly Leu Arg Glu Ile Gly Phe Ser Gly Asp Leu Val Met Glu Ser Phe
225 230 235 240
Val Ala Leu Asn Pro Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp
245 250 255
Val Val Gly Asp Pro Gln Ala Leu Val Gln Glu Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Ser Glu Tyr Gly Leu Leu Gly
275 280
<210> 2
<211> 852
<212> DNA
<213> 未知(Unknown)
<220>
<223> 西尔瓦诺斯亚栖热菌
<400> 2
atgccacgct tcggagctca tgcgttcatt tgggccgctg agtggaaccc ggaagcggca 60
gagaaagtga ttcagggtgc aacccgtgtt ggcctcgact tcgttgaaat tccgctcttg 120
cacccggaat ccttcgatgt cgagctcaca cgtcgtttac taaacgggta cggcgtcggt 180
tgtacgtgtt ctctgggctt gccgcgtgaa gcgtccctgc cggagcaccc cgaagccgcg 240
actcgttttc tgattcaggc cctgaatgtt gcacatcaga ttggctcaga ggtgctgacc 300
ggggtaacct acgcgacttt aggcacttta tctggccggg cgccgcgcga agctgattat 360
caagcagtcg taaaagcact gaaaccggcg gctagacatg cagcagcact gggtatgcgc 420
ctcggcattg aacccgttaa tcgttatgaa acttatttaa ttaacctggc cgctcagggc 480
ctggagttaa tccgtcgtct ggacgaaccg aatgtgttcc tgcacctgga tacgtaccac 540
atgaatattg aagagaaagg tttccggggc ccgatcgtgg aagcgggcgc ccacctgggg 600
tatattcatc tgagcgagag tgatcgcggc acccctggaa cgggcaacgt ccattgggac 660
gcggtgttcg cggggctgcg tgaaattggc ttctcaggcg atttggtcat ggaaagcttc 720
gtcgcactga accctgatat tgcgcgcgct acatgcatgt ggcgggacgt cgttggcgat 780
ccccaggcgc tggtccagga aggcttagca tttctccgtg gcaaggctag cgagtatggc 840
ctactcggtt aa 852
<210> 3
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 深海热泉宏基因组(hydrothermal vent metagenome)
<400> 3
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Ser Trp Asp
1 5 10 15
Lys Lys Gly Ala Glu Tyr Ala Val Ser Gln Ala Val Arg Tyr Gln Met
20 25 30
Asp Phe Leu Glu Ile Ala Leu Leu Ser Pro Leu Asp Val Asp Ala Gln
35 40 45
His Ser Arg Arg Leu Leu Glu Lys Asn His Met Arg Ala Ile Cys Ser
50 55 60
Leu Gly Leu Pro Glu Gly Ala Trp Leu Ser Asn Asn Pro Gln Ala Gly
65 70 75 80
Val Glu Tyr Leu Lys Ile Ala Leu Glu Lys Thr Ala Glu Met Gly Cys
85 90 95
Glu Ala Leu Ser Gly Val Ile Tyr Gly Gly Ile Gly Glu Arg Thr Gly
100 105 110
Phe Pro Pro Thr Glu Lys Glu Leu Asp Asn Val Val Arg Ala Leu Gly
115 120 125
Glu Ala Ala Ser Tyr Ala Lys Ser Leu Gly Leu Leu Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Gly Arg Gln Ser
145 150 155 160
Val Glu Met Ile Glu Lys Val Gly Ala Ser Asn Met Phe Val His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Gln Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Ile Lys Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Ala Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Val Leu Ala Ala Ile Asn Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Val Asn Met Pro Pro Glu Ile Ala Tyr Gly Leu Ser Ile Trp Arg Pro
245 250 255
Val Ala Lys Ser Ala Asp Glu Val Met Glu Asn Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Gln Leu Leu
275 280
<210> 4
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 深海热泉宏基因组
<400> 4
atggaaggtt ttggagtgca cacgagcatg tggactatga gttgggataa gaagggtgcg 60
gagtatgctg taagccaggc ggtgcgctat cagatggatt ttcttgaaat cgctctgctg 120
agtccactgg atgtcgatgc ccagcatagt cgccgtctgc tagagaagaa ccacatgcgc 180
gcgatttgca gccttgggtt accggaaggt gcgtggctca gtaataaccc tcaggccgga 240
gtggaatacc tgaagatcgc cctggaaaag actgcggaga tgggttgcga agcgctgtcc 300
ggcgtaatct acggcggcat tggcgaaaga acaggttttc cgccgacgga gaaagagctg 360
gacaatgtcg tgcgcgcgct gggtgaagcg gcatcttacg caaaatcgtt aggccttctg 420
ctcggtattg aaccggtgaa ccggtatgag tctcatctga ttaatacggg acgtcagagt 480
gtggaaatga ttgaaaaggt cggtgcctct aacatgtttg ttcaccttga cacataccac 540
atgaatattg aagaaaaggg tgtggcacaa gggattctgg acgcgcgcga acacataaaa 600
tatatccacc tgtcagagtc tgaccgaggg actccgggcg caggcacgtg tgactgggat 660
gagattttcg cagtcctggc cgcaattaac tttaaaggcg gcttagcgat ggaatcgttc 720
gtgaacatgc cgccggaaat tgcctatggt ctgtccattt ggcgtccggt ggctaaatcg 780
gctgatgaag tcatggaaaa cggcctgccg tttctacgca acaaagcgcg ccagtatcag 840
ctgctgtaa 849
<210> 5
<211> 289
<212> PRT
<213> 未知(Unknown)
<220>
<223> 污泥嗜热梭菌(Thermoclostridium caenicola)
<400> 5
Met Lys Tyr Gly Ile Phe Tyr Ala Tyr Trp Glu Lys Glu Trp Lys Gly
1 5 10 15
Asp Phe Ile Thr Tyr Ile Glu Lys Val Lys Lys Leu Gly Phe Asp Ile
20 25 30
Leu Glu Val Gly Cys Gly Asp Phe His Lys Gln Pro Asp Ser Tyr Phe
35 40 45
His Thr Leu Arg Asp Ala Ala Arg Glu Tyr Asp Ile Ile Leu Thr Gly
50 55 60
Gly Tyr Gly Pro Arg Ala Glu His Asn Leu Cys Ser Pro Asp Thr Ala
65 70 75 80
Val Val Glu Asn Ala Leu Ala Phe Tyr Ser Asp Ile Phe Arg Lys Met
85 90 95
Glu Ile Ala Gly Ile Arg Ser Ile Gly Gly Gly Leu Tyr Ala Tyr Trp
100 105 110
Pro Val Asp Tyr Ser Arg Glu Pro Asp Lys Ala Gly Asp Leu Glu Arg
115 120 125
Ser Ile Lys Asn Met Arg Arg Leu Ala Asp Ile Ala Glu Arg His Gly
130 135 140
Ile Thr Leu Asn Met Glu Val Leu Asn Arg Phe Glu Gly Tyr Leu Ile
145 150 155 160
Asn Asp Thr Asn Glu Gly Leu Ala Tyr Ile Arg Ala Val Asp Lys Pro
165 170 175
Asn Val Lys Leu Met Leu Asp Thr Phe His Met Asn Ile Glu Glu Asp
180 185 190
Ser Phe Thr Glu Pro Ile Leu Gln Ala Gly Lys Tyr Leu Gly His Val
195 200 205
His Val Gly Glu Pro Asn Arg Lys Pro Pro Arg Glu Gly Arg Ile Pro
210 215 220
Trp Gly Glu Ile Gly Lys Ala Leu Arg Gln Ile Gly Tyr Asp Gly Pro
225 230 235 240
Val Val Met Glu Pro Phe Val Thr Met Gly Gly Gln Val Gly Lys Asp
245 250 255
Ile Cys Val Trp Arg Asp Leu Ser Gln Gly Ala Thr Glu Glu Asp Leu
260 265 270
Asp Arg Asp Ala Glu Lys Ser Leu Ala Phe Leu Lys Gly Met Phe Glu
275 280 285
Ala
<210> 6
<211> 870
<212> PRT
<213> 未知(Unknown)
<220>
<223> 污泥嗜热梭菌
<400> 6
Ala Thr Gly Ala Ala Ala Thr Ala Thr Gly Gly Thr Ala Thr Ala Thr
1 5 10 15
Thr Thr Thr Ala Cys Gly Cys Ala Thr Ala Thr Thr Gly Gly Gly Ala
20 25 30
Gly Ala Ala Ala Gly Ala Ala Thr Gly Gly Ala Ala Ala Gly Gly Cys
35 40 45
Gly Ala Cys Thr Thr Thr Ala Thr Cys Ala Cys Ala Thr Ala Cys Ala
50 55 60
Thr Thr Gly Ala Gly Ala Ala Ala Gly Thr Thr Ala Ala Gly Ala Ala
65 70 75 80
Ala Thr Thr Ala Gly Gly Cys Thr Thr Thr Gly Ala Cys Ala Thr Thr
85 90 95
Thr Thr Gly Gly Ala Ala Gly Thr Cys Gly Gly Cys Thr Gly Cys Gly
100 105 110
Gly Thr Gly Ala Thr Thr Thr Thr Cys Ala Thr Ala Ala Ala Cys Ala
115 120 125
Gly Cys Cys Gly Gly Ala Thr Thr Cys Ala Thr Ala Cys Thr Thr Cys
130 135 140
Cys Ala Cys Ala Cys Cys Cys Thr Gly Cys Gly Thr Gly Ala Thr Gly
145 150 155 160
Cys Cys Gly Cys Thr Cys Gly Cys Gly Ala Ala Thr Ala Cys Gly Ala
165 170 175
Cys Ala Thr Thr Ala Thr Thr Cys Thr Gly Ala Cys Cys Gly Gly Cys
180 185 190
Gly Gly Cys Thr Ala Thr Gly Gly Gly Cys Cys Gly Cys Gly Cys Gly
195 200 205
Cys Cys Gly Ala Ala Cys Ala Cys Ala Ala Cys Thr Thr Gly Thr Gly
210 215 220
Thr Ala Gly Cys Cys Cys Gly Gly Ala Thr Ala Cys Ala Gly Cys Gly
225 230 235 240
Gly Thr Cys Gly Thr Thr Gly Ala Ala Ala Ala Thr Gly Cys Cys Cys
245 250 255
Thr Gly Gly Cys Ala Thr Thr Thr Thr Ala Cys Thr Cys Cys Gly Ala
260 265 270
Thr Ala Thr Ala Thr Thr Thr Cys Gly Cys Ala Ala Ala Ala Thr Gly
275 280 285
Gly Ala Ala Ala Thr Thr Gly Cys Cys Gly Gly Cys Ala Thr Cys Cys
290 295 300
Gly Thr Thr Cys Gly Ala Thr Cys Gly Gly Cys Gly Gly Cys Gly Gly
305 310 315 320
Thr Cys Thr Ala Thr Ala Thr Gly Cys Gly Thr Ala Thr Thr Gly Gly
325 330 335
Cys Cys Ala Gly Thr Thr Gly Ala Thr Thr Ala Cys Ala Gly Cys Cys
340 345 350
Gly Thr Gly Ala Ala Cys Cys Cys Gly Ala Cys Ala Ala Ala Gly Cys
355 360 365
Cys Gly Gly Cys Gly Ala Thr Thr Thr Ala Gly Ala Ala Cys Gly Thr
370 375 380
Thr Cys Cys Ala Thr Thr Ala Ala Gly Ala Ala Cys Ala Thr Gly Cys
385 390 395 400
Gly Thr Cys Gly Cys Thr Thr Ala Gly Cys Cys Gly Ala Thr Ala Thr
405 410 415
Thr Gly Cys Gly Gly Ala Ala Cys Gly Gly Cys Ala Thr Gly Gly Thr
420 425 430
Ala Thr Cys Ala Cys Gly Cys Thr Gly Ala Ala Thr Ala Thr Gly Gly
435 440 445
Ala Ala Gly Thr Gly Cys Thr Cys Ala Ala Thr Cys Gly Cys Thr Thr
450 455 460
Cys Gly Ala Ala Gly Gly Thr Thr Ala Cys Cys Thr Thr Ala Thr Thr
465 470 475 480
Ala Ala Thr Gly Ala Thr Ala Cys Cys Ala Ala Thr Gly Ala Ala Gly
485 490 495
Gly Thr Cys Thr Gly Gly Cys Cys Thr Ala Cys Ala Thr Thr Cys Gly
500 505 510
Thr Gly Cys Cys Gly Thr Cys Gly Ala Thr Ala Ala Ala Cys Cys Cys
515 520 525
Ala Ala Cys Gly Thr Ala Ala Ala Gly Thr Thr Gly Ala Thr Gly Cys
530 535 540
Thr Gly Gly Ala Thr Ala Cys Ala Thr Thr Thr Cys Ala Cys Ala Thr
545 550 555 560
Gly Ala Ala Cys Ala Thr Thr Gly Ala Gly Gly Ala Ala Gly Ala Thr
565 570 575
Ala Gly Cys Thr Thr Thr Ala Cys Cys Gly Ala Ala Cys Cys Cys Ala
580 585 590
Thr Thr Cys Thr Cys Cys Ala Gly Gly Cys Thr Gly Gly Thr Ala Ala
595 600 605
Gly Thr Ala Cys Cys Thr Gly Gly Gly Cys Cys Ala Thr Gly Thr Ala
610 615 620
Cys Ala Thr Gly Thr Cys Gly Gly Cys Gly Ala Ala Cys Cys Ala Ala
625 630 635 640
Ala Thr Cys Gly Thr Ala Ala Ala Cys Cys Ala Cys Cys Ala Cys Gly
645 650 655
Gly Gly Ala Ala Gly Gly Thr Cys Gly Thr Ala Thr Thr Cys Cys Gly
660 665 670
Thr Gly Gly Gly Gly Cys Gly Ala Gly Ala Thr Thr Gly Gly Cys Ala
675 680 685
Ala Ala Gly Cys Gly Cys Thr Gly Cys Gly Cys Cys Ala Gly Ala Thr
690 695 700
Thr Gly Gly Gly Thr Ala Cys Gly Ala Cys Gly Gly Thr Cys Cys Cys
705 710 715 720
Gly Thr Gly Gly Thr Gly Ala Thr Gly Gly Ala Ala Cys Cys Gly Thr
725 730 735
Thr Thr Gly Thr Thr Ala Cys Cys Ala Thr Gly Gly Gly Cys Gly Gly
740 745 750
Cys Cys Ala Ala Gly Thr Gly Gly Gly Gly Ala Ala Ala Gly Ala Cys
755 760 765
Ala Thr Thr Thr Gly Thr Gly Thr Gly Thr Gly Gly Cys Gly Gly Gly
770 775 780
Ala Cys Cys Thr Thr Ala Gly Cys Cys Ala Ala Gly Gly Thr Gly Cys
785 790 795 800
Gly Ala Cys Cys Gly Ala Ala Gly Ala Ala Gly Ala Thr Cys Thr Gly
805 810 815
Gly Ala Thr Cys Gly Cys Gly Ala Thr Gly Cys Thr Gly Ala Gly Ala
820 825 830
Ala Ala Ala Gly Cys Cys Thr Gly Gly Cys Cys Thr Thr Thr Cys Thr
835 840 845
Gly Ala Ala Ala Gly Gly Ala Ala Thr Gly Thr Thr Thr Gly Ala Ala
850 855 860
Gly Cys Cys Thr Ala Ala
865 870
<210> 7
<211> 290
<212> PRT
<213> 未知(Unknown)
<220>
<223> 深海热泉宏基因组
<400> 7
Met Asn Leu Pro Ala Lys Lys Met Val Leu Gly Val His Thr Phe Ala
1 5 10 15
Val Ala Pro Phe Trp Asp Leu Glu Val Met Arg His Glu Ala Arg Arg
20 25 30
Leu Lys Ser His Gly Val Gly Leu Leu Glu Ile Pro Leu Leu Arg Pro
35 40 45
Glu Glu Ile Asn Ile Lys Ala Thr Arg Ala Phe Ala Arg Glu Phe Gly
50 55 60
Phe Glu Leu Val Thr Ser Leu Gly Leu Pro Ser Asn Ile Asp Ala Val
65 70 75 80
Glu Asp Pro Gln Ser Ala Leu Ala Phe Leu Glu Pro Ala Phe Lys Val
85 90 95
Ala Ala Glu Ile Gly Ser Asn Met Leu Ser Gly Val Thr Tyr Ala Pro
100 105 110
Ile Gly Lys Ile Ser Gly Gln Pro Val Thr Gln Arg Glu Lys Asp Gly
115 120 125
Ile Cys Arg Phe Leu Gln Gln Ala Ala Ala Leu Ala Ala Asn His Gly
130 135 140
Leu Lys Leu Gly Val Glu Pro Cys Asn Arg Tyr Glu Thr His Leu Met
145 150 155 160
Asn Thr Ala Ala Gln Ala Val Glu Tyr Val Glu Ala Val Ala Ala Glu
165 170 175
Asn Leu Phe Ile His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Glu
180 185 190
Ser Phe Ala Ala Gly Phe Ala Lys Ala Ala Pro Tyr Leu Gly Tyr Val
195 200 205
His Leu Ser Glu Ser Asn Arg Gly Val Pro Gly Arg Ala Met Ile Asn
210 215 220
Trp Asp Ala Val Met Gly Ala Leu Ala Asp Ile Gly Tyr His Gly Ala
225 230 235 240
Leu Thr Leu Glu Ser Met Asn Tyr Val Asp Pro Asp Ile Ala Thr Ala
245 250 255
Leu Ala Val Trp Arg Pro Val Ala Lys Asn Pro Asp Asp Val Ile Asp
260 265 270
Phe Gly Leu Ala Phe Leu Leu Lys Ala Ala Ala Asp Ala Gly Leu Thr
275 280 285
Phe Gly
290
<210> 8
<211> 873
<212> DNA
<213> 未知(Unknown)
<220>
<223> 深海热泉宏基因组
<400> 8
atgaacctgc cggctaagaa gatggtcctg ggagtccata cgttcgcagt cgccccgttt 60
tgggatcttg aagtaatgcg ccacgaggcc cgccgtttaa agagccatgg cgtagggtta 120
ttggaaatcc cacttctccg gccagaagaa attaatatta aagcgacccg cgcatttgct 180
cgtgaatttg ggtttgaatt agtgaccagt ttaggcctgc cttcgaatat cgacgctgta 240
gaagatccgc agtctgcttt agcctttctg gaaccggcgt tcaaagtggc tgctgaaatt 300
ggtagcaata tgctttcagg cgttacctat gctccgattg gaaagataag tggtcagccg 360
gtgacccagc gtgagaagga tggtatttgt cggttcctac aacaagcggc tgcgttggcc 420
gcgaaccatg ggttgaaact gggcgtagag ccttgtaatc gctatgaaac gcatctgatg 480
aacacagcag cccaagcagt tgaatacgtt gaggctgtgg cagcggaaaa ccttttcatc 540
cacttagata cctaccacat gaacatcgaa gaagaaagtt ttgcagcagg gtttgcgaaa 600
gcggcgcctt atctggggta cgtgcatctg agcgagagca atcgcggcgt accgggccgc 660
gccatgatca attgggatgc agtgatgggt gcccttgccg acatcgggta tcatggggca 720
ctgactctgg agtctatgaa ttatgtggat ccggatattg cgactgccct tgcggtctgg 780
cgtccggttg ccaagaaccc ggacgatgtg atagactttg gcctggcgtt tctgctgaag 840
gccgcagcgg atgcgggttt gacattcggt taa 873
<210> 9
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 谷粒亚栖热菌(Meiothermus granaticius)
<400> 9
Met Ala Arg Phe Gly Ala His Ala Phe Ile Trp Ser Ala Asp Trp Thr
1 5 10 15
Pro Gln Ala Ala Glu Lys Val Ala Ala Gly Ala Ala Ala Ala Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Ala Phe Asp Ser Thr
35 40 45
Leu Thr Arg Arg Leu Leu Glu His His Gly Leu Gly Cys Thr Cys Ser
50 55 60
Leu Gly Leu Pro Thr Glu Ala Ala Leu Pro Asp His Pro Gln Ala Ala
65 70 75 80
Ala Arg Phe Leu Ile Gln Ala Leu Asp Val Ala His Gln Met Gly Ser
85 90 95
Pro Val Leu Ser Gly Val Thr Tyr Ala Thr Leu Gly Ala Leu Ser Gly
100 105 110
Arg Pro Pro Thr Glu Ala Asp Tyr Glu Thr Leu Ala Lys Thr Leu Lys
115 120 125
Pro Val Ala Gln His Ala Ala Arg Leu Gly Met Arg Leu Gly Leu Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr Tyr Leu Ile Asn Leu Gly Ser Gln Ala
145 150 155 160
Leu Asp Leu Ile Gln Arg Ile Gly Glu Pro Asn Val Phe Val His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Lys Asn Pro Ile
180 185 190
Val Thr Val Gly Lys His Leu Gly Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Ser Gly Asn Val His Trp Asp Glu Val Phe Ser
210 215 220
Gly Leu Gln Ala Ile Gly Phe Gln Gly Asp Leu Val Met Glu Ser Phe
225 230 235 240
Val Ala Leu Asn Pro Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp
245 250 255
Val Val Gly Asp Pro Lys Thr Leu Val His Asp Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Arg Glu Tyr Gly Leu Leu
275 280
<210> 10
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 谷粒亚栖热菌
<400> 10
atggcgcgct ttggtgcgca tgcttttatt tggagtgctg attggacccc tcaagccgcc 60
gaaaaggtcg cagcgggagc agcggcggcg ggactggatt ttgtcgaaat accgcttctt 120
cgtccagagg cgttcgattc gacacttacc cgtaggttat tagagcatca tggactggga 180
tgcacctgct ctctgggtct gcctaccgag gcagcactcc cggaccatcc tcaagcagca 240
gcccgttttc tcatccaggc cttggatgta gcccatcaaa tgggcagccc ggtcctgagt 300
ggggtcacct acgcaaccct gggcgcactg tcaggccgcc cgccgaccga ggccgattat 360
gaaaccctgg cgaaaacact gaagccagta gcgcagcacg ccgcccgcct gggtatgcga 420
ctcgggcttg aaccggttaa ccgctatgaa acatacctga taaacttagg gtcacaggcg 480
ctggatctca tccaacgtat cggcgaaccg aacgtgttcg tacacctgga tacttatcac 540
atgaacatcg aagagaaagg ttttaagaac ccgattgtta ccgtcggtaa acatcttggt 600
tatattcacc tgtctgaaag cgaccgtggt accccaggta gcggtaatgt gcattgggat 660
gaagtgttct ccggcctgca agcaatcggt tttcagggtg accttgtgat ggagtcgttt 720
gtggcactga atccggatat tgcccgcgcc acgtgcatgt ggcgggatgt tgtgggagat 780
ccgaaaacac tggtgcatga tggcctagct ttcctgcgcg gtaaagctcg cgaatacgga 840
ctgctgtaa 849
<210> 11
<211> 283
<212> PRT
<213> 未知(Unknown)
<220>
<223> 嗜热微红微菌(Rubellimicrobium thermophilum)
<400> 11
Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asp Thr Ala Ile Val Asp Ala Ala
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Gly Leu Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Pro Val Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Ala His Leu Lys Arg Ala Leu Asp Lys Thr Ala Glu Met Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly
100 105 110
Val Pro Pro Thr Pro Gln Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu
115 120 125
Ala Ala Ala Lys His Ala Lys Ala Leu Gly Leu Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Gly Arg Gln Ala
145 150 155 160
Val Glu Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Ala Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Gln Val Ala Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Ser Phe Glu Glu Val Met Asp Arg Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile Ala
275 280
<210> 12
<211> 852
<212> DNA
<213> 未知(Unknown)
<220>
<223> 嗜热微红微菌
<400> 12
atgcaaggtt tcggcgtaca cactagcatg tggacgatgc attgggatcg cgcgggcgcc 60
gagcgcacca ttccggccgc cgccgcctac aaaatggact ttatcgaaat tgcgctgctg 120
gatacagcta tagtcgatgc agcgcacacc cgtgcgctgc tggagaagca cggcctgcgt 180
gcagtttgtt cactcggatt accggagccg gtctgggcct ctgtgaaccc ggaaggggcc 240
attgctcacc tgaaacgcgc gctggacaag accgcagaga tgggagctga agctctgtct 300
ggtgtgactt acggcggtat cggccagcgc acaggcgtac caccaacgcc ccaagaatac 360
gataacattg cccgtgccct tgaagcagct gcgaaacatg ccaaagcctt aggcctggcc 420
tttggtatcg aaccggttaa caggtatgaa aaccatttga taaacaccgg acgtcaagct 480
gtagaaatga tcgaaaaggt cggggcagat aacattttca tacacctgga tacgtatcac 540
atgaatatcg aagagaaagg tgtggcaaac ggtatcctgg atgcccgaga acaccttcgt 600
tatattcacc tgtcagaaag cgatcgcggc actcctggcg aagggacgtg tgattgggac 660
gaaatcttcg ctgcgttggc cgccatcggt tttaaaggcg gccttgctat ggaatccttt 720
attaacatgc cgcctcaagt cgcttacggc ctggcggtgt ggcgtcctgt tgccgaatct 780
tttgaagaag tcatggaccg tggcctgccg tttctacgta acaaggctcg tcagtataga 840
ttgatcgctt aa 852
<210> 13
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 暂定纲Thermofonsia分支1细菌(Candidatus Thermofonsia Clade 1bacterium)
<400> 13
Met Pro Thr Phe Gly Ala His Ala Phe Val Trp Ile Gly Asp Trp Thr
1 5 10 15
Thr Glu Ser Gly Asn Tyr Ala Ile Ala Gln Ala Gly Ala Leu Gly Phe
20 25 30
Asp Phe Ile Glu Ile Pro Leu Leu Ala Pro Gln Arg Phe Asp Ala Ala
35 40 45
Ser His Arg Gln Ala Leu Ala Gln Ala Gly Ile Gln Ala Thr Cys Ser
50 55 60
Leu Val Leu Pro Lys Gly Ala His Met Pro Arg Tyr Pro Glu Arg Ala
65 70 75 80
Arg Gln Phe Leu Tyr Glu Ala Leu Glu Lys Val Glu Ala Val Gly Ser
85 90 95
Gln Tyr Leu Gly Gly Cys Ile Ala Tyr Glu Leu Gly Tyr Leu Thr Gly
100 105 110
Gln Pro Pro Thr Pro Glu Glu Arg Gln Val Val Val Glu Val Leu Arg
115 120 125
Asp Val Ala Ala Glu Ala Arg Arg Arg Gly Ile Gln Leu Ala Leu Glu
130 135 140
Ala Cys Asn Arg Tyr Glu Thr Tyr Leu Tyr Asn Thr Leu Ala Asp Val
145 150 155 160
Arg Glu Thr Val Leu Ala Val Gly Ala Pro Asn Leu Lys Leu His Ala
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Glu Gly Phe Ala Gln Pro Leu
180 185 190
Ile Ala Cys Ala Asp Val Leu Asp Tyr Ile His Met Ser Glu Ser His
195 200 205
Arg Gly Leu Val Gly Ser Gly Asn Val Asn Trp Ala Gln Val Trp Gln
210 215 220
Ala Leu Ala Ala Ile Arg Phe Asn Gly Lys Leu Val Leu Glu Ser Phe
225 230 235 240
Ala Ala Ile Asn Pro Asp Leu Gln Ala Ala Thr Cys Leu Trp Arg Pro
245 250 255
Pro Asn Gln Pro Pro Glu Val Leu Ala Arg Glu Gly Leu Arg Phe Leu
260 265 270
Arg Glu Gly Ala Ala Gln Ala Gln Leu Pro
275 280
<210> 14
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 暂定纲Thermofonsia分支1细菌
<400> 14
atgccaacct tcggcgccca tgcatttgtg tggattggag attggacgac agaatcggga 60
aactatgcga tcgcgcaagc cggcgcactg ggcttcgact tcattgagat tccgcttttg 120
gcaccgcagc gttttgatgc cgcttcccac cgtcaagccc tggcgcaggc cggcattcag 180
gcgacgtgca gcctggtatt gccaaaaggc gctcacatgc ccaggtatcc agaacgtgcg 240
cgtcagttct tgtatgaagc gttagaaaag gtagaggcgg ttggaagtca atacttgggc 300
ggttgcatcg cgtacgaact tgggtatctt accggtcagc caccgacccc ggaagagcgt 360
caggttgttg tggaagtgct gcgcgatgta gccgcagaag cacgccgtcg cggcattcag 420
ttggcactgg aagcatgcaa tcgctatgag acttacctgt acaacacgct ggcggacgtg 480
cgcgaaacgg ttttagcggt gggcgcgcca aacttgaagc tgcatgcgga tacctaccac 540
atgaacatcg aagaagaagg ctttgcccag ccgcttattg cctgtgccga cgtgctggat 600
tatatccaca tgtcggaatc ccatcgcggc ctggtcggaa gcggcaacgt taattgggcg 660
caggtctggc aagcgctcgc cgcaattcgc ttcaatggca aactggtgct ggaatcgttt 720
gccgcgatta acccggacct tcaggccgct acttgtctgt ggcgcccgcc caaccagccg 780
ccggaagtgc tggcccgcga aggactgcga tttctccgag aaggtgcggc acaggcccaa 840
ctaccgtaa 849
<210> 15
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 韩国异常球菌(Deinococcus koreensis)
<400> 15
Met Leu Lys Phe Gly Ala His Ala Phe Cys Trp Glu Gly Asp Trp Thr
1 5 10 15
Asp Glu Ile Gly Asp Arg Val Ile Glu Gln Ala Ala Arg Ala Gly Leu
20 25 30
Asp Phe Ile Glu Ile Pro Leu Leu His Pro Glu Thr Phe Asp Ala Arg
35 40 45
Arg His Arg Arg His Leu Glu Ala Val Gly Leu Ala Cys Val Ser Ser
50 55 60
Leu Gly Leu Pro Arg Asp Ala His Met Pro His Glu Pro Glu Lys Ala
65 70 75 80
Val Thr Phe Leu Thr Gly Val Leu Asp Arg Met Glu Glu Leu Gly Ala
85 90 95
Arg Asp Leu Thr Gly Cys Thr Gly Tyr Ser Ile Gly Val Leu Thr Gly
100 105 110
Gln Gly Pro Thr Ser Gln Glu Leu Asp Arg Met Val Asp Gly Leu Ala
115 120 125
Arg Val Thr Glu Asp Ala Arg Ser Arg Gly Ile Gly Val Gly Leu Glu
130 135 140
Ala Ile Asn Arg Tyr Glu Thr Tyr Met Val Asn Thr Leu Asp Asp Ala
145 150 155 160
Leu Ala Val Val Asn Arg Val Gly Ser Asp Asn Leu Arg Val His Ala
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Thr Asn Leu Arg Glu Ala Leu
180 185 190
Gly Arg Val Lys Gly Lys Leu Asn Phe Ile His Met Ser Glu Ser His
195 200 205
Arg Gly Leu Val Gly Thr Gly Thr Val Pro Trp Glu Asp Val Trp Gln
210 215 220
Gly Leu Ala Asp Ile Glu Phe Ser Gly Tyr Leu Thr Leu Glu Ser Phe
225 230 235 240
Ala Ala Pro Asn Ala Glu Leu Ala Ala Ala Thr Cys Ile Trp Lys Pro
245 250 255
Pro Arg His Ser Gly Gln Glu Leu Ala Gln Gly Gly Leu Ala Phe Leu
260 265 270
Arg Glu Gly Ala Thr Arg His Gly Leu Met
275 280
<210> 16
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 韩国异常球菌
<400> 16
atgttgaagt tcggcgcgca cgccttttgc tgggaaggcg attggaccga tgaaattggc 60
gatcgcgtca tcgagcaagc ggcgcgggcc ggattggatt tcattgaaat cccgctcttg 120
caccctgaaa ccttcgatgc gcgccgtcat cgtcgccatc ttgaggctgt gggcctggcg 180
tgcgtttcca gcctgggcct tccgcgtgac gcccacatgc cacatgaacc ggagaaagcg 240
gtaacattcc ttaccggcgt actggatcgc atggaagaac tgggcgctcg cgaccttacc 300
ggttgtaccg gttatagcat tggcgtactg accggccagg gtccgacctc tcaagagctc 360
gatcgtatgg tggatggtct ggctcgtgtg actgaagatg cacggtcgcg cgggattggc 420
gtaggccttg aagccatcaa tcgttatgaa acttatatgg taaacacgct ggacgatgcg 480
ttagcggtcg tgaatcgtgt cgggagtgac aatcttcgcg ttcatgccga tacataccac 540
atgaacatag aagaaaccaa cctgcgtgag gcgcttgggc gagttaaggg taagctgaac 600
ttcattcaca tgagtgaaag tcatcgtggt ctggttggta ccgggacagt tccatgggaa 660
gatgtttggc agggtctggc ggatattgag ttcagcgggt atcttactct tgaatcgttt 720
gcagctccga atgccgagtt ggcggcagct acctgtatct ggaaaccacc acggcatagc 780
ggccaggaac tggcgcaggg tggcctagct tttctgcgcg agggcgcgac tcgccacggc 840
ttaatgtaa 849
<210> 17
<211> 281
<212> PRT
<213> 未知(Unknown)
<220>
<223> 阿氏厄尔巴线虫(Olavius algarvensis)螺旋体内共生体
<400> 17
Met Lys Phe Gly Ala His Ala Phe Val Trp Glu Pro Glu Trp Asn Asp
1 5 10 15
Thr Thr Ser Arg Arg Val Ile Ser Glu Ala Ala Arg Ile Gly Leu Asp
20 25 30
Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Arg Phe Asp Gly Ala Ala
35 40 45
Thr Lys Val Leu Leu Asp Glu His Ala Val Gly Ala Thr Tyr Ser Leu
50 55 60
Gly Leu Pro Ser Asp Lys Ser Leu Pro Glu Arg Pro Tyr Leu Ala Glu
65 70 75 80
Pro Phe Leu Arg Ser Ala Ile Asp Ala Ile Glu Ser Ala Gly Gly Asp
85 90 95
Thr Leu Thr Gly Val Leu Tyr Gly Thr Leu Gly Glu Leu Pro Gly Arg
100 105 110
Pro Pro Asn Glu Lys Asp Tyr Lys Val Ile Ala Gln Val Leu Arg Ser
115 120 125
Val Ala Asp Tyr Ala Lys Asp Arg Gly Ile Lys Leu Gly Ile Glu Pro
130 135 140
Val Asn Arg Tyr Glu Thr Phe Leu Val Asn Thr Ala Glu Gln Ala Ile
145 150 155 160
Thr Leu Leu Asp Arg Ile Glu Ser Asp Asn Val Phe Ile His Leu Asp
165 170 175
Thr Tyr His Val Asn Ile Glu Glu Asp Ser Phe Gly Ala Ala Ile Arg
180 185 190
Leu Ala Gly Asp Arg Leu Gly Tyr Ile His Leu Ser Glu Ser His Arg
195 200 205
Gly Thr Pro Gly Lys Gly Thr Val Asp Trp Asp Asp Val Phe Gly Ala
210 215 220
Leu Ser Asp Ile Gly Phe Ala Gly Pro Leu Val Met Glu Ser Phe Val
225 230 235 240
Lys Leu Asn Ala Asp Ile Ala Arg Ala Thr Cys Met Trp Arg Asp Ile
245 250 255
Val Lys Asp Pro Glu Ala Leu Ile Arg Asp Gly Ile Ala Phe Leu Glu
260 265 270
Gly Lys Ala Lys Gly Tyr Gly Leu Phe
275 280
<210> 18
<211> 846
<212> DNA
<213> 未知(Unknown)
<220>
<223> 阿氏厄尔巴线虫螺旋体内共生体
<400> 18
atgaaatttg gtgcgcatgc tttcgtctgg gaaccagaat ggaatgatac cacctcgcgc 60
cgtgtgattt cagaggccgc gcgcatcggc ctggattttg tggaaatacc gctccttcgc 120
ccagaacgct ttgacggcgc cgctaccaaa gtcttgctgg atgaacatgc cgtgggcgcc 180
acttattcat tgggcctgcc cagtgacaaa agcctgccag aacgcccgta tctggctgaa 240
cccttcttac ggtctgcaat cgacgccatt gaatccgcag gcggtgatac actgacaggc 300
gtgctgtatg gcactctggg tgagctgccg ggccgcccgc cgaacgaaaa ggactacaaa 360
gtgattgcgc aggtattacg tagtgttgct gattacgcga aagaccgtgg catcaaactg 420
ggcattgagc cggtaaaccg ttatgaaacc tttctggtga ataccgcaga gcaggcgatc 480
acattgttag accgtatcga aagcgacaat gtctttattc atctggatac ctatcacgtg 540
aacatcgaag aagatagttt tggcgcggct atccgcctgg ctggggatcg tttaggctac 600
atccacctgt ccgaaagcca ccgtggcacg ccaggcaagg gtactgtgga ttgggacgac 660
gttttcggag cgctttccga tattggtttc gcaggccctc ttgtgatgga aagctttgtc 720
aagctgaatg cagacattgc acgtgcgacc tgcatgtggc gtgatattgt gaaagaccca 780
gaagccctga ttcgcgatgg tattgcgttt ctcgagggga aagcgaaagg ctatggtctg 840
ttttaa 846
<210> 19
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 嗜酸菌属(Acidiphilium)
<400> 19
Met Lys Gly Phe Gly Ile His Thr Ser Leu Trp Ala His Asp Trp Thr
1 5 10 15
Glu Gln Ala Ala Arg Leu Ala Ile Pro Glu Ala Ala Lys His Gly Leu
20 25 30
Ala Phe Val Glu Ile Ala Leu Ile Glu Pro Asp Arg Ala Glu Thr Glu
35 40 45
Val Thr Arg Gly Leu Leu Glu Gln His Gly Leu Ala Ala Cys Cys Ser
50 55 60
Leu Gly Leu Pro Glu Glu Ala Arg Pro Thr Thr Asn Pro Asp Lys Ala
65 70 75 80
Leu Glu Phe Val Thr Leu Ala Leu Glu Lys Thr Ala Ala Ile Gly Ala
85 90 95
Ser Leu Phe Thr Gly Val Thr Tyr Gly Ser Ile Gly Glu Arg Thr Gly
100 105 110
Gln Pro Pro Thr Ala Ala Glu Leu Asp Ala Val Ala Arg Phe Leu Asp
115 120 125
Lys Ala Ala Ala Val Ala Arg Gly Phe Gly Ile Ile Phe Gly Ile Glu
130 135 140
Val Val Asn Arg Tyr Glu Ser His Leu Phe Asn Thr Thr Glu Gln Ala
145 150 155 160
Val Ala Leu Ile Glu Arg Val Gly Ala Pro Asn Ile Val Leu His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Ala Thr Gly Gln Ala Asn Ala Ile
180 185 190
Arg Ala Ala Gly Ala His Leu Ala Tyr Ile His Leu Ser Glu Ser His
195 200 205
Arg Gly Val Pro Gly Thr Gly Thr Ile Ala Trp Asp Glu Val Phe Ala
210 215 220
Gly Leu Ala Gly Leu Gly Phe Thr Gly Gly Met Ala Leu Glu Ser Phe
225 230 235 240
Ile His Met Pro Pro Arg Leu Ala Ala Ala Leu Ser Val Trp Arg Pro
245 250 255
Val Ala Pro Ser Arg Ala Ala Ile Ile Asp Glu Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Gly Leu Ile
275 280
<210> 20
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 嗜酸菌属
<400> 20
atgaaaggct ttggcattca tacaagtctg tgggcccatg actggaccga gcaagcggct 60
cgtttagcaa ttccggaagc ggcaaaacat ggcctggcgt ttgtcgaaat tgctttaatt 120
gaaccagatc gcgcggaaac tgaagttacc cgcgggctgc tggaacagca cggcttggct 180
gcctgctgct ctctgggctt acctgaggaa gcgcggccaa cgacgaaccc ggataaagcg 240
ttggagttcg tcactttagc tctggaaaag accgcggcga taggggctag cctgtttacc 300
ggtgtgacct acgggagcat tggcgaacgt acgggccagc cacctactgc cgccgaactt 360
gatgcagtag caaggttctt ggataaggct gccgcagtag cgcgcggttt cggtatcatt 420
ttcggtatcg aagtagtgaa tcggtacgag tctcatctgt ttaacaccac cgaacaggcc 480
gttgcactga tcgaacgtgt cggcgcaccg aacatagtgc tgcacttaga cacgtatcac 540
atgaacatcg aagccacggg ccaggccaac gcaatacgcg cggcgggtgc acatctggcc 600
tatattcacc tgagtgaatc gcacaggggt gttccgggca cagggaccat cgcctgggac 660
gaggtgtttg caggtcttgc cggcctgggc tttaccggcg ggatggccct cgaatcattt 720
attcacatgc cgccccgcct ggccgccgcg ctgagcgtct ggcgtccagt tgcaccgagt 780
cgcgcggcca tcatcgatga aggccttcca tttctgcgaa ataaagcccg tcaatacggc 840
ctcatttaa 849
<210> 21
<211> 285
<212> PRT
<213> 未知(Unknown)
<220>
<223> 红细菌目细菌(Rhodobacterales bacterium)
<400> 21
Met Leu Ser Leu Gly Leu His Ala Leu Ala Ala Ala Pro Glu Trp Arg
1 5 10 15
Pro Asp Leu Trp Ala Ala Ile Leu Pro Arg Met Ala Ala His Gly Val
20 25 30
Ser Val Ile Glu Ile Pro Leu Leu Arg Pro Ala Glu Leu Asp Ile Ala
35 40 45
Gly Thr Arg Ala Leu Ala Ala Lys His Asp Val Glu Leu Val Cys Ser
50 55 60
Leu Gly Leu Pro Ala Thr Leu Asn Val Ala Glu Arg Pro Asp Glu Ala
65 70 75 80
Phe Asp Phe Ile Arg Val Ala Leu Glu Val Thr Ala Ser Ala Gly Ala
85 90 95
Thr Ala Leu Ser Gly Val Thr Phe Gly Val Ile Gly Gln Thr Thr Gly
100 105 110
Ala Ala Pro Thr Thr Arg Glu Ile Asp Ala Met Thr Arg His Val Ser
115 120 125
Arg Ser Ala Ala Leu Ala Lys Lys Leu Gly Leu Arg Phe Gly Ile Glu
130 135 140
Pro Cys Asn Arg Tyr Glu Thr His Leu Leu Asn Thr Gly Ala Ala Ala
145 150 155 160
Arg Ala Val Ile Glu Arg Ser Gly Ala Asp Asn Ala Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Val Ser His Ala Gln Gly Phe
180 185 190
Ala Asp Ala Gly Asp Leu Leu Gly Tyr Val His Leu Ser Glu Ser Asn
195 200 205
Arg Gly Val Pro Gly Arg Gly Thr Val Asp Trp Ala Asn Val Phe Gln
210 215 220
Gly Leu Lys Ala Ala Gly Phe Asp Gly Cys Ala Ala Leu Glu Ser Phe
225 230 235 240
Val Phe Val Asp Ala Asp Leu Ala Ser Gly Leu Ala Ile Trp Arg Pro
245 250 255
Val Ala Glu Asn Pro Asp Asp Val Ile Asp Val Gly Phe Pro Phe Leu
260 265 270
Arg Thr Ala Gly Glu Ala Ala Gly Leu Arg Trp Ala Arg
275 280 285
<210> 22
<211> 858
<212> DNA
<213> 未知(Unknown)
<220>
<223> 红细菌目细菌
<400> 22
atgctttctc tgggactgca tgcgcttgca gccgcccctg aatggcgccc ggatctgtgg 60
gcggcgatcc tgccgcgtat ggcggcccac ggtgttagcg ttatcgaaat tccgctgctc 120
cgtcctgctg aactggatat tgcgggcacg cgggctttag cggctaaaca tgatgttgaa 180
ctcgtttgtt cattggggct gccagccacc ctcaatgttg cggaacgccc tgatgaggcg 240
tttgatttta tccgcgtggc gttagaagtg accgcgagcg cgggtgcgac cgcgctgtca 300
ggagtgacat ttggcgtgat tgggcagacg acgggcgccg ccccaaccac gcgcgaaatc 360
gatgctatga cccggcatgt gagccgtagc gcagccctcg ccaagaaact gggcttgcgc 420
tttggcattg agccgtgcaa ccgctacgaa acccacttac tgaatactgg cgcagccgct 480
cgggccgtga tagaacgctc aggcgctgat aacgccttca tccatttgga tacatatcac 540
atgaatatcg aagaagtgtc tcatgctcag ggttttgcag atgcgggcga cctgctggga 600
tatgtgcact tgtcagaaag caatcgaggc gtcccggggc gtggtaccgt cgattgggcg 660
aatgtatttc agggtctgaa agccgccgga ttcgatggtt gcgccgcact cgaaagtttc 720
gtgttcgttg acgcggactt agcatccgga cttgccatct ggcgtcctgt tgctgaaaac 780
ccagatgacg tgattgacgt aggtttcccg ttcttgcgga cagccggaga ggcggcgggc 840
ttgcgctggg cgcgttaa 858
<210> 23
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 绿弯菌门细菌(Chloroflexi bacterium)
<400> 23
Met Val Leu Phe Gly Ala His Thr Phe Ile Trp Ser Ala Glu Trp Asn
1 5 10 15
Pro Glu Thr Ala Glu His Val Ile Asp Gly Ala Ala Arg Ala Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu His Pro Asp Gln Met Asp Ala Gly
35 40 45
Gly Thr Arg Arg Leu Leu Glu Asn Tyr Gly Leu Gln Cys Thr Cys Ser
50 55 60
Leu Gly Leu Pro Arg Glu Ala His Leu Pro Phe Ala Pro Asp Lys Ala
65 70 75 80
Thr Gly Phe Leu Glu Gln Ala Val Asp Val Thr Ser Asp Leu Gly Ser
85 90 95
Pro Val Leu Thr Gly Cys Leu Tyr Thr His Leu Gly Thr Leu Thr Gly
100 105 110
Lys Pro Pro Thr Asp Glu Glu Ile Asp Leu Val Val Arg Val Leu Lys
115 120 125
Arg Ile Ala Arg Tyr Ala Gln Asp Arg Gly Ile Ser Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr Tyr Leu Leu Asn Leu Ala Glu Gln Ala
145 150 155 160
Ser Ala Leu Leu Asp Arg Ile Asp Glu Ala Asn Val Phe Val His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Phe Tyr Thr Pro Ile
180 185 190
Val Asp Thr Gly Pro Arg Leu Gln Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Ile Pro Gly Thr Gly Asn Val His Trp Asp Glu Val Phe Arg
210 215 220
Gly Leu Lys Ala Val Lys Tyr Glu Gly Arg Leu Val Met Glu Ser Phe
225 230 235 240
Ala Ala Val Asn Glu Asp Leu Met Gly Ala Thr Ala Met Trp Arg Asp
245 250 255
Val Val Gly Asp Pro Asp Arg Leu Val Thr Glu Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Ile Glu Tyr Gly Leu Leu
275 280
<210> 24
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 绿弯菌门细菌
<400> 24
atggtactgt ttggggcgca tacctttatt tggagcgccg aatggaaccc agaaacggcg 60
gaacatgtaa ttgatggcgc agctcgcgcc ggcctggatt tcgttgagat tccgttgctg 120
catcccgatc agatggacgc aggcggcacg cgccggcttt tggaaaacta tggtctgcaa 180
tgcacatgta gcttgggcct gccgcgcgaa gcgcatctgc cattcgcccc tgacaaggca 240
acaggctttc tggaacaggc cgtcgatgtg acaagtgacc tgggtagccc tgttttgacc 300
ggctgtttat atacccactt aggaacgctg acaggaaagc cgcctaccga cgaagagatt 360
gatttggtcg ttcgtgtcct gaagcgaatt gcgcgctacg cccaggaccg agggattagt 420
ctgggcatcg aaccggtcaa ccgctatgaa acctatcttc tgaatctggc ggagcaagcg 480
tctgcactgc tcgatcgtat tgacgaagcc aatgtatttg tgcatctgga tacctatcac 540
atgaacattg aagaaaaggg cttttatact ccgatcgttg ataccgggcc gcgtttacag 600
tacattcacc tgtccgaatc ggaccgcggt atcccgggta ctggcaacgt tcattgggac 660
gaggtgtttc gaggcctcaa ggccgttaaa tacgaaggcc gtcttgtgat ggaatctttc 720
gccgcagtca acgaagatct gatgggtgca acggcgatgt ggcgggatgt ggtgggtgat 780
ccggatcgat tagtcacgga aggcctggcg ttcttacgtg gaaaggcgat tgagtacggc 840
ctgctgtaa 849
<210> 25
<211> 283
<212> PRT
<213> 未知(Unknown)
<220>
<223> 螺旋杆菌属物种(Spiribacter sp.) E85
<400> 25
Met Ala Glu Phe Gly Ala His Ala Phe Ile Trp Glu Ser Asp Trp Asn
1 5 10 15
Pro Ala Ser Ala Arg Arg Val Ile Ala Gly Ala Ala Ala Ala Gly Leu
20 25 30
Asp Phe Val Glu Ile Pro Leu Leu Arg Pro Glu Ser Met Asp Thr Ala
35 40 45
Gly Thr Arg Arg Leu Leu Ala Glu His Arg Leu Gly Val Arg Cys Ser
50 55 60
Leu Gly Leu Pro Pro Ala Ala Ser Leu Pro Ala His Pro Gln Ala Ala
65 70 75 80
Glu Ala Phe Leu Cys Arg Ala Leu Asp Val Thr Arg Ala Leu Gly Gly
85 90 95
Pro Val Leu Thr Gly Val Ile Tyr Gly Thr Leu Gly Gln Leu Pro Gly
100 105 110
His Pro Pro Arg Pro Gly Asp Leu Asp Ile Val Ala Gln Thr Leu Arg
115 120 125
Arg Val Ala Ala Tyr Ala Ala Asp Gln Gly Leu Ala Leu Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr His Leu Val Asn Leu Thr Asp Gln Ala
145 150 155 160
Leu Glu Leu Leu Asp Ala Ile Gly Ala Asp Asn Val Phe Leu His Leu
165 170 175
Asp Thr Tyr His Met Asn Val Glu Glu Lys Gly Phe Arg Gly Pro Val
180 185 190
Glu Ala Ala Gly Lys Arg Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Thr Gly Asn Val His Trp Asp Glu Val Phe Asp
210 215 220
Gly Leu Ala Ala Ile Gly Tyr Arg Gly Asp Leu Val Met Glu Ser Phe
225 230 235 240
Ala Ala Val Asn Glu Asp Ile Ala Arg Ala Thr Cys Ile Trp Arg Gln
245 250 255
Val Ala Pro Asp Pro Asp Thr Leu Val Arg Glu Gly Leu Ala Phe Leu
260 265 270
Arg Gly Lys Ala Thr Ala Arg Gly Leu Ile Pro
275 280
<210> 26
<211> 852
<212> DNA
<213> 未知(Unknown)
<220>
<223> 螺旋杆菌属物种E85
<400> 26
atggcggagt tcggtgcaca tgctttcatt tgggagtctg actggaatcc ggcgtcagct 60
cgccgtgtca ttgccggcgc cgctgccgcc ggcctagatt tcgtcgagat cccactgctc 120
cgcccggaat ccatggacac cgcgggaacc cgcagattac ttgctgaaca tcgcctcggc 180
gtgcgctgtt cactgggcct gccgccggca gcgagtctac ccgctcatcc gcaggccgca 240
gaagcattcc tttgccgcgc cctagacgtt acgcgtgcgt tgggcggacc cgtactcact 300
ggtgtcatct atggcactct gggccagtta ccgggtcacc cgccacgccc tggcgatctt 360
gacattgtcg cacagacctt acggcgcgtg gcagcgtacg ccgcagatca gggtctggcc 420
ctgggcattg aaccagtgaa ccgttatgaa acacatttag tgaatctcac ggatcaagcc 480
ctagaactgt tagatgcgat tggcgccgac aatgtattcc tgcatctgga tacctatcac 540
atgaacgtgg aagagaaagg ttttcgtggt ccagttgaag cagctggtaa acgtttgaga 600
tacattcatc tttcggagtc agatcgtggt accccgggga caggcaacgt tcactgggat 660
gaagtattcg acggtctggc tgcaatcgga taccgtgggg atctggtgat ggaaagtttt 720
gcggccgtga atgaggacat tgcgcgtgcg acctgcatct ggcgtcaagt tgccccagac 780
ccggacactc tggttagaga aggcttggcg tttcttcgcg gcaaagcgac cgcccgcggc 840
cttatccctt aa 852
<210> 27
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 大不里士杆菌属物种(Tabrizicola sp.) TH137
<400> 27
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Arg Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Thr Ala Ile Val Asp Ala Ala
35 40 45
His Thr Arg Ala Leu Leu Glu Arg His Gly Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Arg Asn Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Ala His Leu Cys Asp Cys Ile Asp Thr Ala Ala Ala Met Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly
100 105 110
Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Ala
115 120 125
Ala Val Ala Lys His Ala Lys Ala Arg Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Ala Ala Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Asp His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Tyr Ala
210 215 220
Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Val Ala Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Asn Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 28
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 大不里士杆菌属物种TH137
<400> 28
atggaaggat ttggtgtaca tacttccatg tggacaatgc actgggatcg cgcgggcgct 60
gaacgtacca ttcctgccgc agctgcgtac cgcatggatt tcatagagat tgctttatta 120
aacacagcca ttgttgacgc ggcacacacg agggctctcc ttgaacggca tggcatgcgc 180
gcagtgtgtt cattgggctt acctgaacgc aattgggcga gcgtgaaccc ggaaggcgcc 240
atcgcacatc tgtgcgattg tattgacaca gcagcagcca tgggcgccga agccctatcc 300
ggcgtcacgt atggcggcat cgggcaacgt acggggctcc cgcctacgat ggccgaatac 360
gataacattg cccgcgctct ggcagctgtg gcgaaacatg ctaaagcacg cggcattgcg 420
tttggtatcg aacccgtgaa tcgctacgaa aatcacttga ttaataccgc cgcacaagct 480
aaatggatga tcgaaaaggt tggggctgat aatatattta ttcatctgga cacctatcac 540
atgaacatag aggaaaaggg agccggcaat gggatcctcg atgcgcgtga tcatttgaga 600
tatatccact tatcggaatc ggatcgcggc actccgggcg aaggcacgtg tgactgggat 660
gaggtatatg ctaccctggc cgccattggt tttaaaggcg gtttggctat ggaatcgttt 720
attaatatgc caccggaagt ggcctatggt cttgccgtct ggcgtccggt ggcggaaaat 780
tttgaggaag tgatggataa aggactcccg ttcttgcgta ataaagcgcg ccaatatcgc 840
ctgatataa 849
<210> 29
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 异食烷烃热带单胞菌(Tropicimonas isoalkanivorans)
<400> 29
Met Lys Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Asp Gly Ala Glu Arg Thr Ile Pro Ala Thr Ala Ala Tyr Gly Met
20 25 30
Asp Phe Val Glu Ile Ala Leu Leu Asp Thr Ser Ile Val Asp Ala Ala
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Glu Leu Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Gly Ser Trp Pro Ser Val Ala Pro Glu Ala Ala
65 70 75 80
Val Ala His Leu Lys Asp Val Phe Glu Thr Ala Ala Ala Met Gly Ala
85 90 95
Glu Ala Val Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Ser Gly
100 105 110
Val Pro Pro Thr Glu Glu Glu Tyr Asp Asn Val Ala Arg Ala Leu Gln
115 120 125
Gln Ala Ala Ala Tyr Ala Lys Arg Leu Gly Leu Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Ala Trp Gln Ala
145 150 155 160
Arg Asp Met Ile Glu Lys Val Gly Ser Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Ala Asn Gly Ile
180 185 190
Leu Asp Ala Arg Asp His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Cys Cys Asp Trp Asn Glu Val Phe Gly
210 215 220
Thr Leu Ser Ala Ile Gly Phe Glu Gly Gly Met Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Gln Ile Ala Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Asp Ser Phe Glu Asp Val Met Asp Arg Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ala
275 280
<210> 30
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 异食烷烃热带单胞菌
<400> 30
atgaagggtt tcggggtgca cacgagtatg tggacgatgc attgggaccg ggatggcgcg 60
gaacgtacaa ttccagcgac ggccgcgtat ggcatggatt ttgtcgagat cgctctgttg 120
gatacctcta tcgttgatgc tgcgcacacc cgggcgctcc tggagaaaca cgagctgcgc 180
gccgtttgct cgttgggcct gccggaaggc tcgtggcctt cggttgcccc agaggcggcg 240
gtagcgcatc tgaaagacgt atttgaaacc gcagccgcga tgggcgccga agcggtttcg 300
ggcgtcacat acggcggtat tggccaacgt tccggtgtgc cgcccaccga ggaagaatat 360
gacaacgtag ctcgtgccct gcaacaggca gcggcttacg ccaaacgctt aggcttagcc 420
tttggcattg aacctgtgaa ccgctacgaa aaccatttga tcaacactgc atggcaggcc 480
cgtgacatga ttgaaaaggt aggctcggac aatattttca tccatttaga tacttaccac 540
atgaatatag aagagaaagg tgtggcgaac ggtatcttag acgcacgtga tcaccttcgt 600
tatattcatc tttcagagag cgaccgtggc actccgggtg aaggttgctg cgattggaac 660
gaagttttcg ggaccttgag cgctattggg tttgaaggtg gtatggcgat ggaatcgttt 720
attaacatgc cgccgcagat agcttacggc ctggccgttt ggcgaccagt tgcggactcc 780
ttcgaagatg tgatggatcg cgggctgccg tttctgcgta acaaagcgcg tcagtaccgt 840
ctggcttaa 849
<210> 31
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 红杆菌科细菌(Rhodobacteraceae bacterium)
<400> 31
Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Leu Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asp Thr Ser Val Val Asp Ala His
35 40 45
His Thr Arg Asp Leu Leu Ala Lys His Glu Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Arg Glu Ser Trp Ala Ser Val Asn Pro Asp Gly Ala
65 70 75 80
Ile Ala His Leu Ile Asp Ala Met Asp Tyr Thr Lys Glu Met Gly Gly
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Ser Gly
100 105 110
Val Pro Pro Thr Glu Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu
115 120 125
Val Ala Ala Lys Tyr Ala Lys Thr Leu Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Ser Trp Gln Ala
145 150 155 160
Lys Glu Met Ile Asp Lys Ile Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Ala Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Thr Leu Ala Ala Val Glu Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Gln Val Gly Tyr Gly Leu Gly Ile Trp Arg Pro
245 250 255
Val Ala Asn Ser Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Ala Gln Tyr Arg Leu Ile
275 280
<210> 32
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 红杆菌科细菌
<400> 32
atgcaaggtt ttggtgtcca taccagtatg tggacaatgc actgggatcg cctgggcgcg 60
gaacgaacca ttccggccgc ggctgcgtac aaaatggact ttattgaaat tgctcttctg 120
gacaccagcg tcgtggatgc gcatcacact cgtgatcttc tggcgaaaca tgaaatgcgt 180
gcggtttgct cgctgggctt gcctcgcgaa tcttgggcca gtgttaaccc ggatggtgcc 240
atagctcacc ttatagatgc aatggactat actaaagaga tgggcggcga ggcactgtct 300
ggcgtcacct atggcggtat cggtgaacgt agcggtgttc cgccgacgga agctgaatat 360
gataatatcg cacgtgccct agaagttgcc gccaaatacg ccaaaacgct gggcattgcc 420
tttggcattg aacccgtgaa ccgctatgaa agccacctga ttaataccag ttggcaggct 480
aaagaaatga ttgataaaat cggtgcagat aacatcttca ttcacttaga tacctaccac 540
atgaacattg aagagaaagg cgccggtaat ggaatcctgg cagctcggga acaccttcgc 600
tacattcatt tgagcgaaag cgaccggggt acacccggcg aaggcacctg tgattgggac 660
gaaatatttg cgacccttgc tgccgttgag ttcaaaggtg gcttggccat ggagagtttc 720
attaatatgc cgccgcaagt gggatatggc ttgggtatct ggcgcccggt cgccaattca 780
ttcgaggaag tgatggataa aggcctgccg ttcctgcgta acaaagcggc ccagtatcgt 840
cttatttaa 849
<210> 33
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 红细菌属物种(Rhodobacter sp.) SW2
<400> 33
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Gln Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Thr Ala Ile Val Asp Ala Pro
35 40 45
His Thr Arg Ala Leu Leu Gln Lys His Gly Leu Arg Ala Val Ala Ser
50 55 60
Leu Gly Leu Pro Gln Gln Asn Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Glu Gln Leu Cys Arg Ser Leu Asp Thr Ala Ala Ala Met Gly Cys
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Ser Gly
100 105 110
Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Val Ala Arg Ala Leu Ala
115 120 125
Ala Ala Ala Lys His Ala Lys Lys Leu Gly Leu Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Ser His Leu Ile Asn Thr Gly Trp Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Val His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Val Asp Trp Asp Glu Ile Phe Ala
210 215 220
Thr Leu Ala Ala Val Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Leu Gly Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Ser Phe Gln Ala Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 34
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 红细菌属物种SW2
<400> 34
atggaaggtt tcggtgtcca tacttccatg tggaccatgc aatgggaccg tgctggtgcc 60
gaacggacga taccagccgc tgcggcatat aagatggatt tcatcgaaat cgcgctgctg 120
aatacggcca ttgtggatgc cccgcatacc cgcgcactgt tacagaaaca tggtctgcgc 180
gccgttgcga gtctgggcct gccacaacag aactgggcga gtgtcaatcc tgagggtgcc 240
attgagcagt tatgccgctc actggacacc gctgccgcga tgggttgcga agccctgtca 300
ggggttacct acggcggcat cggagagcgc agcggtctgc cgccaacaat ggcagaatat 360
gacaacgtgg cccgtgcgtt ggcggcggca gcaaaacacg ctaagaaact gggcctggcg 420
tttggaatcg aacctgtgaa cagatatgag tctcacttga tcaacaccgg atggcaagca 480
aaatggatga ttgaaaaggt gggtgcggat aacatcttta tccacctgga tacttatcac 540
atgaatattg aggaaaaggg tgcaggcaac ggcattctcg atgcgcgcga acacctgcgt 600
tacgtgcatc ttagcgaaag cgaccgtggg acccctggag aaggtactgt tgactgggat 660
gaaatattcg cgacactcgc cgcagttgga tttaaaggcg gattagcaat ggaaagcttt 720
atcaacatgc caccggaact gggatatggc ctggcagtat ggcgcccggt ggcggaatcc 780
tttcaagcag taatggataa aggtttacct tttctgcgga acaaagcgcg tcagtatcgt 840
ctgatctaa 849
<210> 35
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 甲型变形菌纲细菌HGW-甲型变形菌-8 (Alphaproteobacteria bacteriumHGW-Alphaproteobacteria-8)
<400> 35
Met Arg Gly Phe Gly Val His Thr Ser Met Trp Thr Met Lys Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Ala Val Ala Ala Ala Ala His Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Pro Gly Val Asp Ala Pro
35 40 45
His Ser Arg Ala Leu Leu Glu Lys His Gly Leu Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Ala Ala Trp Pro Ser Arg Asn Pro Glu Ala Ala
65 70 75 80
Val Ala His Leu Lys Val Ala Leu Asp Lys Thr Ala Glu Met Gly Cys
85 90 95
Glu Ala Leu Thr Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Gly
100 105 110
Leu Pro Pro Ser Ala Thr Glu Leu Asp Asn Val Ala Arg Ala Leu Arg
115 120 125
Glu Ala Ala Ala His Ala Lys Lys Leu Gly Leu Leu Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr His Leu Ile Asn Thr Gly Arg Gln Ala
145 150 155 160
Val Glu Met Ile Glu Lys Val Gly Ala Glu Asn Met Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Ala Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Ile Lys Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Trp Gly Thr Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Val Leu Ser Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Val Ala Tyr Gly Leu Ser Val Trp Arg Pro
245 250 255
Val Ala Arg Asp Glu Ala Glu Val Met Asp Asn Gly Leu Pro Phe Leu
260 265 270
Arg Gly Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 36
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 甲型变形菌纲细菌HGW-甲型变形菌-8
<400> 36
atgcgtggtt ttggcgtcca tacatctatg tggactatga aatgggaccg tgcaggtgcc 60
gagcgtgccg tggcggcggc agcccactat aagatggact tcatcgaaat tgcgctgctg 120
aacgcgccgg gtgtcgatgc accgcatagt cgggcactcc tggagaaaca tggactgcgc 180
gcggtctgtt cattggggct tccggaagcc gcttggccga gccgcaaccc ggaagccgcc 240
gttgctcatc tgaaagtggc gctcgataaa accgctgaaa tgggttgtga agcgctgacc 300
ggagtcacct acggcggcat cggggaacgg accggcctgc caccgtctgc caccgaactg 360
gataacgtgg cacgcgcttt acgcgaagcc gcagcacacg ctaagaagct ggggctcctc 420
ttcggcatcg aaccggttaa ccgctacgaa acccatctga ttaacactgg tcggcaagcc 480
gttgaaatga ttgagaaagt cggcgcagag aatatgttta ttcacctgga cacctatcac 540
atgaacatcg aggaaaaggg cgcagcgaat ggtattctgg atgcacgcga acacattaaa 600
tatatccatc tttcagaatc tgatcgcggt accccgggct ggggtacctg cgattgggat 660
gaaattttcg cagtgctgag cgcaattgga tttaaaggtg gtttggcgat ggaaagtttt 720
attaacatgc cgccggaagt tgcgtatggc ctgtcagtat ggcgaccagt cgcacgggat 780
gaagcggaag ttatggataa cggccttccg tttcttcgtg gtaaagcccg ccagtaccgc 840
ttaatttaa 849
<210> 37
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 中温微红微菌(Rubellimicrobium mesophilum)
<400> 37
Met Gln Gly Phe Gly Val His Thr Ser Met Trp Thr Met Asn Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ser Ala Tyr Gly Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Pro Ala Val Asp Ala Pro
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Gly Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Arg Asn Trp Ala Ser Val Asn Pro Glu Gly Ala
65 70 75 80
Ile Glu His Leu Arg Gln Ala Leu Glu Val Thr Ala Ala Leu Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Gln Arg Thr Gly
100 105 110
Val Pro Pro Thr Ala Gly Glu Tyr Asp Asn Ile Ala Arg Ala Leu Glu
115 120 125
Ala Ala Ala Arg Tyr Ala Arg Glu Leu Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Val Asn Thr Ala Ala Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Val Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Phe Ala
210 215 220
Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Ile Gly Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Glu Ser Phe Glu Glu Val Met Asp Arg Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Lys Gln Tyr Arg Leu Val
275 280
<210> 38
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 中温微红微菌
<400> 38
atgcaagggt ttggcgtcca cacttcgatg tggaccatga actgggatcg tgccggcgcc 60
gaacgtacaa tcccggccgc gagcgcatac ggtatggatt ttattgaaat tgcgctgctg 120
aatgccccgg cggtggacgc tccacatacg cgcgcccttc ttgaaaagca cgggatgcgt 180
gcagtttgca gtttgggttt gcctgagcgt aattgggcaa gcgtcaaccc tgaaggcgcg 240
atcgagcacc ttcgacaagc cctcgaagtg accgccgccc ttggggcaga agcgttaagc 300
ggtgtcacat acggcggtat aggtcagcgc acaggggtgc cacccaccgc tggcgagtat 360
gataacatcg cccgtgcact ggaagccgct gcacgctatg cacgagaact gggtatcgcc 420
tttggtatcg aaccggttaa ccggtacgag aaccatctgg tgaacaccgc ggcccaagct 480
aaatggatga tagaaaaggt tggcgcggat aatattttca tccatttgga tacatatcac 540
atgaacattg aggagaaagg tgtcggcaac ggtatcctgg atgcgcgtga gcacctgcgc 600
tatattcatc tgtctgagag cgatcgcggc acaccaggcg agggtacttg cgattgggac 660
gaagtattcg caaccctggc agcaattggt ttcaaaggcg gacttgctat ggaatcgttt 720
atcaacatgc cgccagaaat tggatacggc ttggccgttt ggcgacctgt ggcagagagt 780
tttgaagaag tcatggaccg cggcctgccg ttcctgcgga acaaggcgaa acagtaccgt 840
cttgtgtaa 849
<210> 39
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 红杆菌目细菌(Rhodobacterales bacterium)
<400> 39
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met His Trp Asp
1 5 10 15
Arg Ala Gly Ala Glu Arg Thr Ile Pro Ala Ala Ala Ala Tyr Lys Met
20 25 30
Asp Phe Ile Glu Ile Ala Leu Leu Asn Ala Ala Met Ile Asp Pro Pro
35 40 45
His Thr Arg Ala Leu Leu Glu Lys His Asn Met Arg Ala Val Ala Ser
50 55 60
Leu Gly Leu Pro Gln Arg Asn Trp Ala Ser Val Asn Pro Asp Gly Ala
65 70 75 80
Ala Ala His Leu Ile Glu Ala Met Asp Val Ala Ala Ala Met Gly Ala
85 90 95
Glu Ala Leu Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Gly
100 105 110
Leu Pro Pro Thr Met Ala Glu Tyr Asp Asn Ile Ala Arg Ala Leu Gly
115 120 125
Gln Ala Ala Lys His Ala Lys Lys Leu Gly Ile Ala Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Asn His Leu Ile Asn Thr Gly Trp Gln Ala
145 150 155 160
Lys Trp Met Ile Glu Lys Val Gly Ala Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Gly Asn Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Arg Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Thr Cys Asp Trp Asp Glu Val Tyr Ala
210 215 220
Thr Leu Ala Ala Ile Gly Phe Lys Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Val Gly Tyr Gly Leu Ala Val Trp Arg Pro
245 250 255
Val Ala Asn Ser Phe Glu Glu Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Arg Gln Tyr Arg Leu Ile
275 280
<210> 40
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 红杆菌目细菌
<400> 40
atggaaggct tcggtgtgca cacgagtatg tggacgatgc actgggatcg tgctggtgct 60
gaacgtacga ttccggccgc cgccgcgtac aagatggact tcattgaaat tgcgctgctg 120
aacgcagcga tgatcgatcc gccacatact cgcgcgcttc tggagaaaca taacatgcgg 180
gctgttgcga gtctcggact tccacaacgc aattgggcct cggttaatcc agatggtgcc 240
gcggcccatc ttatcgaggc gatggacgtg gcggcagcaa tgggtgccga agcgctttcc 300
ggagtgacat acggcggaat cggtgaacgc actggcctgc cgccaactat ggcagagtac 360
gataacattg cacgagcact cgggcaggcc gccaaacatg ccaagaagct tgggatcgct 420
ttcggcatag agccggtgaa tcgctatgag aatcatctga tcaacactgg ctggcaggcc 480
aaatggatga ttgagaaagt gggtgctgat aacatcttta tccatctgga tacatatcac 540
atgaatatcg aggaaaaggg cgctggtaat ggtattttag atgcacgtga acacctgcgt 600
tatattcatt tgtctgagtc cgatcgcggc acgccgggtg aaggcacgtg tgactgggat 660
gaagtttacg cgacactggc agccattggc tttaaaggtg gactcgcgat ggaatcattc 720
atcaacatgc cgccggaagt gggttatggt ctggcagttt ggcgcccggt ggcgaacagc 780
tttgaagaag ttatggacaa aggtctgccg tttctccgca ataaagcgcg gcagtaccgc 840
ctgatctaa 849
<210> 41
<211> 282
<212> PRT
<213> 未知(Unknown)
<220>
<223> 红杆菌目细菌RIFCSPHIGHO2_02_FULL_62_130
<400> 41
Met Glu Gly Phe Gly Val His Thr Ser Met Trp Thr Met Lys Trp Asp
1 5 10 15
Arg Glu Gly Thr Glu Arg Ala Val Gln Ala Ala Val Asp Tyr Lys Met
20 25 30
Asp Phe Leu Glu Ile Ala Leu Leu Asp Ala Pro Ser Val Asp Ala Ala
35 40 45
His Thr Arg Lys Leu Leu Glu Asp Asn Asp Met Arg Ala Val Cys Ser
50 55 60
Leu Gly Leu Pro Glu Ala Val Trp Pro Ser Arg Asp Pro Glu Ser Ala
65 70 75 80
Ile Ala Phe Met Lys Gly Val Phe Asp Lys Ala Asn Glu Met Gly Ala
85 90 95
Glu Ala Val Ser Gly Val Thr Tyr Gly Gly Ile Gly Glu Arg Thr Asp
100 105 110
Met Pro Pro Thr Glu Ala Glu Leu Ser Asn Val Ala Arg Ala Leu Glu
115 120 125
Ala Cys Ala Ser Tyr Ala Lys Ser Leu Gly Leu Arg Phe Gly Ile Glu
130 135 140
Pro Val Asn Arg Tyr Glu Thr His Leu Leu Asn Thr Gly Trp Gln Ala
145 150 155 160
Arg Asp Met Ile Glu Arg Ile Gly Ser Asp Asn Ile Phe Ile His Leu
165 170 175
Asp Thr Tyr His Met Asn Ile Glu Glu Lys Gly Ala Ala Ser Gly Ile
180 185 190
Leu Asp Ala Arg Glu His Leu Lys Tyr Ile His Leu Ser Glu Ser Asp
195 200 205
Arg Gly Thr Pro Gly Glu Gly Cys Cys Asp Trp Asp Glu Ile Phe Ala
210 215 220
Thr Leu Ala Ala Ile Asn Phe Thr Gly Gly Leu Ala Met Glu Ser Phe
225 230 235 240
Ile Asn Met Pro Pro Glu Leu Ala His Gly Leu Ser Val Trp Arg Pro
245 250 255
Val Ala Pro Asp Phe Gln Ala Val Met Asp Lys Gly Leu Pro Phe Leu
260 265 270
Arg Asn Lys Ala Ala Gln Tyr Arg Leu Val
275 280
<210> 42
<211> 849
<212> DNA
<213> 未知(Unknown)
<220>
<223> 红杆菌目细菌RIFCSPHIGHO2_02_FULL_62_130
<400> 42
atggaaggtt ttggggtaca caccagcatg tggacgatga aatgggatcg tgagggcacc 60
gagcgggctg tacaggcggc agttgattac aaaatggatt ttctggaaat tgctctgctt 120
gacgctccga gcgtggacgc ggcacacacg cgcaaactcc tggaagataa cgatatgcgt 180
gcggtgtgca gtttagggtt accagaagcg gtgtggccga gtcgcgaccc agagagcgca 240
attgctttta tgaaaggagt attcgataag gccaacgaaa tgggcgccga ggcagtgagt 300
ggggtcacgt atggcggcat aggcgaacgc acagacatgc caccgacaga agcggagctg 360
agcaacgtag cccgcgcact ggaagcgtgc gcgagttatg caaaatcatt aggtctgcga 420
tttggcattg agcctgtgaa tcgttatgaa acccatctgc tgaataccgg ttggcaagca 480
cgcgatatga tcgaacgtat cggttcagat aacattttca ttcatttgga tacgtaccac 540
atgaatatcg aagagaaagg cgcggcctct ggtattttag atgcccgtga acacttgaaa 600
tacatccatt tatctgaaag tgacagaggc acgccaggcg aaggttgttg cgactgggat 660
gaaattttcg ccaccctcgc cgccattaat tttaccggcg gtcttgccat ggaaagtttc 720
attaacatgc cgccagagct ggcgcatggt ctgagcgtgt ggcgccccgt ggccccggac 780
ttccaagcgg tgatggataa aggcctgccg ttcctgcgaa acaaagccgc gcagtaccgc 840
ctggtctaa 849
<210> 43
<211> 288
<212> PRT
<213> 未知(Unknown)
<220>
<223> 污泥嗜热梭菌
<400> 43
Lys Tyr Gly Ile Phe Tyr Ala Tyr Trp Glu Lys Glu Trp Lys Gly Asp
1 5 10 15
Phe Ile Thr Tyr Ile Glu Lys Val Lys Lys Leu Gly Phe Asp Ile Leu
20 25 30
Glu Val Gly Cys Gly Asp Phe His Lys Gln Pro Asp Ser Tyr Phe His
35 40 45
Thr Leu Arg Asp Ala Ala Arg Glu Tyr Asp Ile Ile Leu Thr Gly Gly
50 55 60
Tyr Gly Pro Arg Ala Glu His Asn Leu Cys Ser Pro Asp Thr Ala Val
65 70 75 80
Val Glu Asn Ala Leu Ala Phe Tyr Ser Asp Ile Phe Arg Lys Met Glu
85 90 95
Ile Ala Gly Ile Arg Ser Ile Gly Gly Gly Leu Tyr Ala Tyr Trp Pro
100 105 110
Val Asp Tyr Ser Arg Glu Pro Asp Lys Ala Gly Asp Leu Glu Arg Ser
115 120 125
Ile Lys Asn Met Arg Arg Leu Ala Asp Ile Ala Glu Arg His Gly Ile
130 135 140
Thr Leu Asn Met Glu Val Leu Asn Arg Phe Glu Gly Tyr Leu Ile Asn
145 150 155 160
Asp Thr Asn Glu Gly Leu Ala Tyr Ile Arg Ala Val Asp Lys Pro Asn
165 170 175
Val Lys Leu Met Leu Asp Thr Phe His Met Asn Ile Glu Glu Asp Ser
180 185 190
Phe Thr Glu Pro Ile Leu Gln Ala Gly Lys Tyr Leu Gly His Val His
195 200 205
Val Gly Glu Pro Asn Arg Lys Pro Pro Arg Glu Gly Arg Ile Pro Trp
210 215 220
Gly Glu Ile Gly Lys Ala Leu Arg Gln Ile Gly Tyr Asp Gly Pro Val
225 230 235 240
Val Met Glu Pro Phe Val Thr Met Gly Gly Gln Val Gly Lys Asp Ile
245 250 255
Cys Val Trp Arg Asp Leu Ser Gln Gly Ala Thr Glu Glu Asp Leu Asp
260 265 270
Arg Asp Ala Glu Lys Ser Leu Ala Phe Leu Lys Gly Met Phe Glu Ala
275 280 285
<210> 44
<211> 864
<212> DNA
<213> 未知(Unknown)
<220>
<223> 污泥嗜热梭菌
<400> 44
aagtacggta tcttctatgc ttattgggaa aaggaatgga agggtgactt cattacttac 60
attgaaaagg ttaagaagct gggattcgat attcttgaag ttggttgtgg tgacttccat 120
aaacaacctg attcttactt ccatactctt agagatgctg ctagagaata tgatattatt 180
cttactggtg gttacggtcc tagagctgaa cataacttgt gttctccaga tactgctgtt 240
gttgaaaacg ctcttgcctt ctattctgat atcttcagaa aaatggagat cgctggtatt 300
agatccattg gtggtggtct gtatgcttac tggcctgttg attattctag agaacctgat 360
aaggctggtg atcttgaaag atccattaag aacatgagaa gattggctga tattgctgaa 420
agacatggta ttactcttaa tatggaagtt cttaacagat tcgaaggtta tcttattaac 480
gatactaacg aaggtcttgc ttatattaga gctgttgata aaccaaacgt taaattgatg 540
ttggatacct tccacatgaa cattgaagaa gattccttca ctgaacctat tcttcaagct 600
ggtaagtatc ttggtcatgt tcatgttggt gaacctaata gaaagccacc tagagaaggt 660
agaatccctt ggggtgaaat tggtaaagct cttagacaaa ttggttacga tggtcctgtt 720
gttatggaac cattcgttac tatgggtggt caagttggta aggatatctg tgtctggaga 780
gacttatctc aaggtgctac tgaagaggat cttgatagag atgctgaaaa gtctcttgcc 840
ttcttgaaag gtatgttcga agct 864

Claims (20)

1.一种生产阿洛酮糖的方法,所述方法包括使果糖底物与反应混合物在使得所述果糖底物转化为阿洛酮糖的条件下接触,所述反应混合物包含:
(a)包含D-阿洛酮糖3-差向异构酶酶的酶***;
(b)用包含编码D-阿洛酮糖3-差向异构酶酶的核酸分子的重组载体转化的宿主细胞;和/或
(c)(b)的所述宿主细胞的裂解物,其中所述D-阿洛酮糖3-差向异构酶酶包含与选自由SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43组成的组的多肽具有至少80%序列同一性的氨基酸序列。
2.根据权利要求1所述的方法,其中所述反应混合物包含D-阿洛酮糖3-差向异构酶酶,所述酶包含与选自由SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ IDNO:25组成的组的多肽具有至少80%序列同一性的氨基酸序列。
3.根据权利要求2所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶包含与选自由SEQID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25组成的组的多肽具有至少90%序列同一性的氨基酸序列。
4.根据权利要求2所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶包含与选自由SEQID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25组成的组的多肽具有至少95%序列同一性的氨基酸序列。
5.根据权利要求2所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶包含SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23或SEQ ID NO:25的氨基酸序列。
6.根据权利要求1所述的方法,其中所述反应混合物包含D-阿洛酮糖3-差向异构酶酶,所述酶包含与选自由SEQ ID NO:3、SEQ ID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQID NO:43组成的组的多肽具有至少90%序列同一性的氨基酸序列。
7.根据权利要求6所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶包含与选自由SEQID NO:3、SEQ ID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43组成的组的多肽具有至少95%序列同一性的氨基酸序列。
8.根据权利要求6所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶包含SEQ ID NO:3、SEQ ID NO:11、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43的氨基酸序列。
9.根据权利要求1所述的方法,其中所述条件包括将所述酶***和所述果糖底物维持在25℃与75℃之间的温度下。
10.根据权利要求1所述的方法,其中所述条件包括将所述酶***和所述果糖底物维持在4与10之间的pH下。
11.根据权利要求1所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶为分离形式。
12.根据权利要求1所述的方法,其中所述D-阿洛酮糖3-差向异构酶酶被固定化在固体基质上。
13.根据权利要求1所述的方法,其中所述反应混合物包含用包含编码所述D-阿洛酮糖3-差向异构酶酶的核酸分子的重组载体转化的宿主细胞或所述宿主细胞的裂解物,其中编码所述D-阿洛酮糖3-差向异构酶酶的所述核酸分子包含与选自由SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42和SEQ ID NO:44组成的组的多核苷酸序列具有至少80%序列同一性的多核苷酸序列。
14.根据权利要求13所述的方法,其中所述宿主细胞选自由以下组成的组:酵母细胞、丝状真菌细胞、细菌细胞、哺乳动物细胞、植物细胞以及网粘菌纲细胞。
15.根据权利要求14所述的方法,其中所述宿主细胞是大肠杆菌或巴斯德毕赤酵母。
16.根据权利要求13所述的方法,其中所述重组载体在所述宿主细胞内作为自我复制的核酸分子存在。
17.根据权利要求13所述的方法,其中所述重组载体被整合到宿主细胞染色体中。
18.根据权利要求1所述的方法,其还包括向所述反应***中添加至少一种类型的金属离子,所述至少一种类型的金属离子选自由以下组成的组:镁离子、锰离子、铜离子、锌离子、镍离子、钴离子、铁离子、铝离子和钙离子。
19.根据权利要求18所述的方法,其中所述金属离子以约0.01mM至约5mM的浓度添加。
20.根据权利要求1所述的方法,其包括在所述果糖底物转化为阿洛酮糖时从所述反应***中移除包含阿洛酮糖的产物流。
CN202180026890.1A 2020-05-11 2021-05-11 用于将d-果糖生物转化为d-阿洛酮糖的d-阿洛酮糖3-差向异构酶 Pending CN115380109A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063022617P 2020-05-11 2020-05-11
US63/022,617 2020-05-11
PCT/US2021/031859 WO2021231488A2 (en) 2020-05-11 2021-05-11 D-allulose 3-epimerases for bioconversion of d-fructose to d-allulose

Publications (1)

Publication Number Publication Date
CN115380109A true CN115380109A (zh) 2022-11-22

Family

ID=78524895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180026890.1A Pending CN115380109A (zh) 2020-05-11 2021-05-11 用于将d-果糖生物转化为d-阿洛酮糖的d-阿洛酮糖3-差向异构酶

Country Status (6)

Country Link
US (1) US20230313254A1 (zh)
EP (1) EP4114935A4 (zh)
JP (1) JP2023525666A (zh)
KR (1) KR20230009372A (zh)
CN (1) CN115380109A (zh)
WO (1) WO2021231488A2 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115074350B (zh) * 2022-08-12 2022-12-13 保龄宝生物股份有限公司 一种降低d-阿洛酮糖-3-差向异构酶酶液酶活力损失的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107109451A (zh) * 2014-10-01 2017-08-29 庆尚大学校产学协力团 阿洛酮糖的生产方法
TW201920667A (zh) * 2017-07-31 2019-06-01 南韓商Cj第一製糖股份有限公司 阿洛酮糖-6-磷酸磷酸酶、對所述酶進行編碼的核酸、用於生產d-阿洛酮糖的包括所述酶的組成物以及使用所述酶生產d-阿洛酮糖的方法
WO2019112368A1 (ko) * 2017-12-08 2019-06-13 씨제이제일제당 (주) 신규한 사이코스-6-인산 탈인산효소, 상기 효소를 포함하는 사이코스 생산용 조성물, 상기 효소를 이용하여 사이코스를 제조하는 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110035805A (ko) * 2009-09-30 2011-04-06 씨제이제일제당 (주) 사이코스-에피머화 효소의 고정화 및 이를 이용한 사이코스의 제조방법
EP2843044A1 (en) * 2013-09-03 2015-03-04 Roquette Frères Improved variant of D-psicose 3-epimerase and uses thereof
ES2796749T3 (es) 2014-10-30 2020-11-30 Samyang Corp Sistema de expresión de psicosa epimerasa y producción de psicosa que utiliza la misma
US10266862B2 (en) 2014-11-06 2019-04-23 Industry-Academic Cooperation Foundation Gyeongsang National University Method for preparing psicose
CN109306347B (zh) * 2017-12-28 2019-08-30 吉林中粮生化有限公司 一种新型d-阿洛酮糖3-差向异构酶及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107109451A (zh) * 2014-10-01 2017-08-29 庆尚大学校产学协力团 阿洛酮糖的生产方法
TW201920667A (zh) * 2017-07-31 2019-06-01 南韓商Cj第一製糖股份有限公司 阿洛酮糖-6-磷酸磷酸酶、對所述酶進行編碼的核酸、用於生產d-阿洛酮糖的包括所述酶的組成物以及使用所述酶生產d-阿洛酮糖的方法
WO2019112368A1 (ko) * 2017-12-08 2019-06-13 씨제이제일제당 (주) 신규한 사이코스-6-인산 탈인산효소, 상기 효소를 포함하는 사이코스 생산용 조성물, 상기 효소를 이용하여 사이코스를 제조하는 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GENBANK DATABASE: "sugar phosphate isomerase/epimerase [Allomeiothermus silvanus]", GENBANK DATABASE, 4 July 2017 (2017-07-04), pages 013156592 *
SATYA NARAYAN PATEL 等: "A Novel d-Allulose 3-Epimerase Gene from the Metagenome of a Thermal Aquatic Habitat and d-Allulose Production by Bacillus subtilis Whole-Cell Catalysis", APPLIED AND ENVIRONMENTAL MICROBIOLOGY, vol. 86, no. 5, 18 February 2020 (2020-02-18), pages 1 - 14 *
SIKORSKI J 等: "Xylose isomerase domain protein TIM barrel", UBIPROTKB, 10 August 2010 (2010-08-10), pages 7 *

Also Published As

Publication number Publication date
JP2023525666A (ja) 2023-06-19
WO2021231488A2 (en) 2021-11-18
EP4114935A4 (en) 2023-12-27
WO2021231488A3 (en) 2021-12-16
KR20230009372A (ko) 2023-01-17
EP4114935A2 (en) 2023-01-11
US20230313254A1 (en) 2023-10-05

Similar Documents

Publication Publication Date Title
WO2019107516A1 (ja) 3-ヒドロキシアジピン酸、α-ヒドロムコン酸および/またはアジピン酸を生産するための遺伝子改変微生物および当該化学品の製造方法
CN110878261B (zh) 合成木糖醇的重组解脂耶氏酵母的构建方法及其菌株
JP2010207094A (ja) プロトカテク酸の製造法
KR20150103289A (ko) 아스로박터 글로비포미스에 의해 생산되는 케토오스 3-에피머라제
WO2020105709A1 (ja) 新規ケトース3-エピメラーゼ
US20230313254A1 (en) D-allulose 3-epimerases for bioconversion of d-fructose to d-allulose
JP2023506154A (ja) アルロースエピマー化酵素変異体、その製造方法及びそれを利用したアルロースの製造方法
KR102007890B1 (ko) 변형된 당 대사 경로를 갖는 재조합 균주를 이용한 당이성화 효소의 스크리닝 방법
JP7067706B2 (ja) 形質転換微生物及びその利用
WO2021187533A1 (ja) 3-ヒドロキシアジピン酸および/またはα-ヒドロムコン酸を生産するための遺伝子改変微生物および当該化学品の製造方法
JP5660271B2 (ja) グルコースデヒドロゲナーゼおよびその製造方法
CN112410353B (zh) 一种fkbS基因、含其的基因工程菌及其制备方法和用途
KR20190097250A (ko) 신규한 효소를 사용한 메틸글리옥살의 히드록시아세톤으로의 전환 및 그의 적용
Elmahmoudy et al. Identification and characterization of a novel 2R, 3R-Butanediol dehydrogenase from Bacillus sp. DL01
JP6989746B2 (ja) 変異型2-デオキシ-シロ-イノソース合成酵素
CN113061593A (zh) 一种l-苹果酸脱氢酶突变体及其应用
EP3489361B1 (en) Microorganism having activity of acyltransferase and use thereof
WO2014202838A1 (en) Methods for producing styrene and genetically modified micro-organisms related thereto
DK2992106T3 (en) ENZYMATIC PROCEDURE FOR PREPARING (R) -3-QUINUCLIDINOL
JP6527708B2 (ja) 新規微生物、ならびにそれを用いる2,3−ジヒドロキシナフタレンの製造法
KR20140078381A (ko) 휴면 세포 전환법을 이용한 d-카이로 이노시톨의 생산 방법
EP1614745B1 (en) Process for producing glucose dehydrogenase
EP4006163A1 (en) Enzyme capable of dehydroxylating hydroxyl group in urolithin compound
CA3225924A1 (en) Novel beta-carotene 15,15-oxygenase variant and retinoid production method using same
JP5678356B2 (ja) フェノール酸の製造法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40075943

Country of ref document: HK