CN1962870A - 编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因 - Google Patents

编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因 Download PDF

Info

Publication number
CN1962870A
CN1962870A CNA2006101058946A CN200610105894A CN1962870A CN 1962870 A CN1962870 A CN 1962870A CN A2006101058946 A CNA2006101058946 A CN A2006101058946A CN 200610105894 A CN200610105894 A CN 200610105894A CN 1962870 A CN1962870 A CN 1962870A
Authority
CN
China
Prior art keywords
nucleic acid
mct
amino acid
sequence
acid molecules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006101058946A
Other languages
English (en)
Inventor
M·波姆佩朱斯
B·克雷格尔
H·施雷德尔
O·策尔德
G·哈伯豪尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN1962870A publication Critical patent/CN1962870A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明描述了命名为MCT核酸分子的分离的核酸分子,它编码谷氨酸棒杆菌的新型MCT蛋白。本发明也提供反义核酸分子、含有MCT核酸分子的重组表达载体和已经导入所述表达载体的宿主细胞。本发明还提供分离的MCT蛋白、突变型MCT蛋白、融合蛋白、抗原性肽和用于基于谷氨酸棒杆菌中MCT基因的基因工程而改进谷氨酸棒杆菌的所需化合物生产的方法。

Description

编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因
本申请是申请日为2000年6月23日,申请号为00811820.5,发明名称为“编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因”的发明专利申请的分案申请。
相关申请
本申请要求于1999年6月25日申请的美国临时专利申请顺序号60/141031的优先权。本申请也要求以下专利申请的优先权:1999年7月8日申请的德国专利申请号19931454.3、1999年7月8日申请的德国专利申请号19931478.0、1999年7月8日申请的德国专利申请号19931563.9、1999年7月9日申请的德国专利申请号19932122.1、1999年7月9日申请的德国专利申请号19932124.8、1999年7月9日申请的德国专利申请号19932125.6、1999年7月9日申请的德国专利申请号19932128.0、1999年7月9日申请的德国专利申请号19932180.9、1999年7月9日申请的德国专利申请号19932182.5、1999年7月9日申请的德国专利申请号19932190.6、1999年7月9日申请的德国专利申请号19932191.4、1999年7月9日申请的德国专利申请号19932209.0、1999年7月9日申请的德国专利申请号19932212.0、1999年7月9日申请的德国专利申请号19932227.9、1999年7月9日申请的德国专利申请号19932228.7、99070申请的德国专利申请号19932229.5、1999年7月9日申请的德国专利申请号19932230.9、1999年7月14日申请的德国专利申请号19932927.3、1999年7月14日申请的德国专利申请号19933005.0、1999年7月14日申请的德国专利申请号19933006.9、1999年8月27日申请的德国专利申请号19940764.9、1999年8月27日申请的德国专利申请号19940765.7、1999年8月27日申请的德国专利申请号19940766.5、1999年8月27日申请的德国专利申请号19940830.0、1999年8月27日申请的德国专利申请号19940831.9、1999年8月27日申请的德国专利申请号19940832.7、1999年8月27日申请的德国专利申请号19940833.5、1999年8月31日申请的德国专利申请号19941378.9、1999年8月31日申请的德国专利申请号19941379.7、1999年8月31日申请的德国专利申请号19941395.9、1999年9月3日申请的德国专利申请号19942077.7、1999年9月3日申请的德国专利申请号19942078.5、1999年9月3日申请的德国专利申请号19942079.3和1999年9月3日申请的德国专利申请号19942088.2。所有以上引用的申请的全部内容均通过引用结合到本文中。
发明背景
在细胞中天然发生的代谢过程的某些产物和副产物在多种多样的工业中具有实用性,所述工业包括食品工业、饲料工业、化妆品工业和制药业。这些分子统称为“精细化学品”,包括有机酸、生成蛋白质的(proteinogenic)和非生成蛋白质的氨基酸、核苷酸和核苷、脂质和脂肪酸、二元醇、糖类、芳族化合物、维生素和辅因子和酶。它们的生产最为方便的是通过开发用以生产和分泌大量的一种或多种所需分子的细菌的大规模培养来进行。用于此目的的一种特别有用的生物是谷氨酸棒杆菌(Corynebacterium glutamicum),这是一种革兰氏阳性的非致病菌。通过菌株的选择,已经开发了许多产生一系列所需化合物突变型菌株。然而,在特定分子生产方面改进的菌株的选择是一个费时且困难的过程。
发明概要
本发明提供具有多种用途的新型细菌核酸分子。这些用途包括可以用来生产精细化学品的微生物的鉴定、谷氨酸棒杆菌或相关细菌中精细化学品生产的调节、谷氨酸棒杆菌或相关细菌的定型或鉴定、作为谷氨酸棒杆菌基因组作图的参比点以及作为转化的标记。这些新型核酸分子编码本文中称为膜构建和膜转运(membrane construction andmembrane transport)(MCT)蛋白的蛋白质。
谷氨酸棒杆菌是一种革兰氏阳性需氧菌,通常用于工业中以大规模生产种类繁多的精细化学品,也用于糖类降解(例如用于石油溢出)以及用于萜类化合物的氧化。因此,本发明的MCT核酸分子可以用来鉴定可以用以例如通过发酵过程生产精细化学品的微生物。本发明MCT核酸表达的调节或本发明MCT核酸分子序列的修饰,可以用以调节得自微生物的一种或多种精细化学品的生产(例如以改进得自棒杆菌或短杆菌菌种的一种或多种精细化学品的收率或产量)。
本发明的MCT核酸也可以用来将生物鉴定为谷氨酸棒杆菌或其密切相关菌种,或用来鉴定混合微生物群体中谷氨酸棒杆菌或其相关菌种的存在。本发明提供多种谷氨酸棒杆菌基因的核酸序列;通过用跨越谷氨酸棒杆菌基因区的探针,在严格条件下探测特有微生物或混合微生物群体的培养物的提取的基因组DNA,人们可以确定该生物是否存在。虽然谷氨酸棒杆菌本身是非致病性的,但它与人类中的致病菌种例如白喉棒杆菌(Corynebacterium diphtheriae)(白喉的病原体)相关;这类生物的检测具有重大的临床意义。
本发明的MCT核酸分子也可以用作谷氨酸棒杆菌基因组或相关生物基因组作图的参比点。同样,这些分子或其变异体或其部分可以用作基因工程棒杆菌或短杆菌菌种的标记。
由本发明新型核酸分子编码的MCT蛋白能够例如执行参与膜生物合成必需的化合物的代谢(例如,生物合成或降解)或有助于一种或多种化合物跨膜转运进或转运出细胞的功能。已知可得到用于谷氨酸棒杆菌的克隆载体例如Sinskey等的美国专利号4,649,119中的克隆载体以及用于谷氨酸棒杆菌和相关短杆菌菌种(例如乳发酵短杆菌(Brevibacterium lactofermentum))遗传操作技术(Yoshihama等,J.Bacteriol.162:591-597(1985);Katsumata等,J. Bacteriol.159:306-311(1984);和Santamaria等,J. Gen.Microbiol.130:2237-2246(1984)),因此本发明的核酸分子可以用于这种生物的基因工程,以使其成为一种或多种精细化学品的更好或更有效的生产者。精细化学品的这种改进的生产或产率可能是由于本发明基因的操作的直接效应引起的,或者它可能是由这类操作的间接效应引起的。
有许多机制使得改变本发明MCT蛋白可以直接影响掺入这种改变的蛋白的谷氨酸棒杆菌菌株生产精细化学品的收率、产量或产率。可以在数量或活性方面增加参与细胞输出精细化学品分子的那些MCT蛋白,使得将更大量的这些化合物分泌到胞外介质中,从胞外介质中更为容易地回收它们。同样,可以在数量或活性方面增加参与一种或多种精细化学品(例如磷酸、硫酸、含氮化合物等)生物合成所必需营养物输入的那些MCT蛋白,使得细胞内这些前体、辅因子或中间体化合物的浓度增加。此外,脂肪酸和脂质本身是理想的精细化学品;通过优化一种或多种参与这些化合物生物合成的本发明MCT蛋白的活性或增加其数量,或通过降低一种或多种参与这些化合物降解的MCT蛋白的活性,有可能增加谷氨酸棒杆菌生产脂肪酸和脂质分子的收率、产量和/或产率。
一种或多种本发明MCT基因的诱变也可能产生活性改变的MCT蛋白,这间接影响谷氨酸棒杆菌的一种或多种所需精细化学品的生产。例如,可以在数量或活性方面增加参与废物输出的本发明MCT蛋白,使得细胞的正常代谢废物(由于所需精细化学品的过量生产所致,其量有可能增加)在它们能够损害细胞内核苷酸和蛋白(这可能降低细胞的生存力)或干扰精细化学品生物合成途径(这可能降低所需精细化学品的收率、产量或产率)之前,得以有效地输出。另外,胞内相对大量的所需精细化学品本身可能对细胞有毒性,因此通过增加能够将该化合物输出所述细胞的转运蛋白的活性或数量,可能提高培养物中细胞的生存力,这进而导致在所述培养物中生产所需精细化学品的细胞数更大。也可以操作本发明的MCT蛋白,使得可生产相对量的不同脂质和脂肪酸分子。这可能对细胞膜的脂质组成具有深远的影响。由于每种类型的脂质具有不同的物理特性,因此膜脂质组成的改变可能显著改变膜的流动性。膜流动性的改变可以影响跨越所述膜的分子转运以及细胞的完整性,这两者对大规模发酵培养物中谷氨酸棒杆菌的精细化学品生产具有深远的影响。
本发明提供编码本文称为MCT蛋白的新型核酸分子,所述MCT蛋白能够例如参与谷氨酸棒杆菌细胞膜构成所必需的化合物的代谢、或参与跨越这些膜的分子转运。编码MCT蛋白的核酸分子在本文中称为MCT核酸分子。在一个优选实施方案中,所述MCT蛋白参与谷氨酸棒杆菌细胞膜构成所必需的化合物的代谢、或参与跨越这些膜的分子转运。这类蛋白的实例包括由表1中所述基因编码的那些蛋白。
因此,本发明的一个方面涉及分离的核酸分子(例如cDNA、DNA或RNA),所述分离的核酸分子包含编码MCT蛋白或其生物活性部分的核苷酸序列,还涉及适合作为检测或扩增MCT编码核酸(例如DNA或mRNA)的引物或杂交探针的核酸片段。在特别优选的实施方案中,所述分离的核酸分子包含序列表中奇数SEQ ID NO(例如SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7...)中所述核苷酸序列之一、序列表中奇数SEQ ID NO(例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7...)中所述核苷酸序列之一、或这些核苷酸序列之一的编码区或其互补序列。在其它特别优选的实施方案中,本发明的分离的核酸分子包含这样的核苷酸序列或其部分,所述核苷酸序列与一种序列表奇数SEQ ID NO(例如SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7...)中所述核苷酸序列杂交或有至少约50%、优选至少约60%、更优选至少约70%、80%或90%、甚至更优选至少约95%、96%、97%、98%、99%或更高同源性。在其它优选实施方案中,所述分离的核酸分子编码序列表偶数SEQ ID NO (例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8...)中所述氨基酸序列之一。本发明优选的MCT蛋白也最好具有至少一种本文所述的MCT活性。
在另一实施方案中,所述分离的核酸分子编码一种蛋白质或其部分,其中所述蛋白或其部分包括足以与本发明氨基酸序列(例如具有序列表中偶数SEQ ID NO的序列)同源的氨基酸序列,例如足以与本发明的氨基酸序列同源,使得所述蛋白质或其部分保留MCT活性。最好是,由所述核酸分子编码的蛋白质或其部分保留参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运的能力。在一个实施方案中,由所述核酸分子编码的蛋白质与本发明氨基酸序列(例如选自具有序列表中偶数SEQ ID NO的完整的氨基酸序列)的同源性为至少约50%、优选至少约60%、更优选至少约70%、80%或90%、最优选至少约95%、96%、97%、98%或99%或更高。在另一优选实施方案中,所述蛋白质是与本发明完整氨基酸序列(由序列表中相应的奇数SEQ ID NO(例如SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7...)中所示的可读框编码)基本上同源的全长谷氨酸棒杆菌蛋白质。
在另一优选实施方案中,所述分离的核酸分子得自谷氨酸棒杆菌,并且编码一种包括一个生物活性结构域的蛋白质(例如MCT融合蛋白),所述生物活性结构域与一种本发明的氨基酸序列(例如序列表中一种偶数SEQ ID NO的序列)有至少约50%或更高的同源性,并且能够参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢、或参与跨越这些膜的分子转运,或具有表1中所述的一种或多种活性,所述分离的核酸分子也包括编码异源多肽或调节区的异源核酸序列。
在另一实施方案中,所述分离的核酸分子至少长15个核苷酸,并且在严格条件下与包含本发明核苷酸序列(例如序列表中奇数SEQ IDNO的序列)的核酸分子杂交。优选所述分离的核酸分子对应于天然存在的核酸分子。更优选所述分离的核酸编码天然存在的谷氨酸棒杆菌MCT蛋白或其生物活性部分。
本发明的另一方面涉及含有本发明核酸分子的载体,例如重组表达载体,涉及已经导入这类载体的宿主细胞。在一个实施方案中,这样一种宿主细胞用来通过在合适的培养基中培养所述宿主细胞而生产MCT蛋白。然后从所述培养基或所述宿主细胞中分离出所述MCT蛋白。
本发明的再一方面涉及其中已经导入MCT基因或改变MCT基因的遗传改变的微生物。在一个实施方案中,通过导入作为转基因的编码野生型或突变型MCT序列的本发明核酸分子,已经改变了所述微生物的基因组。在另一实施方案中,所述微生物基因组内的内源MCT基因通过与改变的MCT基因同源重组而已经被改变,例如功能性断裂。在另一实施方案中,微生物中内源的或所引入的MCT基因通过一个或多个点突变、缺失或倒位而被改变,但仍编码功能性MCT蛋白。在再一实施方案中,微生物中MCT基因的一个或多个调节区(例如启动子、阻抑蛋白或诱导物)已经被改变(例如通过缺失、截短、倒位或点突变),使得所述MCT基因的表达得到调节。在一个优选实施方案,所述微生物属于棒杆菌属或短杆菌属,特别优选谷氨酸棒杆菌。在一个优选实施方案中,所述微生物也用于生产所需化合物,例如氨基酸,特别优选赖氨酸。
另一方面,本发明提供一种鉴定受治疗者体内白喉棒杆菌存在或其活性的方法。该方法包括检测受治疗者体内的一种或多种本发明的核酸序列或氨基酸序列(例如序列表SEQ ID NO 1-676中所述序列),由此检测所述受治疗者体内白喉棒杆菌的存在或其活性。
本发明的又一方面涉及分离的MCT蛋白或其部分,例如生物活性部分。在一个优选实施方案中,所述分离MCT蛋白或其部分可以参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运。在另一优选实施方案中,所述分离的MCT蛋白或其部分与本发明的氨基酸序列(例如序列表中偶数SEQ ID NO的序列)足够同源,使得所述蛋白质或其部分保留参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运的能力。
本发明也提供MCT蛋白的分离制剂。在优选实施方案中,所述MCT蛋白包含本发明的氨基酸序列(例如序列表中偶数SEQ ID NO的序列)。在另一优选实施方案中,本发明涉及与本发明的完整氨基酸序列(例如序列表中偶数SEQ ID NO的序列)(由序列表A中相应奇数SEQ ID NO所述可读框编码)基本上同源的分离的全长蛋白质。在再一实施方案中,所述蛋白质与本发明完整氨基酸序列(例如序列表中偶数SEQ ID NO的序列)的同源性为至少约50%、优选至少约60%、更优选至少约70%、80%或90%、最优选至少约95%、96%、97%、98%或99%或更高。在其它实施方案中,所述分离的MCT蛋白包含与本发明的一种氨基酸序列(例如序列表中偶数SEQ ID NO的序列)的同源性至少约50%或更高的氨基酸序列,并且能够参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运,或具有表1中所述的一种或多种活性。
或者,所述分离的MCT蛋白可以包含这样一种核苷酸序列编码的氨基酸序列,所述核苷酸序列与序列表中一种偶数SEQ ID NO所述的核苷酸序列杂交,例如在严格条件下杂交,或与序列表中一种奇数SEQ ID NO所示的核苷酸序列的同源性至少约50%、优选至少约60%、更优选至少约70%、80%或90%、最优选至少约95%、96%、97%、98%或99%或更高。也优选MCT蛋白的优选形式也具有本文所述一种或多种MCT生物活性。
所述MCT多肽或其生物活性部分可以与一种非MCT多肽有效地连接,形成融合蛋白。在优选实施方案中,这种融合蛋白具有不同于单独的所述MCT蛋白的活性。在其它优选实施方案中,这种融合蛋白参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运。在特别优选的实施方案中,这种融合蛋白整合到宿主细胞中,调节所述细胞的所需化合物产生。
另一方面,本发明提供用于筛选调节MCT蛋白活性的分子的方法,所述分子或者通过与MCT蛋白本身相互作用或者作为所述MCT蛋白的底物或结合配偶体,或者通过调节本发明MCT核酸分子的转录或翻译,调节MCT蛋白活性。
本发明的另一方面涉及用于生产精细化学品的方法。该方法包括培养含指导本发明MCT核酸分子表达的载体的细胞,使得可生产精细化学品。在一个优选实施方案中,该方法还包括获得含这种载体的细胞的步骤,其中用指导MCT核酸表达的载体转染细胞。在另一优选实施方案中,该方法还包括从培养物中回收所述精细化学品的步骤。在一个特别优选的实施方案中,所述细胞得自棒杆菌属或短杆菌属,或选自表3中所述的那些菌株。
本发明的另一方面涉及用于调节由微生物生产分子的方法。这类方法包括使所述细胞与调节MCT蛋白活性或MCT核酸表达的因子接触,使得细胞相关活性相对于在缺乏所述因子时的所述活性而言被改变。在一个优选实施方案中,调节所述细胞的一种或多种谷氨酸棒杆菌细胞膜组分的代谢途径,或调节所述细胞的跨越这些膜的化合物转运,使得改进这种微生物的所需精细化学品的收率或产率。调节MCT蛋白活性的因子可以是刺激MCT蛋白活性或MCT核酸表达的因子。刺激MCT蛋白活性或MCT核酸表达的因子的实例包括小分子、活性MCT蛋白和已被导入所述细胞的编码MCT蛋白的核酸。抑制MCT活性或表达的因子的实例包括小分子和反义MCT核酸分子。
本发明的另一方面涉及调节细胞的所需化合物收率的方法,所述方法包括将野生型或突变型MCT基因导入细胞中,或者保留在单独的质粒上或整合到宿主细胞的基因组中。如果整合到基因组中,则这种整合可以是随机的,或它可以通过同源重组而发生,使得所述天然基因被所导入的拷贝取代,导致从待调节的细胞产生所述所需化合物。在一个优选实施方案中,所述收率增加。在另一优选实施方案中,所述化学品是一种精细化学品。在一个特别优选的实施方案中,所述精细化学品是一种氨基酸。在尤其优选的实施方案中,所述氨基酸是L-赖氨酸。
发明详述
本发明提供MCT核酸分子和MCT蛋白分子,所述分子参与谷氨酸棒杆菌细胞膜组分的代谢或参与跨越这些膜的分子转运。本发明的分子可以用于或者直接调节微生物例如谷氨酸棒杆菌的精细化学品产生(例如其中脂肪酸生物合成蛋白的过量表达或优化对经修饰的谷氨酸棒杆菌的脂肪酸收率、产量和/或产率有直接影响),或可以具有间接影响,这无论如何导致所需化合物的收率、产量和/或产率的提高(例如其中细胞膜组成代谢的调节导致收率、产量和/或产率或细胞膜组合的改变,这进而可以影响一种或多种精细化学品的生产)。以下进一步说明本发明的各个方面。
I.精细化学品
术语“精细化学品”是本领域公知的,包括由生物产生的在各种工业(例如但不限于制药业、农业和化妆品工业)上具有多种应用的分子。这类化合物包括有机酸,例如酒石酸、衣康酸和二氨基庚二酸;生成蛋白质的和非生成蛋白质的氨基酸;嘌呤和嘧啶碱基、核苷和核苷酸(如描述于例如Kuninaka,A.(1996)核苷酸和相关化合物,载于Biotechnology,第6卷,第561-612页,Rehm等编著,VCH:Weinheim以及其中含有的参考文献);脂质、饱和和不饱和脂肪酸(例如花生四烯酸);二元醇(例如丙二醇和丁二醇);糖类(例如透明质酸和海藻糖);芳族化合物(例如芳香胺、香草醛和靛蓝);维生素和辅因子(如描述于Ullmann’s Encyclopedia of Industrial Chemistry,第A27卷,“Vitamins”,第443-613页(1996)VCH:Weinheim以及其中的参考文献;和Ong,A.S.,Niki,E.和Packer,L.(1995)“Nutrition,Lipids,Health,and Disease”Proceedings of the UNESCO/Confederation of Scientific and TechnologicalAssociations in Malaysia,and the Society for Free Radical Research-Asia,于1994年9月1-3日在马来西亚Penang举行,AOCS Press,(1995));酶;聚酮化合物(Cane等(1998)Science 282:63-68);和描述于Gutcho(1983)Chemicals by Fermentation,Noyes Data Corporation,ISBN:0818805086中以及其中的参考文献的所有其它化学品。以下进一步详细描述这些精细化学品中的某些的代谢和应用。
A.氨基酸代谢和应用
氨基酸包括所有蛋白质的基本结构单元,因此是所有生物的正常细胞功能必不可少的。术语“氨基酸”是本领域公知的。生成蛋白质的氨基酸有20种,用作蛋白质的结构单元,在蛋白质中它们通过肽键连接;而非蛋白生成的氨基酸(已知数百种所述氨基酸)不是在蛋白质中正常发现的(参见Ulmann’s Encyclopedia of Industrial Chemistry,第A2卷,第57-97页VCH:Weinheim(1985))。氨基酸可以具有D-或L-光学构型,虽然L-氨基酸一般是天然存在的蛋白质中发现的唯一类型。20种生成蛋白质的氨基酸中每种的生物合成和降解途径已经在原核细胞和真核细胞中很好地表征了(参见例如Stryer,L. Biochemistry,第3版,第578-590页(1988))。“必需”氨基酸(组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、苏氨酸、色氨酸和缬氨酸)如此命名,是因为它们的生物合成复杂,一般是营养上需要的,所述“必需”氨基酸容易通过简单的生物合成途径转化为其余11种“非必需”氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、丝氨酸和酪氨酸)。高等动物的确保留合成这些氨基酸中的某些氨基酸,但必需氨基酸必需从饮食中供应,以便进行正常的蛋白质合成。
除了这些氨基酸在蛋白质生物合成中的功能外,这些氨基酸自身还是令人感兴趣的化学品,已经发现其中许多氨基酸在食品工业、饲料工业、化学工业、化妆品工业、农业和制药业中具有各种应用。赖氨酸不仅是人类营养的重要氨基酸,而且也是单胃动物(例如家禽和猪)营养的重要氨基酸。谷氨酸最常用作调味添加剂(谷氨酸一钠,MSG),并且在食品工业广泛使用,天冬氨酸、苯丙氨酸、甘氨酸和半胱氨酸也是如此。甘氨酸、L-甲硫氨酸和色氨酸都用于制药业。谷氨酰胺、缬氨酸、亮氨酸、异亮氨酸、组氨酸、精氨酸、脯氨酸、丝氨酸和丙氨酸在制药业和化妆品工业上有价值。苏氨酸、色氨酸和D/L-甲硫氨酸是常用的饲料添加剂。(Leuchtenberger,W.(1996)氨基酸-技术生产和应用,载于Rehm等(编著)Biotechnology,第6卷,第14a章,第466-502页,VCH:Weinheim)。另外,已经发现这些氨基酸可用作合成氨基酸和蛋白质合成的前体,例如N-乙酰半胱氨酸、S-羧甲基-L-半胱氨酸、(S)-5-羟基色氨酸以及描述于Ulmann’s Encyclopedia of IndustrialChemistry,第A2卷,第57-97页,VCH:Weinheim,1985的其它氨基酸。
在能够生产这些天然氨基酸的生物(例如细菌)体内的这些天然氨基酸的生物合成已经很好地表征(有关细菌氨基酸生物合成及其调节的综述,参见Umbarger,H.E.(1978)Ann.Rev.Biochem.47:533-606)。通过柠檬酸循环中的中间体α-酮戊二酸的还原酰胺化,合成谷氨酸。随后由谷氨酸分别产生谷氨酰胺、脯氨酸和精氨酸。丝氨酸的生物合成是一个三步骤过程,以3-磷酸甘油酸(糖酵解中的中间体)开始,在氧化、转氨基作用和水解步骤后,产生这种氨基酸。半胱氨酸和甘氨酸都由丝氨酸产生,前者通过高半胱氨酸和丝氨酸缩合而产生,而后者通过在一个由丝氨酸转羟甲基酶催化的反应中将侧链β-碳原子转移至四氢叶酸而产生。苯丙氨酸和酪氨酸在预苯酸合成后在仅最后两个步骤不同的9步骤生物合成途径中,由糖酵解和戊糖磷酸途径前体4-磷酸赤藓糖和磷酸烯醇丙酮酸合成。色氨酸也由这两种起始分子产生,但其合成是一个11步骤途径。酪氨酸也可以在一个由苯丙氨酸羟化酶催化的反应中由苯丙氨酸合成。丙氨酸、缬氨酸和亮氨酸都是糖酵解终产物-丙酮酸的生物合成产物。天冬氨酸由柠檬酸循环的中间体草酰乙酸生成。天冬酰胺、甲硫氨酸、苏氨酸和赖氨酸分别通过天冬氨酸的转化而产生。异亮氨酸由苏氨酸生成。一个复杂的9步骤途径导致由一种活化糖-5-磷酸核糖-1-焦磷酸产生组氨酸。
细胞的过量蛋白质合成需求中的氨基酸不能被贮存,而是被降解,为细胞的主要代谢途径提供中间体(有关综述参见Stryer,L.Biochemistry,第3版,第21章,“氨基酸降解和尿素循环”,第495-516页(1988))。虽然细胞能够将不想要的氨基酸转化为有用的代谢中间体,但就能量、前体分子和合成氨基酸所必需的酶而言,氨基酸生产是昂贵的。因此,氨基酸生物合成受反馈抑制调节是不奇怪的,在反馈抑制中,特定氨基酸的存在起减慢或完全终止其自身产生的作用(有关氨基酸生物合成途径中的反馈机制的综述,参见Stryer,L.Biochemistry,第3版,第24章,“氨基酸和血红素的生物合成”,第575-600页(1988))。因此,任何特定氨基酸的输出受细胞中存在的氨基酸量的限制。
B.维生素、辅因子和营养药的代谢和应用
维生素、辅因子和营养药包括高等动物已经丧失合成能力并且因此必须摄入的另外一组分子,尽管它们容易由其它生物例如细菌合成。这些分子或者本身是生物活性物质,或者是可以用作用作电子载体或多种代谢途径的中间体的生物活性物质的前体。这些化合物除了具有营养价值外,也具有作为着色剂、抗氧化剂和催化剂或其它加工助剂的重要工业价值。(有关这些化合物的结构、活性和工业应用的概述,参见例如Ullman’s Encyclopedia of Industrial Chemistry,“Vitamins”,第A27卷,第443-613页,VCH:Weinheim,1996)。术语“维生素”是本领域公知的,包括生物正常功能所需、但生物自身不能合成的营养物。维生素类可以包括辅因子和营养药化合物。用语“辅因子”包括发生正常酶活性所需的非蛋白性化合物。这类化合物可以是有机化合物或无机化合物;本发明的辅因子分子最好是有机分子。术语“营养药”包括在植物和动物、特别是人类中具有健康益处的食物增补剂。这类分子的实例是维生素、抗氧化剂以及某些脂质(例如多不饱和脂肪酸)。
已经大量表征了这些分子在能够生产其的生物例如细菌中的生物合成(Ullman’s Encyclopedia of Industrial Chemistry,“Vitamins”,第A27卷,第443-613页,VCH:Weinheim,1996;Michal,G.(1999)Biochemical Pathways:An Atlas of Biochemistry and Molecular Biology,John Wiley & Sons;Ong,A.S.,Niki,E和Packer,L.(1995)“Nutrition,Lipids,Health,and Disease”Proceedings of the UNESCO/Confederationof Scientific and Technological Associations in Malaysia,and the Societyfor Free Radical Research-Asia,于1994年9月1-3日在马来西亚Penang举行,AOCS Press:Champaign,IL X,374 S)。
通过将嘧啶和噻唑部分化学偶联,产生硫胺素(维生素B1)。核黄素(维生素B2)由鸟苷-5’-三磷酸(GTP)和核糖-5’-磷酸合成。核黄素进而用来合成黄素单核苷酸(FMN)和黄素腺嘌呤二核苷酸(FAD)。统称为“维生素B6”的化合物家族(例如吡哆醇、吡哆胺、吡哆醛-5’-磷酸以及商业上使用的盐酸吡哆醇)都是具有共同结构单元5-羟基-6-甲基吡啶的衍生物。泛酸((R)-(+)-N-(2,4-二羟基-3,3-二甲基-1-氧代丁基)-β-丙氨酸)可以或者通过化学合成或者通过发酵生产。泛酸生物合成中的最后的步骤由ATP驱动的β-丙氨酸和泛解酸缩合组成。负责转化为泛解酸、β-丙氨酸和转化为泛酸的缩合的生物合成步骤的酶是已知的。代谢活性形式的泛酸是辅酶A,其生物合成以5个酶促步骤进行。泛酸、吡哆醛-5’-磷酸、半胱氨酸和ATP是辅酶A的前体。这些酶不仅催化泛酸的生成,而且催化(R)-泛解酸、(R)-pantolacton、(R)-泛醇(前维生素B5)、泛酰巯基乙胺(及其衍生物)和辅酶A的产生。
已经详细研究了微生物中由前体分子庚二酰辅酶A开始的生物素生物合成,并且已经鉴定出所涉及的几种基因。已经发现许多相应的蛋白质也参与铁簇合成,并且是nifS类蛋白质的成员。硫辛酸衍生自辛酸,用作能量代谢中的辅酶,在能量代谢中它成为丙酮酸脱氢酶复合体和α-酮戊二酸脱氢酶复合体的一部分。叶酸类是一类叶酸衍生物的物质,叶酸又衍生自L-谷氨酸、对氨基苯甲酸和6-甲基蝶呤。已经在某些微生物中详细地研究了叶酸及其衍生物的生物合成,所述生物合成起始于代谢中间体鸟苷-5’-三磷酸(GTP)、L-谷氨酸和对氨基苯甲酸。
类咕啉(例如钴胺素、特别是维生素B12)和卟啉属于一类特征为四吡咯环系的化学物质。维生素B12的生物合成足够复杂,以致尚未被完全鉴定,但现在已知许多所涉及的酶和底物。烟酸和烟酰胺是吡啶衍生物,也称为“尼克酸”。烟酸是重要的辅酶NAD(烟酰胺腺嘌呤二核苷酸)和NADP(烟酰胺腺嘌呤二核苷酸磷酸)及其还原形式的前体。
这些化合物的大规模生产一直主要依靠无细胞化学合成,尽管这些化学品中的某些也已经通过大规模微生物培养来生产,例如核黄素、维生素B6、泛酸和生物素。仅维生素B12由于其合成的复杂性通过发酵生产。体外方法花费大量原料和时间,通常费用巨大。
C.嘌呤、嘧啶、核苷和核苷酸的代谢和应用
嘌呤和嘧啶代谢基因及其相应的蛋白质是肿瘤疾病和病毒感染的重要的治疗靶。用语“嘌呤”或“嘧啶”包括含氮碱基,它们是核酸、辅酶和核苷酸的组分。术语“核苷酸”包括核酸分子的基本结构单元,它们由一个含氮碱基、一个戊糖(在RNA的情况下,所述糖是核糖;在DNA的情况下,所述糖是D-脱氧核糖)和磷酸构成。用语“核苷”包括用作核苷酸前体、但缺乏核苷酸所具有的磷酸部分的分子。通过抑制这些分子的生物合成或抑制其形成核酸分子的转移,有可能抑制RNA和DNA的合成;通过以靶向癌细胞的方式抑制这种活性,可以抑制肿瘤细胞***和复制的能力。另外,有不形成核酸分子、而是用作能量贮存(即AMP)或用作辅酶(即FAD和NAD)的核苷酸。
几个出版物已经描述了通过影响嘌呤和/或嘧啶代谢,将这些化学物质用于这些医学适应征(例如Christopherson,R.I.和Lyons,S.D.(1990)“作为化疗药的嘧啶和嘌呤从头生物合成的有效抑制剂”,Med.Res.Reviews 10:505-548)。对参与嘌呤和嘧啶代谢的酶的研究一直集中于可以用作例如免疫抑制剂或抗增殖药的新药的开发(Smith,J.L.,(1995)“核苷酸合成中的酶”,Curr.Opin. struct.Biol.5:752-757;(1995)Biochem Soc.Transact.23:877-902)。然而,嘌呤和嘧啶碱基、核苷和核苷酸具有其它用途:用作几种精细化学品(例如硫胺素、S-腺苷-甲硫氨酸、叶酸或核黄素)生物合成的中间体、用作细胞的能量载体(例如ATP或GTP)和用于化学品自身,通常用作黄素增强剂(例如IMP或GMP)或用于几种药物应用(参见例如Kuninaka,A.(1996)Nucleotidesand Related Compounds in Biotechnology,第6卷,Rehm等编著,VCH:Weinheim,第561-612页)。此外,参与嘌呤、嘧啶、核苷或核苷酸代谢的酶越来越多地用作开发用于保护作物的化学品的靶,所述化学品包括杀真菌剂、除草剂和杀虫剂。
已经鉴定了这些化合物在细菌中的代谢(有关综述参见例如Zalkin,H.和Dixon,J.E.(1992)“嘌呤核苷酸的从头生物合成”,载于:Progress in Nucleic Acid Research and Molecular Biology,第42卷,Academic Press,第259-287页;和Michal,G.(1999)“核苷酸和核苷”,载于:Biochemical Pathways:An Atlas of Biochemistry and MolecularBiology,第8章,Wiley:New York)。嘌呤代谢一直是广泛研究的主题,并且对于细胞的正常功能是必不可少的。在高等动物中嘌呤代谢受损可以引起严重的疾病,例如痛风。嘌呤核苷酸由核糖-5-磷酸开始合成,通过中间体化合物肌苷-5’-磷酸(IMP)的一系列步骤,导致鸟苷-5’-一磷酸(GMP)或腺苷-5’-一磷酸(AMP)的产生,由GMP或AMP容易生成用作核苷酸的三磷酸形式。这些化合物也用作能量贮存,因为其降解为细胞中的许多不同生物化学过程提供能量。嘧啶生物合成通过由核糖-5-磷酸形成尿苷-5’-一磷酸(UMP)而进行。UMP进而转化为胞苷-5’-三磷酸(CTP)。所有这些核苷酸的脱氧形式在一步还原反应中产生,从所述核苷酸的二磷酸核糖形式还原反应为所述核苷酸的二磷酸脱氧核糖形式。在磷酸化后,这些分子能够参与DNA合成。
D.海藻糖的代谢和应用
海藻糖由以α,α-1,1-键合连接的两个葡萄糖分子组成。海藻糖在食品工业中通常用作甜味剂,即用于干燥食品或冷冻食品和饮料中的一种添加剂。然而,它在制药业、化妆品工业和生物技术工业中也具有许多应用(参见例如Nishimoto等,(1998)美国专利号5,759,610;Singer,M.A.和Lindquist,S.(1998)Trends Biotech.16:460-467;Paiva,C.L.A.和Panek,A.D.(1996)Biotech.Ann.Rev.2:293-314;和Shiosaka,M.(1997)J.Japan 172:97-102)。海藻糖用来自许多微生物的酶来生产,并且天然被释放到周围介质中,可以用本领域已知的方法从所述周围介质中收集海藻糖。
II.膜生物合成和跨膜转运
细胞膜在细胞中有各种各样的功能。首要的是,细胞膜将细胞内容物与周围环境区分开来,因此给予细胞完整性。细胞膜也用作阻挡有害或不想要的化合物流入以及阻止所需化合物流出的屏障。细胞膜由于其脂质分子双层的结构,对于不易扩散的亲水性化合物例如蛋白质、水分子和离子是天然不透过性的,在脂质分子双层结构中,极性头基面向外(分别朝向细胞的外部和内部),而剂型尾面向内朝向双层中心,形成疏水核心(有关膜结构和功能的总体综述,参见Gennis,R.B.(1989)Biomembranes,Molecular Structure and Function,Springer:Heidelberg)。这种屏障使细胞能够维持相对高于周围介质中所含浓度的所需化合物和相对低浓度不需要的化合物,因为这些化合物的扩散被膜有效地阻断。然而,膜也提供了输入所需化合物和输出废物分子的有效屏障。为了克服这种困难,细胞膜掺入了许多种类的转运蛋白,所述转运蛋白能够促进不同种类化合物的跨膜转运。有两个主要类别的转运蛋白:膜孔蛋白或通道蛋白以及转运蛋白。前者形成膜内在蛋白,有时形成蛋白复合体,构成受调节的通过该膜的膜孔。这种调节或者“门控”通常对于所述膜孔蛋白或通道蛋白待转运的分子是特异性的,使得这些跨膜构成物选择性地可透过特定类别的底物;例如构建钾通道,使得仅电荷和大小类似于钾的离子可以通过。通道蛋白和膜孔蛋白往往具有分隔的疏水结构域和亲水结构域,使得所述蛋白质的疏水面可以与膜的内部缔合,而亲水面衬于通道内部,由此提供选定亲水分子可以通过的受保护的亲水环境。本领域已知许多这类膜孔/通道,包括钾离子、钙离子、钠离子和氯离子的膜孔/通道。
这种膜孔和通道介导的易化扩散***限于非常小的分子,例如离子,因为大到足以让完整蛋白质通过易化扩散而通过的膜孔或通道也不能阻止较小的亲水性分子的通过。通过这一过程的分子转运有时称为“易化扩散”,因为发生所述转运需要浓度梯度的驱动力。当较大分子(例如葡萄糖或其它糖)在膜一侧的浓度高于另一侧时,通透酶也提供这些分子到细胞中的易化扩散(也称为“单向转运”)。与膜孔或通道相反,这些膜内在蛋白(通常具有6-14个跨膜α-螺旋)不形成通过膜的开放通道,而是与膜表面的靶分子结合,然后经过构象变化,使得所述靶分子在膜的相反一侧释放。
然而,细胞通常需要逆现有浓度梯度输入或输出分子(“主动转运”),这是不能发生易化转运的情况。细胞使用两个主要的机制进行膜转运:同向转运或对向转运、以及能量偶联转运,例如ABC转运蛋白介导的转运。同向转运和对向转运***偶联跨越膜的两种不同分子的运动(通过对于所述两种不同分子具有两个独立的结合部位的通透酶);在同向转运中,两种分子以同一方向转运,而在对向转运中,一种分子输入,另一种分子输出。这在能量学上可能的,因为这两种分子之一按照浓度梯度运动,这种符合能量学的事件仅在所需化合物逆优势(prevailing)浓度梯度同时运动时才是允许的。在能量驱动的过程中,单种分子可以被逆浓度梯度跨膜转运,例如ABC转运蛋白所利用的能量驱动过程。在该***中,位于膜中的转运蛋白具有一个ATP结合盒;当靶分子结合时,ATP转化为ADP+Pi,所产生的能量释放被用来驱动所述转运蛋白易化的靶分子到膜另一面的移动。有关所有这些转运***的更详细描述,参见:Bamberg,E.等,(1993)“脂质双层膜上离子泵的电荷转运”,Q.Rev.Biophys.26:1-25;Findlay,J.B.C.(1991)“膜转运***中的结构和功能”,Curr.Opin.Struct.Biol.1:804-810;Higgins,C.F.(1992)“从微生物到人类的ABC转运蛋白”,Ann.Rev.Cell Biol.8:67-113;Gennis,R.B.(1989)“膜孔、通道和转运蛋白”,载于:Biomembranes,Molecular Structure and Function,Springer:Heidelberg,第270-322页;和Nikaido,H.和Saier,H.(1992)“细菌中的转运蛋白:其设计中的共同主题”,Science 258:936-942以及这些参考文献中的每个中所含有的参考文献。
膜的合成是一个已充分表征的过程,涉及许多组分,其中最为重要的是脂质分子。脂质合成可以分为两个部分:脂肪酸的合成及其与sn-甘油-3-磷酸的连接、以及极性头基的加入或修饰。细菌细胞膜中所用的典型脂质包括磷脂、糖脂、鞘脂和磷酸甘油酯。脂肪酸合成始于或者由乙酰CoA羧化酶将乙酰CoA转化为丙二酰CoA、或由乙酰基转移酶将乙酰CoA转化为乙酰-ACP。在缩合反应之后,这两种产物分子一起形成乙酰乙酰-ACP,这通过一系列缩合、还原和脱水反应而转化,产生具有所需链长的饱和脂肪酸分子。从这类分子产生不饱和脂肪酸,由特定的去饱和酶或者借助于分子氧有氧催化,或者无氧催化(有关脂肪酸合成的参考文献,参见F.C.Neidhardt等(1996)E.coliandSalmonella.ASM Press:Washington,D.C.,第612-636页和其中含有的参考文献;Lengeler等(编著)(1999)Biology of Procaryotes.Thieme:Stuttgart,New York和其中含有的参考文献;和Magnuson,K.等(1993)Microbiological Reviews 57:522-542和其中含有的参考文献)。环丙烷脂肪酸(CFA)由特定CFA合酶用SAM作为共底物来合成。支链脂肪酸由支链氨基酸脱氨产生支链2-酮-酸而合成(参见Lengeler等编著(1999)Biology of Procaryotes.Thieme:Stuttgart,New York及其中含有的参考文献)。脂质合成中的另一必需步骤是由例如甘油-磷酸-酰基转移酶将脂肪酸转移至极性头基上。各种前体分子和生物合成酶的联合导致产生不同的脂肪酸分子,这对所述膜的组成具有深远的影响。
III.本发明的元件和方法
本发明至少部分基于本文称为MCT核酸和蛋白分子的新分子的发现,所述MCT分子控制谷氨酸棒杆菌中细胞膜的产生并且控制跨越这类膜的分子的运动。在一个实施方案中,MCT分子参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运。在一个优选实施方案中,本发明的MCT分子调节膜组分产生和膜转运的活性对该生物产生所需精细化学品有影响。在一个特别优选的实施方案中,本发明的MCT分子在活性上受调节,使得在收率、产量和/或产率以及化合物通过所述膜的转运方面调节本发明MCT蛋白所调节的谷氨酸棒杆菌代谢途径在效率方面被改变,这或者直接或者间接地调节谷氨酸棒杆菌的所需精细化学品的收率、产量和/或产率。
用语“MCT蛋白”或“MCT多肽”包括参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运的蛋白质。MCT蛋白的实例包括由表1中所述的MCT基因和奇数SEQ ID NO编码的那些蛋白质。术语“MCT基因”或“MCT核酸序列”包括编码MCT蛋白、由一个编码区以及相应的非翻译5’和3’序列区组成的核酸序列。MCT基因的实例包括表1中所述的那些基因。术语“产量”或“生产力”是本领域公知的,包括在给定时间和给定发酵体积内生成的发酵产物(例如所需精细化学品)的浓度(例如每小时每升的kg产物)。术语“产率”包括待达到的特定生产水平所需的时间(例如细胞达到特定精细化学品产出率需要多长时间)。术语“收率”或“产物/碳收率”是本领域公知的,包括碳源转化为产物(即精细化学品)的效率。这通常表示为例如每kg碳源的kg产物。通过增加所述化合物的收率或产量,增加在给定时间给定量的培养物中该化合物的回收分子的量或可用回收分子的量。术语“生物合成”或“生物合成途径”是本领域公知的,包括细胞在可以多步骤且高度受调节的过程中从中间体化合物开始的化合物、最好是有机化合物的合成。术语“降解”或“降解途径”是本领域公知的,包括细胞在可以是多步骤且高度受调节的过程中将化合物、最好是有机化合物分解为降解产物(一般而言,是较小或复杂度较低的分子)。用语“代谢”是本领域公知的,包括生物体内发生的全部生物化学反应。特定化合物的代谢(例如诸如甘氨酸的氨基酸的代谢)则包括细胞中与该化合物有关的全部生物合成、修饰和降解途径。
在另一实施方案中,本发明的MCT分子能够调节微生物例如谷氨酸棒杆菌中所需分子例如精细化学品的产量。有许多机制使得改变本发明MCT蛋白可以直接影响得自掺入这种改变的蛋白的谷氨酸棒杆菌菌株的精细化学品的收率、产量和/或产率。可以在数量或活性上增加参与从细胞输出精细化学品的那些MCT蛋白,使得更大量的这些化合物被分泌到胞外介质中,从胞外介质中更容易将其回收。同样,可以在数量或活性上增加参与一种或多种精细化学品(例如磷酸、硫酸、含氮化合物等)生物合成所必需营养物输入的那些MCT蛋白,使得这些前体、辅因子或中间体化合物在细胞中的浓度增加。此外,脂肪酸和脂质本身是理想的精细化学品;通过优化参与这些化合物生物合成的一种或多种本发明MCT蛋白的活性,或者增加所述MCT蛋白的数量,或者通过降低参与这些化合物降解的一种或多种MCT蛋白的活性,有可能增加得自谷氨酸棒杆菌的脂肪酸或脂质分子的收率、产量和/或产率。
一种或多种本发明MCT基因的诱变也可能产生具有改变活性的MCT蛋白,这间接影响得自谷氨酸棒杆菌的一种或多种所需精细化学品的产生。例如,可以数量或活性上增加参与废物输出的本发明MCT蛋白,使得细胞的正常代谢废物(由于所需精细化学品的过量产生,其量可能增加)在能够损害细胞内的核苷酸和蛋白质(这可能降低细胞的生存力)或干扰精细化学品生物合成途径(这可能降低所需精细化学品的收率、产量或产率)之前被有效地输出。此外,胞内相对大量的所需精细化学品可能本身对细胞有毒性,因此通过增加能够将该化合物输出细胞的转运蛋白的活性或数量,可能增加培养物中细胞的生存力,进而在培养物中产生更大量的生产所需精细化学品的细胞。也可以对本发明的MCT蛋白进行操作,使得产生相对量的不同脂质和脂肪酸分子。这可能对对细胞膜脂质组成有深远的影响。由于每种类型的脂质具有不同的物理特性,因此膜脂质组成的改变可能显著改变膜的流动性。膜流动性的改变可能影响跨越所述膜的分子的转运以及细胞的完整性,这两者对得自大规模发酵培养物中谷氨酸棒杆菌的精细化学品生产具有深远的影响。
本发明的分离的核酸序列包含在谷氨酸棒杆菌菌株的基因组中,所述菌株可通过美国典型培养物保藏中心获得,保藏号为ATCC13032。所述分离的谷氨酸棒杆菌MCT DNA的核苷酸序列和谷氨酸棒杆菌MCT蛋白的预测氨基酸序列分别示于序列表中奇数SEQ ID NO和偶数SEQ ID NO中。进行计算分析,将这些核苷酸序列分类和/或鉴定为参与细胞膜组分的代谢或参与跨越这些膜的化合物转运的蛋白质的编码序列。
本发明也涉及所具有的氨基酸与本发明氨基酸序列(例如序列表中的偶数SEQ ID NO的序列)基本上同源的蛋白质。本文所用的所具有的氨基酸序列与选定氨基酸序列基本上同源的蛋白质,与所选定氨基酸序列(例如所述完整的所选定氨基酸序列)至少约50%同源。所具有的氨基酸序列与选定氨基酸序列基本上同源的蛋白质,也可以与所选定氨基酸序列有至少约50-60%、优选至少约60-70%、更优选至少约70-80%、80-90%或90-95%、最优选至少约96%、97%、98%、99%或更高的同源性。
本发明的MCT蛋白或其生物活性部分或片段可以参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运,或具有表1中所述的一种或多种活性。
在以下小节中更加详细地描述本发明的各个方面。
A.分离的核酸分子
本发明的一个方面涉及编码MCT多肽或其生物活性部分的分离的核酸分子、以及足以用作MCT编码核酸(例如MCT DNA)鉴定或扩增的杂交探针或引物的核酸片段。本文所用的术语“核酸分子”将是指包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)以及采用核苷酸类似物产生的DNA或RNA类似物。该术语也包括位于基因编码区3’端和5’端的非翻译序列:基因编码区5’端上游的至少约100个核苷酸的序列和编码区3’端下游至少约20个核苷酸的序列。所述核酸分子可以是单链或双链,但最好是双链DNA。“分离的”核酸分子是与所述核酸天然来源中存在的其它核酸分子分离的核酸分子。最好是,“分离的”核酸不含所述核酸来源的生物的基因组DNA中天然邻接所述核酸的序列(即位于所述核酸5’端和3’端的序列)。例如,在各种实施方案中,分离的MCT核酸分子可以含有小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在所述核酸来源的细胞(例如谷氨酸棒杆菌细胞)的基因组DNA中天然邻接所述核酸分子的核苷酸序列。此外,“分离的”核酸分子,例如DNA分子,可以基本上不含其它细胞物质,或当通过重组技术产生时不含培养基,或当化学合成时不合化学前体或其它化学物质。
本发明的核酸分子,例如具有序列表中奇数SEQ ID NO核苷酸序列的核酸分子或其部分,可以用标准分子生物学技术和本文提供的序列信息来分离。例如,可以用序列表中奇数SEQ ID NO序列之一的全部序列或部分序列作为杂交探针,采用用标准杂交技术(例如,描述于以下文献的技术:Sambrook,J.,Fritsh,E.F.和Maniatis,T.MolecularCloning:A Laboratory Manual.第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989),可以从谷氨酸棒杆菌文库中分离出谷氨酸棒杆菌MCT DNA。此外,包含本发明核酸序列(例如奇数SEQ ID NO)之一的全部或部分序列的核酸分子,可以采用基于该序列设计的寡核苷酸引物,通过聚合酶链式反应来分离(例如,包含本发明核酸序列之一的全部或部分序列的核酸分子(例如序列表的奇数SEQ ID NO)可以采用基于所述序列的设计的寡核苷酸引物通过聚合酶链式反应来分离)。例如,可以从正常的内皮细胞分离mRNA(例如通过Chirgwin等(1979)Biochemistry 18:5294-5299的异硫氰酸萃取法),然后用反转录酶(例如莫洛尼MLV反转录酶,可得自Gibco/BRL,Bethesda,MD;或AMV反转录酶,可得自Seikagaku America,Inc.,St.Petersburg,FL)制备DNA。可以基于序列表中所示的核苷酸序列之一,设计用于聚合酶链式反应扩增的合成寡核苷酸引物。用cDNA或者基因组DNA作为模板,用合适的寡核苷酸引物,按照标准PCR扩增技术,可以扩增本发明的核酸。将如此扩增的核酸克隆到合适的载体中,并且通过DNA序列分析进行鉴定。此外,对应于MCT核苷酸序列的寡核苷酸可以通过标准合成技术,例如用自动DNA合成仪来制备。
在一个优选实施方案中,本发明的分离的核酸分子包含一种序列表中所示的核苷酸序列。序列表中所示的本发明的核酸序列对应于本发明的谷氨酸棒杆菌MCT DNA。该DNA包含编码MCT蛋白(即分别示于序列表奇数SEQ ID NO中的“编码区”)的序列以及5’非翻译序列和3’非翻译序列,所述非翻译序列也分别示于序列表中的奇数SEQID NO中。另一方面,所述核酸分子可以仅包含序列表中任一核酸序列的编码区。
为了进行这种应用,人们会理解,序列表中所示的每种核酸序列和氨基酸序列具有标识性RXA、RXN、RXS或RXC编号,所述编号具有后接5位数字的标识符“RXA”、“RXN”、“RXS”或“RXC”(即RXA02099、RXN03097、RXS00148或RXC01748)。每种所述核酸序列包含至多三个部分:一个5’上游区、一个编码区和一个下游区。这三个区中的每个区通过相同的RXA、RXN、RXS或RXC标识符来鉴别,以避免混淆。叙述“序列表中奇数序列之一”则是指序列表中任一核酸序列,它也可以根据其不同的RXA、RXN、RXS或RXC标识符来区分。这些序列中的每个序列的编码区被翻译为相应的氨基酸序列,所述氨基酸序列也示于序列表中,作为紧接相应核酸序列之后的偶数SEQ ID NO。例如,RXA03097的编码区示于SEQ ID NO:1中,而其编码的氨基酸序列示于SEQ ID NO:2中。本发明核酸分子的序列根据与它们所编码的氨基酸分子相同的RXA、RXN、RXS或RXC标识符来鉴别,使得可以容易地将它们相联系。例如,名为RXA02099、RXN03097、RXS00148和RXC01748的氨基酸序列分别是核酸分子RXA02099、RXN03097、RXS00148和RXC01748核苷酸序列编码区的翻译物。本发明的RXA、RXN、RXS和RXC核苷酸序列和氨基酸序列与其指定的SEQ ID NO之间的对应关系示于表1中。例如,如表1中所示,RXA00104的核苷酸序列是SEQ ID NO:5,而RXA00104的氨基酸序列是SEQ ID NO:6。
本发明的几种基因是“F标志的基因”。F标志的基因包括表1中所示的在RXA、RXN、RXS或RXC标识符之前具有一个“F”的那些基因。例如,在表1中指定为“F RXA02581”的SEQ ID NO:11是一种F标志的基因,SEQ ID NO:31、33和43(在表1中分别指定为“F RXA02487”,“F RXA02490”,“F RXA02809”)也是如此。
在一个实施方案中,本发明的核酸分子不是指包括表2中编辑的那些核酸分子。就dapD基因而言,该基因的序列公布于Wehrmann,A.等(1998)J. Bacteriol.180(12):3159-3165中。然而,本申请发明人获得的序列显著比所公布的形式长。认为所公布的形式依赖于不正确的起始密码子,因此仅代表真实编码区的一个片段。
在另一优选实施方案中,本发明的分离的核酸分子包含作为本发明核苷酸序列(例如序列表中的奇数SEQ ID NO序列)之一的互补序列的核酸分子或其部分。作为本发明中所示核苷酸序列之一的互补序列的核酸分子是与序列表中所示的核苷酸序列(例如奇数SEQ ID NO序列)之一足够互补、使得可以与本发明核苷酸序列之一杂交并因此形成稳定双链体的核酸分子。
在再一优选实施方案中,本发明的分离的核酸分子包含这样的核苷酸序列或其部分,所述核苷酸序列与本发明核苷酸序列(例如序列表中的奇数SEQ ID NO序列)的同源性为至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%或60%,优选至少约61%、62%、63%、64%、65%、66%、67%、68%、69%或70%,更优选至少约71%、72%、73%、74%、75%、76%、77%、78%、79%或80%、81%、82%、83%、84%、85%、86%、87%、88%、89%或90%、或91%、92%、93%、94%,甚至更优选至少约95%、96%、97%、98%、99%或更高。本发明也包括上述数值之间的范围和标识数值(例如70-90%相同或80-95%相同)。例如,将包括采用上述值作为上限和/或下限的任何组合的标识值范围。在另一优选实施方案中,本发明的分离的核酸分子包含与本发明核苷酸序列之一杂交、例如在严格条件下杂交的核苷酸序列或其部分。
此外,本发明的核酸分子可以仅包含序列表中一种奇数SEQ IDNO序列编码区的一部分,例如可以用作探针或引物的片段或编码MCT蛋白的生物活性部分的片段。根据从谷氨酸棒杆菌克隆MCT基因而测定的核苷酸序列,使得可以产生设计用于鉴定和/或克隆其它细胞类型和生物中的MCT同系物以及来自其它棒杆菌或相关菌种的MCT同系物的探针和引物。所述探针/引物通常包含基本上纯化的寡核苷酸。所述寡核苷酸通常包含一种核苷酸序列区,所述核苷酸序列区在严格条件下与本发明核苷酸序列之一(例如序列表中一种奇数SEQ ID NO序列)的有义链、这些序列之一的反义序列或其天然存在的突变体的至少约12个、优选约25个、更优选约40个、50个或75个连续核苷酸杂交。基于本发明核苷酸序列的引物可以用于PCR反应中,以克隆MCT同系物。基于所述MCT核苷酸序列的探针可以用来检测编码同一蛋白或同源蛋白的转录物或基因组序列。在优选实施方案中,所述探针还包含与其连接的一个标记基团,例如所述标记基团可以是放射性同位素、荧光化合物、酶或酶辅因子。这类探针可以用作诊断试验试剂盒的一部分,以鉴定错误表达(misexpress)MCT蛋白的细胞,例如通过测定细胞样品中MCT编码核酸的水平,例如检测MCT mRNA水平或检测基因组MCT基因是否已经突变或缺失。
在一个实施方案中,本发明的核酸分子编码一种包含与本发明氨基酸序列(例如序列表中偶数SEQ ID NO序列)足够同源的氨基酸序列的蛋白质或其部分,使得所述蛋白质或其部分保留参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运的能力。本文所用的用语“足够同源”是指这样的蛋白质或其部分,所述蛋白质或其部分所具有的氨基酸序列包含最小数目的与本发明氨基酸序列相同或等同(例如所具有的侧链与序列表中一种偶数SEQ ID NO序列中的氨基酸残基相似的氨基酸残基)氨基酸残基,使得所述蛋白质或其部分能够参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运。本文所述的这类膜组分代谢途径或膜转运***的蛋白成员可能在一种或多种精细化学品的生产和分泌方面起作用。在本文中也描述了这类活性的实例。因此,“MCT蛋白的功能”或者直接或者间接地影响一种或多种精细化学品生产的收率、产量和/或产率。MCT蛋白活性的实例示于表1中。
在另一实施方案中,所述蛋白质与本发明的完整氨基酸序列(例如序列表偶数SEQ ID NO序列)的同源性为至少约50-60%,优选至少约60-70%,更优选至少约70-80%、80-90%、90-95%,最优选至少约96%、97%、98%、99%或更高。
本发明MCT核酸分子所编码的蛋白质的部分最好是一种所述MCT蛋白的生物活性部分。本文所用的术语“MCT蛋白的生物活性部分”将包括可以参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运的MCT蛋白的部分,例如结构域/基序,或具有表1中所述的一种活性。为了确定MCT蛋白或其生物活性部分是否可以参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运,可以进行酶活性的测定。这类测定方法是本领域技术人员众所周知的,如实施例部分的实施例8中详细描述的。
通过分离一种本发明氨基酸序列(例如序列表中偶数SEQ ID NO序列)的一部分,表达所编码的所述MCT蛋白或肽的一部分(例如通过体外重组表达),并且评价所编码的所述MCT蛋白或肽部分的活性,可以制备另外的编码MCT蛋白生物活性部分的核酸片段。
本发明还包括由于遗传密码的简并性而不同于本发明核苷酸序列(例如序列表中的奇数SEQ ID NO序列)之一(和其部分)并因此编码与本发明核苷酸序列所编码蛋白相同的MCT蛋白的核酸分子。在另一实施方案中,本发明的分离的核酸分子所具有的核苷酸序列编码具有序列表中所示氨基酸序列(例如偶数SEQ ID NO)的蛋白质。在再一实施方案中,本发明的核酸分子编码与本发明氨基酸序列(由序列表中奇数SEQ ID NO中所示的可读框编码)基本上同源的全长谷氨酸棒杆菌蛋白。
本领域技术人员会理解,在一个实施方案中,本发明的序列不意味着包括现有技术的序列,例如表2或4中叙述的在本发明之前获得的Genbank序列的那些序列。在一个实施方案中,本发明包括与本发明的核苷酸序列或氨基酸序列具有的同一性百分比大于现有技术序列(例如表2或4中叙述的Genbank序列(或由这种序列编码的蛋白质))的同一性百分比的核苷酸序列和氨基酸序列。例如,本发明包括:与名为RXA01420(SEQ ID NO:7)的核苷酸序列的同一性大于38%和/或至少为38%的核苷酸序列;与名为RXA00104(SEQ ID NO:5)的核苷酸序列的同一性大于41%和/或至少为41%的核苷酸序列;以及与名为RXA02173(SEQ ID NO:25)的核苷酸序列的同一性大于45%和/或至少为45%的核苷酸序列。本领域技术人员通过检查任何给定的本发明序列三个最高命中各自的表4中所示GAP计算的同一性百分比分值,并且从100%中减去GAP计算的最高同一性百分比分值,能够计算出所述给定的本发明序列同一性百分比的下限。本领域技术人员也会认识到,本发明也包括同一性百分比大于如此计算的下限(例如同一性至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%或60%,优选至少约61%、62%、63%、64%、65%、66%、67%、68%、69%或70%,更优选至少约71%、72%、73%、74%、75%、76%、77%、78%、79%或80%、81%、82%、83%、84%、85%、86%、87%、88%、89%或90%、或91%、92%、93%、94%,甚至更优选至少约95%、96%、97%、98%、99%或更高)的核酸序列和氨基酸序列。
除了序列表中奇数SEQ ID NO中所示的谷氨酸棒杆菌MCT核苷酸外,本领域技术人员会认识到,在群体(例如谷氨酸棒杆菌群体)中可能存在导致MCT蛋白氨基酸序列改变的DNA序列多态性。由于自然变异,这类所述MCT基因中的遗传多态性可能存在于群体的个体中。本文所用的术语“基因”和“重组基因”是指包含编码MCT蛋白、最好是谷氨酸棒杆菌MCT蛋白的可读框的核酸分子。这类天然变异通常可以导致所述MCT基因核苷酸序列中1-5%的变异。由于自然变异的结果并且不改变MCT蛋白功能活性的MCT中的任何和所有这类核苷酸变异和所产生的氨基酸多态性将包括在本发明范围内。
根据对应于本发明谷氨酸棒杆菌MCT DNA的天然变异体和非谷氨酸棒杆菌同系物的核酸分子与本文所公开的谷氨酸棒杆菌MCT核酸的同源性,采用所述谷氨酸棒杆菌DNA或其部分作为严格杂交条件下按照标准杂交技术的杂交探针,可以分离出所述核酸分子。因此,在另一实施方案中,本发明的分离的核酸分子至少长15个核苷酸,并且在严格条件下与包含序列表中奇数SEQ ID NO核苷酸序列的核酸分子杂交。在其它实施方案中,所述核酸至少长30个、50个、100个、250个或更多个核苷酸。本文所用的术语“在严格条件下杂交”意在描述相互之间至少60%同源的核苷酸序列通常保留相互杂交的杂交和洗涤条件。最好是,所述条件使得相互之间同源性为至少约65%、更优选至少约70%、甚至更优选至少约75%或更高的序列通常保持相互杂交。这类严格条件是本领域技术人员已知的,并且可以在CurrentProtocols in Mollecular Biology,John Wiley & Sons,N.Y.(1989),6.3.1-6.3.6中找到。严格杂交条件的一个优选的非限制性实例是在6X氯化钠/柠檬酸钠(SSC)中于约45℃杂交,然后在0.2 X SSC,0.1%SDS中于50-65℃进行一次或多次洗涤。最好是,在严格条件下与本发明核苷酸序列杂交的本发明分离的核酸分子对应于天然存在的核酸分子。本文所用的“天然存在的”核酸分子是指具有天然存在的核苷酸序列(例如编码天然蛋白质)的RNA或DNA分子。在一个实施方案中,所述核酸编码一种天然谷氨酸棒杆菌MCT蛋白。
除了在群体中可能存在的所述MCT序列的天然存在的变异体外,本领域技术人员还会认识到,可以通过在本发明核苷酸序列中进行突变而导入改变,由此导致所编码MCT蛋白氨基酸序列的改变,而不改变所述MCT蛋白的功能能力。例如,可以在本发明核苷酸中进行导致在“非必需”氨基酸残基上氨基酸取代的核苷酸取代。“非必需”氨基酸残基是可以在所述MCT蛋白之一的野生型序列(例如序列表的偶数SEQ ID NO)中被改变、而不改变所述MCT蛋白活性的残基,而“必需”氨基酸残基是MCT蛋白活性所需的。然而,其它氨基酸残基(例如在具有MCT活性的结构域中不保守或仅半保守的那些残基)可能不是活性必需的,因此可能适合改变而不改变MCT活性。
因此,本发明的另一方面涉及编码MCT蛋白、含有MCT活性非必需的氨基酸残基改变的核酸分子。这类MCT蛋白在氨基酸序列上不同于序列表中偶数SEQ ID NO的序列,但仍保留至少一种本文所述的MCT活性。在一个实施方案中,所述分离的核酸分子包含编码蛋白质的核苷酸序列,其中所述蛋白质包含与本发明氨基酸序列至少约50%同源的氨基酸序列,并且能够参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运,或具有表1中所述的一种或多种活性。最好是,所述核酸分子编码的蛋白质与序列表中一种奇数SEQ ID NO的氨基酸序列至少约50-60%同源,更优选与这些序列之一至少约60-70%同源,甚至更优选与这些序列之一至少约70-80%、80-90%、90-95%同源,最优选与一种本发明的氨基酸序列至少约96%、97%、98%或99%同源。
为了确定两种氨基酸序列(例如一种本发明的氨基酸序列和其突变体形式)或两种核酸的同源性百分比,将所述序列进行序列比对,以进行最佳比较(例如可以在一种蛋白质或核酸的序列引入空位,以与另一种蛋白质或核酸进行最佳序列比对)。然后比较对应氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当一个序列(例如一种本发明的氨基酸序列)中的一个位置被另一个序列(例如所述氨基酸序列的突变体形式)中相应位置的同一氨基酸残基或核苷酸占据时,则所述两种分子在该位置是同源的(即本文所用的氨基酸或核酸“同源性”等同于氨基酸或核酸“同一性”)。这两个序列之间的同源性百分比随所述序列共享的相同位置数而变化(即同源性百分比=相同位置数/位置总数×100)。
编码本发明蛋白序列(例如序列表中偶数SEQ ID NO序列)同源的MCT蛋白的分离的核酸分子可以通过以下步骤构建:在本发明的核苷酸序列中,导入一个或多个核苷酸取代、添加或缺失,使得在所编码的蛋白质中导入一个或多个氨基酸取代、添加或缺失。可以采用标准技术,例如定点诱变和PCR介导的诱变,将突变导入一种本发明的核苷酸序列中。最好是,在一个或多个预测的非必需氨基酸残基上进行保守氨基酸取代。“保守氨基酸取代”是其中所述氨基酸残基被具有相似侧链的一个氨基酸残基取代的氨基酸取代。在本领域中已经确定了具有相似侧链的氨基酸残基类别。这些类别包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳族侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,MCT蛋白中预测的非必需氨基酸残基最好被来自同一侧链类别的另一种氨基酸残基取代。或者,在另一实施方案中,可以沿全部或部分MCT编码序列随机导入突变,例如通过饱和诱变导入突变,并且可以根据本文所述的MCT活性对所产生的突变体进行筛选,以鉴定保留MCT活性的突变体。对序列表中奇数SEQID NO之一的核苷酸序列诱变后,可以重组表达所编码的蛋白质,然后可以采用例如本文所述的测定(参见实施例部分的实施例8)测定所述蛋白质的活性。
除了上述编码MCT蛋白的核酸分子外,本发明的另一方面涉及反义的分离的核酸分子。“反义”核酸包括与编码蛋白质的“有义”核酸互补的核苷酸序列,例如与双链DNA分子的编码链互补或与mRNA序列互补的核苷酸序列。因此,反义核酸可以与有义核酸形成氢键。所述反义核酸与完整的MCT编码链或仅与其部分互补。在一个实施方案中,反义核酸分子是编码MCT蛋白的核苷酸序列编码链的“编码区”的反义核酸分子。术语“编码区”是指包含被翻译为氨基酸残基的密码子的核苷酸序列区(例如SEQ ID NO:5(RXA00104)的完整编码区包含核苷酸1-756)。在另一实施方案中,所述反义核酸分子是编码MCT的核苷酸序列编码链“非编码区”的反义核酸分子。术语“非编码区”是指邻接所述编码区、不被翻译为氨基酸的5’序列和3’序列(即也称为5’和3’非翻译区)。
已知本文公开的编码MCT的编码链序列(例如序列表中奇数SEQID NO中所示的序列),因此可以依照Waston和Crick碱基配对原则,设计本发明的反义核酸。所述反义核酸分子可以与MCT mRNA的完整编码区互补,但更优选是作为仅MCT mRNA编码区或非编码区一部分的反义分子的寡核苷酸。例如,所述反义寡核苷酸可以与MCTmRNA翻译起始位点周围的区域互补。所述反义寡核苷酸可以例如长约5个、10个、15个、20个、25个、30个、35个、40个、45个或50个核苷酸。可以采用化学合成以及采用本领域已知的方法的酶连接反应,构建本发明的反义核酸。例如,可以用天然存在的核苷酸或设计用以增加所述分子生物学稳定性或增加所述反义核酸和有义核酸之间所形成的双链体物理稳定性的各种修饰的核苷酸,化学合成反义核酸(例如反义寡核苷酸),例如可以使用硫代磷酸衍生物以及吖啶取代的核苷酸。可以用来产生所述反义核酸的经修饰的核苷酸的实例包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫代尿苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基Q核苷(queosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷、5’-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-羟基乙酸(v)、wybutoxosine、假尿嘧啶、Q核苷、2-硫代胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟基乙酸甲酯、尿嘧啶-5-羟基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w和2,6-二氨基嘌呤。另一方面,可以采用已经以反义方向亚克隆了一种核酸(即由所***的核酸转录出的RNA将具有所感兴趣的靶核酸的反义方向,在以下小节中进一步描述)的表达载体,用生物学方法产生所述反义核酸。
通常将本发明的反义核酸分子给予细胞或使其原位产生,使得它们与编码MCT蛋白的细胞mRNA和/或基因组DNA杂交或结合,以由此抑制所述蛋白的表达,例如通过抑制转录和/或翻译抑制表达。可以借助常规的核苷酸互补性进行杂交,以形成稳定的双链体,或例如在与DNA双链体结合的反义核酸分子的情况下,通过双螺旋主沟中的特定相互作用,而进行杂交。可以对所述反义分子进行修饰,使得它例如通过使所述反义核酸分子与结合于细胞表面受体或抗原的肽或抗体连接,而特异性地结合于所选定细胞表面表达的受体或抗原。也可以用本文描述的载体将所述反义核酸分子传递至细胞。为了获得足够胞内浓度的所述反义分子,优选其中所述反义核酸分子置于强原核生物、病毒或真核生物启动子控制之下的载体构建体。
在再一实施方案中,本发明的反义核酸分子是α-异头核酸分子。α-异头核酸分子与互补RNA形成特定的双链杂交体,其中与通常的β单位相反,所述链互补平行(Gaultier等(1987)Nucleic Acids.Res.15:6625-6641)。所述反义核酸分子也可以包含2’-o-甲基核糖核苷酸(Inoue等(1987)Nucleic Acids Res.15:6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215:327-330)。
在又一实施方案中,本发明的反义核酸是一种核酶。核酶是具有核糖核酸酶活性的催化性RNA分子,它们能够切割与其具有互补区的单链核酸,例如mRNA。因此,可以用核酶(例如锤头核酶(描述于Haselhoff和Gerlach(1988)Nature 334:585-591)来催化切割MCTmRNA转录物,由此抑制MCT mRNA的翻译。可以根据本文公开的MCT DNA分子的核苷酸序列(即SEQ ID NO.5(RXA00104),设计对MCT编码核酸具有特异性的核酶。例如,可以构建一种四膜虫属(Tetrahymena)L-19 IVS RNA的衍生物,其中活性部位的核苷酸序列与MCT编码mRNA中待切割的核苷酸序列互补。参见例如Cech等的美国专利号4,987,071和Cech等的美国专利号5,116,742。或者,可以用MCT mRNA,从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA。参见例如Bartel,D.和Szostak,J.W.(1993)Science 261:1411-1418。
另一方面,通过靶向与MCT核苷酸序列调节区(例如MCT启动子和/或增强子)互补的核苷酸序列,以形成阻止靶细胞中MCT基因转录的三螺旋结构,可以抑制MCT基因的表达。一般参见Helene,C.(1991)Anticancer Drug Des.6(6):569-84;Helene,C.等(1992)Ann.N.Y.Acad.Sci.660:27-36;和Maher,L.J.(1992)Bioassays 14(12):807-15。
B.重组表达载体和宿主细胞
本发明的另一方面涉及含编码MCT蛋白(或其部分)的核酸的载体,优选表达载体。本文所用的术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。一种类型的载体是“质粒”,质粒是指其中可以连接另外的DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中可以将另外的DNA区段连接到病毒基因组中。某些载体能够在它们所导入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)在导入到宿主细胞中后整合到宿主细胞的基因组中,由此与宿主基因组一起复制。此外,某些载体能够指导与其有效连接的基因的表达。这类载体在本文中称为“表达载体”。一般而言,在重组DNA技术中使用的表达载体通常是质粒形式的载体。在本说明书中,“质粒”和“载体”可以互换使用,因为质粒是最常使用的载体形式。然而,本发明将包括这类其它形式的表达载体,例如病毒载体(例如复制缺陷型反转录病毒、腺病毒和腺相关病毒),它们发挥等同的功能。
本发明的重组表达载体包含适合于在宿主细胞中表达本发明核酸的形式的本发明核酸,这是指所述重组表达载体包括根据用于表达的宿主细胞选择的一个或多个调节序列,所述调节序列有效连接于待表达的核酸序列。在重组表达载体中,“有效连接的”是指将所感兴趣的核苷酸序列以允许所述核苷酸序列表达的方式(例如在体外转录/翻译***中或当将所述载体导入宿主细胞时在所述宿主细胞中)连接于所述调节序列。术语“调节序列”将包括启动子、增强子和其它表达控制元件(例如聚腺苷酸化信号)。这类调节序列描述于例如Goeddel;Gene Expression Technology:Methods in Enzymology 185,AcademicPress,San Diego,CA(1990)。调节序列包括在许多类型宿主细胞中指导核苷酸序列组成型表达的那些调节序列、以及在某些宿主细胞中指导所述核苷酸序列表达的那些调节序列。优选的调节序列是例如启动子,例如coS-、tac-、trp-、tet-、trp-tet、lpp-、lac-、lpp-lac、lacIq-、T7-、T5-、T3-、gal-、trc-、ara-、SP6-、arny、SPO2、λ-PR-或λPL,它们优选用于细菌中。其它调节序列是例如来自酵母和真菌的启动子,例如ADCl、MFα、AC、P-60、CYCl、GAPDH、TEF、rp28、ADH;来自植物的启动子,例如CaMV/35S、SSU、OCS、lib4、usp、STLSl、B33、nos或遍在蛋白启动子或菜豆蛋白启动子。也有可能使用人工启动子。本领域技术人员会认识到,所述表达载体的设计可取决于诸如待转化的宿主细胞的选择、所需蛋白的表达水平等的因素。可以将本发明的表达载体导入宿主细胞中,由此产生由本文所述的核酸编码的蛋白质或肽,包括融合蛋白或肽(例如MCT蛋白、突变形式的MCT蛋白、融合蛋白等)。
可以设计本发明的重组表达载体用于在原核细胞或真核细胞中表达MCT蛋白。例如,可以在细菌细胞例如谷氨酸棒杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母和其它真菌细胞(参见Romanos,M.A.等(1992)“酵母中的外源基因表达:综述”,Yeast 8:423-488;van denHondel,C.A.M.J.J.等(1991)“丝状真菌中的异源基因表达”,载于:More Gene Manipulations in Fungi,J.W.Bennet和L.L.Lasure编著,第396-428页:Academic Press:San Diego;和van den Hondel,C.A.M.J.J.和Punt,P.J.(1991),“用于丝状真菌的基因转移***和载体开发”,载于:Applied Molecular Genetics of Fungi,Peberdy,J.F.等编著,第1-28页,Cambridge University Press:Cambridge)、藻类和多细胞植物细胞(参见Schmidt,R.和Willmitzer,L.(1988)“高效根癌农杆菌(Agrobacteriumtumefaciens)介导的拟南芥(Arabidopsis thaliana)和子叶外植体的转化”Plant Cell Rep.:583-586)或哺乳动物细胞中,表达MCT基因。合适的宿主细胞在Goeddel,Gene Expression Technology:Methods inEnzymology 185,Academic Press,San Diego,CA(1990)中有进一步的描述。或者,所述重组表达载体可以在体外例如用T7启动子调节序列和T7聚合酶进行转录和翻译。
原核生物中的蛋白表达最常用合有指导或者融合蛋白或者非融合蛋白表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸加至其中所编码蛋白上,通常加至所述重组蛋白的氨基末端,但也加至C末端,或在所述蛋白质中的合适区中融合。这类融合载体通常用于三个目的:1)为了增加重组蛋白的表达;2)为了增加所述重组蛋白的溶解性;和3)为了通过用作亲和纯化中的配体而有助于所述重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白的接点处引入一个蛋白酶切割位点,以使得能够将重组蛋白与融合部分分开,以随后纯化所述融合蛋白。这类酶及其相关的识别序列包括因子Xa、凝血酶和肠激酶。
典型的融合表达载体包括pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 67:31-40)、pMAL(New EnglandBiolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或A蛋白与靶重组蛋白融合。在一个实施方案中,将所述MCT蛋白的编码序列克隆到pGEX表达载体中,以产生编码融合蛋白的载体,所述融合蛋白从N末端至C末端包含GST-凝血酶切割位点-X蛋白。所述融和蛋白可以用谷胱甘肽-琼脂糖树脂通过亲和层析纯化。不与GST融合的重组MCT蛋白可以通过用凝血酶切割所述融合蛋白进行回收。
合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amann等,(1988)Gene 69:301-315)、pLG338、pACYC184、pBR322、pUC18、pUC19,pKC30、pRep4、pHS1、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III113-B1、λgt11、pBdC1和pET 11d(Studier等,GeneExpression Tchnology:Methods in Enzymology 185,Academic Press,SanDiego,California(1990)60-89;和Pouwels等编著(1985)Cloning Vectors.Elsevier:New York IBSN 0 444 904018)。来自pTrc载体的靶基因的表达依赖于来自杂种trp-lac融合启动子的宿主RNA聚合酶转录。来自pET11d载体的靶基因的表达依赖于通过共同表达的病毒RNA聚合酶(T7 gn1)介导的T7 gn10-lac融合启动子的转录。这种病毒聚合酶由来自含有lacUV5启动子转录控制下的T7 gn1基因的居留(resident)λ原噬菌体的宿主菌株BL21(DE3)或HMS174(DE3)供应。关于其它细菌变种的转化,可以选择合适的载体。例如,已知质粒pIJ101、pIJ364、pIJ702和pIJ361可用于转化链霉菌属(Streptomyces),质粒pUB110、pC194或pBD214适用于转化芽孢杆菌属(Bacilllus)菌种。用于将遗传信息转移到棒杆菌属的几种质粒包括pHM1519、pBL1、pSA77或pAJ667(Pouwels等编著(1985)Cloning Vectors.Elsevier:New York IBSN 0 444904018)。
使重组蛋白表达最大化的一种策略是在蛋白酶剪切所述重组蛋白能力受损的宿主细菌中表达所述蛋白(Gottesman,S.,GeneExpression Technology: Methods in Enzymology 185,Academic Press,SanDiego,California(1990)119-128)。另一种策略是改变待***到表达载体中的核酸的核酸序列,使得每个氨基酸的各个密码子是在选定用于表达的细菌(例如谷氨酸棒杆菌)中优先使用的密码子(Wada等(1992)Nucleic Acids Res.20:2111-2118)。这种本发明核酸序列的改变可以用标准DNA合成技术来进行。
在另一实施方案中,所述MCT蛋白表达载体是一种酵母表达载体。用于在酵母酿酒酵母(S.cerevisiae)中表达的载体的实例包括pYepSecl(Baldari等(1987)Embo J.6:229-234)、2μ、pAG-1、Yep6、Yep13、pEMBLYe23、pMFa(Kurjan和Herskowitz(1982)Cell 30:933-943)、pJRY88(Schultz等,(1987)Gene 54:113-123)和pYES2(InvitrogenCorporation,San Diego,CA)。适用于其它真菌例如丝状真菌的载体以及载体的构建方法包括在以下文献中详述的载体和方法:van denHondel,C.A.M.J.J.和Punt,P.J.(1991)“用于丝状真菌的基因转移***和载体开发”,载于:Applied Molecular Genetics of Fungi,J.F.Peberdy等编著,第1-28页,Cambridge University Press:Cambridge,和Pouwels等编著(1985)Cloning Vectors.Elsevier:New York(IBSN 0 444904018)。
另一方面,本发明的MCT蛋白可以用杆状病毒表达载体在昆虫细胞中表达。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白的杆状病毒载体包括pAc系列(Smith等(1983)Mol.Cell Biol.3:2156-2165)和pVL系列(Lucklow和Summers(1989)Virology 170:31-39)。
在另一实施方案中,本发明的MCT蛋白可以在单细胞植物细胞(例如藻类)或在来自高等植物(例如种子植物,诸如作物)的植物细胞中表达。植物表达载体的实例包括详述于以下文献中的表达载体:Becker,D.,Kemper,E.,Schell,J.和Masterson,R.(1992)“具有位于左边界邻近的选择标记的新型植物双元载体”,Plant Mol.Biol.20:1195-1197;和Bevan,M.W.(1984)“用于植物转化的农杆菌双元载体”,Nucl.Acid.Res.12:8711-8721,并且包括pLGV23、pGHlac+、pBIN19、pAK2004和pDH51(Pouwels等编著(1985)Cloning Vectors.Elsevier:New YorkIBSN 0 444 904018)。
在再一实施方案中,本发明的核酸用哺乳动物表达载体在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pCDM8(Seed,B.(1987)Nature 329:840)和pMT2PC(Kaufman等(1987)EMBO J.6:187-195)。当用于哺乳动物细胞中时,所述表达载体的控制功能通常由病毒调节元件提供。例如,常用的启动子得自多瘤病毒、腺病毒2、巨细胞病毒和猿猴病毒40。对于用于原核细胞和真核细胞的其它合适的表达***,参见Sambrook,J.,Fritsh,E.F.和Maniatis,T.Molecular Cloning:ALaboratory Manual.第2版的第16和17章,Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989。
在另一实施方案中,哺乳动物重组表达载体能够指导所述核酸优先在特定的细胞类型中表达(例如用组织特异性调节元件来表达所述核酸)。组织特异性调节元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括清蛋白启动子(肝特异性;Pinkert等(1987)Genes Dev.1:268-277)、淋巴(lymphoid)特异性启动子(Calame和Eaton(1988)Adv.Immunol.43:235-275)、特别是T细胞受体的启动子(Winoto和Baltimore(1989)EMBO J. 8:729-733)和免疫球蛋白的启动子(Banerji等(1983)Cell 33:729-740;Queen和Baltimore(1983)Cell33:741-748)、神经元特异性启动子(例如神经丝启动子;Byrne和Ruddle(1989)PNAS86:5473-5477)、胰腺特异性启动子(Edlund等(1985)Science 230:912-916)和乳腺特异性启动子(例如乳清启动子;美国专利号4,873,316和欧洲申请公布号264,166)。也包括发育调节型启动子,例如鼠类hox启动子(Kessel和Gruss(1990)Science 249:374-379)和甲胎蛋白启动子(Campes和Tilghman(1989)Genes Dev.3:537-546)。
本发明还提供包含以反义方向克隆到表达载体中的本发明DNA分子的重组表达载体。亦即所述DNA分子与调节序列有效地连接,其连接方式提供MCT mRNA的反义RNA分子的表达(通过转录所述DNA分子)。可以选择有效连接于反义方向克隆的核酸的、指导在多种细胞类型中连续表达所述反义RNA分子的调节序列,例如病毒启动子和/或增强子,或者可以选择指导反义RNA的组成型、组织特异性或细胞类型特异性表达的调节序列。反义表达载体可以为重组质粒、噬菌粒或减毒病毒的形式,其中反义核酸在高效调节区的控制之下产生,其活性可以由所述载体所导入的细胞类型决定。对于使用反义基因的基因表达调节的讨论,参见Weintraub,H.等,作为遗传分析分子工具的反义RNA,Reviews-Trends in Genetics,第1(1)卷1986。
本发明的另一方面涉及已经导入本发明重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”在本文中可互换使用。不言而喻,这种术语不仅是指特定的题述细胞,而且也指这种细胞的子代或潜在的子代。因为在连续世代中由于或者突变或者环境影响而可能存在某些修饰,所以这类子代事实上可能与亲代细胞不完全相同,但仍包括在本文所述的术语范围内。
宿主细胞可以是任何原核细胞或真核细胞。例如,MCT蛋白可以在细菌细胞例如谷氨酸棒杆菌、昆虫细胞、酵母细胞或哺乳动物细胞(例如中国仓鼠卵巢细胞(CHO)或COS细胞)中表达。其它合适的宿主细胞是本领域技术人员已知的。与谷氨酸棒杆菌相关的、可以方便地用作本发明核酸和蛋白分子的宿主细胞的微生物示于表3中。
可以通过常规转化或转染技术,将载体DNA导入原核细胞或真核细胞中。本文所用的术语“转化”和“转染”、“接合”和“转导”是指本领域公知的用于将外源核酸(例如,线性DNA或RNA(例如线性化载体或无载体的单独的基因构建体))或载体形式(例如质粒、噬菌体、噬菌粒(phasmid)、噬菌粒(phagemid)、转座子或其它DNA)的核酸导入宿主细胞的多种技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂转染、天然感受态、化学物质介导的转移或电穿孔。用于转化或转染宿主细胞的合适方法可以在Sambrook等(MolecularCloning:A Laboratory Manual.第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989)和其它实验指南中找到。
关于哺乳动物细胞的稳定转染,已知根据所用的表达载体和转染技术,仅一小部分细胞可以将外源DNA整合到其基因组中。为了鉴定和选择这些整合子,通常将编码选择标记(例如抗生素抗性)的基因与所感兴趣的基因一起导入宿主细胞中。优选的选择标记包括赋予对药物例如G418、潮霉素和氨甲蝶呤的抗性的那些选择标记。可以将编码选择标记的核酸在编码MCT蛋白的同一载体上导入宿主细胞,或者可以将其在单独的载体上导入。用所导入核酸稳定转染的细胞可以通过例如药物选择进行鉴定(例如已经掺入选择标记基因的细胞将存活,而其它细胞死亡)。
为了产生同源重组微生物,制备含有其它已经引入缺失、添加或取代以由此改变(例如功能性破坏)所述MCT基因的至少一部分MCT基因的载体。最好是,该MCT基因是谷氨酸棒杆菌MCT基因,但它可以是来自相关细菌或甚至来自哺乳动物、酵母或昆虫来源的同系物。在一个优选实施方案中,设计所述载体,使得在同源重组后,所述内源MCT基因被功能性破坏(即不再编码功能性蛋白;也称为“剔除”载体)。或者,可以设计所述载体,使得在同源重组后,所述内源MCT基因被突变或者被改变,但仍编码功能性蛋白(例如可以改变上游调节区,以由此改变所述内源MCT蛋白的表达)。在所述同源重组载体中,所述MCT基因的被改变的部分在其5’端和3’端邻接另一种MCT基因的核酸,使得能够在所述载体所携带的外源MCT基因和微生物中的内源MCT基因之间发生同源重组。所述另一种侧翼MCT核酸具有足以与内源基因成功同源重组的长度。通常,在所述载体中包含数千碱基的侧翼DNA(5’端以及3’端)(有关同源重组载体的描述,参见例如Thomas,K.R.和Capecchi,M.R.(1987)Cell 51:503)。将所述载体导入微生物中(例如通过电穿孔),然后用本领域已知的技术选择其中所导入的MCT基因与内源MCT基因同源重组过的细胞。
在另一实施方案中,可以产生含有选定***的重组微生物,所述选定***提供受调节的所导入基因的表达。例如,在载体上包含在置于lac操纵子控制之下的MCT基因,允许所述MCT基因仅在IPTG存在时表达。这类调节***是本领域众所周知的。
在另一实施方案中,破坏宿主细胞中的内源MCT基因(例如通过同源重组或本领域已知的其它遗传方法),使得不发生其蛋白产物的表达。在另一实施方案中,通过一个或多个点突变、缺失或倒位,已经改变了宿主细胞中内源的或所导入的MCT基因,但它仍编码功能性MCT蛋白。在再一实施方案中,改变了微生物中MCT基因的一个或多个调节区(例如启动子、阻抑蛋白或诱导物)(例如通过缺失、截短、倒位或点突变),使得调节所述MCT基因的表达。本领域技术人员会认识到,含有一种以上的所述MCT基因和蛋白修饰的宿主细胞可以采用本发明的方法容易地产生,并且意味着将包括在本发明内。
本发明的宿主细胞(例如培养物中的原核宿主细胞或真核宿主细胞)可以用来产生(即表达)MCT蛋白。因此,本发明还提供使用本发明的宿主细胞生产MCT蛋白的方法。在一个实施方案中,所述方法包括在合适的培养基中培养本发明的宿主细胞(其中已经导入了编码MCT蛋白的重组表达载体,或其中基因组已经导入了编码野生型的或改变的MCT蛋白的基因),直至产生MCT蛋白。在另一实施方案中,所述方法还包括从培养基中或从宿主细胞中分离MCT蛋白。
C.分离的MCT蛋白
本发明的另一方面涉及分离的MCT蛋白及其生物活性部分。“分离的”或“纯化的”蛋白或其生物活性部分当通过重组DNA技术产生时基本上不合细胞物质,或在化学合成时基本上不含化学前体或其它化学物质。用语“基本上不合细胞物质”包括其中所述蛋白质与细胞中天然产生或重组产生的细胞组分分离的MCT蛋白制备物。在一个实施方案中,用语“基本上不含细胞物质”包括所具有非MCT蛋白(本文中也称为“污染蛋白”)低于约30%(以干重计)、更优选低于20%、再更优选低于约10%、最优选低于约5%的MCT蛋白制备物。当MCT蛋白或其生物活性部分重组产生时,也优选基本上不含培养基,即培养基低于所述蛋白制备物体积的约20%,更优选低于约10%,最优选低于约5%。用语“基本上不含化学前体或其它化学物质”包括其中MCT蛋白与参与所述蛋白合成的化学前体或其它化学物质分离的MCT蛋白制备物。在一个实施方案中,用语“基本上不含化学前体或其它化学物质”包括所具有的化学前体或非MCT化学物质低于约30%(以干重计)、更优选低于20%、再更优选低于约10%、最优选低于约5%的MCT蛋白制备物。在优选实施方案中,分离的蛋白质或其生物活性部分没有来自所述MCT蛋白所来源的同一生物的污染蛋白。通常,这类蛋白通过在微生物例如谷氨酸棒杆菌中重组表达例如谷氨酸棒杆菌MCT蛋白来产生。
本发明的分离的MCT蛋白或其部分可以参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运,或具有表1中所述的一种或多种活性。在优选实施方案中,所述蛋白质或其部分包含与一种本发明氨基酸序列(例如序列表中一种偶数SEQ ID NO序列)足够同源的氨基酸序列,使得所述蛋白质或其部分保留参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运的能力。所述蛋白的所述部分最好是本文所述的生物活性部分。在另一优选实施方案中,本发明的MCT蛋白具有序列表中一个偶数SEQID NO中所示的氨基酸序列。在再一优选实施方案中,所述MCT蛋白具有与一种本发明核苷酸序列(例如序列表中的奇数SEQ ID NO序列)杂交(例如在严格条件下杂交)的核苷酸序列所编码的氨基酸序列。在又一优选实施方案中,所述MCT蛋白具有由下述的核苷酸序列编码的氨基酸序列或其部分,其中所述核苷酸序列与一种本发明核酸序列的同源性为至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%或60%,优选至少约61%、62%、63%、64%、65%、66%、67%、68%、69%或70%,更优选至少约71%、72%、73%、74%、75%、76%、77%、78%、79%或80%、81%、82%、83%、84%、85%、86%、87%、88%、89%或90%、或91%、92%、93%、94%,甚至更优选至少约95%、96%、97%、98%、99%或更高。本发明也包括上述数值之间的范围和标识数值(例如70-90%相同或80-95%相同)。例如,将包括采用上述值作为上限和/或下限的任何组合的标识值范围。本发明优选的MCT蛋白也最好具有本文所述的至少一种MCT活性。例如,本发明的优选MCT蛋白包括由与一种本发明核苷酸序列杂交、例如在严格条件下杂交的核苷酸序列编码的氨基酸序列,并且可以参与谷氨酸棒杆菌细胞膜构成所必需化合物的代谢或参与跨越这些膜的分子转运,或者具有表1中所述的一种或多种活性。
在其它实施方案中,所述MCT蛋白与一种本发明的氨基酸序列(例如序列表中的偶数SEQ ID NO序列)基本上同源,并且保留本发明氨基酸序列之一的蛋白的功能活性,但由于天然变异或诱变在氨基酸序列有所不同,如以上I小节中详细描述的。因此,在另一实施方案中,所述MCT蛋白是这样一种蛋白质,所述蛋白质所具有的氨基序列与一种本发明的完整氨基酸序列的同源性为至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%或60%,优选至少约61%、62%、63%、64%、65%、66%、67%、68%、69%或70%,更优选至少约71%、72%、73%、74%、75%、76%、77%、78%、79%或80%、81%、82%、83%、84%、85%、86%、87%、88%、89%或90%、或91%、92%、93%、94%,甚至更优选至少约95%、96%、97%、98%、99%或更高,并且具有本文所述的至少一种MCT活性。本发明也包括上述数值之间的范围和标识数值(例如70-90%相同或80-95%相同)。例如,将包括采用上述值作为上限和/或下限的任何组合的标识值范围。在另一实施方案中,本发明涉及与一种本发明的完整氨基酸序列基本上同源的全长的谷氨酸棒杆菌蛋白。
MCT蛋白的生物活性部分包括包含衍生自MCT蛋白的氨基酸序列(例如序列表中偶数SEQ ID NO的氨基酸序列)的氨基酸序列、或与MCT蛋白同源的蛋白的氨基酸序列的肽,这包括小于全长MCT蛋白或与MCT蛋白同源的全长蛋白质、并且表现出至少一种MCT蛋白活性的氨基酸。通常,生物活性部分(肽,例如长度例如为5个、10个、15个、20个、30个、35个、36个、37个、38个、39个、40个、50个、100个或更多个氨基酸的肽)包含具有至少一种MCT蛋白的活性的结构域或基序。此外,其中所述蛋白质的其它区缺失的其它生物活性部分可以通过重组技术制备,并且根据本文所述的一种或多种活性进行评价。最好是,MCT蛋白的生物活性部分包括具有生物活性的一种或多种选定结构域/基序或其部分。
MCT蛋白最好通过重组DNA技术产生。例如,将编码所述蛋白质的核酸分子克隆到表达载体(如上所述)中,将所述表达载体导入宿主细胞(如上所述),然后在所述宿主细胞中表达所述MCT蛋白。然后可以通过合适的纯化方案,采用标准蛋白质纯化技术,从所述细胞中分离出所述MCT蛋白。作为重组表达的替代方法,可以用标准肽合成技术,化学合成MCT蛋白、多肽或肽。此外,可以例如采用通过标准技术、利用本发明的MCT蛋白或其片段产生的抗MCT抗体,从细胞(例如内皮细胞)中分离天然MCT蛋白。
本发明也提供MCT嵌合蛋白或融合蛋白。本文所用的MCT“嵌合蛋白”或“融合蛋白”包含与非MCT多肽有效连接的MCT多肽。“MCT多肽”是指具有对应于MCT蛋白的氨基酸序列的多肽,而“非MCT多肽”是指所具有的氨基酸序列对应于与所述MCT蛋白基本上不同源的蛋白质的多肽,例如不同于所述MCT蛋白并且得自同一生物或不同生物的蛋白质。在所述融合蛋白中,术语“有效连接的”甚至是指所述MCT多肽和所述非MCT多肽相互符合读框地融合。所述非MCT多肽可以融合至所述MCT多肽的N末端或C末端。例如,在一个实施方案中,所述融合蛋白是其中MCT序列融合至GST序列的C末端的GST-MCT融合蛋白。这类融合蛋白可以便于纯化重组MCT蛋白。在另一实施方案中,所述融合蛋白是在其N末端含有一个异源信号序列的MCT蛋白。在某些宿主细胞(例如哺乳动物宿主细胞)中,可以通过利用异源信号序列增加MCT蛋白的表达和/或分泌。
最好是,本发明的MCT嵌合蛋白或融合蛋白采用标准重组DNA技术来生产。例如,依照常规技术,例如通过利用平端或交错切口末端进行连接,进行限制性酶消化以提供合适的末端,适当地补平粘性末端,进行碱性磷酸酶处理以避免不希望有的连接,然后进行酶连接,将编码不同多肽序列的DNA片段符合读框地连接在一起。在另一实施方案中,通过常规技术,包括自动DNA合成仪,可以合成所述融合基因。或者,采用锚定引物进行基因片段的PCR扩增,所述锚定引物在两个连续基因片段之间产生互补突出端,随后将其退火并重新扩增,产生嵌合基因序列(参见例如Current Protocols in Molecular Biology,Ausubel等编著,John Wiley & Sons:1992)。此外,许多表达载体是市售的,已经编码一个融合部分(例如GST多肽)。可以将MCT编码核酸克隆到这样一种表达载体中,使得所述融合部分与所述MCT蛋白符合读框地连接。
通过对所述MCT蛋白进行诱变,例如离散的点突变或截短,可以产生所述MCT蛋白的同系物。本文所用的术语“同系物”是指用作所述MCT蛋白活性激动剂或拮抗剂的所述MCT蛋白的变异形式。所述MCT蛋白的激动剂可以基本上保留所述MCT蛋白的相同生物活性或一个亚类的生物活性。所述MCT蛋白的拮抗剂通过例如竞争性地与包括所述MCT蛋白在内的细胞膜组分代谢级联下游或上游成员结合,或通过与介导跨越这类膜的化合物转运的MCT蛋白结合,由此阻止发生转运,可以抑制天然存在形式的所述MCT蛋白的一种或多种活性。
在一个替代实施方案中,通过筛选具有MCT蛋白激动剂或拮抗剂活性的所述MCT蛋白的突变体例如截短突变体的组合文库,可以鉴定出所述MCT蛋白的同系物。在一个实施方案中,通过在核酸水准上进行联合诱变,产生MCT变异体的一个花斑文库(variegatedlibrary),所述花斑文库由一个花斑基因文库编码。通过例如酶法将合成的寡核苷酸混合物连接到基因序列中,使得一组简并潜在的MCT序列可作为单个多肽表达,或者作为其中含有一组MCT序列的一组较大的融合蛋白表达(例如用于噬菌体展示),可以产生MCT变异体花斑文库。有多种方法可以用来由简并的寡核苷酸序列产生潜在的MCT同系物文库。可以在自动DNA合成仪中进行简并基因序列的化学合成,然后将所述合成基因连接到合适的表达载体中。应用一组简并基因,使得可以在一种混合物中提供所有编码一组所需潜在MCT序列的序列。合成简并寡核苷酸的方法是本领域已知的(参见例如Narang,S.A.(1983)Tetrahedron 39:3;Itakura等(1984)Annu.Rev.Biochem.53:323;Itakura等(1984)Science 198:1056;Ike等(1983)Nucleic AcidRes.11:477)。
另外,所述MCT蛋白编码的片段的文库可以用来产生MCT片段的花斑群,用来筛选和随后选择MCT蛋白的同系物。在一个实施方案中,通过在每个分子仅发生一个缺口的条件下用核酸酶处理MCT编码序列的双链PCR片段,使所述双链DNA变性,将所述DNA复性,以形成可以包括来自不同缺口产物的有义/反义对的双链DNA,通过用S1核酸酶处理从重新形成的双链体中去除单链部分,然后将所产生的片段文库连接到表达载体中,可以产生一个编码序列片段文库。用这种方法,可以得到一个表达文库,所述表达文库编码各种大小的所述MCT蛋白的N末端片段、C末端片段和内部片段。
本领域已知几种技术用于筛选通过点突变或截短制备的组合文库的基因产物、以及筛选具有选定特性的基因产物的cDNA文库。这类技术适用于快速筛选通过组合诱变MCT同系物产生的基因文库。适合于高通量分析、用于筛选大基因文库的最为广泛使用的技术,通常包括将所述基因文库克隆到复制型表达载体中,用所产生的载体文库转化合适的细胞,并且使所述组合基因在所需活性的检测有助于载体分离的条件下表达,而所述载体编码其基因产物被检测的基因。循环总体诱变(REM)是一种提高文库中功能型突变体频率的新技术,可以与鉴定MCT同系物的筛选测定结合使用(Arkin和Yourvan(1992)PNAS 89:7811-7815;Delgrave等(1993)Protein Engineering 6(3):327-331)。
在另一实施方案中,可以采用本领域中众所周知的方法,用基于细胞的测定来分析花斑MCT文库。
D.本发明的应用和方法
本文所述的核酸分子、蛋白质、蛋白质同系物、融合蛋白、引物、载体和宿主细胞可以用于一种或多种以下方法中:谷氨酸棒杆菌和相关生物的鉴定;与谷氨酸棒杆菌相关的生物的基因组作图;所感兴趣的谷氨酸棒杆菌序列的鉴定和定位;进化研究;功能所需的MCT蛋白区的测定;MCT蛋白活性的调节;一种或多种细胞膜组分代谢的调节;一种或多种化合物膜转运的调节;以及细胞产生所需化合物(例如精细化学品)的调节。
本发明的MCT核酸分子具有多种用途。首先,它们可以用来鉴定作为谷氨酸棒杆菌或其密切相关菌种的生物。此外,它们可以用来鉴定微生物混合群体中谷氨酸棒杆菌或其相关菌种的存在。本发明提供许多谷氨酸棒杆菌基因的核酸序列;通过在严格条件下用跨越该生物特有的谷氨酸棒杆菌基因区域的探针,探测特有微生物群体或混合微生物群体培养物的所提取的基因组DNA,人们可以确定该生物是否存在。
虽然谷氨酸棒杆菌自身是非致病性的,但它与致病菌种例如白喉棒杆菌相关。白喉棒杆菌是一种快速发展的、涉及局部和***病理学的急性热性感染-白喉的病原体。在这种疾病中,局部病变在上呼吸道中发展,包括对上皮细胞的坏死性损伤;所述杆菌分泌毒素,毒素通过这种损害弥散到机体的远端易感组织。所产生的变性性改变通过抑制包括心脏、肌肉、外周神经、肾上腺、肾、肝和脾在内的这些组织中的蛋白质合成,导致该疾病的***病理学。白喉在世界许多地区包括非洲、亚洲、欧洲东部和前苏联许多独立的州中发病率一直很高。自从1990年以来,在后两个地区的一次白喉流行已经导致至少5,000人死亡。
在一个实施方案中,本发明提供一种鉴定受治疗者体内白喉棒杆菌的存在或活性的方法。这种方法包括检测受治疗者体内一种或多种本发明核酸序列或氨基酸序列(例如分别为序列表中奇数或偶数SEQID NO中所示的序列),由此检测所述受治疗者体内白喉棒杆菌的存在或活性。谷氨酸棒杆菌和白喉棒杆菌是相关细菌,谷氨酸棒杆菌中的许多核酸和蛋白质分子与白喉棒杆菌核酸和蛋白质分子同源,因此可以用来检测受治疗者体内的白喉棒杆菌。
本发明的核酸分子和蛋白质分子也可以用作基因组特定区的标记。这不仅可应用于基因组作图中,也可应用于谷氨酸棒杆菌蛋白的功能研究。例如,为了鉴定基因组中特定谷氨酸棒杆菌DNA结合蛋白所结合的区域,可以将谷氨酸棒杆菌基因组消化,然后将所述片段与所述DNA结合蛋白一起温育。结合所述蛋白的那些区域可以另外用本发明的核酸分子来探测,最好是用可容易检测的标记来探测;这种核酸分子与所述基因组片段的结合使得能够将上述片段定位至谷氨酸棒杆菌的基因组图谱上,并且当用不同酶进行多次时,有助于所述蛋白所结合的核酸序列的快速测定。此外,本发明的核酸分子可能与相关菌种的序列具有足够的同源性,因此这些核酸分子可以用作在相关细菌例如乳发酵短杆菌中构建基因组图谱的标记。
本发明的MCT核酸分子也可用于进化研究和蛋白质结构研究。种类繁多的原核细胞和真核细胞利用本发明分子所参与的代谢过程和转运过程;通过将本发明核酸分子的序列与来自其他生物的编码相似酶的那些序列进行比较,可以评价所述生物的进化相关性。同样,这种比较允许评价所述序列的哪些区保守、哪些区不保守,这有助于确定酶功能所必需的蛋白区。这种类型的测定对于蛋白质工程研究是有价值的,并且可以给出蛋白质在诱变方面可以耐受而不丧失功能的指标。
对本发明的MCT核酸分子的操作可以导致产生功能上不同于野生型MCT蛋白的MCT蛋白。这些蛋白质可能效率方面或活性方面得到改进,在细胞中的存在数量可能大于通常的数量,或可能效率或活性降低。
本发明提供筛选方法,筛选或者通过与蛋白质自身或所述MCT蛋白的底物或者结合配偶体相互作用、或者通过调节本发明MCT核酸分子的转录或翻译而调节MCT蛋白活性的分子。在这类方法中,使表达一种或多种本发明MCT蛋白的微生物与一种或多种试验化合物接触,并且评价每种试验化合物对所述MCT蛋白活性或表达水平的影响。
有多种的机制使得改变本发明MCT蛋白可以直接影响得自掺入这种改变蛋白的谷氨酸棒杆菌菌株的精细化学品的收率、产量和/或产率。如果谷氨酸棒杆菌分泌所述所需化合物,则从谷氨酸棒杆菌大规模培养物中精细化学品化合物的回收得到显著改进,因为可以从培养基中容易地纯化这类化合物(与从谷氨酸棒杆菌细胞块提取相反)。通过或者增加将精细化学品输出细胞的转运蛋白分子的数量或者活性,有可能增加胞外培养基中存在的所得精细化学品的量,因此使得更加容易地收集和纯化。相反,为了有效地过量产生一种或多种精细化学品,需要增加量的所述合适生物合成途径的辅因子、前体分子和中间体化合物。因此,通过增加参与营养物(例如碳源(即糖)、氮源(即氨基酸、铵盐)、磷酸和硫)输入的转运蛋白的数量和/或活性,有可能改善精细化学品的生产,因为除去了对所述生物合成过程的任何营养物供应的限制。此外,脂肪酸和脂质本身是理想的精细化学品,因此通过对一种或多种参与这些化合物生物合成的本发明MCT蛋白进行活性优化或增加其数量,或者通过降低参与这些化合物降解的一种或多种MCT蛋白的活性,有可能增加得自谷氨酸棒杆菌的脂肪酸和脂质分子的收率、产量和/或产率。
对一种或多种本发明MCT基因的工程改造也可以产生改变活性、间接影响得自谷氨酸棒杆菌的一种或多种所需精细化学品生产的MCT蛋白。例如,代谢的正常生物化学过程导致产生多种废物(例如过氧化氢和其它活性氧种类),它们可能主动干扰所述代谢过程(例如已知过亚硝酸盐使酪氨酸侧链硝化,由此使在活性部位具有酪氨酸的某些酶失活(Groves,J.T.(1999)Curr.Opin.Chem.Biol.3(2):226-235)。虽然这些废物通常被***掉,但对用于大规模发酵生产的谷氨酸棒杆菌菌株进行优化以用于过量生产一种或多种精细化学品,因此可能产生比野生型谷氨酸棒杆菌通常所具有的更多的废物。通过对参与废物分子输出的一种或多种本发明MCT蛋白的活性进行优化,则有可能提高细胞的生存力并且保持有效的代谢活性。此外,高胞内水平的所需精细化学品的存在可能实际上对细胞有毒性,因此通过提高细胞分泌这些化合物的能力,可以提高细胞的生存力。
此外,可以对本发明的MCT蛋白进行操作,使得改变所产生的各种脂质和脂肪酸分子的相对量。这可能对细胞膜脂质组成有深远的影响。由于每种类型的脂质具有不同的物理特性,故膜脂质组成的改变可能显著改变膜流动性。膜流动性的改变可能影响跨越所述膜的分子转运,如前所述这可能改变废物或所产生的精细化学品的输出或必需营养物的输入。这类膜流动性的改变也可以显著影响细胞的完整性;膜相对较弱的细胞在大规模发酵罐环境中更易受到机械应力的影响,这可能损伤或杀死所述细胞。通过对参与膜构成脂肪酸和脂质产生的MCT蛋白进行操作,使得所得膜的膜组成更加适应于用来生产精细化学品的培养物中存在的环境条件,应该有更大比例的谷氨酸棒杆菌细胞存活并且繁殖。培养物中更大数量的谷氨酸棒杆菌细胞应该转化为得自所述培养物的精细化学品的更大收率、产量或产率。
导致得自谷氨酸棒杆菌的精细化学品收率提高的上述MCT蛋白诱变策略,并不意味着是限制性的;这些策略的变化对于本领域技术人员是显而易见的。采用这些策略并且加入本文公开的机制,可以利用本发明的核酸分子和蛋白质分子来产生表达突变型MCT核酸分子和蛋白质分子的谷氨酸棒杆菌或相关细菌菌株,使得所需化合物生产的收率、产量和/或产率得以改善。这种所需化合物可以是谷氨酸棒杆菌的任何天然产物,包括生物合成途径的终产物和天然存在的代谢途径的中间体、以及在谷氨酸棒杆菌代谢中不是天然存在的、但由本发明的谷氨酸棒杆菌菌株产生的分子。
本发明通过以下实施例进一步说明,所述实施例不应解释为是限制性的。在本申请中引用的所有参考文献、专利申请、专利、公布的专利申请、表和序列表的内容,通过引用结合到本文中。
表1:本申请中的基因
  核酸 SEQ ID NO135   氨基酸 SEQ ID NO246   标识码RXN03097RXA02099RXA00104   重叠群VV0062GR00630GR00014   NT起始3619815895   NT终止557647016650   功能铵转运***铵转运***CYSQ蛋白,铵转运蛋白
聚酮化合物合成
  核酸 SEQ ID NO79111315171921    氨基酸 SEQ ID NO810121416182022    标识码RXA01420RXN02581FRXA02581RXA02582RXA01138RXA01980RXN01007RXN00784    重叠群GR00416VV0098GR00741GR00741GR00318GR00573VV0021VV0103    NT起始775304821189016561470257227531    NT终止172862315276719207283886628265    功能4”-mycarosyl异戊酰-CoA转移酶(EC 2.-.-.-)聚酮化合物合酶聚酮化合物合酶可能的聚酮化合物合酶CY338.20放线菌紫素聚酮化合物二聚化酶(EC-.-.-.-)聚酮化合物环化酶FRNAFRNE
脂肪酸和脂质合成
  核酸 SEQ ID NO23252729313335373941434547   氨基酸 SEQ ID NO24262830323436384042444648    标识码RXA02335RXA02173RXA01764RXN02487FRXA02487FRXA02490RXA01467RXA00796RXA01897RXN02809FRXA02809RXN00113FRXA00113    重叠群GR00672GR00641GR00500VV0007GR00718GR00720GR00422GR00212GR00544VV0342GR00790VV0129GR00017    NT起始55074732178636749378179202026173802771032   NT终止2322892431104664465051210511596557243295   功能生物素羧化酶(EC 6.3.4.14)乙酰-CoA羧化酶羧基转移酶亚基β(EC 6.4.1.2)3-酮酰基-[酰基-载体蛋白]还原酶(EC 1.1.1.100)长链脂肪酸-CoA连接酶(EC 6.2.1.3)长链脂肪酸-CoA连接酶(EC 6.2.1.3)长链脂肪酸-CoA连接酶(EC 6.2.1.3)酰基载体蛋白酰基载体蛋白磷酸二酯酶酰基载体蛋白磷酸二酯酶酰基载体蛋白磷酸二酯酶酰基载体蛋白磷酸二酯酶脂肪酸合酶(EC 2.3.1.85)[包括:EC 2.3.1.38;EC 2.3.1.39;EC 2.3.1.41;脂肪酸合酶(EC 2.3.1.85)
表1(续)
  核酸 SEQ ID NO4951535557596163656769717375777981838587899193959799101103105107109111113115117119121123125    氨基酸 SEQ ID NO50525456586062646668707274767880828486889092949698100102104106108110112114116118120122124126    标识码RXN03111FRXA00158FRXA00572RXA02582RXA02691RXA00880RXA01060RXN01722FRXA01722RXA01644RXA02029RXA01801RXN02512FRXA02512RXA00899RXN00819FRXA00819FRXA01766RXN01762FRXA01762RXA00681RXA00802RXA02133RXN01114FRXA01114RXA01894RXA02599RXN02638FRXA02638RXA00856RXA02511RXN02836FRXA02836RXA02578RXA02150RXA00607RXA02397RXN03110FRXA00660    重叠群VV0084GR00024GR00155GR00741GR00754GR00242GR00296VV0036GR00488GR00456GR00618GR00509VV0171GR00721GR00245VV0054GR00221GR00500VV0054GR00500GR00179GR00214GR00639VV0182GR00308GR00542GR00742VV0098GR00749GR00232GR00721VV0102GR00827GR00740GR00639GR00160GR00698VV0083GR00171    NI终始604020882189015347621395662938574698543563396161473303159918127184081153181272340538033911821622317954531872026213281810624381885818691688165681027   NI终止5438326719145418057104891214402285771669238015185425928641945510074371137831026624516308103417932476365553656511125632773337241135411965822492683179295   功能脂肪酸合酶(EC2.3.1.85)[包括:EC 2.3.1.38;EC 2.3.1.39;EC2.3.1.41;EC 1.1.1.100;EC4.2.1.61;EC 1.3.1.10;EC 3.1.2.14]脂肪酸合酶(EC 2.3.1.85)脂肪酸合酶(EC 2.3.1.85)可能的聚酮化合物合酶CY338.20脂肪酰效应调节剂长链脂肪酸-CoA连接酶(EC 6.2.1.3)Ω-3脂肪酸去饱和酶(EC 1.14.99.-)中链脂肪酸-CoA连接酶(EC 6.2.1.-)中链脂肪酸-CoA连接酶(EC 6.2.1.-)环丙烷-脂肪酰基-磷脂合酶(EC 2.1.1.79)环丙烷-脂肪酰基-磷脂合酶(EC 2.1.1.79)烯酰-CoA水合酶(EC 4.2.1.17)脂质A生物合成月桂酰基酰基转移酶(EC 2.3.1-)脂质A生物合成月桂酰基酰基转移酶(EC 2.3.1.-)心磷脂合成酶(EC 2.7.8.-)酰基-CoA脱氢酶(EC 1.3.99-)酰基-CoA脱氢酶(EC 1.3.99-)酰基-CoA脱氢酶(EC 1.3.99-)长链脂肪酸-CoA连接酶(EC 6.2.1.3)长链脂肪酸-CoA连接酶(EC 6.2.1.3)3-酮酰基-[酰基-载体蛋白]还原酶(EC 1.1.1.100)3-酮酰基-[酰基-载体蛋白]还原酶(EC 1.1.1.100)3-酮酰基-[酰基-载体蛋白]还原酶(EC 1.1.1.100)3-酮酰基-CoA硫解酶(EC 2.3.1.16)3-酮酰基-CoA硫解酶(EC 2.3.1.16)磷脂酸胞苷酰基转移酶(EC 2.7.7.41)磷脂酰甘油磷酸酶B(EC 3.1.3.27)1-酰基-sn-甘油-3-磷酸酰基转移酶(EC 2.3.1.51)1-酰基-sn-甘油-3-磷酸酰基转移酶(EC 2.3.1.51)CDP-二酰基甘油-甘油-3-磷酸3-磷脂酰基转移酶(EC 2.7.8.5)CDP-二酰基甘油-甘油-3-磷酸3-磷脂酰基转移酶(EC 2.7.8 5)酮酰基还原酶HETN(EC 1.3.1.-)酮酰基还原酶HETN(EC 1.3.1.-)推定的酰基转移酶1-酰基-sn-甘油-3-磷酸酰基转移酶(EC 2.3.1.51)聚(3-羟基链烷酸酯)聚合酶(EC 2.3.1.-)聚-β-羟基丁酸聚合酶(EC 2.3.1.-)羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)
表1(续)
  核酸 SEQ ID NO127129131133135137139141143145147149151153155157159161163165167169171173175177179181183185187189191193195    氨基酸 SEQ ID NO128130132134136138140142144146148150152154156158160162164166168170172174176178180182184186188190192194196    标识码RXA00801RXA00821RXN02966FRXA01833RXA01853RXN02424FRXA02424RXN00419FRXA00419FRXA00421RXN02923RXN02922RXN03065RXN03132RXN03157RXN00934RXN00792RXN00931FRXA00931RXN01421RXN02342RXN00563RXN02168RXN01090RXN02062RXN02148RXN02595RXS00148RXS00149RXS02106RXS01746RXS01747RXC01748RXC00354RXC01749    重叠群GR00214GR00221VV0143GR00517GR00525VV0116GR00706VV0112GR00095GR00096VV0088VV0321VV0038VV0127VV0188VV0171VV0321VV0171GR00253VV0122VV0078VV0038VV0100VV0155VV0222VV0300VV0098VV0167VV0167VV0123VV0185VV0185VV0185VV0135VV0185    NT起始31381469120561666556110570808102435653301114076237390531607151811032813011495916024346012894648331591656111098984979952264993418263001336043953    NT终止377023111346226050101116942826646472325641032866293947211701409991321216641141563842662739815686199017703993512059984221594168628693780327925569      功能羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)羟酰谷胱甘肽水解酶(EC 3.1.2.6)乙酰乙酰-CoA还原酶(EC 1.1.1.36)乙酰乙酰-CoA还原酶(EC 1.1.1.36)乙酰乙酰-CoA还原酶(EC 1.1.1.36)乙酰乙酰-CoA还原酶(EC 1.1.1.36)酰基-CoA脱氢酶,短链特异性的(EC 1.3.99.2)全-[酰基-载体蛋白]合酶(EC 2.7.8.7)聚-β-羟基丁酸聚合酶(EC 2.3.1.-)脂多糖核心生物合成蛋白KDTB(AE00085)LPS生物合成RfbU相关蛋白[Methanobacterium thermoautotrophicum]酰基-CoA脱氢酶,短链特异性的(EC 1.3.99.2)酰基-CoA硫酯酶II(EC 3.1.2.-)硫酯酶II酰基转移酶(EC 2.3.1-)生物素-[酰基-CoA羧化酶]合成酶(EC 6.3.4.15)脂肪酸合酶(EC 2.3.1.85)[包括:EC 2.3.1.38;EC 2.3.1.39;EC2.3.1.41;EC 1.1.1.100;EC 4.2.1.61;EC 1.3.1.10;EC 3.1.2.14]脂肪酸合酶(EC 2.3.1.85)[包括:EC 2.3.1.38;EC 2.3.1.39;EC2.3.1.41;EC 1.1.1.100;EC 4.2.1.61;EC 1.3.1.10;EC 3.1.2.14]酮酰基还原酶HETN(EC 1.3.1-)脂多糖N-乙酰葡糖胺基转移酶脂多糖N-乙酰葡糖胺基转移酶脂多糖N-乙酰葡糖胺基转移酶甲基丙二酰-CoA变位酶α亚基(EC 5.4.99.2)甲基丙二酰-CoA变位酶α亚基(EC 5.4.99.2)硫辛酸蛋白连接酶A(EC 6.-.-.- )硫辛酸蛋白连接酶B(EC 6.-.-.-)硫辛酸合成酶参与脂质代谢的蛋白参与脂质代谢的胞质蛋白参与脂质代谢的跨膜蛋白
表1(续)
脂肪酸降解
  核酸 SEQ ID NO197199201203205207209211213215217219221223225227229231233235237    氨基酸 SEQ ID NO198200202204206208210212214216218220222224226228230232234236238    标识码RXA02268RXA02269RXA01614RXA01983RXN02947FRXA02320FRXA02851RXN02321FRXA02321FRXA02343FRXA02850RXA02583RXA00870RXA01260RXA01261RXA01136RXN00559FRXA00559RXA01580RXA02677RXS01166    重叠群GR00655GR00655GR00449GR00573VV0078GR00667GR00851VV0078GR00667GR00675GR00850GR00741GR00239GR00367GR00367GR00318VV0103GR00149GR00440GR00754VV0117    NT起始2182309482193559131959352432911380140326743809238126076857568218707311918142    NT终止30814065719730536661663937181649382902320120024371116655266387716838    功能脂酶(EC 3.1.1.3)脂酶(EC 3.1.1.3)溶血磷脂酶L2(EC 3.1.1.5)脂酶(EC 3.1.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)丙酰-CoA羧化酶β链(EC 6.4.1.3)甲基丙二酸-半醛脱氢酶(酰化)(EC1.2.1.27)2-甲基-3-酮丙酸:NAD+氧化还原酶(CoA-丙酰化)支链α-酮酸脱氢酶复合体的硫辛酰胺脱氢酶组分(E3)(EC 1.8.1.4)支链α-酮酸脱氢酶复合体的硫辛酰胺脱氢酶组分(E3)(EC 1.8.1.4)异戊酰-CoA脱氢酶(EC 1.3.99.10)蛋白质VDLD蛋白质VDLD甘油磷酰二酯磷酸二酯酶甘油磷酰二酯磷酸二酯酶(EC 3.1.4.46)胞外脂酶前体(EC 3.1.1.3)
萜类化合物的生物合成
  核酸 SEQ ID NO239241243245247    氨基酸 SEQ ID NO240242244246248      标识码RXA00875RXA01292RXA01293RXA02310RXA02718    重叠群GR00241GR00373GR00373GR00665GR00758    NI终止242312042370113218539    NT终止185723882696239419585    功能异戊烯二磷酸δ-异构酶(EC 5.3.3.2)八氢番茄红素脱氢酶(EC 1.3.-.-)八氢番茄红素脱氢酶(EC 1.3.-.-)牻牛儿酰牻牛儿基氢化酶牻牛儿酰牻牛儿基焦磷酸合酶(EC 2.5.1.1)
表1(续)
  核酸 SEQ ID NO249251253255257259261263265267269271273275277279281    氨基酸 SEQ ID NO250252254256258260262264266268270272274276278280282    标识码RXA01067RXA01269RXA01250RXA01576RXN02309FRXA02309RXN00477FRXA00477RXA00478RXA01291RXA00480RXS01879RXS02023RXS00948RXS02228RXC01971RXC02697      重叠群GR00298GR00367GR00364GR00438VV0025GR00665VV0086GR00119GR00119GR00373GR00119VV0105VV0160VV0107VV0068VV0105VV0017      NT起始1453203343805328493978389051318714020345174441505323442661876454531257      NT终止2181198945338811295424372621154413190127716329573400153842778371532783 功能十一萜烯二磷酸合酶(EC 2.5.1.31)十一萜烯磷酸半乳糖磷酸转移酶(EC 2.7.8.6)推定的十一萜烯磷酸α-N-乙酰葡糖胺基转移酶(EC 2.4.1.-)多萜(dolichyl)磷酸β-葡糖基转移酶(EC 2.4.1.117)octaprenyl-二磷酸合酶(EC 2.5.1.-)octaprenyl-二磷酸合酶(EC 2.5.1.-)八氢番茄红素脱氢酶(EC 1.3.-.-)八氢番茄红素脱氢酶(EC 1.3.-.-)八氢番茄红素合酶(EC 2.5.1.-)八氢番茄红素合酶(EC 2.5.1.-)法尼二磷酸合酶(EC 2.5.1.1)(EC 2.5.1.10)异戊烯磷酸激酶(EC 2.7.4.-)P450细胞色素、异戊烯基转移酶、铁氧还蛋白12-酮phytodienoate还原酶(EC 1.3.1.42)tRNAδ(2)-异戊二烯磷酸转移酶(EC 2.5.1.8)参与萜类化合物代谢的依赖于金属的水解酶参与萜类化合物代谢的膜蛋白
ABC转运蛋白
  核酸 SEQ ID NO283285287289291293295297299301303305307309311313315    氨基酸 SEQ ID NO284286288290292294296298300302304306308310312314316    标型码RXN01946FRXA01946RXN00164FRXA00164RXN00243FRXA00243RXA00259RXN00410FRXA00410RXN00456FRXA00456FRXA00459RXN01604FRXA01604RXN02547FRXA02547RXN02571    重叠群VV0228GR00559VV0232GR00025VV0057GR00037GR00039VV0086GR00092VV0076GR00114GR00115VV0137GR00448VV0057GR00726VV0101    NT起始2184917821782289159308469519888296780316123181172277262205512331    NT终止12765759494278994626851323164815652457470607255881993213359   功能假定的ABC转运蛋白ATP结合蛋白(AL021184)ABC转运蛋白ATP结合蛋白[结核分杆菌(Mycobacterium tuberculosis)]假定的ABC转运蛋白ATP结合蛋白ABC转运蛋白的,P,G,RATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基谷氨酰胺转运ATP结合蛋白GLNQABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基麦芽糖/麦芽糊精转运ATP结合蛋白MALK
表1(续)
  核酸 SEQ ID NO317319321323325327329331333335337339341343345347349351353355357359361363365367369371373375377379381383385387389391393395    氨基酸 SEQ ID NO318320322324326328330332334336338340342344346348350352354356358360362364366368370372374376378380382384386388390392394396    标识码FRXA02571RXN02074FRXA02074RXA02095RXA02225RXA02253RXN01881FRXA01881RXA00526RXN00733FRXA00733RXA00735RXA00878RXN01191FRXA01191RXN01212FRXA01212RXA02749RXA02224RXN01602RXN02515RXN00525RXN02096RXN00412RXN00411RXN02614RXN02613RXN00368FRXA00368FRXA00370RXN01285RXN00523RXN01142RXN01141RNX01002RXN01000RXN01732RXN03080RXN03081RXN03082    重叠群GR00736VV0318GR00628GR00629GR00652GR00654VV0105GR00537GR00136VV0132GR00197GR00198GR00242VV0169GR00341VV0169GR00350GR00764GR00652VV0229VV0087VV0079VV0126VV0086VV0086VV0313VV0313VV0226GR00076GR00077VV0215VV0194VV0077VV0077VV0106VV0106VV0106VV0045VV0045VV0045    NT起始14691277557981407131562048052930921353164741184937331047815713284141532271110996226304204445392352844596452232300161780136358054644885872529944167024763131    NI终止249711534176154742275214069535326642531418118711206716542078135028475263817172756622135528445217052364267726579803105533863025468805564078895244929343451      功能ABC转运蛋白的,P,G,R ATP酶亚基转运ATP结合蛋白CYDDABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基ABC转运蛋白的,P,G,R ATP酶亚基假定的ABC转运蛋白ATP结合蛋白具有重复ATP酶结构域的ABC转运蛋白的ATP酶组分假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白ATP结合蛋白假定的ABC转运蛋白通透酶蛋白假定的ABC转运蛋白通透酶蛋白假定的氨基酸ABC转运蛋白ATP结合蛋白假定的氨基酸ABC转运蛋白通透酶蛋白牛磺酸转运ATP结合蛋白TAUB牛磺酸结合周质蛋白前体亚精胺/腐胺转运ATP结合蛋白POTA亚精胺/腐胺转运ATP结合蛋白POTA亚精胺/腐胺转运ATP结合蛋白POTA高铁肠杆菌素转运ATP结合蛋白FEPC高铁肠杆菌素转运蛋白EFPCG硝酸转运ATP结合蛋白NRTD硝酸转运蛋白NRTA膦酸转运ATP结合蛋白PHNC膦酸转运***通透酶蛋白PHNE膦酸结合周质蛋白前体高铁肠杆菌素转运ATP结合蛋白FEPC高铁肠杆菌素结合周质蛋白前体高铁肠杆菌素结合周质蛋白前体
表1(续)
 其它转运蛋白
  核酸 SEQ ID NO397339401403405407409411413415417419421423425427429431433435437439441443445447449451453455457459461463    氨基酸 SEQ ID NO398400402404406408410412414416418420422424426428430432434436438440442444446448450452454456458460462464      标识码RXA02261RXA02020RXA00281RXN00570FRXA00570RXN00571FRXA00571RXA00962RXA02811RXA02115RXN00590FRXA00590FRXA01538RXA01727RXA00623RXA01584RXA00825RXA00690RXA00827RXA00851RXS03220FRXA02762RXN00092FRXA00092RXN013060FRXA02618FRXA02900RXS03212FRXA01591RXN00201FRXA00201RXA01221RXA01222RXA01219      重叠群GR00654GR00613GR00043VV0147GR00153VV0173GR00154GR00268GR00792GR00635VV0178GR00157GR00427GR00489GR00163GR00441GR00231GR00181GR00223GR00231GR00768VV0129GR00014VV0030GR00745GR10040GR00446VV0096GR00032GR00354GR00354GP00354      NI起始3093610154721855112982217725043178504014716525553137121313192448346275091622719142979319719121082844151    NI终止32291554044498421186667560119862305645429194786259724486856718406302684420453762351212894766283335421032    功能铵转运***芳香氨基酸转运蛋白AROP杆菌肽转运ATP结合蛋白BCRA苯甲酸膜转运蛋白苯甲酸膜转运蛋白苯甲酸膜转运蛋白苯甲酸膜转运蛋白苯甲酸膜转运蛋白苯甲酸膜转运蛋白苯甲酸膜转运蛋白支链氨基酸转运***II载体蛋白支链氨基酸转运***II载体蛋白支链氨基酸转运***II载体蛋白支链氨基酸转运***载体蛋白C4-二羧酸转运蛋白铬酸转运蛋白钴转运ATP结合蛋白CBIO钴转运蛋白CBIQ钴转运蛋白CBIQ钴转运蛋白CBIQD-木糖质子同向转运D-木糖质子同向转运蛋白谷氨酰胺转运ATP结合蛋白GLNQ谷氧酰胺转运ATP结合蛋白GLNQ谷氨酰胺转运ATP结合蛋白GLNQ谷氨酰胺转运ATP结合蛋白GLNQ谷氨酰胺转运ATP结合蛋白GLNQ甜菜碱转运蛋白BETP甜菜碱转运蛋白BETP高亲和性核糖转运蛋白RBSD高亲和性核糖转运蛋白RBSD高亲和性支链氨基酸转运ATP结合蛋白BRAG高亲和性支链氨基酸转运ATP结合蛋白LIVF高亲和性支链氨基酸转运通透酶蛋白LIVH
表1(续)
    核酸 SEQ ID NO465467469471473475477479481483485487489491493495497499501503505507509511513515517519521523525527529531533535    氨基酸 SEQ ID NO466468470472474476478480482484486488490492494496498500502504506508510512514516518520522524526528530532534536      标识码RXA01220RXA00091RXA00228RXA00346RXA00524RXA01823RXA02767RXA02792RXN02929FRXA01235RXN02794FRXA01419FRXA02794RXN03079FRXA02865RXA00181RXA00591RXA01629RXA02030RXA00186RXA00187RXA01667RXA02171RXA00902RXA00941RXN00449FRXA00449FRXA01755RXA00269RXA00369RXA02073RXA01399RXA01339RXA02527RXN00298FRXA00298      重叠群GR00354GR00013GR00032GR00064GR00135GR00516GR00770GR00777VV0090GR00358VV0134GR00415GR00777VV0045GR10007GR00028GR00158GR00453GR00618GR00028GR00028GR00464GR00641GR00245GR00257VV0112GR00109GR00498GR00041GR00076GR00628GR00409GR00389GR00725VV0176GR00048      NT起始103277622923210547795911032858136837116510625888101726443832395422934763072122421309770365714643199930992204035218265834176184085519402284459     NT终止2108851428642174311111367181478293787419495521151955216602816238315811965168712988134471908491958756833257210365103812992647111971646847420726303     功能高亲和性支链氨基酸转运通透酶蛋白LIVM二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运ATP结合蛋白FECE二柠檬酸铁(III)转运***通透酶蛋白FECD二柠檬酸铁(III)转运***通透酶蛋白FECD二柠檬酸铁(III)转运***通透酶蛋白FECD二柠檬酸铁(III)转运***通透酶蛋白FECD二柠檬酸铁(III)转运***通透酶蛋白FECD二柠檬酸铁(III)转运***通透酶蛋白FECD二柠檬酸铁(III)转运***通透酶蛋白FECD脯氨酸转运***脯氨酸/甜菜碱转运蛋白脯氨酸/甜菜碱转运蛋白脯氨酸/甜菜碱转运蛋白短链脂肪酸转运蛋白短链脂肪酸转运蛋白钠/谷氨酸同向转运载体蛋白钠/脯氨酸同向转运蛋白依赖于钠的磷酸转运蛋白依赖于钠的磷酸转运蛋白钠-二羧酸同向转运蛋白钠-二羧酸同向转运蛋白钠-二羧酸同向转运蛋白亚精胺/腐胺转运ATP结合蛋白POTA亚精胺/腐胺转运ATP结合蛋白POTA转运ATP结合蛋白CYDC转运ATP结合蛋白CYDD酪氨酸特异性转运蛋白2-酮戊二酸/苹果酸转运蛋白前体高亲和性胆碱转运蛋白ectoine/脯氨酸/甜菜碱载体ectP
表1(续)
    核酸 SEQ ID NO537539541543545547549551553555557559561563565567569571573575577579581583585587589591593595597599601603      氨基酸 SEQ ID NO538540542544546548550552554556558560562564566568570572574576578580582584586588590592594596598600602604    标识码RXA00596RXA02364RXN01411RXN00960RXN02447RXN02395RXN02348RXN00297RXN03103RXN02993RXN00349RXN03095RXN03160RXN02955RXN03109RXN02979RXN02987RXN03084RXN03183RXN01139RXN00378RXN01338RXN00980RXN00099RXN02662RXN02442RXN02443RXN00842FRXA00842RXN00832RXN00466RXN01936RXN01995RXN00661    重叠群GR00159GR00686VV0050VV0075VV0107VV0176VV0078VV0176VV0070VV0071VV0135VV0057VV0189VV0176VV0082VV0149VV0234VV0048VV0372VV0077VV0223VV0032VV0149VV0129VV0315VV0217VV0217VV0138GR00228VV0180VV0086VV0127VV0182VV0142      NT起始33584126015113914297167476027386308457363518740565150866665921505279001277680272263518876146159706818868632083133632714011621399718      NT终止78721526779105132031485879103954110876536653442456179187623832941817417182354181903442817704172468187771748720094182642664138734769029    功能钾流出***蛋白phaEC4-二羧酸结合周质蛋白前体,转运蛋白莽草酸转运蛋白质子/钠-谷氨酸同向转运蛋白半乳糖-质子同向转运甜菜碱转运蛋白BETPKUP***钾摄入蛋白假定的丙二酸转运蛋白谷氨酸结合蛋白前体谷氨酰胺结合蛋白假定的海藻糖转运蛋白钙流出***辅助蛋白同系物铬酸转运蛋白二羧酸转运蛋白氯高铁血红素转运***通透酶蛋白HMUU汞转运蛋白周质组分前体汞转运蛋白周质组分前体二柠檬酸铁(III)结合周质蛋白前体海藻糖/麦芽糖结合蛋白阳离子流出***蛋白CZCD阳离子转运ATP酶阳离子转运ATP酶PACS(EC 3.6.1.-)阳离子转运P型ATP酶B(EC 3.6.1.-)氰酸转运蛋白CYNX二肽转运***通透酶蛋白DPPC锌转运***膜蛋白锌结合周质蛋白前体支链氨基酸转运***II载体蛋白通透酶钙/质子对向转运蛋白高铁色素转运蛋白大环内酯流出蛋白推定的3-(3-羟基苯基)丙酸转运蛋白PNUC蛋白
表1(续)
通透酶
  核酸 SEQ ID NO605607609611613615617619621623625627629631633635637639641643645647649651653655657659661    氨基酸 SEQ ID NO606608610612614616618620622624626628630632634636638640642644646648650652654656658660662    标识码RXN02566FRXA02561FRXA02566RXA00051RXA01172RXA02128RXA02634RXN02233FRXA02233RXN02372FRXA02372FRXA02377RXA02676RXN00432FRXA00432FRXA00436RXA00847RXN01382FRXA01382RXA02659RXN02933RXN02991RXN02992RXN02996RXN03126RXN00443RXN00444RXN00193RXN01298    重叠群VV0154GR00732GR00733GR00008GR00334GR00637GR00748VV0068GR00653VV0213GR00688GR00689GR00754VV0112GR00100GR00101GR00230VV0119GR00405GR00753VV0176VV0072VV0072VV0069VV0112VV0112VV0112VV0371VV0116    NT起始1182366478257702687290660456856685693116333626971475114518298670106723004261884219809894215722078512071    NT终止130315345717341414600765581428067111975604526130913267891569381976163132923346212648900120769199495941142    功能核苷通透酶NUPG核苷通透酶NUPG核苷通透酶NUPG脯氨酸特异性通透酶PROY硫酸通透酶硫酸通透酶硫酸通透酶尿嘧啶通透酶尿嘧啶通透酶黄嘌呤通透酶黄嘌呤通透酶黄嘌呤通透酶葡糖酸通透酶NA(+)-联D-丙氨酸甘氨酸通透酶NA(+)-联D-丙氨酸甘氨酸通透酶NA(+)-联D-丙氨酸甘氨酸通透酶寡肽结合蛋白APPA前体(通透酶)寡肽结合蛋白OPPA前体寡肽结合蛋白OPPA前体(通透酶)寡肽结合蛋白OPPA前体(通透酶)二肽转运***通透酶蛋白DPPC谷氨酰胺转运***通透酶蛋白GLNP谷氨酰胺转运***通透酶蛋白GLNP高亲和性支链氨基酸转运通透酶蛋白LIVH磷壁酸转运通透酶蛋白TAGG钼酸结合周质蛋白前体钼转运***通透酶蛋白MODB潜在的淀粉降解产物转运***通透酶蛋白AMYD潜在的淀粉降解产物转运***通透酶蛋白AMYD
表1(续)
通道蛋白
  核酸 SEQ ID NO663665667669671   氨基酸 SEQ ID NO664666668670672   标识码RXA01737RXN02348RXA02426RXN03164RXN00024   重叠群GR00493VV0078GR00707VV0277VV0127   NT起始291360272165158664219   NT终止39717910633245563275   功能钾通道蛋白KUP***钾摄入蛋白可能的NA(+)/H(+)对向转运蛋白钾通道β亚基钾通道β亚基
脂蛋白和脂多糖合成
  核酸 SEQ ID NO673675   氨基酸 SEQ ID NO674676   标识码RXN01164RXN01168   重叠群VV0117VV0117   NI起始1589414224   NT终止1426013415   功能多萜醇磷酸甘露糖基转移酶(EC 2.4.1.83)/载脂蛋白磷酸N-酰基转移酶(EC 2.3.1.-)多萜醇磷酸甘露糖基转移酶(EC 2.4.1.83)/载脂蛋白磷酸N-酰基转移酶(EC 2.3.1.-)
                                                                 表2-排除的基因
Gen BankTM登记号 基因名称 基因功能 参考文献
A09073 ppg 磷酸烯醇丙酮酸羧化酶 Bachmann,B.等“编码磷酸烯醇丙酮酸羧化酶的DNA片段、携带所述片段的重组DNA、带有所述重组DNA的菌株和采用所述菌株生产L-氨基酸的方法”,专利:EP 0358940-A303/21/90
A45579,A45581,A45583,A45585A45587 苏氨酸脱水酶 Moeckel,B.等“利用具有去调节苏氨酸脱水酶的重组微生物生产L-异亮氨酸”专利:WO 9519442-A 507/20/95
AB003132 murC;ftsQ;fisZ Kobayashi,M.等“来自棒状细菌的ftsZ基因的克隆、测序和特征鉴定”Biochem.Biophys.Res.Commun.,236(2):383-388(1997)
AB015023 murC;ftsQ Wachi,M.等“来自棒杆菌的murC基因”Appl.Microbiol.Biotechnol.,51(2):223-228(1999)
AB018530 dtsR Kimura,E.等“拯救衍生自乳发酵短杆菌的突变体去垢剂敏感性的新型基因dtsR的分子克隆”,Biosci.Biotechnol.Biochem.,60(10):1565-1570(1996)
AB018531 dtsR1;dtsR2
AB020624 murI D-谷氨酸消旋酶
AB023377 tkt 转羟乙醛酶
AB024708 gltB;gltD 谷氨酰胺2-酮戊二酸氨基转移酶大亚基和小亚基
AB025424 acn 顺乌头酸酶
AB027714 rep 复制蛋白
AB027715 rep;aad 复制蛋白;氨基糖苷腺苷酸转移酶
AF005242 argC N-乙酰谷氨酸-5-半醛脱氢酶
AF005635 glnA 谷氨酰胺合成酶
AF030405 hisF 环化酶
AF030520 argG 精氨琥珀酸合成酶
AF031518 argF 鸟氨酸氨甲酰基转移酶
AF036932 aroD 3-脱氢奎尼酸脱水酶
                                                                           表2(续)
AF038548 pyc 丙酮酸羧化酶
AF038651 dciAE;apt;rel 二肽结合蛋白;腺嘌呤磷酸核糖转移酶;GTP焦磷酸激酶 Wehmeier,L.等“谷氨酸棒杆菌rel基因在(p)ppGpp代谢中的作用”,Microbiology,144:1853-1862(1998)
AF041436 argR 精氨酸阻抑蛋白
AF045998 impA 肌醇单磷酸磷酸酶
AF048764 argH 精氨琥珀酸裂合酶
AF049897 argC;argJ;argB;argD;argF;argR;argG;argH N-乙酰谷氨酰磷酸还原酶;鸟氨酸乙酰基转移酶;N-乙酰谷氨酸激酶;乙酰鸟氨酸转氨酶;鸟氨酸氨甲酰转移酶;精氨酸阻抑蛋白;精氨琥珀酸合酶;精氨琥珀酸裂合酶
AF050109 inhA 烯酰-酰基载体蛋白还原酶
AF050166 hisG ATP磷酸核糖转移酶
AF051846 hisA 甲酰亚氨基-5-氨基-1-磷酸核糖基-4-咪唑甲酰胺核苷酸异构酶
AF052652 metA 高丝氨酸O-乙酰基转移酶 Park,S.等“metA-一种谷氨酸棒杆菌中编码高丝氨酸乙酰基转移酶的甲硫氨酸生物合成基因的分离与分析”,Mol.Cells.,8(3):286-294(1998)
AF053071 aroB 脱氢奎尼酸合成酶
AF060558 hisH 谷氨酰胺转酰胺酶
AF086704 hisE 磷酸核糖基-ATP-焦磷酸水解酶
AF114233 aroA 5-烯醇丙酮酸莽草酸3-磷酸合酶L-天冬氨酸-α-脱羧酶前体
AF116184 panDpanD L-天冬氨-α-脱羧酶前体 Dusch,N.等“编码L-天冬氨酸-α-脱羧酶的谷氨酸棒杆菌panD基因的表达导致在大肠杆菌中过量产生泛酸”,Appl. Environ.Microbiol.,65(4)1530-1539(1999)
AF124518 aroD;aroE 3-脱氢奎尼酸酶(dehydroquinase);莽草酸脱氢酶
AF124600 aroC;aroK;aroB;pepQ 分支酸合酶;莽草酸激酶;3-脱氢奎尼酸合酶;推定的胞质肽酶
                                                                         表2(续)
AF145897 inhA
AF145898 inhA
AJ001436 ectP ectoine、甜菜碱、脯氨酸的转运 Peter,H.等“谷氨酸棒杆菌备有四种匹配溶质的第二载体:脯氨酸/ectoine摄入***Prop和ectoine/脯氨酸/甜菜碱载体EctP的鉴定、测序和特征鉴定”,J.Bacteriol.,180(22):6005-6012(1998)
AJ004934 dapD 四氢2,6-吡啶二羧酸琥珀酰化酶(不完整的i) Wehrmann,A.等“二氨基庚二酸合成的差别模式及其在细胞壁完整性方面的作用:用谷氨酸棒杆菌的研究”,J.Bacteriol.,180(12):3159-3165(1998)
AJ007732 ppc;secG;amt;ocd;soxA 磷酸烯醇丙酮酸羧化酶;?;高亲合性铵摄入蛋白;推定的鸟氨酸-环脱羧酶;肌氨酸氧化酶
AJ010319 ftsY,glnB,glnD;srp;amtP 参与细胞***;PII蛋白;尿苷酰基转移酶(尿苷酰基释去酶);信号识别颗粒;低亲合性铵摄入蛋白 Jakoby,M.等“谷氨酸棒杆菌中的氮调节;涉及相应蛋白质的生物化学鉴定的基因的分离”,FEMS Microbiol.,173(2);303-310(1999)
AJ132968 cat 氯霉素乙酰基转移酶
AJ224946 mqo L-苹果酸;醌氧化还原酶 Molenaar,D.等“得自谷氨酸棒杆菌的膜相关苹果酸脱氢酶(受体)的生物化学和遗传学特征鉴定”,Eur.J.Biochem.,254(2):395-403(1998)
AJ238250 ndh NADH脱氢酶
AJ238703 porA 膜孔蛋白 Lichtinger,T.等“谷氨酸棒杆菌细胞壁膜孔蛋白的生物化学和生物物理学特征鉴定:该通道由低分子量多肽形成”,Biochemistry,37(43):15024-15032(1998)
D17429 转座因子IS31831 Vertes等“得自谷氨酸棒杆菌的转座因子IS31831的分离和特征鉴定”,Mol.Microbiol.,11(4):739-746(1994)
D84102 odhA 2-酮戊二酸脱氢酶 Usuda,Y.等“编码新型2-酮戊二酸脱氢酶的谷氨酸棒杆菌(乳发酵短杆菌AJ12036)odhA基因的分子克隆”,Microbiology,142:3347-3354(1996)
E01358 hdh;hk 高丝氨酸脱氢酶;高丝氨酸激酶 Katsumata,R.等“L-苏氨酸和L-异亮氨酸的生产”,专利:JP 1987232392-A110/12/87
E01359 高丝氨酸激酶基因起始密码子上游 Katsumata,R.等“L-苏氨酸和L-异亮氨酸的生产”,专利:JP 1987232392-A 210/12/87
E01375 色氨酸操纵子
E01376 trpL;trpE 前导肽;邻氨基苯甲酸合酶 Matsui,K.等“色氨酸操纵子、由其编码的肽和蛋白质、色氨酸操纵子基因表达的利用和色氨酸的生产”,专利:JP 1987244382-A 1 10/24/87
                                             表2(续)
E01377 色氨酸操纵子的启动子和操纵基因区 Matsui,K.等“色氨酸操纵子、由其编码的肽和蛋白质、色氨酸操纵子基因表达的利用和色氨酸的生产”,专利:JP 1987244382-A 1 10/24/87
E03937 生物素合酶 Hatakeyama,K.等“含能够编码生物素合成酶的基因的DNA片段及其应用”,专利:JP 1992278088-A 1 10/02/92
E04040 二氨基壬酸氨基转移酶 Kohama,K.等“编码二氨基壬酸氨基转移酶和脱硫生物素合成酶的基因及其应用”,专利:JP 1992330284-A 1 11/18/92
E04041 脱硫生物素合成酶 Kohama,K.等“编码二氨基壬酸氨基转移酶和脱硫生物素合成酶的基因及其应用”,专利:JP 1992330284-A 111/18/92
E04307 Flavum天冬氨酸酶 Kurusu,Y.等“编码天冬氨酸酶的基因DNA及其应用”,专利:JP1993030977-A 1 02/09/93
E04376 异柠檬酸裂合酶 Katsumata,R.等“基因表现控制性DNA”,专利:JP 1993056782-A3 03/09/93
E04377 异柠檬酸裂合酶N末端片段 Katsumata,R.等“基因表现控制性DNA”,专利:JP 1993056782-A 3 03/09/93
E04484 预苯酸脱水酶 Sotouchi,N.等“通过发酵生产L-苯丙氨酸”,专利:JP 1993076352-A203/30/97
E05108 天冬氨酸激酶 Fugono,N.等“编码天冬氨酸激酶的基因DNA及其应用”,专利:JP1993184366-A 1 07/27/93
E05112 二氢-dipichorinate合成酶 Hatakeyama,K.等“编码二氢2,6-吡啶二羧酸合成酶的基因DNA及其应用”,专利:JP 1993184371-A 1 07/27/93
E05776 二氨基庚二酸脱氢酶 Kobayashi,M.等“编码二氨基庚二酸脱氢酶的基因DNA及其应用”,专利:JP 1993284970-A 1 11/02/93
E05779 苏氨酸合酶 Kohama,K.等“编码苏氨酸合酶的基因DNA及其应用”,专利:JP1993284972-A 1 11/02/93
E06110 预苯酸脱水酶 Kikuchi,T.等“通过发酵法生产L-苯丙氨酸”,专利:JP 1993344881-A 112/27/93
E06111 突变型预苯酸脱水酶 Kikuchi,T.等“通过发酵法生产L-笨丙氨酸”,专利:JP 1993344881-A 112/27/93
E06146 乙酰羟酸合成酶 Inui,M.等“能够编码乙酰羟酸合成酶的基因及其应用”,专利:JP1993344893-A 1 12/27/93
E06825 天冬氨酸激酶 Sugimoto,M.等“突变型天冬氨酸激酶基因”,专利:JP 1994062866-A 103/08/94
E06826 突变型天冬氨酸激酶α亚基 Sugimoto,M.等“突变型天冬氨酸激酶基因”,专利:JP 1994062866-A 1
03/08/94
                                                        表2(续)
E06827 突变型天冬氨酸激酶α亚基 Sugimoto,M.等“突变型天冬氨酸激酶基因”,专利:JP 1994062866-A 103/08/94
E07701 secY Honno,N.等“参与膜蛋白与膜整合的基因DNA”,专利:JP 1994169780-A 106/21/94
E08177 天冬氨酸激酶 Sato,Y.等“能够编码从反馈抑制释放的天冬氨酸激酶的基因DNA及其应用”,专利:JP 1994261766-A 1 09/20/94
E08178,E08179,E08180,E08181,E08182 反馈抑制释放的天冬氨酸激酶 Sato,Y.等“能够编码从反馈抑制释放的天冬氨酸激酶的基因DNA及其应用”,专利:JP 1994261766-A 1 09/20/94
E08232 乙酰羟酸异构还原酶 Inui,M.等“编码乙酰羟酸异构还原酶的基因DNA”,专利:JP 1994277067-A1 10/04/94
E08234 secE Asai,Y.等“编码蛋白质转运机器的基因DNA”,专利:JP 1994277073-A 110/04/94
E08643 FT氨基转移酶和脱硫生物素合成酶启动子区 Hatakeyama,K.等“棒状细菌中具有启动子功能的DNA片段”,专利:JP1995031476-A 1 02/03/95
E08646 生物素合成酶 Hatakeyama,K.等“棒状细菌中具有启动子功能的DNA片段”,专利:JP1995031476-A 1 02/03/95
E08649 天冬氨酸酶 Kohama,K.等“棒状细菌中具有启动子功能的DNA片段”,专利:JP1995031478-A 1 02/03/95
E08900 二氢2,6-吡啶二羧酸还原酶 Madori,M.等“含有编码二氢2,6-吡啶二羧酸还原酶的基因的DNA片段及其应用”,专利:JP 1995075578-A 1 03/20/95
E08901 二氨基庚二酸脱羧酶 Madori,M.等“含有编码二氨基庚二酸脱羧酶的基因的DNA片段及其应用”,专利:JP 1995075579-A 1 03/20/95
E12594 丝氨酸羟甲基转移酶 Hatakeyama,K.等“L-色氨酸的生产”,专利:JP 1997028391-A 1 02/04/97
E12760,E12759,E12758 转座酶 Moriya,M.等“采用人工转座子扩增基因”,专利:JP 1997070291-A 03/18/97
E12764 精氨酰-tRNA合成酶;二氨基庚二酸脱羧酶 Moriya,M.等“采用人工转座子扩增基因”,专利:JP 1997070291-A03/18/97
E12767 二氢2,6-吡啶二羧酸合成酶 Moriya,M.等“采用人工转座子扩增基因”,专利:JP 1997070291-A 03/18/97
                                                                             表2(续)
E12770 天冬氨酸激酶 Moriya,M.等“采用人工转座子扩增基因”,专利:JP 1997070291-A 03/18/97
E12773 二氢2,6-吡啶二羧酸还原酶 Moriya,M.等“采用人工转座子扩增基因”,专利:JP 1997070291-A 03/18/97
E13655 葡萄糖-6-磷酸脱氢酶 Hatakeyama,K.等“葡萄糖-6-磷酸脱氢酶以及能够编码其的DNA”,专利:JP 1997224661-A 1 09/02/97
L01508 IlHvA 苏氨酸脱水酶 Moeckel,B.等“谷氨酸棒杆菌苏氨酸脱水酶的功能和结构分析”,J.Bacteriol.,174:8065-8072(1992)
L07603 EC 4.2.1.15 3-脱氧-D-***庚酮糖酸-7-磷酸合酶 Chen,C.等“谷氨酸棒杆菌3-脱氧-D-***庚酮糖酸-7-磷酸合酶基因的克隆和核苷酸序列”,FEMS Microbiol.Lett.,107:223-230(1993)
L09232 IlvB;ilvN;ilvC 乙酰羟酸合酶大亚基;乙酰羟酸合酶小亚基;乙酰羟酸异构还原酶 Keilhauer,C.等“谷氨酸棒杆菌中的异亮氨酸合成:ilvB-ilvN-ilvC操纵子的分子分析”,J.Bacteriol.,175(17):5595-5603(1993)
L18874 PtsM 磷酸烯醇丙酮酸糖磷酸转移酶 Fouet,A等“枯草杆菌磷酸转移酶***的蔗糖特异性酶II:在大肠杆菌中的表达以及与来自肠细菌的酶II的同源性”,PNAS USA,84(24):8773-8777(1987);Lee,J.K.等“编码谷氨酸棒杆菌甘露糖酶II的基因的核苷酸序列和推导的蛋白质序列的分析”,FEMS Microbiol.Lett.,119(1-2):137-145(1994)
L27123 aceB 苹果酸合酶 Lee,H-S.等“aceB-一种谷氨酸棒杆菌中编码苹果酸合酶的基因的分子特征鉴定”,J.Microbiol.Biotechnol.,4(4):256-263(1994)
L27126 丙酮酸激酶 Jetten,M.S.等“来自谷氨酸棒杆菌的丙酮酸激酶的结构与功能分析”,Appl.Environ.Microbiol.,60(7):2501-2507(1994)
L28760 aceA 异柠檬酸裂合酶
L35906 dtxr 白喉毒素阻抑蛋白 Oguiza,J.A.等“来自乳发酵短杆菌的白喉棒杆菌dtxR的分子克隆、DNA序列分析和特征鉴定”,J.Bacteriol.,177(2):465-467(1995)
M13774 预苯酸脱水酶 Follettie,M.T.等“谷氨酸棒杆菌pheA基因的分子克隆和核苷酸序列”,J.Bacteriol.,167:695-702(1986)
M16175 5S rRNA Park,Y-H.等“通过56种rRNA序列对棒状细菌进行的种系发生分析”,J.Bacteriol.,169:1801-1806(1987)
M16663 trpE 邻氨基苯甲酸合酶,5’端 Sano,K.等“一种谷氨酸生产细菌-乳发酵短杆菌trp操纵子控制区的结构和功能”,Gene,52:191-200(1987)
M16664 trpA 色氨酸合酶,3’端 Sano,K.等“一种谷氨酸生产细菌-乳发酵短杆菌trp操纵子控制区的结构和功能”,Gene,52:191-200(1987)
                                                                   表2(续)
M25819 磷酸烯醇丙酮酸羧化酶 O’Regan,M.等“谷氨酸棒杆菌ATCC 13032的磷酸烯醇丙酮酸羧化酶编码基因的克隆和核苷酸序列”,Gene,77(2):237-251(1989)
M85106 23S rRNA基因***序列 Roller,C.等“具有高DNAG+C含量的***的特征为其23SrRNA基因内的一个共同***”,J.Gen.Microbiol.,138:1167-1175(1992)
M8107,M85108 23S rRNA基因***序列 Roller,C.等“具有高DNAG+C含量的***的特征为其23SrRNA基因内的一个共同***”,J.Gen.Microbiol.,138:1167-1175(1992)
M89931 aecD;brnQ;yhbw βC-S裂合酶;支链氨基酸摄入载体;假定的蛋白yhbw Rossol,I.等“谷氨酸棒杆菌aecD基因编码一种具有降解氨乙基半胱氨酸的α,β-消除活性的C-S裂合酶”,J.Bacteriol.174(9):2968-2977(1992);Taich,A.等“谷氨酸棒杆菌ATCC 13032中的异亮氨酸摄入由brnQ基因产生指导”,Arch.Microbiol.,169(4):303-312(1998)
S59299 trp 前导基因(启动子) Herry,D.M.等“来自谷氨酸棒杆菌色氨酸高生产菌株的trp基因簇的克隆:trp前导序列中一个突变的鉴定”,APPl.Environ.Microbiol.,59(3):791-799(1993)
U11545 trpD 邻氨基苯甲酸磷酸核糖基转移酶 O’Gara,J.P.和Dunican,L.K.(1994)“谷氨酸棒杆菌ATCC 2150 tpD基因的完整核苷酸序列”,论文,Microbiology Department,University College Galway,Ireland
U13922 cglIM;cglIR;clgIIR 推定的II型5-胞嘧啶甲基转移酶;推定的II型限制性内切核酸酶;推定的I型或III型限制性内切酸酶 Schafer,A.等“来自谷氨酸棒杆菌ATCC 13032的编码胁迫敏感性限制***的DNA区的克隆和特征鉴定及其在与大肠杆菌的属间接合方面的作用分析”,J.Bacteriol.176(23):7309-7319(1994);Schafer,A.等“谷氨酸棒杆菌编码McrBC缺陷型大肠杆菌菌株中的5-胞嘧啶的cglIM基因”,Gene,203(2):95-101(1997)
U14965 recA
U31224 ppx Ankri,S.等“谷氨酸棒杆酸脯氨酸生物合成途径中的突变:proA步骤的天然气旁路”,J.Bacteriol.,178(15):4412-4419(1996)
U31225 proC L-脯氨酸:NADP+5-氧化还原酶 Ankri,S.等“谷氨酸棒杆菌脯氨酸生物合成途径中的突变:proA步骤的天然旁路”,J.Bacteriol.178(15):4412-4419(1996)
U31230 obg;proB;unkdh ?;γ-谷氨酰激酶;与D-异构体特异性的2-羟酸脱氢酶相似 Ankri,S.等“谷氨酸棒杆菌脯氨酸生物合成途径中的突变:proA步骤的天然旁路”,J.Bacteriol.,178(15):4412-4419(1996)
                                                                     表2(续)
U31281 bioB 生物素合酶 Serebriiskii,I.G.,“bio B超家族的两个新成员:Methylobacillus flagellatum和谷氨酸棒杆菌的bio B基因的克隆、测序和表达”,Gene,175:15-22(1996)
U35023 thtR;accBC 硫代硫酸硫转移酶;酰基CoA羧化酶 Jager,W.等“编码类似于生物素羧化酶和生物素羧基载体蛋白的二结构域蛋白的谷氨酸棒杆菌基因”,Arch.Microbiol.,166(2);76-82(1996)
U43535 cmr 多种药物抗性蛋白 Jager,W.等“在异源宿主大肠杆菌中赋予多种药物抗性的谷氨酸棒杆菌基因”,J.Bacteriol.,179(7):2449-2451(1997)
U43536 clpB 热激ATP结合蛋白
U53587 aphA-3 3’5”-氨基糖苷磷酸转移酶
U89648 谷氨酸棒杆菌中参与组氨酸生物合成的未鉴定序列、部分序列
X04960 trpA;trpB;trpC;trpD;TrpE;trpG;trpL 色氨酸操纵子 Matsui,K.等“乳发酵短杆菌色氨酸操纵子的完整核苷酸序列和推导的氨基酸序列”,Nucleic Acids Res.,14(24):10113-10114(1986)
X07563 lysA DAP脱羧酶(中-二氨基庚二酸脱羧酶,EC 4.1.1.20) Yeh,P.等“谷氨酸棒杆菌的lysA基因的核酸序列以及其表达调节的可能机制”,Mol.Gen.Genet.,212(1):112-119(1988)
X14234 EC 4.1.1.31 磷酸烯醇丙酮酸羧化酶 Eikmanns,B.J.等“谷氨酸棒杆菌的磷酸烯醇丙酮酸羧化酶基因:分子克隆、核苷酸序列和表达”,Mol. Gen.Genet.,218(2):330-339(1989);Lepiniec,L.等“高粱磷酸烯醇丙酮酸羧化酶基因家族:结构、功能和分子进化”,Plant.Mol.Biol.,21(3):487-502(1993)
X17313 fda 果糖二磷酸醛缩酶 Von der Osten,C.H.等“谷氨酸棒杆菌fda基因的分子克隆、核苷酸序列和精细结构分析:谷氨酸棒杆菌果糖-1,6-二磷酸醛缩酶与I类和II类醛缩酶的结构比较”,Mol.Microbiol.,
X53993 dapA L-2,3-二氢2,6-吡啶二羧酸合成酶(EC 4.2.1.52) Bonnassie,S.等“来自谷氨酸棒杆菌的dapA基因的核酸序列”,Nucleic AcidsRes.,18(21):6421(1990)
X54223 AttB相关位点 Cianciotto,N.等“白喉棒杆菌、溃疡棒杆菌(Corynebacterium ulcerans)和谷氨酸棒杆菌attB相关位点和λ棒杆菌噬菌体的attP位点之间的DNA序列同源性”,FEMS,Microbiol,Lett.,66:299-302(1990)
X54740 argS;lysA 精氨酰-tRNA合成酶;二氨基庚二酸脱羧酶 Marcel,T.等“谷氨酸棒杆菌lysA基因上游区的核苷酸序列和组构”,Mol.Microbiol.,4(11):1819-1830(1990)
                                                              表2(续)
X55994 trpL;trpE 推定的前导肽;邻氨基苯甲酸合酶组分I Heery,D.M.等“谷氨酸棒杆菌trpE基因的核苷酸序列”,Nucleic Acids Res.,18(23):7138(1990)
X56037 thrC 苏氨酸合酶 Han,K.S.等“谷氨酸棒杆菌苏氨酸合酶基因的分子结构”,Mol.Microbiol,4(10):1693-1702(1990)
X56075 attB-相关位点 附着位点 Cianciotto,N.等“白喉棒杆菌、溃疡棒杆菌(Corynebacterium ulcerans)和谷氨酸棒杆菌att B相关位点和λ棒杆菌噬菌体的attP位点之间的DNA序列同源性”,FEMS.Microbiol,Lett.,66:299-302(1990)
X57226 lysC-α;lysC-β;asd 天冬氨酸激酶α亚基;天冬氨酸激酶β亚基;天冬氨酸β半醛脱氢酶 Kalinowski,J.等“来自谷氨酸棒杆菌的天冬氨酸激酶的遗传学和生物化学分析”,Mol.Microbiol.,5(5):1197-1204(1991);Kalinowski,J.等“天冬氨酸激酶基因lysCα和lysCβ重叠并且在谷氨酸棒杆菌中与天冬氨酸β半醛脱氢酶基因asd相邻”,Mol.Gen.Genet.,224(3):317-324(1990)
X59403 gap;pgk;tpi 甘油醛-3-磷酸;磷酸甘油酸激酶;丙糖磷酸异构酶 Eikmanns,B.J.“一种编码三种糖酵解酶甘油醛-3-磷酸脱氢酶、磷酸甘油酸激酶和丙糖磷酸异构酶的谷氨酸棒杆菌基因簇的鉴定、序列分析和表达”,J.Bacteriol.,174(19):6076-6086(1992)
X59404 gdh 谷氨酸脱氢酶 Bormann,E.R.等“编码谷氨酸脱氢酶的谷氨酸棒杆菌gdh基因的分子分析”,Mol.Microbiol.,6(3):317-326(1992)
X60312 Lys1 L-赖氨酸通透酶 Seep-Feldhaus,A.H.等“参与赖氨酸摄入的谷氨酸棒杆菌lysl基因的分子分析”,Mol.Microbiol.,5(12):2995-3005(1991)
X66078 Cop1 Ps1蛋白 Joliff,G.等“编码谷氨酸棒杆菌两种主要分泌蛋白之一PS1的csp1基因的克隆和核苷酸序列:PS1的推导的N末端区与分枝杆菌属抗原85复合体相似”,Mol.Microbiol.,6(16):2349-2362(1992)
X66112 glt 柠檬酸合酶 Eikmanns,B.J.等“编码柠檬酸合酶的谷氨酸棒杆菌gltA基因的克隆序列、表达和转录分析”,Microbiol.,140:1817-1828(1994)
X67737 dapB 二氢2,6-吡啶二羧酸还原酶
X69103 csp2 表层蛋白PS2 Peyret,J.L.等“编码谷氨酸棒杆菌中一种有序表层蛋白PS2的cspB基因的特征鉴定”,Mol.Microbiol.,9(1):97-109(1993)
X69104 IS3相关***元件 Bonamy,C.等“一种谷氨酸棒杆菌IS3相关***序列IS 1206的鉴定以及种系发生分析”,Mol.Microbiol.,14(3):571-581(1994)
                                                                表2(续)
X70959 leuA 异丙基苹果酸合酶 Patek,M.等“谷氨酸棒杆菌中的亮氨酸合成:leuA的酶活性、结构以及leuA失活对赖氨酸合成的影响”,Appl.Environ.Microbiol.,60(1):133-140(1994)
X71489 icd 异柠檬酸脱氢酶(NADP+) Eikmanns,B.J.等“编码异柠檬酸脱氢酶的谷氨酸棒杆菌icd基因的克隆序列分析、表达和失活以及该酶的生化特征鉴定”,J.Bacteriol.,177(3):774-782(1995)
X72855 GDHA 谷氨酸脱氢酶(NADP+)
X75083,X70584 mtrA 5-甲基色氨酸抗性 Heery,D.M.等“来自谷氨酸棒杆菌色氨酸高生产菌株编码5-甲基色氨酸抗性的序列”,Biochem.Biophys.Res.Commun.,201(3):1255-1262(1994)
X75085 recA Fitzpatrick,R.等“谷氨酸棒杆菌和乳发酵短杆菌的recA突变株的构建和特征鉴定”,Appl. Microbiol.Biotechnol.,42(4):575-580(1994)
X75504 aceA;thiX 部分异柠檬酸裂合酶;? Reinscheid,D.J.等“来自谷氨酸棒杆菌的异柠檬酸裂合酶基因的特征鉴定以及该酶的生化分析”,J.Bacteriol.,176(12):3474-3483(1994)
X76875 ATP酶β亚基 Ludwig,W.等“基于延伸因子Tu和ATP合酶β亚基基因比较序列分析的细菌种系***”,Antonie Van Leeuwenhoek,64:285-305(1993)
X77034 tuf 延伸因子Tu Ludwig,W.等“基于延伸因子Tu和ATP合酶β亚基基因比较序列分析的细菌种系***”,Antonie Van Leeuwenhoek,64:285-305(1993)
X77384 recA Billman-Jacobe,H.“来自谷氨酸棒杆菌的recA基因的核苷酸序列”,DNASeq.,4(6):403-404(1994)
X78491 aceB 苹果酸合酶 Reinscheid,D.J.等“来自编码磷酸转乙酰基酶的谷氨酸棒杆菌pta-ack操纵子的苹果酸合酶:序列分析”,Microbiology,140:3099-3108(1994)
X80629 16S rDNA 16S核糖体RNA Rainey,FA.等“红球菌属(Rhodococcus)和诺卡氏菌属(Norcardia)的种系发生分析和诺卡氏菌属来自红球菌辐射的进化起源的证据”,Microbiol.,141:523-528(1995)
X81191 gluA;gluB;gluC;gluD 谷氨酸摄入*** Kronemeyer,W.等“编码谷氨酸棒杆菌谷氨酸摄入***的gluABCD簇的结构”,J.Bacteriol.,177(5):1152-1158(1995)
X81379 dapE 琥珀酰二氨基庚二酸脱琥珀酰基酶 Wehrmann,A.等“互补大肠杆菌dapE的谷氨酸棒杆菌的不同DNA片段的分析”,Microbiology,40:3349-56(1994)
                                                                          表2(续)
X82061 16S rDNA 16S核糖体RNA Ruimy,R.等“由小亚基核糖体DNA序列分析推导的棒杆菌属的种系发生”,Int.J.Sydt Bacteriol.,45(4):740-746(1995)
X82928 asd;lysC 天冬氨酸半醛脱氢酶;? Serebrijski,I.等“proA突变体中由asd基因引起的多拷贝抑制和由异源proA引起的渗透胁迫依赖性互补”,J.Bacterio1.,177(24):7255-7260(1995)
X82929 proA γ-谷氨酰磷酸还原酶 Serebrijski,I.等“proA突变体中由asd基因引起的多拷贝抑制和由异源proA引起的渗透胁迫依赖性互补”,J.Bacterio1.,177(24):7255-7260(1995)
X84257 16S rDNA 16S核糖体RNA Pascual,C.等“基于16SrRNA基因序列的棒杆菌属的种系发生分析”,Int.J.Syst.Bacteriol,45(4):724-728(1995)
X85965 aroP;dapE 芳族氨基酸通透酶;? Wehrmann等“谷氨酸棒杆菌脯氨酸dapE的相邻序列的功能分析揭示编码芳族氨基酸转运蛋白的arop的存在”,J.Bacteriol.,177(20):5991-5993(1995)
X86157 argB;argC;argD;argF;argJ 乙酰谷氨酸激酶;N-乙酰-γ-谷氨酰磷酸还原酶;乙酰鸟氨酸氨基转移酶;乌氨酸氨甲酰转移酶;谷氨酸N-乙酰基转移酶 Sakanyan,V.等“谷氨酸棒杆菌中精氨酸生物合成乙酰基循环的基因和酶:精氨酸途径早期步骤中的酶进化”,Microbiology,142:99-108(1996)
X89084 pta;ackA 磷酸乙酰基转移酶;乙酸激酶 Reinscheid,D.J.等“编码磷酸转乙酰基酶和乙酸激酶的谷氨酸棒杆菌pta-ack操纵子的克隆、序列分析、表达和失活”,Microbiology,145:503-513(1999)
X89850 attB 附着位点 Le Marrec,C.等“感染“金黄节杆菌(Arthrobacter aureus)C70”的phi AAU2定点整合功能的遗传特征鉴定”,J.Bacteriol.,178(7):1996-2004(1996)
X90356 启动子片段F1 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90357 启动子片段F2 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbilogy,142:1297-1309(1996)
X90358 启动子片段F10 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90359 启动子片段F13 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
                                                              表2(续)
X90360 启动子片段F22 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90361 启动子片段F34 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90362 启动子片段F37 Patek M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90363 启动子片段F45 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90364 启动子片段F64 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90365 启动子片段F75 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90366 启动子片段PF101 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90367 启动子片段PF104 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X90368 启动子片段PF109 Patek,M.等“来自谷氨酸棒杆菌的启动子:克隆、分子分析和共有基序的搜索”,Microbiology,142:1297-1309(1996)
X93513 amt 铵转运*** Siewe,R.M.等“谷氨酸棒杆菌(甲基)铵摄入载体的功能和遗传特征鉴定”,J.Biol. Chem.,271(10):5398-5403(1996)
X93514 betP 甜菜碱转运*** Peter,H.等“编码匹配溶质甜菜碱转运***的谷氨酸棒杆菌betP基因分离、特征鉴定和表达”,J.Bacteriol.,178(17):5229-5234(1996)
X95649 orf4 Patek,M.等“编码参与L-赖氨酸合成的两种酶的谷氨酸棒杆菌dapB-ORF2-dapA-ORF4操纵子的鉴定和转录分析”,Biotechnol. Lett.,19:1113-1117(1997)
X96471 lysE;lysG 赖氨酸输出蛋白;赖氨酸输出调节蛋白 Vrljic,M.等“具有新类型细胞功能的新类型转运蛋白:来自谷氨酸棒杆菌的L-赖氨酸输出”,Mol.Microbiol.,22(5):815-826(1996)
                                                                           表2(续)
X96580 panB;panC;xylB 3-甲基-2-酮丁酸羟甲基转移酶;泛解酸-β-丙氨酸连接酶;木酮糖激酶 Sahrn,H.等“谷氨酸棒杆菌中的D-泛酸合成以及将panBC和编码L-缬氨酸合成的基因应用于D-泛酸的过量生产”,Appl.Environ.Microbiol.,65(5):1973-1979(1999)
X96962 ***序列IS1207和转座酶
X99289 延伸因子P Ramos,A.等“编码氨基酸生产菌乳发酵短杆菌(谷氨酸棒杆菌ATCC 13869)中延伸因子P的基因的克隆、测序和表达”,Gene,198:217-222(1997)
Y00140 thrB 高丝氨酸激酶 Mateos,L.M.等“乳发酵短杆菌的高丝氨酸激酶(thrB)基因的核苷酸序列”,NucleicA cids Res.,15(9):3922(1987)
Y00151 ddh 中-二氨基庚二酸D-脱氢酶(EC 1.4.1.16) Ishino,S.等“来自谷氨酸棒杆菌的中-二氨基庚二酸D-脱氢酶基因的核苷酸序列”,Nucleic Acids Res.,15(9):3917(1987)
Y00476 thrA 高丝氨酸脱氢酶 Mateos,L.M.等“乳发酵短杆菌的高丝氨酸脱氢酶(thrA)基因的核苷酸序列”,Nucleic Acids Res.,15(24):10598(1987)
Y00546 hom;thrB 高丝氨酸脱氢酶;高丝氨酸激酶 Peoples,O.P.等“谷氨酸棒杆菌hom-thrB操纵子的核苷酸序列和精细结构分析”,Mol.Microbiol.,2(1):63-72(1988)
Y08964 murC;ftsQ/divD;ftsZ UPD-N-乙酰胞壁酸-丙氨酸连接酶;***起始蛋白或细胞***蛋白;细胞***蛋白 Honrubia,M.P等“来自乳发酵短杆菌的ftsZ基因的鉴定、特征鉴定和染色体组构”,Mol.Gen.Genet.,259(1):97-104(1998)
Y09163 putP 高亲合性脯氨酸转运*** Peter,H.等“谷氨酸棒杆菌脯氨酸的putP基因的分离和匹配溶质的低亲合性摄入***的特征鉴定”,Arch.Microbiol.,168(2):143-151(1997)
Y09548 pyc 丙酮酸羧化酶 Peters-Wendisch,P.G.等“来自谷氨酸棒杆菌的丙酮酸羧化酶:pyc基因的特征鉴定、表达和失活”,Microbiology,144:915-927(1998)
Y09578 leuB 3-异丙基苹果酸脱氢酶 Patek,M.等“来自谷氨酸棒杆菌的leuB基因的分析”,Appl. Microbiol,Biotechnol.,50(1):42-47(1998)
Y12472 附着位点噬菌体Phi-16 Moreau,S.等“棒杆菌噬菌体Phi-16的定点整合:整合载体的构建”,Microbiol.,145:539-548(1999)
Y12537 proP 脯氨酸/ectoine摄入***蛋白 Peter,H.等“谷氨酸棒杆菌备有四种匹配溶质的第二载体:脯氨酸/ectoine摄入***ProP以及ectoine/脯氨酸/甜菜碱载体EctP的鉴定、测序和特征鉴定”,J.Bacteriol.,180(22):6005-6012(1998)
                                                              表2(续)
Y13221 glnA 谷氨酰胺合成酶I Jakoby,M.等“编码谷氨酰胺合成酶I的谷氨酸棒杆菌glnA基因的分离”,FEMS Microbiol. Lett.,154(1):81-88(1997)
Y16642 lpd 二氢硫辛酰胺脱氢酶
Y18059 附着位点棒杆菌噬菌体304L Moreau,S.等“φ304L整合功能的分析:棒杆菌噬菌体中的一种整合酶组件”,Virology,255(1):150-159(1999)
Z21501 argS;lysA 精氨酰-tRNA合成酶;二氨基庚二酸脱羧酶(部分) Oguiza,J.A.等“编码精氨酰-tRNA合成酶的基因位于乳发酵短杆菌lysA基因的上游区中:通过精氨酸调节argS-lysA族表达”,J.Bacteriol.,175(22):7356-7362(1993)
Z21502 dapA;dapB 二氢2,6-吡啶二羧酸合酶;二氢2,6-吡啶二羧酸还原酶 Pisabarro,A.等“乳发酵短杆菌三种基因(dapA、orf2和dapB)的基因簇编码二氢2,6-吡啶二羧酸还原酶和一种功能未知的第三种多肽”,J.Bacterkol.,175(9):2743-2749(1993)
Z29563 thrC 苏氨酸合酶 Malumbres,M.等“所编码苏氨酸合酶的thrC基因的分析和表达”,Appl.Environ.Microbiol.,60(7)2209-2219(1994)
Z46753 16S rDNA 16S核糖体RNA的基因
Z49822 sigA SigAσ因子 Oguiza,J.A.等“乳发酵短杆菌中的多个σ因子基因:sigA和sigB的特征鉴定”,J.Bacteriol.,178(2):550-553(1996)
Z49823 galE;dtxR 催化活性UDP-半乳糖4-差向异构酶;白喉毒素调节蛋白 Oguiza,J.A.等“乳发酵短杆菌编码UDP-半乳糖4-差向异构酶的galE基因与dmdR基因转录偶联”,Gene,177:103-107(1996)
Z49824 orfI;sigB ?;SigBσ因子 Oguiza,J.A.等“乳发酵短杆菌中的多个σ因子基因:sigA和sigB的特征鉴定”,J.Bacteriol.,178(2):550-553(1996)
Z66534 转座酶 Correia,A等“存在于乳发酵短杆菌ATCC 13869基因组中的IS样元件的克隆和特征鉴定”,Gene,170(1):91-94(1996)
1该基因的序公布于所指明的参考文献中。然而,本申请的发明人获得的序列明显长于所公布的形式。认为所公布的形式依赖于不正确的起始密码子,因此仅代表真实编码区的片段。
表3:可以用于实施本发明的棒杆菌属和短杆菌属菌株
菌种 ATCC FERM NRRL CECT NCIMB CBS NCTC DSMZ
产氨短杆菌(Brevibacterium ammoniagenes) 21054
产氨短杆菌 19350
产氨短杆菌 19351
产氨短杆菌 19352
产氨短杆菌 19353
产氨短杆菌 19354
产氨短杆菌 19355
产氨短杆菌 19356
产氨短杆菌 21055
产氨短杆菌 21077
产氨短杆菌 21553
产氨短杆菌 21580
产氨短杆菌 39101
Brevibacterium butanicum 21196
谷氨酸棒杆菌(Brevibacterium divaricatum) 21792 P928
黄色短杆菌(Brevibacterium flavum) 21474
黄色短杆菌 21129
黄色短杆菌 21518
黄色短杆菌 B11474
黄色短杆菌 B11472
黄色短杆菌 21127
黄色短杆菌 21128
黄色短杆菌 21427
黄色短杆菌 21475
黄色短杆菌 21517
黄色短杆菌 21528
黄色短杆菌 21529
黄色短杆菌 B11477
黄色短杆菌 B11478
黄色短杆菌 21127
黄色短杆菌 B11474
希氏短杆菌(Brevibacterium healii) 15527
酮戊二酸短杆菌(Brevibacterium ketoglutamicum) 21004
酮戊二酸短杆菌 21089
酮戊二酸短杆菌 21914
乳发酵短杆菌 70
乳发酵短杆菌 74
乳发酵短杆菌 77
乳发酵短杆菌 21798
乳发酵短杆菌 21799
乳发酵短杆菌 21800
乳发酵短杆菌 21801
乳发酵短杆菌 B11470
乳发酵短杆菌 B11471
乳发酵短杆菌 21086
乳发酵短杆菌 21420
乳发酵短杆菌 21086
乳发酵短杆菌 31269
扩展短杆菌(Brevibacterium linens) 9174
扩展短杆菌 19391
扩展短杆菌 8377
Brevibacterium paraffinolyticum 11160
短杆菌(Brevibacterium spec.) 717.73
短杆菌 717.73
短杆菌 14604
短杆菌 21860
短杆菌 21864
短杆菌 21865
短杆菌 21866
短杆菌 19240
嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum) 21476
嗜乙酰乙酸棒杆菌 13870
醋谷棒杆菌(Corynebacteriumacetoglutamiphilum) B11473
醋谷棒杆菌 B11475
醋谷棒杆菌 15806
醋谷棒杆菌 21491
醋谷棒杆菌 31270
嗜乙酰棒杆菌(Corynebacterium acetophilum) B3671
产氨棒杆菌 6872 2399
产氨棒杆菌 15511
Corynebacterium fujiokense 21496
谷氨酸棒杆菌 14067
谷氨酸棒杆菌 39137
谷氨酸棒杆菌 21254
谷氨酸棒杆菌 21255
谷氨酸棒杆菌 31830
谷氨酸棒杆菌 13032
谷氨酸棒杆菌 14305
谷氨酸棒杆菌 15455
谷氨酸棒杆菌 13058
谷氨酸棒杆菌 13059
谷氨酸棒杆菌 13060
谷氨酸棒杆菌 21492
谷氨酸棒杆菌 21513
谷氨酸棒杆菌 21526
谷氨酸棒杆菌 21543
谷氨酸棒杆菌 13287
谷氨酸棒杆菌 21851
谷氨酸棒杆菌 21253
谷氨酸棒杆菌 21514
谷氨酸棒杆菌 21516
谷氨酸棒杆菌 21299
谷氨酸棒杆菌 21300
谷氨酸棒杆菌 39684
谷氨酸棒杆菌 21488
谷氨酸棒杆菌 21649
谷氨酸棒杆菌 21650
谷氨酸棒杆菌 19223
谷氨酸棒杆菌 13869
谷氨酸棒杆菌 21157
谷氨酸棒杆菌 21158
谷氨酸棒杆菌 21159
谷氨酸棒杆菌 21355
谷氨酸棒杆菌 31808
谷氨酸棒杆菌 21674
谷氨酸棒杆菌 21562
谷氨酸棒杆菌 21563
谷氨酸棒杆菌 21564
谷氨酸棒杆菌 21565
谷氨酸棒杆菌 21566
谷氨酸棒杆菌 21567
谷氨酸棒杆菌 21568
谷氨酸棒杆菌 21569
谷氨酸棒杆菌 21570
谷氨酸棒杆菌 21571
谷氨酸棒杆菌 21572
谷氨酸棒杆菌 21573
谷氨酸棒杆菌 21579
谷氨酸棒杆菌 19049
谷氨酸棒杆菌 19050
谷氨酸棒杆菌 19051
谷氨酸棒杆菌 19052
谷氨酸棒杆菌 19053
谷氨酸棒杆菌 19054
谷氨酸棒杆菌 19055
谷氨酸棒杆菌 19056
谷氨酸棒杆菌 19057
谷氨酸棒杆菌 19058
谷氨酸棒杆菌 19059
谷氨酸棒杆菌 19060
谷氨酸棒杆菌 19185
谷氨酸棒杆菌 13286
谷氨酸棒杆菌 21515
谷氨酸棒杆菌 21527
谷氨酸棒杆菌 21544
谷氨酸棒杆菌 21492
谷氨酸棒杆菌 B8183
谷氨酸棒杆菌 B8182
谷氨酸棒杆菌 B12416
谷氨酸棒杆菌 B12417
谷氨酸棒杆菌 B12418
谷氨酸棒杆菌 B11476
谷氨酸棒杆菌 21608
百合花棒杆菌(Corynebacterium lilium) P973
Corynebacterium nitrilophilus 21419 11594
棒杆菌(Corynebacterium spec.) P4445
棒杆菌 P4446
棒杆菌 31088
棒杆菌 31089
棒杆菌 31090
棒杆菌 31090
棒杆菌 31090
棒杆菌 15954 20145
棒杆菌 21857
棒杆菌 21862
棒杆菌 21863
ATCC:美国典型培养物保藏中心,Rockville,MD,USA
FERM:发酵研究所,Chiba,日本
NRRL:农业研究机构培养物保藏中心,Northern Regional ResearchLaboratory,Peoria,IL,USA
CECT:西班牙典型培养物保藏中心,Valencia,西班牙
NCIMB:国立工业和海洋微生物保藏有限公司,Aberdeen,英国
CBS:真菌菌种保藏中心,Baarn,荷兰
NCTC:国立典型培养物保藏中心,London,英国
DSMZ:德意志微生物保藏中心,Braunschweig,德国
有关参考文献参见Sugawara,H.等(1993)World directory of collections ofcultures of microorganisms:Bacteria,fungi and yeasts(第4版),World federation forculture collections World data center on microorganisms,Saimata,Japan。
表4:序列比对结果
ID# 长度 (NT) Gertbank命中 长度 登记号 Genbank命中的名称 Genbank命中 的夹源 同源性% (CAP) 录入日期
rxa00051rxa00091rxa00092rxa00104rxa00113rxa00164rxa00181rxa00186 1527876789879574518121695870 GB_HTG3:AC009685GB_HTG3:AC009685GB_HTG7:AC009511GB_BA1:D50453GB_BA1:SCI51GB_BA1:ECOUW93GB_BA1:SCH35GB_HTG3:AC011498_0GB_HTG3:AC011498_OGB_BAl:MTCY270GB_PL2:T24M8GB_BA1:MTCY270GB_BA1:MAFASGENGB_BA1:BAFASAAGB_BA1:MTCYl59GB_HTG2:HSJ1153D9GB_HTG2:HSJ1153D9GB_HTG2:HSJ1153D9GB_BA1:CGPUTPGB_BA2:U32814GB_BA1:CGPUTPGB_PR3:AC004843 210031210031271896146191407453385344539312343312343375866825l375861052010549338181183601183601183603791103933791136655 AC009685AC009685AC009511D50453AL109848U14003AL078610AC011498AC011498Z95388AF077409Z95388X87822X64795Z83863AL109806AL109806AL109806Y09163U32814Y09163AC004843 人15号染色体克隆91_E_3 map 15,***测序正在进行之中***,27个非顺序片段(piece).人15号染色体克隆91_E_13 map 15,***测序正在进行之中***,27个非顺序片段.人克隆RP11-860B 13,***测序正在进行之中***,59个非顺序片段。含amyE-srfA区的25-36度区的枯草杆菌DNA,完整编码区。天蓝色链霉菌粘拉I51。大肠杆菌K-12从92.8至00.1分钟的染色体区。天蓝色链霉菌粘粒H35。人19号染色体克隆CTT978SKB_50L17,***测序正在进行之中***,190个非顺序片段。人19号染色体克隆CTT978SKB_50Ll7,***测序正在进行之中***,190个非顺序片段。结核分枝杆菌H37Rv完整基因组;区段96/162。拟南芥BAC T24MB。结核分枝杆菌H37Rv完整基因组;区段96/162。产氨短杆菌FAS基因。产氨短杆菌FAS基因。结核分枝杆菌H37Rv完整基因组;区段111/162。人20号染色体克隆RP5-1153D9,***测序正在进行之中***,为非顺序片段。人20号染色体克隆RP5-1153D9,***测序正在进行之中***,为非顺序片段。人20号染色体克隆RP5-1153D9,***测序正在进行之中***,为非顺序片段。谷氨酸棒杆菌putP基因。流感嗜血菌Rd完整基因组的区域129/163(section 129 0f 163)。谷氨酸棒杆菌putP基因。来自7p12-p14的人PAC克隆DJ0612F12。 人(Homo sapiens)人人枯草杆菌(Bacillus subtilis)天蓝色链霉菌(Streptomyces coelicolor)A3(2)大肠杆菌天蓝色链霉菌人人结核分枝杆菌(Mycobacterium tuberculosis)拟南芥(Arabidopsis thaliana)结核分枝杆菌产氨棒杆菌产氨棒杆菌结核分枝杆菌人人人谷氨酸棒杆菌流感嗜血菌(Haemophilus influenzae)Rd谷氨酸棒杆菌人 34,24734,24735,03354,45236,80638,64249,93437,11737,11736,73237,15042,87468,38157,25939,87035,71435,71435,7334100,00036,34737,45437,315 99-09-2999-09-291999-12-0999-02-1099-08-1696-04-1799-06-0499-12-1399-12-1399-02-1098-08-0399-02-101996-10-031997-lO-1498-06-171999-12-031999-12-031999-12-0397-09-081998-05-2997-09-0898-11-05
                                                                      表4(续)
rxa00187rxa00201rxaa00228rxa00243rxa00259rxa00269rxa00281 47429271411402325912766   GB_HTG2:HS745I14GB_HTG2:HS745I14GB_GSS10:AQ184082GB_GSS1:CNS008ZZGB_GSS10:AQ184082GB_PR3:HSJ824F16GB_BA1:RCSECAGB_EST34:AV122904GB_EST15:AA486042GB_EST15:AA486042GB_PR2:CNS01DS5GBHTG3:AC011408GB_HTG3:AC011408GB_HTG1:CEY62E10GB_HTG1:CEY62E10GB_PL2:YSCCHROMGB_HTG4:AC009974GB_HTG4:AC009974GB_BA1:AB017508GB_BA1:SCE8GB_BA1:SCU5 1332GB_HTG4:AC011122   1333091333095061101506139330272424251551510158479332793322542172542174198821956521956532050247003216187123   AL033532AL033532AQ184082AL052951AQ184082AL050325X89411AV122904AA486042AA486042AL121655AC011408AC011408AL031580AL031580L22015AC009974AC009974AB017508AL035654U51332AC011122   人1号染色体克隆RP4-745I14map q23.1-24.3,***测序正在进行之中***,为非顺序片段。人1号染色体克隆RP4-745I14map q23.1-24.3,***测序正在进行之中***,为非顺序片段。HS_3216_Al_G08_T7 CIT批准的人类基因组***文库D人基因组克隆平板=3216列=15行=M,基因组综述序列。来自黑腹果蝇(果蝇)的RPCI-98文库BAC#BACR18L01的黑腹果蝇基因组综述序列T7末端,基因组综述序列。HS_3216_Al_G08_T7CIT批准的人类基因组***文库D人基因组克隆平板=3216列=15行=M,基因组综述序列。来自克隆824F16的20号染色体上的人类DNA序列,完整序列。夹膜红细菌secA基因的DNA。AV122904小家鼠C57BL/6J 10天胚胎小家鼠cDNA克隆2610529H07,mRNA序列。ab40c08.rl.Stratagene HeLa细胞s3 937216人cDNA克隆IMAGE:843278 5’,mRNA序列。ab40c08.rl.StratageneHeLa细胞s3 937216人cDNA克隆IMAGE:843278 5’,mRNA序列。来自2p21-2p22的SPG4候选区的BAC序列,完整的人克隆CIT978SKB_65D22,***测序正在进行之中***,10个非顺序片段。人克隆CIT978SKB_65D22,***测序正在进行之中***,10个非顺序片段。Caenorhabditis elegans染色体IV克隆Y62E10,***测序正在进行之中***,为非顺序片段。Caenorhabditis elegans染色体IV克隆Y62E10,***测序正在进行之中***,为非顺序片段。酿酒酵母染色体I着丝点和右臂序列。人染色体未知克隆NH0459I19、WORKING DRAFT SEQUENCE,为非顺序片段。人染色体未知克隆NH0459I19、WORKING DRAFT SEQUENCE,为非顺序片段。Bacillus haloduransC-125基因组DNA,32kb片段,完整编码区。天蓝色链霉菌粘粒E8。天蓝色链霉菌组氨酸激酶同系物(absA1)和效应调节物同系物(absA2)基因,完整编码区。人8号染色体克隆23 D 19map 8,***测序正在进行之中***,27个   人人人黑腹果蝇(Drosophila melanogaster)人人夹膜红细菌(Rhodobacter capsulatus)小家鼠(Mus musculus)人人人人人Caenorhabditis elegansCaenorhabditis elegans酿酒酵母(Saccharomyces cerevisiae)人人Bacillus halodurans天蓝色链霉菌天蓝色链霉菌人   38,12938,12937,29734,12039,65534,52038,16338,88937,50038,81637,00138,04038,04036,77636,77639,26037,35837,35844,62236,32839,08938,658   1999-12-031999-12-0398-11-0199-06-0398-11-0199-11-2396-01-0699-07-011998-03-061998-03-0699-09-291999-10-061999-10-0699-09-0699-09-061998-03-051999-10-291999-10-2999-04-141999-03-1196-09-141999-10-14
顺序片段。
表4(续)
 rxa00298rxa00346rxa00368rxa00369rxa00410rxa00419rxa00432     196881316988177898821608     GB_BA1:CGECTPGB_BA1:CGECTPGB_EST24:AI234006GB_BA1:SC2E9GB_BA1:SC9B1GB_BA1:ECU70214GB_BA2:AF065159GB_BA1:AEOCHIT1GB_EST4:D62996GB_BA1:YP102KBGB_GSS8:AQ012142GB_HTG2:AC005081GB_BA1:ATPLOCCGB_BA2:U67591GB_BA1:TIPOCCQMFJGB_BA2:MSU46844GB_EST28:AI513245GB_HTG4:AC010066GB_BA1:BSUB0015GB_PL1:CAC35A5GB_EST13:AA336266     2719271943220850248001231713520968613141194435011800968870982943501695147118724021841042565378    AJ001436AJ001436AI234006AL021530AL049727U70214AF065159D63139D62996AL031866AQ012142AC005081Z30328U67591M80607U46844AI513245AC010066Z9911gAL033396AA336266   谷氨酸棒杆菌ectP基因。谷氨酸棒杆菌ectP基因。EST230694标准化大鼠肺,Bento Soares鼠(Rattus sp.)cDNA克隆RLUCU01 3’端,mRNA序列。天蓝色链霉菌粘粒2E9。天蓝色链霉菌粘粒9B1.大肠杆菌染色体第4-6分钟。大豆慢生根瘤菌推定的芳基硫酸酯酶(arsA)、推定的可溶性裂解性转糖基酶前体(sltA)、二氢2,6-吡啶二羧酸合酶(dapA)、MscL(mscL)、SmpB(smpB)、BcpB(bcpB)、RnpO(nnpO)、RelA/SpoT同系物(relA)、PdxJ(PdxJ)和酰基载体蛋白合酶AcpS(acpS)基因,完整编码区;原核生物I型信号肽酶SipF(sipF)基因、sipF-sipS等位基因,完整编码区;RNA酶III(mc)基因,完整编码区;GTP结合蛋白Era(era)基因、部分编码区;和未知基因。产气杆菌壳多糖酶基因,完整的和部分的编码区。HUM347G01B Clontech人主动脉polyA+mRNA(#6572)人cDNA克隆GEN-347G01 5’端,RNA序列。鼠疫耶尔森氏菌102千碱基不稳定区:1-119443。类球红细菌染色体II基因组克隆8750H1A037010398的8750H1A037010398粘粒文库,基因组综述序列。人克隆RG270D13,***测序正在进行之中***,18个非顺序片段。根癌农杆菌Ti质粒OccR、OccQ、OccM、OccP、OccT、OoxB、OoxA和鸟氨酸环脱氨酶的pTiAch5基因。詹氏甲烷球菌完整基因组的区域133/150(section 133 of 150)。质粒pTiA6(来自根癌农杆菌)周质型章鱼碱通透酶(occR、occQ、occM、occP和occJ)和lysR型调节蛋白(occR)基因,完整编码区。耻垢分枝杆菌过氧化氢酶-过氧化物酶(katG)、推定的***糖基转移酶(embC、embA、embB)基因完整编码区和推定的丙酰-CoA羧化酶β链(pccB)基因,部分编码区。GH13311.3prime.GH黑腹果蝇头pOT2黑腹果蝇cDNA克隆GH13311 3prime,mRNA序列。黑腹果蝇染色体3L/72A4克隆RPCI98-25O1,***测序正在进行之中***,70个非顺序片段。枯草杆菌完整基因组(区域15/21):2795131-3013540。白色念珠菌粘粒Ca35A5。EST40981子宫内膜肿瘤人cDNA 5’端,mRNA序列。   谷氨酸棒杆菌谷氨酸棒杆菌鼠(Rattus sp.)天蓝色链霉菌天蓝色链霉菌大肠杆菌大豆慢生根瘤菌(Bradyrhizobium japonicum)产气杆菌(Aeromonas sp.)10S-24人鼠疫耶尔森氏菌(Yersinia pestis)类球红细菌(Rhodobacter sphaeroides)人根癌农杆菌(Agrobacterium tumefaciens)詹氏甲烷球菌(Methanococcus jannaschii)质粒pTiA6耻垢分枝杆菌(Mycobacterium smegmatis)黑腹果蝇黑腹果蝇枯草杆菌白色念珠菌(Candida albicans)人   100,000100,00046,55243,26744,61339,49040,40938,57741,61335,39654,80045,78646,49045,67746,49057,02937,69639,60749,81035,04139,733   98-11-2098-11-2099-01-3198-01-2899-04-2796-09-211999-10-2799-02-1395-08-2999-01-0498-06-0498-06-121994-10-1098-01-2896-04-241997-05-121999-03-161999-10-1697-11-2698-11-0597-04-21
表4(续)
rxa00449rxa00456rxa00477rxa00478rxa00480rxa00524rxa00526rxa00559   17041500176795412394338131140   GB_HTG2:AC008199GB_HTG2:AC008199GB_RO:RATLNKP2GB_GSS1:FR0030597GB_GSS5:AQ786587GB_GSS14:AQ526586GB_EST17:AA610489GB_PR1:HSH3G4GB EST30:AI637667GB_HTG3:AC008708GB_HTG3:AC008708GB_HTG3:AC008708GB_HTG1:HSJ575L21GB_HTG1:HSJ575L21GB_RO:AC005960GB_BA1:SCI51GB_BA2:AF082879GB_BA1:BSP132617GB_BA1:BSUB0008GB_BA2:AF012285GB_BA1:D90725GB_BA2:CAU77910GB_EST4:H34952   12405012405017747655643440710155798393283932839329471594715158414407453434519220823046864137963385382   AC008199AC008199M22337AL026966AQ786587AQ526586AA610489X05857AI637667AC008708AC008708AC008708AL096841AL096841AC005960AL109848AF082879AJ132617Z99111AF012285D90725U77910H34952   黑腹果蝇3号染色体克隆BACR01K08(D756)RPCI-98 01.K.8map94D-94D strain y;cn bw sp,***测序正在进行之中***,83个非顺序片段。黑腹果蝇3号染色体克隆BACR01K08(D756)RPCI-98 01.K.8map94D-94Dstrain y;cn bw sp,***测序正在进行之中***,83个非顺序片段。大鼠连接蛋白基因,外显子2。Fugu rubripes GSS序列,克隆091C22aF9,基因组综述序列。HS_3086_B1_H05_MR CIT批准的人类基因组***文库D人基因组克隆平板=3086列=9行=P,基因组综述序列。HS_5198_B1_B03_SP6ERPCI-11人类男性BAC文库人基因组克隆平板=774列=5行=D,基因组综述序列。类似于gb:M11353 HISTONE H3.3(人类)的np93e05.slNCI_CGAP_Thyl人cDNA克隆IMAGE:1133888;mRNA序列。人类H3.3基因外显子4。tt10g11.xl NCI_CGAP_GC6人cDNA克隆IMAGE:2240420 3’,mRNA序列。人5号染色体克隆CIT978SKB_78F1,***测序正在进行之中***,12个非顺序片段。人5号染色体克隆CIT978SKB_78F1,***测序正在进行之中***,12个非顺序片段。人5号染色体克隆CIT978SKB_78F1,***测序正在进行之中***,12个非顺序片段。人1号染色体克隆RP4-575L21,***测序正在进行之中***,为非顺序片段。人1号染色体克隆RP4-575L21,***测序正在进行之中***,为非顺序片段。小家鼠17号染色体来自MHC区的BAC citb20h22,完整序列。天蓝色链霉菌粘粒I51。肠炎耶尔森氏菌ABC转运蛋白肠螯合素/肠杆菌素基因簇,完整序列。伯克霍尔德氏菌P转运蛋白操纵子和侧翼基因。枯草杆菌完整基因组(区域8/21):1394791-1603020。枯草杆菌mobA-nprE基因区。大肠杆菌基因组DNA。(19.7-20.0分钟)。产氨棒杆菌5-磷酸核糖-1-焦磷酸转酰胺酶(purF)基因上游的序列。类似于NADH-辅酶Q氧化还原酶复合体I 23 kDa前体(铁-硫蛋白)的EST108261大鼠PC-12细胞、未处理的鼠(Rattus sp.)cDNA克 黑腹果蝇黑腹果蝇鼠(Rattus sp.)Fugu rubripes人人人人人人人人人人小家鼠天蓝色链霉菌A3(2)肠炎耶尔森氏菌(Yersinia enterocolitica)伯克霍尔德氏菌(Burkholderia sp.)枯草杆菌枯草杆菌大肠杆菌产氨棒杆菌鼠(Rattus sp.)     38,39238,39240,67847,40738,40636,95141,79138,18235,41738,76938,76936,79738,13838,13838,71240,28455,63440,79354,53454,53451,48139,00739,267   99-08-0299-08-0293-04-2798-06-2599-08-031999-05-111997-12-0996-01-2499-04-2799-08-0399-08-0399-08-0399-11-2399-11-231998-12-0199-08-161999-10-2099-07-1397-11-2698-07-0199-02-0798-01-0198-04-02
GB BA2:AE000963 22014 AE000963 隆的RPCCK07,mRNA序列。闪烁古生球菌完整基因组的区域144/172。 闪烁古生球菌(Archaeoglobus fulgidus) 38,338 1997-12-15
表4(续)
 rxa00570rxa00571rxa00590rxa00591rxa00596rxa00607rxa00623rxa00681rxa00690     85212801288147657650414611269     GB_GSS12:AQ422451GB_EST28:AI504741GB_EST18:AA712043GB_BA1:MTCY78GB_PR3:AC005788GB_PR3:AC005338GB_HTG6:AC010932GB_HTG6:AC010932GB_BA1:MSGB26CSGB_IN1:CEK09E9GB_PR4:AF135802GB_PR4:AF104256GB_PR3:AC004659GB_PR3:AC004659GB_PR1:HUMCBP2GB_BA1:MTV010GB_BA1:MTV010GB_BA1:MTCY428GB_BA1:RSPNGR234GB_BA2:AE000101GB_HTG5:AC008338GB_HTG4:AC009766     56356868338183622434541203273203273370403009849654365129577129577204734003400269143401010057136685170502   AQ422451AI504741AA712043Z77165AC005788AC005338AC010932AC010932L78816Z79602AF135802AF104256AC004659AC004659D83174AL021186AL021186Z81451Z68203AE000101AC008338AC009766   RPCI-11-185C3.TV RPCI-11人基因组克隆RPCI-11-185C3,基因组综述序列。类似于含缬酪肽蛋白(小鼠)的小家鼠mRNA的gb:Z14044的vl16c01.xl Stratagene小鼠T细胞937311小家鼠cDNA克隆IMAGE:972384 3’;mRNA序列。类似于gb:L05093 60S核糖体蛋白L18A(人类)的vu29f10.r1Barstead小鼠肌管MPLRB5小家鼠cDNA克隆IMAGE:11820915’;mRNA序列。结核分枝杆菌H37Rv完整基因组;区段145/162。人19号染色体,粘粒R26652,完整序列。人19号染色体,粘粒R31646,完整序列。人15号染色体克隆RP11-296E22map 15,***测序正在进行之中***,36个非顺序片段。人15号染色体克隆RP11-296E22map 15,***测序正在进行之中***,36个非顺序片段。麻风分枝杆菌粘粒B26 DNA序列。Caenorhabditis elegans粘粒K09E9,完整序列。人甲状腺激素受体相关蛋白复合体组分TRAP170mRNA,完整编码区。人转录共激活蛋白CRSP150(CRSP150)mRNA,完整编码区。人19号染色体,CIT-HSP-87m17 BAC克隆,完整的人19号染色体,CIT-HSP-87m17 BAC克隆,完整的胶原蛋白结合蛋白2的人mRNA,完整编码区。结核分枝杆菌H37Rv完整基因组;区段119/162。结核分枝杆菌H37Rv完整基因组;区段119/162。结核分枝杆菌H37Rv完整基因组;区段107/162。根瘤菌质粒NGR234aDNA。根瘤菌NGR234质粒pNGR234a,完整质粒序列的区域38/46。黑腹果蝇染色体X克隆BACR30J04(D908)RPCI-98 30.J.4 map19C-19E strain y;cn bw sp,***测序正在进行之中***,93个非顺序片段。人11号染色体克隆404_A_03map11,***测序正在进行之中***,27个非顺序片段。   人小家鼠小家鼠结核分枝杆菌人人人人麻风分枝杆菌(Mycobacterium leprae)Caenorhabditis elegans人人人人人结核分枝杆菌结核分枝杆菌结核分枝杆菌根瘤菌(Rhizobium sp.)根瘤菌(Rhizobium sp.)NGR234黑腹果蝇人     38,76737,90042,64738,46836,91136,91137,24236,48539,27234,09236,31036,61734,32135,73940,40440,86238,83360,55251,99251,99235,34137,984   1999-03-231999-03-111997-12-2498-06-171998-10-0698-07-3099-11-3099-11-3096-06-1599-09-0299-04-0999-02-041998-05-021998-05-0299-02-0699-06-2399-06-2398-06-1796-08-081997-12-1299-11-151999-10-19
表4(续)
rxa00733rxa00735rxa00796rxa00801rxa00802rxa00819rxa00821rxa00827 10086922987568371452966876     GB_HTG4:AC009766GB_EST30:AU054038GB_EST30:AU054038GB_BA1:MTCY50GB_BA1:D90904GB_BA1:D90904GB_GSS14:AQ579838GB_PR4:AC007625GB_EST14:AA427576GB_BA1:MTV022GB_RO:AC002109GB_BA1:MTV022GB_GSS14:AQ563349GB_BA1:DIHCLPBAGB_GSS3:B61538GB_HTG3:AC008691_1GB_HTG3:AC008691_1GB_HTG3:AC009127GB_HTG1:HS32B1GB_HTG1:HS32B1GB_PR3:AC004919GB_EST6:W06539GB_PR4:AC008179   170502245245360301508941508946511747015801302516004813025642244169811000011000018659127148827148875547300181745   AC009766AU054038AU054038Z77137D90904D90904AQ579838AC007625AA427576AL021925AC002109AL021925AQ563349M32229B61538AC008691AC008691AC009127AL023693AL023693AC004919W06539AC008179   人11号染色体克隆404_-03map11,***测序正在进行之中***,27个非顺序片段。AU054038 Dictyostelium discoideum SL(H.Urushihara)DictyosteliumdiscoideumcDNA克隆SLK472,mRNA序列。AU054038 Dictyostelium discoideum SL(H.Urushihara)Dictyosteliumdiscoideum cDNA克隆SLK472,mRNA序列。结核分枝杆菌H37Rv完整基因组;区段55/162。Synechocystis,sp.PCC6803完整基因组,6/27,630555-781448。Synechocystis,sp.PCC6803完整基因组,6/27,630555-781448。BAC克隆31P06 Medicago truncatula基因组克隆31-P-06-C-054的T135342b鸟枪亚文库,基因组综述序列。来自18号染色体的人克隆2314F2的基因组序列,完整序列。类似于gb:M86852过氧化物体装配因子-1(人类)的zw54b04.slSoares_total_fetus_Nb2HF8_9w人cDNA克隆IMAGE:773839 3’,mRNA序列。结核分枝杆菌H37Rv完整基因组;区段100/162。来自小鼠9的基因组序列,完整序列。结核分枝杆菌H37Rv完整基因组;区段100/162。HS_5335_B2_A09_T7ARPCI-11人类男性BAC文库人基因组克隆平板=911列=18行=B,基因组综述序列。编码ATP依赖性蛋白酶调节亚基的节瘤偶蹄形菌clpB基因。T17M17TRTAMU拟南芥基因组克隆T17M17,基因组综述序列。人5号染色体克隆CIT978SKB_63A22,***测序正在进行之中***,253个非顺序片段。人5号染色体克隆CIT978SKB_63A22,***测序正在进行之中***,253个非顺序片段。人16号染色体克隆RPCI-11_498D10,***测序正在进行之中***,49个非顺序片段。人6号染色体克隆RP1-32B1,***测序正在进行之中***,为非顺序片段。人6号染色体克隆RP1-32B1,***测序正在进行之中***,为非顺序片段。来自UL的人PAC克隆DJ0895B23,完整序列。T2367MVAT4血流形式的Serodeme WRATat1.1罗德西亚布氏锥虫cDNA 5’,mRNA序列。人克隆NH0576F01,完整序列。   人Dictyostelium discoideumDictyostelium discoideum结核分枝杆菌Synechocystis,sp.Synechocystis,sp.Medicago truncatula人人结核分枝杆菌小家鼠结核分枝杆菌人节瘤偶蹄形菌(Dichelobacter nodosus)拟南芥人人人人人人罗德西亚布氏锥虫(Trypanosoma brucei thodesiense)人     37,98443,26543,26536,81952,58539,69937,15338,01442,73159,35039,39836,84237,64941,14036,94638,27038,27038,94736,56536,56534,34640,00035,903   1999-10-1999-04-2899-04-2898-06-1799-02-0799-02-0799-09-2799-06-301997-10-1698-06-1797-09-0998-06-171999-05-2993-04-2697-11-2199-08-0399-08-0399-08-0399-11-2399-11-2398-09-1996-08-1299-09-28
表4(续)
rxa00842rxa00847rxa00851rxa00852rxa00856rxa00870rxa00875rxa00878 1323157273281316356901986     GB_EST18:AA710415GB_PR2:AC002379GB_PR2:AC002379GB_IN1:CEF02D8GB_OV:XELRDS38AGB_HTG4:AC007920GB_HTG4:AC007920GB_HTG2:AC004064GB_HTG2:AC004064GB_PR3:HSJ824F16GB_HTG3:AC010120GB_HTG3:AC010120GB_HTG2:AC006898GB_BA1:STMMSDAGB_PAT:I92043GB_PAT:I78754GB_BA2:AF119715GB_BA2:AE000372GB_BA1:ECU28375GB_HTG2:AC007472GB_HTG2:AC007472GB_HTG2:AC006798     53311859511859531624120923452923452918500018500013933012158212158229930839867137135491214455175114003114003207370     AA710415AC002379AC002379Z78411L79915AC007920AC007920AC004064AC004064AL050325AC010120AC010120AC006898L48550I92043I78754AF119715AE000372U28375AC007472AC007472AC006798    vt53f08.r1 Barstead 小鼠照射结肠MPLRB7小家鼠cDNA克隆IMAGE:1166823 5’,mRNA序列。来自7q21的人BAC克隆GS165I04,完整序列。来自7q21的人BAC克隆GS165I04,完整序列。Caenorhabditis elegans粘粒F02D8,完整序列。有爪蟾蜍rds/外周蛋白(rds38)mRNA,完整编码区。人染色体3q27克隆RPCI11-208N14,***测序正在进行之中***,51个非顺序片段。人染色体3q27克隆RPCI11-208N14,***测序正在进行之中***,51个非顺序片段。人4号染色体,***测序正在进行之中***,10个非顺序片段。人4号染色体,***测序正在进行之中***,10个非顺序片段。来自20号染色体上的克隆824F16的人DNA序列,完整序列。黑腹果蝇3号染色体克隆BACR22N13(D1061)RPCI-98 22.N.13map96F-96F strain y;cn bw sp,***测序正在进行之中***,83个非顺序片段。黑腹果蝇3号染色体克隆BACR22N13(D1061)RPCI-98 22.N.13map 96F-96F strain y;cn bw sp,***测序正在进行之中***,83个非顺序片段。Caenorhabditis elegans克隆Y73B6x,***测序正在进行之中***,9个非顺序片段。天蓝色链霉菌甲基丙二酸半醛脱氢酶(msdA)基因,完整编码区。来自专利US 5726299的序列10。来自专利US 5693781的序列10。大肠杆菌异戊基二磷酸酯异构酶(idi)基因,完整编码区。大肠杆菌K-12MG1655完整基因组的区域262/400。大肠杆菌K-12基因组;约64-65分钟。黑腹果蝇2号染色体克隆BACR30D19(D587)RPCI-98 30.D.19map49E-49F strain y;cn bw sp,***测序正在进行之中***,79个非顺序片段。黑腹果蝇2号染色体克隆BACR30D19(D587)RPCI-98 30 .D.19map49E-49F strairn y;cn bw sp,***测序正在进行之中***,79个非顺序片段。Caenorhabditis elegans克隆Y51F8,***测序正在进行之中***,30个非顺序片段。   小家鼠人人Caenorhabditis elegans有爪蟾蜍(Xenopus laevis)人人人人人黑腹果蝇黑腹果蝇Caenorhabditis elegans天蓝色链霉菌未知未知大肠杆菌大肠杆菌大肠杆菌黑腹果蝇黑腹果蝇Caenorhabditis elegans     41,56236,32137,28438,16336,04433,74233,74239,83339,83339,83336,85536,85536,76863,74338,85038,85054,82751,41651,41636,59236,59236,699     1997-12-2497-07-2397-07-2398-11-2397-07-301999-10-211999-10-2198-07-0998-07-0999-11-2399-09-2499-09-2499-02-241996-05-091998-12-0198-04-0399-04-2298-11-121995-12-0899-08-0299-08-0299-02-25
表4(续)
  rxa00880rxa00899rxa00902rxa00931rxa00941rxa00962rxa01060rxa01067rxa01114     196813891333969144068910478521347     GB_EST4:H22888GB_GSSI3:AQ426858GB_PRI:AB002335GB_BAl:NGU58849GB_BA1:PLPDHOSGB_BA1:PDGINTORFGB_GSS15:AQ606873GB_GSS9:AQ163442GB_PL1:PSST70GB_GSS1:FR0025208GB_GSS1:FR0021844GB_BA2:MSGKATGGB_BA1:MTCY180GB_BA1:MTCY180GB_GSS 12:AQ403344GB_HTG6:AC010998GB_GSS1:GGA340111GB_HTG6:AC010998GB_BA1:ECTTN7GB_IN2:AF176377GB_GSS10:AQ196728GB_BA1:U00016GB_BA1:SYCGROESLGB_BA1:D90905GB_BA1:PSEFAOAB     4685166289240131196747581658497461225217454420144201593144338990144338228082204294293132561394673480   H22888AQ426858AB002335U58849L06822L06418AQ606873AQ163442X69213AL018047AL014715L14268Z97193Z97193AQ403344AC010998AJ232089AC010998AJ001816AF176377AQ196728U00016D12677D90905D10390   ym54e12.r1 Soares婴儿脑INIB人cDNA克隆IMAGE:52158 5’,mRNA序列。CITBI-E1-2578F1.TFCITBI-E1人基因组克隆2578F1,基因组综述序列KIAA0337基因的人mRNA,完整编码区。淋病奈瑟氏球菌pilS6沉默毛(pilus)基因座。质粒pSa(来自大肠杆菌)二氢蝶酸合酶基因3’端。整合子In7(来自大肠杆菌的质粒pDGO100)整合酶(int)、氨基糖苷腺苷酸转移酶(aad)、季铵化合物抗性蛋白,二氢叶酸还原酶(dhfrX)和二氢蝶酸合酶(sull)基因。HS_5404_B2_H05_T7ARPCI-11人类男性BAC文库人基因组克隆平板=980列=10行=P,基因组综述序列。nbxb0007A07fCUGI水稻BAC文库稻基因组克隆nbxb0007A07f,基因组综述序列。热激蛋白的豌豆Psst70基因。F.rubripes GSS序列,克隆145D10aA8,基因组综述序列。F.rubripes GSS序列,克隆069K22aG5,基因组综述序列。HS_2257_BI_B03_T7C CIT批准的人类基因组***文库D人基因组克隆平板=2257列=5行=D,基因组综述序列。结核分枝杆菌H37Rv完整基因组;区段85/162。结核分枝杆菌H37Rv完整基因组;区段85/162。结核分枝杆菌乙基甲磺酸酯抗性蛋白(katG)基因,3’端。人克隆RP11-95I16,***测序正在进行之中***,17个非顺序片段。得自对2号染色体的粘粒作图的原鸡无名序列(粘粒34-重叠群15),基因组综述序列。人克隆RP11-95I16,***测序正在进行之中***,17个非顺序片段。大肠杆菌转座子Tn7包括2型整合子的左末端,Caenorhabditis briggsae CES-1(ces-1)基因,完整编码区;和CPN-1(cpn-1)基因,部分编码区。CIT-HSP-2381F4.TRCITHSP人基因组克隆2381F4,基因组综述序列。麻风分枝杆菌粘粒B1937。Synechocystis sp.groES和groEL基因。Synechocystis sp.PCC6803完整基因组,7/27,781449-920915。莓实假单胞菌faoA和faoB基因,完整编码区。   人人人淋病奈瑟氏球菌(Neisseria gonorhoeae)质粒pSa质粒pDGO100人稻(Oryza sativa)豌豆(Pisum sativum)Fugu rubripesFugu rubripes人结核分枝杆菌结核分枝杆菌结核分枝杆菌人原鸡(Gallus gallus)人大肠杆菌Caenorhabditis briggsae人麻风分枝杆菌Synechocystis sp.Synechocystis sp.莓实假单胞菌(Pseudomonas fragi)     37,17938,44735,79940,62338,96638,96637,90041,88536,86637,81537,69831,55237,90239,14042,51739,49737,97038,22638,82239,92139,01958,30334,59334,59351,919   95-07-061999-03-2499-02-1396-06-201996-03-201996-03-2099-06-1098-09-1296-07-031997-12-101997-12-101999-03-1398-06-1798-06-1799-08-261999-12-0898-08-251999-12-0897-11-041999-12-0998-09-161994-03-0199-02-0399-02-0799-02-02
表4(续)
rxa01136rxa01138rxa01172rxa01191rxa01205rxa01212rxa01219 5555401578171355410471005     GB_BA1:AB014757GB_BA1:SC8D9GB_EST11:AA244557GB_EST14:AA407673GB_EST26:AI390328GB_OV:XLXINT1GB_PR4:AC006054GB_PR4:AC006054GB_BA1:SCE39GB_BA1:MSU50335GB_BA1:BACTHRTRNAGB_PR2:HS1191B2GB_PR2:HS1191B2GB_BA1:MTCY373GB_PL1:ATY12776GB_PL2:ATT6K21GB_BA2:SCD25GB_BA1:SLGLYUBGB_BA1:SCH10GB_PAT:A68024GB_PAT:A68025GB_PAT:A68027     605738681379306604127814373814373823550519315467608286082835516384839964341622257639524520193193   AB014757AL035569AA244557AA407673AI390328X13138AC006054AC006054AL049573U50335D84213AL022237AL022237Z73419Y12776AL021889AL118514X65556AL049754A68024A68025A68027   假单胞菌61-3的PhbB、乙酰乙酰-CoA还原酶、β-酮硫解酶和PHB合酶的基因,完整编码区。天蓝色链霉菌粘粒8D9。mx07a01.r1 Soares小鼠NML小家鼠cDNA克隆IMAGE:679464 5’,mRNA序列。EST01834小鼠7.5dpc胚胎外胎盘锥体(cone)cDNA文库小家鼠cDNA克隆C0014F02 3’,mRNA序列。mx07a01.r1 Soares小鼠NML小家鼠cDNA克隆IMAGE:679464 5’,mRNA序列。有爪蟾蜍int-1蛋白的int-1 Mrna。人Xq28 BAC RPCI11-382P7(Roswell Park Cancer Institute人类BAC文库)完整序列。人Xq28 BAC RPCI11-382P7(Roswell Park Cancer Institute人类BAC文库)完整序列。天蓝色链霉菌粘粒E39。耻垢分枝杆菌噬菌体抗性(mpr)基因,完整编码区。枯草杆菌基因组,trnl-feuABC区。来自染色体22q13.2-13.3上的克隆1191B2的人DNA序列。含有BCL2相互作用杀伤物(诱导细胞凋亡)的BIK(NBK、BP4、BIP1)基因-40S核糖体蛋白S25假基因的一部分和类似于C.elegansC50D2.7的可变剪接新酰基转移酶基因的一部分。含有EST、STS、GSS、两个推定的CpG岛和基因组标记D22S1151,完整序列。来自染色体22q13.2-13.3上的克隆1191B2的人DNA序列。含有BCL2相互作用杀伤物(诱导细胞凋亡)的BIK(NBK、BP4、BIP1)基因-40S核糖体蛋白S25假基因的一部分和类似于C.elegansC50D2.7的可变剪接新酰基转移酶基因的一部分.含有EST、STS、GSS、两个推定的CpG岛和基因组标记D22S1151,完整序列。结核分枝杆菌H37Rv完整基因组;区段57/162。拟南芥DNA,40kb周围ACS1基因座。拟南芥DNA染色体4,BAC克隆T6K21(ESSA计划)。天蓝色链霉菌粘粒D25。浅青紫链霉菌tRNA-GlyUβ基因。天蓝色链霉菌粘粒H10。得自专利WO 9743409的序列19。得自专利WO 9743409的序列20。得自专利WO 9743409的序列22。   假单胞菌(Pseudomonas sp.)61-3天蓝色链霉菌小家鼠小家鼠小家鼠有爪蟾蜍人人天蓝色链霉菌耻垢分枝杆菌枯草杆菌人人结核分枝杆菌拟南芥拟南芥天蓝色链霉菌A3(2)浅青紫链霉菌(Streptomyces lividans)天蓝色链霉菌未鉴定的未鉴定的未鉴定的   50,57342,20039,05038,56233,13640,03837,99636,05362,35737,85353,80738,36639,59557,76232,97135,27339,65454,49344,63842,55343,22938,342   1998-12-2699-02-261997-03-1098-08-2699-02-021995-03-3199-04-0199-04-011999-03-3197-02-0199-02-0699-11-2399-11-2398-06-1798-09-0799-08-1699-09-211993-12-201999-05-041999-05-051999-05-051999-05-05
表4(续)
 rxa01220rxa01221rxa01222rxa01260rxa01261rxa01269rxa01291     120084982213052945641056   GB_PR3:HS512B11GB_EST6:N99239GB_EST16:AA554268GB_PR4:AF179633GB_VI:EHVU20824GB_BA2:AE000407GB_PAT:AP068625GB_B2:SSU51197GB_IN1:BBU44918GB_BA1:CGLPDGB_BA1:MTV038GB_PR3:AC005618GB_BA1:CGLPDGB_HTG4:AC010045GB_HTG4:AC010045GB_BA2:AF125164GB_BA1:AB002668GB_BA1:AB010415GB_STS:AU027820GB_STS:AU027820   643564244009637118442710601288042880427911800160941767141800164829164829264432490723112238238   AL031058N99239AA554268AF179633U20824AE000407AR068625U51197U44918Y16642AL021933AC005618Y16642AC010045AC010045AF125164AB002668AB010415AU027820AU027820   来自染色体6q24-25上的克隆512B11的人DNA序列。含有桥粒斑蛋白I(DPI)基因、EST、STS和GSS,完整序列。zb76h11.sl Soares_senescent_fibroblasts_NbHSF人cDNA克隆IMAGE:309573 3’,mRNA序列。nk36c09.sl NCI-CGAP_GC2人cDNA克隆IMAGE:1015600 3’,与gb:X01677肝(人类)甘油醛-3-磷酸脱氢酶相似;mRNA序列。人16号染色体图谱16q23.3-24.1序列。2型马疱疹病毒,完整基因组。大肠杆菌K-12MG1655完整基因组的区域297/400。得自专利US5854034的序列1。鞘氨醇单胞菌S88sphingan多糖合成(spsG)、(spsS)、(spsR)、糖基转移酶(spsQ)、(spsl)、糖基转移酶(spsK)、糖基转移酶(spsL)、(spsJ)、(spsF)、(spsD)、(spsC)、(spsE)、Urf32、Urf26、ATP结合盒转运蛋白(atrD)、ATP结合盒转运蛋白(atrB)、糖基-异戊二烯磷酸转移酶(spsB)、葡萄糖-1-磷酸胸苷酰基(thymidylyl)转移酶(rhsA)、dTDP-6-脱氧-D-葡萄糖-3,5-差向异构酶(rhsC)、dTDP-D-葡萄糖-4,6-脱水酶(rhsB)、dTDP-6-脱氧-L-甘露糖-脱氢酶(rhsD)、Urf31和Urf34基因,完整编码区。牛巴贝虫ATP结合蛋白(babc)mRNA,完整编码区。谷氨酸棒杆菌lpd基因,完整编码区。结核分枝杆菌H37Rv完整基因组;区段24/162。人5号染色体,BAC克隆249h5(LBNL H149),完整序列。谷氨酸棒杆菌lpd基因,完整编码区。黑腹果蝇染色体3L/75A1克隆RPCI98-17C17,***测序正在进行之中***,50个非顺序片段。黑腹果蝇染色体3L/75A1克隆RPCI98-17C17,***测序正在进行之中***,50个非顺序片段。脆弱拟杆菌638R多糖B(PS B2)生物合成基因座,完整序列;和未知基因。伴放线放线杆菌的糖基转移酶、裂解性糖基转移酶、dTDP-4-鼠李糖还原酶的DNA,完整编码区。伴放线放线杆菌6-脱氧-talan合成的基因簇,完整编码区。褐鼠,OTSUKA克隆,OT78.02/918b07,微卫星序列,序列标志位点。褐鼠,OTSUKA克隆,OT78.02/918b07,微卫星序列,序列标志位点。   人人人人2型马疱疹病毒大肠杆菌未知的鞘氨醇单胞菌(Sphingomonas sp.)S88牛巴贝虫(Babesia bovis)谷氨酸棒杆菌结核分枝杆菌人谷氨酸棒杆菌黑腹果蝇黑腹果蝇脆弱拟杆菌(Bacteroides fragilis)伴放线放线杆菌(Actinobacillusactinomycetemcomitans)伴放线放线杆菌褐鼠(Rattus norvegicus)褐鼠   35,47839,62336,11140,19937,00139,47140,57440,57439,22899,92359,05636,270100,00050,51250,51256,07146,67946,67934,87434,874   99-11-2396-08-2097-09-0899-09-0596-02-0298-11-1299-09-291996-05-1697-08-0999-02-0198-06-1798-09-0599-02-011999-10-161999-10-161999-12-0198-02-2199-02-131999-03-021999-03-02
表4(续)
GB_BA2:AF030975 2511 AF030975   区。杀鲑气单胞菌伴侣蛋白GroES和伴侣蛋白GroEL基因,完整编码区。   (Aeromonas salmonicida)杀鲑气单胞菌 38,171 98-04-02
表4(续)
rxa01580rxa01584rxa01604rxa01614rxa01629rxa01644rxa01667rxa01722 84077111461635140113291848     GB_EST22:AI068560GB_GSS14:AQ554460GB_IN2:AC005449GB_IN2:AC005449GB_HTG3:AC011352GB_HTG3:AC011352GB_HTG3:AC01 1402GB_BA1:CGA224946GB_EST17:AA608825GB_PR4:AC005377GB_BA1:CGPROPGENGB_BA1:CGPROPGENGB_PR4:AF191071GB_BA1:MSGB577COSGB_BA1:MLCB2407GB_BA1:MTV025GB_BA1:CGU43536GB_HTG4:AC009841GB_HTG4:AC009841GB_GSS1:FR0022586GB_GSS1:FR0022584GB_IN1:CET26H2     9656818551885518160167160167168868240843910231129362936884813777035615121125346416443416443452248537569   AI068560AQ554460AC005449AC005449AC011352AC011352AC011402AJ224946AA608825AC005377Y12537Y12537AF191071L01263AL023596AL022121U43536AC009841AC009841AL015452AL015450Z82055   mgae0003aC11fMagnaporthe grisea附着器阶段cDNA文库Pyricularia grisea cDNA克隆mgae0003aC11f5’,mRNA序列。RPCI-11-419F2.TV RPCI-11人基因组克隆RPCI-11-419F2,基因组综述序列。黑腹果蝇,染色体2R,区域44C4-44C5,P1克隆DS06765,完整序列。黑腹果蝇,染色体2R,区域44C4-44C5,P1克隆DS06765,完整序列。人5号染色体克隆CIT-HSPC_327F10,***测序正在进行之中***,15个非顺序片段。人5号染色体克隆CIT-HSPC_327F10,***测序正在进行之中***,15个非顺序片段。人5号染色体克隆CIT978SKB_38B5,***测序正在进行之中***,7个非顺序片段。谷氨酸棒杆菌L-苹果酸:醌氧化还原酶的DNA。af03g07.sl Soares_testis_NHT人cDNA克隆IMAGE:1030620 3’,与TR:G976083 G976083 HISTONE H2A相关;mRNA序列。来自7q32-q34的人PAC克隆DJ1136G02,完整序列。谷氨酸棒杆菌proP基因谷氨酸棒杆菌proP基因人8号染色体克隆BAC 388D06,完整序列。麻风分枝杆菌基因组dna序列,粘粒b577。麻风分枝杆菌粘粒B2407。结核分枝杆菌H37Rv完整基因组;区段155/162。谷氨酸棒杆菌热激、ATP结合蛋白(clpB)基因,完整编码区。黑腹果蝇染色体3L/77E1克隆RPCI98-13F11,***测序正在进行之中***,70个非顺序片段。黑腹果蝇染色体3L/77E1克隆RPCI98-13F11,***测序正在进行之中***,70个非顺序片段。F.rubripes GSS序列,克隆077P23aB10,基因组综述序列。F.rubripes GSS序列,克隆077P23aB11,基因组综述序列。Caenorhabditis elegans粘粒T26H2,完整序列。   Pyricularia grisea人黑腹果蝇黑腹果蝇人人人谷氨酸棒杆菌人人谷氨酸棒杆菌谷氨酸棒杆菌人麻风分枝杆菌麻风分枝杆菌结核分枝杆菌谷氨酸棒杆菌黑腹果蝇黑腹果蝇Fugu rubripesFugu rubripesCaenorhabditis elegans  40,07336,52236,60933,61233,68833,68833,68842,28440,09237,811100,000100,00035,61255,60436,41655,844100,0003,20533,20540,1925,8764,759     1999-12-091999-05-281998-12-231998-12-231999-10-061999-10-061999-10-0698-08-111998-03-0299-04-2898-11-1798-11-171999-10-1196-06-1499-08-2799-06-241997-03-131999-10-161999-10-161997-12-101997-12-1099-11-19
表4(续)
  rsa01727rxa01737txa01762rxa01764rxa01801rxa01823rxa01853rxa01881   14011182165910561140900675558   GB_BA2:CORCSLYSGB_HTG6:AC011037GB_HTG6:AC011037GB_BA1:SCGD3GB_HTG1:CNSO1DSBGB_HTG1:CNSO1DSBGB_BA1:MTC128GB_BA1:SC6G10GB_BA1:SCE29GB_PL2:SPAC343GB_PL2:SPAC343GB_EST38:AW066306GB_GSS13:AQ484750GB_GSS13:AQ489971GB_BA1:SCI51GB_BA1:ECU82598GB_BA1:BSUB0018GB_BA1:MTCY227GB_HTG3:AC010189GB_HTG3:AC010189GB_HTG4:AC011117GB_HTG4:AC011117GB_BA1:MTCY2B12   28211678491678493377922219322219336300367342647742947429473343752524074513674220951O3594626596226596214844714844720431   M89931AC011037AC011037AL096822AL121768AL121768Z97050AL049497AL035707AL109739AL109739AW066306AQ484750AQ489971AL109848U82598Z99121Z77724AC010189ACO1O189ACO11117AC011117Z81011   谷氨酸棒杆菌βC-S裂合酶(aeeD)和支链氨基酸摄入载体(brnQ)基因,完整编码区,和假定的蛋白Yhbw(yhbw)基因,部分编码区。人克隆RP11-7F18,WORKING DRAFT SEQUENCE,19个非顺序片段。人克隆RP11-7F18,WORKING DRAFT SEQUENCE,19个非顺序片段。天蓝色链霉菌粘粒GD3。人14号染色体克隆R-976B16,***测序正在进行之中***,为顺序片段。人14号染色体克隆R-976B16,***测序正在进行之中***,为顺序片段。结核分枝杆菌H37Rv完整基因组;区段10/162。天蓝色链霉菌粘粒6G10。天蓝色链霉菌粘粒E29。粟酒裂殖酵母I染色体粘粒c343。粟酒裂殖酵母I染色体粘粒c343。687009D03.y1 687-来自Delaware玉蜀黍早期胚cDNA,mRNA序列。RPCI-11-248N4.TV RPCI-11人基因组克隆RPCI-11-248N4,基因组综述序列。RPCI-11-247N23.TV RPCI-11人基因组克隆RPCI-11-247N23,基因组综述序列。天蓝色链霉菌粘粒I51。大肠杆菌的第9-12分钟的基因组序列。枯草杆菌完整基因组(区域18/21):3399551-3609060。结核分枝杆菌H37Rv完整基因组;区段114/162。人克隆RPCI11-296K13,***测序正在进行之中***,80个非顺序片段。人克隆RPCI11-296K13,***测序正在进行之中***,80个非顺序片段。人4号染色体克隆173_C_09 map 4,***测序正在进行之中***,10个顺序片段。人4号染色体克隆173_C_09 map 4,***测序正在进行之中***,10个顺序片段。结核分枝杆菌H37Rv完整基因组:区段61/162。 谷氨酸棒杆菌人人天蓝色链霉菌人人结核分枝杆菌天蓝色链霉菌天蓝色链霉菌粟酒裂殖酵母(Schizosaccharomyces pombe)粟酒裂殖酵母玉蜀黍人人天蓝色链霉菌A3(2)大肠杆菌枯草杆菌结核分枝杆菌人人人人结核分枝杆菌   99,92936,90335,64238,05435,14735,14749,57444,04940,24637,08434,89046,10832,00036,11135,77939,21136,99937,61239,00639,00639,13039,13037,893   98-06-0499-11-3099-11-3099-07-081999-1O-051999-10-0598-06-231999-03-241999-03-1299-09-0699-09-061999-10-1299-04-2499-04-2499-08-1697-01-1597-11-2698-06-1799-09-1699-09-161999-1O-141999-10-1498-06-18
表4(续)
  rxa01894rxa01897rxa01946rxa01980rxa01983rxa02020rxa02029   978666129875663011111437  GB_BA1:MTCY274GB_IN1:CELF46H5GB_HTG3:AC009204GB_HTG1:CEY48B6GB_HTG1:CEY48B6GB_HTG1:CEY53F4_2GB_BA1:MTV007GB_BA1:SC5F2AGB_BA1:SCARD1GNGB_PL2:AC008262GB_PL1:AB013388GB_PL1:AB013388GB_HTG4:AC006467GB_HTG4:AC006467GB_HTG4:AC006467GB_BA1:CGDNAAROPGB_PAT:A58887GB_BA1:STYCARABAGB_HTG2:AC003023GB_HTG2:AC003023GB_HTG2:HS118B18  399913888611563329382729382711000032806401052321996987342873428175695175695175695261216124378104768104768104729   Z74024U41543AC009204AL021151AL021151Z92860AL021184AL049587X84374AC008262AB013388AB013388AC006467AC006467AC006467X85965A58887M95047AC003023AC003023AL034344   结核分枝杆菌H37Rv完整基因组;区段128/162。Caenorhabditis elegans粘粒F46H5。黑腹果蝇2号染色体克隆BACR03E19(D1033)RPCI-98 03.E.19map 36E-37C strain y;cn bw sp,***测序正在进行之中***,94个非顺序片段。Caenorhabditis elegans II染色体克隆Y48B6,***测序正在进行之中***,为非顺序片段。Caenorhabditis elegans II染色体克隆Y48B6,***测序正在进行之中***,为非顺序片段。Caenorhabditis elegans II染色体克隆Y53F4,***测序正在进行之中***,为非顺序片段。结核分枝杆菌H37Rv完整基因组;区段64/162。天蓝色链霉菌粘粒5F2A。缠绕链霉菌ardl基因。来自1号染色体的拟南芥BAC F4N2的基因组序列,完整序列。拟南芥基因组DNA,5号染色体,TAC克隆:K19E1,完整序列。拟南芥基因组DNA,5号染色体,TAC克隆:K19E1,完整序列。黑腹果蝇2号染色体克隆BACR03L08(D532)RPCI-98 03.L.8 map40A-40C strain y;cn bw sp,***测序正在进行之中***,9个非顺序片段。黑腹果蝇2号染色体克隆BACR03L08(D532)RPCI-98 03.L.8 map40A-40C strain y;cn bw sp,***测序正在进行之中***,9个非顺序片段。黑腹果蝇2号染色体克隆BACR03L08(D532)RPCI-98 03.L.8 map40A-40C strain y;cn bw sp,***测序正在进行之中***,9个非顺序片段。谷氨酸棒杆菌ORF3和aroP基因。得自专利WO9701637的序列1。鼠伤寒沙门氏菌转运蛋白,完整编码区和转移RNA-Arg。人11号染色体克隆pDJ363p2,***测序正在进行之中***,22个非顺序片段。人11号染色体克隆pDJ363p2,***测序正在进行之中***,22个非顺序片段。人6号染色体克隆RP1-118B18 map p24.1-25.3,***测序正在进行之中***,为非顺序片段。 结核分枝杆菌Caenolhabditis elegans黑腹果蝇Caenorhabditis elegansCaenodlabditis elegansCaenorhabdibditis elegans结核分枝杆菌天蓝色链霉菌缠绕链霉菌拟南芥拟南芥拟南芥黑腹果蝇黑腹果蝇黑腹果蝇谷氨酸棒杆菌未鉴定的鼠伤寒沙门氏菌(Salmonella typhimurium)人人人     37,22938,52531,57934,70334,70333,33365,56050,64844,97335,31035,50539,97336,67236,67232,367100,000100,00050,54735,82035,82034,55   98-06-1996-11-2999-08-1899-04-0199-04-0199-10-1598-06-171999-05-2495-08-2399-08-2199-11-2099-11-201999-10-271999-10-271999-10-2797-11-301998-03-061996-03-131997-10-211997-10-211999-12-03
表4(续)
  rxa02030rxa02073rxa02074rxa02095rxa02099rxa02115rxa02128rxa02133   15091653152737311971818329   GB_PR4:AC007695GB_PR4:AC006464GB_PR4:AC006464GB_BA1:CGGDHAGB_BA1:CGGDHGB_BA2:SC2H4GB_EST18:AA703380GB_HTG6:AC009769GB_EST7:W70175GB_BA1:CAJ10319GB_HTG3:AC011509GB_HTG3:AC011509GB_HTG5:AC010126GB_HTG5:AC010126GB_PR1:HUMHM145CaB_BA1:MTCY190CaB_BA1;MTCY190GB_GSS10:AQ161109GB_BA2:MPAE000058GB_HTG4:AC008308   632479990899908203720372597047112291143653681113531113531759861759862214341503415073828530151373   AC007695AC006464AC006464X72855X59404AL031514AA703380AC009769W70175AJ010319AC011509AC011509AC010126AC010126D10925Z70283Z70283AQ161109AE000058AC008308   人12q24BAC RPC111-124N23(Roswell Park Cancer Institute人BAC文库)完整序列。来自2的人BAC克隆NH0436C12,完整序列来自2的人BAC克隆NH0436C12,完整序列谷氨酸棒杆菌GDHA基因谷氨酸棒杆菌,谷氨酸脱氢酶的gdh基因天蓝色链霉菌粘粒2H4。zj12b06.sl Soares_fetal-liver_spleen_1NFLS_S1人cDNA克隆IMAGE:4500353’,类似于含有LTR5.t3 LTR5重复元件;mRNA序列。人8号染色体克隆RP11-202I12 map 8,低通序列采样(LOW-PASSSEQUENCE SAMPLING)。zd52c02.rl Soares_fetal_heart_NbHH19W人cDNA克隆IMAGE:3442585’,类似于含有LTR5.b2 LTR5重复元件;mRNA序列。谷氨酸棒杆菌amtP、glnB、glnD基因和部分ftsY和srp基因。人19号染色体克隆CTTB-H1_2189E23,***测序正在进行之中***,35个非顺序片段。人19号染色体克隆CTTB-H1_2189E23,***测序正在进行之中***,35个非顺序片段。人克隆GS502802,***测序正在进行之中***,3个非顺序片段。人克隆GS502B02,***测序正在进行之中***,3个非顺序片段。人HM145的mRNA。结核分枝杆菌H37Rv完整基因组;区段98/162。结核分枝杆菌H37Rv完整基因组;区段98/162。nbxb0006D03r CUGI水稻BAC文库稻基因纽克隆nbxb0006D03r,基因组综述序列。肺炎支原体完整基因组的区域58/63。黑腹果蝇3号染色体克隆BACR10M16(D743)RPCI-98 10.M.16map93C-93D strainy;cn bw sp,***测序正在进行之中***,186个非顺序片段。   人人人谷氨酸棒杆菌谷氨酸棒杆菌天蓝色链霉菌A3(2)人人人谷氨酸棒杆菌人人人人人结核分枝杆菌结核分枝杆菌稻肺炎支原体(Mycoplasma pneumoniae)黑腹果蝇     38,68135,44535,96839,65544,44438,45236,51835,47334,174100,00033,42333,42336,71736,09239,17138,68235,74638,48232,31734,579   99-09-011999-10-221999-10-221993-05-2499-07-301999-10-191997-12-241999-12-071996-10-161999-05-141999-10-071999-10-0799-11-1399-11-1399-02-0398-06-1798-06-1798-09-1296-11-181999-10-20
表4(续)
txa02150rxa02171rxa02173rxa02224rxa02225rxa02233rxa02253 92417761575192090514101050   GB_HTG4:AC008308GB_EST37:AW012260GB_GSS3:B87734GB_PR4:AC005042GB_BA2:AF010496GB_EST24:AI170522GB_PL1:PHVDLECAGB_BA1:CGGLTGGB_BA1:CGGLTGGB_BA2:AE000104GB_BA2:CXU21300GB_HTG3:AC009185GB_HTG3:AC009185GB_BA2:MPAE000058GB_EST26:AI337275GB_EST26:AB37275GB_BA1:ERWPNLBGB_EST30:AV021947GB_EST33:AV087117GB_EST11:AA250210GB_EST11:AA250210   1513733581922183891893703671441301330131014689908718487184285306186181291313251532532   AC008308AW012260AC005042B87734AF010496A1170522K03288X66112X66112AE000104U21300AC009185AC009185AE000058AI337275AI337275M65057AV021947AV087117AA250210AA250210   黑腹果蝇3号染色体克隆BACR10M16(D743)RPCI-98 10.M.16map93C-93D strain y;cn bw sp,***测序正在进行之中***,186个非顺序片段。um06e09.yl Sugano小鼠肾mkia小家鼠cDNA克隆IMAGE:21823125’,与SW:AMPL_BOVINP00727胞质氨基肽酶相似;mRNA序列。RPCIll-30D24.TPRPCI-11人基因组克隆RPCI/-11-30D24,基因组综述序列。人克隆NH0552E01,完整序列。夹膜红细菌菌株SB1003,部分基因组。EST216450正常化大鼠肺,Bento Soares鼠(Rattus 8p.)cDNA克隆RLUC0753’端,mRNA序列。编码红细胞凝集性植物凝集素(PHA-E)的菜豆植物凝集素基因,完整编码区。谷氨酸棒杆菌的柠檬酸合酶的glt基因和ORF。谷氨酸棒杆菌的柠檬酸合酶的glt基因和ORF。根瘤菌NGR234的质粒pNGR234a,完整质粒序列的区域41/46。纹带棒杆菌的假定蛋白YbhB基因,部分编码区;ABC转运蛋白TetB(tetB)、ABC转运蛋白TetA(tetA)、转座酶、23S rRNA甲基转移酶和转座酶基因,完整编码区;和未知基因。人5号染色体克隆CIT-HSPC 248O19,***测序正在进行之中***,2个顺序片段。人5号染色体克隆CIT-HSPC 248O19,***测序正在进行之中***,2个顺序片段。肺炎支原体完整基因组的区域58/63。tb96h11.xl NCI_CGAP_C016人cDNA克隆IMAGE:20622453’,与TR:Q15392 Q15392 ORF相似,完整编码区;mRNA序列。tb96h11.xl NCI_CGAP_Co16人cDNA克隆IMAGE:20622453’,与TR:Q15392 Q15392 ORF相似,完整编码区;mRNA序列。胡萝卜软腐欧文氏菌果胶裂合酶(pnl)基因,完整编码区。AV021947小家鼠18日胚胎C57BL/6J小家鼠cDNA克隆1190024M23,mRNA序列。AV087117小家鼠舌C57BL/6J成年小家鼠cDNA克隆2310028C15,mRNA序列。mx79g10.rl Soares小鼠NML小家鼠cDNA克隆IMAGE:6926105’,与TR:E236517E236517F44G4.1相似;mRNA序列。mx79g10.rl Soares小鼠NML小家鼠cDNA克隆IMAGE:6926lO5’,与TR:E236517E236517F44G4.1相似;mRNA序列。   黑腹果蝇小家鼠人人夹膜红细菌鼠(Rattus sp.)菜豆(Phaseolus vulgaris)谷氨酸棒杆菌谷氨酸棒杆菌根瘤菌(Rhizobium sp.)NGR234纹带棒杆菌(corynebacterium striatum)人人肺炎支原体人人胡萝卜软腐欧文氏菌(Erwinia carotovora)小家鼠小家鼠小家鼠小家鼠   34,57939,38537,62936,90153,71444,18639,10344,11836,18938,48737,26436,45936,45935,49835,58942,78637,78039,42347,41036,13636,202   1999-10-2099-09-1099-04-0999-01-141998-05-1299-01-2093-04-2795-02-1795-02-171997-12-1299-04-091999-10-071999-10-0796-11-181999-03-181999-03-1893-04-2699-08-2899-06-251997-03-121997-03-12
表4(续)
  rxa02261rxa02268rxa02269rxa02309rxa02310rxa02321rxa02335rxa02364     1479102310951173138617521896750     GB_BA1:CGL007732GB_BA1:CGAMTGENEGB_BA1:CORPEPCGB_PL2:AF087130GB_EST30:AI663709GB_RO:AF074714GB_GSS4:AQ742825GB_HTG3:AC009293GB_HTG3:AC009293GB_BA1:MTY25D10GB_BA1:MSGY224GB_HTG2:AC007163GB_BA1:MTY25D10GB_BA1:MSGY224GB_PR3:HS279N11GB_BA1:AB018531GB_PAT:E17019GB_BA1:AB018530GB_BA1:CGU35023GB_BA1:U00012GB_BA1:MTCY71GB_BA1:AP000006GB_BA1:AP000006   446020284885347840831208471629441629444083840051186618408384005116999849614961285531953331242729319000319000   AJ007732X93513M25819AF087130AI663709AF074714AQ742825AC009293AC009293Z95558AD000004AC007163Z95558AD000004Z98255AB018531E17019AB018530U35023U00012Z92771AP00006AP00006 谷氨酸棒杆菌3’ppc基因、secG基因、amt基因、ocd基因和5’soxA基因。谷氨酸棒杆菌amt基因。谷氨酸棒杆菌磷酸烯醇丙酮酸羧化酶基因,完整编码区。粗糙脉孢霉铁载体调节蛋白(sre)基因,完整编码区。ud47a06.yl Soares小鼠乳腺NbMMG小家鼠cDNA克隆IMAGE:1449010 5’,与TR:O75585促细胞***原活化的和应激活化蛋白激酶-2;mRNA序列。小家鼠促细胞***原活化的和应激活化的蛋白激酶-2(mMSK2)mRNA,完整编码区。HS_5482_B2_A04_T7APCRI-11人类男性BAC文库人基因组克隆平板=1058列=8行=B,基因组综述序列。人18号染色体克隆53_I_06 map 18,***测序正在进行之中***,15个非顺序片段。人18号染色体克隆53_I_06 map 18,***测序正在进行之中***,15个非顺序片段。结核分枝杆菌H37Rv完整基因组;区段28/162。来自克隆y224的结核分枝杆菌序列。人克隆NH0091M05,***测序正在进行之中***,1个非顺序片段。结核分枝杆菌H37Rv完整基因组;区段28/162。来自克隆y224的结核分枝杆菌序列。来自PAC 279N11的染色体Xq11.2-13.3上的人DNA序列。谷氨酸棒杆菌dtsR1和dtsR2基因,完整编码区。乳发酵短杆菌dtsR和dtsR2基因。谷氨酸棒杆菌dtsR基因,完整编码区。谷氨酸棒杆菌硫代硫酸硫转移酶(thtR)基因,部分编码区,酰基CoA羧化酶(accBC)基因,完整编码区。麻风分枝杆菌粘粒B1308。结核分枝杆菌H37Rv完整基因组;区段141/162。Pyrococcus horikoshii OT3基因组DNA,1166001-1485000nt.位置(6/7)。Pyrococcus horikoshii OT3基因组DNA,1166001-1485000 nt.位置(6/7)。 谷氨酸棒杆菌谷氨酸棒杆菌谷氨酸棒杆菌粗糙脉孢霉(Neurospora crassa)小家鼠小家鼠人人人结核分枝杆菌结核分枝杆菌人结核分枝杆菌结核分枝杆菌人谷氨酸棒杆菌谷氨酸棒杆菌谷氨酸棒杆菌谷氨酸棒杆菌麻风分枝杆菌结核分枝杆菌Pyrococcus horikoshiiPyrococcus horikoshii   100,000100,000100,00039,26841,52338,34737,70337,00637,00652,34452,34437,26336,86136,86134,51699,03098,97399,03099,94740,24767,56836,13034,543   99-01-071996-05-291995-12-151998-10-221999-05-101998-10-2499-07-1699-08-1399-08-1398-06-171996-12-0399-04-2398-06-171996-12-0399-11-231998-10-1999-07-281998-10-1997-01-1696-01-3099-02-1099-02-0899-02-08
表4(续)
  rxa02372rxa02397rxa02424rxa02426rxa02487rxa02511rxa02512rxa02527   201O11197231656182778010861452   GB_HTG3:AC011461GB_HTG3:AC01146lGB_EST21:AA992021GB_HTG4:AC009273GB_HTG4:AC009273GB_BA1:D90826GB_EST13:AA334108GB_PR3:AC005224GB_PR3:AC005224GB_PAT:A06664GB_PAT:A04115GB_BA1:BACLDHLGB_BA2:AF007101GB_BA1:MTCI364GB_BA2:AF119621GB_PR4:AC002470GB_PR4:AC002472GB_EST34:A1806938GB_BA1:MTCYlA10GB_BA1:MLCL581GB_OV:GGU43396GB_BA2:AF008220   10097410097427976175761751949327516668716668713501361136132870295401598623539514710011825949362252738220060   AC011461AC011461AA992021AC009273AC009273D90826AA334108AC005224AC005224A06664A04115M14788AF007101Z93777AF119621AC002470AC002472AI806938Z95387Z96801U43396AF008220   人19号染色体克隆CIT-HSPC_429L19,***测序正在进行之中***,4个顺序片段。人19号染色体克隆CIT-HSPC_429L19,***测序正在进行之中***,4个顺序片段。ot36c01.sl Soares_testis_NHT人cDNA克隆IMAGE:16188483’,mRNA序列。拟南芥1号染色体克隆T1N6,***测序正在进行之中***,2个顺序片段。拟南芥1号染色体克隆T1N6,***测序正在进行之中***,2个顺序片段。大肠杆菌基因组DNA,Kohara克隆#335(40.9-41.3分钟)。EST38262胚胎,9周人cDNA5’端,mRNA序列。人17号染色体,克隆hRPK.214_O_1,完整序列。人17号染色体,克隆hRPK214_O_1,完整序列。嗜热脂肪芽孢杆菌lct基因。嗜热脂肪芽孢杆菌重组lct基因。嗜热脂肪芽孢杆菌编码L-乳酸脱氢酶的lct基因,完整编码区。吸水链霉菌推定的蝶啶依赖性双加氧酶、PKS组件1、2、3和4以及推定的调节蛋白基因的完整编码区以及推定的羟化酶基因部分编码区。结核分枝杆菌H37Rv完整基因组;区段52/162。Pseudomonas abietaniphila BKME-9DitI(ditI)、双加氧酶DitA加氧酶组分小亚基(ditA2)、双加氧酶DitA加氧酶组分大亚基(ditA1)、DitH(ditH)、DitG(ditG)、DitF(ditF)、DitR(ditR)、DitE(ditE)、DitD(ditD)、芳香双萜类化合物外二醇(extradiol)环切割双加氧酶(ditC)、DitB(ditB)和双加氧酶DitA铁氧还蛋白组分(ditA3)基因,完整编码区;以及未知基因。人染色体22q11.2BAC克隆b135h6的BCRL2-GGT区,完整序列。人染色体22q11.2PAC克隆p_n5的BCRL2-GGT区,完整序列。wf24b07.xl Soares_NFL_T_GBC_S1人cDNA克隆IMAGE:23565013’,与SW:PLZF_HUMAN Q05516锌指蛋白PLZF相似;mRNA序列。结核分枝杆菌H37Rv完整基因组;区段117/162。麻风分枝杆菌粘粒L581。原鸡原肌球蛋白受体激酶A(ctrkA)mRNA,完整编码区。枯草杆菌rrnB-dnaB基因组区。   人人人拟南芥拟南芥大肠杆菌人人人嗜热脂肪芽孢杆菌(Bacillusstearothennophilus)合成构建体嗜热脂肪芽孢杆菌吸水链霉菌(Streptomyces hygrosecopieus)结核分枝杆菌Pseudomonas abietaniphila人人人结核分枝杆菌麻风分枝杆菌原鸡枯草杆菌     36,13836,13841,21938,56638,56639,60038,60336,11133,42739,93640,04240,33843,29844,35243,61137,97138,23938,98337,40743,19338,78937,395   1999-10-071999-10-0798-06-031999-10-121999-10-121997-03-2197-04-2198-08-1498-08-1493-07-2997-02-1793-04-2698-01-1398-06-1799-04-2899-11-3099-09-1399-07-0798-06-1797-06-2496-01-1898-02-04
表4(续)
rxa02547rxa02566rxa02571txa02578rxa02581txa02582rxa02583rxa02599 2262133211521227198349531671600   GB_BA2:AF008220GB_HTG2:AC005861GB_PL1:AB006530GB_PL1:CNASAGB_PL1:AB006530GB_EST32:AI727189GB_BA1:CGPUTPGB_PL2:SPAC13G6GB_BA1:CGU43535GB_EST35:AI857385GB_BA1:CGU43535GB_PL1:AB016871GB_PL1:AB025602GB_IN1:CELF36H9GB_BA1:MTV005GB_BA1:MTV005GB_BA1:MTV026GB_BA1:MTCY338GB_BA1:SEERYABSGB_BA2:AF113605GB_BA1:SC1C2GB_BA1:ABOl8531GB_BA1:AEMML  22006011236973445729734461937913348125314882531791095579035985378403784023740293722044415934221049612585   AF008220AC005861AB006530D85624AB006530AI727189Y09163Z54308U43535AI857385U43535ABOl687lAB025602AF016668AL010186AL010186AL022076Z74697X62569AF113605AL031124AB018531X99639 枯草杆菌mnB-dnaB基因组区。拟南芥克隆F23824,***测序正在进行之中***,6个非顺序片段。西瓜丝氨酸乙酰基转移酶的Sat基因,完整编码区和5’侧翼区。西瓜(Citrullus vulgaris)丝氨酸乙酰基转移酶的(sat)DNA,完整编码区。西瓜丝氨酸乙酰基转移醇的Sat基因,完整编码区和5’侧翼区。BNLGHi74986日棉花纤维陆地棉与(AB020715)KIAA0908蛋白[人]相似的cDNA5’,mRNA序列。谷氨酸棒杆菌putP基因。粟酒裂殖酵母I染色体粘粒c13G6。谷氨酸棒杆菌多种药物抗性蛋白(cmr)基因,完整编码区。w155e03.xl NCI_CGAP_Brn25人cDNA克隆IMAGE:24288283’,mRNa序列。谷氨酸棒杆菌多种药物抗性蛋白(cmr)基因,完整编码区。拟南芥基因组DNA,5号染色体,TAC克隆:K16L22,完整序列。拟南芥基因组DNA,5号染色体,BAC克隆:F14A1,完整序列。Caenorhabditis elegans粘粒F36H9。结核分枝杆菌H37Rv完整基因组;区段51/162。结核分枝杆菌H37Rv完整基因组;区段51/162。结核分枝杆菌H37Rv完整基因组;区段157/162。结核分枝杆菌H37Rv完整基囡组;区段127/162。红色糖多孢菌6-脱氧etythronolydeB合酶II和III的eryA基因。天蓝色链霉菌丙酰-CoA羧化酶复合体B亚基(pccB)基因,完整编码区。天蓝色链霉菌粘粒IC2。谷氨酸棒杆菌dtsR1和dtsR2基因,完整编码区。Ralstonia eutropha mmlH、mmlI和mmlJ基因。 枯草杆菌拟南芥西瓜(citrullus lanatus)西瓜(Cittullus lanatus)西瓜(Citrallus lanatus)陆地棉(Gossypium hirsutum)谷氨酸棒杆菌粟酒裂殖酵母谷氨酸棒杆菌人谷氨酸棒杆菌拟南芥拟南芥Caenorhabditis elegans结核分枝杆菌结核分枝杆菌结核分枝杆菌结核分枝杆菌红色糖多孢菌(Sacaharopolyspora erythraea)天蓝色链霉菌天蓝色链霉菌谷氨酸棒杆菌Ralstonla eutropha     36,21838,40735,44935,44934,64635,09938,56235,77441,87239,13938,55234,21336,46135,97738,51739,17338,54846,26345,05358,39752,91658,80935,264   98-02-0499-04-2997-08-2099-02-0697-08-2099-06-1197-09-081999-10-1897-04-0999-08-2697-04-0999-11-2099-11-2097-08-0898-06-1798-06-1799-06-2498-06-1792-02-281999-12-0899-01-151998-10-1998-01-22
表4(续)
rxa02634rxa02638rxa02659rxa02676rxa02677rxa02691rxa02718 173499933515128829301170   GB_EST15:AA508926GB_BA1:AEMMLGB_BA1:SYNPOOGB_GSS9:AQ101527GB_IN1:MNE133341GB_BA2:AE001756GB_GSS12:AQ423878GB_HTG2:AC006765GB_EST36:AI900317GB_GSS12:AQ342831GB_EST36:AI900856GB_IN2:CELB0213GB_GSS1:CNS00PZBGB_RO:RNITPR2RGB_RO:D89728GB_GSS8:AQ062004GB_GSS14:AQ555818GB_IN1:DME9736GB_PR4:AC004801GB_PR4:AC004801GB_EST34:AV132028GB_GSS10:AQ240654GB_GSS11:AQ309500   4222585196418439910938689274498436683779391343641070850023624627411193561193561258452576     AA508926X99639X17439AQ101527AJ133341AE001756AQ423878AC006765AI900317AQ342831MI900856AF039050AL085157X61677D89728AQ062004AQ555818AJ009736AC004801AC004801AV132028AQ240654AQ309500 MBAFCW1C8T3马来丝虫雌性成虫cDNA(SAW96MLW-BmAF)马来丝虫cDNA克隆AFCW1C08 5’,mRNA序列。Ralstonia eutropha mmlH、mmlI和mmlJ基因。Synechocystis NDH-C、PSII-G的ndhC、psbG基因和ORF157。HS_2265_A1_E11_MFCIT批准的人类基因组***文库D人基因组克隆平板=2265列=21行=I,基因组综述序列。Melarhaphe neritoides部分caM基因,外显子1-2。Thermotoga maritima完整基因组的区域68/136。CITBI-E1-2575E20.TF CITBI-E1人基因组克隆2575E20,基因组综述序列。Caenorhabditis elegans克隆Y43H11,***测序正在进行之中***,  7个非顺序片段。sc04a02.yl Gm-c1012大豆cDNA克隆基因组***克隆(GENOMESYSTEMS CLONE)ID:Gm-c1012-1155 5’,与SW:PRS6_SOLTUP54778 26S蛋白酶调节亚基6B同系物相似;mRNA序列。RPCI11-122K17.TJRPCI-11人基因组克隆RPCI-11-122K17,基因组综述序列。sb95c11.yl Gm-c1012大豆cDNA克隆基因组***克隆ID:Gm-c1012-429 5’,与SW:PRS6_SOLTU P54778 26S蛋白酶调节亚基6B同系物相似;mRNA序列。Caenorhabditis elegans粘粒系B0213。来自拟南芥哥伦比亚品系的IGF文库BAC F10D11的拟南芥基因组综述序列SP6末端,基因组综述序列。大鼠2型肌醇三磷酸受体的ITPR2基因。小家鼠LOK的mRNA,完整编码区。CIT-HSP-2346O14.TRCIT-HSP人基因组克隆2346O14,基因组综述序列。HS_5230_B1_G06_SP6ERPCI-11人类男性BAC文库人基因组克隆平板=806列=11行=N,基因组综述序列。黑腹果蝇Idefix反转录元件(retroelement):gag、pol和env基因,部分的。人12q13.1 PACRPCI1-228P16(Roswell Park Cancer Institute人类PAC文库)完整序列。人12q13.1 PAC RPCI1-228P16(Roswell Park Cancer Institute人类PAC文库)完整序列。AV132028小家鼠C57BL/6J 11天胚胎小家鼠cDNA克隆2700087F01,mRNA序列。CIT-HSP-2385D24.TFB.1 CIT-HSP人基因组克隆2385D24,基因组综述序列。CIT-HSP-2384D24.TFD CIT-HSP人基因组克隆2384D24,基因组综 马来丝虫(Brugia malayi)Ralstonia eutrophaSynechocystis PCC6803人Melarhaphe neritoidesThermotoga maritima人Caenorhabditis elegans大豆(Glycine max)人大豆Caenorhabditis elegans拟南芥褐鼠小家鼠人人黑腹果蝇人人小家鼠人人     43,37741,14838,14538,79839,09840,10436,45139,07241,56634,76239,06335,81438,46237,54338,82936,56536,53436,52239,34137,03743,52940,04438,869   97-07-0898-01-2299-02-1098-08-2799-06-0299-06-021999-03-2399-02-231999-12-061999-05-071999-12-0699-06-0299-06-281991-10-2199-02-0798-07-311999-05-2999-01-1999-02-0299-02-0299-07-0198-09-301998-12-22
述序列。
表4(续)
  rxa02749rxa02767rxa02792rxa02794rxa02809rxa02811rxa02836rxs03212     99990687611973754846781452   GB_BA2:AF086791GB_BA1:SYCSLRBGB_BA2:AE001306GB_BA2:AF126953GB_BA1:SCI5GB_PR3:HS90L6GB_BA2:AF099015GB_BA1:ECOUW93GB_HTG3:AC011361GB_PR4:AC005998GB_PR4:AC006008GB_PR3:HSDJ73H14GB_RO:MUSSPCTLTGB_RO:MUSGRCGB_RO:RNU57062GB_GSS6:AQ832862GB_GSS5:AQ784593GBB_GSS13:AQ473140GB_EST18:AA696785GB_EST18:AA696785GB_BA1:CGBETPGEN   378671462711331616386661190837500033853418614896556575549555631728948804765153973163162339   AF086791D64000AE001306AF126953AL079332Z97353AF099015U14003AC011361AC005998AC006008AL080272M22527M18459U57062AQ832862AQ784593AQ473140AA696785AA696785X93514   运动发酵单胞菌菌株ZM4克隆67E10氨甲酰磷酸合成酶小亚基(carA)、氨甲酰磷酸合成酶大亚基(carB)、转录延伸因子(greA)、烯醇化酶(eno)、丙酮酸脱氢酶α亚基(pdhA)、丙酮酸脱氢酶β亚基(pdhB)、核糖核酸酶H(rnh)、高丝氨酸激酶同系物、醇脱氢酶II(adhB)和外切核酸酶(excinuclease)ABC亚基A(uvrA)基因,完整编码区;和未知基因。Synechocystis sp.PCC6803完整基因组,19/27,2392729-2538999。沙眼衣原体完整基因组的区域33/87。谷氨酸棒杆菌胱硫醚γ合酶(metB)基因,完整编码区。天蓝色链霉菌粘粒I5。来自克隆90L6的染色体22q11.21-11.23上的人类DNA序列。含有一个RPL15(60S核糖体蛋白L15)假基因、EST、STS和GSS,完整序列。天蓝色链霉菌菌株A3(2)整合酶(int)、含铁超氧化物歧化酶II(sodF2)、铁摄入***通透酶(ftrE)和铁摄入***膜内在蛋白(ftrD)基因,完整编码区。大肠杆菌K-12的92.8-00.1分钟的染色体区。人5号染色体克隆CIT-HSPC_482N19,***测序正在进行之中***,69个非顺序片段。人克隆DJ0622E21,完整序列。人克隆DJ0820A21,完整序列。来自克隆73H14的染色体Xq26.3-28上的人类DNA序列,完整序列。小鼠细胞毒性T淋巴细胞特异性丝氨酸蛋白酶CCPII基因,完整的。小鼠粒酶C丝氨酸酯酶mRNA,完整编码区。褐鼠天然杀伤细胞蛋白酶4(RNKP-4)mRNA,完整编码区,HS_5261_A2_E10_SP6ERPCI-11人类男性BAC文库人基因组克隆平板=837列=20行=I,基因组综述序列。HS_3248_A2_F02_T7CCIT批准的人类基因组***文库D人基因组克隆平板=3248列=4行=K,基因组综述序列。CITBI-E1-2589G6.TF CITBI-E1人基因组克隆2589G6,基因组综述序列。GM08392.5primeGM黑腹果蝇卵巢BlueScript黑腹果蝇cDNA克隆GM08392 5prime,mRNA序列。GM08392.5prime GM黑腹果蝇卵巢BlueScript黑腹果蝇cDNA克隆GM08392 5prime,mRNA序列。谷氨酸棒杆菌betP基因。   运动发酵单胞菌(Zymomonas mobilis)Synechocystis sP.沙眼衣原体(Chlamydia trachomatis)谷氨酸棒杆菌天蓝色链霉菌人天蓝色链霉菌大肠杆菌人人人人小家鼠小家鼠褐鼠人人人黑腹果蝇黑腹果蝇谷氨酸棒杆菌     39,02434,57338,940100,00037,48634,14936,72138,78743,57737,29836,63839,72647,51844,93941,55435,61038,95634,76140,60438,28199,931   98-11-0499-02-1398-09-0299-09-1099-06-1699-11-2399-06-0196-04-171999-10-0699-07-2999-06-1799-11-2396-01-1993-06-1296-07-3199-08-2799-08-0399-04-2398-11-2898-11-2897-09-08
表4(续)
rxs03220 725   GB_BA1:SC5F2AGB_BA2:AF008220GB_PL1:CKHUP2GB_EST38:AW048153GB_PL1:CKHUP2   4010522006023533832353   AL049587AF008220X66855AW048153X66855   天蓝色链霉菌粘粒5F2A。枯草杆菌rrnB-dnaB基因组区。C.kessleri HUP2 mRNA。UI-M-BH1-alq-h-05-0-UI.sl NIH_BMAP_M_S2小家鼠cDNA克隆UI-M-BH1-alq-h-05-0-UI 3’,mRNA序列。C.kessleri HUP2 mRNA。   天蓝色链霉菌A3(2)枯草杆菌Chlorella kessleri小家鼠Chlorella kessleri     57,55740,00045,32841,75838,106   1999-05-2498-02-0497-02-1799-09-1897-02-17
实施例部分
实施例 1:谷氨酸棒杆菌ATCC13032 的总基因组DNA的制备让谷氨酸棒杆菌(ATCC 13032)的培养物于30℃下在BHI培养基(Difco)中剧烈振荡生长过夜。通过离心收集细胞,弃去上清液,将细胞重悬于5ml缓冲液I(培养物原始体积的5%--所有指定的体积均已经根据100ml培养物体积来计算)。缓冲液I的组成:140.34g/l蔗糖、2.46g/l MgSO4x7H2O、10ml/l KH2PO4溶液(100g/l,用KOH调至pH6.7)、50ml/l M12浓缩物(10g/l(NH4)2SO4、1g/l NaCl、2g/l MgSO4x7H2O、 0.2g/l CaCl2、 0.5g/l酵母膏(Difco)、10ml/l微量元素混合物(200mg/lFeSO4xH2O、10mg/l ZnSO4x7H2O、3mg/l MnCl2x4H2O、30mg/lH3BO3、20mg/l CoCl2x6H2O、1mg/l NiCl2x6H2O、3mg/l Na2MoO4x2H2O、500mg/l络合剂(EDTA或柠檬酸)、100ml/l维生素混合物(0.2mg/l生物素、0.2mg/l叶酸、 20mg/l对氨基苯甲酸、20mg/l核黄素、40mg/l泛酸钙(ca-panthothenate)、140mg/l烟酸、40mg/l盐酸吡哆醇、200mg/l肌醇)。 将溶菌酶加入悬浮液中至终浓度2.5mg/ml。于37℃温育约4小时后,细胞壁被降解,通过离心收获所产生的原生质体。沉淀用5ml缓冲液I洗涤1次,用5mlTE缓冲液(10mM Tris-HCl、1mMEDTA,pH8)冼涤1次。将沉淀重悬于4mlTE缓冲液中,加入0.5mlSDS溶液(10%)和0.5ml NaCl溶液(5M)。加入蛋白酶K至终浓度200μg/ml后,将悬浮液于37℃温育约18小时。采用标准方法,通过用苯酚、苯酚-氯仿-异戊醇和氯仿-异戊醇抽提,纯化DNA。然后,通过加入1/50 体积的3M乙酸钠和2体积乙醇,然后于-20℃温育30分钟,在高速离心机中用SS34转子(Sorvall)以12,000rpm离心30分钟,沉淀所述DNA。将DNA溶于1ml含有20μg/ml RNA酶A的TE缓冲液中,于4℃对1000ml TE缓冲透析至少3小时。在此期间,更换缓冲液3次。向0.4ml等份的经透析的DNA溶液中,加入0.4ml 2M LiCl和0.8ml乙醇。于-20℃温育30分钟后,通过离心(13,000rpm,BiofugeFresco,Heraeus,Hanau,德国)收集DNA。将DNA沉淀溶于TE缓冲液中。用该方法制备的DNA可以用于所有目的,包括DNA印迹法或基因组文库的构建。
实施例2:构建谷氨酸棒杆菌ATCC13032在大肠杆菌中的基因组文库
采用实施例1所述制备的DNA按照已知的明确方法(参见例如Sambrook,J.等,(1989)“Molecular Cloning:A Laboratory Manual”,ColdSpring Harbor Laboratory Press,或Ausubel,F.M.等(1994)“CurrentProtocols in Molecular Biology”,John Wiley & Sons.)构建粘粒和质粒文库。
可以使用任何质粒或粘粒。具体使用的质粒是质粒pBR322(Sutcliffe,J.G.(1979)Proc.Natl.Acad.Sci.USA,75:3737-3741)、pACYC177(Change & Cohen(1978)J.Bacteriol 134:1141-1156)、pBS质粒系列(pBSSK+、pBSSK-和其它系列;Stratagene,LaJolla,USA)或粘粒如SuperCosl(Stratagene,LaJolla,USA)或Lorist6(Gibson,T.J.,Rosenthal A.和Waterson,R.H.(1987)Gene 53:283-286)。使用质粒pSL109可构建特别用于谷氨酸棒杆菌的基因文库(Lee,H.-S.和A.J.Sinskey(1994)J.Microbiol.Biotechnol.4:256-263)。
实施例3:DNA测序和计算功能分析
应用实施例2描述的基因组文库按照标准方法、尤其是利用ABI377测序仪的链终止法(参见例如Fleischman,R.D.等(1995)“流感嗜血杆菌Rd.的随机全基因组测序和装配”,Science,269:496-512)进行DNA测序。使用具有以下核苷酸序列的测序引物: 5’-GGAAACAGTATGACCATG-3’(SEQ ID NO:677)或5’-GTAAAACGACGGCCAGT-3’(SEQ ID NO:678)。
实施例4:体内诱变
将质粒(或其它载体)DNA通过保持其遗传信息完整性的能力受损的大肠杆菌或其它微生物(例如芽孢杆菌或酵母如酿酒酵母)进行传代,从而可在体内诱变谷氨酸棒杆菌。典型增变株的DNA修复***基因存在突变(例如mutHLS、mutD、mutT等;参考文献见Rupp,W.D.(1996)DNA修复机制,载于:Escherichia coli and Salmonella,第2277-2294页,ASM:Washington.)。这类菌株是本领域技术人员周知的。例如Greener,A.和Callahan,M.(1994)Strategies 7:32-34中介绍了所述菌株的使用。
实施例5:大肠杆菌和谷氨酸棒杆菌之间的DNA转移
若干棒杆菌属和短杆菌属菌种含有自主复制(综述参见例如Martin,J.F.等(1987)Biotechnology,5:137-146)的内源性质粒(例如pHM1519或pBL1)。采用其中加入复制起点和谷氨酸棒杆菌合适标记的大肠杆菌标准载体(Sambrook,J.等(1989),“Molecular Cloning:ALaboratory Manual”,Cold Spring Harbor Laboratory Press或Ausubel,F.M.等(1994)“Current Protocols in Molecular Biology”,John Wiley & Sons)能够容易地构建大肠杆菌和谷氨酸棒杆菌的穿梭载体。所述复制起点优选取自分离自棒杆菌属和短杆菌属菌种的内源性质粒。具体使用的这些菌种的转化标记为卡那霉素抗性基因(例如Tn5或Tn903转座子产生的卡那霉素抗性基因)或氯霉素抗性基因(Winnacker,E.L.(1987),From Genes to Clones - Introduction to Gene Technology,VCH,Weinheim)。所述文献中列举了许多关于构建各种穿梭载体的实施例,所述穿梭载体可在大肠杆菌和谷氨酸棒杆菌中复制而且可用于若干目的,包括基因过量表达(参考文献参见例如Yoshihama,M.等(1985)J.Bacteriol.162:591-597,Martin J.F.等(1987)Biotechnology,5:137-146和Eikmanns,B.J.等(1991)Gene,102:93-98)。
应用标准方法可将目的基因克隆到一种上述穿梭载体并将这种杂合载体导入谷氨酸棒杆菌菌株中。可采用以下方法转化谷氨酸棒杆菌:原生质体转化(Kastsumata,R.等(1984)J.Bacteriol.159306-311)、电穿孔(Lieb1,E.等(1989)FEMS Microbiol. Letters,53:399-303),如果使用特殊载体,也可以采用接合方法(见例如Schfer,A等(1990)J.Bacteriol.172:1663-1666)。通过制备谷氨酸棒杆菌质粒DNA(利用本领域周知的标准方法)并将其转化入大肠杆菌,也可以使穿梭载体从谷氨酸棒杆菌转移到大肠杆菌。采用标准方法可进行这种转化步骤,但是最好使用Mcr缺陷型大肠杆菌菌株如NM522(Gough和Murray(1983)J.Mol.Biol.166:1-19)。
可使用包含pCG1(美国专利号4,617,267)或其片段和任选包含TN903卡那霉素抗性基因(Grindley,N.D.和Joyce,C.M.(1980)Proc.Natl.Acad.Sci.USA 77(12):7176-7180)的质粒在谷氨酸棒杆菌菌株中过量表达各种基因。此外,也可以使用质粒pSL109在谷氨酸棒杆菌菌株中过量表达各种基因(Lee,H.-S.和A.J.Sinskey(1994)J.Microbiol.Biotechnol.4:256-263)。
除了使用复制型质粒之外,也可以通过整合入基因组实现基因过量表达。利用周知的方法可实现在谷氨酸棒杆菌或其它棒杆菌属或短杆菌属菌种中的基因组整合,例如与基因组区的同源重组、限制性内切核酸酶介导的整合(REMI)(参见例如DE专利19823834)或应用转座子。也可以采取以下措施修饰调节区(例如启动子、阻抑蛋白和/或增强子)而调节目的基因的活性:利用定点方法(例如同源重组)或基于随机事件的方法(例如转座子诱变或REMI)进行序列修饰、***或缺失。也可以在本发明一个或多个基因编码区的3’***转录终止子作用的核酸序列;所述终止子是本领域周知的,例如在Winnacker,E.L.(1987)FromGenes to Clones-Introduction to Gene Technology.VCH:Weinheim)中有其介绍。
实施例6:评价突变蛋白的表达
观测转化宿主细胞中的突变蛋白活性依赖于这样的事实:突变蛋白以与野生型蛋白相似的方式和相似的量表达。一种确定突变基因转录水平(有效翻译出基因产物的mRNA量的指标)的有用方法是进行RNA印迹(参考文献见例如Ausubel等(1988)Current Protocols inMolecular Biology,Wiley:纽约),其中用可检测标记(通常为放射性或化学发光)标记结合目的基因的设计引物,使得当提取所述生物培养物的总RNA、在凝胶上电泳、转移至稳定基体上以及与所述探针温育时,所述探针的结合以及结合量可说明所述基因的存在而且指示该基因的mRNA量。这样的信息是突变基因转录程度的证据。应用若干本领域周知的方法可从谷氨酸棒杆菌制备总细胞RNA,例如Bormann,E.R.等(1992)Mol.Microbiol.6:317-326介绍的方法。
为了评价所述mRNA翻译蛋白的存在或相对量,可使用标准技术例如蛋白质印迹(参见例如Ausubel等(1988)Current Protocols inMolecular Biology,Wiley:纽约)。在此过程中,提取总细胞蛋白,经凝胶电泳分离,转移至如硝酸纤维素的基体上以及与特异性结合所需蛋白的探针如抗体温育。这种探针一般用容易检测的化学发光或比色标记物标记。观测到标记物存在和标记物量说明所述细胞中存在所需突变蛋白及其量。
实施例7:遗传改良的谷氨酸棒杆菌的培养-培养基和培养条件
用合成或天然生长培养基培养遗传改良棒杆菌。用于棒杆菌的许多不同生长培养基是众所周知的而且容易获得(Lieb等(1989)Appl.Microbiol.Biotechnol.,32:205-210;von der Osten等(1998)Biotechnology Letters,11:11-16;专利DE 4,120,867;Lieb1(1992)“棒杆菌属”,载于:The Procaryotes,第II卷,Balows,A.等编著,Springer-Verlag)。这些培养基的组成是:一种或多种碳源、氮源、无机盐、维生素和微量元素。优选碳源为糖如单糖、二糖或多糖。例如葡萄糖、果糖、甘露糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉子糖、淀粉或纤维素为非常好的碳源。也可以通过复合化合物如糖蜜或精制糖的其它副产品为培养基提供糖。提供不同碳源的混合物也可能是有益的。其它可能的碳源为醇类和有机酸,例如甲醇、乙醇、醋酸或乳酸。氮源通常为有机或无机氮化合物,或者含有这些化合物的物质。典型氮源包括氨气或铵盐,例如氯化铵或硫酸铵、氢氧化铵、硝酸盐、尿素、氨基酸或复合氮源如玉米浆、大豆粉、大豆蛋白、酵母膏、肉膏等。
培养基可含有的无机盐化合物包括钙、镁、钠、钴、钼、钾、锰、锌、铜和铁的盐酸盐、亚磷酸盐或硫酸盐。所述培养基中可加入螯合化合物,以保持溶液中的金属离子。特别有效的螯合化合物包括二羟基酚(例如儿茶酚或原儿茶酸)或有机酸(例如柠檬酸)。所述培养基还常规含有其它生长因子,例如维生素或生长促进剂,其实例包括生物素、核黄素、硫胺素、叶酸、烟酸、泛酸盐和吡哆醇。生长因子和盐通常源自复合培养基组分,例如酵母膏、糖蜜、玉米浆等。培养基化合物的确切组成与直接实验密切相关而且具体取决于各特定情况。关于培养基优化的信息可在教科书“Applied Microbiol.Physiology,A PracticalApproach(P.M.Rhodes,P.F.Stanbury编著,IRL Press(1997),第53-73页,ISBN 0 19 963577 3)中获得。也可以从商业供应商选择生长培养基,例如标准1号(Merck)或BHI(grain heart infusion,DIFCO)等。
所有培养基组分通过加热灭菌(于1.5帕和121℃20分钟)或过滤除菌。所述组分可一起灭菌,如果需要可分别灭菌。所有培养基组分可培养开始时就存在,或者可以任选连续或分批加入。
每个实验分别规定培养条件。温度应为15℃-45℃。培养温度可保持恒定或实验中改变。培养基的pH应为5-8.5、优选约7.0,可在培养基中加入缓冲剂维持pH。用于该目的的典型缓冲剂为磷酸钾缓冲剂。可选择或同时使用合成缓冲剂如MOPS、HEPES、ACES等。也可以在培养期间加入氢氧化钠或氢氧化铵维持恒定培养pH。如果使用复合培养基组分如酵母膏,额外缓冲剂需要可能降低,因为实际上许多复合化合物具有高缓冲能力。如果使用发酵罐培养所述微生物,也可以使用氨气控制pH。
培养时间通常为数小时至数天。选择培养时间以使液体培养基累积的产物量最多。可用各种容器进行所公开的生长实验,例如微量滴定板、玻璃试管、玻璃烧瓶或不同大小的玻璃或金属发酵罐。为了筛选大量克隆,培养微生物应使用微量滴定板、玻璃试管或摇瓶(带有或没有挡板)。优选使用100ml摇瓶,其中装有10%(体积)需要的生长培养基。培养瓶应在使用100-300rpm速度范围的旋转式振摇器(振幅为25mm)上振摇。维持湿润气氛使蒸发丧失最少;或者应进行数学校正蒸发损失。
如果测试经遗传修饰的克隆,也应该测试未经修饰的对照克隆或含没有任何***片段的基础质粒的对照克隆。利用已经于30℃温育的琼脂平板如CM平板(10g/l葡萄糖、2.5g/l氯化钠、2g/l尿素、10g/l聚胨、5g/l酵母膏、5g/l肉膏、22g/l氯化钠、2g/l尿素、10g/l聚胨、5g/l酵母膏、5g/l肉膏、22g/l琼脂、pH6.8,2M氢氧化钠)上生长的细胞接种培养基至OD600为0.5-1.5。加入得自CM平板的谷氨酸棒杆菌细胞的盐水悬浮液或加入该菌的液体预培养物,从而完成培养基接种。
实施例8:体外分析突变蛋白的功能
本领域已有明确的酶活性和动力学参数测定法。必须使测定任何给定改变酶活性的实验适合野生型酶的比活,这完全在本领域一般技术人员能力范围内。关于酶的一般概述以及涉及结构、动力学、原理、方法、应用的具体细节和许多酶活性测定实例可见于例如以下文献:Dixon,M.和Webb,E.C.,(1979)Enzymes,Longmans:London;Fersht,(1985)Enzyme Structure and Mechanism,Freeman:纽约;Walsh,(1979)Enzymatic Reaction Mechanisms.Freeman:San Francisco;Price,N.C.,Stevens,L.(1982)Fundamentals of Enzymology.Oxford Univ.Press:Oxford;Boyer,P.D.编著(1983)The Enzymes,第三版,Academic Press:纽约;Bisswanger,H.,(1994)Enzymkinetik,第二版,VCH:Weinheim(ISBN 3527300325);Bergmeyer,H.U.,Bergmeyer,J.,Graβ1,M.编著(1983-1986)Methods of Enzymatic Analysis,第三版,第I-XII卷,VerlagChemie:Weinheim;以及Ullmann’s Encyclopedia of Industrial Chemistry(1987),第A9卷,“Enzymes”,VCH:Weinheim,第352-363页。
可应用数种明确的方法如DNA条带移位测定(也称为凝胶阻滞测定)测定结合DNA的蛋白活性。可用报道基因测定(例如Kolmar,H.等(1995)EMBOJ.14:3895-3904以及其中的引用文献介绍的测定)测量所述蛋白对其它分子表达的影响。报道基因测试***是众所周知的而且明确用于原核生物细胞和真核生物细胞,利用酶如β半乳糖苷酶、绿色荧光蛋白等。
按照例如Gennis,R.B.(1989)“膜孔、通道与转运蛋白”,载于:Biomembranes,Molecular Structure and Function,Springer:Heidelberg,第85-137、199-234和270-322页介绍的技术可测定膜转运蛋白的活性。
实施例9:分析突变蛋白对所需产物产量的影响
可如下评价谷氨酸棒杆菌的遗传改进对所需化合物(例如氨基酸)产量的影响:使经修饰的微生物在合适条件(例如上述条件)下生长,然后分析所述培养基和/或细胞组分中的所需产物(即氨基酸)的产量增加情况。所述分析技术是本领域一般技术人员周知的,包括光谱检测法、薄层层析、各种染色法、酶法以及微生物学方法、以及分析型层析法如高效液相层析(参见例如Ullman,Encyclopedia of IndustrialChemistry,第A2卷,第89-90和443-613页,VCH:Weinheim(1985);Fallon,A.等,(1987)“HPLC在生物化学中的应用”,载于:LaboratoryTechniques in Biochemistry and Molecular Biology,第17卷;Rehm等(1993)Biotechnology,第3卷,第III章:“产物的回收纯化”,第469-714页,VCH:Weinheim;Belter,P.A.等(1988)Bioseparations:downstream processing for biotechnology,John Wiley和Sons;Kennedy,J.F.和Cabral,J.M.S.(1992)Recovery processes for biological materials,John Wiley和Sons;Shaeiwitz,J.A.和Henry,J.D.(1988)生物化学分离纯化(Biochemical separations),载于:Ulmann’s Encyclopedia of IndustrialChemistry,第B3卷,第11章,第1-27页,VCH:Weinheim;以及DechoW,F.J.(1989)Separation and purification techniques inbiotechnology,Noyes Publications)。
除了检测发酵终产物之外,也可以分析利用产生所需产物的代谢途径的其它组分,例如中间体和副产物,以确定产生所述化合物的总体效率。分析方法包括测量培养基中的营养物水平(例如糖、烃类、氮源、磷酸盐和其它离子)、检测生物量组成和生长、分析生物合成途径共同代谢物的产量以及发酵期间产生的气体。这些检测的标准方法概述于Applied Microbial Physiology,A Practical Approach,P.M.Rhodes和P.F.Stanbury编著,IRL Press,第103-129、131-163和165-192页(ISBN:0199635773)以及其中引用的参考文献。
实施例10:从谷氨酸棒杆菌培养物纯化所需产物
可用本领域周知的各种方法从上述培养物的谷氨酸棒杆菌细胞或上清液中回收所需产物。如果所需产物不从细胞中分泌出来,可以通过低速离心从培养物收获细胞,应用标准技术裂解细胞,例如机械力或超声。离心去除细胞碎片,保留含有所述可溶性蛋白的上清液部分供进一步纯化所需要的化合物。如果产物从谷氨酸棒杆菌细胞分泌出来,则通过低速离心从所述培养物中去除细胞,保留上清液部分供进一步纯化。
使得自任一纯化方法的上清液部分在合适树脂上进行层析,其中所需分子保留在层析树脂上而样品中的大多数杂质被洗出,或者杂质保留在树脂上而所述样品被洗出。根据需要可重复所述层析步骤,使用相同或不同层析树脂。本领域一般技术人员在选择合适层析树脂和最有效利用待纯化的特定分子方面是非常精通的。纯化产物可通过过滤或超滤浓缩,贮藏在产物最稳定的温度状态下。
有许多本领域已知的纯化方法,上述纯化方法仅仅是举例说明本发明。这样的纯化技术描述于例如Bailey,J.E.& Ollis,D.F.,BiochemicalEngineering Fundamentals,McGraw-Hill:纽约(1986)。
应用本领域的标准技术可评价分离化合物的身份和纯度。所述标准技术包括高效液相层析(HPLC)、光谱法、染色法、薄层层析、NIRS、酶测定法或微生物学测定法。所述分析方法的综述见:Patek等(1994)Appl.Environ.Microbiol.60:133-140;Malakhova等(1996)Biotekhnologiya 11:27-32;以及Schmidt等(1998)BioprocessEngineer,19:67-70;Ulmann’s Encyclopedia of Industrial Chemistry,(1996)第A27卷,VCH:Weinheim,第89-90、521-540、540-547、559-566、575-581和581-587页;Michal,G.(1999)Biochemical Pathways:An Atlas of Biochemistry and Molecular Biology,John Wiley and Sons;Fallon,A.等(1987)HPLC在生物化学中的应用,载于:LaboratoryTechniques in Biochemistry and Molecular Biology,第17卷。
实施例11:分析本发明的基因序列
比较序列并确定两种序列的同源性百分率是本领域已知的技术,可以采用数学算法完成,例如Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA 87:2264-68)及其改良算法(Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-77。这种算法掺入了Altschul等(1990)J.Mol.Biol.215:403-10的NBLAST和XBLAST程序(2.0版)。可应用NBLAST程序,分值=100,字节长度=12进行BLAST核苷酸检索,以便获得与本发明MCT核酸分子同源的核苷酸序列。可应用XBLAST程序,分值=50,字节长度=3进行BLAST蛋白质检索,以便获得与本发明MCT蛋白分子同源的氨基酸序列。为了获得比较目的的空位对比序列,可按照Altschul等,(1997)Nucleic Acids Res.25(17):3389-3402所述,使用引入空位的(Gapped) BLAST。当使用BLAST和引入空位的BLAST程序时,本领域技术人员将知道如何优化用于分析特定序列的程序(例如XBLAST和NBLAST)参数。
用于序列比较的另一个数学算法实例是Meyers和Miller算法((1988)Comput.Appl.Biosci.4:11-17)。这种算法掺入了ALIGN程序(2.0版),ALIGN程序是GCG序列比对软件包的组成部分。当使用ALIGN程序比较氨基酸序列时,可使用PAM120加权残基表、空位长度罚分12和空位罚分4。其它序列分析算法是本领域已知的,包括Torelli和Robotti(1994)Comput.Appl.Biosci.10:3-5介绍的ADVANCE和ADAM;以及Pearson和Lipman(1988)P.B.A.S.85:2444-8介绍的FASTA。
也可以使用GCG软件包中的GAP程序(可在 http://www.gcg.com获得),选用Blosum 62矩阵或PAM250矩阵以及空位加权为12、10、8、6或4而长度加权为2、3或4,获得两种氨基酸序列的同源性百分率。应用GCG软件包中的GAP程序,使用标准参数,例如空位加权为50而长度加权为3,可获得两种核酸序列的同源性百分率。
采用本领域已知的技术(参见例如Bexevanis和Ouellette编著(1998)Bioinformatics:A Practical Guide to the Analysis of Genes and Proteins,John Wiley和Sons:纽约),可进行本发明基因序列与Genbank中的序列的比较分析。以3步骤方法比较本发明基因序列与Genbank中的基因。第一步,对本发明各序列与Genbank核苷酸序列进行BLASTN分析(例如局部比对分析),保留前500个命中序列供进一步分析。接下来,对500个命中序列进行FASTA检索(例如联合的局部和全局序列比对分析,其中比对序列的限定区)。最后,采用GCG软件包中的GAP程序(使用标准参数),对本发明各基因序列与各前3个FASTA命中序列进行全局性序列比对。为了获得正确的结果,应用本领域周知的方法使从Genbank取出的序列长度调整为查询序列长度。分析结果见表4。获得的数据与单独对本发明各基因与Genbank各参考序列进行GAP(全局)分析获得的数据相同,但是与这样的数据库-宽GAP(全局)分析相比,需要显著减少计算时间。没有获得高于阈值的序列比对的本发明序列在表4中指示为没有序列比对信息。本领域技术人员进而应该知道的是,表4表头“同源性(%)(GAP)”下的GAP序列比对同源性百分率是以欧洲数字格式列出的,其中“,”代表小数点。例如该栏中的数值“40,345”是指“40.345%”。
实施例12:构建和操作DNA微阵列
此外,本发明序列可以用于构建和应用DNA微阵列(DNA阵列的设计、方法学以及使用是本领域众所周知的,例如在以下文献中有其介绍:Schena,M等(1995)Science 270:467-470;Wodicka,L.等(1997)Nature Biotechnology 15:1359-1367;DeSaizieu,A.等(1998)NatureBiotechnology 16:45-48;以及DeRisi,J.L.等(1997)Science 278:680-686)。
DNA微阵列是固体或柔性支持物,例如硝酸纤维素、尼龙、玻璃、硅酮或其它物质构成的材料。核酸分子与支持物表面有序结合。适当标记后,其它核酸或核酸混合物可与固定化核酸分子杂交,标记物可用来监测和测量限定区域中的杂交分子的各信号强度。该方法可同时定量所施用的核酸样品或混合物中全部或选定核酸的相对量或绝对量。因此,DNA微阵列可平行分析多种(多达6800种或更多)核酸的表达(参见例如Schena,M.(1996)BioEssays 18(5):427-431)。
本发明序列可用来设计寡核苷酸引物,该寡核苷酸引物能够通过诸如聚合酶链式反应的核酸扩增反应扩增一种或多种谷氨酸棒杆菌基因的规定区域。选择和设计5’或3’寡核苷酸引物或合适接头,可使所产生的PCR产物与上述支持物介质表面共价连接(也参见例如Schena,M.等(1995)Science 270:467-470介绍)。
按照Wodicka,L.等(1997)Nature Biotechnology 15:1359-1367介绍,也可以通过原位寡核苷酸合成构建核酸微阵列。应用光刻法使基体精确限定的区域曝光。由此活化光不稳定性保护基团而加入核苷酸,而避光区则不会发生任何改变。随后的保护和光活化循环使得在限定位置合成不同的寡核苷酸。通过固相合成寡核苷酸,可在微阵列上合成所限定区域的本发明基因。
样品或核苷酸混合物中存在的本发明核酸分子可与所述微阵列杂交。按照标准方法可标记这些核酸分子。简而言之,例如逆转录或DNA合成时通过掺入同位素或荧光标记核苷酸而标记核酸分子(例如mRNA分子或DNA分子)。已有关于标记核酸与微阵列杂交的介绍(例如载于:Schena,M等(1995)同上;Wodicka,L等(1997),同上;以及DeSaizieu A.等(1998),同上)。杂交分子的检测和定量须适合具体掺入的标记物。例如按照Schena,M等(1995)(同上)介绍可检测放射性标记物,而例如按照Shalon等((1996)Genome Research6:639-645)的方法可检测荧光标记物。
将本发明序列用于上述DNA微阵列技术可比较分析谷氨酸棒杆菌或其它棒杆菌属的不同菌株。核酸阵列方法学有助于例如根据各个转录物分布研究菌株间变异和鉴定特定和/或所需菌株特性如致病性、生产能力和胁迫耐受性的重要基因。此外,利用核酸阵列技术可以比较发酵反应期间本发明基因的表达分布。
实施例13:分析细胞蛋白群动力学(蛋白质组学(Proteomics))
本发明基因、组合物和方法可用于研究蛋白群相互作用和动力学,称为“蛋白质组学”。目的蛋白群包括但不限于谷氨酸棒杆菌总蛋白群(例如与其它生物的蛋白群比较)、在特定环境或代谢条件下(例如发酵期间的高温或低温,或者高pH或低pH)具有活性的蛋白、在生长和发育的特定时期具有活性的蛋白。
可用本领域周知的各种技术如凝胶电泳分析蛋白质群。例如通过裂解或提取可获得细胞蛋白,应用各种电泳技术可使细胞蛋白彼此分开。十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)主要根据蛋白质的分子量分离蛋白。等电聚焦聚丙烯酰胺凝胶电泳(IEF-PAGE)通过其等电点(它不仅反映氨基酸序列,而且反映所述蛋白翻译后修饰)分离蛋白。另一个更优选的蛋白分析方法是连续组合的IEF-PAGE和SDS-PAGE,称为2-D-gel电泳(例如见以下文献介绍:Hermann等(1998)Electrophoresis 19:3217-3221;Fountoulakis等(1998)Electrophoresis 19:1193-1202;Langen等(1997)Electrophoresis 18:1184-1192;Antelmann等(1997)Electrophoresis 18:1451-1463)。也可以使用其它蛋白分离技术进行蛋白质分离,例如毛细管凝胶电泳;所述技术是本领域周知的技术。
可用标准技术如染色或标记显现所述方法分开的蛋白。合适染色法是本领域已知的,包括考马斯亮蓝、银染色或荧光染料如Sypro Ruby(Molecular Probes)。在谷氨酸棒杆菌培养基中含有放射性标记氨基酸或其它蛋白前体(例如35S-甲硫氨酸、35S-半胱氨酸、14C-标记氨基酸、15N-氨基酸、15NO315NH4 +13C-标记氨基酸)可在其分离前标记这些细胞的蛋白。同样可使用荧光标记物。可按照前述技术提取、分开和分离所述标记蛋白。
通过测量所用染料或标记物量可进一步分析所述技术显现的蛋白。采用例如光学方法可定量测定给定蛋白量,而且可以与相同凝胶或其它凝胶上的其它蛋白的量比较。例如采用光学比较、光谱法、图象扫描和凝胶分析、或者通过应用照相胶片和筛选可进行凝胶上的蛋白比较。这样的技术产本领域周知的。
为了确定任何给定蛋白的身份,可采用直接测序或其它标准技术。可使用例如N-和/或C-末端氨基酸测序(例如Edman降解法),也可以使用质谱法(尤其是MALDI或ESI技术(参见例如Langen等(1997)Electrophoresis 18:1184-1192))。本文提供的蛋白序列可用于通过所述技术鉴定谷氨酸棒杆菌蛋白。
所述方法获得的信息可用于比较各种生物条件(例如不同生物、发酵时间点、培养基条件或不同群落生境等)的不同样品之间的蛋白存在、活性或修饰的模式。这些实验单独或与其它技术联合获得的资料可用于各种用途,例如比较给定(例如代谢)情况的各种生物行为、提高生产精细化学品的菌株生产能力或提高生产精细化学品的产率。
等同实施方案
本领域技术人员知道或者仅采用常规实验就能够确定本文介绍的本发明的具体实施方案的许多等同实施方案。以下的权利要求书包括这样的等同实施方案。

Claims (34)

1.一种分离的核酸分子或其互补序列,所述核酸分子包含选自SEQID NO:1至675的各奇数核酸序列,前提是所述核酸分子不由表1给出的任何F标志的基因组成。
2.一种分离的核酸分子或其互补序列,所述核酸分子编码包含选自SEQ ID NO:2至676的各偶数氨基酸序列的多肽,前提是所述核酸分子不由表1给出的任何F标志的基因组成。
3.一种分离的核酸分子或其互补序列,所述核酸分子编码一种多肽的天然存在的等位基因变异体,所述多肽包含选自SEQ ID NO:2至676的各偶数氨基酸序列,前提是所述核酸分子不由表1给出的任何F标志的基因组成。
4.一种分离的核酸分子或其互补序列,所述核酸分子包含与选自SEQ ID NO:1至675的任意奇数完整核苷酸序列具有至少50%同一性的核苷酸序列,前提是所述核酸分子不由表1给出的任何F标志的基因组成。
5.一种分离的核酸分子或其互补序列,所述核酸分子包含选自SEQID NO:1至675的任意奇数核苷酸序列的至少15个连续核苷酸的片段,前提是所述核酸分子不由表1给出的任何F标志的基因组成。
6.一种分离的核酸分子,所述核酸分子包含权利要求1-5中任一项的核酸分子和一种编码异源多肽的核苷酸序列。
7.一种载体,所述载体包含权利要求1-6中任一项的核酸分子。
8.权利要求7的载体,所述载体为表达载体。
9.一种宿主细胞,所述宿主细胞是用权利要求8的表达载体转染的宿主细胞。
10.权利要求9的宿主细胞,其中所述细胞来源于微生物。
11.权利要求10的宿主细胞,其中所述细胞属于棒杆菌属(Corynebacterium)或短杆菌属(Brevibacterium)。
12.权利要求9的宿主细胞,其中所述核酸分子的表达导致对由所述细胞产生精细化学品进行调节。
13.权利要求12的宿主细胞,其中所述精细化学品选自:有机酸、生成蛋白质的氨基酸和非生成蛋白质的氨基酸、嘌呤和嘧啶碱基、核苷、核苷酸、脂质、饱和和不饱和脂肪酸、二元醇、糖类、芳族化合物、维生素、辅因子、聚酮化合物和酶。
14.一种生产多肽的方法,该方法包括在合适培养基中培养权利要求9的宿主细胞,由此生产所述多肽。
15.一种分离的多肽,所述多肽包含选自SEQ ID NO:2至676的各偶数氨基酸序列,前提是所述氨基酸序列不由表1给出的任何F标志的基因编码。
16.一种分离的多肽,所述多肽包含一种含有选自SEQ ID NO:2至676的各偶数氨基酸序列的多肽的天然存在的等位基因变异体,前提是所述氨基酸序列不由表1给出的任何F标志的基因编码。
17.一种分离的多肽,所述多肽由一种核酸分子编码,所述核酸分子包含与SEQ ID NO:1至675的任意奇数完整核酸序列具有至少50%同一性的核苷酸序列,前提是所述核酸分子不由表1给出的任何F标志的核酸分子组成。
18.一种分离的多肽,所述多肽包含与SEQ ID NO:2至676的任意偶数完整氨基酸序列至少有50%同一性的氨基酸序列,前提是所述氨基酸序列不由表1给出的任何F标志的基因编码。
19.一种分离的多肽,所述多肽包含一种含有SEQ ID NO:2至676的任意偶数氨基酸序列的多肽的片段,前提是所述氨基酸序列不由表1给出的任何F标志的基因编码,其中所述多肽片段保持包含氨基酸序列的多肽的生物活性。
20.一种分离的多肽,所述多肽由包含SEQ ID NO:1至675的任意奇数核苷酸序列的核酸分子编码,前提是所述核酸分子不由表1给出的任何F标志的核酸分子组成。
21.权利要求15-20中任一项的分离多肽,所述多肽还包含至少一种异源氨基酸序列。
22.一种生产精细化学品的方法,所述方法包括培养权利要求9的细胞,由此生产所述精细化学品。
23.权利要求22的方法,其中所述方法还包括从所述培养物回收所述精细化学品的步骤。
24.权利要求22的方法,其中所述细胞属于棒杆菌属或短杆菌属。
25.权利要求22的方法,其中所述细胞选自:谷氨酸棒杆菌(Corynebacterium glutamicum)、力士棒杆菌(Corynebacterium herculus)、百合花棒杆菌(Corynebacterium lilium)、嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)、醋谷棒杆菌(Corynebacteriumacetoglutamicum)、嗜乙酰棒杆菌(Corynebacterium acetophilum)、产氨棒杆菌(Corynebacterium ammoniagenes)、Corynebacterium fujiokense、Corynebacterium  nitrilophilus、产氨短杆菌(Brevibacteriumammoniagenes)、Brevibacterium butahicum、谷氨酸棒杆菌(Brevibacteriumdivaricatum)、黄色短杆菌(Brevibacterium flavum)、希氏短杆菌(Brevibacterium healii)、酮戊二酸短杆菌(Brevibacteriumketoglutamicum)、Brevibacterium ketosoreductum、乳发酵短杆菌(Brevibacterium lactoferrmentum)、扩展短杆菌(Brevibacterium linens)、Brevibacterium paraffinolyticum和表3中给出的菌株。
26.权利要求22的方法,其中来自所述载体的所述核酸分子的表达导致对所述精细化学品的生产产生调节。
27.权利要求22的方法,其中所述精细化学品选自:有机酸、生成蛋白质的氨基酸和非生成蛋白质的氨基酸、嘌呤和嘧啶碱基、核苷、核苷酸、脂质、饱和和不饱和脂肪酸、二元醇、糖类、芳族化合物、维生素、辅因子、聚酮化合物和酶。
28.权利要求22的方法,其中所述精细化学品为氨基酸。
29.权利要求28的方法,其中所述氨基酸选自:赖氨酸、谷氨酸、谷氨酰胺、丙氨酸、天冬氨酸、甘氨酸、丝氨酸、苏氨酸、甲硫氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、精氨酸、脯氨酸、组氨酸、酪氨酸、苯丙氨酸和色氨酸。
30.一种生产精细化学品的方法,所述方法包括培养其基因组DNA因为含有权利要求1-6中任一项的核酸分子而改变的细胞。
31.一种诊断受治疗者体内白喉棒杆菌的存在或其活性的方法,所述方法包括检测所述受治疗者体内是否存在权利要求1-5的核酸分子或权利要求15-20的多肽分子中的至少一种,由此诊断所述受治疗者体内白喉棒杆菌的存在或活性。
32.一种分离的宿主细胞,所述宿主细胞包含选自SEQ ID NO:1至675的各奇数核酸分子,其中所述核酸分子被破坏。
33.一种分离的宿主细胞,所述宿主细胞包含选自SEQ ID NO:1至675的各奇数核酸分子,其中所述核酸分子与SEQ ID NO:1至675的任意奇数序列相比包含一个或多个核酸修饰。
34.一种分离的宿主细胞,所述宿主细胞包含选自SEQ ID NO:1至675的各奇数核酸分子,其中相对于所述核酸分子的野生型调节区而言,所述核酸分子的调节区被修饰。
CNA2006101058946A 1999-06-25 2000-06-23 编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因 Pending CN1962870A (zh)

Applications Claiming Priority (36)

Application Number Priority Date Filing Date Title
US14103199P 1999-06-25 1999-06-25
US60/141031 1999-06-25
DE19931563.9 1999-07-08
DE19931478.0 1999-07-08
DE19931454.3 1999-07-08
DE19932125.6 1999-07-09
DE19932191.4 1999-07-09
DE19932122.1 1999-07-09
DE19932180.9 1999-07-09
DE19932209.0 1999-07-09
DE19932182.5 1999-07-09
DE19932128.0 1999-07-09
DE19932230.9 1999-07-09
DE19932229.5 1999-07-09
DE19932212.0 1999-07-09
DE19932124.8 1999-07-09
DE19932190.6 1999-07-09
DE19932227.9 1999-07-09
DE19932228.7 1999-07-09
DE19933005.0 1999-07-14
DE19933006.9 1999-07-14
DE19932927.3 1999-07-14
DE19940766.5 1999-08-27
DE19940765.7 1999-08-27
DE19940831.9 1999-08-27
DE19940764.9 1999-08-27
DE19940830.0 1999-08-27
DE19940833.5 1999-08-27
DE19940832.7 1999-08-27
DE19941378.9 1999-08-31
DE19941395.9 1999-08-31
DE19941379.7 1999-08-31
DE19942088.2 1999-09-03
DE19942077.7 1999-09-03
DE19942078.5 1999-09-03
DE19942079.3 1999-09-03

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN00811820A Division CN1370236A (zh) 1999-06-25 2000-06-23 编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因

Publications (1)

Publication Number Publication Date
CN1962870A true CN1962870A (zh) 2007-05-16

Family

ID=34078496

Family Applications (12)

Application Number Title Priority Date Filing Date
CNA2005100712558A Pending CN1766111A (zh) 1999-06-25 2000-06-23 编码参与内环境稳定和适应的蛋白质的谷氨酸棒杆菌基因
CNA2005100759145A Pending CN1715413A (zh) 1999-06-25 2000-06-23 编码代谢途径蛋白的谷氨酸棒杆菌基因
CNA2007100051605A Pending CN101074441A (zh) 1999-06-25 2000-06-23 编码代谢途径蛋白的谷氨酸棒杆菌基因
CNA2007101033021A Pending CN101078017A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2005101164688A Pending CN1800397A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2006100024016A Pending CN1807634A (zh) 1999-06-25 2000-06-23 编码参与碳代谢和能量产生的蛋白质的谷氨酸棒杆菌基因
CNA2007101033036A Pending CN101082050A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2006101074050A Pending CN1990868A (zh) 1999-06-25 2000-06-23 编码参与内环境稳定和适应的蛋白质的谷氨酸棒杆菌基因
CNA200710005154XA Pending CN101082049A (zh) 1999-06-25 2000-06-23 编码代谢途径蛋白的谷氨酸棒杆菌基因
CNA2007101033017A Pending CN101078016A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2006101074012A Pending CN1920040A (zh) 1999-06-25 2000-06-23 编码参与碳代谢和能量产生的蛋白质的谷氨酸棒杆菌基因
CNA2006101058946A Pending CN1962870A (zh) 1999-06-25 2000-06-23 编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因

Family Applications Before (11)

Application Number Title Priority Date Filing Date
CNA2005100712558A Pending CN1766111A (zh) 1999-06-25 2000-06-23 编码参与内环境稳定和适应的蛋白质的谷氨酸棒杆菌基因
CNA2005100759145A Pending CN1715413A (zh) 1999-06-25 2000-06-23 编码代谢途径蛋白的谷氨酸棒杆菌基因
CNA2007100051605A Pending CN101074441A (zh) 1999-06-25 2000-06-23 编码代谢途径蛋白的谷氨酸棒杆菌基因
CNA2007101033021A Pending CN101078017A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2005101164688A Pending CN1800397A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2006100024016A Pending CN1807634A (zh) 1999-06-25 2000-06-23 编码参与碳代谢和能量产生的蛋白质的谷氨酸棒杆菌基因
CNA2007101033036A Pending CN101082050A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2006101074050A Pending CN1990868A (zh) 1999-06-25 2000-06-23 编码参与内环境稳定和适应的蛋白质的谷氨酸棒杆菌基因
CNA200710005154XA Pending CN101082049A (zh) 1999-06-25 2000-06-23 编码代谢途径蛋白的谷氨酸棒杆菌基因
CNA2007101033017A Pending CN101078016A (zh) 1999-06-25 2000-06-23 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因
CNA2006101074012A Pending CN1920040A (zh) 1999-06-25 2000-06-23 编码参与碳代谢和能量产生的蛋白质的谷氨酸棒杆菌基因

Country Status (2)

Country Link
CN (12) CN1766111A (zh)
ZA (5) ZA200200585B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113891941A (zh) * 2019-03-28 2022-01-04 特拉维夫大学拉莫特有限公司 修饰翻译的方法

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6964314B2 (ja) * 2017-05-12 2021-11-10 三井化学株式会社 組換え微生物、組換え微生物を用いたピリドキサミン又はその塩の製造方法、及び組換え微生物を用いたピリドキサール又はその塩の製造方法
EP3456833A1 (en) * 2017-09-18 2019-03-20 Evonik Degussa GmbH Method for the fermentative production of l-amino acids
EP3467099A1 (en) * 2017-10-05 2019-04-10 Evonik Degussa GmbH Method for the fermentative production of l-amino acids
CN108359669B (zh) * 2018-02-13 2020-04-07 江南大学 一种棒杆菌启动子及其应用
TW202020148A (zh) * 2018-07-31 2020-06-01 德商拜耳廠股份有限公司 編碼改良之轉胺酶蛋白質之核酸
CN109097361B (zh) * 2018-08-28 2020-02-14 江南大学 启动子、其载体及其应用
CN110423829A (zh) * 2019-08-15 2019-11-08 广州市疾病预防控制中心(广州市卫生检验中心) 一种检测白喉棒状杆菌的荧光pcr试剂盒
KR102153534B1 (ko) * 2019-09-02 2020-09-09 씨제이제일제당 주식회사 신규한 프로모터 및 이를 이용한 아미노산 생산 방법
CN111019958A (zh) * 2019-12-11 2020-04-17 宁波大学 过表达utp-葡萄糖-1-磷酸-尿苷转移酶基因及其重组工程菌的构建方法和应用
CN111394291B (zh) * 2020-03-27 2022-03-15 江南大学 一种利用重组谷氨酸棒杆菌发酵生产l-谷氨酸的方法
CN111635454B (zh) * 2020-06-04 2021-12-28 江南大学 利用生物传感器筛选精氨酸高产菌株的方法
CN111961635B (zh) * 2020-08-07 2023-09-01 内蒙古伊品生物科技有限公司 一种产l-赖氨酸的重组菌株及其构建方法与应用
CN112266891B (zh) * 2020-10-15 2023-10-31 内蒙古伊品生物科技有限公司 一种产l-氨基酸的重组菌株及其构建方法与应用
CN112725253B (zh) * 2020-12-30 2023-01-06 宁夏伊品生物科技股份有限公司 一种改造基因bbd29_14900的重组菌株及其构建方法与应用
CN112646767B (zh) * 2020-12-30 2022-08-09 宁夏伊品生物科技股份有限公司 具有增强的l-谷氨酸生产力的菌株及其构建方法与应用
KR102287111B1 (ko) * 2021-01-25 2021-08-06 씨제이제일제당 주식회사 신규한 데옥시구아노신트리포스페이트 트리포스포하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법
EP4056698B1 (en) * 2021-01-26 2024-01-03 CJ Cheiljedang Corporation Novel urease accessory protein variant and method for producing l-valine using same
CN114729340B (zh) * 2021-01-29 2023-06-23 Cj第一制糖株式会社 新dahp合酶变体及使用其生产l-赖氨酸的方法
KR102314883B1 (ko) * 2021-01-29 2021-10-19 씨제이제일제당 (주) 신규한 Co/Zn/Cd 유출 시스템 컴포넌트 변이체 및 이를 이용한 L-라이신 생산 방법
CN113846019B (zh) * 2021-03-05 2023-08-01 海南师范大学 一种海洋微拟球藻靶向表观基因组遗传调控方法
KR102306009B1 (ko) * 2021-04-07 2021-09-27 씨제이제일제당 (주) 신규한 WhiB 계열 전사 조절자 WhcA 변이체 및 이를 이용한 L-발린 생산 방법
KR102281369B1 (ko) * 2021-04-07 2021-07-22 씨제이제일제당 (주) 신규한 디히드로리포일 아세틸기전이효소 변이체 및 이를 이용한 l-발린 생산 방법
KR102303747B1 (ko) * 2021-04-12 2021-09-16 씨제이제일제당 (주) 신규한 주요 촉진제 수퍼패밀리 퍼미에이즈 변이체 및 이를 이용한 l-라이신 생산 방법
CN117106042A (zh) * 2021-08-23 2023-11-24 黑龙江伊品生物科技有限公司 Yh66-rs07020突变体蛋白及其相关生物材料在制备缬氨酸中的应用
CN114181288B (zh) * 2022-02-17 2022-05-03 北京中科伊品生物科技有限公司 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质
CN114507273B (zh) * 2022-03-14 2024-05-07 宁夏伊品生物科技股份有限公司 Yh66_07020蛋白及其相关生物材料在提高精氨酸产量中的应用
CN114907459A (zh) * 2022-03-14 2022-08-16 宁夏伊品生物科技股份有限公司 一种高产精氨酸的工程菌及其构建方法与应用
CN114941005B (zh) * 2022-05-24 2023-08-11 绵阳师范学院 一种重组表达载体、降解苯酚的基因工程菌及其应用
CN116590202B (zh) * 2023-07-12 2023-09-12 欧铭庄生物科技(天津)有限公司滨海新区分公司 一株谷氨酸棒杆菌及其在发酵生产l-亮氨酸中的应用
CN117512029B (zh) * 2024-01-03 2024-03-29 地奥集团成都药业股份有限公司 一种提升谷氨酰胺产量的培养基、方法及代谢组学分析方法
CN117946954B (zh) * 2024-03-26 2024-06-14 天津科技大学 一种亮氨酸生产菌株及其构建方法与应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113891941A (zh) * 2019-03-28 2022-01-04 特拉维夫大学拉莫特有限公司 修饰翻译的方法

Also Published As

Publication number Publication date
CN1800397A (zh) 2006-07-12
CN1990868A (zh) 2007-07-04
CN101078016A (zh) 2007-11-28
CN1807634A (zh) 2006-07-26
ZA200200646B (en) 2004-10-27
CN1766111A (zh) 2006-05-03
CN1715413A (zh) 2006-01-04
ZA200200585B (en) 2004-10-27
CN101082049A (zh) 2007-12-05
ZA200200584B (en) 2004-10-27
ZA200200647B (en) 2004-09-29
CN101078017A (zh) 2007-11-28
CN1920040A (zh) 2007-02-28
CN101074441A (zh) 2007-11-21
CN101082050A (zh) 2007-12-05
ZA200200645B (en) 2004-07-26

Similar Documents

Publication Publication Date Title
US6696561B1 (en) Corynebacterium glutamicum genes encoding proteins involved in membrane synthesis and membrane transport
CN1962870A (zh) 编码参与膜合成和膜转运的蛋白质的谷氨酸棒杆菌基因
US20070015252A1 (en) Corynebacterium glutamicum genes encoding regulatory proteins
US20070161091A1 (en) Corynebacterium glutamicum genes encoding proteins involved in genetic stability, gene expression, and protein secretion and folding
EP2292763A1 (en) Corynebacterium glutamicum genes encoding proteins involved in carbon metabolism and energy production
US7410766B2 (en) Corynebacterium glutamicum genes encoding phosphoenolpyruvate: sugar phosphotransferase system proteins
MXPA01012845A (es) Genes de corynebacterium glutamicum que codifican proteinas involucradas en la sintesis de membrana y transporte de membrana.
US20070059810A1 (en) Corynebacterium glutamicum genes encoding stress, resistance and tolerance proteins
US20060269975A1 (en) Corynebacterium glutamicum genes encoding proteins involved in DNA replication, protein synthesis, and pathogenesis
EP1246922B1 (en) Corynebacterium glutamicum genes encoding phosphoenolpyruvate: sugar phosphotransferase system proteins
US20070111232A1 (en) Corynebacterium glutamicum genes encoding proteins involved in homeostasis and adaptation
US20050191732A1 (en) Corynebacterium glutamicum genes encoding proteins involved in homeostasis and adaptation
CN101130778A (zh) 编码磷酸烯醇丙酮酸:糖类磷酸转移酶***蛋白质的谷氨酸棒杆菌基因
US20080096211A1 (en) Corynebacterium glutamicum genes encoding proteins involved in genetic stability, gene expression, and protein secretion and folding
CA2585907A1 (en) Corynebacterium glutamicum genes encoding proteins involved in homeostasis and adaptation
AU783707B2 (en) Corynebacterium glutamicum genes encoding proteins involved in membrane synthesis and membrane transport
CA2583703A1 (en) Corynebacterium glutamicum genes encoding proteins involved in membrane synthesis and membrane transport
AU2007202317A1 (en) Corynebacterium glutamicum genes encoding phosphoenolpyruvate: sugar phosphotransferase system proteins
CA2587128A1 (en) Corynebacterium glutamicum genes encoding proteins involved in carbon metabolism and energy production
CA2590403A1 (en) Corynebacterium glutamicum genes encoding phosphoenolpyruvate:sugar phospho-transferase system proteins
EP1702980A1 (en) Corynebacterium glutamicum gene encoding Hpr of phosphoenolpyruvate:sugar phosphotransferase system
AU2006200795A1 (en) Corynebacterium glutamicum genes encoding proteins involved in membrane synthesis and membrane transport
AU2007202394A1 (en) Corynebacterium glutamicum genes encoding stress, resistance and tolerance proteins
CA2585184A1 (en) Corynebacterium glutamicum genes encoding stress, resistance and tolerance proteins
AU2007203275A1 (en) Corynebacterium glutamicum genese encoding proteins involved in carbon metabolism and energy production

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication