CN103080126B

CN103080126B - 具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸

Info

Publication number: CN103080126B
Application number: CN201180040520.XA
Authority: CN
Inventors: A.费希尔; D.亚弗
Original assignee: Novozymes Inc
Current assignee: Novozymes Inc
Priority date: 2010-06-21
Filing date: 2011-06-21
Publication date: 2016-05-11
Anticipated expiration: 2031-06-21
Also published as: US20130302865A1; US8158395B2; AU2011271094A1; CA2803343C; JP5912111B2; EP2582716A1; CN103080126A; EP2769985A1; KR20130113937A; AU2011271094B2; EP2769985B1; US20110312047A1; US20120149079A1; JP2013534825A; ZA201209441B; CA2803343A1; MX2012014627A; BR112012029891A2; US8518676B2; WO2011163269A1

Abstract

本发明涉及具有C4-二羧酸转运蛋白活性的分离的多肽，和编码所述多肽的分离的多核苷酸。本发明亦涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用所述多肽的方法，和产生C4-二羧酸如苹果酸的方法。

Description

具有C4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸

涉及序列表

本申请包含计算机可读形式的序列表，其通过提述并入本文。

涉及生物材料的保藏

本申请包含对生物材料的保藏的引用，其通过提述并入本文。

发明背景

技术领域

本发明涉及具有C4-二羧酸转运蛋白活性的多肽和编码所述多肽的多核苷酸。本发明亦涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用所述多肽的方法，和产生C4-二羧酸如苹果酸的方法。

背景技术

有机酸在多种工业中具有悠久历史的商业使用。举例而言，有机酸用于食品和饲料工业(柠檬酸、抗坏血酸、乳酸、乙酸和葡糖酸)，作为用于产生多种聚合物的单体(己二酸、乳酸、丙烯酸和衣康酸)，作为金属螯合剂(葡糖酸)和作为“绿色”溶剂(乙酸)(Sauer等,2008,TrendsinBiotechnology26:100-108)。有机酸自身可为商业产品或其可为用于制造其他化学品的化学构件(buildingblock)。除了专门用途之外，长久以来公认C4-二羧酸亦可充当构件化合物以供产生大体积的工业化学品，如1,4-丁二醇，四氢呋喃和γ-丁内酯。由于石油衍生构件的高成本，通过传统石油化学途径产生这些大体积工业化学品的成本显著增加。

有机酸在商业上是通过从石油衍生原料的化学合成(例如，延胡索酸、苹果酸、丙烯酸和己二酸)或通过微生物发酵(例如柠檬酸、乳酸、葡糖酸和衣康酸)产生的。一些有机酸如延胡索酸和苹果酸亦可通过微生物发酵来产生，但由于更低的生产成本，目前在商业上仍通过化学合成从石油化学原料产生。然而，石油衍生构件化学品的成本的日益升高，地缘政治的不稳定性对原油价格的影响，以及对实施利用来源于可再生资源的原料的制造工艺的期望，刺激了通过微生物发酵产生有机酸和其他化学品中的重建的兴趣。

虽然现在通过化学合成从石油化学原料商业性产生苹果酸，其亦可通过微生物发酵产生。苹果酸已在基因工程改造的酵母(酿酒酵母(Saccharomycescerevisia))(Zelle等,2008,Appl.Environ.Microbiol.74:2766-2777)和天然存在的丝状真菌如曲霉属菌种(Aspergillusspp.)(美国专利号3,063,910;Bercovitz等,1990,Appl.Environ.Microbiol.56:1594-1597)中以高水平产生。Abe等(美国专利号3,063,910)和Bercovitz等(1990,Appl.Environ.Microbiol.56:1594-1597)报道了在几种曲霉属菌种中高水平的苹果酸产生。而且，Battat等(1991,Biotechnol.Bioengineering,37:1108-1116)报道了在优化条件下在搅拌的发酵罐中由黄曲霉(Aspergillusflavus)产生了高至113g/L的苹果酸。在WO2010/003728中描述了在酵母中通过微生物发酵产生二羧酸。亦在WO2009/011974和WO2009/155382中描述了通过微生物发酵产生苹果酸。通过对曲霉属(Aspergillus)进行遗传工程改造改善苹果酸产生会使得能够通过发酵经济地商业性生产苹果酸。

曲霉属菌种(Aspergillusspp.)中的苹果酸过量产生在特定的培养条件(有氧条件和高C:N比；碳酸钙亦作为中和剂和作为用于苹果酸生物合成的CO₂源添加)下发生。在这些条件下，通过胞质溶胶的、还原性三羧酸(TCA)循环的溢出代谢(overflowmetabolism)导致增加的苹果酸生物合成和分泌入培养基。已在酿酒酵母中报道了通过使用遗传工程增加丙酮酸羧化酶(Bauer等,1999,FEMSMicrobiolLett.179:107-113)或苹果酸脱氢酶(Pines等,1997,Appl.Microbiol.Biotechnol.48:248-255)的水平和增加苹果酸转运蛋白的表达(Zelle等,2008,见上)而增加苹果酸产生。基于生物化学证据，提出了在黄曲霉菌株ATCC13697中，苹果酸脱氢酶活性限制苹果酸产生(Peleg等,1988,Appl.Microbiol.Biotechnol.28:69-75)。2010年8月27日提交、题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申请号PCT/US10/47002(其内容通过提述以其整体并入本文)描述了丝状真菌中的苹果酸产生。

在本领域中，在曲霉属中作为使用重组DNA技术的遗传工程改造的结果而改善C4-二羧酸产生如苹果酸产生会是有益的。本发明提供了具有C4-二羧酸转运蛋白活性的多肽，编码所述多肽的多核苷酸，和用于改善C4-二羧酸产生(例如苹果酸产生)的方法等。

发明内容

本发明涉及具有C4-二羧酸转运蛋白活性的分离的多肽。在一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽选自：(a)多肽，其与SEQIDNO:2、4或6，或其成熟多肽序列具有至少65%序列同一性；(b)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，或其成熟多肽编码序列，或前述序列的全长互补链在低严格条件下杂交；(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，或其成熟多肽编码序列具有至少65%序列同一性；(d)SEQIDNO:2、4或6，或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。

本发明亦涉及产生C4-二羧酸(例如苹果酸)的方法。在一个方面，该方法包括：(a)培养宿主细胞(例如丝状真菌宿主细胞)，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸；和(b)回收所述C4-二羧酸(例如苹果酸)。在另一个方面，该方法包括(a)将编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞(例如丝状真菌宿主细胞)；(b)在培养基中培养经转化的生物；和(c)回收所述C4-二羧酸(例如苹果酸)。在所述方法的一些方面，所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。

本发明还涉及宿主细胞(例如丝状真菌宿主细胞，如米曲霉(Aspergillusoryzae))，所述宿主细胞包含本文中所述的编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述宿主细胞分泌和/或能够分泌增加水平的C4-二羧酸(例如苹果酸)。在一些方面，所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。

本发明亦涉及信号肽和编码该信号肽的多核苷酸。在一个方面，本发明涉及多核苷酸，其编码可操作地连接于编码蛋白的基因的信号肽，所述信号肽包含或组成为(consistingof)SEQIDNO:2的氨基酸1至61或1至68。在另一个方面，本发明涉及多核苷酸，其编码可操作地连接于编码蛋白的基因的信号肽，所述信号肽包含或组成为SEQIDNO:4的氨基酸1至17。在另一个方面，本发明涉及多核苷酸，其编码可操作地连接于编码蛋白的基因的信号肽，所述信号肽包含或组成为SEQIDNO:6的氨基酸1至68。

本发明亦涉及包含本文中所述的多肽的组合物，编码所述多肽的分离的多核苷酸，包含所述多核苷酸的核酸构建体、表达载体、重组宿主细胞，和产生所述多肽的方法。

附图说明

图1显示pShTh60的限制图谱。

图2显示pSaMF35的限制图谱。

图3显示棘孢曲霉(Aspergillusaculeatus)C4-二羧酸转运蛋白基因(c4t737)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:1和2)。

图4显示pSaMF36的限制图谱。

图5显示棘孢曲霉C4-二羧酸转运蛋白基因(c4t521)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:3和4)。

图6显示米曲霉(Aspergillusoryzae)NRRL3488苹果酸脱氢酶基因(mdh3)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:11和12)。

图7显示pSaMF21的限制图谱。

图8A和8B一同显示了米曲霉NRRL3488丙酮酸羧化酶(pyc)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:15和16)。

图9显示pRYAN1的限制图谱。

图10显示pAaMAT737的限制图谱。

图11显示pSaMF38的限制图谱。

图12显示棘孢曲霉C4-二羧酸转运蛋白基因(mat737)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:5和6)。

定义

C4-二羧酸转运蛋白：术语“C4-二羧酸转运蛋白”在本文中定义为可将苹果酸、琥珀酸、草酰乙酸、丙二酸和/或延胡索酸转运至细胞外的二羧酸通透酶(Grobler等,1995,Yeast11:1485-1491;Camarasa等,2001,AppliedandEnvironmentalMicrobiology67:4144-4151)。用于预测线粒体输入的蛋白及其靶向序列的计算方法由Claros和Vincens,1996,Eur.J.Biochem.241:779-786描述。

在一些方面，所述C4-二羧酸转运蛋白具有成熟多肽SEQIDNO:2、SEQIDNO:4和/或SEQIDNO:6的C4-二羧酸转运蛋白活性(例如苹果酸转运蛋白活性)的至少20%，例如至少40%，至少50%，至少60%，至少70%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或至少100%。

苹果酸脱氢酶：术语“苹果酸脱氢酶”在本文中定义为在NADH+H+的存在下催化将草酰乙酸还原为苹果酸和NAD⁺的苹果酸:NAD⁺氧还酶(EC1.1.1.37)。就本发明而言，根据下述步骤确定苹果酸脱氢酶活性。测定溶液由1mM草酰乙酸，100mMTrispH8.0，10mMNaHCO₃，5mMMgCl₂，和0.1mMNADH(SigmaChemicalCo.，St.Louis，MO，USA)组成。将不含草酰乙酸作为底物的测定溶液作为对照运行以测量背景NADH降解率(degradationrates)。用双蒸水制备每种上清的1/100，1/500，1/2500和1/12500的稀释物。将测定溶液的270μl的等分试样分配入96孔聚苯乙烯平底板。添加每种稀释的上清的30μl样品以起始测定。使用340PC读板器(MolecularDevices,Sunnyvale,CA,USA)以下述设定监测反应：340nm，动力学读取(kineticreading)。使用NADH的浓度系列以构建标准曲线，并使用纯化的苹果酸脱氢酶(SigmaChemicalCo.,St.Louis,MO,USA)的稀释系列作为阳性对照。一单位的苹果酸脱氢酶活性等于能够在pH8.0，25℃每分钟将1微摩尔草酰乙酸和NADH+H⁺转化为苹果酸和NAD⁺的酶量。

在一些方面，所述苹果酸脱氢酶具有成熟多肽SEQIDNO:12的苹果酸脱氢酶活性的至少20%，例如至少40%，至少50%，至少60%，至少70%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或至少100%。

丙酮酸羧化酶：术语“丙酮酸羧化酶”在本文中定义为在ATP和HCO₃ ^-存在下催化将丙酮酸羧化为草酰乙酸、ADP和磷酸的丙酮酸:二氧化碳连接酶(ADP-形成)(EC6.4.1.1)。就本发明而言，根据针对丙酮酸羧化酶(SigmaChemicalCo.,St.Louis,MO,USA)的SIGMA?QualityControlTest方法的步骤确定丙酮酸羧化酶活性，只是该测定使用pH8.0的Tris缓冲液。一单位的丙酮酸羧化酶活性等于能够在pH7.8，30℃每分钟将1微摩尔的丙酮酸和CO₂转化为草酰乙酸的酶量。

在一些方面，所述丙酮酸羧化酶具有成熟多肽SEQIDNO:16的丙酮酸羧化酶活性的至少20%，例如至少40%，至少50%，至少60%，至少70%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或至少100%。

异源多核苷酸：术语“异源多核苷酸”在本文中定义为对于宿主细胞并非天然的多核苷酸；其中已对编码区进行结构修饰的天然多核苷酸；作为通过重组DNA技术(例如，不同的(外源)启动子)操纵DNA的结果其表达定量改变的天然多核苷酸；或其表达通过将一个或多个(例如，两个、几个)额外拷贝的多核苷酸导入宿主细胞而定量改变的天然多核苷酸。

分离的/纯化的：术语“分离的”和“纯化的”意指从至少一种与其天然结合(associated)的成分分离的多肽或多核苷酸。举例而言，如通过SDS-PAGE确定的，该多肽可为至少1%纯，例如至少5%纯，至少10%纯，至少20%纯，至少40%纯，至少60%纯，至少80%纯，至少90%纯，至少93%纯，至少95%纯，至少97%纯，至少98%纯，或至少99%纯；且如通过琼脂糖电泳确定的，该多核苷酸可为至少1%纯，例如至少5%纯，至少10%纯，至少20%纯，至少40%纯，至少60%纯，至少80%纯，至少90%纯，至少93%纯，至少95%纯，至少97%纯，至少98%纯，或至少99%纯。

编码序列：术语“编码序列”的意思是指定其蛋白产物的氨基酸序列的多核苷酸序列。编码序列的边界通常由开读框确定，所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始，并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是基因组DNA、cDNA、合成多核苷酸和/或重组多核苷酸的序列。

cDNA序列：术语“cDNA序列”意指从得自真核细胞的成熟的、已剪接的mRNA分子在反转录之后所得的DNA。来自基因组DNA起始的(initial)、初级的RNA转录物是mRNA的前体，其通过一系列包括剪接的步骤加工然后作为成熟的已剪接的mRNA出现。cDNA序列缺乏可存在于相应基因组DNA序列中的***的内含子。相应地，短语“SEQIDNO:X的cDNA序列”意指将SEQIDNO:X中***的内含子序列(若存在)去除之后所得的序列。在一些情况下—当参照的基因组DNA序列缺乏***的内含子序列时—cDNA序列可与相应的基因组DNA序列完全相同。

基因组DNA序列：术语“基因组DNA序列”意指见于来源生物的基因组(例如真核或原核基因组)的DNA序列。在一些情况下，来自真核基因组的基因组DNA序列含有一个或多个***的内含子序列，其作为RNA剪接的结果从初级RNA转录物去除。相应地，短语“SEQIDNO:Y的基因组DNA序列”意指来自来源生物的相应DNA序列，其含有在RNA剪接之前存在的***的内含子序列(若存在)。

成熟多肽序列：术语“成熟多肽序列”意指参照的多核苷酸序列在任何翻译后序列修饰(如N端加工和/或C端截短)之后的部分。在一些情况下，所述成熟多肽序列可以与整个参照的多肽序列相同。在一个方面，基于预测SEQIDNO:2的氨基酸1至68为信号肽的InterProScan程序(TheEuropeanBioinformaticsInstitute)，所述成熟多肽序列是SEQIDNO:2的氨基酸69至397。在另一个方面，基于预测SEQIDNO:2的氨基酸1至61为信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6)，所述成熟多肽序列是SEQIDNO:2的氨基酸62至397。在另一个方面，基于预测SEQIDNO:4的氨基酸1至17为信号肽的SignalP程序，所述成熟多肽序列是SEQIDNO:4的氨基酸18至418。在另一个方面，基于预测无信号肽的InterProScan程序，所述成熟多肽序列是SEQIDNO:4的氨基酸1至418。在一个方面，基于预测SEQIDNO:6的氨基酸1至68为信号肽的InterProScan程序，所述成熟多肽序列是SEQIDNO:2的氨基酸69至397。

成熟多肽编码序列：术语“成熟多肽编码序列”意指参照的多核苷酸序列(例如基因组或cDNA序列)编码成熟多肽序列的部分。在一些情况下，所述成熟多肽编码序列可以与整个参照的多核苷酸序列相同。在一个方面，基于预测SEQIDNO:1的核苷酸1至204编码信号肽的InterProScan程序(TheEuropeanBioinformaticsInstitute)，所述成熟多肽编码序列是SEQIDNO:1的核苷酸205至1194。在另一个方面，基于预测SEQIDNO:1的核苷酸1至183编码信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6)，所述成熟多肽编码序列是SEQIDNO:1的核苷酸184至1194。在另一个方面，基于预测SEQIDNO:3的核苷酸1至51编码信号肽的SignalP程序，所述成熟多肽编码序列是SEQIDNO:3的核苷酸52至1257。在另一个方面，基于预测无信号肽的InterProScan程序，所述成熟多肽编码序列是SEQIDNO:3的核苷酸1至1257。在另一个方面，基于预测SEQIDNO:5的核苷酸1至204编码信号肽的InterProScan程序，所述成熟多肽编码序列是SEQIDNO:1的核苷酸205至1194。

片段：术语“片段”意指从参照的多肽序列的氨基和/或羧基末端缺失了一个或多个(例如两个、几个)氨基酸的多肽。在一个方面，所述片段具有C4-二羧酸转运蛋白活性。在另一个方面，片段包含SEQIDNO:2的至少337个氨基酸残基，例如至少357个氨基酸残基或至少377个氨基酸残基。在另一个方面，片段包含SEQIDNO:4的至少355个氨基酸残基，例如至少375个氨基酸残基或至少395个氨基酸残基。在另一个方面，片段包含SEQIDNO:6的至少337个氨基酸残基，例如至少357个氨基酸残基或至少377个氨基酸残基。

亚序列：术语“亚序列(subsequence)”意指从参照的核苷酸序列的5'和/或3'端缺失了一个或多个(例如两个、几个)核苷酸的多核苷酸。在一个方面，所述亚序列编码具有C4-二羧酸转运蛋白活性的片段。在另一个方面，亚序列包含SEQIDNO:1的至少1011个核苷酸，例如至少1171个核苷酸或至少1131个核苷酸。在另一个方面，亚序列包含SEQIDNO:3的至少1065个核苷酸，例如至少1125个核苷酸或至少1185个核苷酸。在另一个方面，亚序列包含SEQIDNO:5的至少1011个核苷酸，例如至少1171个核苷酸或至少1131个核苷酸。

等位变体(allelicvariant)：术语“等位变体”意指占据相同染色体基因座的基因的任何两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。

序列同一性：两个氨基酸序列间或两个核苷酸序列间的相关性由参数“序列同一性”所描述。

就本发明而言，两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite)，Rice等，2000，TrendsGenet.16:276-277)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，J.Mol.Biol.48：443-453)确定的。所用的可选参数为缺口开放罚分(gapopenpenalty)10，缺口延伸罚分(gapextensionpenalty)0.5，和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用标记为“最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算：

(相同的残基×100)/(比对长度-比对中缺口总数)

就本发明而言，两个脱氧核糖核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite)，Rice等，2000，见上)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，见上)确定的。所用的可选参数为缺口开放罚分10，缺口延伸罚分0.5，和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用标记为”最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算：

(相同的脱氧核糖核苷酸×100)/(比对长度-比对中缺口总数)。

表达：术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

核酸构建体：术语“核酸构建体”意指单链或双链的核酸分子，其分离自天然存在的基因，或经修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段，或为合成的，其中所述核酸分子包含一个或多个(例如两个，几个)调控序列。

调控序列(controlsequence)：术语“调控序列”意指对于多肽表达必需的核酸序列。调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的，以及对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列和转录终止子序列。调控序列可以和用于引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。

可操作地连接：术语“可操作地连接”意指这样的构型，其中将调控序列置于相对于多核苷酸的编码序列的适当位置，使得调控序列指导编码序列的表达。

表达载体：术语“表达载体”意指线性的或环状的DNA分子，其包含编码多肽的多核苷酸，并与调控序列可操作地连接，其中所述调控序列提供编码所述多肽的多核苷酸的表达。最少的情况，所述表达载体包含启动子序列，和转录和翻译终止信号序列。

宿主细胞：术语“宿主细胞”意指任何细胞类型，所述细胞类型对于用包含本发明的多核苷酸(例如编码C4-二羧酸转运蛋白的多核苷酸)的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代，其由于在复制过程中发生的突变而不同于亲本细胞。

变体：术语“变体”意指在一个或多个位置包含变化即取代、***和/或缺失一个或多个(例如两个、几个)氨基酸残基的，具有活性例如C4-二羧酸转运蛋白活性的多肽。取代意指将占据某位置的氨基酸用不同氨基酸替换；缺失意指去除占据某位置的氨基酸；而***意指在占据某位置的氨基酸的相邻处添加一个或多个，例如1-3个氨基酸。

体积产量：术语“体积产量”指每单位时间每体积(例如，培养基及其中内含物的总体积)使用的***所产生的参照的产物的量(例如，产生的C4-二羧酸的量)。

发酵培养基：术语“发酵培养基”指包含一种或多种(例如，两种，几种)糖如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、***糖、甘露糖、半乳糖和/或可溶性寡糖的培养基，其中所述培养基能够部分地通过宿主细胞转化(发酵)为所需产物，如C4-二羧酸。在一些情况下，所述发酵培养基源自天然来源，如甘蔗，淀粉，或纤维素，并可为通过酶水解(糖化)而预处理所述来源的结果。

在本文中，提及“约”某值或参数包括了涉及该值或参数本身的方面。举例而言，提及“约X”的描述包括了“X”的方面。

如用于本文中和所附权利要求中，除非上下文明确地表示相反，单数形式“一(个/种…)(a)”或“所述/该(the)”包括了对复数的提及。应理解本文中所述的发明的各方面包括了“由…组成(consisting)”和/或“基本上由…组成(consistingessentiallyof)”的方面。

除非另行定义或上下文明确指出，本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含意。

发明详述

具有C-4二羧酸转运蛋白活性的多肽

本发明涉及具有C4-二羧酸转运蛋白活性的分离的多肽。在一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽选自：

(a)多肽，其与SEQIDNO:2、4或6，或其成熟多肽序列具有至少65%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件下与SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链杂交；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，或其成熟多肽编码序列具有至少65%序列同一性；

(d)SEQIDNO:2、4或6，或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和

(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。

在另一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽选自：

(a)多肽，其与SEQIDNO:2，或其成熟多肽序列具有至少65%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件下与SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链杂交；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1，或其成熟多肽编码序列具有至少65%序列同一性；

(d)SEQIDNO:2，或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和

(a)多肽，其与SEQIDNO:4，或其成熟多肽序列具有至少65%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件下与SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链杂交；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:3，或其成熟多肽编码序列具有至少65%序列同一性；

(d)SEQIDNO:4，或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和

(a)多肽，其与SEQIDNO:6，或其成熟多肽序列具有至少65%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件下与SEQIDNO:5，其成熟多肽编码序列，或前述序列的全长互补链杂交；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:5，或其成熟多肽编码序列具有至少65%序列同一性；

(d)SEQIDNO:6，或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和

在一些这些方面，所述分离的多肽具有氨基酸序列，所述氨基酸序列与SEQIDNO:2，或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性，并具有C4-二羧酸转运蛋白活性。在一个方面，所述多肽包含氨基酸序列，所述氨基酸序列与SEQIDNO:2，或其成熟多肽序列相差不多于十个氨基酸，例如五个氨基酸，四个氨基酸，三个氨基酸，两个氨基酸，或一个氨基酸。

在一个方面，所述多肽包含或组成为SEQIDNO:2的氨基酸序列，SEQIDNO:2的成熟多肽序列，其等位变体，或前述序列的具有C4-二羧酸转运蛋白活性的片段。在另一个方面，所述多肽包含或组成为SEQIDNO:2的氨基酸序列。在另一个方面，所述多肽包含或组成为SEQIDNO:2的成熟多肽序列。在另一个优选的方面，所述多肽包含或组成为SEQIDNO:2的氨基酸62至397或69至397。

在一些这些方面，所述分离的多肽具有氨基酸序列，所述氨基酸序列与SEQIDNO:4，或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性，并具有C4-二羧酸转运蛋白活性。在一个方面，所述多肽包含氨基酸序列，所述氨基酸序列与SEQIDNO:4，或其成熟多肽序列相差不多于十个氨基酸，例如五个氨基酸，四个氨基酸，三个氨基酸，两个氨基酸，或一个氨基酸。

在一个方面，所述多肽包含或组成为SEQIDNO:4的氨基酸序列，SEQIDNO:4的成熟多肽序列，其等位变体，或前述序列的具有C4-二羧酸转运蛋白活性的片段。在另一个方面，所述多肽包含或组成为SEQIDNO:4的氨基酸序列。在另一个方面，所述多肽包含或组成为SEQIDNO:4的成熟多肽序列。在另一个优选的方面，所述多肽包含或组成为SEQIDNO:2的氨基酸52至418。

在一些这些方面，所述分离的多肽具有氨基酸序列，所述氨基酸序列与SEQIDNO:6，或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性，并具有C4-二羧酸转运蛋白活性。在一个方面，所述多肽包含氨基酸序列，所述氨基酸序列与SEQIDNO:6，或其成熟多肽序列相差不多于十个氨基酸，例如五个氨基酸，四个氨基酸，三个氨基酸，两个氨基酸，或一个氨基酸。

在一个方面，所述多肽包含或组成为SEQIDNO:6的氨基酸序列，SEQIDNO:6的成熟多肽序列，其等位变体，或前述序列的具有C4-二羧酸转运蛋白活性的片段。在另一个方面，所述多肽包含或组成为SEQIDNO:6的氨基酸序列。在另一个方面，所述多肽包含或组成为SEQIDNO:6的成熟多肽序列。在另一个优选的方面，所述多肽包含或组成为SEQIDNO:6的氨基酸69至397。

在一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链(参见，例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。

在另一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链。

在另一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:5，其成熟多肽编码序列，或前述序列的全长互补链。

在另一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸与SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸与SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述具有C4-二羧酸转运蛋白活性的分离的多肽由多核苷酸编码，所述多核苷酸与SEQIDNO:5，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述多肽由SEQIDNO:1、3或5，或其成熟多肽编码序列编码。在一个方面，所述多肽由SEQIDNO:1或其成熟多肽编码序列编码。在一个方面，所述多肽由SEQIDNO:1编码。在一个方面，所述多肽由SEQIDNO:3或其成熟多肽编码序列编码。在一个方面，所述多肽由SEQIDNO:3编码。在一个方面，所述多肽由SEQIDNO:5或其成熟多肽编码序列编码。在一个方面，所述多肽由SEQIDNO:5编码。在一个方面，所述多肽由SEQIDNO:1、3或5的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面，所述多肽由SEQIDNO:1的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面，所述多肽由SEQIDNO:3的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面，所述多肽由SEQIDNO:5的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。

在一个方面，所述分离的多肽是SEQIDNO:2、4或6，或其成熟多肽编码序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体。在一个方面，所述多肽是SEQIDNO:2的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述多肽是SEQIDNO:2的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述多肽是SEQIDNO:4的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述多肽是SEQIDNO:4的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述多肽是SEQIDNO:6的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述多肽是SEQIDNO:6的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或***的变体。

优选地，氨基酸改变的性质是较不重要的(ofaminornature)，即保守的氨基酸取代或***，其不显著影响蛋白质的折叠和/或活性；通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

或者，氨基酸改变具有这样的性质：使多肽的物理化学性质改变。例如，氨基酸改变可改善多肽的热稳定性，改变底物特异性，改变最适pH等。

能够根据本领域已知的方法，例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变引入到分子中的每个残基，并且测试所得突变分子的C4-二羧酸转运蛋白活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来确定。参见例如deVos等,1992,Science255:306-312；Smith等,1992,J.Mol.Biol.224:899-904；Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断，所述多肽与亲本多肽相关。

能够使用已知的诱变、重组和/或改组(shuffling)方法接着进行有关的筛选方法，例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57；Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156；WO95/17413；或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或***。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等,1991,Biochemistry30:10832-10837；美国专利No.5,223,409；WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145；Ner等,1988,DNA7:127)。

诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域中的标准方法快速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。

在一些方面，SEQIDNO:2、4或6，或其成熟多肽序列的氨基酸取代、缺失和/或***的总数不多于10，例如不多于1，2，3，4，5，6，7，8或9。

在另一个方面，所述多肽是SEQIDNO:2、4或6，或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述多肽是SEQIDNO:2或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述片段含有SEQIDNO:2的至少337个氨基酸残基，例如至少357个氨基酸残基，或至少377个氨基酸残基。在另一个方面，所述多肽是SEQIDNO:4或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述片段含有SEQIDNO:4的至少355个氨基酸残基，例如至少375个氨基酸残基，或至少395个氨基酸残基。在另一个方面，所述多肽是SEQIDNO:6或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述片段含有SEQIDNO:6的至少337个氨基酸残基，例如至少357个氨基酸残基，或至少377个氨基酸残基。

所述多肽可为杂合的多肽，其中一个多肽的一部分融合于另一个多肽的一部分的N端或C端。

所述多肽可为融合多肽或可切割的融合多肽，其中另一种多肽融合于本发明多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合的多肽。产生融合多肽的技术是本领域已知的，并包括连接编码多肽的编码序列以使它们符合读框(inframe)，并且使融合多肽的表达在相同启动子和终止子的调控下。融合蛋白亦可使用内蛋白(intein)技术构建，其中融合物在翻译后产生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。

融合多肽还可以包含在两个多肽之间的切割位点。一旦分泌了融合多肽，就切割所述位点，释放所述两个多肽。切割位点的实例包括，但不限于，Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381；Eaton等,1986,Biochem.25:505-512；Collins-Racie等,1995,Biotechnology13:982-987；Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248；以及Stevens,2003,DrugDiscoveryWorld4:35-48中公开的位点。

具有C4-二羧酸转运蛋白活性的多肽的来源

本发明的具有C4-二羧酸转运蛋白活性的多肽(例如SEQIDNO:2、4或6，或其成熟多肽序列的多肽)可获得自任何属的微生物。就本发明而言，如用于本文中的、与给定的来源相联的术语“获得自”，意思应为由多核苷酸编码的多肽由所述来源产生，或由其中***了来自所述来源的多核苷酸的株产生。在一个方面，从给定来源获得的多肽分泌至胞外。

所述多肽可为细菌多肽。例如，所述多肽可为***多肽如具有C4-二羧酸转运蛋白活性的芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)或链霉菌属(Streptomyces)多肽；或革兰氏阴性细菌多肽，如具有C4-二羧酸转运蛋白活性的弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)或脲原体属(Ureaplasma)多肽。

在一个方面，所述多肽是嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。

在另一个方面，所述多肽是似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcuspyogenes)、***链球菌(Streptococcusuberis)或马链球菌兽瘟亚种(Streptococcusequisubsp.Zooepidemicus)多肽。

在另一个方面，所述多肽是不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多肽。

所述多肽亦可为真菌多肽。例如，所述多肽可为酵母多肽，如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽，或丝状真菌多肽，如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。

在另一个方面，所述多肽是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多肽。

在另一个方面，所述多肽是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Asperigullusfoetidus)、烟曲霉(Aspergillusfumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉、Chrysosporiuminops、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、Chrysosporiummerdarium、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporiumzonatum、杆孢状镰孢(Fusariumbactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢壳(Thielaviamicrospora)、卵孢梭孢壳(Thielaviaovispora)、Thielaviaperuviana、毛梭孢壳(Thielaviasetosa)、瘤孢梭孢壳(Thielaviaspededonium)、Thielaviasubthermophila、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多肽。

在另一个方面，所述多肽是曲霉属多肽，例如棘孢曲霉多肽，如来自大肠杆菌NRRLB-50400、大肠杆菌NRRLB-50388或大肠杆菌NRRLB-50401的棘孢曲霉多肽。

在另一个方面，所述多肽是SEQIDNO:2或SEQIDNO:4的棘孢曲霉多肽。在另一个方面，所述多肽是SEQIDNO:2的棘孢曲霉多肽。在另一个方面，所述多肽是SEQIDNO:4的棘孢曲霉多肽。

可理解的是对于前述的种，本发明包含完全和不完全阶段(perfectandimperfectstates)，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。

这些种的菌株在许多培养物保藏中心对于公众能够容易地取得，所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。

亦可使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物鉴定和获得所述多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。然后可通过相似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码所述多肽的多核苷酸。一旦用探针检测到编码所述多肽的多核苷酸，就能够使用本领域普通技术人员公知的技术将所述多核苷酸分离或克隆(参见，例如，Sambrook等，1989，见上文)。

多核苷酸

本发明亦涉及编码本发明的多肽的分离的多核苷酸(例如，编码任何涉及SEQIDNO:2、4或6的方面的多肽的分离的多核苷酸)。

用于分离或克隆编码编码多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段，从而实现从这种基因组DNA克隆多核苷酸。参见，例如，Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法，如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription；LAT)和基于核苷酸序列的扩增(NASBA)。可以从曲霉属(例如棘孢曲霉)菌株，或其他或相关生物体克隆所述多核苷酸，并且因此可为所述核苷酸序列的多肽编码区的等位变体或种变体(speciesvariant)。

本发明亦涉及分离的多核苷酸，其包含或组成为核苷酸序列，所述核苷酸序列与SEQIDNO:1、3或5，或其成熟多肽编码序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性，并编码具有C4-二羧酸转运蛋白活性的多肽。

在一个方面，所述分离的多核苷酸包含或组成为核苷酸序列，所述核苷酸序列与SEQIDNO:1或其成熟多肽编码序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性，并编码具有C4-二羧酸转运蛋白活性的多肽。

在一个方面，所述分离的多核苷酸包含或组成为核苷酸序列，所述核苷酸序列与SEQIDNO:3或其成熟多肽编码序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性，并编码具有C4-二羧酸转运蛋白活性的多肽。

在一个方面，所述分离的多核苷酸包含或组成为核苷酸序列，所述核苷酸序列与SEQIDNO:5或其成熟多肽编码序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性，并编码具有C4-二羧酸转运蛋白活性的多肽。

修饰编码本发明多肽的多核苷酸对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽，例如，比活性、热稳定性、最适pH等方面不同的变体。可以在作为SEQIDNO:1、3或5的成熟多肽编码序列存在的多核苷酸，例如其亚序列的基础上，和/或通过引入如下核苷酸取代来构建变体序列：所述取代不产生所述多肽的氨基酸序列的变化，但是符合意欲产生酶的宿主生物体的密码子选择；或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述，参见，例如，Ford等,1991,ProteinExpressionandPurification2:95-107。

本发明亦涉及编码本发明的多肽的分离的多核苷酸，所述多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1、3或5；SEQIDNO:1、3或5的成熟多肽编码序列；其全长互补链；或前述序列的等位变体或亚序列(参见，例如Sambrook等，1989，见上文)，如本文中所定义。

在一个方面，所述分离的多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1；SEQIDNO:1的成熟多肽编码序列；其全长互补链；或前述序列的等位变体或亚序列(参见，例如Sambrook等，1989，见上文)，如本文中所定义。

在一个方面，所述分离的多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:3或1；SEQIDNO:3的成熟多肽编码序列；其全长互补链；或前述序列的等位变体或亚序列(参见，例如Sambrook等，1989，见上文)，如本文中所定义。

在一个方面，所述分离的多核苷酸在非常低严格条件，低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:5或1；SEQIDNO:5的成熟多肽编码序列；其全长互补链；或前述序列的等位变体或亚序列(参见，例如Sambrook等，1989，见上文)，如本文中所定义。

在一个方面，所述多核苷酸包含或组成为SEQIDNO:1，SEQIDNO:1的成熟多肽编码序列，或大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的序列，或SEQIDNO:1编码SEQIDNO:2的具有C4-二羧酸转运蛋白活性的片段(例如SEQIDNO:2的氨基酸69-397或62至397)的亚序列，如SEQIDNO:1的核苷酸204至1194或184至1194的多核苷酸。

在另一个方面，所述多核苷酸包含或组成为SEQIDNO:3，SEQIDNO:3的成熟多肽编码序列，或大肠杆菌NRRLB-50388中包含的质粒pAaC4T521中包含的序列，或SEQIDNO:3编码SEQIDNO:4的具有C4-二羧酸转运蛋白活性的片段(例如SEQIDNO:4的氨基酸18-418)的亚序列，如SEQIDNO:3的核苷酸52至1257的多核苷酸。

在另一个方面，所述多核苷酸包含或组成为SEQIDNO:5，SEQIDNO:5的成熟多肽编码序列，或大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的序列，或SEQIDNO:5编码SEQIDNO:6的具有C4-二羧酸转运蛋白活性的片段(例如SEQIDNO:6的氨基酸69-397)的亚序列，如SEQIDNO:5的核苷酸205至1194的多核苷酸。

SEQIDNO:1、3或5的多核苷酸，或亚序列，以及SEQIDNO:2、4或6的氨基酸序列，或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有C4-二羧酸转运蛋白活性的多肽的DNA。具体而言，根据标准的Southern印迹方法，可将这些探针用于与感兴趣的属或种的基因组DNA或cDNA杂交，以鉴定和分离其中相应的基因。这些探针可明显短于完整序列，但长度上应为至少14个核苷酸，例如至少25个核苷酸，至少35个核苷酸，或至少70个核苷酸。优选地，所述核酸探针为至少100个核苷酸的长度，例如至少200个核苷酸，至少300个核苷酸，至少400个核苷酸，或至少500个核苷酸的长度，至少600个核苷酸，例如至少700个核苷酸，至少800个核苷酸，或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以供检测相应的基因(例如，用³²P、³H、³⁵S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。

可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码具有C4-二羧酸转运蛋白活性的多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术分离来自这些其它株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的担载体材料并且固定于其上。为了鉴定与SEQIDNO:1、3或5，或其亚序列同源的克隆或DNA，所述担载体材料优选用于Sounthern印迹。

就本发明而言，杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交，所述核酸探针对应于SEQIDNO:1、3或5，SEQIDNO:1、3或5的成熟多肽编码序列，其全长互补链；或前述序列的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。

在一个方面，核酸探针是SEQIDNO:1、3或5。在另一个方面，核酸探针是SEQIDNO:1、3或5的成熟多肽编码序列。在另一个方面，核酸探针是编码SEQIDNO:2、4或6的多肽，或其片段的多核苷酸。在另一个方面，核酸探针是SEQIDNO:1。在另一个方面，核酸探针是SEQIDNO:3。在另一个方面，核酸探针是SEQIDNO:5。在另一个方面，核酸探针是大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的多核苷酸，其中所述多核苷酸编码具有C4-二羧酸转运蛋白活性的多肽。在另一个方面，核酸探针是大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的成熟多肽编码序列，其中所述多肽具有C4-二羧酸转运蛋白活性。在另一个方面，核酸探针是大肠杆菌NRRLB-50388中包含的质粒pAaC4T521中包含的多核苷酸，其中所述多核苷酸编码具有C4-二羧酸转运蛋白活性的多肽。在另一个方面，核酸探针是大肠杆菌NRRLB-50388中包含的质粒pAaC4T521中包含的成熟多肽编码序列，其中所述多肽具有C4-二羧酸转运蛋白活性。在另一个方面，核酸探针是大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的多核苷酸，其中所述多核苷酸编码具有C4-二羧酸转运蛋白活性的多肽。在另一个方面，核酸探针是大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的成熟多肽编码序列，其中所述多肽具有C4-二羧酸转运蛋白活性。

对于长度至少100个核苷酸的长探针，将非常低至非常高的严格条件定义为在42℃，在5XSSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA中，并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺，根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2XSSC、0.2%SDS在45℃(非常低严格性)，在50℃(低严格性)，在55℃(中严格性)，在60℃(中-高严格性)，在65℃(高严格性)，和在70℃(非常高严格性)将载体材料最终洗涤三次，每次15分钟。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严格条件定义为在比使用根据Bolton和McCarthy计算法(1962,Proc.Natl.Acad.Sci.USA48:1390)计算的T_m低大约5℃至大约10℃，在0.9MNaCl，0.09MTris-HClpH7.6，6mMEDTA，0.5%NP-40，1×Denhardt溶液，1mM焦磷酸钠(sodiumpyrophosphate)，1mM磷酸二氢钠(sodiummonobasicphosphate)，0.1mMATP和0.2mg每ml的酵母RNA中，根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6×SSC加0.1%SDS中最终洗涤一次15分钟，并用6×SSC在比计算的T_m低5℃至10℃的温度洗涤两次，每次15分钟。

核酸构建体

本发明还涉及核酸构建体，所述核酸构建体包含可操作地连接于一个或多个(例如两个、几个)调控序列的本发明的多核苷酸，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。本发明亦涵盖利用核酸构建体的宿主细胞和方法，所述核酸构建体包含连接于一个或多个调控序列、编码本文中所述的C4-二羧酸转运蛋白(和/或本文中所述的苹果酸脱氢酶，或丙酮酸羧化酶)的异源多核苷酸，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导表达。此类核酸构建体可用于本文中所述的任何宿主细胞和方法中。

可以用许多方式操作本文中所述的多核苷酸以提供多肽的表达。依赖于表达载体，在将多核苷酸***载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

调控序列可为启动子序列，其是由用于表达编码本发明的多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。

本文中所述的每个多核苷酸可以可操作地连接于对于所述多核苷酸是外源的启动子。例如，在一个方面，编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对于所述多核苷酸是外源的启动子。在另一个方面，编码苹果酸脱氢酶的异源多核苷酸可操作地连接于对于所述多核苷酸是外源的启动子。在一个方面，编码丙酮酸羧化酶的异源多核苷酸可操作地连接于对于所述多核苷酸是外源的启动子。

用于指导本发明的核酸构建体在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731)，以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的启动子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中；和在Sambrook等,1989,见上文描述。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(一种修饰的启动子，其来自曲霉属中编码中性α-淀粉酶的基因，其中未翻译的前导序列已由曲霉属(Aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代；非限制性实例包括修饰的启动子，其来自黑曲霉中编码中性α-淀粉酶的基因，其中未翻译的前导序列已由构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代)；和它们的突变的、截短的和杂合的启动子。

在酵母宿主中，有用的启动子从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。

调控序列也可以是合适的转录终止子序列，其由宿主细胞识别以终止转录。所述终止子序列与编码所述多肽的多核苷酸的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。

对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。

调控序列还可以是合适的前导序列，当被转录时其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在所选宿主细胞中有功能的任何前导序列。

对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。

对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

调控序列也可以是聚腺苷酸化序列，其是与多核苷酸的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在所选宿主细胞中有功能的任何聚腺苷酸化序列。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。

对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。

调控序列还可以是信号肽编码区，其编码与多肽的N端相连的信号肽，并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列，其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是，编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者，外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而，可使用指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列。

对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。

对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。

调控序列还可以是前肽编码序列，其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的，并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)，枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。

当信号肽和前肽序列二者均出现在多肽的N端时，将前肽序列置于紧接着(nextto)多肽N端，并且将信号肽序列置于紧接着前肽序列的N端。

同样理想的是添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节***的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些***。原核***中的调节***包括lac、tac和trp操纵基因***。在酵母中，可使用ADH2***或GAL1***。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核***中，这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的多核苷酸将与调节序列可操作地连接。

表达载体

本发明亦涉及包含本发明的多核苷酸、启动子和转录和翻译终止信号的重组表达载体。本发明亦涵盖利用重组表达载体的重组宿主细胞和方法，所述重组表达载体包含编码C4-二羧酸转运蛋白(和/或苹果酸脱氢酶或丙酮酸羧化酶)的异源多核苷酸，以及启动子和转录和翻译终止信号。此类重组表达载体可用于本文中所述的任何宿主细胞和方法中。

多种核苷酸和调控序列可以结合在一起以产生重组表达载体，所述表达载体可以包括一个或多个(例如两个、几个)方便的限制位点以允许在这些位点***或取代编码多肽的多核苷酸。可供选择的是，可以通过在适当的用于表达的载体中***包含所述序列的多核苷酸或核酸构建体来表达所述多核苷酸。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的表达调控序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。

在一个方面，每个编码本文中所述的C4-二羧酸转运蛋白、苹果酸脱氢酶，和/或丙酮酸羧化酶的多核苷酸包含于各自独立的载体上。在一个方面，至少两个所述多核苷酸包含于单一的载体上。在一个方面，所有编码C4-二羧酸转运蛋白，苹果酸脱氢酶，和丙酮酸羧化酶的多核苷酸包含于单一的载体上。

载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整DNA(totalDNA)，或可以使用转座子(transposon)。

载体优选含有一个或多个(例如两个、几个)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。

细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性的标记，所述抗生素抗性如氨苄青霉素、氯霉素、卡那霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。

载体优选含有元件，其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。

为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的多核苷酸，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应含有足够数量的核酸，如100至10,000碱基对，400至10,000碱基对，和800至10,000碱基对，其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列，其与宿主细胞基因组中的目标序列同源。此外，整合元件可以是非编码或编码的多核苷酸。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点，ARS1,ARS4,ARS1和CEN3的组合，和ARS4和CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67；Cullen等,1987,NucleicAcidsRes.15:9163-9175；WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。

可以将多于一个拷贝的本发明的多核苷酸***宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择性标记基因包括于多核苷酸，其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝，且由此含有多核苷酸的额外拷贝的细胞。

用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等,1989,见上文)。

苹果酸脱氢酶和编码苹果酸脱氢酶的多核苷酸

在重组宿主细胞及其使用方法的一些方面，所述宿主细胞具有苹果酸脱氢酶活性。在一些方面，所述宿主细胞包含编码苹果酸脱氢酶的异源多核苷酸。所述苹果酸脱氢酶可为任何适于实施本发明的苹果酸脱氢酶。在一个方面，所述苹果酸脱氢酶是存在于宿主细胞胞质溶胶中的酶。

在本文所述的重组宿主细胞和方法的一个方面，所述苹果酸脱氢酶是：(a)苹果酸脱氢酶，其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性；(b)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:11或其成熟多肽编码序列，(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:11或其成熟多肽编码序列，(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的苹果酸脱氢酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。

在一个方面，所述苹果酸脱氢酶包含或组成为氨基酸序列，所述氨基酸序列与SEQIDNO:12或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，或至少99%序列同一性。在一个方面，所述苹果酸脱氢酶包含氨基酸序列，所述氨基酸序列与SEQIDNO:12或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。

在一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列，SEQIDNO:12的成熟多肽序列，其等位变体，或前述的具有苹果酸脱氢酶活性的片段。在另一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列。在另一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的成熟多肽序列。在另一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸1至330。

在一个方面，所述苹果酸脱氢酶由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：(i)SEQIDNO:11或其成熟多肽编码序列，(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链(参见，例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。

在一个方面，所述苹果酸脱氢酶由多核苷酸编码，所述多核苷酸与(iv)SEQIDNO:11或其成熟多肽编码序列，(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述苹果酸脱氢酶由SEQIDNO:11，或其成熟多肽编码序列编码。在一个方面，所述苹果酸脱氢酶由SEQIDNO:11编码。在一个方面，所述苹果酸脱氢酶由SEQIDNO:11的成熟多肽编码序列编码。在一个方面，所述苹果酸脱氢酶由SEQIDNO:11的亚序列编码，其中所述亚序列编码具有苹果酸脱氢酶活性的多肽。在一个方面，所述亚序列含有SEQIDNO:11的至少885个核苷酸，例如至少930个核苷酸或至少975个核苷酸。

在一个方面，所述苹果酸脱氢酶为SEQIDNO:12或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体，如上文所述。在一个方面，所述苹果酸脱氢酶为SEQIDNO:12的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述苹果酸脱氢酶为SEQIDNO:12的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一些方面，SEQIDNO:12或其成熟多肽序列的氨基酸取代、缺失和/或***的总数不多于10，例如不多于1，2，3，4，5，6，7，8或9。

在另一个方面，所述苹果酸脱氢酶是SEQIDNO:12或其成熟多肽序列的片段，其中所述片段具有苹果酸脱氢酶活性。在一个方面，所述的片段含有SEQIDNO:12的至少295个氨基酸残基，例如至少310个氨基酸残基，或至少325个氨基酸残基。

所述苹果酸脱氢酶亦可为苹果酸脱氢酶的等位变体或人工变体。

所述苹果酸脱氢酶亦可包括融合多肽或可切割的融合多肽，如上文所述。

用于分离或克隆编码苹果酸脱氢酶的多核苷酸的技术如上文中所述。

SEQIDNO:11的多核苷酸；或其亚序列；以及SEQIDNO:12的氨基酸序列；或其片段；可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码苹果酸脱氢酶的DNA，如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码苹果酸脱氢酶的DNA，如上文中所述。

在一个方面，所述核酸探针为SEQIDNO:11。在另一个方面，所述核酸探针为SEQIDNO:11的成熟多肽编码序列。在另一个方面，所述核酸探针是多核苷酸序列，其编码SEQIDNO:12，其成熟多肽序列或前述序列的片段。

对于长度至少100个核苷酸的长探针，非常低至非常高的严格条件和洗涤条件如上文中所述定义。对于长度大约15个核苷酸至大约70个核苷酸的短探针，严格条件和洗涤条件如上文中所述定义。

所述苹果酸脱氢酶可获得自任何属的微生物。在一个方面，所述苹果酸脱氢酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌苹果酸脱氢酶。在另一个方面，所述苹果酸脱氢酶是米曲霉苹果酸脱氢酶，例如SEQIDNO:12的米曲霉苹果酸脱氢酶。

其它可用于实施本发明的苹果酸脱氢酶包括但不限于：构巢曲霉苹果酸脱氢酶(AN6717.1；SIMS等,2004,Mycol.Res.108:853-857)；黑曲霉苹果酸脱氢酶(An16g00120；Pel等,2007,NatureBiotechnology25:221-231)；Phytophthorainfestans苹果酸脱氢酶(PITG13614.1；Calcagno等,2009,MycologicalResearch113:771-781)；酿酒酵母苹果酸脱氢酶(YKL085W；McAlister-Henn和Thompson,1987,JBacteriol.169:5157-5166)；埃默森踝节菌(Talaromycesemersonii)苹果酸脱氢酶(AF439996,AF487682；Maloney等,2004,Eur.J.Biochem.271:3115-3126)；以及玉蜀黍黑粉菌(Ustilagomaydis)苹果酸脱氢酶(um00403,um11161；McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77–S87)，SEQIDNO:20的米曲霉苹果酸脱氢酶(其由SEQIDNO:19的核苷酸序列所编码；参见美国申请号12/870,523，标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”，2010年8月27日提交)，或任何相应的参考文献中所述的苹果酸脱氢酶的任何方面。

本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于如上所述的苹果酸脱氢酶多肽序列和多核苷酸序列。举例而言，在一个方面，所述苹果酸脱氢酶是(a)苹果酸脱氢酶，其与SEQIDNO:20或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；(b)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸在低严格条件，例如中等严格条件，中等-高严格条件，高严格条件或非常高严格条件下与以下杂交：(i)SEQIDNO:19或其成熟多肽编码序列，(ii)SEQIDNO:19的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸与(iv)SEQIDNO:19或其成熟多肽编码序列，(v)SEQIDNO:19的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；(d)SEQIDNO:20或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的苹果酸脱氢酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。

所述苹果酸脱氢酶亦可从其它来源鉴定和获取，所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品，如上文中所述。

丙酮酸羧化酶和编码丙酮酸羧化酶的多核苷酸

在重组宿主细胞及其使用方法的一些方面，所述宿主细胞具有丙酮酸羧化酶活性。在一些方面，所述宿主细胞包含编码丙酮酸羧化酶的异源多核苷酸。所述丙酮酸羧化酶可为任何适于实施本发明的丙酮酸羧化酶。在一个方面，所述丙酮酸羧化酶是存在于宿主细胞胞质溶胶中的酶。

在本文所述的重组宿主细胞和方法的一个方面，所述丙酮酸羧化酶是：(a)丙酮酸羧化酶，其与SEQIDNO:16或其成熟多肽序列具有至少60%序列同一性；(b)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:15或其成熟多肽编码序列，(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:15或其成熟多肽编码序列，(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:16或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的丙酮酸羧化酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段。

在一个方面，所述丙酮酸羧化酶包含或组成为氨基酸序列，所述氨基酸序列与SEQIDNO:16或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，或至少99%序列同一性。在一个方面，所述丙酮酸羧化酶包含氨基酸序列，所述氨基酸序列与SEQIDNO:16或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。

在一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:16的氨基酸序列，SEQIDNO:16的成熟多肽序列，其等位变体，或前述序列的具有丙酮酸羧化酶活性的片段。在另一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:16的氨基酸序列。在另一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:16的成熟多肽序列。在另一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:16的氨基酸1至1193。

在一个方面，所述丙酮酸羧化酶由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：(i)SEQIDNO:15或其成熟多肽编码序列，(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链(参见，例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。

在一个方面，所述丙酮酸羧化酶由多核苷酸编码，所述多核苷酸与(iv)SEQIDNO:15或其成熟多肽编码序列，(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述丙酮酸羧化酶由SEQIDNO:15或其成熟多肽编码序列编码。在一个方面，所述丙酮酸羧化酶由SEQIDNO:15编码。在一个方面，所述丙酮酸羧化酶由SEQIDNO:15的成熟多肽编码序列编码。在一个方面，所述丙酮酸羧化酶由SEQIDNO:15的亚序列编码，其中所述亚序列编码具有丙酮酸羧化酶活性的多肽。在一个方面，所述亚序列含有SEQIDNO:15的至少3060个核苷酸，例如至少3240个核苷酸或至少3420个核苷酸。

在一个方面，所述丙酮酸羧化酶为SEQIDNO:16或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体，如上文所述。在一个方面，所述丙酮酸羧化酶为SEQIDNO:16的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一个方面，所述丙酮酸羧化酶为SEQIDNO:16的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或***的变体。在一些方面，SEQIDNO:16或其成熟多肽序列的氨基酸取代、缺失和/或***的总数不多于16，例如不多于1，2，3，4，5，6，7，8或9。

在另一个方面，所述丙酮酸羧化酶是SEQIDNO:16或其成熟多肽序列的片段，其中所述片段具有丙酮酸羧化酶活性。在一个方面，所述的片段含有SEQIDNO:16的至少1020个氨基酸残基，例如至少1080个氨基酸残基，或至少1140个氨基酸残基。

所述丙酮酸羧化酶亦可为丙酮酸羧化酶的等位变体或人工变体。

所述丙酮酸羧化酶亦可包括融合多肽或可切割的融合多肽，如上文所述。

所述丙酮酸羧化酶可为线粒体丙酮酸羧化酶的变体，使得体内输入线粒体减少，由此增加所述丙酮酸羧化酶在胞质溶胶中的水平。

用于分离或克隆编码丙酮酸羧化酶的多核苷酸的技术如上文中所述。

SEQIDNO:15的多核苷酸；或其亚序列；以及SEQIDNO:16的氨基酸序列；或其片段；可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码丙酮酸羧化酶的DNA，如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码丙酮酸羧化酶的DNA，如上文所述。

在一个方面，所述核酸探针为SEQIDNO:15。在另一个方面，所述核酸探针为SEQIDNO:15的成熟多肽编码序列。在另一个方面，所述核酸探针是多核苷酸序列，其编码SEQIDNO:16，其成熟多肽序列或前述序列的片段。

所述丙酮酸羧化酶可获得自任何属的微生物。在一个方面，所述丙酮酸羧化酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌丙酮酸羧化酶。在另一个方面，所述丙酮酸羧化酶是米曲霉丙酮酸羧化酶，例如SEQIDNO:16的米曲霉丙酮酸羧化酶。

其它可用于实施本发明的丙酮酸羧化酶包括但不限于：棒曲霉(Aspergillusclavatus)NRRL1丙酮酸羧化酶(XP_001271664;DirectSubmission,Submitted(26-OCT-2006),TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA)；烟曲霉Af293丙酮酸羧化酶(XP_752054;Nierman等,2005,Nature438:1151-1156)；构巢曲霉FGSCA4丙酮酸羧化酶(XP_662066;Galagan等,2005,Nature438:1105-1115)；黑曲霉丙酮酸羧化酶(An15g02820;Pel等,2007,NatureBiotechnology25:221-231;ASPNG5061;Panneman等,(JUL-1998)提交至EMBL/GenBank/DDBJ数据库)；土曲霉丙酮酸羧化酶(O93918;DirectSubmission,Submitted(OCT-1998)TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA)；灰梨孢菌(Magnaporthegrisea)70-15丙酮酸羧化酶(XP_367852;DirectSubmission,Submitted(26-SEP-2005)BroadInstituteofMITandHarvard,320CharlesStreet,Cambridge,MA02142,USA)；粗糙脉孢菌OR74A丙酮酸羧化酶(XP_965636;Galagan等,2003,Nature422:859-868)；米根霉(Rhizopusoryzae)丙酮酸羧化酶(RO3G_06931.1)；酿酒酵母丙酮酸羧化酶(NP_009777;Gaffeau等,1996,Science274:546-547)；粟酒裂殖酵母丙酮酸羧化酶(NP_595900;DirectSubmission,Submitted(29-JUN-2007)EuropeanSchizosaccharomycesgenomesequencingproject,SangerInstitute,TheWellcomeTrustGenomeCampus,Hinxton,CambridgeCB101SA)；和玉蜀黍黑粉菌丙酮酸羧化酶(um01054;McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77-S87)。本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于其它如上所述的丙酮酸羧化酶多肽序列和多核苷酸序列。

所述丙酮酸羧化酶亦可从其它来源鉴定和获取，所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品，如上文中所述。

宿主细胞

如本文中所述，本发明还涉及重组宿主细胞，其包含本文中所述的多核苷酸可操作地连接于一个或多个(例如两个、几个)调控序列，所述调控序列指导本文中所述的多肽的产生。本发明还涵盖重组宿主细胞，其包含一个或多个本文中所述的多核苷酸，所述多核苷酸可为可操作地连接于一个或多个调控序列，所述调控序列指导一种或多种所述多肽的表达，以供重组产生C4-二羧酸，以及本发明涉及使用此类宿主细胞以供产生C4-二羧酸的方法。所述宿主细胞可包含任何一种或多种本文中所述的多核苷酸的组合。举例而言，在一个方面，所述重组宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸，并任选地包含编码苹果酸脱氢酶的异源多核苷酸，和/或编码丙酮酸脱羧酶的异源多核苷酸；其中所述宿主细胞与不含有所述编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞在相同条件下培养时相比产生(或能够产生)更多量的C4-二羧酸。

在一个方面，所述重组宿主细胞包含：

(1)异源多核苷酸，其编码C4-二羧酸转运蛋白，如选自下组的C4-二羧酸转运蛋白：(a)C4-二羧酸转运蛋白，其与SEQIDNO:2、4或6，或其成熟多肽序列具有至少60%序列同一性；(b)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链；(c)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%序列同一性；(d)SEQIDNO:2、4或6，或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的C4-二羧酸转运蛋白变体；和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段；

(2)任选的异源第二多核苷酸，其编码苹果酸脱氢酶，如选自下组的苹果酸脱氢酶：(a)苹果酸脱氢酶，其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性；(b)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:11或其成熟多肽编码序列，(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:11或其成熟多肽编码序列，(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的苹果酸脱氢酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段；和

(3)任选的异源第三多核苷酸，其编码丙酮酸羧化酶，如选自下组的丙酮酸羧化酶：(a)丙酮酸羧化酶，其与SEQIDNO:16或其成熟多肽序列具有至少60%序列同一性；(b)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:15或其成熟多肽编码序列，(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:15或其成熟多肽编码序列，(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:16或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或***的丙酮酸羧化酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段；

其中所述宿主细胞与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞在相同条件下培养时相比产生(或能够产生)更多量的C4-二羧酸。

在一个方面，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3或5，或任何其所述的方面)和编码苹果酸脱氢酶的异源多核苷酸。在本发明中，所述苹果酸脱氢酶可为任何适于实施本发明的苹果酸脱氢酶，如上文所述。在另一个方面，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3或5，或任何其所述的方面)和编码丙酮酸羧化酶的异源多核苷酸。在本发明中，所述丙酮酸羧化酶可为任何适于实施本发明的丙酮酸羧化酶，如上文所述。具体而言，所述丙酮酸羧化酶优选为存在于宿主细胞胞质溶胶中的酶。在一个方面，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3或5，或任何其所述的方面)，编码苹果酸脱氢酶的第二异源多核苷酸，和编码丙酮酸羧化酶的第三异源多核苷酸。

将包含一个或多个(例如两个、几个)的多核苷酸的一个构建体或载体(或多个构建体或载体)导入宿主细胞，使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”涵盖任何亲本细胞的后代，其由于在复制中发生的突变而与亲本细胞不同。在一些情况下，宿主细胞的选择会很大程度上依赖于编码多肽的基因及其来源。下文中所述的方面适用于宿主细胞本身，以及使用宿主细胞的方法。

所述宿主细胞可为任何能够重组产生本发明的多肽的细胞，例如原核细胞或真核细胞，和/或任何能够重组产生C4-二羧酸(例如苹果酸)的细胞(例如任何丝状真菌细胞)。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。***包括但不限于，芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于，弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞，包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞，包括但不限于，似马链球菌、酿脓链球菌、***链球菌和马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞，包括但不限于，不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。

可通过如下方法实现将DNA引入到芽孢杆菌属细胞：例如原生质体转化(参见，例如，Chang和Cohen,1979,Mol.Gen.Genet.168:111-115)，使用感受态细胞(参见，例如，Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221)，电穿孔(参见，例如，Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见，例如，Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞：例如原生质体转化(参见，例如，Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见，例如，Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞：例如原生质体转化和电穿孔(参见，例如，Gong等,2004,FoliaMicrobiol.(Praha)49:399-405)，接合(参见，例如，Mazodier等,1989,J.Bacteriol.171:3583-3585)，或转导(参见，例如，Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞：例如电穿孔(参见，例如，Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见，例如，Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞：例如天然感受态(naturalcompetence)(参见，例如，Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297)，原生质体转化(参见，例如，Catt和Jollick,1991,Microbios.68:189-207)，电穿孔(参见，例如，Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见，例如，Clewell,1981,Microbiol.Rev.45:409-436)。然而，可以使用本领域已知的用于将DNA引入宿主细胞的任何方法。

宿主细胞还可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。

所述宿主细胞可为真菌细胞。“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby’sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用)和所有有丝***孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。

所述真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)和属于半知菌类(FungiImperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。

所述酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞，如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowialipolytica)细胞。

所述真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文，所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。

所述丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

所述丝状真菌宿主细胞可为棘孢曲霉、泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟蜡菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角质金孢子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、毡金孢子菌、Chrysosporiumqueenslandicum、热带金孢子菌、Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

在一个方面，所述宿主细胞是曲霉属宿主细胞。在另一个方面，所述宿主细胞是米曲霉。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork；Ito等,1983,J.Bacteriol.153:163；和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。

在一些方面，所述宿主细胞包含一种或多种(例如两种、几种)本文中所述的多核苷酸，其中所述宿主细胞与不含有所述一种或多种多核苷酸的宿主细胞在相同条件下培养时相比分泌(或能够分泌)增加水平的C4-二羧酸。在一些方面，所述宿主细胞与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞在相同条件下培养时相比，分泌和/或能够分泌增加至少5%，例如至少10%，至少15%，至少20%，至少25%，至少50%，至少100%，至少150%，至少200%，至少300%，或500%的水平的C4-二羧酸(例如苹果酸)。

在本文中所述的重组宿主细胞和方法的任何方面中，所述C4-二羧酸可为苹果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸，或其组合。在一些方面中，所述C4-二羧酸是苹果酸、琥珀酸或延胡索酸，或其组合。在一些方面中，所述C4-二羧酸是苹果酸或延胡索酸，或苹果酸和延胡索酸的组合。在一些方面中，所述C4-二羧酸是苹果酸。

在任何这些方面，所述宿主细胞以比理论值高至少10%，例如至少20%，至少30%，至少40%，至少50%，至少60%，至少70%，至少80%或至少90%的产率(yield)产生(和/或能够产生)C4-二羧酸。

在任何这些方面，所述重组宿主具有大于约0.1g/L每小时，例如，大于约0.2g/L每小时，0.5g/L每小时，0.6g/L每小时，0.7g/L每小时，0.8g/L每小时，0.9g/L每小时，1.0g/L每小时，1.1g/L每小时，1.2g/L每小时，1.3g/L每小时，1.5g/L每小时，1.75g/L每小时，2.0g/L每小时，2.25g/L每小时，2.5g/L每小时，或3.0g/L每小时；或约0.1g/L每小时至约2.0g/L每小时，例如，约0.3g/L每小时至约1.7g/L每小时，约0.5g/L每小时至约1.5g/L每小时，约0.7g/L每小时至约1.3g/L每小时，约0.8g/L每小时至约1.2g/L每小时，或约0.9g/L每小时至约1.1g/L每小时的C4-二羧酸体积生产力(volumetricproductivity)(例如苹果酸体积生产力)。

可将所述重组宿主细胞在适于产生C4-二羧酸转运蛋白、苹果酸脱氢酶或丙酮酸羧化酶的营养培养基中使用如下所述的本领域中公知的方法进行培养。

所述C4-二羧酸转运蛋白、苹果酸脱氢酶和丙酮酸羧化酶，及其活性，可使用本领域中公知的方法检测。这些检测方法可包括使用特异性抗体，酶产物的形成，或酶底物的消失。参见，例如Sambrook等,MolecularCloning:ALaboratoryManual,第3版,ColdSpringHarborLaboratory,NewYork(2001)；Ausubel等,CurrentProtocolsinMolecularBiology,JohnWileyandSons,Baltimore,MD(1999)；及Hanai等,Appl.Environ.Microbiol.73:7814-7818(2007))。

产生方法

本发明还涉及产生本文中所述的多肽(例如，包含或组成为SEQIDNO:2、4、6或其任何所述的方面的多肽)的方法，其包括：(a)在有助于产生多肽的条件下培养细胞，所述细胞以其野生型形式产生所述多肽；和(b)回收所述多肽。在一个方面，所述细胞是曲霉属的细胞。在另一个的方面，所述细胞是棘孢曲霉。在另一个的方面，所述细胞是大肠杆菌NRRLB50400、大肠杆菌NRRLB-50388或大肠杆菌NRRLB50401。

本发明还涉及产生本发明的多肽的方法，包括：(a)在有助于产生多肽的条件下培养本发明的重组宿主细胞，和(b)回收所述多肽。

使用本领域熟知的方法在适合于产生C4-二羧酸转运蛋白的营养培养基中培养宿主细胞。例如，可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养，和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中，该多肽能够从所述培养基中直接回收。如果多肽未分泌，其可从细胞裂解物(lysate)回收。

如上文中所述，可以使用本领域已知的对于多肽是特异性的方法来检测C4-二羧酸转运蛋白。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶试验(enzymeassay)可用于确定多肽的活性。

多肽可以使用本领域已知的方法回收。例如，多肽可以通过常规方法从营养培养基中回收，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。

多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或提取(参见，例如，ProteinPurification,J.-C.Janson和LarsRyden,editors,VCHPublishers,NewYork,1989)。

在另一个方面，不回收所述多肽，而是使用表达多肽的本发明的宿主细胞作为多肽的来源。

植物

本发明还涉及植物，例如，转基因植物、植物部分或植物细胞，其包含本发明的多肽，从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者，同样可以将含有该多肽的植物或植物部分用于改进食品或饲料的质量，例如，改进营养价值、适口性(palatability)和流变性质(rheologicalproperties)，或用于破坏抗营养因子。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses)，如草地早熟禾(meadowgrass)(蓝草(bluegrass)，早熟禾属(Poa))；饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium)；寒地型牧草(temperategrass)，如Agrostis(翦股颖属)；和谷类，例如，小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。

双子叶植物的实例是烟草(tobacco)，豆类(legumes)，如羽扇豆(lupins)，马铃薯，糖甜菜(sugarbeet)，豌豆，豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae))，如花椰菜(cauliflower)，油菜籽(rapeseed)和紧密相关的模式生物体拟南芥(Arabidopsisthaliana)。

植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber)，以及包含这些部分的独立组织，例如，表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments)，如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外，任何植物细胞，无论什么组织来源，都被认为是植物部分。同样地，植物部分，如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分，例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。

同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。

表达多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之，通过如下构建所述植物或植物细胞：将编码多肽的一个或多个(例如两个、几个)表达构建体并入植物宿主基因组或叶绿体基因组，并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。

表达构建体便利地是包含编码多肽的多核苷酸的核酸构建体，所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外，表达构建体可以包含对于鉴定整合了该表达构建体的宿主细胞有用的选择性标记，和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。

调节序列的选择，例如启动子和终止子序列和任选地信号或转运序列的选择，举例来说，基于期望何时、何处以及如何表达多肽而确定。例如，编码多肽的基因的表达可以是组成型的或诱导型的，或可以是发育、阶段或组织特异性的，并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86:506所述。

对于组成型表达，可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,PlantMo.Biol.18:675-689；Zhang等,1991,PlantCell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303)，或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863-878)，种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantCellPhysiol.39:885-889)，来自豆球蛋白(legumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.PlantPhysiol.152:708-711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantCellPhysiol.39:935-941)，来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子，或本技术领域公知的任何其他种子特异性的启动子，例如，在WO91/14772中所描述的。此外，启动子可为叶特异性的启动子，如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiol.102:991-1000)，小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMol.Biol.26:85-93)，或来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.Genet.248:668-674)，或伤口诱导的启动子，如马铃薯pin2启动子(Xu等,1993,PlantMol.Biol.22:573-588)。同样地，所述启动子可通过非生物的处理诱导，所述非生物的处理如温度、干旱或盐度变化，或通过外源施加的激活所述启动子的物质诱导，例如乙醇、***(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid)，和重金属。

启动子增强子元件也可以用于实现多肽在植物中的较高表达。例如，启动子增强子元件可以是内含子，其置于启动子和编码多肽的多核苷酸之间。例如Xu等,1993,见上，公开了使用稻肌动蛋白1基因的第一内含子以增强表达。

选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。

将核酸构建体根据本领域已知的常规技术并入植物基因组，所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293；Potrykus,1990,Bio/Technology8:535；Shimamoto等,1989,Nature338:274)。

目前，根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer)，是产生转基因双子叶植物的优选方法(为了参考，见Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38)，而且它也可以用于转化单子叶植物，虽然对于这些植物常常使用其他的转化方法。目前，产生转基因单子叶植物的优选的方法，是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJ.2:275-281；Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162；Vasil等,1992,Bio/Technology10:667-674)。转化单子叶植物的可供选择的方法基于原生质体转化，如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。其它依照本公开使用的转化方法包括描述于美国专利号6,395,966和7,151,204中的那些(两者均通过全文提述并入本文)。

转化之后，根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因：例如，使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。

除了用根据本发明制备的构建体直接转化具体植物基因型之外，还可通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言，可将编码多肽的构建体通过杂交而引入特定植物品种，而根本无需直接转化该给定品种的植物。因此，本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物，还包括此类植物的后代(progeny)。如用于本文，后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的DNA构建体，或依据本发明制备的DNA构建体的一部分。杂交导致转基因通过将起始种系与供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例进一步阐述于美国专利7,151,204号。

植物可通过回交转化的过程生成。举例而言，植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。

可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势，在于其可用于避免由表型变异导致的错误。进一步，遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言，当具有期望性状但除此之外(otherwise)具有非农艺学期望的遗传背景的植物与良种亲本杂交时，可使用遗传标记来选择不仅具有该目标性状，还具有相对较大比例期望种质的后代。以此方式，使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。

本发明亦涉及产生本发明的多肽的方法，其包括：(a)在有助于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞；和(b)回收所述多肽。

去除或减少C4-二羧酸转运蛋白活性

本发明还涉及用于产生亲本细胞突变体的方法，其包括破坏或缺失编码本发明的多肽的多核苷酸或其部分，所述方法导致在相同条件下培养时，与亲本细胞相比突变细胞产生较少的所述多肽。

可以使用本领域熟知的方法(例如，***、破坏、替代或缺失)通过减少或消除编码所述多核苷酸的表达来构建突变细胞。在一个优选的方面，所述核苷酸序列是失活的。待修饰或失活的多核苷酸可以是，例如，编码区或其对活性关键的部分，或表达编码区所需的调节元件。此种调节或调控序列的实例可以是启动子序列或其功能部分，即，足以影响多核苷酸表达的部分。其它用于可能的修饰的调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。

可以通过向亲本细胞施以诱变，并且选择其中已将所述多核苷酸的表达减少或消除的突变细胞来进行多核苷酸的修饰或失活。诱变(其可为特异性的或随机的)可以通过例如使用合适的物理或化学诱变剂进行，通过使用合适的寡核苷酸进行，或通过对所述DNA序列进行PCR产生的诱变来进行。此外，可以通过使用这些诱变剂的任何组合来进行诱变。

适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。

当使用这些试剂时，通常通过如下方法来进行所述诱变：在合适条件下存在所选的诱变剂时温育待诱变的亲本细胞，并筛选和/或选择显示基因表达减少的或无基因表达的突变细胞。

通过导入、取代或去除基因或其转录或翻译所需的调控元件中的一个或多个(例如两个、几个)核苷酸可以实现所述核苷酸序列的修饰或失活。例如，可以***或去除核苷酸从而导致引入终止密码子，去除起始密码子，或改变开读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以完成此种修饰或失活。尽管在理论上所述修饰可以在体内进行，即，直接在表达待修饰的多核苷酸的细胞上进行，但优选如下面所示例的那样在体外进行所述修饰。

消除或减少核苷酸序列通过细胞的表达的便利方式的例子是基于基因取代，基因缺失，或基因破坏的技术。例如，在基因破坏方法中，将相应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷性的核酸序列，然后将其转化入亲本细胞中以产生缺陷基因。通过同源重组，所述缺陷性核酸序列替代内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记，其可用于选择其中多核苷酸被修饰或破坏的转化体。在一个特别优选的方面，用选择性标记，如本文所述的那些，来破坏所述核苷酸序列。

本发明亦涉及在细胞中抑制具有C4-二羧酸转运蛋白活性的多肽的表达的方法，其包括向细胞施以或在细胞中表达双链RNA(dsRNA)分子，其中所述dsRNA包含本发明的多核苷酸的亚序列。在一个优选的方面，所述dsRNA长度为约15，16，17，18，19，20，21，22，23，24，25或更多个双链核苷酸。

所述dsRNA优选为小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面，所述dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一个优选的方面，所述dsRNA是用于抑制翻译的微RNA(miRNA)。

本发明亦涉及此种双链RNA(dsRNA)分子，其包含SEQIDNO:1、3或5的一部分，或其成熟多肽编码序列，以供抑制所述多肽在细胞中的表达。尽管本发明并不限于任何特定的作用机制，但所述dsRNA可进入细胞，并导致类似或相同序列的单链RNA(ssRNA)，包括内源mRNA的降解。当细胞暴露于dsRNA时，来自同源基因的mRNA通过称为RNA干扰(RNAi)的过程被选择性降解。

本发明的dsRNA可用于基因沉默。在一个方面，本发明提供了使用本发明的dsRNAi选择性降解RNA的方法。该工艺可在体外、离体或体内实施。在一个方面，所述dsRNA分子可用于在细胞、器官或动物中生成功能丧失突变。用于制备和使用dsRNA分子以选择性降解RNA的方法在本领域中是公知的，参见，例如美国专利号6,489,127；6,506,559；6,511,824；和6,515,109。

本发明进一步涉及亲本细胞的突变细胞，其包含编码所述多肽的多核苷酸或其调控序列的破坏或缺失，或编码所述多肽的基因的沉默，这导致突变细胞与亲本细胞相比产生较少的所述多肽或不产生所述多肽。

多肽缺陷突变细胞作为用于表达天然或异源多肽的宿主细胞是特别有用的。因此，本发明进一步涉及产生天然或异源多肽的方法，其包括：(a)在有助于产生所述多肽的条件下培养突变细胞；和(b)回收所述多肽。术语“异源多肽”意指对于宿主细胞并非天然的多肽，例如，天然蛋白的变体。所述宿主细胞可包含多于一个拷贝的编码所述天然或异源多肽的多核苷酸。

用于培养和纯化感兴趣的产物的方法可通过本领域中已知的方法进行。

C4-二羧酸产生的方法

本发明还涉及使用具有C4-二羧酸转运蛋白活性的多肽的方法，或使用编码具有C4-二羧酸转运蛋白活性的多肽的多核苷酸的方法。本文中所述的C4-二羧酸转运蛋白或编码该蛋白的多核苷酸可用于宿主细胞(例如丝状真菌宿主细胞)以协助(如增加)C4-二羧酸(例如苹果酸)的产生。对于这些方法，可使用任何本文中所述的本发明的多核苷酸或多肽(例如SEQIDNO:1、2、3、4、5和/或6，或任何其所述的方面)，如下文所列的方面中所例示的。

在一个方面，本发明涉及产生C4-二羧酸(例如苹果酸)的方法，其包括：(1)培养宿主细胞(例如丝状真菌宿主细胞)，其包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3、5或任何其所述的方面)，其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸；和(2)回收所述苹果酸。

在另一个方面，本发明涉及相对于亲本宿主细胞增加C4-二羧酸产生(例如苹果酸产生)的方法，其包括：(1)将编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1、3、5或任何其所述的方面)转化入宿主细胞，其中所述宿主细胞与不含有所述异源多核苷酸的丝状真菌宿主细胞相比分泌增加水平的C4-二羧酸；(2)在培养基中培养经转化的宿主细胞；和(3)回收所述C4-二羧酸。

在所述方法的这些方面中的一些，C4-二羧酸是苹果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸，或其组合。在一些方面，C4-二羧酸是苹果酸、琥珀酸或延胡索酸，或其组合。在一些方面，C4-二羧酸是苹果酸或延胡索酸，或苹果酸和延胡索酸的组合。在一些方面，所述C4-二羧酸是苹果酸。

如上文所述，所述C4-二羧酸转运蛋白可为任何本文中所述的C4-二羧酸转运蛋白，例如选自下组的C4-二羧酸转运蛋白：(a)多肽，其与SEQIDNO:2、4或6，或其成熟多肽序列具有至少60%序列同一性；(b)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链在低严格条件下杂交；(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，或其成熟多肽编码序列具有至少65%序列同一性；(d)SEQIDNO:2、4或6，或其成熟多肽的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和(e)(a)、(b)、(c)或(d)的多肽的片段。

举例而言，在一个方面，本发明涉及产生C4-二羧酸(例如苹果酸)的方法，其包括：

(1)培养宿主细胞(例如丝状真菌宿主细胞)，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述C4-二羧酸转运蛋白选自：(a)多肽，其与SEQIDNO:2或其成熟多肽序列具有至少60%序列同一性；(b)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链在低严格条件下杂交；(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少65%序列同一性；(d)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和(e)(a)、(b)、(c)或(d)的多肽的片段；其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸；和

(2)回收所述苹果酸。

在另一个例示性方面，本发明涉及产生C4-二羧酸(例如苹果酸)的方法，其包括：

(1)培养宿主细胞(例如丝状真菌宿主细胞)，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述C4-二羧酸转运蛋白选自：(a)多肽，其与SEQIDNO:4或其成熟多肽序列具有至少60%序列同一性；(b)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链在低严格条件下杂交；(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%序列同一性；(d)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和(e)(a)、(b)、(c)或(d)的多肽的片段；其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸；和

(2)回收所述苹果酸。

(1)培养宿主细胞(例如丝状真菌宿主细胞)，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述C4-二羧酸转运蛋白选自：(a)多肽，其与SEQIDNO:6或其成熟多肽序列具有至少60%序列同一性；(b)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:5，其成熟多肽编码序列，或前述序列的全长互补链在低严格条件下杂交；(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:5或其成熟多肽编码序列具有至少65%序列同一性；(d)SEQIDNO:6或其成熟多肽序列的包含一个或多个(例如两个，几个)氨基酸的取代、缺失和/或***的变体；和(e)(a)、(b)、(c)或(d)的多肽的片段；其中所述宿主细胞与不含有编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸；和

(2)回收所述苹果酸。

在本申请全文内描述了上述方法中涵盖的具有C4-二羧酸转运蛋白活性的多肽的其它变化和实施方案。

在所述方法的一个方面，以大于约10g/L，例如，大于约25g/L，50g/L，75g/L，100g/L，125g/L，150g/L，160g/L，170g/L，180g/L，190g/L，200g/L，210g/L，225g/L，250g/L，275g/L，300g/L，325g/L，350g/L，400g/L，或500g/L；或约10g/L至约500g/L，例如，约50g/L至约350g/L，约100g/L至约300g/L，约150g/L至约250g/L，约175g/L至约225g/L，或约190g/L至约210g/L的效价产生或分泌所述C4-二羧酸(例如苹果酸)。

在所述方法的任何方面，在宿主细胞中产生或分泌的C4-二羧酸(例如苹果酸)的水平与不包含编码所述异源多核苷酸的多核苷酸的宿主细胞相比，在相同条件下培养时增加至少25%，例如至少50%，至少100%，至少150%，至少200%，至少300%，或至少500%。

在所述方法的任何这些方面，所述异源多核苷酸可能可操作地连接于对于所述多核苷酸为外源的启动子。

在所述方法的任何这些方面，所述宿主细胞可进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如，SEQIDNO:11的成熟多肽编码序列，或其任何所述的方面)和/或编码丙酮酸羧化酶的异源第三多核苷酸(例如，SEQIDNO:15的成熟多肽编码序列，或其任何所述的方面)，如上文中所述。在一些方面中，所述异源第二和/或第三多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。可用于这些方法的苹果酸脱氢酶和丙酮酸羧化酶的实例可见于例如2010年8月27日提交的题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申请号PCT/US10/47002，其内容通过全文提述并入本文，特别是其中关于编码苹果酸脱氢酶和丙酮酸羧化酶多肽的多核苷酸所述的内容。

在所述方法的任何这些方面，所述宿主细胞可为任何上述的宿主细胞，例如，丝状真菌宿主细胞，如选自下组的宿主细胞：枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)。举例而言，所述宿主细胞可为曲霉属宿主细胞，如米曲霉宿主细胞。

在本发明的方法中，所述重组宿主细胞在适于产生C4-二羧酸转运蛋白的培养基中，使用本领域中公知的方法进行培养，如上文中所述。

重组C4-二羧酸可任选地使用任何本领域中已知的方法从发酵培养基回收(参见，例如WO1998/022611和U.S.7,601,865)，所述方法包括但不限于层析(例如大小排阻层析、吸附层析、离子交换层析)，电泳方法，差示溶解度，渗透，蒸馏，萃取(例如液-液萃取)，渗透蒸发(pervaporation)，提取过滤，膜过滤，膜分离，反向过滤或超滤。在一个实例中，C4-二羧酸通过过滤从发酵培养基中的其它材料回收。

在所述方法的一些方面，在任选地纯化之前和/或之后的重组C4-二羧酸是基本上纯的。对于产生C4-二羧酸(或其具体的C4-二羧酸，如苹果酸)的方法，“基本上纯的”意指C4-二羧酸的回收的制备物含有不超过15%杂质，其中杂质意指除了C4-二羧酸之外的化合物。在一个变化中，提供了基本上纯的C4-二羧酸的制备物，其中所述制备物含有不超过25%杂质，或不超过20%杂质，或不超过10%杂质，或不超过5%杂质，或不超过3%杂质，或不超过1%杂质，或不超过0.5%杂质。

用于对于本文中所述的产生方法和宿主细胞测试C4-二羧酸产生的合适测定法可使用本文中已知的方法进行。举例而言，最终C4-二羧酸产物(例如苹果酸)，和其它有机化合物，可通过方法如HPLC(高效液相色谱)，GC-MS(气相色谱-质谱)和LC-MS(液相色谱-质谱)或其它合适的分析方法使用本领域公知的常规步骤进行分析。发酵液中C4-二羧酸的释放亦可用培养上清来进行测试。发酵培养基中的副产物和残余糖(例如葡萄糖)可通过HPLC使用例如针对葡萄糖和醇的折射率检测器，和针对有机酸的UV检测器(Lin等,Biotechnol.Bioeng.90:775-779(2005))，或使用其它本领域中公知的合适测定法和检测方法来进行定量。

信号肽

本发明亦涉及编码信号肽的分离的多核苷酸。在一个方面，所述信号肽包含或组成为SEQIDNO:2的氨基酸1至61或1至68。在一些方面，编码所述信号肽的分离的多核苷酸是SEQIDNO:1的核苷酸1至183或1至204。在另一个方面，所述信号肽包含或组成为SEQIDNO:4的氨基酸1至17。在一些方面，编码所述信号肽的分离的多核苷酸是SEQIDNO:3的1至51。在另一个方面，所述信号肽包含或组成为SEQIDNO:6的1至68。在一些方面，编码所述信号肽的分离的多核苷酸是SEQIDNO:5的核苷酸1至204。

所述多核苷酸可进一步包含编码蛋白的基因，其可操作地连接于信号肽和/或前肽。所述蛋白优选对于信号肽和/或前肽是外源的。

本发明亦涉及包含此类多核苷酸的核酸构建体、表达载体和重组宿主细胞。

本发明亦涉及产生蛋白质的方法，其包括：(a)培养包含此种多核苷酸的重组宿主细胞；和(b)回收所述蛋白质。

所述蛋白质对于宿主细胞可为天然的或异源的。术语“蛋白质”在本文中并不意指特定长度的编码产物，并因此涵盖肽、寡肽和蛋白。术语“蛋白质”亦涵盖组合以形成编码产物的两个或多个多肽。蛋白质亦包括杂合多肽和融合多肽。

优选地，所述蛋白是激素或其变体，酶，受体或其部分，抗体或其部分，或报道蛋白。举例而言，所述蛋白可为氧还酶，转移酶，水解酶，裂合酶，异构酶，或连接酶，如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶酸裂合酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。

所述基因可从任何原核、真核或其它来源获得。

本发明进一步通过下述实施例描述，其不应视为对本发明范围的限制。

实施例

用作缓冲液和底物是至少试剂级的商品。

真菌菌株

使用棘孢曲霉作为C4-二羧酸转运蛋白基因c4t737、c4t521和mat737的来源。使用米曲霉NRRL3488(或ATCC56747)作为丙酮酸羧化酶基因、苹果酸脱氢酶基因的来源，并用于产生C4-二羧酸。

培养基

YEG培养基组成为：20g葡萄糖，5g酵母提取物，和去离子水加至1升。

COVE平板组成为：1M蔗糖，2%COVE盐溶液，10mM乙酰胺，15mMCsCl，和25g/lAgarNoble。

COVE盐溶液组成为：26gKCl，26gMgSO₄·7H₂O，76gKH₂PO₄，50mlCOVE痕量元素溶液，和去离子水加至1升。

COVE痕量元素溶液组成为：0.04gNa₂B₄O₇·10H₂O，0.04gCuSO₄·5H₂O，1.2gFeSO₄·7H₂O，0.7gMnSO₄·H₂O，0.8gNa₂MoO₂·2H₂O，10gZnSO₄·7H₂O和去离子水加至1升。

种子培养基组成为：40g葡萄糖，6gBactoPeptone(细菌用蛋白胨)，750mgKH₂PO₄，750mgK₂HPO₄，100mgMgSO₄·7H₂O，100mgCaCl₂·H₂O，5mgFeSO₄·7H₂O，5mgNaCl，和去离子水加至1升。

种子培养基B组成为：30g葡萄糖，3gBactoPeptone，560mgKH₂PO₄，560mgK₂HPO₄，925mgNaH₂PO₄·H₂O，820mgNa₂HPO₄，75mgMgSO₄·7H₂O，75mgCaCl₂·H₂O，0.75ml的1000X微量营养物溶液(MicronutrientSolution)，和去离子水加至1升。

酸产生培养基C组成为：100g葡萄糖，80gCaCO₃，6gBactoPeptone，150mgKH₂PO₄，150mgK₂HPO₄，100mgMgSO₄·7H₂O，100mgCaCl₂·H₂O，1ml1000X微量营养物溶液，和去离子水加至1升。

发酵器批式培养基组成为：120g葡萄糖，120gCaCO₃，9gBactoPeptone，150mgKH₂PO₄，150mgK₂HPO₄，100mgMgSO·7H₂O，100mgCaCl₂-2H₂O，5mgFeSO₄·7H₂O，5mgNaCl，5mLPluronicL61，和去离子水加至1升。

1000X微量营养物溶液组成为：5gNaCl，5gFeSO₄·7H₂O，1g柠檬酸，和去离子水加至1升。

PDA平板组成为：39g/l马铃薯右旋糖琼脂。

2XYT+amp平板组成为16g胰蛋白胨，10g酵母提取物，5gNaCl，100mg氨苄青霉素，15gBacto琼脂，和去离子水加至1升。

实施例1：棘孢曲霉C4-二羧酸转运蛋白基因的克隆和表达载体pSaMF35的构建

分离来自棘孢曲霉的基因组DNA，即用2x10⁶个孢子接种至摇瓶中的100ml的YEG培养基，并将所述烧瓶在34℃以160rpm振荡温育过夜。将菌丝体通过使用(Calbiochem,SanDiego,CA,USA)带衬里的漏斗(linedfunnel)的过滤来收获，并回收了大约2g的菌丝体，并将其冻结于液氮。将冻结的菌丝体通过仍包裹在中时迅速用锤子锤碎来破坏。然后将破坏的菌丝体转移至含有10ml的1X裂解缓冲液(100mMEDTA，10mMTrispH8.0，1%X-100，0.5M胍-HCl，200mMNaCl)和3μl的RNaseA(QIAGENInc.,Valencia,CA,USA,100mg/ml)的50ml聚丙烯锥形离心管中。将管通过轻柔的涡旋来混合，然后在室温温育5分钟，之后添加150μl蛋白酶K(QIAGENInc.,Valencia,CA,USA;20mg/ml)。将管通过倒置混合，并在50℃温育1小时。然后将管在7240xg离心20分钟，然后将上清添加至预平衡的QIAGEN-tip100(QIAGENInc.,Valencia,CA,USA)，而剩余的DNA提取步骤根据生产商的指示进行。将DNA重悬于100μlTE缓冲液(10mMTris碱,1mMEDTA,pH8.0)中。

将1194bpC4-二羧酸转运蛋白基因c4t737从棘孢曲霉基因组DNA使用下示的引物069698和069699扩增。

引物069698：

5’-GTGATAGAACATCGTCCATAATGCTCGGGCAACACT-3’(SEQIDNO:7)

引物069699：

5’-GTGTCAGTCACCTCTAGTTATTACTCCGATACATCCTCGT-3’(SEQIDNO:8)

PCR反应物组成为：5μl10X反应缓冲液(Stratagene,LaJolla,CA,USA)，1μl棘孢曲霉DNA模板(105ng/μl)，1μl引物069698(100ng/μl)，1μl引物069699(100ng/μl)，1μldNTP混合物(10mM)，40.5μl去离子水，和0.5μlHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。将扩增反应温育于 (EppendorfScientificInc.Westbury,NewYork,USA)，其程序如下：1个循环，在95℃进行2分钟；10个循环，每个95℃进行10秒，60℃进行30秒，和72℃进行1.5分钟；和20个循环，每个在95℃进行10秒，60℃进行30秒，72℃进行1.5分钟且每循环加10秒。然后使用PCRPurificationKit(QIAGENInc.,Valencia,CA,USA)纯化PCR产物。

将质粒pShTh60(图1；亦参见2010年8月27日提交的PCR申请号PCT/US10/47002)用SexAI和PacI消化，通过TBE缓冲液(10.8g/LTris碱，5.5g/L硼酸，2mMEDTA,pH8.0)中的0.8%琼脂糖凝胶电泳分离，并使用GelExtractionKit(QIAGENInc.,Valencia,CA,USA)纯化。然后将上述纯化的PCR产物使用In-Fusion^TMAdvantage反应试剂盒(Clontech,MountainView,CA,USA)***消化的pShTh60片段中，该反应组成为2μl5X缓冲液(Clontech,MountainView,CA,USA)，2.4μl纯化的PCR产物(33ng/μl)，1.5μl消化和凝胶纯化的pShTh60(132ng/μl)，1μlIn-Fusion^TM酶和3.1μl去离子水。将反应在37℃温育15分钟，50℃温育15分钟，置于冰上5分钟，并用40μlTE缓冲液(10mMTris碱,1mMEDTA,pH8.0)稀释，得到pSaMF35(图2)。

将上述含有pSaMF35的连接反应产物的2.5μl等分试样根据生产商的指示转化入TOP10化学感受态大肠杆菌细胞(Invitrogen,SanDiego,CA,USA)。将转化物铺板于2XYT+amp平板上，并在37℃温育过夜。挑取所得的转化体，并对其进行DNA测序以确认c4t737基因整合入载体。

棘孢曲霉c4t737基因的核苷酸序列(SEQIDNO:1)和推导的氨基酸序列(SEQIDNO:2)显示于图3。编码序列为1194bp，包含终止密码子。编码的预测蛋白为397个氨基酸，具有44.3kDa的预测分子量和6.93的等电点pH。该基因不含内含子。使用SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6)，预测了61个残基的信号肽。基于该程序，预测的成熟蛋白含有336个氨基酸，具有37.3kDa的预测分子量和6.52的等电点pH。使用InterProScan程序(TheEuropeanBioinformaticsInstitute)，预测了68个残基的信号肽。基于该程序，预测的成熟蛋白含有329个氨基酸，具有36.5kDa的预测分子量和6.52的等电点pH。

实施例2：将pSaMF35的表达载体片段转化入棘孢曲霉NRRL3488(SaMF35)

进行米曲霉NRRL3488的原生质体制备和转化，即将大约2x10⁷个孢子接种入100mLYEG培养基，并将烧瓶在27℃以140rpm温育16-18小时。收集菌丝体，即将培养物倾倒透过衬有(Calbiochem,SanDiego,CA,USA)的灭菌漏斗，并用50mL的0.7MKCl漂洗。将经洗涤的菌丝体重悬于含有20mL原生质体化溶液的125mL烧瓶，所述溶液包含每mL0.7MKCl(经过滤灭菌)5mg的GLUCANEX^TM(NovozymesA/S,,Denmark)和0.5mg的壳多糖酶(SigmaChemicalCo.,St.Louis,MO,USA)，并将该烧瓶在34℃以80rpm混合温育30分钟。将原生质体化溶液倾倒透过衬有的灭菌漏斗，并用50mL的STC缓冲液(1M山梨醇-10mMTris-HClpH6.5-10mMCaCl₂)漂洗。将流过物在两个50mL聚丙烯管中收集。将管在室温以1300xg离心10分钟。弃去上清并将原生质体沉淀重悬于20mL的STC缓冲液。洗涤原生质体，即进行两轮的将沉淀重悬于20mL的STC缓冲液并在室温在1300xg离心10分钟。将最终沉淀重悬于2mL的STC缓冲液。对原生质体进行计数，即移取10μl样品并在血细胞计数器(VWR,WestChester,PA,USA)中对其进行计数。用STC缓冲液调整体积以获得2x10⁷每mL的原生质体浓度。

通过用PmeI进行限制性消化制备质粒pSaMF35以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离4977bp表达盒，并使用GelExtractionKit进行纯化。准备了两个转化反应。对于每个反应，将100μL原生质体制备的溶液转移至12mL聚丙烯管，对其添加5μg直链化的pSaMF35和250μlPEG溶液(60%w/v聚乙二醇(PEG)，10mMTris6.5，10mMCaCl)接着进行轻柔地混合，并在37℃温育30分钟。将每个转化反应物用9mL的STC溶液稀释，接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将二十个SaMF35转化体转移至单个COVE平板，并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物，即制备每个的甘油储液(800μl孢子储液，200μl0.1%80)并冻结于-80℃。

实施例3：在含有pSaMF35的表达载体片段的米曲霉转化体(SaMF35)的摇瓶培养中产生苹果酸

将来自实施例2中所述的每个pSaMF35转化体和作为对照的米曲霉NRRL3488的孢子铺板于单个PDA平板，并允许其在34℃进行5至7日的孢子形成。在0.1%80中收集孢子，并使用血细胞计数器进行计数。在含有100ml的种子培养基B的250ml烧瓶中制备种子培养物，并用300μl的孢子悬液接种。将种子培养物在30℃以200rpm振荡生长大约17个小时。在含有50ml的酸产生培养基C和3ml的17小时种子培养物的250ml不带挡板的烧瓶中制备酸产生培养物。将培养物在30℃以200rpm振荡温育2-10日。

对于摇瓶培养转化体的苹果酸定量通过使用1200SeriesBinaryLCSystem和1200SeriesDiodeArrayDetector(DAD)(AgilentTechnologies,SantaClara,CAUSA)的ReversePhaseHighPressureLiquidChromatography(RP-HPLC)进行。使用Aqua5μC18205x4.6mmID柱和AQC184x3.0mmSecurityGuardCartridge(Phenomenex,Inc.,Torrance,CA,USA)进行反向分离。流动相由10%甲醇(HPLC级)和90%145mM磷酸盐pH1.5缓冲液组成。

移出全培养样品，并将其在由850ml的64mM磷酸盐缓冲液和150ml的甲醇pH1.65组成的HPLCRunningBuffer中以1:10稀释。然后将样品透过25mm0.45微米聚醚砜膜(Whatman,FlorhamPark,NJ,USA)进行过滤，并将1.5ml滤过物置入HPLC小瓶进行酸分析。将剩余量的摇瓶培养物透过3层粗滤布(cheesecloth)过滤，并用10体积的双蒸无菌水漂洗三次以去除不溶的CaCO₃。从粗滤布收获细胞沉淀，置入15ml培养管，并储藏于-20℃。

使用10μl的注入体积以0.7ml/分钟(等度洗脱)的流速以25℃的柱温度和11分钟的运行时间进行RP-HPLC。检测设定为210nm，8nm带宽，参照为360nm，40nm带宽。确定空白时间(voidtime)为3.8分钟。通过进行浓度范围为49.2至3.93mM的系列稀释的苹果酸标样的重复注入，对于苹果酸确定了反相方法的定量能力。对于重复注入的相对标准偏差(RSD)为≤5%。苹果酸显示R²≥0.9999。

在3日摇瓶生长之后，含有pSaMF35的米曲霉转化体与米曲霉NRRL3488对照菌株相比显示了超过2倍的苹果酸产生方面的改善。

实施例3B：含有pSaMF35的表达载体片段的米曲霉转化体(SaMF35)的发酵。

制备了实施例2中所述的米曲霉pSaMF35转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCR申请号PCT/US10/47002)并将其如下文实施例7中所述进行发酵。

发酵中苹果酸的定量如上所述进行。米曲霉pSaMF35转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体，表明基于之前描述的ShTh1040和NRRL3488的比较，米曲霉pSaMF35转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比性能更好。

实施例4：棘孢曲霉C4-二羧酸转运蛋白基因的克隆和表达载体pSaMF36的构建

将1257bpC4-二羧酸转运蛋白基因c4t521从棘孢曲霉基因组DNA(实施例1)使用下示的引物069700和069701扩增。

引物069700：

5’-TGTGATAGAACATCGTCCATAATGCACGACCACAGC-3’(SEQIDNO:9)

引物069701：

5’-GTGTCAGTCACCTCTAGTTATCATTCGAACAACTCGGACA-3’(SEQIDNO:10)

PCR反应物组成为：10μl5X反应缓冲液，1μl棘孢曲霉DNA模板(105ng/μl)，1μl引物069700(100ng/μl)，1μl引物069701(100ng/μl)，1μldNTP混合物(10mM)，35.5μl去离子水，和0.5μlPhusion^TMHotStartHigh-FidelityDNA聚合酶(Finnzymes,Inc,Massachusetts,USA)。将扩增反应温育于，其程序如下：1个循环，在98℃进行30秒；30个循环，每个在98℃进行10秒，60℃进行30秒，72℃进行1分钟，和一个循环，在72℃进行10分钟。将PCR产物用DpnI消化1小时以降解任何质粒DNA模板。

将质粒pShTh60(图1)用SexAI和PacI消化，通过TBE缓冲液中的0.8%琼脂糖凝胶电泳分离，并使用GelExtractionKit纯化。然后将上述纯化的PCR产物使用In-Fusion^TMAdvantage反应试剂盒***消化的pShTh60片段中，该反应组成为2μl5X缓冲液，3μl纯化的PCR产物(26ng/μl)，1.5μl凝胶纯化的SexAI和PacI消化的和凝胶纯化的pShTh60(132ng/μl)，1μlIn-Fusion^TM酶和2.5μl去离子水。将反应在37℃温育15分钟，50℃温育15分钟，置于冰上5分钟，并用40μlTE缓冲液稀释，得到pSaMF36(图4)。

将上述连接反应产物的2.5μl等分试样根据生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞。将转化物铺板于2XYT+amp平板上，并在37℃温育过夜。挑取所得的转化体，并对其进行DNA测序以确认mat521基因成功整合入载体。

棘孢曲霉c4t521基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)显示于图5。编码序列为1257bp，包含终止密码子。编码的预测蛋白为418个氨基酸，具有46.8kDa的预测分子量和6.36的等电点pH。该基因不含内含子。使用SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6)，预测了17个残基的信号肽。基于该程序，预测的成熟蛋白含有401个氨基酸，具有44.9kDa的预测分子量和6.89的等电点pH。

实施例5：将pSaMF36的表达载体片段转化入棘孢曲霉NRRL3488(SaMF36)

米曲霉NRRL3488的原生质体制备和转化如实施例2中所述进行。

通过用PmeI进行限制性消化制备质粒pSaMF35以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离5040bp表达盒，并使用GelExtractionKit进行纯化。准备了两个转化反应。对于每个反应，将100μL原生质体制备的溶液转移至12mL聚丙烯管，对其添加5μg直链化的pSaMF36和250μlPEG溶液(60%w/v聚乙二醇(PEG)，10mMTris6.5，10mMCaCl)接着进行轻柔地混合，并在37℃温育30分钟。将每个转化反应物用9mL的STC溶液稀释，接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将二十个SaMF36转化体转移至单个COVE平板，并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物，即制备每个的甘油储液(800μl孢子储液，200μl0.1%80)并冻结于-80℃。

实施例6：在含有pSaMF36的表达载体片段的米曲霉转化体(SaMF36)的摇瓶培养中产生苹果酸

来自实施例5中所述的每个pSaMF36转化体和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体的苹果酸的定量如实施例3中所述进行。

表1显示了在3日的摇瓶生长之后，转化体米曲霉SaMF36-3和米曲霉SaMF36-4与作为对照的米曲霉NRRL3488的苹果酸产生相比的苹果酸效价的相对增加。相对于米曲霉NRRL3488，米曲霉SaMF36-3和米曲霉SaMF36-4分别产生了2.1倍和2.3倍的苹果酸效价的增加。

表1

菌株	苹果酸的相对效价	%CV
			NRRL3488	1	0.7%
SaMF36-3	2.1	4.8%
			SaMF36-4	2.3	0.2%

实施例7：含有pSaMF36的表达载体片段的米曲霉转化体(SaMF36)的发酵

将描述于实施例5中的米曲霉pSaMF36转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCR申请号PCT/US10/47002)在34℃在PDA平板上生长大约7日。将5-6ml体积的含有0.2%80的灭菌的50mM磷酸钠缓冲液(pH6.8)添加至每个平板，并通过用接种环刮擦使孢子悬浮。通过移液将每个悬液转移至50ml锥形管。对于每个管，将25ml的灭菌的磷酸钠缓冲液(50mM，pH6.8)添加至含有75ml的种子培养基的500ml不带挡板的烧瓶，然后将其用2ml的孢子悬液接种。然后将烧瓶在34℃和180rpm温育约24小时。合并所述种子烧瓶以供应每罐所需的144ml接种物。

通过导入144ml(8%)的来自米曲霉pSaMF36转化体或米曲霉ShTh1040转化体的合并的种子***种子培养液来分别接种含有1.8升的发酵罐批式培养基的三升发酵罐。仅对该实验，将发酵罐批式培养基中的葡萄糖浓度减少至60g/L，并将补料起始推迟一日。将发酵罐平衡于34±0.1℃并以500rpm搅拌。入口空气流量维持在1v/v/m。自发酵约43小时开始，将20%葡萄糖流以大约7.3g/hr的速率施加。在大约第5或6日添加灭菌的CaCO₃(约100g)以保持发酵pH在6至7的范围。每日取出样品，并如实施例3中所述就苹果酸产生进行分析。发酵在7或8日之后完成。

发酵中苹果酸的定量如实施例3中所述进行。米曲霉pSaMF36转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体，表明基于之前描述的ShTh1040和NRRL3488的比较，米曲霉pSaMF36转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比在苹果酸产生方面性能更好。

实施例8：米曲霉苹果酸脱氢酶基因的克隆和载体pSaMF21的构建

构建质粒pSaMF21以包含NAD-依赖性苹果酸脱氢酶(mdh3)基因序列(DOGAN:AO090701000013)，如2010年8月27日提交的PCT申请号PCT/US10/47002中所述的来自米曲霉的1430bp片段。米曲霉NRRL3488苹果酸脱氢酶mdh3基因的核苷酸序列(SEQIDNO:11)和推导的氨基酸序列(SEQIDNO:12)显示于图6。1430bp的基因组编码序列(包含终止密码子)编码330个氨基酸的多肽，其具有35kDa的预测分子量。编码序列被57bp(14-70bp)，70bp(103-172bp)，74bp(284-357bp)，68bp(446-513bp)，58bp(892-949bp)，48bp(1035-1082bp)，和62bp(1228-1289bp)的7个内含子打断，mdh3基因的编码区的G+C含量为50.3%。

简言之，该质粒通过藉由用SexAI和PacI的限制性消化直链化pShTh60(图1)来构建。消化的载体通过TBE缓冲液中的0.8%琼脂糖凝胶电泳来分离，并使用GelExtractionKit纯化。将mdh3基因使用引物067522和067525从pShTh71(2010年8月27日提交的PCT申请号PCT/US10/47002)扩增。

引物067522：

5’-AGAACATCGTCCATAATGGTCAAAGCTGGTGAGTTA-3’(SEQIDNO:13)

引物067525：

5’-GTGTCAGTCACCTCTAGTTATTACTTTGGTGGTGGGTTCT-3’(SEQIDNO:14)

PCR反应组成为：5μl10X反应缓冲液，1μlpShTh71模板(87ng/μl)，1μl引物067522(100ng/μl)，1μl引物067525(100ng/μl),1μldNTP混合物(10mM)，45.5μl去离子水，和0.5μlHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。将扩增反应温育于，其程序如下：1个循环，在95℃进行2分钟；10个循环，每个在95℃进行10秒，58℃进行30秒，和72℃进行1.5分钟；20个循环，每个在95℃进行10秒，50℃进行30秒，和72℃进行1.5分钟每循环增加10秒。对PCR反应产物进行用DpnI的限制性消化1小时以降解任何质粒DNA模板。然后使用PCRPurificationKit(QIAGENInc.,Valencia,CA,USA)纯化PCR产物。将纯化的PCR产物使用In-Fusion^TMAdvantage反应***载体，所述反应组成为2μl5X缓冲液，0.5μl纯化的PCR产物(110ng/μl)，1.7μl凝胶纯化的SexAI和PacI限制性消化的pShTh60(Figure1;78ng/μl)，1μlIn-Fusion^TM酶和4.8μl去离子水。将反应在37℃温育15分钟，接着在50℃温育15分钟，然后将其置于冰上5分钟，并用40μlTE稀释，得到pSaMF21(图7)。将连接反应的2μl等分试样根据生产商的指示转化入ONETOP10化学感受态细胞(Invitrogen,SanDiego,CA,USA)。将转化体铺板于2XYT+amp上，并在37℃温育过夜。挑取所得的转化体，并对其进行DNA测序以确认mdh3基因成功地整合入载体。

实施例9：米曲霉丙酮酸羧化酶基因的克隆和表达载体pRyan1的构建

构建质粒pRyan1以包含丙酮酸羧化酶(pyc)基因序列(DOGAN:AO090023000801)，如2010年8月27日提交的PCT申请号PCT/US10/47002中所述的来自米曲霉的3646bp片段(包含两个终止密码子)。米曲霉丙酮酸羧化酶基因的核苷酸序列(SEQIDNO:15)和推导的氨基酸序列(SEQIDNO:16)显示于图8A和8B。米曲霉NRRL3488和ATCC56747丙酮酸羧化酶基因均具有相同的核苷酸序列。3643bp的基因组编码序列(包含一个终止密码子)编码1193个氨基酸的多肽，其具有131kDa的预测分子量。编码序列由61bp(3475-3535bp)的1个内含子打断。基因的编码区的G+C含量为57.1%。

简言之，该质粒通过藉由用SexAI和PacI的限制性消化直链化pShTh60(图1)来构建。消化的载体通过TBE缓冲液中的0.8%琼脂糖凝胶电泳来分离，并使用GelExtractionKit纯化。将pyc基因使用下示的引物066549和067388从米曲霉NRRL3488基因组DNA扩增。

引物066549：

5’-TAGAACATCGTCCATAATGGCGGCTCCGTTTCGTCA-3’(SEQIDNO:17)

引物067388：

5’-GTGTCAGTCACCTCTAGTTATTATTACGCTTTGACGATCT-3’(SEQIDNO:18)

PCR反应组成为：5μl10X反应缓冲液，1μl米曲霉NRRL3488基因组DNA(110ng/μl)，1μl引物066549(100ng/μl)，1μl引物067388(100ng/μl),1μldNTP混合物(10mM)，45.5μl去离子水，和0.5μlHotStartDNA聚合酶。将扩增反应温育于，其程序如下：1个循环，在95℃进行2分钟；10个循环，每个在95℃进行10秒，58℃进行30秒，和72℃进行3.5分钟；20个循环，每个在95℃进行10秒，58℃进行30秒，和72℃进行3.5分钟每循环增加10秒。然后使用PCRPurificationKit纯化PCR产物。

将纯化的PCR产物使用In-Fusion^TMAdvantage反应***载体，所述反应组成为2μl5X缓冲液，0.5μl纯化的PCR产物(144ng/μl)，2μl凝胶纯化的SexAI和PacI限制性消化的pShTh60(图1;78ng/μl)，1μlIn-Fusion^TM酶和4μl去离子水。将反应在37℃温育15分钟，接着在50℃温育15分钟，然后将其置于冰上5分钟，并用40μlTE稀释，得到pRYAN1(图9)。将连接反应的2μl等分试样根据生产商的指示转化入ONETOP10化学感受态细胞。将转化体铺板于2XYT+amp上，并在37℃温育过夜。挑取所得的转化体，并对其进行DNA测序以确认pyc基因成功地整合入载体。核苷酸1308从C变为T，但并不影响蛋白序列。

实施例10：将pSaMF36、pSaMF21和pRyan1的表达载体片段转化入米曲霉NRRL3488(SaMF3603)

通过用PmeI在37℃消化4小时准备载体pSaMF36(实施例4)，pSaMF21(实施例8)和pRyan1(实施例9)以供转化。将消化的载体在0.8%琼脂糖TBE凝胶上分离，对于pSaMF36切出5040bp的条带，对于pSaMF21切出5213bp的条带，而对于pRyan1切出7429bp的条带。将含有表达盒的条带各自使用Macherey-NagelExtractIIKit(Düren,Germany)依照生产商的指示进行纯化。

准备了三个转化反应。对于每个反应，将100μL原生质体制备物(实施例2)转移至12mL聚丙烯管。对其以等摩尔量添加总共五微克的不含amp标志物、直链化的pShTh104、pSaMF21和pRyan1，和250μl聚乙二醇(PEG)溶液(60%w/v聚乙二醇(PEG)，10mMTris6.5，10mMCaCl)接着进行轻柔地混合，并在37℃温育30分钟。将每个转化反应物用9mL的STC缓冲液稀释，接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将所得的转化体转移至单个COVE平板，并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物，即制备每个的甘油储液(800μl孢子储液，200μl0.1%80)并冻结于-80℃。

实施例11：在含有pSaMF36、pSaMF21和pRyan1的表达载体片段的米曲霉转化体(SaMF3603)的摇瓶培养中产生苹果酸

来自实施例10中所述的每个米曲霉三重转化体SaMF3603和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体苹果酸的定量如实施例3中所述进行。

含有pSaMF36、pSaMF21和pRyan1的米曲霉转化体SaMF3603与米曲霉NRRL3488对照菌株相比在苹果酸产生方面显示超过2.55倍的改善。

实施例12：含有pSaMF36、pSaMF21和pRyan1的表达载体片段的米曲霉转化体(SaMF3603)的发酵

如实施例7中所述准备并发酵描述于实施例10中的米曲霉三重转化体SaMF3603和对照转化体米曲霉SaMF2103(参见2010年8月27日提交的PCR申请号PCT/US10/47002)

发酵中苹果酸的定量如实施例3中所述进行。米曲霉三重转化体SaMF3603的相对苹果酸效价类似于米曲霉转化体SaMF2103，表明基于之前描述的比较，米曲霉三重转化体SaMF3603转化体与米曲霉pSaMF36单转化体和米曲霉NRRL3488对照相比在苹果酸产生方面性能更好。

实施例13：棘孢曲霉C4-二羧酸转运蛋白的克隆和表达载体pSaMF38的构建

将1194bpC4-二羧酸转运蛋白基因mat737合成地构建入pAaMAT737(图10;DNA2.0,MenloPark,CA,USA)。从pAaMAT737使用069698和069699(实施例1)扩增mat737基因

PCR反应物组成为：10μl5X反应缓冲液，1μlpAaMAT737模板(20ng/μl)，1μl引物069698(100ng/μl)，1μl引物069699(100ng/μl)，1μldNTP混合物(10mM)，35.5μl去离子水，和0.5μlPhusion^TMHotStartHigh-FidelityDNA聚合酶。将扩增反应温育于，其程序如下：1个循环，在98℃进行30秒；30个循环，每个在98℃进行10秒，65℃进行30秒，72℃进行1分钟，和一个循环，在72℃进行10分钟。将PCR产物用DpnI消化1小时以降解任何质粒DNA模板，并使用PCRPurificationKit纯化PCR产物。

将质粒pShTh60(图1)用SexAI和PacI消化，通过TBE缓冲液(10.8g/LTris碱，5.5g/L硼酸，2mMEDTA，pH8.0)中的0.8%琼脂糖凝胶电泳分离，并使用GelExtractionKit纯化。然后将上述纯化的PCR产物使用In-Fusion^TMAdvantage反应试剂盒***消化的pShTh60片段中，该反应组成为2μl5X缓冲液，0.5μl纯化的PCR产物(187ng/μl)，1.5μl消化的和凝胶纯化的pShTh60(132ng/μl)，1μlIn-Fusion^TM酶和5μl去离子水。将反应在37℃温育15分钟，50℃温育15分钟，置于冰上5分钟，并用40μlTE缓冲液(10mMTris碱，1mMEDTA，pH8.0)稀释，得到pSaMF38(图11)。

将上述含有pSaMF38的连接反应产物的2.5μl等分试样根据生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞。将转化物铺板于2XYT+amp平板上，并在37℃温育过夜。挑取所得的转化体，并对其进行DNA测序以确认mat737基因整合入载体。

mat737基因的核苷酸序列(SEQIDNO:5)和推导的氨基酸序列(SEQIDNO:6)显示于图12。编码序列为1194bp，包含终止密码子。编码的预测蛋白为397个氨基酸，具有44.3kDa的预测分子量和7.32的等电点pH。该基因不含内含子。使用InterProScan程序(TheEuropeanBioinformaticsInstitute)，预测了68个残基的信号肽。基于该程序，预测的成熟蛋白含有329个氨基酸，具有36.6kDa的预测分子量和6.52的等电点pH。

实施例14：将表达载体片段pSaMF38转化入米曲霉NRRL3488(SaMF38)

米曲霉NRRL3488的原生质体制备和转化如实施例2中所述进行。

通过用PmeI进行限制性消化制备质粒pSaMF38以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离4977bp表达盒，并使用Macherey-NagelNucleospinExtractIIKit进行纯化。准备了两个转化反应。对于每个反应，将100μL原生质体制备物转移至12mL聚丙烯管，对其添加5μg直链化的pSaMF38和250μlPEG溶液(60%w/v聚乙二醇(PEG)，10mMTris6.5，10mMCaCl)接着进行轻柔地混合，并在37℃温育30分钟。将每个转化反应物用9mL的STC缓冲液稀释，接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将二十个SaMF38转化体转移至单个COVE平板，并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物，即制备每个的甘油储液(800μl孢子储液，200μl0.1%80)并冻结于-80℃。

实施例15：在含有pSaMF38的表达载体片段的米曲霉转化体(SaMF38)的摇瓶培养中产生苹果酸

来自实施例14中所述的米曲霉pSaMF38转化体和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体苹果酸的定量如实施例3中所述进行。

米曲霉pSaMF38转化体与米曲霉NRRL3488对照菌株相比，在苹果酸产生方面显示超过1.8倍的改善。

实施例16：棘孢曲霉C4-二羧酸转运蛋白基因的克隆和在另一种启动子调控下的表达载体pSaMF41的构建

下述实施例说明棘孢曲霉C4-二羧酸转运蛋白基因可通过使用另一种gpd启动子进行驱动。

将1257bpC4-二羧酸转运蛋白基因c4t521从pSaMF36(见上文)使用下示的引物0611384和069701扩增。

引物0611384：

5’-CCAACAGACACATCTAAACAATGCACGACCACAGCA-3’(SEQIDNO:21)

引物069701：

5’-GTGTCAGTCACCTCTAGTTATCATTCGAACAACTCGGACA-3’(SEQIDNO:22)

PCR反应物组成为：5μl10X反应缓冲液，1μlpSaMF36模板(50ng/μl)，1μl引物0611384(100ng/μl)，1μl引物069701(100ng/μl)，1μldNTP混合物(10mM)，40.5μl去离子水，和0.5μlHotStartDNA聚合酶(Stratagene,LaJolla,CA,USA)。将扩增反应温育于其程序如下：1个循环，在95℃进行2分钟；10个循环，每个在95℃进行10秒，60℃进行30秒，和72℃进行1.5分钟；20个循环，每个在95℃进行10秒，60℃进行30秒，和72℃进行1.5分钟每循环增加10秒。将PCR产物用DpnI消化1小时以降解任何质粒DNA模板。然后使用PCRPurificationKit(QIAGENInc.)纯化PCR产物。

将纯化的PCR产物使用In-Fusion^TMAdvantage反应试剂盒***含有gpd启动子的载体(pShTh108)中，该反应组成为2μl5X缓冲液，0.6μl纯化的PCR产物(127ng/μl)，1.75μl凝胶纯化的HindIII和PacI消化的pShTh108(114ng/μl)，1μlIn-Fusion^TM酶和4.65μl去离子水。将反应在37℃温育15分钟，然后在50℃温育15分钟，然后置于冰上5分钟，并用40μlTE缓冲液稀释，得到pSaMF41。

将连接反应产物的2.5μl等分试样根据生产商的指示转化入ONETOP10化学感受态大肠杆菌细胞(Invitrogen)。将转化物铺板于2XYT+amp平板上，并在37℃温育过夜。挑取所得的转化体，并对其进行DNA测序以确认c4t521基因成功地整合入载体。

棘孢曲霉c4t521基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)显示于图5。编码序列为1257bp，包含终止密码子，并由gpd启动子驱动，与之相对，实施例4中为pgk启动子。

实施例17：将表达载体片段pSaMF41转化入棘孢曲霉NRRL3488(SaMF41)

米曲霉3488的原生质体制备和转化如实施例2中所述进行。

通过藉由用PmeI限制性消化进行的直链化制备质粒pSaMF41以供转化。通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从消化的载体分离5025bp表达盒，并使用供凝胶分离的Macherey-NagelExtractIIKit依照生产商的指示进行纯化。准备了两个转化反应。对于每个反应，将100μL原生质体制备的溶液转移至12mL聚丙烯管，对其添加5μg直链化的pSaMF41和250μlPEG溶液(60%w/v聚乙二醇(PEG)，10mMTris6.5，10mMCaCl)接着进行轻柔地混合，并在37℃温育30分钟。将每个转化反应物用9mL的STC缓冲液稀释，接着将三个不同的3ml等分试样铺板于COVE平板上。然后将每个平板在34℃温育7-10日。将SaMF41转化体转移至单个COVE平板，并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物，即制备每个的甘油储液(800μl孢子储液，200μl0.1%80)并冻结于-80℃。

实施例18：在含有pSaMF41的表达载体片段的米曲霉转化体(SaMF41)的摇瓶培养中产生苹果酸

来自实施例17中所述的每个pSaMF41转化体(SaMF41)、实施例5中所述的pSaMF36转化体(SaMF36)和作为对照的米曲霉NRRL3488的孢子如实施例3中所述制备。对于摇瓶培养转化体苹果酸的定量如实施例3中所述进行。

含有由gpd启动子驱动的棘孢曲霉c4t521基因(SEQIDNO:3)的米曲霉SaMF41转化体与含有由pgk启动子驱动的棘孢曲霉c4t521基因(SEQIDNO:3)的米曲霉SaMF36转化体显示类似的苹果酸产生，并与缺乏c4t521基因的米曲霉NRRL3488对照相比在苹果酸效价方面显示约2倍的增加。

实施例19：含有pSaMF41的表达载体片段的米曲霉转化体(SaMF41)的发酵

如实施例7中所述制备和发酵实施例18中所述的米曲霉pSaMF41转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCT申请号PCT/US10/47002)。

发酵中苹果酸的定量如上文所述进行。米曲霉pSaMF41转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体，表明基于之前描述的ShTh1040和NRRL3488的比较，米曲霉pSaMF41转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比性能更好。

生物材料的保藏

依据布达佩斯条约的条款，下述的生物材料已经保藏于农业研究机构专利培养物保藏中心/农业研究培养物保藏中心(AgriculturalResearchServicePatentCultureCollection)，北区研究中心(NorthernRegionalResearchCenter)，1815UniversityStreet,Peoria,Illinois,61604，并给予下述的登录号：

保藏物登录号保藏日期

大肠杆菌pAaC4T737NRRLB-504002010年6月17日

大肠杆菌pAaC4T521NRRLB-503882010年6月4日

大肠杆菌pAaMAT737NRRLB-504012010年6月17日

所述菌株于下述条件下保藏：确保在本专利申请未决期间，由外国专利法律决定授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了题述申请的副本或其后续文本的国家，依据该外国专利法律的要求，可以获得所述保藏物。然而，应当理解，保藏物的获得并不构成对实施题述发明的许可，实施题述发明是对政府行为所授予的专利权的侵犯。

本发明可进一步通过下述编号段落描述：

[1]一种具有C4-二羧酸转运蛋白活性的分离的多肽，其选自：

(a)多肽，其与SEQIDNO:2、4或6，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:2、4或6或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体；和

[2]一种具有C4-二羧酸转运蛋白活性的分离的多肽，其选自：

(a)多肽，其与SEQIDNO:2或其成熟多肽序列具有至少75%，例如至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少75%，例如至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体；和

[3]一种具有C4-二羧酸转运蛋白活性的分离的多肽，其选自：

(a)多肽，其与SEQIDNO:4或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体；和

[4]一种具有C4-二羧酸转运蛋白活性的分离的多肽，其选自：

(a)多肽，其与SEQIDNO:6或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)多肽，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:5，其成熟多肽编码序列，或前述序列的全长互补链；

(c)多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:5或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:6或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体；和

[5]段[1]-[4]任一项的多肽，其与SEQIDNO:2、4或6，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[6]段[1]-[5]任一项的多肽，其由多核苷酸编码，所述多核苷酸在低严格条件，低-中等严格条件，中等严格条件，中等-高严格条件，高严格条件下，或非常高严格条件与以下杂交：SEQIDNO:1、3或5，其成熟多肽编码序列，或前述序列的全长互补链。

[7]段[1]-[6]任一项的多肽，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1、3或5，或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[8]段[1]-[7]任一项的多肽，其包含或组成为SEQIDNO:2、4或6。

[9]段[1]-[7]任一项的多肽，其包含或组成为SEQIDNO:2、4或6的成熟多肽序列。

[10]段[9]的多肽，其中所述SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸62至397或69至397。

[11]段[9]的多肽，其中所述SEQIDNO:4的成熟多肽是SEQIDNO:4的氨基酸18至418。

[12]段[9]的多肽，其中所述SEQIDNO:6的成熟多肽是SEQIDNO:6的氨基酸69至397。

[13]段[1]-[7]任一项的多肽，其为SEQIDNO:2、4或6的片段，其中所述片段具有C4-二羧酸转运蛋白活性。

[14]段[1]-[7]任一项的多肽，其为SEQIDNO:2、4或6或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或***的变体。

[15]段[1]-[13]任一项的多肽，其由大肠杆菌NRRLB-50400中包含的质粒pAaC4T737中包含的多核苷酸编码。

[16]段[1]-[13]任一项的多肽，其由大肠杆菌NRRLB-50388中包含的质粒pAaC4t521中包含的多核苷酸编码。

[17]段[1]-[13]任一项的多肽，其由大肠杆菌NRRLB-50401中包含的质粒pAaMAT737中包含的多核苷酸编码。

[18]一种组合物，其包含段[1]-[17]任一项的多肽。

[19]一种分离的多核苷酸，其编码段[1]-[17]任一项的多肽。

[20]一种核酸构建体或表达载体，其包含段[19]的多核苷酸，所述多核苷酸可操作地连接于一个或多个(例如两个、几个)调控序列，所述调控序列指导所述多肽在表达宿主中的产生。

[21]一种重组宿主细胞，其包含段[19]的多核苷酸，所述多个核酸可操作地连接于一个或多个调控序列，所述调控序列指导所述多肽的产生。

[22]一种产生段[1]-[17]任一项的多肽的方法，其包括：

(a)在有助于所述多肽产生的条件下培养细胞，所述细胞以其野生型形式产生所述多肽；和

(b)回收所述多肽。

[23]一种产生段[1]-[17]任一项的多肽的方法，其包括：

(a)在有助于产生所述多肽的条件下培养段[21]的重组宿主细胞；和

(b)回收所述多肽。

[24]一种转基因植物、植物部分或植物细胞，其用编码段[1]-[17]任一项的多肽的多核苷酸转化。

[25]一种产生段[1]-[17]任一项的多肽的方法，其包括：

(a)在有助于产生所述多肽的条件下培养段[24]的转基因植物或植物细胞；和

(b)回收所述多肽。

[26]一种产生亲本细胞的突变体的方法，其包括使编码段[1]-[17]任一项的多肽的多核苷酸失活，这导致突变体与亲本细胞相比产生较少的所述多肽。

[27]一种通过段[26]的方法产生的突变细胞。

[28]段[27]的突变细胞，其进一步包含编码天然或异源蛋白的基因。

[29]一种产生蛋白的方法，其包括：

(a)在有助于产生所述蛋白的条件下培养段[27]或[28]的突变细胞；和

(b)回收所述蛋白。

[30]一种双链抑制性RNA(dsRNA)分子，其包含段[19]的多核苷酸的亚序列，其中所述dsRNA任选地是siRNA或miRNA分子。

[31]段[30]的双链抑制性RNA(dsRNA)分子，其长度为约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。

[32]一种抑制细胞中具有C4-二羧酸转运蛋白活性的多肽的表达的方法，其包括对细胞施用或在细胞中表达段[30]或[31]的双链RNA(dsRNA)分子。

[33]一种由段[31]或[32]的方法产生的细胞。

[34]段[33]的细胞，其进一步包含编码天然或异源蛋白的基因。

[35]一种产生蛋白的方法，其包括：

(a)在有助于产生所述蛋白的条件下培养段[33]或[34]的突变细胞；和

(b)回收所述蛋白。

[36]一种分离的多核苷酸，其编码信号肽，所述信号肽包含或组成为SEQIDNO:2的氨基酸1至61或1至68。

[37]一种分离的多核苷酸，其编码信号肽，所述信号肽包含或组成为SEQIDNO:4的氨基酸1至17。

[38]一种分离的多核苷酸，其编码信号肽，所述信号肽包含或组成为SEQIDNO:6的氨基酸1至68。

[39]一种核酸构建体或表达载体，其包含编码蛋白的基因，所述基因可操作地连接于段[36]-[38]任一项的多核苷酸，其中所述基因对于编码所述信号肽的多核苷酸是外源的。

[40]一种重组宿主细胞，其包含段[39]的核酸构建体或表达载体。

[41]一种产生蛋白的方法，其包括：

(a)在有助于产生所述蛋白的条件下培养段[40]的重组宿主细胞；和

(b)回收所述蛋白。

[42]一种产生C4-二羧酸的方法，其包括：

(a)在培养基中培养宿主细胞，其包含编码段[1]-[17]任一项的多肽的异源多核苷酸；和

(b)回收所述C4-二羧酸。

[43]一种增加C4-二羧酸产生的方法，其包括：

(a)将编码段[1]-[17]任一项的多肽的异源多核苷酸转化入宿主细胞；

(b)在培养基中培养经转化的生物体；和

(c)回收所述C4-二羧酸。

[44]段[42]或[43]的方法，其中所述异源多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

[45]段[42]-[44]任一项的方法，其中所述宿主细胞进一步包含异源第二多核苷酸，所述多核苷酸编码苹果酸脱氢酶(例如，SEQIDNO:11的成熟多肽编码序列，或其任何所述的方面)。

[46]段[45]的方法，其中所述异源第二多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

[47]段[42]-[46]任一项的方法，其中所述宿主细胞进一步包含异源第三多核苷酸，所述多核苷酸编码丙酮酸羧化酶(例如，SEQIDNO:15的成熟多肽编码序列，或其任何所述的方面)。

[48]段[47]的方法，其中所述异源第三多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

[49]段[42]-[48]任一项的方法，其中所述宿主细胞是丝状真菌宿主细胞。

[50]段[49]的方法，其中所述丝状真菌宿主细胞选自：枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)。

[51]段[50]的方法，其中所述宿主细胞是曲霉属宿主细胞。

[52]段[50]的方法，其中所述宿主细胞是米曲霉宿主细胞。

[53]段[42]-[52]任一项的方法，其中所述培养基是可发酵培养基。

[54]段[42]-[53]任一项的方法，其中所述C4-二羧酸为大于约10g/L，例如，大于约25g/L，50g/L，75g/L，100g/L，125g/L，150g/L，160g/L，170g/L，180g/L，190g/L，200g/L，210g/L，225g/L，250g/L，275g/L，300g/L，325g/L，350g/L，400g/L，或500g/L；或约10g/L至约500g/L，例如，约50g/L至约350g/L，约100g/L至约300g/L，约150g/L至约250g/L，约175g/L至约225g/L，或约190g/L至约210g/L的效价。

[55]段[42]-[54]任一项的方法，其中C4-二羧酸的水平与不包含编码C4-二羧酸转运蛋白的多核苷酸的宿主细胞相比，在相同条件下培养时增加至少25%，例如至少50%，至少100%，至少150%，至少200%，至少300%，或至少500%。

[56]段[42]-[55]任一项的方法，其中所述C4-二羧酸选自苹果酸、琥珀酸、草酰乙酸、丙二酸和延胡索酸。

[57]段[56]的方法，其中所述C4-二羧酸是苹果酸。

[58]一种宿主细胞，其包含编码段[1]-[17]任一项的多肽的异源多核苷酸；其中所述宿主细胞与不包含编码所述异源多核苷酸的宿主细胞相比，在相同条件下培养时，能够分泌增加水平的C4-二羧酸。

[59]段[58]的宿主细胞，其中所述异源多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

[60]段[57]或[58]的宿主细胞，其中所述宿主细胞进一步包含异源第二多核苷酸，所述多核苷酸编码苹果酸脱氢酶(例如，SEQIDNO:11的成熟多肽编码序列，或其任何所述的方面)。

[61]段[60]的宿主细胞，其中所述异源第二多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

[62]段[58]-[61]任一项的宿主细胞，其中所述宿主细胞进一步包含异源第三多核苷酸，所述多核苷酸编码丙酮酸羧化酶(例如，SEQIDNO:15的成熟多肽编码序列，或其任何所述的方面)。

[62]段[62]的宿主细胞，其中所述异源第三多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

[63]段[58]-[62]任一项的宿主细胞，其中所述宿主细胞是丝状真菌宿主细胞。

[64]段[63]的丝状真菌宿主细胞，其中宿主细胞选自：枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、根霉属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞。

[65]段[64]的丝状真菌宿主细胞，其中所述宿主细胞是曲霉属宿主细胞。

[66]段[65]的丝状真菌宿主细胞，其中所述宿主细胞是米曲霉宿主细胞。

[67]段[58]-[66]任一项的宿主细胞，其中所述细胞能够具有大于约0.1g/L每小时，例如，大于约0.2g/L每小时，0.5g/L每小时，0.6g/L每小时，0.7g/L每小时，0.8g/L每小时，0.9g/L每小时，1.0g/L每小时，1.1g/L每小时，1.2g/L每小时，1.3g/L每小时，1.5g/L每小时，1.75g/L每小时，2.0g/L每小时，2.25g/L每小时，2.5g/L每小时，或3.0g/L每小时；或约0.1g/L每小时至约2.0g/L每小时，例如，约0.3g/L每小时至约1.7g/L每小时，约0.5g/L每小时至约1.5g/L每小时，约0.7g/L每小时至约1.3g/L每小时，约0.8g/L每小时至约1.2g/L每小时，或约0.9g/L每小时至约1.1g/L每小时的C4-二羧酸体积产量/体积生产力。

[68]段[58]-[67]任一项的宿主细胞，其中所述宿主细胞与不包含编码所述异源第一多核苷酸的宿主细胞相比，在相同条件下培养时能够分泌增加至少25%，例如至少50%，至少100%，至少150%，至少200%，至少300%，或至少500%的水平的C4-二羧酸。

[69]段[58]-[68]任一项的宿主细胞，其中所述C4-二羧酸选自苹果酸、琥珀酸、草酰乙酸、丙二酸和延胡索酸。

[70]段[69]的宿主细胞，其中所述C4-二羧酸是苹果酸。

本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内，因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上，从前面的说明中，除本文所显示和描述的之外，本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下，将以包括定义部分的本公开为准。

Claims

1.一种具有C4-二羧酸转运蛋白活性的分离的多肽，其为SEQIDNO:4或SEQIDNO:4的氨基酸18至418。

2.权利要求1的多肽，其中所述多肽由大肠杆菌NRRLB-50388中包含的质粒pAaC4t521中包含的多核苷酸编码。

3.权利要求1或2的多肽，其中所述多肽是曲霉属(Aspergillus)多肽。

4.权利要求3的多肽，其中所述多肽是棘孢曲霉(Aspergillusaculeatus)多肽。

5.一种组合物，其包含权利要求1-4任一项的多肽。

6.一种分离的多核苷酸，其编码权利要求1-4任一项的多肽。

7.一种核酸构建体或表达载体，其包含权利要求6的多核苷酸可操作地连接于一个或多个调控序列，所述调控序列指导所述多肽在表达宿主中的产生。

8.一种重组宿主细胞，其包含权利要求6的多核苷酸，所述多核苷酸可操作地连接于一个或多个调控序列，所述调控序列指导所述多肽的产生。

9.一种宿主细胞，其包含编码C4-二羧酸转运蛋白的异源多核苷酸；其中所述异源多核苷酸：

(a)编码C4-二羧酸转运蛋白，所述转运蛋白由SEQIDNO:4的序列，或SEQIDNO:4的氨基酸18-418组成；或

(b)为SEQIDNO:3或SEQIDNO:3的核苷酸52-1257；

其中所述宿主细胞与不包含所述异源多核苷酸的宿主细胞相比，在相同条件下培养时，能够产生更大量的C4-二羧酸。

10.权利要求9的宿主细胞，其中所述异源多核苷酸可操作地连接于对于所述多核苷酸为外源的启动子。

11.权利要求9或10的宿主细胞，其中所述宿主细胞进一步包含异源第二多核苷酸，所述多核苷酸编码苹果酸脱氢酶。

12.权利要求9或10的宿主细胞，其中所述宿主细胞进一步包含异源第三多核苷酸，所述多核苷酸编码丙酮酸羧化酶。

13.权利要求9或10的宿主细胞，其中所述宿主细胞是丝状真菌宿主细胞。

14.权利要求13的丝状真菌宿主细胞，其中所述宿主细胞是曲霉属宿主细胞。

15.权利要求13的丝状真菌宿主细胞，其中所述宿主细胞是米曲霉宿主细胞。

16.权利要求9或10的宿主细胞，其中所述C4-二羧酸是苹果酸。

17.一种产生C4-二羧酸的方法，其包括：

(a)在培养基中在合适的条件下培养权利要求9-16任一项的宿主细胞以产生C4-二羧酸；和

(b)回收所述C4-二羧酸。

18.一种增加C4-二羧酸产生的方法，其包括：

(a)将编码权利要求1-4任一项的多肽的异源多核苷酸转化入宿主细胞；

(b)在培养基中在合适的条件下培养经转化的宿主细胞以产生C4-二羧酸；和

(c)回收所述C4-二羧酸。