CN101600794A - α-淀粉酶及其用途 - Google Patents

α-淀粉酶及其用途 Download PDF

Info

Publication number
CN101600794A
CN101600794A CNA2008800038321A CN200880003832A CN101600794A CN 101600794 A CN101600794 A CN 101600794A CN A2008800038321 A CNA2008800038321 A CN A2008800038321A CN 200880003832 A CN200880003832 A CN 200880003832A CN 101600794 A CN101600794 A CN 101600794A
Authority
CN
China
Prior art keywords
polypeptide
gly
ala
asp
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008800038321A
Other languages
English (en)
Inventor
马丁·伯彻特
安德斯·维克索-尼尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN101600794A publication Critical patent/CN101600794A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source

Abstract

本发明涉及具有α-淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于制备和使用所述多肽的方法。

Description

α-淀粉酶及其用途
对于序列表的引用
本申请包含计算机可读格式的序列表。计算机可读格式通过提述并入本文。
发明领域
本发明涉及具有α-淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。
相关领域描述
α-淀粉酶(α-1,4-葡聚糖-4-葡聚糖水解酶,EC.3.2.1.1)组成了一组酶,其催化淀粉和其他线性和具有支链的1,4-糖苷寡糖和多糖的水解。
多年来一直为多种不同目的而使用α-淀粉酶,最重要的用途是淀粉液化、纺织品脱浆、纸和纸浆工业中淀粉的修饰,和用于酿造、乙醇生产和烘培。
有非常多与这种在工业上非常重要的酶类有关的专利和科学文献。从,例如,WO 90/11352、WO 95/10603、WO 95/26397和WO 96/23874,已知称作“
Figure A20088000383200031
样α-淀粉酶”的很多α-淀粉酶及其变体。
Figure A20088000383200032
样α-淀粉酶是非常热稳定的,因此适用于在高温进行的过程,如右旋糖生产工艺中的淀粉液化。
另一组α-淀粉酶称为“FungamylTM样α-淀粉酶”,其为与源自米曲霉的α-淀粉酶有关或与其同源的α-淀粉酶。Fungamyl样α-淀粉酶具有相对低的热稳定性,Novozymes A/S,Denmark以商标名FUNGAMYLTM出售的商业产品的最适温度为约55℃,并且不适合于在高温进行的过程。Fungamyl样α-淀粉酶当前用于制备糖浆,例如,用于酿造业。
明显地,有利的是提供可替换的α-淀粉酶,其具有不同于先前已知的α-淀粉酶的性质,特别是在中性或酸性pH具有高活性的α-淀粉酶。
本发明的目的是提供具有α-淀粉酶活性的多肽和编码所述多肽的多核苷酸。
发明概述
本发明提供具有α-淀粉酶活性或淀粉结合活性的分离的多肽,所述多肽选自下组:
(a)多肽,其具有与SEQ ID NO:2的氨基酸1至719有至少60%同一性的氨基酸序列;
(b)多肽,其由在至少中严紧条件下与以下杂交的核苷酸序列编码:(i)SEQ ID NO:1的核苷酸1至2256,或(ii)(i)的互补链;和
(c)多肽,具有通过一个或多个氨基酸的取代(特别是保守取代)、缺失和/或***而由SEQ ID NO:2的氨基酸1至719得到的氨基酸序列。
本发明还涉及分离的多核苷酸,其编码具有α-淀粉酶活性的多肽,所述多核苷酸选自下组:
(a)多核苷酸,其与SEQ ID NO:1的核苷酸97至2256具有至少60%同一性;和
(b)多核苷酸,其在中严紧条件下与以下序列杂交:(i)SEQ ID NO:1的核苷酸97至2256,或(ii)(i)的互补链。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞。
本发明还涉及用于产生这些具有α-淀粉酶活性的多肽的方法,其包括:(a)在有益于产生该多肽的条件下培养包含核酸构建体的重组宿主细胞,所述核酸构建体包含编码所述多肽的多核苷酸;和(b)回收所述多肽。
本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中所述基因与编码信号肽的核苷酸序列可操作地连接,该信号肽由SEQ ID NO:1的核苷酸1至96组成,其中所述基因对于编码所述信号序列的核苷酸序列是外源的。
α-淀粉酶(具有α-淀粉酶活性的多肽)可以用在用于产生麦芽糊精的多种工艺中,包括将淀粉或淀粉水解物与α-淀粉酶一起温育,从而使淀粉或淀粉水解物中的α-1,4键水解。
因此,α-淀粉酶可以用于淀粉工业、食品加工业、纺织业和洗涤剂工业,例如,用于淀粉液化、液化淀粉的糖化、纺织品脱浆、纸和纸浆工业中的淀粉修饰、酿造、乙醇生产和烘培(baking)。α-淀粉酶可以用于产生酶修饰的淀粉衍生物,其中α-淀粉酶用于液化和/或糖化淀粉;用于产生糖浆(例如,高麦芽糖浆),其中α-淀粉酶用于淀粉液化和/或液化淀粉的糖化;用于将纺织品脱浆,其中α-淀粉酶用于处理纺织品;和用于酿造,其中在麦芽汁发酵过程中加入α-淀粉酶;用于乙醇生产,其中α-淀粉酶用于蒸馏醪液中淀粉的液化;和用于将包含α-淀粉酶的面团烘培的工艺。α-淀粉酶可以在淀粉转化过程使用,用于液化和/或糖化;用于在高麦芽糖浆产生过程中液化淀粉;用于纺织品脱浆;用于产生乙醇;用于酿造;和用于烘培。
定义
α-淀粉酶活性:术语“α-淀粉酶活性”在本文中定义为1,4-葡聚糖4-葡聚糖水解酶(1,4-glucan 4-glucanohydrolase)(E.C.No.3.2.1.1)活性,其催化淀粉和其他线性和分支的1,4-糖苷寡糖和多糖的水解。α-淀粉酶测定法如下所述。
淀粉结合活性:术语“淀粉结合活性”应理解为多肽结合天然淀粉的能力。就本发明而言,淀粉结合活性应理解为淀粉与糖结合模块结合的结合活性如A.B.Boraston在(Boraston,A.B.等2004.Carbohydrate-binding modules:fine-tuning polysaccharide recognition.Biochem.J.382:769-781)中综述的。
分离的多肽:术语“分离的多肽”用于本文中指,如通过SDS-PAGE测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。
本发明的多肽优选是基本上纯的形式。具体而言,优选所述多肽是“基本上(essentially)纯的形式”,即,所述多肽制备物基本上(essentially)不含与其天然结合的其它多肽材料。这能够通过以下方式实现,例如,通过公知的重组方法或由经典纯化方法制备多肽。
在本文中,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。
同一性:参数“同一性”描述两个氨基酸序列之间的相关性。
就本发明而言,两个氨基酸序列的比对通过使用来自EMBOSS软件包(http://emboss.org)2.8.0版的Needle程序来确定。Needle软件执行Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453中所述的全局比对算法。使用的取代矩阵为BLOSUM62,缺口开放罚分为10,而缺口延伸罚分为0.5。
第一和第二氨基酸序列之间的同一性程度如下计算:两个序列比对中完全匹配的数目,除以第一或第二序列其中较短者的长度。结果用百分比同一性表示。
当两个序列在重叠的相同位置有相同的氨基酸残基时即发生完全匹配。序列的长度是序列中氨基酸残基的数目。
就本发明而言,两个核苷酸序列之间的同一性程度通过Wilbur-Lipman方法(Wilbur和Lipman,1983,Proceedings of the National Academy of ScienceUSA 80:726-730)使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)来确定,使用同一性表和以下多重比对参数:缺口罚分10和缺口长度罚分10。配对比对参数是K元组(Ktuple)=3,缺口罚分=3,和窗口=20。
在一个具体的实施方案中,多肽的氨基酸序列与,或对,SEQ ID NO:2的氨基酸1至719的同一性百分比通过下述方式确定:i)使用Needle程序比对两个氨基酸序列,用BLOSUM62取代矩阵,缺口开放罚分为10,和缺口延伸罚分为0.5;ii)计算比对中完全匹配的数目;iii)完全匹配的数目除以两个氨基酸序列中最短者的长度,和iv)将iii)的除法结果转换成百分比。对,或与本发明其他序列如SEQ ID NO:2的氨基酸1-719的同一性百分比以类似的方法计算。
本发明的多肽具有由SEQ ID NO:2的氨基酸1至719所示氨基酸序列组成的多肽的α-淀粉酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:2的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,或其同源序列;其中所述片段具有生物活性,如α-淀粉酶活性或淀粉结合活性。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程改造的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式。具体而言,优选本文公开的多核苷酸是“基本上(essentially)纯的形式”,即,所述多核苷酸制备物基本上不含与其天然结合的其它多核苷酸材料。在本文中,术语“基本上纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段。当所述核酸构建体含有本发明的编码序列表达所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有组分。每种调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可提供有用于引入特异性限制位点的接头,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置,使得调控序列指导多肽的编码序列的表达。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始。编码序列可以是DNA、cDNA或重组核苷酸序列。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:2的氨基酸1至719组成的多肽的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个氨基酸的取代、缺失和/或***,以及一个或多个氨基酸侧链的置换。
人工变体:当用在本文时,术语“人工变体”的意思是具有α-淀粉酶活性的多肽,所述多肽由表达修饰的SEQ ID NO:1的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰公开于SEQ ID NO:1的核苷酸序列来获得。
发明详述
α-淀粉酶
在第一个方面,本发明涉及具有下述氨基酸序列的分离的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽(即,氨基酸1至719)具有至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,或至少97%的同一性程度,所述多肽具有α-淀粉酶活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有的氨基酸序列与SEQ ID NO:2的氨基酸1至719相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或其具有α-淀粉酶活性或淀粉结合活性的片段。在优选的方面,多肽包含SEQ IDNO:2的氨基酸序列。在另一个优选方面,多肽包含SEQ ID NO:2的氨基酸1至719,或其等位变体;或其具有α-淀粉酶活性的片段。在另一个优选方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或其具有α-淀粉酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:2的氨基酸序列组成。
在第二个方面,本发明涉及具有α-淀粉酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下杂交:(i)SEQ ID NO:1的核苷酸1至2256,(ii)(i)的亚序列,或(iii)(i)或(ii)的互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,ColdSpring Harbor,New York)。SEQ ID NO:1的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有α-淀粉酶活性或淀粉结合活性的多肽片段。
SEQ ID NO:1的核苷酸序列或其亚序列,以及SEQ ID NO:2的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从多种生物体鉴定和克隆编码具有α-淀粉酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针包含于本发明中。
因而,可从由这些生物体制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有α-淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其它分离技术分离来自这些生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ IDNO:1或其亚序列同源的克隆或DNA,将所述载体材料用在Sounthern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1所示的核苷酸序列、它的互补链或其亚序列。可使用X射线片(X-ray film)检测在这些条件下与核酸探针杂交的分子。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
在一个具体的实施方案中,使用0.2X SSC、0.2%SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)进行洗涤。在另一个具体的实施方案中,使用0.1X SSC、0.2%SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)进行洗涤。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6×SSC加0.1%SDS中洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度下洗涤两次,每次15分钟。
在含盐的杂交条件下,有效的Tm可以控制探针和结合滤膜的DNA之间用于成功杂交所需的同一性程度。可以使用下述公式确定有效的Tm,从而确定在各种严紧性条件下两个DNA杂交所需的同一性程度,从而。
有效的Tm=81.5+16.6(log M[Na+])+0.41(%G+C)-0.72(%甲酰胺)
(参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)
SEQ ID NO:1的G+C含量为约55%。对于中严紧性,甲酰胺为35%,并且对于5X SSPE的Na+浓度为0.75M。对这些数值应用这一公式,得到有效Tm为76℃。
另一个相关的关系是两个DNA之间1%的不匹配会将Tm降低1.4℃。为了确定在42℃在中严紧条件下两个DNA杂交所需的同一性程度,使用下述公式:
%同源性=100-[(有效Tm-杂交温度)/1.4]
(参见www.ndsu.nodak.edu/instruct/mcclean/plsc731/dna/dna6.htm)
对数值应用这一公式,在42℃中严紧条件下两个DNA杂交所需的同一性程度为100-[(76-42)/1.4)]=76%。
在第三个方面,本发明涉及具有活性的分离的多肽,其由包含SEQ ID NO:1的核苷酸97至751的多核苷酸编码,作为唯一的基序。
多肽可以提供淀粉水解的下述降解产物:除了分子量较高的糊精之外,还有葡萄糖、麦芽糖、麦芽三糖、麦芽四糖、麦芽五糖、麦芽六糖、麦芽七糖。具体而言,可以提供淀粉水解的下述降解产物:相似量的葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),和大量较大的糊精(>DP10)。
多肽的分子量可以约为78kDa。可以如下所述确定淀粉分解活性。pH 6.0时α-淀粉酶活性的最适温度为约60℃,37℃时的最适pH为约6.0。
多肽可以是人工变体,其具有通过取代(特别是保守取代)、缺失和/或***一个或多个氨基酸而由SEQ ID NO:2的成熟片段得到的氨基酸序列。优选氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或***,其不显著影响蛋白质的折叠和/或活性;小缺失,通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸(如多组氨酸区(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain))。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上可获得的,包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸(dehydroproline)、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,α-淀粉酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而确定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来确定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,如由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2的氨基酸1至719的氨基酸取代、缺失和/或***的总数可为至多10,至多9,至多8,至多7,至多6,至多5,至多4,至多3,至多2,或者至多1。
α-淀粉酶的降解谱
由淀粉降解产生的降解产物依赖于降解使用的特定的α-淀粉酶。典型的真菌α-淀粉酶如米曲霉α-淀粉酶产生麦芽糖(DP2)、麦芽三糖(DP3)和麦芽四糖(DP4)作为主要降解产物,剩余大部分较大的糊精(>DP10)。芽孢杆菌属α-淀粉酶如嗜热脂肪芽孢杆菌α-淀粉酶和地衣芽孢杆菌α-淀粉酶,通常产生葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽五糖(DP5)或麦芽六糖(DP6)作为主要降解产物,仅剩余小部分的较大糊精(>DP10)。
根据本发明的α-淀粉酶产生大约相似量的葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),使用RI检测估计,剩余大量较大的糊精(>DP10)。
因此,在另一个方面,本发明涉及α-淀粉酶,其降解淀粉提供相似量的葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),并剩余大量较大的糊精(>DP10)。
具有α-淀粉酶活性的多肽的来源
本发明的多肽可以获得自任何属的生物体。优选本发明的多肽获得自微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是由核苷酸序列编码的多肽通过已***或天然存在本发明的核苷酸序列的生物体产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
多核苷酸
本发明还涉及分离的多核苷酸,其具有编码本发明的多肽的核苷酸序列。在优选的方面,核苷酸序列示于SEQ ID NO:1。在另一个优选方面,核苷酸序列是SEQ ID NO:1的成熟多肽编码区。本发明还涵盖编码下述多肽的核苷酸序列,所述多肽具有SEQ ID NO:2的氨基酸序列或其成熟多肽;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:1。本发明还涉及SEQ IDNO:1的亚序列,所述亚序列编码具有α-淀粉酶活性的SEQ ID NO:2的片段。
本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQ ID NO:1的成熟多肽编码序列中包含至少一个突变,其中所述突变核苷酸序列编码由SEQ IDNO:2的氨基酸1至719组成的多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,并包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共有结构特征的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。
在本发明中,使用元基因组(metagenomic)技术分离具有SEQ ID NO:1中所示的核苷酸序列的多核苷酸,即从土壤样本纯化多核苷酸,由纯化的多核苷酸产生多核苷酸库并筛选库以提供包含SEQ ID NO:2中所示的核苷酸序列的多核苷酸。因此不知道包含SEQ ID NO:1中所示的核苷酸序列的多核苷酸源自哪种生物体。
本发明还涉及具有编码下述多肽的核苷酸序列的多核苷酸,所述多肽与SEQ ID NO:1的成熟多肽编码序列(即,核苷酸97至2256)具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且最优选至少97%同一性的同一性程度,所述多核苷酸编码活性多肽。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可能是必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQID NO:1的多肽编码区存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是其符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,Protein Expression and Purification 2:95-107。
对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性是关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,Science 244:1081-1085)来鉴定。在后一的技术中,将突变引入到分子中的每个正电残基处,并且测试所得突变分子的α-淀粉酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构而确定,如通过如核磁共振分析、晶体学或光亲和标记这样的技术来确定(参见,例如,de Vos等,1992,Science 255:306-312;Smith等,1992,Journal of Molecular Biology 224:899-904;Wlodaver等,1992,FEBS Letters 309:59-64)。
本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中等严紧条件,更优选中-高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下序列杂交:(i)SEQ ID NO:1的核苷酸96至2256;或(ii)(i)的互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。
本发明还涉及分离的多核苷酸,其通过以下方式获得:(a)在中-高、高或非常高严紧条件下,将DNA的群体与以下杂交:(i)SEQ ID NO:1的核苷酸97至2256,或(ii)(i)的互补链;和(b)分离杂交的多核苷酸,其编码具有α-淀粉酶活性的多肽。
元基因组技术
在本说明书和权利要求中,术语元基因组意欲表示从包含不同生物体的样本分离的多核苷酸的集合。
样本可以是任何已知或疑似包含合适生物体的样本,并且经常从自然环境收集。样本可以是土壤、水、植物材料或疑似包含可能令人感兴趣的多核苷酸的其他材料的样本。
当样本已提供有完整基因组材料时,优选使用例如本领域已知的技术,如在(Ausuble等1995“Current protocols in molecular biology Publ:John Wileyand sons)中所述方法从样本提取完整的基因组DNA。获得的基因材料代表样本中存在的生物体。
当已经制备了元基因组时,可使用元基因组产生元基因组文库,在其中筛选特别令人感兴趣的多核苷酸序列。元基因组文库和DNA的产生和筛选可以使用本领域公知的方法进行。
一个优选的方法是在随后进行筛选的表达载体中制备文库。如技术人员所理解的,已经开发出几种表达载体,其包括λZAP***,可由Stratagene得到。
根据本发明,可以使用公知的α-淀粉酶筛选***筛选文库,如将文库涂布在含淀粉的琼脂平板上,并且通过所述克隆周围的透明圈鉴定包含编码α-淀粉酶的多肽的克隆。淀粉可以是着色的,便于鉴定阳性克隆周围的透明区域,或者可以在克隆生长后将淀粉染色,所述克隆通过,例如,将涂布有文库克隆的平板置于包含碘蒸汽的室中生长,从而淀粉将着深色,并且透明区容易可见。
当已经鉴定了阳性克隆时,可以使用公知的DNA操作技术如(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor,New York)中所述,进一步表征和操作分离的多核苷酸。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
技术人员应了解的是,在合适的宿主细胞中,包括于适合表达根据本发明的多肽的核酸构建体中的元件依赖于特定选择的宿主细胞。在本发明中,细菌细胞是优选的宿主细胞,并且因此详细描述了根据本发明的适用于细菌细胞中的核酸构建体。然而技术人员应了解的是,其他宿主细胞如真菌细胞、哺乳动物细胞、植物细胞或昆虫细胞也可以根据本发明使用,并且技术人员能够决定哪种元件适合包含于意欲与这些宿主细胞联合使用的核酸构建体中。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列***载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是合适的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽糖α-淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of the NationalAcademy of Sciences USA 80:21-25)。另外的启动子在″Useful proteins fromrecombinant bacteria″于Scientific American,1980,242:74-94中;和在Sambrook等,1989,见上文中有所描述。
在优选的方面,启动子是由来自下述基因的启动子组成的启动子***:地衣芽孢杆菌α-淀粉酶基因(amyL)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)和包含稳定化序列的苏云金芽孢杆菌cryIIIA启动子,如WO 99/43835中所述。
调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相联的氨基酸序列,并且指导编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是必需的。或者,外源信号肽编码区可以简单地替代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码区可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:芽孢杆菌属NCIB 11837产麦芽糖α-淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节***的实例是引起基因表达响应于化学或物理刺激,包括调节化合物的存在而开启或关闭的那些***。原核***中的调节***包括lac、tac和trp操纵基因***。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。上述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点***或取代编码多肽的核苷酸序列。可供选择的是,可以通过在合适的用于表达的载体中***包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与合适的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
本发明的载体优选地含有一个或多个选择性标记,其允许简单选择经转化的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
条件必需基因可以作为非抗生素选择性标记起作用。细菌条件必需非抗生素选择性标记的非限制性实例是来自枯草芽孢杆菌、地衣芽孢杆菌或其他芽孢杆菌的dal基因,其仅在缺少D-丙氨酸的条件下培养细菌时是必需的。当细胞在半乳糖存在的情况下或在能引起半乳糖存在的培养基中生长时,编码参与UDP-半乳糖的转换(turnover)的酶的基因也可以在细胞中作为条件必需标记起作用。这类基因的非限制性实例是来自枯草芽孢杆菌或地衣芽孢杆菌的编码UTP-依赖型磷酸化酶(EC 2.7.7.10)、UDP-葡萄糖-依赖型脲苷酰转移酶(EC 2.7.7.12)或UDP-半乳糖差向异构酶(EC 5.1.3.2)的那些。芽孢杆菌的木糖异构酶基因如xylA也可以用作在以木糖作为唯一碳源在基本培养基中生长的细胞中的选择性标记。利用葡萄糖酸所需的基因,gntK和gntP也可以用作以葡萄糖酸作为唯一碳源在基本培养基中生长的细胞中的选择性标记。条件必需基因的其他实例在本领域中已知。抗生素选择性标记可以赋予对这些抗生素的抗生素抗性,所述抗生素如氨苄青霉素、卡那霉素、氯霉素、红霉素、四环素、新霉素、潮霉素或甲氨蝶呤。
本发明的载体优选含有元件,其允许载体整合入宿主细胞的基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数目的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
可以将多于一个拷贝的本发明的多核苷酸***宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括在多核苷酸中,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增的拷贝,并且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,所述重组宿主细胞包含本发明的多核苷酸,将其有利地用于多肽的重组产生中。将包含本发明多核苷酸的载体引入宿主细胞中,从而将该载体保留作为染色体整合体(chromosomal integrant)或作为前述的自复制的染色体外载体。术语“宿主细胞”包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不相同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。
宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例如,真核生物。
有用的单细胞微生物是细菌细胞,例如***,包括但不限于,芽孢杆菌属细胞,例如,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌;或链霉菌属细胞,例如,浅青紫链霉菌和鼠灰链霉菌,或革兰氏阴性细菌例如大肠杆菌和假单胞菌属菌种。在优选的方面,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选的方面,芽孢杆菌属细胞是嗜碱的芽孢杆菌属。
可通过如下方法实现将载体导入细菌宿主细胞:例如原生质体转化(参见,例如,Chang和Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,Journal of Bacteriology81:823-829或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见,例如,Koehler和Thorne,1987,Journal of Bacteriology169:5771-5278)。
宿主细胞还可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。
在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’sDictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝***孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上文)。
在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在甚至更加优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或耶氏酵母属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁弗酵母,诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂耶氏酵母(Yarrowia lipolytica)细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filobasidium、镰孢属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属、毁丝霉属、新考玛脂霉属(Neocallimastix)、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另外的最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另外最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、浅黄拟蜡菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、浅红拟蜡菌(Ceriporiopsis subrufa)、或虫拟蜡菌(Ceriporiopsis subvermispora)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238023和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journalof Bacteriology 153:163;和Hinnen等,1978,Proceedings of the NationalAcademy of Sciences USA 75:1920。
最优选的宿主细胞是细菌细胞如属于芽孢杆菌属的***。
产生方法
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。优选地,所述细胞是芽孢杆菌属的细胞,并且更优选地,所述细胞是枯草芽孢杆菌的细胞。
本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有益于产生多肽的条件下培养宿主细胞;和(b)回收所述多肽。
本发明还涉及用于产生本发明的多肽的方法,包括:(a)在有益于产生多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQID NO:1的成熟多肽编码区中具有至少一个突变,其中所述突变核苷酸序列编码由SEQ ID NO:2的氨基酸1至719组成的多肽,和(b)回收所述多肽。
在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification;J.-C.Janson和Lars Ryden编,VCHPublishers,New York,1989)。
组合物
本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的α-淀粉酶活性增加,例如,以至少1.1的富集因数(enrichment factor)增加。
所述组合物可以包含本发明的多肽作为主要酶组分,例如,单组分组合物。或者,所述组合物可以包含多种酶活性,如氨肽酶、α-淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以将包括于所述组合物中的多肽依照本领域内已知方法稳定。
以下提供的实施例是本发明多肽组合物的优选的用途。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。
用途
α-淀粉酶可以用于产生麦芽糊精,包括在合适的条件下将淀粉或淀粉水解物与α-淀粉酶一起温育以水解淀粉或淀粉水解物中的α-1,4键。麦芽糊精可以是线性或有支链的,并且可以包括葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7)。
可以通过如下方式制备麦芽糊精:在热稳定的α-淀粉酶存在的情况下液化(部分水解)淀粉,然后在本发明的α-淀粉酶存在的情况下,在适于切割α-(1,4)糖苷键的条件下将液化淀粉糖化(进一步水解)。
可以处理非常高的淀粉浓度,例如30%至40%干-固体。液化可以包括在约105℃初步水解约五分钟,然后在85℃至90℃的温度温育约一小时,以得到10至15的右旋糖当量(D.E.)。用本发明的α-淀粉酶进行的糖化可以在pH5-6.5和50-70℃进行24-72小时,优选36-48小时。用本发明的α-淀粉酶进行的糖化可以在比用常规真菌淀粉酶糖化时更高的温度和更低的pH进行。
本发明的α-淀粉酶还可以用于淀粉转化、醇生产、酿造和烘培。
麦芽糖浆的产生可以包括以下步骤:1)在α-淀粉酶存在的情况下液化淀粉;2)在本发明的α-淀粉酶存在的情况下糊精化;和3)回收所述糖浆;和任选地纯化糖浆。
步骤1)中用于液化的α-淀粉酶可以是任何α-淀粉酶。优选的α-淀粉酶是芽孢杆菌属α-淀粉酶,如Termamyl-样α-淀粉酶,包括地衣芽孢杆菌α-淀粉酶(作为TermamylTM商业上可得到(Novozymes)),解淀粉芽孢杆菌α-淀粉酶(作为BAN销售(Novozymes)),嗜热解脂肪芽孢杆菌α-淀粉酶(作为S型TermamylTM 120L销售),源自芽孢杆菌属菌种NCIB 12289、NCIB 12512、NCIB 12513或DSM 9375的菌株的α-淀粉酶,所有上述菌株均在WO 95/26397中详细描述,和由Tsukamoto等,Biochemical and Biophysical ResearchCommunications,151(1988),pp.25-31描述的α-淀粉酶。“Termamyl-样α-淀粉酶”的定义中的α-淀粉酶在例如WO 96/23874(Novozymes)中限定。
在另一个方面,本发明涉及产生麦芽糖的方法,包括下述步骤:1)在140-160℃在pH 4-6液化淀粉;2)在60-95℃,特别是65-85℃,如70-80℃,在pH 4-6,在本发明的真菌α-淀粉酶变体存在的情况下糊精化;和3)回收所述糖浆;和任选地纯化所述糖浆。
在本发明的一个实施方案中,在步骤(2)中加入有效量的葡糖淀粉酶。在这个实施方案(包括用葡糖淀粉酶处理)中的糖浆不是麦芽糖浆,而是具有不同糖谱(sugar profile)的糖浆。葡糖淀粉酶可以是曲霉属葡糖淀粉酶,具体为黑曲霉葡糖淀粉酶。
或者,方法包含下述步骤:1)在95-110℃在pH 4-6,在芽孢杆菌属α-淀粉酶存在的情况下液化淀粉;2)在70-95℃在pH 4-6,在本发明的α-淀粉酶存在的情况下液化,然后回收和/或任选地纯化获得的产物。
最后,本发明的一些方面涉及多种洗涤剂用途。一个方面涉及包含本发明的α-淀粉酶的洗涤添加剂,任选地为无粉尘颗粒、稳定化液体或受保护的酶的形式。这个方面的优选实施方案涉及包含0.02-200mg酶蛋白质/g添加剂的洗涤添加剂。另一个优选的实施方案涉及根据先前方面的洗涤添加剂,其额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、另一种淀粉分解酶和/或纤维素酶。另一个方面涉及包含本发明α-淀粉酶的洗涤组合物,并且这个方面的优选实施方案涉及洗涤组合物,其额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、另一种淀粉分解酶和/或纤维素酶。另一个方面涉及包含本发明的α-淀粉酶的手动或自动洗碗洗涤剂组合物。优选的洗碗洗涤剂组合物额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、另一种淀粉分解酶和/或纤维素酶。最后一个洗涤剂相关方面是包含本发明的α-淀粉酶的手动或自动洗衣组合物。根据本发明优选的洗衣组合物额外包含另一种酶,如蛋白酶、脂肪酶、过氧化物酶、淀粉分解酶和/或纤维素酶。
淀粉结合域
本发明还涉及包含编码蛋白质的基因的核酸构建体,所述基因与由编码具有淀粉结合活性的多肽的SEQ ID NO:1的片段组成的核苷酸序列可操作连接,其中所述基因对于SEQ ID NO:1是外源的。
本发明还涉及包含这些核酸构建体的重组表达载体和重组宿主细胞。
本发明还涉及用于产生蛋白质的方法,其包括:(a)在适于产生所述蛋白质的条件下培养这种重组宿主细胞;和(b)回收所述蛋白质。
核苷酸序列可以单独地以调控序列与外源基因可操作地连接(operablylinked to foreign genes individually with control sequences),如上文所述。
所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此涵盖肽、寡肽和蛋白质。术语“蛋白质”还涵盖组合以形成编码产物的两种或两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一种或多种蛋白质对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质的天然存在的等位基因变异和工程改造的变异。
优选地,蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报道蛋白(reporter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、α-淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
基因可以从任何原核、真核或其它来源获得。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
α-淀粉酶试验
二硝基水杨酸法
就本发明而言,可以使用二硝基水杨酸法测定α-淀粉酶活性,所述方法为由Miller,G.L.在(Miller,G.L.1959.Use of dinitrosalicylic acid fordetermination of reducing sugar.Anal.Chem.31:426-428.)中描述的用于测定还原糖的方法。
PNP-G7方法
或者,可以通过使用PNP-G7为底物的方法测定α-淀粉酶活性。PNP-G7(对硝基苯基-α,D-麦芽庚糖苷)是封闭的(blocked)寡糖,其能被内切淀粉酶切割。切割后,试剂盒中包括的α-葡糖苷酶消化底物以释放游离的PNP分子,PNP分子为黄色,因此能在λ=405nm.(400-420nm.)处通过可见光分光光度法测定。包含PNP-G7底物和α-葡糖苷酶的试剂盒可以从Boehringer-Mannheim获得(目录号1054635)。
为了制备底物,向5ml缓冲液(BM1442309)中加入一瓶底物(BM1442309)。为了制备α-葡糖苷酶,向45ml缓冲液(BM1442309)中加入一瓶α-葡糖苷酶(BM 1462309)。通过将5ml α-葡糖苷酶溶液与1ml底物混合制成工作溶液。通过将20μl酶溶液转移至96孔微量滴定板并在25℃温育而进行试验。在25℃加入200μl工作溶液。将溶液混合并预温育1分钟,在3分钟内在OD 405nm每15秒钟测定吸收。依赖时间的吸收曲线的斜率与指定条件组下的所述α-淀粉酶的比活性(活性每mg酶)成正比。
实施例
用作缓冲液和底物的化学品都是至少试剂级的商业产品。
使用Phadebas试验测定α-淀粉酶活性
通过使用
Figure A20088000383200291
片为底物的方法测定α-淀粉酶活性。Phadebas片(
Figure A20088000383200292
α-淀粉酶测试,由Pharmacia Diagnostic提供)包含交联的不可溶蓝色淀粉聚合物,其已经与牛血清白蛋白和缓冲液物质混合并制成片剂。
对于每次单独的测试,将一片悬浮于包含5ml 50mM Britton-Robinson缓冲液(50mM乙酸,50mM磷酸,50mM硼酸,0.1mM CaCl2,用NaOH将pH调至感兴趣的数值)的试管中。在感兴趣的温度,在水浴中进行测试。将待测试的α-淀粉酶用x ml 50mM Britton-Robinson缓冲液稀释。向5ml 50mM Britton-Robinson缓冲液中加入1ml这种α-淀粉酶溶液。由α-淀粉酶水解淀粉产生可溶的蓝色片段。在620nm处用分光光度计测定获得的蓝色溶液的吸光度,所述吸光度是α-淀粉酶活性的函数。
重要的是,在温育10或15分钟(测试时间)后测定的620nm吸光度于620nm在0.2至2.0吸光度单位的范围内。在此吸光度范围中,活性和吸光度之间有线性(Lambert-Beer定律)。因此必须调整酶的稀释度(dilution)使其符合此标准。在特定的条件组(温度、pH、反应时间、缓冲液条件)下,1mg给定的α-淀粉酶将水解一定量的底物,并产生蓝色。在620nm测定颜色强度。测得的吸光度与给定条件组下所述α-淀粉酶的比活性(活性/mg纯α-淀粉酶蛋白质)成正比。
培养基与溶液
除非另外指出,限制性内切酶和其他用于DNA操作的酶由(供应商)提供,并且根据制造商的说明使用。
实施例1:序列SEQ ID NO:1的鉴定
A.基因组文库构建
从Denmark,Sandbjerg中的地点采集含沙土壤(sandy soil)样本。将土壤样本巴氏杀菌并用橄榄油富集(olive oil enriched)。通过使用标准分子生物学技术(Ausuble等1995“Current protocols in molecular biology Publ:John Wiley andsons)从这一富集培养物中制备染色体DNA。
用限制性内切酶MboI部分切割制备的DNA,并通过超速离心在蔗糖梯度中分离。提取3至10kb的片段,沉淀并重悬于合适的缓冲液中。
通过使用Stratagene ZAP ExpressTM预消化的载体试剂盒和StratageneZAP ExpressTM预消化的
Figure A20088000383200301
克隆试剂盒(用BamH I预消化)(StratageneInc.,USA),根据销售方的说明/推荐,制备基因组文库。
得到的lambdaZAP文库包含200pfu/ul,收集其中的100,000pfu用于大量剪切(mass excision)。将得到的41,900,000cfu/ul大肠杆菌菌落汇集,并通过使用Qiagen Spin微量制备试剂盒(Qiagen,德国)制备质粒。
B.文库筛选
将约100,000个文库克隆均匀地涂布在包含用Cibachron红染色的支链淀粉(1%,重量百分比)、LB琼脂和卡那霉素(25微克/ml)的平板上。
在37℃过夜温育后,通过菌落周围指示分泌淀粉降解酶的透明区(clearingzone)来鉴定阳性克隆。
鉴定出这个文库中的一个阳性克隆(pSBL0622-2),通过如下验证这个克隆胞外产生淀粉降解酶:使克隆在包含卡那霉素(25微克/ml)和1%(重量百分比)马铃薯淀粉(Sigma,S-2630)的LB平板上过夜生长,然后将淀粉进行碘蒸汽染色,当淀粉降解时,其在菌落周围指示透明区。此外,在SDS-Page凝胶上计算的分子量(78kDa)的条带对应于来自SEQ ID NO:2位置1-719的成熟多肽的的计算的分子量,其指示了酶的表达。仅筛选宿主(大肠杆菌DH10B)本身不显示这个蛋白质条带。
根据制造商的推荐,通过使用Qiagen质粒制备试剂盒,制备活性克隆的质粒。
C.基因的分析
使用载体中具有退火位点的T3和T7测序引物,通过Sanger测序由质粒获得基因序列,根据获得的序列设计定制的测序引物,如SEQ ID NO:3-8中所示。
本发明编码α-淀粉酶的完整DNA序列如SEQ ID NO:1中所示,推定的氨基酸序列如SEQ ID NO:2中所示,并且鉴定了信号肽。
分析推定的氨基酸序列,全长多肽显示包括下述序列的域结构:
●能划分为糖基水解酶家族13亚家族2的成员的α-淀粉酶蛋白质序列(Mark R.Stam等,”Dividing the large glycoside hydrolase family 13 intosubfamilies:towards improved functional annotations ofa-alpha-amylase-related proteins”,Protein Engineering,Design&Selectionvol.19no.12pp.555-562,2006)并且包含N-端信号肽序列,GH13_2域,
●α-淀粉酶C-端域(Pfam登录号PF02806)和
●糖结合域(CBM)20(Pfam PF00686)。
实施例2:枯草芽孢杆菌中α-淀粉酶的克隆
通过PCR融合来自地衣芽孢杆菌的α-淀粉酶(AmyL)的信号肽,使其符合编码α-淀粉酶的基因的阅读框。通过同源重组,将编码获得的编码序列的DNA整合到枯草芽孢杆菌宿主细胞基因组上。在三启动子***(如WO99/43835中所述)的控制下表达基因构建体,所述***由来自地衣芽孢杆菌α-淀粉酶基因(amyL)的启动子、来自解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的启动子和包括稳定化序列的苏云金芽孢杆菌cryIIIA启动子组成。使用编码氯霉素乙酰转移酶的基因作为标记(在例如Diderichsen等,A useful cloning vectorfor Bacillus subtilis.Plasmid,30,p.312,1993中描述)。
选择十个具有氯霉素抗性的转化体,在大豆基培养基(soy based media)中的4mL培养物中在37℃生长3天,并将20微升上清液点样在包含cibachron-红标记支链淀粉的琼脂平板上。选择一个这样的克隆,通过DNA测序分析来验证构建体的DNA序列正确。
在旋转摇床上,在300mL带挡板的锥形瓶中进行α-淀粉酶表达克隆的发酵,每瓶包含补加34mg/l氯霉素的100mL大豆基培养基。在37℃将克隆发酵4天。
使用色谱,在苯基琼脂糖柱上从上清液纯化酶,然后使用盐梯度,在Q琼脂糖柱上洗脱。汇集物(pool)的吸收值为A280=0.79和A260=0.43,并且纯化的淀粉酶为12%SDS-PAGE凝胶上的主要条带。在实施例4、5和6中使用纯化的酶。
实施例3:α-淀粉酶活性的检测
A.使用二硝基水杨酸的试验
通过使用二硝基水杨酸方法进行淀粉分解活性的确定,所述方法为测定还原糖的方法(Miller,G.L.1959.Use of dinitrosalicylic acid for determination ofreducing sugar.Anal.Chem.31:426-428.)。
B.用酶谱检测:
通过加入三氯乙酸至终浓度10%,然后在冰浴中温育30分钟并在13,000xg离心5分钟,将来自携带α-淀粉酶基因(SEQ ID NO:1)的表达克隆(实施例2)的两百微升培养物上清液沉淀。去除上清液,并在10%SDS-PAGE凝胶上对样品(50μL)进行大小排阻。在室温在包含100mM Tris pH 8和5mM CaCl2的2.5%Triton X-100中洗涤凝胶,然后在室温在1%Paselli淀粉(Avebe,Netherlands)、100mM Tris pH 8和5mM CaCl2中温育30分钟。用Lugol溶液(溶于100mL水中的0.15g I2,1.5g KI)将凝胶染色10秒钟,并用过量水将剩余的Lugol溶液洗去。
携带α-淀粉酶基因(SEQ ID NO:2)的表达克隆的SDS-PAGE和酶谱(zymogram)指示了期望大小(78kDa)的蛋白质条带和透明区。
实施例4:N-端
N-端序列测定为ASGQSLGPVT(SEQ ID NO:2中的位置1至10)。
实施例5:最适pH与最适温度
通过37℃在调至从pH 2.0至pH 9.0的不同pH值的缓冲液中运行Phadebas试验,来进行关于最适pH的实验。发现酶的最适pH为约pH 6。
相似地,在pH 6,通过在从30℃至80℃的温度运行Phadebas试验,来进行关于最适温度的实验。发现酶的最适温度为约60℃。
实施例6:淀粉降解谱
对制备于50mM乙酸缓冲液,1mM CaCl2,pH 6.0(煮沸3分钟以溶解淀粉)中的5%(重量百分比)蜡质玉米淀粉(waxy corn starch)(Cerestar蜡质玉蜀黍0401)进行淀粉降解谱分析。以0.2mg酶/g干物质的量,向1ml底物加入如实施例2所制备的纯化的酶,并将混合物在50℃温育24小时。加入一滴浓HCl,并将样品在100℃温育15分钟使酶失活。通过0.22微米滤器过滤样品,并使用BIO-RAD
Figure A20088000383200331
HPX-42A柱(Cat.nr.125-0097),与1套BIO-RAD Micro-Guard Deashing cartridge(脱灰筒)(目录号125-0118)相适合的BIO-RAD Deashing Holder(支持器)(Cat.nr.125-0139),在Waters HPLC***上进行分析,用两次脱气的蒸馏水洗脱并使用Waters RI检测器检测。
使用RI检测评价,降解谱显示大约相似量的葡萄糖(DP1)、麦芽糖(DP2)、麦芽三糖(DP3)、麦芽四糖(DP4)、麦芽五糖(DP5)、麦芽六糖(DP6)和麦芽七糖(DP7),并剩余大量的(substantial amount)较大的糊精(>DP10)。
序列表
<110>诺维信公司(Novozymes A/S)
<120>α-淀粉酶及其用途
<130>11136-WO
<160>8
<170>PatentIn version 3.5
<210>1
<211>2256
<212>DNA
<213>未鉴定的
<220>
<221>CDS
<222>(1)..(2253)
<220>
<221>信号肽(sig_peptide)
<222>(1)..(96)
<220>
<221>成熟肽(mat_peptide)
<222>(97)..(2253)
<400>1
atg aat cgg ttc atg aag aag cta ttc tct atg ttc ttg gcg cta gcc     48
Met Asn Arg Phe Met Lys Lys Leu Phe Ser Met Phe Leu Ala Leu Ala
        -30                 -25                 -20
ctg atc gtt ggc tat acg gcg gcc tat cct ctg ccc gca gac gcc gcg     96
Leu Ile Val Gly Tyr Thr Ala Ala Tyr Pro Leu Pro Ala Asp Ala Ala
    -15                 -10                 -5              -1
gcg tcc gga caa tca tta ggg ccg gta aca tcg aag gat gtc att tat    144
Ala Ser Gly Gln Ser Leu Gly Pro Val Thr Ser Lys Asp Val Ile Tyr
1               5                   10                  15
cag att ttg acg gat cgc ttc tat gac gga gat ccc gcg aac aac att    192
Gln Ile Leu Thr Asp Arg Phe Tyr Asp Gly Asp Pro Ala Asn Asn Ile
            20                  25                  30
ccc cca ggc aca ccc ccg gag ctg ttc aac gat gac aac ggg gat gga    240
Pro Pro Gly Thr Pro Pro Glu Leu Phe Asn Asp Asp Asn Gly Asp Gly
        35                  40                  45
cgc ggc gac gga acc gat ctg aac aaa tat caa ggc ggc gat tgg aaa    288
Arg Gly Asp Gly Thr Asp Leu Asn Lys Tyr Gln Gly Gly Asp Trp Lys
    50                  55                  60
ggc atc cag gag aaa atc ccg tac ctg aaa aat atg ggc att acg gcg    336
Gly Ile Gln Glu Lys Ile Pro Tyr Leu Lys Asn Met Gly Ile Thr Ala
65                  70                  75                  80
gta tgg atc tcc gct ccg tac gag aac cgg gag aac ctg atc gcc ggc    384
Val Trp Ile Ser Ala Pro Tyr Glu Asn Arg Glu Asn Leu Ile Ala Gly
                85                  90                  95
atg tac gca tcc tat cat ggc tat cat gcg cgg aat tac ttc gca acc    432
Met Tyr Ala Ser Tyr His Gly Tyr His Ala Arg Asn Tyr Phe Ala Thr
            100                 105                 110
aac cct cat ttc ggg aaa atg cag gac ttc acg gcg ctg gtc gat gcg    480
Asn Pro His Phe Gly Lys Met Gln Asp Phe Thr Ala Leu Val Asp Ala
        115                 120                 125
ctc cat gac aac ggg atc aag gtg gtt att gat ttc gtg acc aac cat    528
Leu His Asp Asn Gly Ile Lys Val Val Ile Asp Phe Val Thr Asn His
    130                 135                 140
tcc ggt ccg cgg ccg gac ggc gac ggc gtg ctg tat gaa cca gat cgc    576
Ser Gly Pro Arg Pro Asp Gly Asp Gly Val Leu Tyr Glu Pro Asp Arg
145                 150                 155                 160
gac agc tcc ggc cag tat gtg ttc gac ccg gac ggc aac cca atc gat    624
Asp Ser Ser Gly Gln Tyr Val Phe Asp Pro Asp Gly Asn Pro Ile Asp
                165                 170                 175
tac aac ggc gac ggc aag gtc gag aac cga atc gcc gac atc ctc aac    672
Tyr Asn Gly Asp Gly Lys Val Glu Asn Arg Ile Ala Asp Ile Leu Asn
            180                 185                 190
gat acg aac ggc ttt ttc cat cat gaa ggg aac cgg ccg gac agc gat    720
Asp Thr Asn Gly Phe Phe His His Glu Gly Asn Arg Pro Asp Ser Asp
        195                 200                 205
aca tcc aaa ttc gga tac cgg cat aag gaa ttg gcc tcg ctc gcc gac    768
Thr Ser Lys Phe Gly Tyr Arg His Lys Glu Leu Ala Ser Leu Ala Asp
    210                 215                 220
tat tcc cag gag aac ggc gtc gtc atc gaa cat ttg gag aag gcg ggc    816
Tyr Ser Gln Glu Asn Gly Val Val Ile Glu His Leu Glu Lys Ala Gly
225                 230                 235                 240
aag ttc tgg aag gcg aag ggc att gac ggt ttt cgc cat gat gcc acg    864
Lys Phe Trp Lys Ala Lys Gly Ile Asp Gly Phe Arg His Asp Ala Thr
                245                 250                 255
ctg cac atg aac ccg gcc ttt gtg aaa gga ttc aag gat gcg atc gat    912
Leu His Met Asn Pro Ala Phe Val Lys Gly Phe Lys Asp Ala Ile Asp
            260                 265                 270
tct gcc cca ggc cgt ccg gtg acc cac ttc ggg gaa ttt ttc att ggc    960
Ser Ala Pro Gly Arg Pro Val Thr His Phe Gly Glu Phe Phe Ile Gly
        275                 280                 285
cgg cct gat ccg aag tat gac gaa tac cga acg ttc cct gat cgg aca   1008
Arg Pro Asp Pro Lys Tyr Asp Glu Tyr Arg Thr Phe Pro Asp Arg Thr
    290                 295                 300
ggc gtc aac aat ctg gac ttc gaa tat tac aat gcg aac cgg caa gcg   1056
Gly Val Asn Asn Leu Asp Phe Glu Tyr Tyr Asn Ala Asn Arg Gln Ala
305                 310                 315                 320
ttt ggt gac ttc agc aga agc atg agc gat ttc gga caa atg ctc gta   1104
Phe Gly Asp Phe Ser Arg Ser Met Ser Asp Phe Gly Gln Met Leu Val
                325                 330                 335
cag acg agc gcg gac tat acg gta gaa aat cag gcc gtc acc ttt atc   1152
Gln Thr Ser Ala Asp Tyr Thr Val Glu Asn Gln Ala Val Thr Phe Ile
            340                 345                 350
gac aat cat gac gtg tcg cgc ttc cgt tat ata cag ccg aat gac aag   1200
Asp Asn His Asp Val Ser Arg Phe Arg Tyr Ile Gln Pro Asn Asp Lys
        355                 360                 365
ccc tat cat gct tcg ctt gcc gtg ctt ctt acc tcg cgc gga atc ccg   1248
Pro Tyr His Ala Ser Leu Ala Val Leu Leu Thr Ser Arg Gly Ile Pro
    370                 375                 380
aac ctt tat tat ggc acg gag caa tac ttg aat ccg ggc cat ggc ggg   1296
Asn Leu Tyr Tyr Gly Thr Glu Gln Tyr Leu Asn Pro Gly His Gly Gly
385                 390                 395                 400
tcg gat gca ggc cgc ttg ttc ctg cag gcg gcg gcc ccg gcg ttc agc   1344
Ser Asp Ala Gly Arg Leu Phe Leu Gln Ala Ala Ala Pro Ala Phe Ser
                405                 410                 415
gag cag acc gta gcc tac cgc ctt atc ggc aag ctg tcg gcc ctg cgg   1392
Glu Gln Thr Val Ala Tyr Arg Leu Ile Gly Lys Leu Ser Ala Leu Arg
            420                 425                 430
cag tcc aat gac gcc ttg gca tac ggg acg acc gat att ttg ttc agc    1440
Gln Ser Asn Asp Ala Leu Ala Tyr Gly Thr Thr Asp Ile Leu Phe Ser
        435                 440                 445
aat gac gat gcg ctc gtg tac aag cgc cag ttc ttc gac aag cag gtg    1488
Asn Asp Asp Ala Leu Val Tyr Lys Arg Gln Phe Phe Asp Lys Gln Val
    450                 455                 460
att gtc gcc gtg aac cgg cag ccg gat cgt tcc gta tcc gta ccg gcc    1536
Ile Val Ala Val Asn Arg Gln Pro Asp Arg Ser Val Ser Val Pro Ala
465                 470                 475                 480
ttg acg acg acc ctt ccg gcg gga agc tat acc gac gca ttg gac ggt    1584
Leu Thr Thr Thr Leu Pro Ala Gly Ser Tyr Thr Asp Ala Leu Asp Gly
                485                 490                 495
ttg ctg tac gga cgg aca atg acc gtc gtt gat cag aac gca gag cgg    1632
Leu Leu Tyr Gly Arg Thr Met Thr Val Val Asp Gln Asn Ala Glu Arg
            500                 505                 510
cag att cca gcc ttt acg ctc gtt ggc ggc gaa gtc agc gtc tgg tcg    1680
Gln Ile Pro Ala Phe Thr Leu Val Gly Gly Glu Val Ser Val Trp Ser
        515                 520                 525
gat aat ccg cca gcc gat cct ggg gaa ccg ctt atc ggc gat gtc gtc    1728
Asp Asn Pro Pro Ala Asp Pro Gly Glu Pro Leu Ile Gly Asp Val Val
    530                 535                 540
tca acg atg ggg cgt cca ggg aac acc gta tac atc tat ggc acc gga    1776
Ser Thr Met Gly Arg Pro Gly Asn Thr Val Tyr Ile Tyr Gly Thr Gly
545                 550                 555                 560
ctg agc ggt ggg gct acc gtt gca ttc ggg tct cag cag gct gcg gtc    1824
Leu Ser Gly Gly Ala Thr Val Ala Phe Gly Ser Gln Gln Ala Ala Val
                565                 570                 575
gta tcc gca cag gat aac cgg att gcg gcc gtg gtg ccg aac gtg cct    1872
Val Ser Ala Gln Asp Asn Arg Ile Ala Ala Val Val Pro Asn Val Pro
            580                 585                 590
gcc ggc gac tac gcg att act gtc acg aaa gac gga aag acg agc aac    1920
Ala Gly Asp Tyr Ala Ile Thr Val Thr Lys Asp Gly Lys Thr Ser Asn
        595                 600                 605
ccg ttc cgg tac cag gtg ctg ggc ggg gat caa gtg cag gtc att ttc    1968
Pro Phe Arg Tyr Gln Val Leu Gly Gly Asp Gln Val Gln Val Ile Phe
    610                 615                 620
cac gtc aat aag acg acg cag ccg gga cag aat gtc tat gtc gtt ggc    2016
His Val Asn Lys Thr Thr Gln Pro Gly Gln Asn Val Tyr Val Val Gly
625                 630                 635                 640
gat att gcc gaa ctg ggg gcc tgg aat ccg gac aat gtg ctc gat tcg    2064
Asp Ile Ala Glu Leu Gly Ala Trp Asn Pro Asp Asn Val Leu Asp Ser
                645                 650                 655
ttc atg aat ccg aat tat ccg gac tgg ttc ctg ccg gtt agc gtg cca    2112
Phe Met Asn Pro Asn Tyr Pro Asp Trp Phe Leu Pro Val Ser Val Pro
            660                 665                 670
gcc ggg gcg gcc ttt cag ttc aaa ttc atc atc aaa gac gcg gca ggc    2160
Ala Gly Ala Ala Phe Gln Phe Lys Phe Ile Ile Lys Asp Ala Ala Gly
        675                 680                 685
cat gtc acc tgg gag ggc ggg gcg aac cgc atg ttt acc gcc aca tca    2208
His Val Thr Trp Glu Gly Gly Ala Asn Arg Met Phe Thr Ala Thr Ser
    690                 695                 700
aac ccg acg gga aca agc gac act ccg gtg tac aac tgg cag cct tag    2256
Asn Pro Thr Gly Thr Ser Asp Thr Pro Val Tyr Asn Trp Gln Pro
705                 710                 715
<210>2
<211>751
<212>PRT
<213>未鉴定的
<400>2
Met Asn Arg Phe Met Lys Lys Leu Phe Ser Met Phe Leu Ala Leu Ala
        -30                 -25                 -20
Leu Ile Val Gly Tyr Thr Ala Ala Tyr Pro Leu Pro Ala Asp Ala Ala
    -15                 -10                 -5              -1
Ala Ser Gly Gln Ser Leu Gly Pro Val Thr Ser Lys Asp Val Ile Tyr
1               5                   10                  15
Gln Ile Leu Thr Asp Arg Phe Tyr Asp Gly Asp Pro Ala Asn Asn Ile
            20                  25                  30
Pro Pro Gly Thr Pro Pro Glu Leu Phe Asn Asp Asp Asn Gly Asp Gly
        35                  40                  45
Arg Gly Asp Gly Thr Asp Leu Asn Lys Tyr Gln Gly Gly Asp Trp Lys
    50                  55                  60
Gly Ile Gln Glu Lys Ile Pro Tyr Leu Lys Asn Met Gly Ile Thr Ala
65                  70                  75                  80
Val Trp Ile Ser Ala Pro Tyr Glu Asn Arg Glu Asn Leu Ile Ala Gly
                85                  90                  95
Met Tyr Ala Ser Tyr His Gly Tyr His Ala Arg Asn Tyr Phe Ala Thr
            100                 105                 110
Asn Pro His Phe Gly Lys Met Gln Asp Phe Thr Ala Leu Val Asp Ala
        115                 120                 125
Leu His Asp Asn Gly Ile Lys Val Val Ile Asp Phe Val Thr Asn His
    130                 135                 140
Ser Gly Pro Arg Pro Asp Gly Asp Gly Val Leu Tyr Glu Pro Asp Arg
145                 150                 155                 160
Asp Ser Ser Gly Gln Tyr Val Phe Asp Pro Asp Gly Asn Pro Ile Asp
                165                 170                 175
Tyr Asn Gly Asp Gly Lys Val Glu Asn Arg Ile Ala Asp Ile Leu Asn
            180                 185                 190
Asp Thr Asn Gly Phe Phe His His Glu Gly Asn Arg Pro Asp Ser Asp
        195                 200                 205
Thr Ser Lys Phe Gly Tyr Arg His Lys Glu Leu Ala Ser Leu Ala Asp
    210                 215                 220
Tyr Ser Gln Glu Asn Gly Val Val Ile Glu His Leu Glu Lys Ala Gly
225                 230                 235                 240
Lys Phe Trp Lys Ala Lys Gly Ile Asp Gly Phe Arg His Asp Ala Thr
                245                 250                 255
Leu His Met Asn Pro Ala Phe Val Lys Gly Phe Lys Asp Ala Ile Asp
            260                 265                 270
Ser Ala Pro Gly Arg Pro Val Thr His Phe Gly Glu Phe Phe Ile Gly
        275                 280                 285
Arg Pro Asp Pro Lys Tyr Asp Glu Tyr Arg Thr Phe Pro Asp Arg Thr
    290                 295                 300
Gly Val Asn Asn Leu Asp Phe Glu Tyr Tyr Asn Ala Asn Arg Gln Ala
305                 310                 315                 320
Phe Gly Asp Phe Ser Arg Ser Met Ser Asp Phe Gly Gln Met Leu Val
                325                 330                 335
Gln Thr Ser Ala Asp Tyr Thr Val Glu Asn Gln Ala Val Thr Phe Ile
            340                 345                 350
Asp Asn His Asp Val Ser Arg Phe Arg Tyr Ile Gln Pro Asn Asp Lys
        355                 360                 365
Pro Tyr His Ala Ser Leu Ala Val Leu Leu Thr Ser Arg Gly Ile Pro
    370                 375                 380
Asn Leu Tyr Tyr Gly Thr Glu Gln Tyr Leu Asn Pro Gly His Gly Gly
385                 390                 395                 400
Ser Asp Ala Gly Arg Leu Phe Leu Gln Ala Ala Ala Pro Ala Phe Ser
                405                 410                 415
Glu Gln Thr Val Ala Tyr Arg Leu Ile Gly Lys Leu Ser Ala Leu Arg
            420                 425                 430
Gln Ser Asn Asp Ala Leu Ala Tyr Gly Thr Thr Asp Ile Leu Phe Ser
        435                 440                 445
Asn Asp Asp Ala Leu Val Tyr Lys Arg Gln Phe Phe Asp Lys Gln Val
    450                 455                 460
Ile Val Ala Val Asn Arg Gln Pro Asp Arg Ser Val Ser Val Pro Ala
465                 470                 475                 480
Leu Thr Thr Thr Leu Pro Ala Gly Ser Tyr Thr Asp Ala Leu Asp Gly
                485                 490                 495
Leu Leu Tyr Gly Arg Thr Met Thr Val Val Asp Gln Asn Ala Glu Arg
            500                 505                 510
Gln Ile Pro Ala Phe Thr Leu Val Gly Gly Glu Val Ser Val Trp Ser
        515                 520                 525
Asp Asn Pro Pro Ala Asp Pro Gly Glu Pro Leu Ile Gly Asp Val Val
    530                 535                 540
Ser Thr Met Gly Arg Pro Gly Asn Thr Val Tyr Ile Tyr Gly Thr Gly
545                 550                 555                 560
Leu Ser Gly Gly Ala Thr Val Ala Phe Gly Ser Gln Gln Ala Ala Val
                565                 570                 575
Val Ser Ala Gln Asp Asn Arg Ile Ala Ala Val Val Pro Asn Val Pro
            580                 585                 590
Ala Gly Asp Tyr Ala Ile Thr Val Thr Lys Asp Gly Lys Thr Ser Asn
        595                 600                 605
Pro Phe Arg Tyr Gln Val Leu Gly Gly Asp Gln Val Gln Val Ile Phe
    610                 615                 620
His Val Asn Lys Thr Thr Gln Pro Gly Gln Asn Val Tyr Val Val Gly
625                 630                 635                 640
Asp Ile Ala Glu Leu Gly Ala Trp Asn Pro Asp Asn Val Leu Asp Ser
                645                 650                 655
Phe Met Asn Pro Asn Tyr Pro Asp Trp Phe Leu Pro Val Ser Val Pro
            660                 665                 670
Ala Gly Ala Ala Phe Gln Phe Lys Phe Ile Ile Lys Asp Ala Ala Gly
        675                 680                 685
His Val Thr Trp Glu Gly Gly Ala Asn Arg Met Phe Thr Ala Thr Ser
    690                 695                 700
Asn Pro Thr Gly Thr Ser Asp Thr Pro Val Tyr Asn Trp Gln Pro
705                 710                 715
<210>3
<211>20
<212>DNA
<213>人工的
<220>
<223>寡核苷酸
<400>3
tcaaaattgt tcctgaatgc    20
<210>4
<211>18
<212>DNA
<213>人工的
<220>
<223>寡核苷酸
<400>4
gcaaggacaa caatgctc    18
<210>5
<211>19
<212>DNA
<213>人工的
<220>
<223>寡核苷酸
<400>5
tgctgtatga accagatcg    19
<210>6
<211>20
<212>DNA
<213>人工的
<220>
<223>寡核苷酸
<400>6
actggtacac gatgaaatcc   20
<210>7
<211>20
<212>DNA
<213>人工的
<220>
<223>寡核苷酸
<400>7
tattttgttc agcaatgacg   20
<210>8
<211>19
<212>DNA
<213>人工的
<220>
<223>寡核苷酸
<400>8
cgtgacagta atcgcgtag    19

Claims (11)

1.具有α-淀粉酶活性的分离的多肽,其选自下组:
(a)多肽,其具有与SEQ ID NO:2的氨基酸1至719有至少65%同一性的氨基酸序列;
(b)多肽,其由在低严紧条件下与以下序列杂交的多核苷酸编码:(i)SEQID NO:1的核苷酸97至2256,或(ii)(i)的互补链;和
(c)多肽,其具有通过取代(特别是保守取代)、缺失和/或***一个或多个氨基酸而由SEQ ID NO:2的氨基酸1至719得到的氨基酸序列。
2.权利要求1的多肽,其具有与SEQ ID NO:2的氨基酸1至719有至少95%同一性的氨基酸序列。
3.权利要求1或2的多肽,其具有包含SEQ ID NO:2的氨基酸1至719或由SEQ ID NO:2的氨基酸1至719组成的氨基酸序列。
4.分离的多核苷酸,其包含编码权利要求1-3中任一项的多肽的核苷酸序列。
5.分离的多核苷酸,其编码具有α-淀粉酶活性的多肽,所述多核苷酸选自下组:
a)多核苷酸,其与下述核苷酸序列具有至少60%同一性:(i)SEQ ID NO:1的核苷酸97至2256,或(ii)(i)的互补链;和
b)多核苷酸,其在中严紧条件下与以下序列杂交:(i)SEQ ID NO:1的核苷酸97至2256,或(ii)(i)的互补链。
6.核酸构建体,其包含权利要求4或5的多核苷酸,所述多核苷酸与指导所述多肽在表达宿主中产生的一个或多个调控序列可操作地连接。
7.重组表达载体,其包含权利要求6的核酸构建体。
8.重组宿主细胞,其包含权利要求6的核酸构建体或权利要求7的载体。
9.用于产生权利要求1-3中任一项的多肽的方法,其包括:(a)在有益于所述多肽产生的条件下培养权利要求8的重组宿主细胞;和(b)回收所述多肽。
10.权利要求1-3中任一项的多肽用于淀粉液化、纺织品脱浆、纸和纸浆工业中的淀粉修饰,用于酿造、乙醇生产或烘培的用途。
11.用于产生麦芽糊精的方法,其包括将淀粉或淀粉水解物与权利要求1-3中任一项的多肽一起温育,从而水解淀粉或淀粉水解物中的α-1,4键。
CNA2008800038321A 2007-02-01 2008-01-31 α-淀粉酶及其用途 Pending CN101600794A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07101570 2007-02-01
EP07101570.5 2007-02-01

Publications (1)

Publication Number Publication Date
CN101600794A true CN101600794A (zh) 2009-12-09

Family

ID=38269059

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008800038321A Pending CN101600794A (zh) 2007-02-01 2008-01-31 α-淀粉酶及其用途

Country Status (4)

Country Link
US (1) US20100112637A1 (zh)
EP (1) EP2121910A1 (zh)
CN (1) CN101600794A (zh)
WO (1) WO2008092919A1 (zh)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2450435B1 (en) * 2009-07-01 2017-08-16 Amano Enzyme Inc. Maltotriosyl transferase, process for production thereof, and use thereof
EP3494993B1 (en) * 2011-02-04 2021-04-21 Amano Enzyme Inc. Novel use of maltotriosyl transferase
EP4159854A1 (en) 2013-05-29 2023-04-05 Danisco US Inc Novel metalloproteases
EP3004342B1 (en) 2013-05-29 2023-01-11 Danisco US Inc. Novel metalloproteases
US20160160202A1 (en) 2013-05-29 2016-06-09 Danisco Us Inc. Novel metalloproteases
EP3260538B1 (en) 2013-05-29 2021-04-14 Danisco US Inc. Novel metalloproteases
TR201906371T4 (tr) 2013-12-13 2019-05-21 Danisco Inc Bacillus türlerinin serin proteazları.
EP3910057A1 (en) 2013-12-13 2021-11-17 Danisco US Inc. Serine proteases of the bacillus gibsonii-clade
WO2015095046A1 (en) 2013-12-16 2015-06-25 E. I. Du Pont De Nemours And Company Use of poly alpha-1,3-glucan ethers as viscosity modifiers
EP3083705B1 (en) 2013-12-18 2020-09-30 DuPont Industrial Biosciences USA, LLC Cationic poly alpha-1,3-glucan ethers
EP3105256A1 (en) 2014-02-14 2016-12-21 E. I. du Pont de Nemours and Company Poly-alpha-1,3-1,6-glucans for viscosity modification
ES2734726T3 (es) 2014-03-11 2019-12-11 Du Pont Poli alfa-1,2-glucano oxidado como reforzante de detergente
JP6585698B2 (ja) 2014-03-21 2019-10-02 ダニスコ・ユーエス・インク バチルス(Bacillus)種のセリンプロテアーゼ
EP3158043B1 (en) 2014-06-19 2021-03-10 Nutrition & Biosciences USA 4, Inc. Compositions containing one or more poly alpha-1,3-glucan ether compounds
US9714403B2 (en) 2014-06-19 2017-07-25 E I Du Pont De Nemours And Company Compositions containing one or more poly alpha-1,3-glucan ether compounds
US20170233710A1 (en) 2014-10-17 2017-08-17 Danisco Us Inc. Serine proteases of bacillus species
DK3212781T3 (da) 2014-10-27 2019-12-16 Danisco Us Inc Serinproteaser
WO2016069569A2 (en) 2014-10-27 2016-05-06 Danisco Us Inc. Serine proteases
DK3212662T3 (da) 2014-10-27 2020-07-20 Danisco Us Inc Serinproteaser
WO2016069557A1 (en) 2014-10-27 2016-05-06 Danisco Us Inc. Serine proteases of bacillus species
EP3212783A1 (en) 2014-10-27 2017-09-06 Danisco US Inc. Serine proteases
US20180334696A1 (en) 2014-12-23 2018-11-22 E I Du Pont De Nemours And Company Enzymatically produced cellulose
EP3964575A3 (en) 2015-05-08 2022-09-28 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
US10647946B2 (en) 2015-05-08 2020-05-12 Novozymes A/S Alpha-amylase variants and polynucleotides encoding same
EP3872174B1 (en) 2015-05-13 2023-03-01 Danisco US Inc. Aprl-clade protease variants and uses thereof
ES2962329T3 (es) 2015-06-09 2024-03-18 Danisco Us Inc Encapsulados de estallido osmótico
WO2016201040A1 (en) 2015-06-09 2016-12-15 Danisco Us Inc. Water-triggered enzyme suspension
WO2016201069A1 (en) 2015-06-09 2016-12-15 Danisco Us Inc Low-density enzyme-containing particles
WO2016205755A1 (en) 2015-06-17 2016-12-22 Danisco Us Inc. Bacillus gibsonii-clade serine proteases
US11286621B2 (en) 2015-08-14 2022-03-29 Basf Se Aqueous surface treatment composition for paper and board
JP7364331B2 (ja) 2015-11-05 2023-10-18 ダニスコ・ユーエス・インク パエニバチルス(Paenibacillus)属種マンナナーゼ
BR112018009050A8 (pt) 2015-11-05 2019-02-26 Danisco Us Inc mananases de paenibacillus e bacillus spp.
JP7045313B2 (ja) 2015-11-13 2022-03-31 ニュートリション・アンド・バイオサイエンシーズ・ユーエスエー・フォー,インコーポレイテッド 洗濯ケアおよび織物ケアにおいて使用するためのグルカン繊維組成物
EP3374488B1 (en) 2015-11-13 2020-10-14 DuPont Industrial Biosciences USA, LLC Glucan fiber compositions for use in laundry care and fabric care
JP2019504932A (ja) 2015-11-13 2019-02-21 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニーE.I.Du Pont De Nemours And Company 洗濯ケアおよび織物ケアにおいて使用するためのグルカン繊維組成物
WO2017100720A1 (en) 2015-12-09 2017-06-15 Danisco Us Inc. Alpha-amylase combinatorial variants
BR112018012020A2 (pt) 2015-12-18 2018-12-04 Danisco Us Inc polipeptídeos com atividade de endoglucanase e usos dos mesmos
JP2019518440A (ja) 2016-05-03 2019-07-04 ダニスコ・ユーエス・インク プロテアーゼ変異体およびその使用
EP3845642B1 (en) 2016-05-05 2023-08-09 Danisco US Inc. Protease variants and uses thereof
MX2018014768A (es) 2016-05-31 2019-03-06 Danisco Us Inc Variantes de proteasa y sus usos.
EP4151726A1 (en) 2016-06-17 2023-03-22 Danisco US Inc Protease variants and uses thereof
EP3535365A2 (en) 2016-11-07 2019-09-11 Danisco US Inc. Laundry detergent composition
CN110312795A (zh) 2016-12-21 2019-10-08 丹尼斯科美国公司 蛋白酶变体及其用途
US11946081B2 (en) 2016-12-21 2024-04-02 Danisco Us Inc. Bacillus gibsonii-clade serine proteases
WO2018169750A1 (en) 2017-03-15 2018-09-20 Danisco Us Inc Trypsin-like serine proteases and uses thereof
EP3601515A1 (en) 2017-03-31 2020-02-05 Danisco US Inc. Delayed release enzyme formulations for bleach-containing detergents
CN110809624A (zh) 2017-06-30 2020-02-18 丹尼斯科美国公司 低团聚的含酶颗粒
CN111373039A (zh) 2017-11-29 2020-07-03 丹尼斯科美国公司 具有改善的稳定性的枯草杆菌蛋白酶变体
MX2020006518A (es) 2017-12-21 2020-10-28 Danisco Us Inc Gránulos de fusión en caliente, que contienen enzimas, que comprenden un desecante termotolerante.
BR112020016068A2 (pt) 2018-02-08 2020-12-08 Danisco Us Inc. Partículas cera termicamente resistente matriz para encapsulamento de enzima
WO2019245705A1 (en) 2018-06-19 2019-12-26 Danisco Us Inc Subtilisin variants
US20210214703A1 (en) 2018-06-19 2021-07-15 Danisco Us Inc Subtilisin variants
WO2020047215A1 (en) 2018-08-30 2020-03-05 Danisco Us Inc Enzyme-containing granules
CN113166682A (zh) 2018-09-27 2021-07-23 丹尼斯科美国公司 用于医疗器械清洁的组合物
WO2020112599A1 (en) 2018-11-28 2020-06-04 Danisco Us Inc Subtilisin variants having improved stability
EP3976776A1 (en) 2019-05-24 2022-04-06 Danisco US Inc. Subtilisin variants and methods of use
US20220306968A1 (en) 2019-06-06 2022-09-29 Danisco Us Inc Methods and compositions for cleaning
WO2022047149A1 (en) 2020-08-27 2022-03-03 Danisco Us Inc Enzymes and enzyme compositions for cleaning
EP4284906A1 (en) 2021-01-29 2023-12-06 Danisco US Inc. Compositions for cleaning and methods related thereto
CN117616120A (zh) 2021-06-30 2024-02-27 丹尼斯科美国公司 变体脂肪酶及其用途
CN117916354A (zh) 2021-09-03 2024-04-19 丹尼斯科美国公司 用于清洁的衣物洗涤组合物
WO2023039270A2 (en) 2021-09-13 2023-03-16 Danisco Us Inc. Bioactive-containing granules
WO2023114939A2 (en) 2021-12-16 2023-06-22 Danisco Us Inc. Subtilisin variants and methods of use
WO2023114932A2 (en) 2021-12-16 2023-06-22 Danisco Us Inc. Subtilisin variants and methods of use
WO2023114936A2 (en) 2021-12-16 2023-06-22 Danisco Us Inc. Subtilisin variants and methods of use
WO2023168234A1 (en) 2022-03-01 2023-09-07 Danisco Us Inc. Enzymes and enzyme compositions for cleaning
WO2023250301A1 (en) 2022-06-21 2023-12-28 Danisco Us Inc. Methods and compositions for cleaning comprising a polypeptide having thermolysin activity
WO2024050343A1 (en) 2022-09-02 2024-03-07 Danisco Us Inc. Subtilisin variants and methods related thereto
WO2024050339A1 (en) 2022-09-02 2024-03-07 Danisco Us Inc. Mannanase variants and methods of use
WO2024050346A1 (en) 2022-09-02 2024-03-07 Danisco Us Inc. Detergent compositions and methods related thereto

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070148287A1 (en) * 2003-07-01 2007-06-28 Novozymes A/S Cgtase variants

Also Published As

Publication number Publication date
US20100112637A1 (en) 2010-05-06
WO2008092919A1 (en) 2008-08-07
EP2121910A1 (en) 2009-11-25

Similar Documents

Publication Publication Date Title
CN101600794A (zh) α-淀粉酶及其用途
DK2322630T3 (en) Polypeptides with xylanase activity and polynucleotides encoding them
ES2526867T3 (es) Polipéptido que tiene actividad potenciadora amilolítica y polinucleótidos que codifican el mismo
CN103890170B (zh) α‑淀粉酶变体以及对其进行编码的多核苷酸
US7851193B2 (en) Polypeptides having xylanase activity and polynucleotides encoding same
CN103649307A (zh) α-淀粉酶变体
CN102027004A (zh) 具有α-淀粉酶活性的多肽和编码该多肽的多核苷酸
CN103857794A (zh) α-淀粉酶变体以及编码它们的多核苷酸
US11788078B2 (en) Processes for producing ethanol
CN101802180A (zh) 真菌过氧合酶和应用方法
CN101287751A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN102066409A (zh) 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸
CN101253263B (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN102884182A (zh) 木聚糖酶变体及编码其的多核苷酸
ES2632011T3 (es) Polipéptidos con actividad de alfa-amilasa y polinucleótidos que codifican los mismos
US20160326507A1 (en) Variants of gh family 5 endoglucanase and polynucleotides encoding same
CN102482658B (zh) 具有异淀粉酶活性的多肽和编码该多肽的多核苷酸
CN101184845A (zh) 胶囊青霉***糖呋喃糖苷酶
CN101010331A (zh) 具有α-葡糖苷酶活性的多肽类和编码它们的多核苷酸
CN106170545A (zh) α‑淀粉酶变体以及对其进行编码的多核苷酸
US9909112B2 (en) Polypeptides having alpha-amylase activity and polynucleotides encoding same
CN102459604B (zh) 来自加州海兔的dfp酶
CN103764670A (zh) 具有葡糖淀粉酶活性的多肽和编码它的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091209