CN1152942A - 在酵母中表达的n末端延伸蛋白 - Google Patents

在酵母中表达的n末端延伸蛋白 Download PDF

Info

Publication number
CN1152942A
CN1152942A CN95194181A CN95194181A CN1152942A CN 1152942 A CN1152942 A CN 1152942A CN 95194181 A CN95194181 A CN 95194181A CN 95194181 A CN95194181 A CN 95194181A CN 1152942 A CN1152942 A CN 1152942A
Authority
CN
China
Prior art keywords
glu
ala
lys
asp
yeast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN95194181A
Other languages
English (en)
Other versions
CN1131312C (zh
Inventor
K·瓦德
J·布兰特
T·B·克杰尔德森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1152942A publication Critical patent/CN1152942A/zh
Application granted granted Critical
Publication of CN1131312C publication Critical patent/CN1131312C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Diabetes (AREA)
  • Endocrinology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及在酵母中表达和加工的多肽,包含编码多肽的一段DNA序列的一个DNA构建体,该多肽具有下列结构:信号肽-先导肽-X1-X2-X3-X4-X5-X6-X7-异源蛋白,其中X1是Lys或Arg;X2□是Lys或Arg,X1与X2共同确定一个酵母加工位点;X3是Glu或Asp;X4是一段具有(A-B)n结构的氨基酸序列,其中A是Glu或Asp,B是Ala,Val,Leu或Pro,n是0或11至5的整数,当n>2时,每个A和B可与其它的A(s)、B(s)相同或相异,或X4是一段具有Cm结构的氨基酸序列,其中C是Glu或Asp,m是0或从1至5的整数;X5是一个肽键或一个氨基酸或多个相同或相异的氨基酸;X6是一个肽键或选自Pro,Asp,Thr,Ser,Glu,Ala,Gly的一个氨基酸残基;X7是Lys或Arg。

Description

在酵母中表达的N末端延伸蛋白
发明领域:
本发明涉及在酵母中表达和加工的多肽,含编码这种多肽DNA序列的DNA构建体,携带这种DNA片段的载体和载体转化的酵母细胞,以及在酵母中生产异种蛋白的过程。
本发明背景
酵母产生许多胞内合成蛋白,但它们在细胞外具有功能。这些胞外蛋白称作分泌蛋白。这些分泌蛋白在细胞内开始是以前体形式或含前序列的前体形式表达的,此前序列确保表达产物穿过内质网(ER)膜的有效方向。这种前序列常称为信号肽,在移位过程中从目的产物上被切除掉。这种蛋白一旦进入分泌途径就被运送到高尔基体。从高尔基体出来,蛋白可经过不同的路径形成一些室例如细胞泡、细胞膜,或从细胞中分泌到胞外介质(Pfeffer,S.R.andRothman,J.E.Ann.Rev.biochem.56(1987)829-852)。
酵母异种蛋白在酵母中表达和分泌已有几种方法。欧洲公开号No.0088632A描述了这一过程,经过将具有编码目的蛋白和信号肽的DNA的表达载体转化酵母菌,准备转化菌的培养物,生长培养物以及以培养基中回收蛋白,使异源于酵母的蛋白得以表达,加工和分泌。信号肽可能是目的蛋白自身的信号肽,异源信号肽或天然和异种信号肽的杂合物。
使用酵母异源性信号肽可能出现的问题是它不能确保有效的移位和/或信号肽的切除。
酿洒酵母(Saccha romyces cerevisiae)MFα1(α-因子)是以165个氨基酸的前体蛋的形式合成的,含19个氨基酸长度的信号肽或前肽,接有64个氨基本长度“先导肽”或原肽,含3个N-连接的糖基化位点接有(Lys Arg(Asp/Glu,Ala)2-3α-因子)4(Kurjan,J.and Herskowitz,I.Cell30(1982),933-943)。前MFα1原的信号-先导肽部分已广泛应用于酿酒酵母异源蛋白的合成和分泌。
已知有用酵母同源信号/先导肽,比如美国专利号4,546,082,欧洲公开号0116201A,0123294A,0123544A,0163529A,0123289A及欧洲专利号0100561B。
EP0123289A描述了酿酒酵母α-因子前体的用处,而EP100561描述了酿酒酵母Saccharomyces cerevisiae PH05信号肽的用处,PCT公开号WO95/02059描述了YAB3信号肽用于分泌外源蛋白。
美国专利号4,546,082和欧洲公开号0016201A,0123294A,0123544A,0163529A描述了酿酒酵母Saccharomvces cerevisiae(MFα1或MFα2)的α-因子信号-先导肽用于分泌在酵母中表达的异源蛋白的过程。将编码酿酒酵母MFα1信号/先导序列的DNA序列接到目的蛋白基因的5’端,证实了目的蛋白的分泌和加工。
EP206,783公开了酿酒酵母多肽分泌***,其中α-因子先导序列被切掉,除去天然先导序列的4个α-因子肽,以使先导肽自身通过α-因子加工位点Lys-Arg-Glu-Ala-Glu-Ala与异源多肽融合。已表明这种构建导致小肽(小于50个氨基酸)的有效加工。对于大的多肽的分泌和加工,天然α-因子先导序列被切除,在先导肽与多肽间保留1个或2个α-因子肽。
许多被分泌的蛋白暴露于蛋白水解加工***,可在羧基末端及两个连续碱性氨基酸间切割肽键。在酿酒酵终中KEX2基因编码此酶的活性(Julius,D.A.et al.Cell37(1984b),1075)。KEX2蛋白酶产物的加工为活性酿酒酵母交配因子α1(MFα1或α-因子)所需,但不涉及活性酿酒酵母交配因子α的分泌。
上述文献指出的构建载体转化的酵母菌进行培养时,就可获得多肽的分泌和正确加工。然而在许多情况下,分泌水平很低或无分泌,或蛋白水解过程可能不正确或不完全。PCT公开号WO90/10075认为这种情况在某种程度上归属于先导肽C-末端与异源蛋白N-末端间的加工位点未充分暴露,致使其不被蛋白水解酶切割或至少极难切割。
WO90/10075描述了改进的异源多肽加工的酵母表达***,在先导肽的C-末端和/或融合先导肽的异源多伏N-末端的加工位点附近进行某种修饰。因此,与未经修饰的先导肽-异源多肽构建体相比,此***可获得高产量的正确加工的蛋白。
本发明概述
本发明描述设计为延伸的异源多肽N-末端修饰,此延伸在培养基中产物纯化前经自然存在的酵母蛋白酶切除,或在培养基的产物纯化期间或随后经体外蛋白水解而切除。
本发明涉及一个DNA构建体,编码的多肽具下列结构
信号肽-先导肽-X1-X2-X3-X4-X5-X6-X7异源蛋白,其中X1是Lys或Arg;X2是Lys或Arg,X1和X2共同确定一个酵母加工位点;X3是Glu或Asp;X4是具有下述结构的一段氨基酸序列:(A-B)n,其中A是Glu或Asp,B是Ala,Val,Leu或Pro,n是0或从1至5的整数,当n≥2时,每个A和B与其它的A(s)和B(s)相同或相异,或X4是具有下述结构的氨基酸序列:(C)m,其中C是Glu或Asp,m是0或从1至5的整数;X5是一个肽键或1个氨基酸或多个相同或相异的氨基酸;X6是一个肽键或选自Pro,Asp,Thr,Glu,Ala,Gly的氨基酸残基;X7是Lys或Arg。
在本说明书中,术语“信号肽”理解为前序列,其自然状态主要是疏水性,在酵母表达的胞外蛋白的前体上为N-末端序列。信号肽的功能是使异源蛋白分泌到内质网中。在此过程中,信号肽常被切除。对于产生这种蛋白的酵母,信号肽可能是异源的或同源的,但是酵母同源信号肽的切除更为有效。
“先导肽”的表达是指亲水肽为主的肽,其功能是使异源蛋白从内质网分泌到高尔基体,乃至分泌囊泡使之分泌到介质中(即表达蛋白或多肽穿过细胞壁或至少穿过细胞膜到细胞的胞外质区)。
“异源蛋白”的表达是指自然状态下宿主酵母菌不能生产的蛋白或多肽。
X3-X4-X5-X6-X7共同形成异源蛋白N-末端的延伸。这种延伸不仅能提高发酵产量,而且由于存在X3,可以防止二肽氨基肽酶(DPAPA)作用,产生多肽的同源N-末端。这种延伸可能以某种方式构建使它在培养基的异源蛋白产物纯化前只被天然的酵母蛋白酶切除,而不受DPAP的作用如酵母天冬氨酸蛋白酶(YAP3)。这种延伸可能选择以另一种方式构建使之在酵解过程中不被蛋白水解,为了体外进一步的成熟例如经胰蛋白酶,Ach romobacter lyticus蛋白酶I或肠激酶作用,N-末端延伸的异源蛋白产物可能从培养基中得到纯化。
另一方面,本发明涉及在酵母中生产异源蛋白的过程,包括在合适的培养基中培养转化的酵母菌株以获得异源蛋白的表达和分泌,从培养基中分离出此种蛋白。
本发明的详细描述
在肽结构(A-B)n中,n优选为2-4,更优选是3
根据本发明,在优选多肽中X3可以是Glu,A可以是Glu,B可以是Ala,X5可以是一个肽键或Glu,或Glu Pro Lys Ala,或X6可以是Pro或一个肽键。
N-末端延伸X3-X4-X5-X6-X7的实例可以为:Glu Glu Ala Glu Ala Glu(Pro/Ala)(Glu/Lys)(Ala/Glu/Lys/Thr)Arg Ala Pro Arg,Glu Glu Ala Glu Ala Glu Pro Lys Ala(Thr/Pro)Arg,Glu Glu Ala Glu Ala Glu Ala Glu Pro Arg,Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys,Glu Glu Ala Glu Ala Glu Ala Glu Arg,Glu Glu Ala Glu Ala Glu Ala(Asp/Ala/Gly/Glu)Lys,Glu Glu Ala Glu Ala Glu Ala(Pro/Leu/Ile/Thr)Lys,Glu Glu Ala Glu Ala Glu Ala Arg,Glu Glu Ala Glu Ala Glu(Glu/Asp/Gly/Ala)Lys,Glu Glu Ala Glu Ala Pro Lys,Glu Glu Ala Pro Lys,Asp Asp Ala Asp Ala Asp Ala Asp Pro Arg,Glu Glu Glu Glu Pro Lys,Glu Glu Glu Pro Lys,Asp Asp Asp Asp Asp Lys,和Glu Glu Pro Lys.
本发明多肽的信号肽序列可以为任何信号肽,确保表达多肽进入细胞分泌途径的有效方向。信号肽可以是自然产生的信号肽或其功能部份,或者是人工合成的肽。已发现合适的信号肽是α-因子信号肽,鼠唾液淀粉酶信号肽,修饰的羧肽酶信号肽或是酵母BAR1信号肽,酵母天冬氨酸蛋白酶3(YAP3)信号肽。O.Hagenbiichleet al.,Nature289,1981,pp643-646描述了鼠唾液淀粉酶信号序列。L.A.Valls et al.,Cell48,1987,PP.887-897描述了羧肽酶信号序列。PCT公开号WO87/02670显示了BAR1信号肽。PCT公开号95/02059描述了酵母天冬氨酸蛋白酶3信号肽。
本发明多肽的先导肽序列可以为任何先导肽,其功能是将表达的多肽穿过内质网并沿分泌途径运动。合适的先导序列可以是来自酵母和其它生物的天然先导肽,例如α-因子先导肽或其功能部分。先导肽也可以是人工合成的先导肽,例如PCT公开号WO89/02463或WO92/11378显示的人工合成先导肽。
本发明方法生产的N-末端延伸异种蛋白可以是在酵母生产中占优势的任何蛋白。这些蛋白的实例是抑蛋白酶肽,组织因子路径抑制剂或其它蛋白抑制剂,胰岛素或胰岛素前体,胰岛素类似物,***I或II,人或牛生长激素,白介素,组织胞浆素原激活剂,胰高血糖素,胰高血糖素样肽-1(GLP-1),因子VII,因子VIII,因子XIII,血小板衍生生长因子,酶或这些蛋白的任何一个功能类似物。在本说明书中,术语“功能类似物”是指与天然蛋白具有相似功能的多肽(可以理解为只涉及天然状态而与天然蛋白的生物活性水平无关)。这种蛋白可以与天然蛋白结构上相似,也可以是天然蛋白的衍生物,可以在天然蛋白C-末端和N-末端的任何一端或两端增加一个或几个氨基酸,在天然蛋白氨基酸序列的一个或几个不同位点替换一个或几个氨基酸,或在天然蛋白的一端或两端氨基酸序列中的一个或几个位点删除一个或几个氨基酸,在天然氨基酸序列中的一个或多个位点***一个或多个氨基酸。这些修饰对于上面所提及的一些蛋白质是熟知的。
合适的胰岛素前体和胰岛素类似物的实例是B(1-29)-Ala-Ala-Lys-A(1-21)(比如EP163529所描述),B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)(比如PCT公开号95/00550所述),B(1-29)-Ala-Ala-Arg-A(1-21)(如PCT公开号95/07931所述),及B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21)。
编码本发明多肽的DNA构建体可根据已知的标准方法人工合成,例如:S.L.Beaucage and M.H.Caruthers,Tetrahedron letters22,1981,pp.1859-1869描述的磷酸酰胺法,或Matthes.et al.,EMBOJournal3,1984,pp801-805描述的方法。根据磷酸酰胺法,寡核苷酸被合成,例如在DNA自动合成仪中合成,纯化,加倍和连接而形成合成的DNA构建体。目前准备DNA构建体的优选方法是聚合酶链式反应(PCR),例如Sambrook et al.Molecular.Cloning:ALaboratory Manual,Cold Spring Harbor,NY,1989所述。
本发明的DNA构建体也可能是基团组源或cDNA源,比如通过准备基因组的或cDNA文库,根据标准技术(Sambrook etal.,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor,1989),使用人工合成的寡聚核苷酸探针进行杂交,筛选编码本发明多肽的全部或部分DNA序列。在这种情况下,编码信号肽和先导肽的基因组或cDNA序列可以结合形成编码异源蛋白基因组或cDNA序列,相应多肽氨基酸序列X1-X2-X3-X4-X5-X6-X7的DNA序列可能被修饰,比如根据已知方法***人工合成的寡聚核苷酸,可编码同源重组的目的氨基酸序列。
最后,根据标准技术将人工合成的、基因组源的或cDNA源(合适的)片段,以及相应整个DNA构建体各部位的片段进行退火就可得到DNA构建体,此构建体可以是人工合成和基因组的混合,人工合成和cDNA的混合,或基因组和cDNA源的混合。因此,设想编码异源蛋白的DNA序列是基因组或cDNA源,而编码信号肽和先导肽的序列以及编码N-末端延伸X1-X2-X3-X4-X5-X6-X7的序列可能是人工合成的。
另一方面,本发明涉及重组表达载体,此载体能在酵母中复制并能携带编码上述确定多肽的DNA构建体。重组表达载体可以是能在酵母中复制的任何载体。在载体中编码本发明多肽的DNA序列与合适的启动子序列相连。启动子可以是在酵母中表现转录活性的任何DNA序列,及编码酵母同源或异源蛋白的基因的衍生物。启动子优选来自编码酵母同源蛋白的基因。例如,合适的启动子可以是酿酒酵母Sacch aromyces cerevisial MαI,TPI,ADH或PGK启动子。
编码本发明多肽的DNA序列可以与合适的终止子有效相连,例如TPI终止子(T.Alber and G.Kauasaki,J.Mol.Appl.Genet.1,1982,pp.419-434)。
本发明的重组表达载体还包含一段能使载体在酵母中复制的DNA序列。此序列的实例是酵母质粒2μ复制基因REP1-3和复制起点。载体也可以包含一个选择标记,例如P.R.Russell,Gene40,1985,PP.125-130所描述的粟酒裂殖酵母Schizosaccharamyces,pombe TPI基因。
分别用于连接编码本发明多肽的DNA序列,启动子和终止子,并将它们***含酵母复制必需信息的合适的酵母载体的方法对于本领域的技术人员而言是熟知的(例如参见Sambrook etal.,op.cit.)。载体构建可以理解为,首先准备一个DNA构建体,它含编码本发明多肽的完整DNA序列,然后将这个片段***合适的表达载体中,或***具单个元件遗传信息的DNA片段(例如信号,先导或异源蛋白),再进行连接。
本发明方法中所用的酵母菌可以是能在培养中生产大量异源蛋白或所述多肽的任何合适酵母菌。合适的酵母菌种的例子可以是酿酒酵母(Saccharomyces cerevisioe),克鲁弗酵母(SaccharomycesKluyveri),粟酒裂殖酵母(Schizosaccharomyces.pombe),或葡萄汁酵母(Saccharomyces uvarum)。酵母细胞转化可能受到诸如原生质体的形成接着以本身已知的方式转化的影响。用于培养细胞的培养基可以是适于酵母生长的任何常规培养基。分泌的异源蛋白,其重要部分在培养基中以正确加工形式存在,可通过常规程序从培养基中回收,此过程包括用离心或过滤将酵母细胞与培养基分离,沉淀上清液的蛋白部分或盐析,比如硫酸铵,再经各种层析方法纯化,例如离子交换层层析,亲和层析等。
蛋白质分泌至培养基中后,再经历各种过程以除去序列X3-X4-X5-X6-X7
当X6是Pro,Thr,Ser,Gly或Asp时,延伸物与异源蛋白在酵解期间结合稳定,保护异源蛋白N-末端不被酵母蛋白酶如DPAP水解。在蛋白质的化学加工过程中,异源蛋白N-末端延伸也可保护异源蛋白N-末端氨基基团,比如它可充当BOC或相似保护基团的替代物。在这种情况下,通过碱性氨基酸特异(如Iys或Arg)的蛋白水解酶作用,从回收的异源蛋白中去除氨基酸序列X3-X4-X5-X6-X7。在X7处去除末端延伸。这些蛋白水解酶的实例是胰蛋白酶,无色杆菌(Achromobacter lyticus)蛋白酶I,肠激酶,尖孢镰孢菌胰蛋白酶样蛋白酶,及酿酒酵母的酵母天冬氨酸蛋白酶3(YAP3)。
YAP3已用于各种原激素和酿酒酵母(Saccharomycescerevisiae)异源蛋白的表达(Niamh,X.C.et al.,FEBSLetters,332,P.273-276,1993;Bourbonnais,Y.et al.EMBO Joumal,12,P.285-294,1993;Egel-Mitani,M.et al.,YEAST,6,P.127-137,1990)。
在酿酒酵母(Saccharomyces cerevisiae)大量酵解时出现YAP3。pH值为3-6时,YAP3有活性。用于生产的基本培养基就能产生明显的YAP3。细胞在这种培养基中处于葡萄糖和/或氮饥饿,但可以利用限制生长状况的其它条件。YAP3蛋白酶需要旁侧为切割位点的特定结构域。当X7前的一个氨基酸是Ala或Glu时,N-末端延伸中就有这种结构域(X6是Pro,Thr,Ser,Gly或Asp就不出现结构域)。
所以,当X6是肽键(X7前的氨基酸是Ala或Glu)或Ala或Glu时,发酵期间从异源蛋白上切除延伸物。酵母细胞分泌后可能发生的过程是根据YAP3在酵母细胞或培养基中作用底物(赖氨酸或精氨酸后的肽键)的情况。根据YAP3内部与酵母细胞的结合或分离就可以选择性地切除延伸,使生长基中的非延伸产物得以纯化。
可以从培养基中的异源蛋白上切除氨基酸序列X3-X7,其中X6是Ala或Glu或肽键(X7前的氨基酸是Ala或Glu),该过程涉及使酵母细胞应急,释放YAP3到培养基中,从而切除氨基酸序列X3-X7。使酵母细胞应急包括减小培养基的pH值,降至6.0以下,优选为5以下,或使酵母细胞出现葡萄糖和/或氮饥饿。
在本发明生产异源蛋白过程中,酵母细胞还转化一个或多个编码碱性氨基酸特异性蛋白酶的基因,在细胞培养中表达一个或多个基因,随即产生蛋白酶,确保从异源蛋白上完全去除X3-X7
作为优选的替代物,编码YAP3的一个或多个附加基因可以转化酵母细胞,在细胞培养时过量表达一个或几个基因,随即大量产生YAP3,确保从异种多肽更完全地去除X3-X7
在本说明书中,酵母天冬氨酸蛋白酶3(YAP3)包括天然YAP3酶及天然酶的衍生物,其中为确保细胞YAP3蛋白的有效释放,C-末端被修饰。为了维持蛋白水解酶活性也可发生任何修饰。
作为选择的蛋白酶可以为无色杆菌蛋白酶I,肠激酶或胰蛋白酶。
下列实施例将详细描述本发明,但这些实施例并非试图限制所要求保护的本发明的范围。
本发明参考附图进行描述,其中
图1.表示含表达N-末端延伸多肽基因的质粒构建的整体设计。
图1中使用下列符号:
1:代表来自酿酒酵母的TPI基因启动子序列。
2:代表编码信号/先导肽区域(例如来自酿酒酵母的α-因子基因)
3:代表编码异源多肽的区域
3*:代表编码N-末端延伸的异源多肽的区域
4:代表酿酒酵母的TPI基因终止子序列
P1:代表确定N-末端延伸结构的人工合成的寡核苷酸PCR
    引物
P2:代表扩增区域3的常用PCR引物。
POT:代表来自粟酒裂殖酵母的TPI基因。
2μOri:代表来自酿酒酵母2μ质粒的序列,包括酿酒酵母DNA复制起点。
ApR:来自pBR322/pUC13的序列,含有氨苄抗性基因和大肠杆菌DNA复制起点。
图2表示pJB59的DNA序列,编码胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21),N-末端融合85个氨基酸残基,这些残基构成α-因子信号/先导肽,其中82位点的Leu和83位点的Asp分别被Met和Ala替代。
图3.pAK623的DNA序列,编码GLP-17-36Ala,N-末端融合人工合成的信号/先导序列“YAP3/S1pAVA”。
图4.pKV142的DNA序列,编码B(1-29)-Ala-Ala-Arg-A(1-21),N-末端融合85个氨基酸残基,这些氨基酸残基构成α-因子信号/先导肽,其中82位的Leu和83位的Asp分别被Met和Ala替代。
图5.编码B(1-29)-Ala-Ala-Lys-A(1-21)的pAK679DNA序列,其N-末端融合人工合成的信号/先导序列“YAP3/LA19”
图6.表示含胰岛素前体B(1-27)Asp-Lys-Ala-Ala-Lys-A(1-21)的培养物上清液在有或无N-末端延伸时的HPLC色谱图;及体内或体外有或无N-末端延伸加工时的HPLC色谱图。
图7.表示根据图4.用10%Tricine-SDS-PAGE胶分离的产物。
图8.表示与pJB64相比,在pJB176中YAP3共同表达的存在对得自HPLC数据的产量的影响。
实施例
质粒与DNA
所有表达质粒是C-POT型(见图1),与WO EP171142的描述相似,其特征是含有丙糖磷酸同分异构酶基因(POT),可在酿酒酵母中选择质粒和稳定质粒。质粒还具有酿酒酵母丙糖磷酸同分异构酶启动子(图1中1区)和终止子(图1中4区)。除了编码信号/先导/产物(图1中2区和3区)的EcoRI-XbaI片段外,这些序列与质粒pKFN 1003(WO90/100075描述)的相应序列相同。为了表达不同的异源蛋白,pKFN10003的Eco RI-XbaI片段仅由编码目的信号/先导/产物的EcoRI-XbaI片段所替代。根据标准技术(Sambrook et al.,1989 supra)使用人工合成的寡聚核苷酸和PCR,就可以人工合成这种EcoRI-XbaI片段。
图1表达含表达N-末端延伸多肽基因的质粒构建的整体设计,包括下列步骤:
-运用标准分子技术(Sambrook J,Fritsch E L and ManioctisT,molecular Cloning:A Laboratory Manual,Cold Spring HarborLaboratory Press,1989),用限制性核酸酶EcoRV和XbaI消化一个C-POT质粒载体样品,分离出最大的DNA片段。
-用限制性核酸酶EcoRV和NcoI消化另一个C-POT质粒载体样品(与前面提及的质粒相同或不同),分离出包含1区和2区的片段。
-根据厂家的说明书及在编码目的异源多肽的模板(与前面提及的质粒相同或不同)上人工合成的寡核苷酸引物P1和P2,使用Gene Amp Pcr试剂盒(Per kin Elmer,761 Main Avewalk,CT06859,USA)进行聚合酶链反应(PCR)。P1被设计成具有一个限制性核酸酶NcoI(5′CCATGG3′)识别位点,接有编码KEX2加工位点的序列,N-末端延伸及与编码目的异源蛋白的原始N-末端序列相同的10-15个核苷酸。根据Sambrook etal.,Supra描述的标准技术,P2(例如5′-AATTTATTTTACATAACACTAG-3′)被设计为能扩增3区,并能在P1存在时扩增PCRs限制性核酸酶XbaI(5′-TCTAGA-3′)的侧翼识别位点。
-用限制性核酸酶NcoI和XbaI消化PCR产物,并分离消化片段。
-在标准条件(Sambrook et al.,出处同上所描述)下,用T4DNA连接酶连接分离片段。
-根据Sambrook et al.,出处同上,连接混合物用于转化感受态apr-大肠杆菌细胞,并筛选氨苄抗性。
-用标准分子技术(Sambrook et al.出处同上所描述)从所得的大肠杆菌克隆中分离出质粒。
-为了证实(或确定)编码N-末端延伸的多肽的DNA序列,并确保它与编码2区的信号/先导肽的DNA序列在同一阅读框中,根据产家的说明书使用酶链终止法(Sequenase,United StatesBiochemicals)进行DNA测序
-质粒用于转化酵母菌株MT663,并适于葡萄糖中生长,细节如下:酵母转化:酿酒酵母菌株MT663(E2-7B XE11-36a/α,Δtpi/Δtpi,pep4-3/pep4-3)(与WO92/11378相关的酵母菌株MT663保存在Deutsche Sammlung von Mikrooganismen undZellkulturen,保存号:DSM6278)在YPGal(1%酵母提取物,2%蛋白胨,2%半乳糖,1%乳糖)中培养至O.D.600nm值达到0.6。
经离心收集100ml培养物,10ml水冲洗,重新离心并重新悬浮于10ml溶液,此溶液包含1.2M山梨醇,25mMNa2EDTAPH=8.0,6.7mg/ml二硫苏糖醇。30℃温育15分钟,离心后细胞重悬浮于10ml包含1.2M山梨醇,10mM Na2EDTA,0.1M柠檬酸钠pH=5.8,2mg Novozym234的溶液中,30℃温育30分钟,离心收集细胞,用10ml1.2M山梨醇和10ml CAS(1.2M山梨醇,10mMCaCl2,10mMTris HCl(Tris=三(羟甲基)氨基甲烷)pH=7.5)冲洗,重新悬浮于2ml CAS中。转化时,1ml CAS-悬浮细胞大约混有0.1μg质粒DNA,室温放置15分钟。加入1ml20%聚乙二醇4000,10mMCaCl2,10mMTrisHCl,pH=7.5,混合物于室温放置30分钟。混合物经离心后重新悬浮于0.1ml SOS(1.2M山梨醇,33%V/V YPD,6.7m MCaCl2),30℃温育2小时。悬浮液离心并重新悬浮于0.5ml1.2M山梨醇。52℃时加入6ml顶级琼脂(Sherman et al.,Methods in Yeast Genetics,ColdSpring Harbor Laboratory(1982)的SC培养基含1.2M山梨醇及2.5%琼脂),将悬浮液铺在含相同山梨醇的琼脂固化培养基平板上。实施例1pJB108与pJB109的构建
质粒pJB59是pKFN1003的衍生物,其中EcoRI-XbaI片段编码胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21),其N-末端与信号/先导序列相融合,此序列对应于α-因子前信号肽原,其中82位的Leu和83位的Asp分别被Met和Ala替代(图2)。根据厂家的说明书,在生物***DNA合成仪(Perkin Elmer DNA Thermal Cycler)上合成EcoRI-XbaI片段。
根据前面提及的整体设计,借助于具下列结构的P1-引物
            NcoI
5′-GGGGTATCCATGGCTAAGAGAGAAGAAGCTGAAGCTGAAGCT(AC)CAAAGTTCGTTAACCAACAC-3′
    GlyLeuSerMetAlaLysArgGluGluAlaGluAlaGluAla  Xaa LysPheValAsnGlnHis
P2-引物:5′-AATTTATTTTACATAACACTAG-3′与质粒pJB59,可获得表达N-末端延伸的胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)的质粒构建体。PCR和克隆产生构建体,其中编码N-末端延伸Glu-Glu-Ala-Glu-Ala-Glu-Ala-Xaa-Lys的DNA序列在编码胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)的DNA序列前面,Xaa或为Pro(pJB108;CCA编码Pro)或Thr(pJB109;ACA编码Thr)。实施例2pJB44,pJB107与pJB126的构建
如实施例1描述,借助于P1-引物
            NcoI
5′-GGGGTATCCATGGCTAAGAGAGAAGAAGCTGAAGCTGAAGCTG(CAG)(AC)AAAGTTCGTTAACCAACAC-3′
    GlyLeuSerMetAlaLysArgGluGluAlaGluAlaGluAla  xaa  LysPheValasnGlnHis
,P2-引物5′AATTTATTTTACATAACACTAG-3′与质粒pJB59,产生表达N-末端延伸的胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)的质粒构建体。在产生的质粒中可以分离出pJB44,pJB10和pJB126。这些质粒编码胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21),其前为N-末端延伸Glu-Glu-Ala-Glu-Ala-Glu-Ala-Xaa-Lys,其中Xaa或为Glu(pJB 44,GAA编码Glu)或为Asp(pJB126,GAC编码Asp)或Gly(pJB107;GGC编码Gly)。实施例3pJB64,pJB110的构建
如实施例1描述,借助于P1-引物
           NcoI
5′-GGGGTATCCATGGCTAAGAGAGAAGAAGCTGAAGCTGAAGG(AC)AAAGTTCGTTAACCAACAC-3′GlyLeuSerMetAlaLysArgGluGluAlaGluAlaGlu  Xaa  LysPheValAsnGlnHis
,P2-引物5′AATTTATTTTACATAACACTAG-3′与质粒pJB59,获得表达N-末端延伸的胰岛素前体B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)的质粒构建体。在产生的质粒中可以分离出pJB64和pJB110。这些质粒编码在前面有DNA序列编码的N-末端延伸物Glu-Glu-Ala-Glu-Ala-Glu-Ala-Xaa-Lys的B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21),其中Xaa或为Glu(pJB110,GAA编码Glu)或为Ala(pJB64,GAC编码Ala)。
实施例4
pAK663的构建
质粒pAK623是pKNF1003的衍生物,其中EcoRI-XbaI片段编码GLP-17-36Ala,N-末端融合人工合成的信号先导序列YAP3/S1PAVA(图3)。
根据厂家的说明书,在生物***DNA合成仪中合成EcoRI-XbaI片段。
按照前面描述的方法产生质粒pAK663,借肋于P1-引物
              NcoI
5′-AACGTTGCCATGGCTCCAGCTCCAGCTAAGAGAGAAGAAGCTGAAGCTGAAGCTGAAAGACATGCTGAAGGT-3′
    AsnValAlaMetAlaProAlaValAlaLysArgGluGluAlaGluAlaGluAlaGluArgHisAlaGluGly
P3-引物5′-AATTTATTTTACATAACACTAG-3′与质粒pAK623,获得表达N末端延伸物是Glu-Glu-Ala-Glu-Ala-Glu-Arg的GLP-17-36ALA的质粒构建体。
实施例5
N-末端延伸产物的表达及延伸物的去除
上述C-POT质粒(pJB59,pJB108,pJB109,pJB44,pJB126,pJB107,pJB64和pJB110)转化的酵母菌株MT663在YPD(1%酵母提取物,2%胨,2%葡萄糖)琼脂板上生长。在YPD液体培养基pH=6.0中,用单菌落起动5ml液体培养物,30℃振荡培养72小时。根据Snel,Damgaard andMollerup,Chromatographia24,1987,pp.329-332描述的方法,直接在培养物上清液中测定产量。
表达N-末端延伸B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)的酵母菌株与非延伸形式(pJB59)的比较结果如下:
质粒               N-末端延伸                      产量
pJB59                                              100%
pJB108    Glu-Glu-Ala-Glu-Ala-Glu-Ala-Pro-Lys      275%
pJBl09    Glu-Glu-Ala-Glu-Ala-Glu-Ala-Thr-Lys      300%
pJB44     Glu-Glu-Ala-Glu-Ala-Glu-Ala-Glu-Lys      325%*
pJB126     Glu-Glu-Ala-Glu-Ala-Glu-Ala-Asp-Lys      300%
pJB107     Glu-Glu-Ala-Glu-Ala-Glu-Ala-Gly-Lys      275%
pJB64      Glu-Glu-Ala-Glu-Ala-Glu-Ala-Lys          250%*
pJB110     Glu-Glu-Ala-Glu-Ala-Glu-Glu-Lys          225%*
标有(*)的产量代表这种产物是N-末端延伸的B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)与非延伸的B(1-27)-Asp-Lys-Ala-Ala-Lys-A(1-21)的混合物,后者是下面所述并在图4a和图5中表示的延伸物体内切除的结果。
pAK663表达N-末端延伸为Glu-Glu-Ala-Glu-Ala-Glu-Ala-Arg的GLP-17-36Ala,其产量比表达非延伸GLP-I7-36Ala的pAK623产量高20倍。
实施例6
体内N-末端延伸物的切除
来自质粒pJB59,pJB64,pJB44和pJB108(见上面)转化的酵母菌株培养物的上清液径HPLC色谱(图4a)检测,平行样品走10%N-三(羟甲基)甲基甘氨酸-SDS-PAGE胶(图5带1,2,3,4)。从HPLC色谱图中可看出具有质粒pJB44(色谱图3)和pJB64(色谱图2)的酵母培养上清液含有N-末端延伸的和非延伸的B(1-27)Asp-Lys-Ala-Ala-Lys-A(1-21),而含pJB108的酵母培养上清液(色谱图4)仅含N-末端延伸形式。在pJB64中大约50%前体以非延伸形式存在(见图5带2),而在pJB44中这种形式只为小部分。
这些结果说明延伸是Glu-Glu-Ala-Glu-Ala-Glu-Ala-Lys(pJB64)或Glu-Glu-Ala-Glu-Ala-Glu-Ala-Glu-Lys(pJB44)时;酵母菌能在体内选择性地切除N-末端延伸,不能切除以Glu-Glu-Ala-Glu-Ala-Glu-Ala-Pro-Lys(pJB108)形式存在的N-末端延伸。
切除延伸的蛋白水解酶活性与分泌途径的酶相关,例如酵母细胞跨高尔基体***上的膜连YAP3。
实施例7体外N-末端延伸物的去除
上述培养上清液用作从过量表达YAP3的酵母菌ME783(Egel-Mitani et al.1990)中分离的部分纯化的YAP3酶或无色杆菌Ach romobacter lyticus蛋白酶I蛋白水解作用的底物。
YAP3的检测如下:
4μl YA3酶
800μl细胞自由生长培养基
样品在0.1M柠檬酸钠缓冲液pH4.0中37℃温育15小时。
无色杆菌(Ach romobacter lyticus)蛋白酶I的检测如下:
10μg无色杆菌蛋白酶I
1ml细胞自由生长培养基
样品在0.1M Tris缓冲液pH8.75中37℃温育1小时
图4b和4c分别表示YAP3和无色杆菌蛋白酶I消化的HPLC色谱结果。平行样品走10%Tricine-SDS PAGE胶(图5带5-12)。
从图4b色谱图谱可以看出YAP3酶能选择性地去除以Glu-Glu-Ala-Glu-Ala-Glu-Ala-Lys(pJB64)或Glu-Glu-Ala-Glu-Ala-Glu-Ala-Glu-Lys(pJB44)形式存在的N-末端延伸,而不作用于Glu-Glu-Ala-Glu-Ala-Glu-Ala-Pro-Lys(pJB108)(见图5带6,7,8)。此结果清楚地表明YAP3或YAP3一样酶在体内有部分切除N-末端延伸物(参见实施例6)。
从图4c的色谱图可以看出,在任何情况下,无色杆菌蛋白酶I消化产生相同的产物,即B链(1-27)-Asp-Lys(二硫键相连)-A(1-21),此产物为蛋白水解酶作用胰岛素前体B(1-27)Asp-Lys-Ala-Ala-Lys-A(1-21)中所有Lys残基的结果或作用前体A、B链间的Lys残基的结果。
pJB59(表达非延伸B(1-27)Asp-Lys-Ala-Ala-Lys-A(1-21))转化的酵母培养上清液在消化过程中可见产物,在其它消化中未出现此产物。此产物Arg-B(1-27)-Asp-Lys-(二硫键相连)-A(1-21),是培养基中分泌的先导-前体经无色杆菌蛋白酶I切除的结果。蛋白酶I在产物双碱性KEX2位点的Lys和Arg残基间进行切除,在酵母细胞分泌途径中产物在KEX2位点不被切割。
实施例8
通过过量表达YAP3去除N-末端延伸
Egel-Mitani et al.(Yeast6(1990)pp127-137)克隆的YAP3基因以下列方式***到编码Glu-Glu-Ala-Glu-Ala-Glu-Ala-Lys-B(1-27)-Pro-Lys-Ala-Ala-Lys-A(1-21)(见实施例3)的C-POT质粒pJB64:
从质粒pME768(Egel-Mitani et al.Yeast 6(1990)pp.127-137)中分离出含有YAP3基因的2.5Kb SaI/SacI片段,将此片段***质粒pIC19R(March et al.Gene32(1984)pp.481-485)SalI和SacI位点。从目的质粒pME834中分离含YAP3基因的一段2.5Kb SalI/xhoI片段,将此片段***位于POT与pJB64的ApR序列间的唯一的SalI位点。将一个目的质粒设计为pJB176。
用pJB176转化酵母菌株MT663并按实施例5所述进行分析。
从图8中产量的HPLC数据可以看出,与pJB64酵母转化菌株相比,在pJB64转化酵母菌株的培养上清液中pJB176中的YAP3基因明显地产生高百分比的非延伸B(1-27)-Pro-Lys-Ala-Ala-Arg-A(1-21)。
这一结果说明通过操作YAP3所致的蛋白水解作用水平,在体外可以选择性提高酵母菌株去除N-末端延伸的能力。
实施例9
pKV143的构建
质粒pKV142是pKFN1003的衍生物。其中EcoRI-XbaI片段编码N-末端融合信号/先导序列的胰岛前体B(1-29)-Ala-Ala-Arg-A(1-21),此信号/先导序列对应α-因子信号肽原的85个残基,其中82位的Leu和83位的Asp分别被Met和Ala替代(图4)。
根据前面描述的整体设计,借助于P1-引物
            NcoI
5′-GGGGTATCCATGGCTAAGAGAGACGACGCTGACGCTGACGCTGACCCAAGATTCGTTAACCAACACTTGTGCGG-3′
    GlyLeuSerMetAlaLysArgAspAspAlaAspAlaAspAlaAspProArgPheValAsnGlnHisLeuCys
P2-引物5′AATTTATTTTACATAACACTAG-3′与质粒pKV142,可获得表达N-末端延伸为Asp-Asp-Ala-Asp-Ala-Asp-Ala-Asp-Pro-Arg的B(1-29)-Ala-Ala-Arg-A(1-21)的质粒构建体。
实施例10
pKV102的构建
根据前面所述的整体设计,借助于P1-引物
            NcoI
5′-GGGGTATCCATGGCTAAGAGAGAAGAAGCTGAAGCTGAAGCTGAACCAAAGGCTACAAGATTCGTTAACCAACACTTGTGCGG-3′
    GlyLeuSerMetAlaLysArgGluGluAlaGluAlaGluAlaGluProLysAlaThrArgPheValAsnGlnHisLeuCys
P2-引物5′AATTTATTTTACATAACACTAG-3′与质粒pKV142,可获得表达N-末端延伸为Glu-Glu-Ala-Glu-Ala-Glu-Ala-Glu-Pro-Lys-Ala-Thr-Arg的B(1-29)-Ala-Ala-Arg-A(1-21)的质粒构键体。
实施例11
N-末端延伸B(1-29)-Ala-Ala-Arg-A(1-21)的表达
按实施例5所述,用C-POT质粒pKV142,pKV143和pKV102转化酵母菌株MT663并进行分析。
表达N-末端延伸B(1-29)-Ala-Ala-Arg-A(1-21)的酵母菌株与非延伸形式(pKV142)比较的结果如下:
质粒           N-末端延伸                       产量pKV142                                              100%pKV143:Asp-Asp-Ala-Asp-Ala-Asp-Ala-Asp-Pro-Arg     263%pKV102:Glu-Glu-Ala-Glu-Ala-Glu-Ala-Glu-Pro-Lys-Ala-Thr-Arg                             400%
实施例12
pIM69和pIM70的构建与表达
质粒pAK679是pKFN10031003的衍生物,其中EcoRI-XbaI片段编码N-末端融合人工合成的信号/先导序列YAP3/LA19(图5)的胰岛素前体B(1-29)-Ala-Ala-Lys-A(1-21)。
通过两个连续的PCR反应,可以获得表达N-末端延伸的胰岛素前体B(1-29)-Ala-Ala-Lys-A(1-21)的质粒构建体。第一个PCR反应借助于引物
5′-GAAGAAGAAGAAGAAGAACCAAAGTTCGTTAACCAACAC-3′
    GluGluGluGluGluGluProLysPheValAsnGlnHis
P2-引物5′AATTTATTTTACATAACACTAG-3′与质粒pAK679进行第二个PCR反应借助于P1-引物
                     NcoI
5′-GTTGTTAACTTGATCTCCATGGCTAAGAGAGAAGAA-3′
    ValValAsnLeuIleSerMetAlaLysArgGluGLu
P2-引物5′AATTTATTTTACATAACACTAG-3′进行,用第一个PCR反应的产物作为第二个PCR反应的DNA模板来完成的。
根据前面描述的整体设计,用NcoI和XbaI切割第二个PCR反应的PCR产物并将此产物连接进pAK679。在目的质粒中有两处编码B(1-29)-Ala-Ala-Lys-A(1-21)的N-末端延伸,分别为Glu-Glu-Glu-Pro-Lys(pIM70)和Glu-Glu-Glu-Glu-Pro-Lys(pIM69)。
按照实施例5的描述,用C-POT质粒pAK579,pIM69和pIM70转化酵母菌株MT663,并进行分析。
实际上,具pAK579的酵母的非延伸B(1-29)-Al-Ala-Lys-A(1-21)的产量为零;而具有pIM69和pIM70的酵母分别能产生大量的Glu-Glu-Glu-Glu-Pro-Lys-B(1-29)-Ala-Ala-Lys-A(1-21)和Glu-Glu-glu-Pro-Lys-B(1-29)-Ala-Ala-Lys-A(1-21)。序列表(1)一般资料(i)申请人:(A)姓名:Novo Nordisk A/S(B)街道:Novo Alle(C)城市:agsvaerd(E)国家:Denmark(F)邮政编码(地区):2880(G)电话:+4544448888(H)电传:+4544493256(I)电报37304(ii)发明题目:在酵终中表达的N-末端延伸蛋白(iii)序列数:52(iv)计算机可读形式:(A)媒体类型:Floppy disk(B)计算机:IBM PC兼容机(C)操作***:PC-DOS/MS-DOS(D)软盘专利释放#1.0,版本#1.25(EPO)(2)SEQ ID NO:1的资料(i)序列特征:(A)长度:6个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:酿酒酵母(xi)序列描述:SEQ ID号:1:(2)SEQ ID号:2的资料(i)序列特征:(A)长度:13个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:2:Glu Glu Ala Glu Ala Glu Xaa Xaa Xaa Arg Ala Pro Arg1               5                   10SEQ ID号:3的资料(i)序列特征:(A)长度:11个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:3:Glu Glu Ala Glu Ala Glu Pro Lys Ala Xaa Arg1               5                   10SEQ ID号:4的资料(i)序列特征:(A)长度:10个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:4:Glu Glu Ala Glu Ala Glu Ala Glu Pro Arg1               5                   10SEQ ID号:5的资料(i)序列特征:(A)长度:10个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:5:Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys1               5                   10SEQ ID号:6的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:6:Glu Glu Ala Glu Ala Glu Ala Glu Arg1               5SEQ ID号:7的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:7:Glu Glu Ala Glu Ala Glu Ala Xaa Lys1               5SEQ ID号:8的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:8:Glu Glu Ala Glu Ala Glu Ala Xaa Lys1               5SEQ ID号:9的资料(i)序列特征:(A)长度:8个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:9:Glu Glu Ala Glu Ala Glu Ala Arg1               5SEQ ID号:10的资料(i)序列特征:(A)长度:8个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:10:Glu Glu Ala Glu Ala Glu Xaa Lys1               5SEQ ID号:11的资料(i)序列特征:(A)长度:7个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:11:Glu Glu Ala Glu Ala Pro Lys1               5SEQ ID号:12的资料(i)序列特征:(A)长度:5个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:12:Glu Glu Ala Pro Lys1               5SEQ ID号:13的资料(i)序列特征:(A)长度:4个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:13:Glu Glu Pro Lys1SEQ ID号:14的资料(i)序列特征:(A)长度:22个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:14:AATTTATTTT ACATAACACT AGSEQ ID号:15的资料(i)序列特征:(A)长度:63个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:15:GGGGTATCCA TGGCTAAGAG AGAAGAAGCT GAAGCTGAAG CTNCAAAGTT CGTTAACCAA          60CAC                                                                        63SEQ ID号:16的资料(i)序列特征:(A)长度:64个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:16:GGGGTATCCA TGGCTAAGAG AGAAGAAGCT GAAGCTGAAG CTGNNAAAGT TCGTTAACCA          60ACAC                                                                       64SEQ ID号:17的资料(i)序列特征:(A)长度:61个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:17:GGGGTATCCA TGGCTAAGAG AGAAGAAGCT GAAGCTGAAG GNAAAGTTCG TTAACCAACA          60C                                                                          61SEQ ID号:18的资料(i)序列特征:(A)长度:72个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:18:AACGTTGCCA TGGCTCCAGC TCCAGCTAAG AGAGAAGAAG CTGAAGCTGA AGCTGAAAGA          60CATGCTGAAG GT                                                              72SEQ ID号:19的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:19:Glu Glu Ala Glu Ala Glu Ala Pro Lys1               5SEQ ID号:20的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:20:Glu Glu Ala Glu Ala Glu Ala Thr Lys1               5SEQ ID号:21的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:21:Glu Glu Ala Glu Ala Glu Ala Glu Lys1               5SEQ ID号:22的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:22:Glu Glu Ala Glu Ala Glu Ala Asp Lys1               5SEQ ID号:23的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:23:Glu Glu Ala Glu Ala Glu Ala Gly Lys1               5SEQ ID号:24的资料(i)序列特征:(A)长度:8个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:24:Glu Glu Ala Glu Ala Glu Ala Lys1               5SEQ ID号:25的资料(i)序列特征:(A)长度:8个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:25:Glu Glu Ala Glu Ala Glu Glu Lys1               5SEQ ID号:26的资料(i)序列特征:(A)长度:9个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:26:Glu Glu Ala Glu Ala Glu Ala Pro Lys1               5SEQ ID号:27的资料(i)序列特征:(A)长度:13个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:27:Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys Ala Thr Arg1               5                   10SEQ ID号:28的资料(i)序列特征:(A)长度:8个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:28:Glu Glu Ala Glu Ala Glu Ala Lys1               5SEQ ID号:29的资料(i)序列特征:(A)长度:5个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(xi)序列描述:SEQ ID号:29:Glu Glu Ala Pro Lys1               5SEQ ID号:30的资料(i)序列特征:(A)长度:660个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(ix)特征:(A)名字/关键词:CDS(B)位点:127..540(ix)特征:(A)名字/关键词:sig-肽(B)位点:127..381(ix)特征:名字/关键词:mat-肽(B)位点382..540(xi)序列描述:SEQ ID号:30:GTTTGTATTC TTTTCTTGCT TAAATCTATA ACTACAAAAA ACACATACAG GAATTCCATT          60CAAGAATAGT TCAAACAAGA AGATTACAAA CTATCAATTT CATACACAAT ATAAACGATT         120AAAAGA ATG AGA TTT CCT TCA ATT TTT ACT GCA GTT TTA TTC GCA GCA            168
   Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala
   -85                 -80                 -75TCC TCC GCA TTA GCT GCT CCA GTC AAC ACT ACA ACA GAA GAT GAA ACG           216Ser Ser Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr
-70                 -65                 -60GCA CAA ATT CCG GCT GAA GCT GTC ATC GGT TAC TCA GAT TTA GAA GGG           264Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly-55                 -50                 -45                 -40GAT TTC GAT GTT GCT GTT TTG CCA TTT TCC AAC AGC ACA AAT AAC GGG           312Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly
            -35                 -30             -25TTA TTG TTT ATA AAT ACT ACT ATT GCC AGC ATT GCT GCT AAA GAA GAA           360Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu
        -20                 -15                 -10GGG GTA TCC ATG GCT AAG AGA TTC GTT AAC CAA CAC TTG TGC GGT TCC           408Gly Val Ser Met Ala Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser
     -5                   1               5CAC TTG GTT GAA GCT TTG TAC TTG GTT TGC GGT GAA AGA GGT TTC TTC           456His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe10                  15                  20              25TAC ACT GAC AAG GCT GCT AAG GGT ATC GTT GAA CAA TGC TGT ACC TCC           504Tyr Thr Asp Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser
             30                  35                  40ATC TGC TCC TTG TAC CAA TTG GAA AAC TAC TGC AAC TAGACGCAGC                550Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
         45                  50CCGCAGGCTC TAGAAACTAA GATTAATATA ATTATATAAA AATATTATCT TCTTTTCTTT         610ATATCTAGTG TTATGTAAAA TAAATTGATG ACTACGGAAA GCTAGCTTTT                    660SEQ ID号:31的资料(i)序列特征:(A)长度:138氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:蛋白质(xi)序列描述:SEQ ID号:31:Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser-85                 -80                 -75                 -70Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
            -65                 -60                 -55Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asn Phe
        -50                 -45                 -40Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
    -35                 -30                 -25Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
-20                 -15                 -10Ser Met Ala Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu-5                   1               5                  10Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
         15                  20                  25Asp Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
     30                  35                  40Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
 45                  50SEQ ID号:32的资料(i)序列特征:(A)长度:516个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iii)反义:无(vi)原始来源:(A)生物:人工合成(ix)特征:(A)名字/关键词:CDS(B)位点:133..411(ix)特征:(A)名字/关键词:Sig-肽(B)位点:133..321(ix)特征:(A)名字/关键词:mat-肽(B)位点:324..411(xi)序列描述:SEQ ID号:32TGTTTGTATT CTTTTCTTGC TTAAATCTAT AACTACAAAA AACACATACA GGAATTCCAT          60TCAAGAATAG TTCAAACAAG AAGATTACAA ACTATCAATT TCATACACAA TATAAACGAC         120GGTACCAAAA TA ATG AAA CTG AAA ACT GTA AGA TCT GCG GTC CTT TCG             168
          Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser
          -63         -60                 -55TCA CTC TTT GCA TCT CAG GTC CTT GGC CAA CCA ATT GAC GAC ACT GAA           216Ser Leu Phe Ala Ser Gln Val Leu Gly Gln Pro Ile Asp Asp Thr Glu
-50                 -45                 -40TCT AAC ACT ACT TCT GTC AAC TTG ATG GCT GAC GAC ACT GAA TCT ATC           264Ser Asn Thr Thr Ser Val Asn Leu Met Ala Asp Asp Thr Glu Ser Ile-35                  -30                -25                 -20AAC ACT ACT TTG GTT AAC TTG GCT AAC GTT GCC ATG GCT CCA GCT CCA           312Asn Thr Thr Leu Val Asn Leu Ala Asn Val Ala Met Ala Pro Ala Pro
            -15                 -10                  -5GCT AAG AGA CAT GCT GAA GGT ACC TTC ACC TCT GAC GTC TCG AGT TAC           360Ala Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr
          1               5                  10TTG GAA GGC CAA GCT GCT AAG GAG TTC ATC GCT TGG TTG GTT AAG GGC           408Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly
 15                  20                  25GCT TAGTCTAGAA ACTAAGATTA ATATAATTAT ATAAAAATAT TATCTTCTTT                461Ala30TCTTTATATC TAGTGTTATG TAAAATAAAT TGATGACTAC GGAAAGCTAG CTTTT              516SEQ ID号:33的资料(i)序列特征:(A)长度:93个氨基酸(B)类型:氨基酸(D)拓扑结构:线型(ii)分子类型:蛋白质(xi)序列描述:SEQ ID号:33:Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser Leu Phe Ala-63         -60                 -55                 -50Ser Gln Val Leu Gly Gln Pro Ile Asp Asp Thr Glu Ser Asn Thr Thr
    -45                 -40                 -35Ser Val Asn Leu Met Ala Asp Asp Thr Glu Ser Ile Asn Thr Thr Leu
-30                 -25                 -20Val Asn Leu Ala Asn Val Ala Met Ala Pro Ala Pro Ala Lys Arg His-15                 -10                  -5                   1Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln
          5                  10                  15Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Ala
     20                  25                  30SEQ ID号:34的资料(i)序列特征:(A)长度:10个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:34:Asp Asp Ala Asp Ala Asp Ala Asp Pro Arg1               5                   10SEQ ID号:35的资料(i)序列特征:(A)长度:6个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:35:Glu Glu Glu Glu Pro Lys1               5SEQ ID号:36的资料(i)序列特征:(A)长度:5个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:36:Glu Glu Glu Pro Lys1               5SEQ ID号:37的资料(i)序列特征:(A)长度:6个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:37:Asp Asp Asp Asp Asp Lys1               5SEQ ID号:38的资料(i)序列特征:(A)长度:61个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:38:Glu Glu Ala Glu Ala Glu Ala Lys Phe Val Asn Gln His Leu Cys Gly1               5                   10                  15Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe
        20                  25                  30Phe Tyr Thr Pro Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr
    35                  40                  45Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
50                  55                  60SEQ ID号:39的资料(i)序列特征:(A)长度:53个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:39:Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1               5                   10                  15Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Arg
        20                  25                  30Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
    35                  40                  45Glu Asn Tyr Cys Asn
50SEQ ID号:40的资料(i)序列特征:(A)长度:10个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:40:Asp Asp Ala Asp Ala Asp Ala Asp Pro Arg1               5                   10SEQ ID号:41的资料(i)序列特征:(A)长度:74个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:41:GGGGTATCCA TGGCTAAGAG AGACGACGCT GACGCTGACG CTGACCCAAG ATTCGTTAAC          60CAACACTTGT GCGG                                                            74SEQ ID号:42的资料(i)序列特征:(A)长度:13个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:42:Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys Ala Thr Arg1               5                   10SEQ ID号:43的资料(i)序列特征:(A)长度:83个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:43:GGGGTATCCA TGGCTAAGAG AGAAGAAGCT GAAGCTGAAG CTGAACCAAA GGCTACAAGA          60TTCGTTAACC AACACTTGTG CGG                                                  83SEQ ID号:44的资料(i)序列特征:(A)长度:53个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:44:Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1               5                   10                  15Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys
        20                  25                  30Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
    35                  40                  45Glu Asn Tyr Cys Asn
50SEQ ID号:45的资料(i)序列特征:(A)长度:39个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:45:GAAGAAGAAG AAGAAGAACC AAAGTTCGTT AACCAACAC                                39SEQ ID号:46的资料(i)序列特征:(A)长度:36个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:46:GTTGTTAACT TGATCTCCAT GGCTAAGAGA GAAGAA                                   36SEQ ID号:47的资料(i)序列特征:(A)长度:59个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:47:Glu Glu Glu Glu Pro Lys Phe Val Asn Gln His Leu Cys Gly Ser His1               5                   10                  15Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr
        20                  25                  30Thr Pro Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile
    35                  40                  45Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
50                  55SEQ ID号:48的资料(i)序列特征:(A)长度:58个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:48:Glu Glu Glu Pro Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu1               5                   10                  15Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr
        20                  25                  30Pro Lys Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys
    35                  40                  45Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn
50                  55SEQ ID号:49的资料(i)序列特征:(A)长度:10个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:49:Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys1               5                   10SEQ ID号:50的资料(i)序列特征:(A)长度:660个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:50:GTTTGTATTC TTTTCTTGCT TAAATCTATA ACTACAAAAA ACACATACAG GAATTCCATT          60CAAGAATAGT TCAAACAAGA AGATTACAAA CTATCAATTT CATACACAAT ATAAACGATT         120AAAAGAATGA GATTTCCTTC AATTTTTACT GCAGTTTTAT TCGCAGCATC CTCCGCATTA         180GCTGCTCCAG TCAACACTAC AACAGAAGAT GAAACGGCAC AAATTCCGGC TGAAGCTGTC         240ATCGGTTACT CAGATTTAGA AGGGGATTTC GATGTTGCTG TTTTGCCATT TTCCAACAGC         300ACAAATAACG GGTTATTGTT TATAAATACT ACTATTGCCA GCATTGCTGC TAAAGAAGAA         360GGGGTATCCA TGGCTAAGAG ATTCGTTAAC CAACACTTGT GCGGTTCCCA CTTGGTTGAA         420GCTTTGTACT TGGTTTGCGG TGAAAGAGGT TTCTTCTACA CTCCTAAGGC TGCTAGAGGT         480ATTGTCGAAC AATGCTGTAC CTCCATCTGC TCCTTGTACC AATTGGAAAA CTACTGCAAC         540TAGACGCAGC CCGCAGGCTC TAGAAACTAA GATTAATATA ATTATATAAA AATATTATCT         600TCTTTTCTTT ATATCTAGTG TTATGTAAAA TAAATTGATG ACTACGGAAA GCTAGCTTTT         660SEQ ID号:51的资料(i)序列特征:(A)长度:600个碱基对(B)类型:核酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:DNA(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:51:TGTTTGTATT CTTTTCTTGC TTAAATCTAT AACTACAAAA AACACATACA GGAATTCCAT          60TCAAGAATAG TTCAAACAAG AAGATTACAA ACTATCAATT TCATACACAA TATAAACGAC         120GGTACCAAAA TAATGAAACT GAAAACTGTA AGATCTGCGG TCCTTTCGTC ACTCTTTGCA         180TCTCAGGTCC TTGGCCAACC AATTGACGAC ACTGAATCTA ACACTACTTC TGTCAACTTG         240ATGGCTGACG ACACTGAATC TAGATTCGCT ACTAACACTA CTTTGGCTTT GGATGTTGTT         300AACTTGATCT CCATGGCTAA GAGATTCGTT AACCAACACT TGTGCGGTTC CCACTTGGTT         360GAAGCTTTGT ACTTGGTTTG CGGTGAAAGA GGTTTCTTCT ACACTCCTAA GGCTGCTAAG         420GGTATTGTCG AACAATGCTG TACCTCCATC TGCTCCTTGT ACCAATTGGA AAACTACTGC         480AACTAGACGC AGCCCGCAGG CTCTAGAAAC TAAGATTAAT ATAATTATAT AAAAATATTA         540TCTTCTTTTC TTTATATCTA GTGTTATGTA AAATAAATTG ATGACTACGG AAAGCTAGCT         600SEQ ID号:52的资料(i)序列特征:(A)长度:55个氨基酸(B)类型:氨基酸(C)链型:单链(D)拓扑结构:线型(ii)分子类型:肽(iii)假设:无(iv)反义:无(v)片段类型:内部(xi)序列描述:SEQ ID号:52:Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1               5                   10                  15Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ser Asp Asp
        20                  25                  30Ala Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr
    35                  40                  45Gln Leu Glu Asn Tyr Cys Asn
50                  55

Claims (23)

1.一种编码具有下列结构的多肽的DNA构建体,信号肽-先导肽-X1-X2-X3-X4-X4-X6-X7-异源蛋白
X1是Lys或Arg;
X2是Lys或Arg,X1与X2共同确定一个酵母加工位点;
X3是Glu或Asp
X4是具有下列结构的一段氨基酸序列:(A-B)n
其中A是Glu或Asp,B是Ala,Val,Leu或Pro,n是0或从1至5的整数,且当n≥2时每个A和B可与其它A(s)和B(s)相同或相异,或
X4是具下列结构的一段氨基酸序列,(C)m,其中C是Glu或Asp,m是0或从1至5的整数
X5是一个肽键或1个氨基酸或多个相同或相异的氨基酸
X6是一个肽键或选自Pro、Asp、Thr、Ser、Glu、Ala和Gly的一个氨基酸残基;X7是Lys或Arg。
2.根据权利要求1的DNA构建体,其中X3是Glu。
3.根据权利要求1的DNA构建体,其中X3是Glu。
4.根据权利要求1的DNA构建体,其中X3是Ala。
5.根据权利要求1的DNA构建体,其中n优选为2-4,更优选为3。
6.根据权利要求1的DNA构建体,其中X5是一个肽键,Glu,Asp或Glu-Pro-Lys-Ala。
7.根据权利要求1的DNA构建体,其中X6是Pro或肽键。
8.根据权利要求1的DNA构建体,其中信号肽是α-因子信号肽,酵母天冬氨酸蛋白酶3信号肽,鼠唾液淀粉酶,羧肽酶信号肽或酵母BAR1信号肽。
9.根据权利要求1的DNA构建体,其中先导肽是一个天然先导肽,例如α-因子先导肽或一个人工合成的先导肽。
10.根据权利要求1的DNA构建体,其中异源蛋白选自抑蛋白酶肽,组织因子途径抑制剂或其它蛋白酶抑制剂,***I或II,人或牛生长激素,白介素,组织血纤维蛋白溶酶原激活剂,胰高血糖或胰高血糖样肽-1,因子VII,因子VIII,因子XIII,血小板衍生生长因子,酶,胰岛素或胰岛素前体,及这些蛋白质的任何功能类似物。
11.根据权利要求10的DNA构建体,其中异源蛋白是胰岛素或胰岛素前体或其功能类似物。
12.根据权利要求1-11中任意一项的DNA构建体,其中氨基酸序列X3-X7
Glu Glu Ala Glu Ala Glu Ala Pro Lys,
Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys Ala Thr Arg,
Glu Glu Ala Glu Ala Glu Ala Lys,
Glu Glu Ala Pro Lys,
Glu Glu Ala Glu Ala Glu Ala Glu Pro Lys,
Asp Asp Ala Asp Ala Asp Ala Asp Pro Arg,
Glu Glu Glu Glu Pro Lys,
Glu Glu Glu Pro Lys or
Asp Asp Asp Asp Asp Lys.
13.一种重组表达载体,它能在酵母中复制并携带根据权利要求12的DNA构建体。
14.一种酵母菌株,它能表达异源蛋白并被根据权利要求13的载体转化。
15.一种生产异源蛋白的方法包括在合适的培养基中培养根据权利要求14酵母细胞以获得异源蛋白的表达和分泌,然后从培养基中分离出此蛋白。
16.根据权利要求15的方法,其中氨基酸序列X3-X7经过涉及用对碱性氨基酸特异的蛋白水解酶处理的方法从回收的异源蛋白上去掉。
17.根据权利要求16的方法,其中蛋白水解酶选自胰蛋白酶,无色杆菌(Achromobacter lyticus)蛋白酶I,肠激酶,尖孢镰孢菌(Fusarium oxysporum)胰蛋白酶样蛋白酶及YAP3。
18.根据权利要求16的方法,其中氨基酸序列X3-X7通过涉及使酵母细胞应急,使之释放酵母天冬氨酸蛋白酶-3进入培养基中的方法而从异源蛋白上切除,从而去掉氨基酸序列X3-X7,其中X6是一个肽键或Ala或Glu。
19.根据权利要求18的方法,其中酵母细胞的应急包括培养基pH值减至6.0以下,或限制生长条件使酵母细胞饥饿。
20.根据权利要求19的方法,其中培养基pH值减至5以下。
21.根据权利要求15的方法,其中用编码对碱性氨基酸残基具特异性的蛋白酶的一个或多个基因进一步转化酵母细胞,在细胞培养中基因表达,随即产生的蛋白酶确保从异源多肽上更完全地去除X3-X7
22.根据权利要求21的方法,其中编码蛋白酶的基因是编码YAP3的基因,使在细胞培养中YAP3基因过度表达,YAP3的过量产物保证了从异源多肽上更完全地去除X3-X7
23.根据权利要求21的方法,其中编码蛋白酶的基因编码无色杆菌蛋白酶I或胰蛋白酶。
CN95194181A 1994-06-17 1995-06-16 在酵母中表达的n末端延伸蛋白 Expired - Lifetime CN1131312C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DK0712/94 1994-06-17
DK71294 1994-06-17
DK0712/1994 1994-06-17

Publications (2)

Publication Number Publication Date
CN1152942A true CN1152942A (zh) 1997-06-25
CN1131312C CN1131312C (zh) 2003-12-17

Family

ID=8096676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95194181A Expired - Lifetime CN1131312C (zh) 1994-06-17 1995-06-16 在酵母中表达的n末端延伸蛋白

Country Status (16)

Country Link
EP (1) EP0765395A1 (zh)
JP (1) JP3730255B2 (zh)
CN (1) CN1131312C (zh)
AU (1) AU2733595A (zh)
BR (1) BR9508053A (zh)
CA (1) CA2192943A1 (zh)
CZ (1) CZ363796A3 (zh)
FI (1) FI965030A (zh)
HU (1) HUT75840A (zh)
IL (1) IL114160A (zh)
MX (1) MX9606536A (zh)
NO (1) NO965411L (zh)
PL (1) PL317761A1 (zh)
SG (1) SG47883A1 (zh)
WO (1) WO1995035384A1 (zh)
ZA (1) ZA954983B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109414471A (zh) * 2016-05-24 2019-03-01 诺和诺德股份有限公司 Mic-1化合物及其用途

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6500645B1 (en) 1994-06-17 2002-12-31 Novo Nordisk A/S N-terminally extended proteins expressed in yeast
ZA9610456B (en) * 1995-12-20 1997-06-20 Novo Nordisk As N-terminally extended proteins expressed in yeast
ATE398139T1 (de) * 1996-12-13 2008-07-15 Novartis Vaccines & Diagnostic Analyse und separation von pdgf-proteinen
DE69735242T2 (de) * 1996-12-20 2006-09-21 Novo Nordisk A/S N-terminal verlängerte proteine exprimiert in hefe
EP1049790A1 (en) 1998-01-23 2000-11-08 Novo Nordisk A/S Process for making desired polypeptides in yeast
WO2001049870A1 (en) 1999-12-29 2001-07-12 Novo Nordisk A/S Method for making insulin precursors and insulin precursor analogues having improved fermentation yield in yeast
US7595172B2 (en) 2001-07-24 2009-09-29 Novo Nordisk A/S Method for making acylated polypeptides
JP2005503141A (ja) * 2001-07-24 2005-02-03 ノボ ノルディスク アクティーゼルスカブ アシル化ポリペプチドを作出するための方法
US20030082671A1 (en) 2001-07-24 2003-05-01 Thomas Hoeg-Jensen Method for making acylated polypeptides
WO2004085472A1 (en) * 2003-03-27 2004-10-07 Novo Nordisk A/S Method for making human insulin precursors and human insulin
EP1692168B1 (en) 2003-12-03 2011-07-20 Novo Nordisk A/S Single-chain insulin
WO2007020256A1 (en) 2005-08-16 2007-02-22 Novo Nordisk A/S Method for making mature insulin polypeptides
JP5550338B2 (ja) 2006-07-31 2014-07-16 ノボ・ノルデイスク・エー/エス ペグ化持続型インスリン
US9018161B2 (en) 2006-09-22 2015-04-28 Novo Nordisk A/S Protease resistant insulin analogues
WO2008037735A1 (en) 2006-09-27 2008-04-03 Novo Nordisk A/S Method for making maturated insulin polypeptides
EP2084179B1 (en) 2006-11-22 2013-05-22 Novo Nordisk A/S Method for making activated carboxypeptidases
CN101743252A (zh) 2007-07-16 2010-06-16 诺沃-诺迪斯克有限公司 蛋白酶稳定化的、peg化的胰岛素类似物
WO2009021955A1 (en) 2007-08-13 2009-02-19 Novo Nordisk A/S Rapid acting insulin analogues
ES2548304T3 (es) 2007-08-15 2015-10-15 Novo Nordisk A/S Análogos de la insulina que contienen una fracción acilo y alquilenglicol
ES2526924T3 (es) 2007-08-15 2015-01-16 Novo Nordisk A/S Insulinas con una fracción acilo que comprende unidades repetitivas de aminoácidos que contienen alquilenglicol
PL2254906T3 (pl) 2008-03-18 2017-04-28 Novo Nordisk A/S Stabilizowane względem proteaz, acylowane analogi insuliny
CN102065903B (zh) 2008-04-01 2015-02-18 诺沃-诺迪斯克有限公司 胰岛素清蛋白缀合物
DK2340033T3 (da) 2009-06-26 2014-01-20 Novo Nordisk As Præparat, der omfatter insulin, nicotinamid og arginin
CN102639559B (zh) 2009-11-25 2015-04-29 诺沃—诺迪斯克有限公司 用于制备多肽的方法
CA2802510A1 (en) 2010-06-23 2011-12-29 Novo Nordisk A/S Insulin derivatives containing additional disulfide bonds
EP2585483A1 (en) 2010-06-23 2013-05-01 Novo Nordisk A/S Human insulin containing additional disulfide bonds
EP2585484A1 (en) 2010-06-23 2013-05-01 Novo Nordisk A/S Insulin analogues containing additional disulfide bonds
KR20140030125A (ko) 2010-12-14 2014-03-11 노보 노르디스크 에이/에스 인슐린, 니코틴아미드 및 아미노산을 포함하는 제제
JP2013545782A (ja) 2010-12-14 2013-12-26 ノヴォ ノルディスク アー/エス 長時間作用型インスリンと組み合わせた速効型インスリン
WO2012171994A1 (en) 2011-06-15 2012-12-20 Novo Nordisk A/S Multi substituted insulins
WO2013186138A1 (en) 2012-06-14 2013-12-19 Novo Nordisk A/S Preparation comprising insulin, nicotinamide and arginine
US9707276B2 (en) 2012-12-03 2017-07-18 Merck Sharp & Dohme Corp. O-glycosylated carboxy terminal portion (CTP) peptide-based insulin and insulin analogues
EP3004156A1 (en) 2013-06-07 2016-04-13 Novo Nordisk A/S Method for making mature insulin polypeptides
WO2015128507A1 (en) 2014-02-28 2015-09-03 Novo Nordisk A/S Mating factor alpha pro-peptide variants
EP3303380B1 (en) 2015-06-02 2020-01-15 Novo Nordisk A/S Insulins with polar recombinant extensions
JP2018531899A (ja) 2015-08-25 2018-11-01 ノヴォ ノルディスク アー/エス 新規インスリン誘導体及びその医学的使用
ES2908373T3 (es) 2015-08-25 2022-04-28 Novo Nordisk As Nuevos derivados de insulina y los usos médicos de los mismos
US20190010206A1 (en) 2015-08-25 2019-01-10 Novo Nordisk A/S Novel Insulin Derivatives and the Medical Uses Hereof
EP3668892A1 (en) 2017-08-17 2020-06-24 Novo Nordisk A/S Novel acylated insulin analogues and uses thereof
JP2021532730A (ja) * 2018-06-18 2021-12-02 ユニケム ラボラトリーズ リミテッド 組換えタンパク質の発現レベルを高めるためのリーダー配列
JP6995284B2 (ja) 2019-12-11 2022-01-14 ノヴォ ノルディスク アー/エス 新規インスリン類似体およびそれらの使用
WO2023144240A1 (en) 2022-01-26 2023-08-03 Novo Nordisk Research Centre Oxford Limited Glucose sensitive insulin derivatives and uses thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2593518B1 (fr) * 1985-05-02 1989-09-08 Transgene Sa Vecteurs d'expression et de secretion de l'hirudine par les levures transformees
US5010182A (en) * 1987-07-28 1991-04-23 Chiron Corporation DNA constructs containing a Kluyveromyces alpha factor leader sequence for directing secretion of heterologous polypeptides
CA1340772C (en) * 1987-12-30 1999-09-28 Patricia Tekamp-Olson Expression and secretion of heterologous protiens in yeast employing truncated alpha-factor leader sequences
DK105489D0 (da) * 1989-03-03 1989-03-03 Novo Nordisk As Polypeptid
DK300090D0 (da) * 1990-12-19 1990-12-19 Novo Nordisk As Fremgangsmaade til fremstilling af leadersekvenser
WO1992013951A1 (en) * 1991-02-04 1992-08-20 The Salk Institute Biotechnology/Industrial Associates, Inc. Production of human serum albumin in methylotrophic yeast cells

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109414471A (zh) * 2016-05-24 2019-03-01 诺和诺德股份有限公司 Mic-1化合物及其用途

Also Published As

Publication number Publication date
AU2733595A (en) 1996-01-15
ZA954983B (en) 1996-02-14
IL114160A (en) 2006-12-31
WO1995035384A1 (en) 1995-12-28
NO965411L (no) 1997-02-14
FI965030A0 (fi) 1996-12-16
IL114160A0 (en) 1995-10-31
CA2192943A1 (en) 1995-12-28
SG47883A1 (en) 1998-04-17
NO965411D0 (no) 1996-12-16
CZ363796A3 (en) 1997-05-14
FI965030A (fi) 1997-02-14
JP3730255B2 (ja) 2005-12-21
JPH10501695A (ja) 1998-02-17
HUT75840A (en) 1997-05-28
EP0765395A1 (en) 1997-04-02
PL317761A1 (en) 1997-04-28
BR9508053A (pt) 1997-08-12
HU9603476D0 (en) 1997-02-28
MX9606536A (es) 1997-03-29
CN1131312C (zh) 2003-12-17

Similar Documents

Publication Publication Date Title
CN1131312C (zh) 在酵母中表达的n末端延伸蛋白
CN1029977C (zh) 胰岛素类似物的制备方法
CN1034428C (zh) 用解脂亚罗威阿酵母转化株表达和分泌异源蛋白质
CN1144815C (zh) 修饰的大肠杆菌内毒素ⅱ信号肽以及表达该肽与异源蛋白质的融合蛋白的微生物
CN1529757A (zh) 用于向细菌培养物上清液中分泌目的蛋白质的融合蛋白质
US20100167342A1 (en) Method of producing biologically active polypeptide having insulinotropic activity
EP1377608B1 (en) Insulin precursors and a process for their preparation
CN1247787C (zh) 实现细胞的改变的方法及载体
CN1279171C (zh) N端部份为蛭素衍生物的融合蛋白在生产酵母分泌的重组蛋白中的应用
CN1177377A (zh) 具酶活性的重组羧肽酶b的生产
JPH09502609A (ja) 酵母において異種蛋白質を産生させるための分泌配列
CN1250729C (zh) 利用大肠杆菌OmpF胞外生产靶蛋白的方法
CN1374970A (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1527882A (zh) 可超分泌的肽及其制备方法和对一种或多种其他多肽的分泌形式的平行提高
US20050019853A1 (en) Production of heterologous polypeptides in yeast
JP6275847B2 (ja) アルファ接合因子プロペプチドバリアント
CN1125181C (zh) 在酵母细胞中表达n-末端延伸蛋白质的载体
CN1928096A (zh) 以油体蛋白作载体在转基因大豆中生产重组水蛭素的方法
CN1110559C (zh) 调控金黄担子素敏感性的基因
WO2000014259A1 (fr) Souches de candida boidinii presentant une activite protease reduite et utilisation de ces dernieres en tant qu'hote pour produire une proteine exogene
CA2169567A1 (en) The recombinant production of proteins in yeast
WO2006121165A1 (ja) タンパク質の製造法
EP2513301A1 (en) Pichia pastoris deficient in endogenous secreted protease
US7270979B1 (en) DNA for expression of alpha 1-antitrypsin in methylotropic yeast
CN1309712A (zh) 在转化的酵母细胞中生产蛋白质的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CX01 Expiry of patent term

Expiration termination date: 20150616

Granted publication date: 20031217