DE69634757T2

DE69634757T2 - Vektor zur expression von n-terminal verlängerten proteinen in hefezellen

Info

Publication number: DE69634757T2
Application number: DE69634757T
Authority: DE
Inventors: Borglum Thomas KJELDSEN; Per Balschmidt; Frost Annette PETTERSSON
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 1995-12-20
Filing date: 1996-12-18
Publication date: 2006-02-02
Anticipated expiration: 2016-12-19
Also published as: ZA9610456B; JP4180112B2; EP0868523A1; AU1093597A; WO1997022706A1; CA2241367A1; IL124939A0; EP0868523B1; DE69634757D1; ATE295890T1; IL124939A; JP2000501617A; CA2241367C; CN1125181C; ES2242969T3; CN1207773A

Description

GEBIET DER ERFINDUNG
Die vorliegende Erfindung betrifft in einer eukaryotischen Zelle, vorzugsweise einer Hefezelle, exprimierte und verarbeitete Polypeptide, ein eine solche Peptide kodierende DNA-Sequenz umfassendes DNA-Konstrukt, solche DNA-Fragmente tragende Vektoren und Zellen, einschließlich Hefezellen, die mit den Vektoren transformiert sind, sowie ein Verfahren zur Herstellung von heterologen Proteinen in Hefe.
HINTERGRUND DER ERFINDUNG
Hefeorganismen produzieren eine Anzahl an Proteinen, die intrazellulär synthetisiert werden, jedoch eine Funktion außerhalb der Zellen aufweisen. Solche extrazellulären Proteine werden als sekretierte Proteine bezeichnet. Diese sekretierten Proteine werden anfänglich innerhalb der Zelle in einem Vorläufer oder einer Präform exprimiert, der/die eine Präsequenz enthält, die das wirksame Anordnen des exprimierten Produkts über den Membranen des endoplasmatischen Retikulums (ER) gewährleist. Die gewöhnlich als Signalpeptid bezeichnete Präsequenz wird im Allgemeinen während der Translokalisierung von dem gewünschten Produkt abgespalten. Nach dem Eintritt in den Sekretionsweg wird das Protein zum Golgi-Apparat transportiert. Vom Golgi-Apparat aus kann das Protein verschiedenen Wegen folgen, die zu Abteilungen wie der Zellvakuole oder der Zellmembran führen, oder zum Sekretieren in einem externen Medium aus der Zelle geleitet werden (Pfeffer, S.R. und Rothman, J.E. Ann. Rev. Biochem. 56 (1987), 829-852).
Mehrere Vorgehensweisen wurden für die Expression und Sekretion von für Hefe heterologe Proteinen vorgeschlagen. Die Europäische Veröffentlichung Nr. 0088632A beschreibt ein Verfahren, durch welches für Hefe heterologe Proteine durch Transformieren eines Hefeorganismus mit einem Expressionsvektor, der eine das gewünschte Protein und ein Signalpeptid kodierende DNA beinhaltet, Herstellen einer Kultur aus dem transformierten Organismus, Wachstum der Kultur und Gewinnen des Proteins aus dem Kulturmedium exprimiert, verarbeitet und sekretiert werden. Bei dem Signalpeptid kann es sich um das gewünschte proteineigene Signalpeptid, ein heterologes Signalpeptid oder ein Hybrid eines nativen und eines heterologen Signalpeptids handeln.
Bei einem bei der Verwendung von für Hefe heterologen Signalpeptiden anzutreffenden Problem könnte es sich darum handeln, dass das heterologe Signalpeptid keine effiziente Translokalisierung und/oder Abspaltung des Vorläuferpolypeptids nach dem Signalpeptid gewährleistet.
Der MFα1 (α-Faktor) von Saccharomyces cerevisiae wird als Präproform mit 165 Aminosäuren synthetisiert, die ein 19 Aminosäuren langes Signal- oder Präpeptid, gefolgt von einem 64 Aminosäuren langen „Leader-" oder Propeptid, das drei N-verknüpfte Glycosylierungsstellen umfasst, gefolgt von (LysArg(Asp/Glu, Ala)_2-3α-Faktor)₄, umfasst (Kurjan, J. und Herskowitz, I. Cell 30 (1982), 933-943. Der Signal-Leader-Teil des Präpro-MFα1 wurde weit verbreitet zum Erhalt der Synthese und Sekretion von heterologen Proteinen in S. cerevisiae eingesetzt.
Die Verwendung von für Hefe homologen Signal/Leader-Peptiden ist u. a. aus dem US-Patent Nr. 4,546,082, den Europäischen Veröffentlichungen Nr. 0116201A, 0123294A, 0163529A, 0123289A und dem Europäischen Patent Nr. 0100561B bekannt.
In EP 0123289A ist die Verwendung des α-Faktor-Vorläufers von S. cerevisiae beschrieben, wohingegen EP 100561 die Verwendung des PH05-Signals von Saccharomyces cerevisiae und die PCT-Veröffentlichung Nr. WO 95/02095 die Verwendung des YAP3-Signalpeptids zur Sekretion von fremden Proteinen beschreibt.
US-Patent Nr. 4,546,082 und die Europäischen Veröffentlichungen Nr. 0016201A, 0123294A, 0123544A, 0163529A beschreiben Verfahren, durch welche der α-Faktor-Signal-Leader von Saccharomyces cerevisiae (MFα1 oder MFα2) im Sekretionsverfahren von heterologen Proteinen in Hefe verwendet wird. Durch Kondensieren einer die MFα1-Signal/Leader-Sequenz von S. cerevisiae kodierenden DNA-Sequenz an das 5'-Ende des Gens, wurde die gewünschte Proteinsekretion und Verarbeitung des gewünschten Proteins gezeigt.
EP 206783 offenbart ein System für die Sekretion von Polypeptiden von S. cerevisiae, durch welches die α-Faktor-Leadersequenz verkürzt wurde, um die vier an der nativen Leadersequenz vorliegenden α-Faktor-Peptide zu eliminieren, wobei das Leaderpeptid selbst über die α-Faktor-Verarbeitungsstelle Lys-Arg-Glu-Ala-Glu-Ala am heterologen Polypeptid kondensiert blieb. Dies weist darauf hin, dass diese Konstruktion zu einem effizienten Verfahren zur Herstellung von kleineren Peptiden (weniger als 50 Aminosäuren) führt. Für die Sekretion und Verarbeitung von größeren Polypeptiden wurde die native α-Faktor-Leadersequenz verkürzt, wobei ein oder zwei α-Faktor-Peptide zwischen dem Leaderpeptid und dem Polypeptid blieben.
Eine Anzahl an sekretierten Proteinen wird derart gesteuert, dass sie einem proteolytischen Verarbeitungssystem ausgesetzt werden, das die Peptidbindung am Carboxyende von zwei aufeinander folgenden basischen Aminosäuren spalten können. Die enzymatische Aktivität wird in S. cerevisiae durch das KEX2-Gen kodiert (Julius, D.A. et al. Cell 37 (1984b), 1075). Die Verarbeitung des Produkts durch die KEX2-Protease ist für die Sekretion des aktiven Paarungsfaktor α1 (MFα1 oder α-Faktor) von S. cerevisiae erforderlich, jedoch an der Sekretion des aktiven Paarungsfaktors a von S. Cerevisiae nicht beteiligt.
Die Sektretion und das korrekte Verarbeiten eines zum Sekretieren vorgesehenen Polypeptids wird in manchen Fällen beim Züchten eines Hefeorganismus erhalten, der mit einem wie im vorstehend genannten Quelltext angegeben konstruierten Vektor transformiert ist. In manchen Fällen ist jedoch der Sekretionsgrad sehr gering oder es liegt keine Sekretion vor oder kann die proteolytische Verarbeitung unkorrekt oder unvollständig sein. Wie in der PCT-Veröffentlichung Nr. WO 90/10075 beschrieben, wird angenommen, dass dies in gewissem Maße einer derart ungenügenden Freilegung der Verarbeitungsstelle zwischen dem C-terminalen Ende des Leaderpeptids und dem N-terminalen Ende des heterologen Proteins geschrieben werden kann, dass sie für proteolytische Spaltung nicht zugänglich oder zumindest weniger zugänglich ist.
WO 90/10075 beschreibt ein Hefeexpressionssystem mit einer verbesserten Verarbeitung eines heterologen Polypeptids, das durch Bereitstellen von bestimmten Modifikationen in der Nähe der Verarbeitungsstelle am C-terminalen Ende des Leaderpeptids und/oder am N-terminalen Ende eines an das Leaderpepptid kondensierten heterologen Polypeptids erhalten wird. Folglich ist es möglich, eine höhere Ausbeute des korrekt verarbeiteten Proteins als mit unmodifizierten Konstruktionen aus Leaderpeptid und heterologem Polypeptid zu erhalten. Es ist die Aufgabe der vorliegenden Erfindung, eine neue N-terminale Modifikation eines an das Leaderpeptid kondensierten heterologen Polypeptids bereitzustellen, die eine effizientere Expression und/oder Verarbeitung sowie eine verbesserte Entfernung der N-terminalen Verlängerung der heterologen Polypeptide in vitro gewährleistet.
ZUSAMMENFASSUNG DER ERFINDUNG
Die vorliegende Erfindung beschreibt als Verlängerungen bezeichnete Modifikationen des N-terminalen Endes des heterologen Polypeptids, die durch eine Proteolyse in vitro während der oder anschließend an die Reinigung des Produkts aus den Kulturmedium abgespalten werden können.
Die vorliegende Erfindung betrifft ein Polypeptid mit der folgenden Struktur kodierendes DNA-Konstrukt:
Signalpeptid-Leaderpeptid-EEAEPK-heterologes Protein.
Der herkömmliche einbuchstabige Kode für Aminosäuren gemäß den von der IUPAC-ICB-Komission für biotechnologische Nomenklatur zugelassenen Regeln (1974) wird innerhalb dieser Beschreibung und in den Ansprüchen verwendet.
Im vorliegenden Kontext ist der Begriff „Signalpeptid" so zu verstehen, dass er eine Präsequenz bedeutet, die als N-terminale Sequenz an der Vorläuferform eines in Hefe exprimierten extrazellulären Proteins vorliegt. Bei der Funktion des Signalpeptids handelt es sich um das Gewähren der Sekretion des heterologen Proteins für den Eintritt in das endoplasmatische Retikulum. Das Signalpeptid wird im Laufe des Verfahrens gewöhnlich abgespalten. Das Signalpeptid kann für den das Protein herstellenden Hefeorganismus heterolog oder homolog sein. Bei einem bevorzugten Signalpeptid in dieser Erfindung handelt es sich um das Signalpeptid Hefeaspartamprotease 3 (YAP3) oder ein beliebiges funktionelles Analogon davon. YAP3 wurde durch Egel-Mitani, M. et al., YEAST, 6 S. 127-137, 1990 geklont und charakterisiert.
Der Ausdruck „Leaderpeptid" ist so zu verstehen, dass er ein Peptid in Form einer Propeptidsequenz angibt, bei dessen Funktion es sich um das Gewähren der Sekretion des heterologen Proteins handelt, wodurch es vom endoplasmatischen Retikulum zum Golgi-Apparat und für die Sekretion in das Medium weiter zu einem Sekretionsvesikel geleitet wird (d.h. die Ausfuhr des exprimierten Proteins oder Polypeptids über die Zellmembran und, falls vorliegend, die Zellwand oder zumindest durch die Zellmembran in den periplasmatischen Raum einer Zelle mit einer Zellwand). Vorzugsweise handelt es sich bei dem Leaderpeptid um den hier als SEQ ID NO. 5 offenbarten LA19.
Der Ausdruck „heterologes Protein" soll ein in der Natur nicht durch den Wirtsorganismus hergestelltes Protein oder Polypeptid, vorzugsweise ein in der Natur nicht durch Hefe hergestelltes Polypeptid angeben. Jedoch ist die Herstellung von homologen Polypeptiden wie Glucagon in einer Säugerzelle für Fachmann nahe liegend, und die Polypeptide sind in der Bedeutung von „heterologem Protein" eingeschlossen.
Die Sequenz EEAEPK bildet eine Verlängerung am N-Terminal des heterologen Polypeptids. Diese Verlängerung erhöht nicht nur die Fermentationsausbeute, sondern ist auch gegen eine Verarbeitung durch Dipeptidylaminopeptidase (DPAP A) geschützt, was zu einem homologen N-Terminal des Polypeptids führt. Die Verlängerung ist in solcher Weise konstruiert, dass sie während der Fermentation gegen proteolytische Abspaltung resistent ist, so dass das N-terminal verlängerte homologe Proteinprodukt zur anschließenden Reifung in vitro z.B. durch Trypsin oder Protease I von Achromobacter lyticus aus dem Kulturmedium gereinigt werden kann. Die gewünschte Entfernung in vitro der N-terminalen Verlängerung EEAEPK wird vermutlich aufgrund der Flexibilität des Peptids mit N-terminale Verlängerung entweder durch Trypsin oder Protease I von Achromobacter lyticus leicht erzielt, was zu einer verbesserten Ausbeute des gereiften heterologen Proteins fuhrt.
Die Erfindung betrifft des Weiteren einen rekombinanten Expressionsvektor, der in einer eukaryotischen Zelle, vorzugsweise einer Hefezelle replizieren kann und vorzugsweise ein DNA-Konstrukt der Erfindung trägt. Vorzugsweise umfasst das DNA-Konstrukt ein synthetisches Leaderpeptid, vorzugsweise das LA19-Leaderpeptid. Außerdem betrifft die Erfindung das hier in 1 beschriebene DNA-Konstrukt. Die Erfindung betrifft auch eine eukaryotische Zelle, vorzugsweise eine Hefezelle, die ein hetrerologes Protein exprimieren kann und mit einem Vektor der Erfindung transformiert ist.
Weiterhin betrifft die Erfindung ein Verfahren zur Herstellung eines heterologen Proteins in Hefe, umfassend das Züchten des transformierten Hefestamms in einem geeigneten Medium zum Erhalt der Expression und Sekretion des heterologen Proteins, wonach das Protein aus dem Medium isoliert wird.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Die vorliegende Erfindung wird weiter mit Bezug auf die beigefügten Zeichnungen veranschaulicht, wobei
1 das Expressionsplasmid pAK729 zeigt, das die N-terminal verlängerten Polypeptide der Erfindung exprimierenden Gene enthält, wobei die folgenden Symbole verwendet werden:
TPI-PROMOTER bezeichnet die Promotersequenz des TPI-Gens von S. cerevisiae.
2 bezeichnet die Region, die ein Signal-/Leaderpeptid (z.B. vom YAP3-Signalpeptid und LA19-Leaderpeptid zusammen mit dem durch EEAEPK N-terminal verlängerten MI3-Insulin Vorläufer) kodiert.
TPI-TERMINATOR bezeichnet die Terminatorsequenz des TPI-Gens von S. cerevisiae.
TPI-Pombe bezeichnet das TPI-Gen von S. pombe.
Ursprung bezeichnet eine Sequenz des 2μ-Plasmids von S. cervisiae, einschließlich dessen DNA-Replikationsursprung in S. cerevisiae.
AMP-R: Sequenz von pBR322/pU13, einschließlich des Ampicillinresistenzgens und eines DNA-Replikationsursprungs in E. coli.
Bei SEQ ID NO. 1 handelt es sich um die DNA- und Aminosäuresequenzen in pAK729, die das YAP3-Signalpeptid (Aminosäure Nr. 1 bis 21), das LA19-Leaderpeptid (Aminosäure Nr. 22 bis 64), die N-terminale Verlängerung EEAEPK (Aminosäure Nr. 65 bis 70), den MI3-Insulinvoräufer B_Kette(1-29)-Ala-Ala-Lys-A_Kette(1-21) (Aminsäure Nr. 71 bis 123) kodieren.
Bei SEQ ID NO. 2 handelt es sich um die DNA- und Aminosäuresequenzen in pAK733, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI1-Insulinvorläufer-Komplex von Beispiel 2 kodieren.
Bei SEQ ID NO. 3 handelt es sich um die DNA- und Aminosäuresequenzen in pAK749, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI5-Insulinvorläufer-Komplex von Beispiel 3 kodieren.
Bei SEQ ID NO. 4 handelt es sich um die DNA- und Aminosäuresequenzen in pAK866, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-X14-Insulinvorläufer-Komplex von Beispiel 4 kodieren.
Bei SEQ ID NO. 5 handelt es sich um die LA19-Leader-DNA-Sequenz.
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
Bei dem durch das Verfahren der Erfindung hergestellten N-terminal verlängerten heterologen Protein kann es sich um ein beliebiges Protein handeln, das vorteilhafterweise in einer eukaryotischen Zelle, vorzugsweise einer Hefezelle produziert wird. Bei Beispielen für solche Proteine handelt es sich um Aprotinin, Hemmer für den Gewebefaktorweg und andere Proteasehemmer und Insulin oder Insulinvorläufer, Insulinanaloga, insulinartigem Wachstumsfaktor I oder II, menschlichem oder Rinder-Wachstumshormon, Interleukin, Gewebeplasminogenaktivator, transformierendem Wachstumfaktor a oder b, Glucagon, glucagonartigem Peptid 1 (GLP-1), glucagonartigem Peptid 2 (GLP-2), GRPP, Faktor VII, Faktor VIII, Faktor XIII, Plättchen-abgeleitetem Wachstumsfaktor, Enzyme wie Lipasen oder ein funktionelles Analogon eines beliebigen dieser Proteine. Im vorliegenden Kontext bedeutet der Begriff „funktionelles Analogon" der Hinweis auf ein Polypeptid mit einer ähnlichen Funktion wie das native Protein (dies soll so zu verstehen sein, dass eher die Natur als der Grad an biologischer Aktivität des nativen Proteins gemeint ist). Das Polypeptid kann dem nativen Protein strukturell ähneln und durch Addition einer oder mehrerer Aminosäuren an eine der beiden oder beide C- und N-terminale Enden des nativen Proteins, Substitution einer oder mehrerer Aminosäuren an einem oder eine Anzahl von verschiedenen Stellen in der nativen Aminosäuresequenz, Deletion einer oder mehrerer Aminosäuren an einem der beiden oder beiden Enden des nativen Proteins oder an einer oder einigen Stellen in der nativen Aminosäuresequenz oder Einfügung einer oder mehrerer Aminosäuren an einer oder mehrere Stellen in der nativen Aminosäuresequenz des nativen Proteins abgeleitet sein. Solche Modifikationen sind für einige der vorstehend erwähnten Proteine bekannt.
„Ein Insulinvorläufer" oder „ein Vorläufer eines Insulinanalogons" ist als einkettiges Polypeptid, einschließlich Proinsulin, zu verstehen, das durch ein oder mehrere anschließende chemische und/oder enzymatische Verfahren zu einem zweikettigen Insulin oder Insulinanalogon mit der korrekten wie in natürlichem menschlichem Insulin zu findenden Einrichtung der drei Disulfidbrücken umgewandelt werden kann. Bei Beispielen für Insuline oder Insulinanaloga, die auf diese Weise hergestellt werden können, handelt es sich um menschliches Insulin, vorzugsweise des(B30)-menschliches Insulin. Schweineinsulin und Insulinanaloga, in welchen mindestens ein Lys oder Arg vorliegt, vorzugsweise Insulinanaloga, in welchen Phe^B1 deletiert wurde, Insulinanaloga, in welchen die A-Kette und/oder die B-Kette eine N-terminale Verlängerung aufweisen, und Insulinanaloga, in welchen die A-Kette und/oder die B-Kette eine C-terminale Verlängerung aufweisen. Bei anderen bevorzugten Insulinanaloga handelt es sich um solche, in welchen ein oder mehrere Aminosäurereste, vorzugsweise ein, zwei oder drei da von durch einen anderen kodierbaren Aminosäurerest substituiert wurden, Folglich kann ein parentales Insulin an Position A21 statt Asn einen Aminosäurerest, ausgewählt aus der Gruppe, umfassend Ala, Gln, Glu, Gly, His, Ile, Leu, Met, Ser, Thr, Trp, Tyr oder Val, insbesondere einen Aminosäurerest, ausgewählt aus der Gruppe, umfassend Gly, Ala, Ser und Thr, aufweisen. Die Insulinanaloga können auch durch eine Kombination der vorstehend umrissenen Veränderungen modifiziert sein. Gleichermaßen kann ein parentales Insulin an Postion B28 statt Pro einen Aminosäurerest, ausgewählt aus der Gruppe, umfassend Lys usw., und ein parentales Insulin an Position B29 statt Lys die Aminosäure Pro aufweisen. Der Ausdruck „ein kodierbarer Aminsosäurerest" bedeutet wie hier verwendet ein Aminosäurerest, der durch den genetischen Kode, d.h. ein Triplett („Kodon") von Nukleotiden kodiert werden kann.
Bei besonders bevorzugten Insulinvorstufen handelt es sich um MI1, B(1-29)-A(1-21); MI3, B(1-29)-Ala-Ala-Lys(1-21) (wie z.B. beschrieben in EP 163 529 ); X14, B(1-27-Asp-Lys)-Ala-Ala-Lys-A(1-21) (wie Z.B. beschrieben in der PCT-Veröffentlichung Nr. 95/00550); N(1-27-Asp-Lys)-A(1-21; B(1-27-Asp-Lys)-Ser-Asp-Asp-Ala-Lys-A(1-21); B(1-29)-Ala-Ala-Arg-A(1-21) (wie z.B. beschrieben in der PCT-Veröffentlichung Nr. 95/07931); MI15, B(1-29)-Ser-Asp-Asp-Ala-Lys-(A1-21) und B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21).
Das das Polypeptid der Erfindung kodierende DNA-Konstruklt der Erfindung kann durch etablierte Standardverfahren, z.B. das von S.L. Beaucage und M.H. Caruthers, Tetrahedron Letters 22, 1981, S. 1859-1869 beschriebene Phosphoamiditverfahren oder das von Matthes et al., EMBO Journal 2, 1984, S. 801-805 beschriebene Verfahren synthetisch hergestellt werden. Gemäß dem Phosphoamiditverfahren werden z.B. in einer automatischen DNA-Syntheseapparatur Oligonukleotide synthetisiert, gereinigt, verdoppelt und unter Bildung des synthetischen DNA-Konstrukts verbunden. Ein gegenwärtig bevorzugter Weg der Herstellung des DNA-Konstrukts erfolgt durch eine wie z.B. in Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, NY, 1989 beschriebene Polymerasekettenreaktion (PCR).
Das DNA-Konstrukt der Erfindung kann auch vom genomischen oder cDNA-Ursprung sein, der z.B. durch Herstellen einer genomischen oder cDNA-Genbank und Durchmustern nach das gesamte oder einen Teil des Polypeptids der Erfindung kodierenden DNA-Sequenzen durch Hybridisierung unter Verwendung von synthetischen Oligonukleotidsonden gemäß Standardtechniken (vgl. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, NY, 1989) erhalten wird. In diesem Fall kann eine ein Signal- und Leaderpeptid kodierende genomische oder cDNA-Sequenz an eine das heterologe Protein kodierende genomische oder cDNA-Sequenz gebunden werden, wonach die DNA-Sequenz an einer der Aminosäuresequenz EEAEPK des Polypeptids entsprechenden Stelle durch Einfügen von die gewünschte Aminosäuresequenz kodierenden synthetischen Oligonukleotiden zur homologen Rekombination gemäß bekannten Verfahren oder vorzugsweise durch Bilden der gewünschten Sequenz durch PCR unter Verwendung von geeigneten Oligonukleotiden modifiziert werden kann.
Schließlich kann das DNA-Konstrukt vom gemischten synthetischen und genomischen, gemischten synthetischen cDNA- oder gemischten genomischen und cDNA-Ursprung sein, der durch Annealen von Fragmenten vom synthetischen, genomischen oder cDNA-Usprung (wie geeignet), wobei die Fragmente verschiedenen Teilen des gesamten DNA-Konstrukts entsprechen, gemäß Standardtechniken hergestellt wird. Folglich kann es vorgesehen sein, dass die das heterologe Protein kodierende DNA-Sequenz vom genomischen oder cDNA-Ursprung sein kann, während die das Signal- und Leaderpeptid kodierende Sequenz sowie die die N-terminale Verlängerung EEAEPK kodierende Sequenz synthetisch hergestellt sein kann.
In einem Aspekt betrifft die Erfindung einen rekombinanten Expressionsvektor, der in Hefe replizieren kann und ein das vorstehend definierte Polypeptid kodie rendes DNA-Konstrukt trägt. Bei dem rekombinanten Expressionsvektor kann es sich um einen beliebigen Vektor handeln, der in Hefeorganismen replizieren kann. Im Vektor sollte die das Polypeptid der Erfindung kodierende DNA-Sequenz funktionsfähig an eine geeignete Promotersequenz gebunden sein. Bei dem Promoter kann es sich um eine beliebige DNA-Sequenz handeln, die Transkriptionsaktivität in Hefe zeigt und von Proteine für Hefe entweder homolog oder heterolog kodierenden Genen abgeleitet sein kann. Der Promoter ist vorzugsweise von einem ein Protein für Hefe heterolog kodierenden Gen abgeleitet. Bei Beispielen für geeignete Promoter handelt es sich um die Mα1-, TPU-, ADH- oder PGK-Promoter.
Die das Polypeptid der Erfindung kodierende DNA-Sequenz kann auch funktionsfähig an einen geeigneten Terminator, z.B. den TPI-Terminator gebunden sein (vgl. T. Alber und G. Kawasaki, J. Mol. Appl. Genet. 1, 1982, S. 419-434).
Der rekombinante Expressionsvektor der Erfindung umfasst eine die Replikation des Vektors in Hefe ermöglichende DNA-Sequenz. Bei Beispielen für solche Sequenzen handelt es sich um die 2μ-Replikationsgene REP 1-3 und den Replikationsursprung des Hefeplasmids. Der Vektor kann auch eine geeignete Markierung, z.B. das wie von R.T. Russel, Gene 40, 1985, S. 125-130, beschriebene TPI-Gen von Schizosaccharomyces pombe umfassen.
Die zum Verbinden der das Polypeptid der Erfindung kodierenden DNA-Sequenzen, des Promoters bzw. des Terminators und deren Einfügen in geeignete Hefevektoren, die die zur Hefereplikation nötige Information enthalten, sind dem Fachmann bekannt (vgl. z.B. Sambrook et al., vorstehend genannt). Es ist klar, dass der Vektor konstruiert werden kann, indem zuerst ein DNA-Konstrukt, das die gesamte für das Polypeptid der Erfindung kodierende DNA-Sequenz enthält, hergestellt und dieses Fragment anschließend in einen geeigneten Expressionsvektor eingefügt wird, oder DNA-Fragmente, die die genetische Information für die einzelnen Elemente enthalten (wie das Signal-, Leader- oder heterologe Protein) sequentiell eingefügt werden, gefolgt von Verbinden.
Bei dem Hefeorganismus oder der eukaryotischen Wirtszelle, die im Verfahren der Erfindung verwendet werden, kann es sich um jeden beliebigen geeigneten Wirtsorganismus handeln, der beim Züchten große Mengen des heterologen Proteins oder fraglichen Polypeptids herstellt. Bei Beispielen für geeignete Hefeorganismen kann es sich um Stämme handeln, die aus den Hefespezien Saccharomyces cerevisiae, Saccharomyces kluyveri, Schizosaccharomyces pombe, Saccharomyces uvarum, Kluyveromyces lactis, Hansenula polymorpha, Pichia pastoris, Pichia methanolica, Pichia kluyveri, Yarrowia lipolytica, Candida sp., Candida utilis, Candida cacaoi, Geotrichum sp. und Geotrichum fermentans, vorzugsweise der Hefespezies Saccharomyces cerevisiae ausgewählt sind. Es ist für den Fachmann deutlich klar, jede beliebige andere eukaryotische Zelle wie Zellen der Gattung Aspergillus, Streptomyces, Insektenzellen oder Säugerzellen als Wirtsorganismus auszuwählen.
Die Transformation der Hefezellen kann z.B. durch Protoplastbildung, gefolgt von Transformation in an sich bekannter Weise bewirkt werden. Bei dem zum Züchten der Zellen verwendeten Medium kann es sich um jedes beliebige herkömmliche Medium handeln, das für das Wachstum von Hefeorganismen geeignet ist. Das sekretierte heterologe Protein, wobei ein beträchtlicher Anteil davon im Medium in korrekt verarbeiteter Form vorliegt, kann durch herkömmliche Verfahren, einschließlich Abtrennen der Hefezellen von dem Medium durch Zentrifugation oder Filtration, Ausfällen der proteinhaltigen Komponenten des Überstands oder Filtrats mittels eines Salzes, z.B. Ammoniumsulfat, gefolgt von Reinigung durch eine Vielzahl von chromatographischen Verfahren, z.B. Ionenaustauschchromatographie, Affinitätschromatographie oder dergleichen aus dem Medium gewonnen werden. Wird das Protein in den periplasmatischen Raum sekretiert, werden die Zellen enzymatisch oder mechanisch zerstört.
Nach der Sekretion in das Kulturmedium oder den periplasmatischen Raum kann das Protein zum Entfernen der Sequenz EEAEPK verschiedenen Verfahren unterzogen werden.
Es wurde gefunden, dass die Verlängerung während der Fermentation am heterologen Protein stabil angelagert ist, wodurch das N-Terminal des heterologen Protein gegen die proteolytische Aktivität von Hefeproteasen wie DPAP geschützt wird. Die Gegenwart einer N-terminalen Verlängerung am heterologen Protein kann als Schutz der N-terminalen Aminogruppe des heterologen Proteins während der chemischen Verarbeitung des Proteins, d.h. als Ersatz für ein BOC oder eine ähnliche Schutzgruppe dienen. In solchen Fällen kann die Aminosäuresequenz EEAEPK mittels eines für eine basische Aminosäure (d.h. K (Lys)) spezifischen proteolytischen Enzyms vom gewonnenen heterologen Protein entfernt werden, sodass die terminale Verlängerung an K abgespalten wird. Bei Beispielen für solche proteolytischen Enzyme handelt es sich um Trypsin oder Protease I von Achromobacter lyticus.
Die vorliegende Erfindung wird detaillierter in den folgenden Beispielen beschrieben, die den beanspruchten Umfang der Erfindung in keinster Weise einschränken sollen.
Beispiel 1. Konstruktion des den EEAEPK-MI3-Insulinvorläufer exprimierenden Hefestamms yAK729
Ein synthetisches Gen, das für die N-terminale Verlängerung des N-terminalverlängerten Insulinvorläufers EEAEPK-MI3 kodierte, wurde unter Verwendung der Polymerasekettenreaktion (PCR) konstruiert.
Die folgenden 2 Oligonukleotide wurden synthetisiert:
#672 5' -TCTCCATGGCTAAGAGAGAAGAAGCTGAACCAAAGTTCGTT-3'
#2785 5' -AATTTATTTTACATAACACTAG-3'
Oligonukleotide wurden unter Verwendung einer automatischen DNA-Syntheseapparatur (Applied Biosystems Modell 380A) unter Verwendung von Phosphoramiditchemie und im Handel erhältlichen Reagenzien (Beaucage, S.L. and Caruthers, M.H., Tetrahedron letters 22 (1981) 1859-1869) synthetisiert.
Die folgende PCR wurde unter Verwendung der Pwo-DNA-Polymerase (Boahringer Mannheim GmbH, Sandhoefter Strasse 116, Mannheim, Deutschland) gemäß den Anweisungen des Herstellers durchgeführt, und das PCR-Gemisch wurde mit 100 μl Mineralöl (Sigma Chemical Co., St. Louis MO, USA) überschichtet.
PCR

5 μl Oligonukleotid # 672 (50 pmol)
5 μl Oligonukleotid #2785 (50 pmol)
10 μl 10X PCR-Puffer
8 μl dNTP-Gemisch
0,5 μl Pwo-Enzym
0,5 μl pAK680-Plasmid als Templat (0,2 ug DNA)
71 μl destilliertes Wasser

Insgesamt 12 Zyklen wurden durchgeführt, bei einem Zyklus handelte es sich um 94°C für eine Dauer von 45 Sekunden, 40°C für eine Dauer von 1 Minute, 72°C für eine Dauer von 1,5 Minuten. Das PCR-Gemisch wurde dann auf ein 2,5 %iges Agarosegel geladen, und eine Elektrophorese wurde unter Verwendung von Standardtechniken durchgeführt (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring harbour Laboratory Press, 1989). Das erhaltene DNA-Fragment wurde aus dem Agarosegel geschnitten und durch den Gen-Clean-Kit (Bio 101 Inc., PO BOX 2284, La Jolla, CA 92038, USA) gemäß den Anweisungen des Herstellers isoliert.
Das gereinigte PCR-DNA-Fragment wurde in 14 μl Wasser und Restriktionsendonukleasepuffer gelöst und mit den Restriktionsendonukleasen NcoI und XbaI gemäß Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) geschnitten. Das NcoI-XbaI-DNA-Fragment auf 209 Nukleotidbasenpaaren wurde einer Agaroseelektrophorese unterzogen und unter Verwendung des Gen-Clean-Kit wie beschrieben gereinigt.
Das Plasmid pAK721 (siehe 1) wurde mit den Restriktionsendonukleasen BgIII und XbaI geschnitten und das Vektorfragment mit 10849 Nukleotidbasenpaaren unter Verwendung des Gen-Clean- Kit wie beschrieben isoliert. Das Plasmid pAK721 wurde dann mit den Restriktionsendonukleasen BgIII und NcoI geschnitten und das DNA-Fragment mit 160 Nukleotidbasenpaaren unter Verwendung des Gen-Clean- Kit wie beschrieben isoliert. Die drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Ligase und Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz.
Das Plasmid des erhaltenen E. coli wurde unter Verwendung von Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und auf die Einfügung mit geeigneten Restriktionsendonukleasen d.h. NcoI und XbaI überprüft. Es zeigte sich durch DNA-Sequenzanalyse (Sequenase, U.S. Biochemical Corp., USA) dass das selektierte Plasmid die korrekte DNA-Sequenz für die EEAEPK-MI3-Insulinvorläufer-DNA kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader-DNA eingefügt wurde. Das Plasmid wurde als pAK729 bezeichnet.
Die DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI3-Insulinvorläufer-Komplex kodierte, ist in SEQ ID NO. 1 dargestellt.
Das Plasmid pAK721 wurde in den Stamm MT663 von S. cerevisiae wie in PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm als yAK721 bezeichnet.
Das Hefeexpressionsplasmid pAK729 ist vom C-POT-Typ (siehe 1) und ähnelt denjenigen, die in WO EP171 142 beschrieben sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces pombe zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten. pAK729 enthält auch den Triosephosphatisomerase-Promoter-Terminator von S. cerevisae. Der Promoter und Terminator ähneln denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075) beschrieben sind, da alle Sequenzen außer die Sequenzen zwischen dem EcoRIXbaI-Fragment, kodierend den YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-MI3-Insulinvorläufer, im Plasmid liegen.
Beispiel 2. Konstruktion des den EEAEPK-MI1-Insulinvorläufer exprimierenden Hefestamms yAK733
Ein synthetisches Gen, das für die N-terminale Verlängerung des N-terminal verlängerten Insulinvorläufers EEAEPK-MI1 kodierte, wurden durch Kombinieren von verschiedenen DNA-Fragmenten, die Leader und Verlängerung und Insulinvorläufer kodieren, konstruiert.
Das Plasmid pAK721 (siehe 1) wurde mit den Restriktionsendonukleasen BgIII und XbaI geschnitten und das Vektorfragment mit 10849 Nukleotidbasenpaaren unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
Das Plasmid pAK730 wurde mit den Restriktionsendonukleasen HindIII und XbaI und den DNA-Fragmenten mit 131 Nukleotidbasenpaaren unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
Das Plasmid pAK729 wurde mit den Restriktionsendonukleasen BgIII und HindIII geschnitten und das DNA-Fragment mit 229 Nukleotiden wurde wie vorstehend beschrieben isoliert.
Die drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Ligase und Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz. Das Plasmid von dem erhaltenen E. coli wurde unter Verwendung von Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und auf Einfügung mit geeigneten Restriktionsendonukleasen überprüft. Es zeigte sich durch DNA-Sequenzanalyse (Sequenase, U.S. Biochemical Corp., USA), dass das selektierte Plasmid die korrekte DNA-Sequenz für die EEAEPK-MI1-Insulinvorläufer-DNA kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader- und Verlängerungs-DNA eingefügt wurde. Das Plasmid wurde als pAK733 bezeichnet.
Die DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI1-Insulinvorläufer-Komplex kodiert, ist in SEQ ID NO 2 dargestellt.
Das Plasmid pAK733 wurde in den Stamm MT663 von S. cerevisiae wie in PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm als yAK733 bezeichnet. Das Hefeexpressionsplasmid pAK733 ist vom C-POT-Typ (siehe 1) und ähnelt denjenigen, die in die WO EP 171 142 beschrieben sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces pombe zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten. pAK733 enthält auch den Triosephosphatisomerase-Promoter-Terminator von S. cerevisiae. Der Promoter und Terminator ähneln denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075) beschrieben sind, da alle Sequenzen außer die Sequenzen zwischen dem EcoRIXbaI-Fragment, kodierend den YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-MI3-Insulinvorläufer, im Plasmid liegen.
Beispiel 3. Konstruktion des den EEAEPK-MI5-Insulinvorläufer exprimierenden Hefestamms yAK749
Ein synthetisches Gen, das für die N-terminale Verlängerung des N-terminal verlängerten Insulinvorläufers EEAEPK-MI1 kodierte, wurden durch Kombinieren von verschiedenen DNA-Fragmenten, die Leader und Verlängerung und Insulinvorläufer kodieren, konstruiert.
Das Plasmid pAK743 wurde mit den Restriktionsendonukleasen BgIII und XbaI geschnitten und das Vektorfragment mit 10757 Nukleotidbasenpaaren unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
Das Plasmid pAK405 wurde mit den Restriktionsendonukleasen HindIII und XbaI und den DNA-Fragmenten mit 238 Nukleotidbasenpaaren unter Verwendung des Gen-Clean-Kti wie beschrieben isoliert.
Das Plasmid pAK729 wurde mit den Restriktionsendonukleasen BgIII und HindIII geschnitten und das DNA-Fragment mit 229 Nukleotiden wurde wie vorstehend beschrieben isoliert.
Die drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Lipase und Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz. Das Plasmid von dem erhaltenen E. coli wurde unter Verwendung von Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und auf Einfügung mit geeigneten Restriktionsendonukleasen überprüft. Es zeigte sich durch DNA-Sequenzanalyse (Sequenase, U.S. Biochemical Corp., USA), dass das selektierte Plasmid die korrekte DNA-Sequenz für die EEAEPK-MI1-Insulinvorläufer-DNA kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader- und Verlängerungs-DNA eingefügt wurde. Das Plasmid wurde als pAK749 bezeichnet.
Die DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI1-Insulinvorläufer-Komplex kodiert, ist in SEQ ID NO 3 dargestellt.
Das Plasmid pAK749 wurde in den Stamm MT663 von S. cerevisiae wie in PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm als yAK749 bezeichnet. Das Hefeexpressionsplasmid pAK749 ist vom C-POT-Typ (siehe 1) und ähnelt denjenigen, die in die WO EP 171 142 beschrieben sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces pombe zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten. pAK749 enthält auch den Triosephosphatisomerase-Promoter-Terminator von S. cerevisiae. Der Promoter und Terminator ähneln denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075) beschrieben sind, da alle Sequenzen, außer die Sequenzen zwischen dem EcoRIXbaI-Fragment, kodierend den YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-MI5-Insulinvorläufer, im Plasmid liegen.
Beispiel 4. Konstruktion des den EEAEPK-X14-Insulinvorläufer exprimierenden Hefestamms yAK866
Ein synthetisches Gen, das für die N-terminale Verlängerung des N-terminal verlängerten Insulinvorläufers EEAEPK-MI1 kodierte, wurden durch Kombinieren von verschiedenen DNA-Fragmenten, die Leader und Verlängerung und X14-Insulinvorläufer kodieren, konstruiert.
Das Plasmid pAK743 wurde mit den Restriktionsendonukleasen BgIII und XbaI geschnitten und das Vektorfragment mit 10757 Nukleotidbasenpaaren unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
Das Plasmid pAK602 wurde mit den Restriktionsendonukleasen HindIII und XbaI und den DNA-Fragmenten mit 232 Nukleotidbasenpaaren unter Verwendung des Gen-Clean-Kti wie beschrieben isoliert.
Das Plasmid pAK729 wurde mit den Restriktionsendonukleasen BgIII und HindIII geschnitten und das DNA-Fragment mit 229 Nukleotiden wurde wie vorstehend beschrieben isoliert.
Die drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Ligase und Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz. Das Plasmid von dem erhaltenen E. coli wurde unter Verwendung von Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und auf Einfügung mit geeigneten Restriktionsendonukleasen überprüft. Es zeigte sich durch DNA-Sequenzanalyse (Sequenase, U.S. Biochemical Corp., USA), dass das selektierte Plasmid die korrekte DNA-Sequenz für die EEAEPK-MI1-Insulinvorläufer-DNA kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader- und Verlängerungs-DNA einfügte. Das Plasmid wurde als pAK866 bezeichnet.
Die DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-X14-Insulinvorläufer-Komplex kodiert, ist in SEQ ID NO 4 dargestellt.
Das Plasmid pAK866 wurde in den Stamm MT663 von S. cerevisiae wie in PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm als yAK866 bezeichnet. Das Hefeexpressionsplasmid pAK866 ist vom C-POT-Typ und ähnelt denjenigen, die in die WO EP 171 142 beschrieben sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces pombe zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten. pAK866 enthält auch den Triosephosphatisomerase-Promoter-Terminator von S. cerevisiae. Der Promoter und Terminator ähneln denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075) beschrieben sind, da alle Sequenzen, außer die Sequenzen zwischen dem EcoRI-XbaI-Fragment, kodierend das YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-X14-Insulinvorläufer, im Plasmid liegen.
SEQ ID NO 1
SEQ D7 NO 5, LA19-Leader
IFORMATION FÜR SEQ ID NO 5:

(i) SEQUENZEIGENSCHAFTEN: (A) LÄNGE: 43 Aminosäuren (B) TYP: Aminosäure (C) TOPOLOGIE: linear
(ii) MOLEKÜLTYP: Peptid
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO 67

Claims

DNA-Konstrukt, das ein Polypeptid mit der folgenden Struktur kodiert: Signalpeptid-Leaderpeptid-EEAEPK-heterologes Protein.
DNA-Konstrukt nach dem vorangehenden Anspruch, wobei das Signalpeptid das Signalpeptid Hefeaspartamprotease 3 (YAP3) oder ein funktionelles Analogon davon ist.
DNA-Konstrukt nach einem der vorangehenden Ansprüche, wobei das Leaderpeptid ein synthetisches Leaderpeptid, vorzugsweise das Leaderpeptid LA19 der SEQ ID NO. 5 hierin ist.
DNA-Konstrukt nach einem der vorangehenden Ansprüche, wobei das heterologe Protein ausgewählt ist aus der Gruppe, bestehend aus Aprotinin, Hemmstoff für den Gewebewachstumsweg oder anderen Proteasehemmstoffen und Insulin oder Insulinvorstufen, Insulinanaloga, insulinartigem Wachstumsfaktor I oder II, menschlichem oder Rinderwachstumshormon, Interleukin, Gewebeplasminogenaktivator, transformierendem Wachstumsfaktor a oder b, Glucagon, glucagonartigem Peptid 1 (GLP-1), glucagonartigem Peptid 2 (GLP-2), GRPP, Faktor VII, Faktor VII, Faktor XIII, Plättchen-abgeleitetem Wachstumsfaktor, Enzymen wie Lipasen oder einem funktionellen Analogon von einem dieser Proteine.
DNA-Konstrukt nach Anspruch 4, wobei das heterologe Protein Insulin oder eine Insulinvorstufe, vorzugsweise ausgewählt aus der Gruppe, bestehend aus M11, B(1-29)-A(1-21); M13, B(1-29)-Ala-Ala-Lys-A(1-21); X14, B(1-27-Asp-Lys)-Ala-Ala-Lys-A(1-21); B(1-29)-Ala-Ala-Arg-A(1-21); M15, B(1-29)-Ser-Asp-Asp-Ala-Lys-A(1-21); und B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21) ist.
DNA-Konstrukt nach Anspruch 4. wobei das heterologe Protein Insulin oder eine Insulinvorstufe, vorzugsweise die Insulinvorstufe M13 oder ein funktionelles Analogon davon ist.
DNA-Konstrukt wie in SEQ ID NO. 1, 2, 3 oder 4 hierin beschrieben.
Rekombinanter Expressionsvektor, der in einer eukaryotischen Zelle replizieren kann und ein DNA-Konstrukt nach einem der vorangehenden Ansprüche trägt.
Rekombinanter Expressionsvektor, der in Hefe replizieren kann und ein DNA-Konstrukt nach einem der Ansprüche 1 bis 7 trägt.
Hefezelle, die ein heterologes Protein exprimieren kann und mit einem Vektor nach Anspruch 9 transformiert ist.
Hefezelle nach Anspruch 10, ausgewählt aus der Spezies Saccharomyces cerevisiae, Saccharomyces kluyveri, Schizosaccharomyces pombe, Saccharomyces uvarum, Kluyveromyces lactis, Hansenula polymorpha, Pichia pastoris, Pichia methanolica, Pichia kluyveri, Yarrowia lipolytica, Candida sp., Candida utilis, Candida cacaoi, Geotrichum sp. und Geotrichum fermentans, vorzugsweise Saccharomyces cerevisiae.
Verfahren zur Herstellung eines heterologen Proteins, umfassend das Züchten einer Hefezelle nach Anspruch 10 oder 11 in einem geeigneten Medium zum Erhalt von Expression und Sekretion des heterologen Proteins, wonach das Protein aus dem Kulturmedium isoliert wird.
Verfahren nach Anspruch 12, wobei die Aminosäuresequenz EEAEPK von dem gewonnenen heterologen Protein durch ein Verfahren entfernt wird, das die Behandlung mit einem proteolytischen Enzym, das für eine basische Aminosäure spezifisch ist, beinhaltet.
Verfahren nach Anspruch 13, wobei das proteolytische Enzym ausgewählt ist aus der Gruppe, bestehend aus Trypsin und der Protease I von Achromobacter lyticus.