-
GEBIET DER
ERFINDUNG
-
Die
vorliegende Erfindung betrifft in einer eukaryotischen Zelle, vorzugsweise
einer Hefezelle, exprimierte und verarbeitete Polypeptide, ein eine
solche Peptide kodierende DNA-Sequenz umfassendes DNA-Konstrukt,
solche DNA-Fragmente tragende Vektoren und Zellen, einschließlich Hefezellen,
die mit den Vektoren transformiert sind, sowie ein Verfahren zur
Herstellung von heterologen Proteinen in Hefe.
-
HINTERGRUND
DER ERFINDUNG
-
Hefeorganismen
produzieren eine Anzahl an Proteinen, die intrazellulär synthetisiert
werden, jedoch eine Funktion außerhalb
der Zellen aufweisen. Solche extrazellulären Proteine werden als sekretierte
Proteine bezeichnet. Diese sekretierten Proteine werden anfänglich innerhalb
der Zelle in einem Vorläufer
oder einer Präform
exprimiert, der/die eine Präsequenz
enthält,
die das wirksame Anordnen des exprimierten Produkts über den
Membranen des endoplasmatischen Retikulums (ER) gewährleist.
Die gewöhnlich
als Signalpeptid bezeichnete Präsequenz
wird im Allgemeinen während
der Translokalisierung von dem gewünschten Produkt abgespalten.
Nach dem Eintritt in den Sekretionsweg wird das Protein zum Golgi-Apparat transportiert.
Vom Golgi-Apparat aus kann das Protein verschiedenen Wegen folgen,
die zu Abteilungen wie der Zellvakuole oder der Zellmembran führen, oder
zum Sekretieren in einem externen Medium aus der Zelle geleitet
werden (Pfeffer, S.R. und Rothman, J.E. Ann. Rev. Biochem. 56 (1987),
829-852).
-
Mehrere
Vorgehensweisen wurden für
die Expression und Sekretion von für Hefe heterologe Proteinen
vorgeschlagen. Die Europäische
Veröffentlichung
Nr. 0088632A beschreibt ein Verfahren, durch welches für Hefe heterologe
Proteine durch Transformieren eines Hefeorganismus mit einem Expressionsvektor,
der eine das gewünschte
Protein und ein Signalpeptid kodierende DNA beinhaltet, Herstellen
einer Kultur aus dem transformierten Organismus, Wachstum der Kultur
und Gewinnen des Proteins aus dem Kulturmedium exprimiert, verarbeitet
und sekretiert werden. Bei dem Signalpeptid kann es sich um das
gewünschte
proteineigene Signalpeptid, ein heterologes Signalpeptid oder ein
Hybrid eines nativen und eines heterologen Signalpeptids handeln.
-
Bei
einem bei der Verwendung von für
Hefe heterologen Signalpeptiden anzutreffenden Problem könnte es
sich darum handeln, dass das heterologe Signalpeptid keine effiziente
Translokalisierung und/oder Abspaltung des Vorläuferpolypeptids nach dem Signalpeptid
gewährleistet.
-
Der
MFα1 (α-Faktor)
von Saccharomyces cerevisiae wird als Präproform mit 165 Aminosäuren synthetisiert,
die ein 19 Aminosäuren
langes Signal- oder Präpeptid,
gefolgt von einem 64 Aminosäuren
langen „Leader-" oder Propeptid,
das drei N-verknüpfte
Glycosylierungsstellen umfasst, gefolgt von (LysArg(Asp/Glu, Ala)2-3α-Faktor)4, umfasst (Kurjan, J. und Herskowitz, I.
Cell 30 (1982), 933-943. Der Signal-Leader-Teil des Präpro-MFα1 wurde weit
verbreitet zum Erhalt der Synthese und Sekretion von heterologen
Proteinen in S. cerevisiae eingesetzt.
-
Die
Verwendung von für
Hefe homologen Signal/Leader-Peptiden ist u. a. aus dem US-Patent
Nr. 4,546,082, den Europäischen
Veröffentlichungen
Nr. 0116201A, 0123294A, 0163529A, 0123289A und dem Europäischen Patent
Nr. 0100561B bekannt.
-
In
EP 0123289A ist
die Verwendung des α-Faktor-Vorläufers von
S. cerevisiae beschrieben, wohingegen
EP
100561 die Verwendung des PH05-Signals von Saccharomyces
cerevisiae und die PCT-Veröffentlichung
Nr. WO 95/02095 die Verwendung des YAP3-Signalpeptids zur Sekretion
von fremden Proteinen beschreibt.
-
US-Patent
Nr. 4,546,082 und die Europäischen
Veröffentlichungen
Nr. 0016201A, 0123294A, 0123544A, 0163529A beschreiben Verfahren,
durch welche der α-Faktor-Signal-Leader
von Saccharomyces cerevisiae (MFα1
oder MFα2)
im Sekretionsverfahren von heterologen Proteinen in Hefe verwendet
wird. Durch Kondensieren einer die MFα1-Signal/Leader-Sequenz von
S. cerevisiae kodierenden DNA-Sequenz an das 5'-Ende des Gens, wurde die gewünschte Proteinsekretion
und Verarbeitung des gewünschten
Proteins gezeigt.
-
EP 206783 offenbart ein System
für die
Sekretion von Polypeptiden von S. cerevisiae, durch welches die α-Faktor-Leadersequenz
verkürzt
wurde, um die vier an der nativen Leadersequenz vorliegenden α-Faktor-Peptide
zu eliminieren, wobei das Leaderpeptid selbst über die α-Faktor-Verarbeitungsstelle Lys-Arg-Glu-Ala-Glu-Ala am heterologen
Polypeptid kondensiert blieb. Dies weist darauf hin, dass diese
Konstruktion zu einem effizienten Verfahren zur Herstellung von
kleineren Peptiden (weniger als 50 Aminosäuren) führt. Für die Sekretion und Verarbeitung
von größeren Polypeptiden
wurde die native α-Faktor-Leadersequenz
verkürzt,
wobei ein oder zwei α-Faktor-Peptide
zwischen dem Leaderpeptid und dem Polypeptid blieben.
-
Eine
Anzahl an sekretierten Proteinen wird derart gesteuert, dass sie
einem proteolytischen Verarbeitungssystem ausgesetzt werden, das
die Peptidbindung am Carboxyende von zwei aufeinander folgenden
basischen Aminosäuren
spalten können.
Die enzymatische Aktivität
wird in S. cerevisiae durch das KEX2-Gen kodiert (Julius, D.A. et
al. Cell 37 (1984b), 1075). Die Verarbeitung des Produkts durch
die KEX2-Protease ist für
die Sekretion des aktiven Paarungsfaktor α1 (MFα1 oder α-Faktor) von S. cerevisiae erforderlich,
jedoch an der Sekretion des aktiven Paarungsfaktors a von S. Cerevisiae
nicht beteiligt.
-
Die
Sektretion und das korrekte Verarbeiten eines zum Sekretieren vorgesehenen
Polypeptids wird in manchen Fällen
beim Züchten
eines Hefeorganismus erhalten, der mit einem wie im vorstehend genannten Quelltext
angegeben konstruierten Vektor transformiert ist. In manchen Fällen ist
jedoch der Sekretionsgrad sehr gering oder es liegt keine Sekretion
vor oder kann die proteolytische Verarbeitung unkorrekt oder unvollständig sein.
Wie in der PCT-Veröffentlichung
Nr. WO 90/10075 beschrieben, wird angenommen, dass dies in gewissem
Maße einer
derart ungenügenden
Freilegung der Verarbeitungsstelle zwischen dem C-terminalen Ende
des Leaderpeptids und dem N-terminalen Ende des heterologen Proteins
geschrieben werden kann, dass sie für proteolytische Spaltung nicht
zugänglich
oder zumindest weniger zugänglich
ist.
-
WO
90/10075 beschreibt ein Hefeexpressionssystem mit einer verbesserten
Verarbeitung eines heterologen Polypeptids, das durch Bereitstellen
von bestimmten Modifikationen in der Nähe der Verarbeitungsstelle
am C-terminalen Ende des Leaderpeptids und/oder am N-terminalen
Ende eines an das Leaderpepptid kondensierten heterologen Polypeptids
erhalten wird. Folglich ist es möglich,
eine höhere
Ausbeute des korrekt verarbeiteten Proteins als mit unmodifizierten
Konstruktionen aus Leaderpeptid und heterologem Polypeptid zu erhalten.
Es ist die Aufgabe der vorliegenden Erfindung, eine neue N-terminale
Modifikation eines an das Leaderpeptid kondensierten heterologen
Polypeptids bereitzustellen, die eine effizientere Expression und/oder Verarbeitung
sowie eine verbesserte Entfernung der N-terminalen Verlängerung
der heterologen Polypeptide in vitro gewährleistet.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Die
vorliegende Erfindung beschreibt als Verlängerungen bezeichnete Modifikationen
des N-terminalen Endes des heterologen Polypeptids, die durch eine
Proteolyse in vitro während
der oder anschließend
an die Reinigung des Produkts aus den Kulturmedium abgespalten werden
können.
-
Die
vorliegende Erfindung betrifft ein Polypeptid mit der folgenden
Struktur kodierendes DNA-Konstrukt:
Signalpeptid-Leaderpeptid-EEAEPK-heterologes
Protein.
-
Der
herkömmliche
einbuchstabige Kode für
Aminosäuren
gemäß den von
der IUPAC-ICB-Komission für
biotechnologische Nomenklatur zugelassenen Regeln (1974) wird innerhalb
dieser Beschreibung und in den Ansprüchen verwendet.
-
Im
vorliegenden Kontext ist der Begriff „Signalpeptid" so zu verstehen,
dass er eine Präsequenz
bedeutet, die als N-terminale Sequenz an der Vorläuferform
eines in Hefe exprimierten extrazellulären Proteins vorliegt. Bei
der Funktion des Signalpeptids handelt es sich um das Gewähren der
Sekretion des heterologen Proteins für den Eintritt in das endoplasmatische
Retikulum. Das Signalpeptid wird im Laufe des Verfahrens gewöhnlich abgespalten.
Das Signalpeptid kann für
den das Protein herstellenden Hefeorganismus heterolog oder homolog
sein. Bei einem bevorzugten Signalpeptid in dieser Erfindung handelt
es sich um das Signalpeptid Hefeaspartamprotease 3 (YAP3) oder ein
beliebiges funktionelles Analogon davon. YAP3 wurde durch Egel-Mitani,
M. et al., YEAST, 6 S. 127-137, 1990 geklont und charakterisiert.
-
Der
Ausdruck „Leaderpeptid" ist so zu verstehen,
dass er ein Peptid in Form einer Propeptidsequenz angibt, bei dessen
Funktion es sich um das Gewähren
der Sekretion des heterologen Proteins handelt, wodurch es vom endoplasmatischen
Retikulum zum Golgi-Apparat und für die Sekretion in das Medium
weiter zu einem Sekretionsvesikel geleitet wird (d.h. die Ausfuhr
des exprimierten Proteins oder Polypeptids über die Zellmembran und, falls
vorliegend, die Zellwand oder zumindest durch die Zellmembran in
den periplasmatischen Raum einer Zelle mit einer Zellwand). Vorzugsweise
handelt es sich bei dem Leaderpeptid um den hier als SEQ ID NO.
5 offenbarten LA19.
-
Der
Ausdruck „heterologes
Protein" soll ein
in der Natur nicht durch den Wirtsorganismus hergestelltes Protein
oder Polypeptid, vorzugsweise ein in der Natur nicht durch Hefe
hergestelltes Polypeptid angeben. Jedoch ist die Herstellung von
homologen Polypeptiden wie Glucagon in einer Säugerzelle für Fachmann nahe liegend, und
die Polypeptide sind in der Bedeutung von „heterologem Protein" eingeschlossen.
-
Die
Sequenz EEAEPK bildet eine Verlängerung
am N-Terminal des heterologen Polypeptids. Diese Verlängerung
erhöht
nicht nur die Fermentationsausbeute, sondern ist auch gegen eine
Verarbeitung durch Dipeptidylaminopeptidase (DPAP A) geschützt, was
zu einem homologen N-Terminal des Polypeptids führt. Die Verlängerung
ist in solcher Weise konstruiert, dass sie während der Fermentation gegen
proteolytische Abspaltung resistent ist, so dass das N-terminal
verlängerte
homologe Proteinprodukt zur anschließenden Reifung in vitro z.B.
durch Trypsin oder Protease I von Achromobacter lyticus aus dem
Kulturmedium gereinigt werden kann. Die gewünschte Entfernung in vitro
der N-terminalen Verlängerung
EEAEPK wird vermutlich aufgrund der Flexibilität des Peptids mit N-terminale
Verlängerung
entweder durch Trypsin oder Protease I von Achromobacter lyticus
leicht erzielt, was zu einer verbesserten Ausbeute des gereiften
heterologen Proteins fuhrt.
-
Die
Erfindung betrifft des Weiteren einen rekombinanten Expressionsvektor,
der in einer eukaryotischen Zelle, vorzugsweise einer Hefezelle
replizieren kann und vorzugsweise ein DNA-Konstrukt der Erfindung
trägt.
Vorzugsweise umfasst das DNA-Konstrukt ein synthetisches Leaderpeptid,
vorzugsweise das LA19-Leaderpeptid.
Außerdem
betrifft die Erfindung das hier in 1 beschriebene
DNA-Konstrukt. Die Erfindung betrifft auch eine eukaryotische Zelle,
vorzugsweise eine Hefezelle, die ein hetrerologes Protein exprimieren
kann und mit einem Vektor der Erfindung transformiert ist.
-
Weiterhin
betrifft die Erfindung ein Verfahren zur Herstellung eines heterologen
Proteins in Hefe, umfassend das Züchten des transformierten Hefestamms
in einem geeigneten Medium zum Erhalt der Expression und Sekretion
des heterologen Proteins, wonach das Protein aus dem Medium isoliert
wird.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
Die
vorliegende Erfindung wird weiter mit Bezug auf die beigefügten Zeichnungen
veranschaulicht, wobei
-
1 das
Expressionsplasmid pAK729 zeigt, das die N-terminal verlängerten
Polypeptide der Erfindung exprimierenden Gene enthält, wobei
die folgenden Symbole verwendet werden:
TPI-PROMOTER bezeichnet
die Promotersequenz des TPI-Gens von S. cerevisiae.
2 bezeichnet
die Region, die ein Signal-/Leaderpeptid (z.B. vom YAP3-Signalpeptid und
LA19-Leaderpeptid zusammen mit dem durch EEAEPK N-terminal verlängerten
MI3-Insulin Vorläufer)
kodiert.
TPI-TERMINATOR bezeichnet die Terminatorsequenz des
TPI-Gens von S. cerevisiae.
TPI-Pombe bezeichnet das TPI-Gen
von S. pombe.
Ursprung bezeichnet eine Sequenz des 2μ-Plasmids
von S. cervisiae, einschließlich
dessen DNA-Replikationsursprung in S. cerevisiae.
AMP-R: Sequenz
von pBR322/pU13, einschließlich
des Ampicillinresistenzgens und eines DNA-Replikationsursprungs
in E. coli.
-
Bei
SEQ ID NO. 1 handelt es sich um die DNA- und Aminosäuresequenzen
in pAK729, die das YAP3-Signalpeptid (Aminosäure Nr. 1 bis 21), das LA19-Leaderpeptid (Aminosäure Nr.
22 bis 64), die N-terminale Verlängerung
EEAEPK (Aminosäure
Nr. 65 bis 70), den MI3-Insulinvoräufer BKette(1-29)-Ala-Ala-Lys-AKette(1-21) (Aminsäure Nr. 71 bis 123) kodieren.
-
Bei
SEQ ID NO. 2 handelt es sich um die DNA- und Aminosäuresequenzen
in pAK733, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI1-Insulinvorläufer-Komplex
von Beispiel 2 kodieren.
-
Bei
SEQ ID NO. 3 handelt es sich um die DNA- und Aminosäuresequenzen
in pAK749, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI5-Insulinvorläufer-Komplex
von Beispiel 3 kodieren.
-
Bei
SEQ ID NO. 4 handelt es sich um die DNA- und Aminosäuresequenzen
in pAK866, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-X14-Insulinvorläufer-Komplex
von Beispiel 4 kodieren.
-
Bei
SEQ ID NO. 5 handelt es sich um die LA19-Leader-DNA-Sequenz.
-
DETAILLIERTE
BESCHREIBUNG DER ERFINDUNG
-
Bei
dem durch das Verfahren der Erfindung hergestellten N-terminal verlängerten
heterologen Protein kann es sich um ein beliebiges Protein handeln,
das vorteilhafterweise in einer eukaryotischen Zelle, vorzugsweise
einer Hefezelle produziert wird. Bei Beispielen für solche
Proteine handelt es sich um Aprotinin, Hemmer für den Gewebefaktorweg und andere
Proteasehemmer und Insulin oder Insulinvorläufer, Insulinanaloga, insulinartigem
Wachstumsfaktor I oder II, menschlichem oder Rinder-Wachstumshormon,
Interleukin, Gewebeplasminogenaktivator, transformierendem Wachstumfaktor
a oder b, Glucagon, glucagonartigem Peptid 1 (GLP-1), glucagonartigem
Peptid 2 (GLP-2), GRPP, Faktor VII, Faktor VIII, Faktor XIII, Plättchen-abgeleitetem Wachstumsfaktor,
Enzyme wie Lipasen oder ein funktionelles Analogon eines beliebigen
dieser Proteine. Im vorliegenden Kontext bedeutet der Begriff „funktionelles
Analogon" der Hinweis
auf ein Polypeptid mit einer ähnlichen
Funktion wie das native Protein (dies soll so zu verstehen sein,
dass eher die Natur als der Grad an biologischer Aktivität des nativen
Proteins gemeint ist). Das Polypeptid kann dem nativen Protein strukturell ähneln und
durch Addition einer oder mehrerer Aminosäuren an eine der beiden oder
beide C- und N-terminale Enden des nativen Proteins, Substitution
einer oder mehrerer Aminosäuren
an einem oder eine Anzahl von verschiedenen Stellen in der nativen
Aminosäuresequenz,
Deletion einer oder mehrerer Aminosäuren an einem der beiden oder
beiden Enden des nativen Proteins oder an einer oder einigen Stellen
in der nativen Aminosäuresequenz
oder Einfügung
einer oder mehrerer Aminosäuren
an einer oder mehrere Stellen in der nativen Aminosäuresequenz
des nativen Proteins abgeleitet sein. Solche Modifikationen sind
für einige
der vorstehend erwähnten
Proteine bekannt.
-
„Ein Insulinvorläufer" oder „ein Vorläufer eines
Insulinanalogons" ist
als einkettiges Polypeptid, einschließlich Proinsulin, zu verstehen,
das durch ein oder mehrere anschließende chemische und/oder enzymatische
Verfahren zu einem zweikettigen Insulin oder Insulinanalogon mit
der korrekten wie in natürlichem menschlichem
Insulin zu findenden Einrichtung der drei Disulfidbrücken umgewandelt
werden kann. Bei Beispielen für
Insuline oder Insulinanaloga, die auf diese Weise hergestellt werden
können,
handelt es sich um menschliches Insulin, vorzugsweise des(B30)-menschliches
Insulin. Schweineinsulin und Insulinanaloga, in welchen mindestens
ein Lys oder Arg vorliegt, vorzugsweise Insulinanaloga, in welchen
PheB1 deletiert wurde, Insulinanaloga, in
welchen die A-Kette und/oder die B-Kette eine N-terminale Verlängerung
aufweisen, und Insulinanaloga, in welchen die A-Kette und/oder die
B-Kette eine C-terminale Verlängerung
aufweisen. Bei anderen bevorzugten Insulinanaloga handelt es sich
um solche, in welchen ein oder mehrere Aminosäurereste, vorzugsweise ein,
zwei oder drei da von durch einen anderen kodierbaren Aminosäurerest
substituiert wurden, Folglich kann ein parentales Insulin an Position
A21 statt Asn einen Aminosäurerest,
ausgewählt
aus der Gruppe, umfassend Ala, Gln, Glu, Gly, His, Ile, Leu, Met,
Ser, Thr, Trp, Tyr oder Val, insbesondere einen Aminosäurerest,
ausgewählt
aus der Gruppe, umfassend Gly, Ala, Ser und Thr, aufweisen. Die
Insulinanaloga können auch
durch eine Kombination der vorstehend umrissenen Veränderungen
modifiziert sein. Gleichermaßen kann
ein parentales Insulin an Postion B28 statt Pro einen Aminosäurerest,
ausgewählt
aus der Gruppe, umfassend Lys usw., und ein parentales Insulin an
Position B29 statt Lys die Aminosäure Pro aufweisen. Der Ausdruck „ein kodierbarer
Aminsosäurerest" bedeutet wie hier
verwendet ein Aminosäurerest,
der durch den genetischen Kode, d.h. ein Triplett („Kodon") von Nukleotiden
kodiert werden kann.
-
Bei
besonders bevorzugten Insulinvorstufen handelt es sich um MI1, B(1-29)-A(1-21); MI3, B(1-29)-Ala-Ala-Lys(1-21)
(wie z.B. beschrieben in
EP 163
529 ); X14, B(1-27-Asp-Lys)-Ala-Ala-Lys-A(1-21) (wie Z.B.
beschrieben in der PCT-Veröffentlichung
Nr. 95/00550); N(1-27-Asp-Lys)-A(1-21; B(1-27-Asp-Lys)-Ser-Asp-Asp-Ala-Lys-A(1-21);
B(1-29)-Ala-Ala-Arg-A(1-21) (wie z.B. beschrieben in der PCT-Veröffentlichung
Nr. 95/07931); MI15, B(1-29)-Ser-Asp-Asp-Ala-Lys-(A1-21) und B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21).
-
Das
das Polypeptid der Erfindung kodierende DNA-Konstruklt der Erfindung
kann durch etablierte Standardverfahren, z.B. das von S.L. Beaucage
und M.H. Caruthers, Tetrahedron Letters 22, 1981, S. 1859-1869 beschriebene
Phosphoamiditverfahren oder das von Matthes et al., EMBO Journal
2, 1984, S. 801-805 beschriebene Verfahren synthetisch hergestellt
werden. Gemäß dem Phosphoamiditverfahren
werden z.B. in einer automatischen DNA-Syntheseapparatur Oligonukleotide
synthetisiert, gereinigt, verdoppelt und unter Bildung des synthetischen
DNA-Konstrukts verbunden. Ein gegenwärtig bevorzugter Weg der Herstellung
des DNA-Konstrukts erfolgt durch eine wie z.B. in Sambrook et al.,
Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, NY,
1989 beschriebene Polymerasekettenreaktion (PCR).
-
Das
DNA-Konstrukt der Erfindung kann auch vom genomischen oder cDNA-Ursprung sein, der
z.B. durch Herstellen einer genomischen oder cDNA-Genbank und Durchmustern
nach das gesamte oder einen Teil des Polypeptids der Erfindung kodierenden
DNA-Sequenzen durch Hybridisierung unter Verwendung von synthetischen
Oligonukleotidsonden gemäß Standardtechniken
(vgl. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold
Spring Harbor, NY, 1989) erhalten wird. In diesem Fall kann eine
ein Signal- und Leaderpeptid kodierende genomische oder cDNA-Sequenz
an eine das heterologe Protein kodierende genomische oder cDNA-Sequenz
gebunden werden, wonach die DNA-Sequenz an einer der Aminosäuresequenz EEAEPK
des Polypeptids entsprechenden Stelle durch Einfügen von die gewünschte Aminosäuresequenz
kodierenden synthetischen Oligonukleotiden zur homologen Rekombination
gemäß bekannten
Verfahren oder vorzugsweise durch Bilden der gewünschten Sequenz durch PCR unter
Verwendung von geeigneten Oligonukleotiden modifiziert werden kann.
-
Schließlich kann
das DNA-Konstrukt vom gemischten synthetischen und genomischen,
gemischten synthetischen cDNA- oder gemischten genomischen und cDNA-Ursprung
sein, der durch Annealen von Fragmenten vom synthetischen, genomischen
oder cDNA-Usprung (wie geeignet), wobei die Fragmente verschiedenen
Teilen des gesamten DNA-Konstrukts entsprechen, gemäß Standardtechniken
hergestellt wird. Folglich kann es vorgesehen sein, dass die das
heterologe Protein kodierende DNA-Sequenz vom genomischen oder cDNA-Ursprung
sein kann, während
die das Signal- und Leaderpeptid kodierende Sequenz sowie die die N-terminale
Verlängerung
EEAEPK kodierende Sequenz synthetisch hergestellt sein kann.
-
In
einem Aspekt betrifft die Erfindung einen rekombinanten Expressionsvektor,
der in Hefe replizieren kann und ein das vorstehend definierte Polypeptid
kodie rendes DNA-Konstrukt trägt.
Bei dem rekombinanten Expressionsvektor kann es sich um einen beliebigen
Vektor handeln, der in Hefeorganismen replizieren kann. Im Vektor
sollte die das Polypeptid der Erfindung kodierende DNA-Sequenz funktionsfähig an eine
geeignete Promotersequenz gebunden sein. Bei dem Promoter kann es
sich um eine beliebige DNA-Sequenz handeln, die Transkriptionsaktivität in Hefe
zeigt und von Proteine für
Hefe entweder homolog oder heterolog kodierenden Genen abgeleitet
sein kann. Der Promoter ist vorzugsweise von einem ein Protein für Hefe heterolog
kodierenden Gen abgeleitet. Bei Beispielen für geeignete Promoter handelt
es sich um die Mα1-,
TPU-, ADH- oder PGK-Promoter.
-
Die
das Polypeptid der Erfindung kodierende DNA-Sequenz kann auch funktionsfähig an einen
geeigneten Terminator, z.B. den TPI-Terminator gebunden sein (vgl.
T. Alber und G. Kawasaki, J. Mol. Appl. Genet. 1, 1982, S. 419-434).
-
Der
rekombinante Expressionsvektor der Erfindung umfasst eine die Replikation
des Vektors in Hefe ermöglichende
DNA-Sequenz. Bei Beispielen für
solche Sequenzen handelt es sich um die 2μ-Replikationsgene REP 1-3 und
den Replikationsursprung des Hefeplasmids. Der Vektor kann auch
eine geeignete Markierung, z.B. das wie von R.T. Russel, Gene 40,
1985, S. 125-130, beschriebene TPI-Gen von Schizosaccharomyces pombe umfassen.
-
Die
zum Verbinden der das Polypeptid der Erfindung kodierenden DNA-Sequenzen, des Promoters bzw.
des Terminators und deren Einfügen
in geeignete Hefevektoren, die die zur Hefereplikation nötige Information
enthalten, sind dem Fachmann bekannt (vgl. z.B. Sambrook et al.,
vorstehend genannt). Es ist klar, dass der Vektor konstruiert werden
kann, indem zuerst ein DNA-Konstrukt, das die gesamte für das Polypeptid der
Erfindung kodierende DNA-Sequenz enthält, hergestellt und dieses
Fragment anschließend
in einen geeigneten Expressionsvektor eingefügt wird, oder DNA-Fragmente,
die die genetische Information für
die einzelnen Elemente enthalten (wie das Signal-, Leader- oder
heterologe Protein) sequentiell eingefügt werden, gefolgt von Verbinden.
-
Bei
dem Hefeorganismus oder der eukaryotischen Wirtszelle, die im Verfahren
der Erfindung verwendet werden, kann es sich um jeden beliebigen
geeigneten Wirtsorganismus handeln, der beim Züchten große Mengen des heterologen Proteins
oder fraglichen Polypeptids herstellt. Bei Beispielen für geeignete
Hefeorganismen kann es sich um Stämme handeln, die aus den Hefespezien
Saccharomyces cerevisiae, Saccharomyces kluyveri, Schizosaccharomyces
pombe, Saccharomyces uvarum, Kluyveromyces lactis, Hansenula polymorpha,
Pichia pastoris, Pichia methanolica, Pichia kluyveri, Yarrowia lipolytica,
Candida sp., Candida utilis, Candida cacaoi, Geotrichum sp. und
Geotrichum fermentans, vorzugsweise der Hefespezies Saccharomyces cerevisiae
ausgewählt
sind. Es ist für
den Fachmann deutlich klar, jede beliebige andere eukaryotische
Zelle wie Zellen der Gattung Aspergillus, Streptomyces, Insektenzellen
oder Säugerzellen
als Wirtsorganismus auszuwählen.
-
Die
Transformation der Hefezellen kann z.B. durch Protoplastbildung,
gefolgt von Transformation in an sich bekannter Weise bewirkt werden.
Bei dem zum Züchten
der Zellen verwendeten Medium kann es sich um jedes beliebige herkömmliche
Medium handeln, das für
das Wachstum von Hefeorganismen geeignet ist. Das sekretierte heterologe
Protein, wobei ein beträchtlicher
Anteil davon im Medium in korrekt verarbeiteter Form vorliegt, kann
durch herkömmliche
Verfahren, einschließlich
Abtrennen der Hefezellen von dem Medium durch Zentrifugation oder
Filtration, Ausfällen
der proteinhaltigen Komponenten des Überstands oder Filtrats mittels eines
Salzes, z.B. Ammoniumsulfat, gefolgt von Reinigung durch eine Vielzahl
von chromatographischen Verfahren, z.B. Ionenaustauschchromatographie,
Affinitätschromatographie
oder dergleichen aus dem Medium gewonnen werden. Wird das Protein
in den periplasmatischen Raum sekretiert, werden die Zellen enzymatisch oder
mechanisch zerstört.
-
Nach
der Sekretion in das Kulturmedium oder den periplasmatischen Raum
kann das Protein zum Entfernen der Sequenz EEAEPK verschiedenen
Verfahren unterzogen werden.
-
Es
wurde gefunden, dass die Verlängerung
während
der Fermentation am heterologen Protein stabil angelagert ist, wodurch
das N-Terminal des heterologen Protein gegen die proteolytische
Aktivität
von Hefeproteasen wie DPAP geschützt
wird. Die Gegenwart einer N-terminalen Verlängerung am heterologen Protein kann
als Schutz der N-terminalen Aminogruppe des heterologen Proteins
während
der chemischen Verarbeitung des Proteins, d.h. als Ersatz für ein BOC
oder eine ähnliche
Schutzgruppe dienen. In solchen Fällen kann die Aminosäuresequenz
EEAEPK mittels eines für
eine basische Aminosäure
(d.h. K (Lys)) spezifischen proteolytischen Enzyms vom gewonnenen
heterologen Protein entfernt werden, sodass die terminale Verlängerung
an K abgespalten wird. Bei Beispielen für solche proteolytischen Enzyme
handelt es sich um Trypsin oder Protease I von Achromobacter lyticus.
-
Die
vorliegende Erfindung wird detaillierter in den folgenden Beispielen
beschrieben, die den beanspruchten Umfang der Erfindung in keinster
Weise einschränken
sollen.
-
Beispiel 1. Konstruktion
des den EEAEPK-MI3-Insulinvorläufer
exprimierenden Hefestamms yAK729
-
Ein
synthetisches Gen, das für
die N-terminale Verlängerung
des N-terminalverlängerten
Insulinvorläufers
EEAEPK-MI3 kodierte, wurde unter Verwendung der Polymerasekettenreaktion
(PCR) konstruiert.
-
Die
folgenden 2 Oligonukleotide wurden synthetisiert:
#672 5' -TCTCCATGGCTAAGAGAGAAGAAGCTGAACCAAAGTTCGTT-3'
#2785 5' -AATTTATTTTACATAACACTAG-3'
-
Oligonukleotide
wurden unter Verwendung einer automatischen DNA-Syntheseapparatur (Applied Biosystems
Modell 380A) unter Verwendung von Phosphoramiditchemie und im Handel
erhältlichen
Reagenzien (Beaucage, S.L. and Caruthers, M.H., Tetrahedron letters
22 (1981) 1859-1869) synthetisiert.
-
Die
folgende PCR wurde unter Verwendung der Pwo-DNA-Polymerase (Boahringer
Mannheim GmbH, Sandhoefter Strasse 116, Mannheim, Deutschland) gemäß den Anweisungen
des Herstellers durchgeführt, und
das PCR-Gemisch wurde mit 100 μl
Mineralöl
(Sigma Chemical Co., St. Louis MO, USA) überschichtet.
-
PCR
-
- 5 μl
Oligonukleotid # 672 (50 pmol)
- 5 μl
Oligonukleotid #2785 (50 pmol)
- 10 μl
10X PCR-Puffer
- 8 μl
dNTP-Gemisch
- 0,5 μl
Pwo-Enzym
- 0,5 μl
pAK680-Plasmid als Templat (0,2 ug DNA)
- 71 μl
destilliertes Wasser
-
Insgesamt
12 Zyklen wurden durchgeführt,
bei einem Zyklus handelte es sich um 94°C für eine Dauer von 45 Sekunden,
40°C für eine Dauer
von 1 Minute, 72°C
für eine
Dauer von 1,5 Minuten. Das PCR-Gemisch wurde dann auf ein 2,5 %iges
Agarosegel geladen, und eine Elektrophorese wurde unter Verwendung
von Standardtechniken durchgeführt
(Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold
Spring harbour Laboratory Press, 1989). Das erhaltene DNA-Fragment wurde aus
dem Agarosegel geschnitten und durch den Gen-Clean-Kit (Bio 101
Inc., PO BOX 2284, La Jolla, CA 92038, USA) gemäß den Anweisungen des Herstellers
isoliert.
-
Das
gereinigte PCR-DNA-Fragment wurde in 14 μl Wasser und Restriktionsendonukleasepuffer
gelöst und
mit den Restriktionsendonukleasen NcoI und XbaI gemäß Standardtechniken
(Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold
Spring Harbour Laboratory Press, 1989) geschnitten. Das NcoI-XbaI-DNA-Fragment
auf 209 Nukleotidbasenpaaren wurde einer Agaroseelektrophorese unterzogen
und unter Verwendung des Gen-Clean-Kit wie beschrieben gereinigt.
-
Das
Plasmid pAK721 (siehe 1) wurde mit den Restriktionsendonukleasen
BgIII und XbaI geschnitten und das Vektorfragment mit 10849 Nukleotidbasenpaaren
unter Verwendung des Gen-Clean- Kit wie beschrieben isoliert. Das
Plasmid pAK721 wurde dann mit den Restriktionsendonukleasen BgIII
und NcoI geschnitten und das DNA-Fragment mit 160 Nukleotidbasenpaaren
unter Verwendung des Gen-Clean- Kit wie beschrieben isoliert. Die
drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Ligase und
Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander
verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm
von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz.
-
Das
Plasmid des erhaltenen E. coli wurde unter Verwendung von Standardtechniken
(Sambrook J, Fritsch EF und Maniatis T, Molekular Cloning, Cold
Spring Harbour Laboratory Press, 1989) isoliert und auf die Einfügung mit
geeigneten Restriktionsendonukleasen d.h. NcoI und XbaI überprüft. Es zeigte
sich durch DNA-Sequenzanalyse (Sequenase, U.S. Biochemical Corp.,
USA) dass das selektierte Plasmid die korrekte DNA-Sequenz für die EEAEPK-MI3-Insulinvorläufer-DNA kodierte und
nach dem DNA-Kodieren die synthetische LA19-Leader-DNA eingefügt wurde.
Das Plasmid wurde als pAK729 bezeichnet.
-
Die
DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI3-Insulinvorläufer-Komplex kodierte,
ist in SEQ ID NO. 1 dargestellt.
-
Das
Plasmid pAK721 wurde in den Stamm MT663 von S. cerevisiae wie in
PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm
als yAK721 bezeichnet.
-
Das
Hefeexpressionsplasmid pAK729 ist vom C-POT-Typ (siehe
1)
und ähnelt
denjenigen, die in WO
EP171 142 beschrieben
sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces pombe
zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten.
pAK729 enthält
auch den Triosephosphatisomerase-Promoter-Terminator von S. cerevisae.
Der Promoter und Terminator ähneln
denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075)
beschrieben sind, da alle Sequenzen außer die Sequenzen zwischen
dem EcoRIXbaI-Fragment, kodierend den YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-MI3-Insulinvorläufer, im
Plasmid liegen.
-
Beispiel 2. Konstruktion
des den EEAEPK-MI1-Insulinvorläufer
exprimierenden Hefestamms yAK733
-
Ein
synthetisches Gen, das für
die N-terminale Verlängerung
des N-terminal verlängerten
Insulinvorläufers
EEAEPK-MI1 kodierte, wurden durch Kombinieren von verschiedenen
DNA-Fragmenten, die Leader und Verlängerung und Insulinvorläufer kodieren,
konstruiert.
-
Das
Plasmid pAK721 (siehe 1) wurde mit den Restriktionsendonukleasen
BgIII und XbaI geschnitten und das Vektorfragment mit 10849 Nukleotidbasenpaaren
unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
-
Das
Plasmid pAK730 wurde mit den Restriktionsendonukleasen HindIII und
XbaI und den DNA-Fragmenten mit 131 Nukleotidbasenpaaren unter Verwendung
des Gen-Clean-Kit wie beschrieben isoliert.
-
Das
Plasmid pAK729 wurde mit den Restriktionsendonukleasen BgIII und
HindIII geschnitten und das DNA-Fragment mit 229 Nukleotiden wurde
wie vorstehend beschrieben isoliert.
-
Die
drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Ligase und
Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander
verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm
von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz.
Das Plasmid von dem erhaltenen E. coli wurde unter Verwendung von
Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und
auf Einfügung
mit geeigneten Restriktionsendonukleasen überprüft. Es zeigte sich durch DNA-Sequenzanalyse
(Sequenase, U.S. Biochemical Corp., USA), dass das selektierte Plasmid
die korrekte DNA-Sequenz für
die EEAEPK-MI1-Insulinvorläufer-DNA
kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader-
und Verlängerungs-DNA
eingefügt
wurde. Das Plasmid wurde als pAK733 bezeichnet.
-
Die
DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI1-Insulinvorläufer-Komplex kodiert,
ist in SEQ ID NO 2 dargestellt.
-
Das
Plasmid pAK733 wurde in den Stamm MT663 von S. cerevisiae wie in
PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm
als yAK733 bezeichnet. Das Hefeexpressionsplasmid pAK733 ist vom
C-POT-Typ (siehe
1) und ähnelt denjenigen, die in die
WO
EP 171 142 beschrieben
sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces
pombe zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten.
pAK733 enthält auch
den Triosephosphatisomerase-Promoter-Terminator von S. cerevisiae.
Der Promoter und Terminator ähneln
denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075)
beschrieben sind, da alle Sequenzen außer die Sequenzen zwischen
dem EcoRIXbaI-Fragment, kodierend den YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-MI3-Insulinvorläufer, im
Plasmid liegen.
-
Beispiel 3. Konstruktion
des den EEAEPK-MI5-Insulinvorläufer
exprimierenden Hefestamms yAK749
-
Ein
synthetisches Gen, das für
die N-terminale Verlängerung
des N-terminal verlängerten
Insulinvorläufers
EEAEPK-MI1 kodierte, wurden durch Kombinieren von verschiedenen
DNA-Fragmenten, die Leader und Verlängerung und Insulinvorläufer kodieren,
konstruiert.
-
Das
Plasmid pAK743 wurde mit den Restriktionsendonukleasen BgIII und
XbaI geschnitten und das Vektorfragment mit 10757 Nukleotidbasenpaaren
unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
-
Das
Plasmid pAK405 wurde mit den Restriktionsendonukleasen HindIII und
XbaI und den DNA-Fragmenten mit 238 Nukleotidbasenpaaren unter Verwendung
des Gen-Clean-Kti wie beschrieben isoliert.
-
Das
Plasmid pAK729 wurde mit den Restriktionsendonukleasen BgIII und
HindIII geschnitten und das DNA-Fragment mit 229 Nukleotiden wurde
wie vorstehend beschrieben isoliert.
-
Die
drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Lipase und
Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander
verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm
von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz.
Das Plasmid von dem erhaltenen E. coli wurde unter Verwendung von
Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und
auf Einfügung
mit geeigneten Restriktionsendonukleasen überprüft. Es zeigte sich durch DNA-Sequenzanalyse
(Sequenase, U.S. Biochemical Corp., USA), dass das selektierte Plasmid
die korrekte DNA-Sequenz für
die EEAEPK-MI1-Insulinvorläufer-DNA
kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader-
und Verlängerungs-DNA
eingefügt
wurde. Das Plasmid wurde als pAK749 bezeichnet.
-
Die
DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-MI1-Insulinvorläufer-Komplex kodiert,
ist in SEQ ID NO 3 dargestellt.
-
Das
Plasmid pAK749 wurde in den Stamm MT663 von S. cerevisiae wie in
PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm
als yAK749 bezeichnet. Das Hefeexpressionsplasmid pAK749 ist vom
C-POT-Typ (siehe
1) und ähnelt denjenigen, die in die
WO
EP 171 142 beschrieben
sind, die das Triosephosphatisomerasegen (POT) von Schizosaccharomyces
pombe zur Plasmidauswahl und Stabilisierung in S. cerevisiae enthalten.
pAK749 enthält
auch den Triosephosphatisomerase-Promoter-Terminator von S. cerevisiae.
Der Promoter und Terminator ähneln
denjenigen, die im Plasmid pKFN1003 (beschrieben in WO 90/100075)
beschrieben sind, da alle Sequenzen, außer die Sequenzen zwischen
dem EcoRIXbaI-Fragment, kodierend den YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-MI5-Insulinvorläufer, im
Plasmid liegen.
-
Beispiel 4. Konstruktion
des den EEAEPK-X14-Insulinvorläufer
exprimierenden Hefestamms yAK866
-
Ein
synthetisches Gen, das für
die N-terminale Verlängerung
des N-terminal verlängerten
Insulinvorläufers
EEAEPK-MI1 kodierte, wurden durch Kombinieren von verschiedenen
DNA-Fragmenten, die Leader und Verlängerung und X14-Insulinvorläufer kodieren,
konstruiert.
-
Das
Plasmid pAK743 wurde mit den Restriktionsendonukleasen BgIII und
XbaI geschnitten und das Vektorfragment mit 10757 Nukleotidbasenpaaren
unter Verwendung des Gen-Clean-Kit wie beschrieben isoliert.
-
Das
Plasmid pAK602 wurde mit den Restriktionsendonukleasen HindIII und
XbaI und den DNA-Fragmenten mit 232 Nukleotidbasenpaaren unter Verwendung
des Gen-Clean-Kti wie beschrieben isoliert.
-
Das
Plasmid pAK729 wurde mit den Restriktionsendonukleasen BgIII und
HindIII geschnitten und das DNA-Fragment mit 229 Nukleotiden wurde
wie vorstehend beschrieben isoliert.
-
Die
drei DNA-Fragmente wurden unter Verwendung von T4-DNA-Ligase und
Standardbedingungen (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) miteinander
verbunden. Das Bindungsgemisch wurde dann in einen kompetenten Stamm
von E. coli (R-, M+) transformiert, gefolgt von Selektion mit Ampicillinresistenz.
Das Plasmid von dem erhaltenen E. coli wurde unter Verwendung von
Standardtechniken (Sambrook J, Fritsch EF und Maniatis T, Molekular
Cloning, Cold Spring Harbour Laboratory Press, 1989) isoliert und
auf Einfügung
mit geeigneten Restriktionsendonukleasen überprüft. Es zeigte sich durch DNA-Sequenzanalyse
(Sequenase, U.S. Biochemical Corp., USA), dass das selektierte Plasmid
die korrekte DNA-Sequenz für
die EEAEPK-MI1-Insulinvorläufer-DNA
kodierte und nach dem DNA-Kodieren die synthetische LA19-Leader-
und Verlängerungs-DNA
einfügte.
Das Plasmid wurde als pAK866 bezeichnet.
-
Die
DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEAEPK-X14-Insulinvorläufer-Komplex kodiert,
ist in SEQ ID NO 4 dargestellt.
-
Das
Plasmid pAK866 wurde in den Stamm MT663 von S. cerevisiae wie in
PCT/DK95/00250 beschrieben transformiert und der erhaltene Stamm
als yAK866 bezeichnet. Das Hefeexpressionsplasmid pAK866 ist vom
C-POT-Typ und ähnelt
denjenigen, die in die WO
EP 171
142 beschrieben sind, die das Triosephosphatisomerasegen
(POT) von Schizosaccharomyces pombe zur Plasmidauswahl und Stabilisierung
in S. cerevisiae enthalten. pAK866 enthält auch den Triosephosphatisomerase-Promoter-Terminator
von S. cerevisiae. Der Promoter und Terminator ähneln denjenigen, die im Plasmid
pKFN1003 (beschrieben in WO 90/100075) beschrieben sind, da alle
Sequenzen, außer
die Sequenzen zwischen dem EcoRI-XbaI-Fragment, kodierend das YAP3-Signalpeptid-LA19-Leaderpeptid-EEAEPK-X14-Insulinvorläufer, im
Plasmid liegen.
-
-
-
-
-
-
SEQ D7 NO 5, LA19-Leader
-
IFORMATION
FÜR SEQ
ID NO 5:
- (i) SEQUENZEIGENSCHAFTEN:
(A)
LÄNGE:
43 Aminosäuren
(B)
TYP: Aminosäure
(C)
TOPOLOGIE: linear
- (ii) MOLEKÜLTYP:
Peptid
- (xi) SEQUENZBESCHREIBUNG: SEQ ID NO 67