DK166784B1 - Rekombinant dna-sekvens, en mikroorganisme indeholdende sekvensen og en fremgangsmaade til fremstilling af et eucaryot protein - Google Patents

Rekombinant dna-sekvens, en mikroorganisme indeholdende sekvensen og en fremgangsmaade til fremstilling af et eucaryot protein Download PDF

Info

Publication number
DK166784B1
DK166784B1 DK088881A DK88881A DK166784B1 DK 166784 B1 DK166784 B1 DK 166784B1 DK 088881 A DK088881 A DK 088881A DK 88881 A DK88881 A DK 88881A DK 166784 B1 DK166784 B1 DK 166784B1
Authority
DK
Denmark
Prior art keywords
sequence
protein
segment
dna
expression
Prior art date
Application number
DK088881A
Other languages
English (en)
Other versions
DK88881A (da
Inventor
William J Rutter
Original Assignee
Univ California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ California filed Critical Univ California
Publication of DK88881A publication Critical patent/DK88881A/da
Application granted granted Critical
Publication of DK166784B1 publication Critical patent/DK166784B1/da

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/61Fusion polypeptide containing an enzyme fusion for detection (lacZ, luciferase)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/74Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor
    • C07K2319/75Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor containing a fusion for activation of a cell surface receptor, e.g. thrombopoeitin, NPY and other peptide hormones

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Endocrinology (AREA)
  • Diabetes (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)

Description

DK 166784 B1
Opfindelsen angår en hidtil ukendt rekombinant DNA-sekvens omfattende tre ikke naturligt sammenhængende segmenter, hvilken sekvens er ejendommelig ved det i krav 1's kendetegnende del angivne, en mikroorganisme, der er ejendommelig ved, at den indeholder denne DNA-sekvens samt en fremgangsmåde til fremstilling af et færdigudviklet, eucaryot protein, 5 hvilken fremgangsmåde er ejendommelig ved det i krav 3's kendetegnende del angivne.
De nævnte tre segmenter er følgende: Et segment, der koder for et ønsket eucaryot protein; et segment, der koder for en specifik spaltningssekvens på mindst to aminosyrer; og et segment, der koder for et rensningspeptid i form af et polykationisk, polyanionisk eller hydrofobt peptid.
10 Spaltningssekvensen spaltes specifikt af enterokinase og/eller kallikrein B og/eller chymosin.
Nylige fremskridt i biokemien og rekombinant-DNA-teknologien har gjort det muligt at gennemføre syntesen af specifikke eucaryote proteiner under kontrollerede betingelser uafhængigt af de højere organismer, hvorfra de normalt isoleres. Sådanne biokemiske syntetiske metoder gør 15 brug af enzymer og subcellulære komponenter af proteinsyntesemaskineriet i levende celler, enten in vitro i cellefrie systemer eller in vivo i mikroorganismer. I begge tilfælde er nøgleelementet tilvejebringelsen af en specifik DNA-sekvens, som indeholder den fornødne information til specifikation af den ønskede aminosyresekvens. Et sådant specifikt DNA betegnes her et DNA-kodningssegment. Det kodningsforhold, hvorved en DNA-sekvens benyttes til specifika-20 tion af aminosyresekvensen af et protein er kort beskrevet nedenfor og arbejder i overensstemmelse med et fundamentalt sæt principper, gennem hele det kendte rige for levende organismer.
Klonet DNA kan benyttes til specifikation af aminosyresekvensen af proteiner, som er synteti-25 seret af systemer in vitro. DNA-styrede proteinsyntesesystemer er velkendte i teknikken, se f.eks. Zubay, G., Ann. Rev. Genetics, b. 7, s. 267, (1973). Desuden kan enkeltstrenget DNA bringes til at virke som messenger-RNA in vitro, hvilket resulterer i en høj pålidelighed i translationen af DNA-sekvensen (Salas, J. m.fl., J. Biol. Chem., b. 243, s. 1012, (1968). Anden velkendt teknik kan benyttes i kombination med ovenstående procedure til forøgelse af udbyt-30 terne.
Udviklingen i rekombinant-DNA-teknologien har gjort det muligt at isolere specifikke gener eller dele deraf fra højere organismer såsom mennesker og andre pattedyr og at overføre generne eller fragmenterne til mikroorganismer såsom bakterier eller gær. Det overførte gen replikeres 35 og propageres, idet den transformerede mikroorganisme replikeres.
Som et resultat heraf kan den transformerede mikroorganisme blive udstyret med den egenskab at fremstille et hvilket som helst protein, som genet eller fragmentet koder, hvad enten det 2 DK 166784 B1 er et enzym, et hormon eller antigen eller et antistof eller en del deraf. Mikroorganismen videregiver denne evne til sit afkom, så at transformationen i virkeligehden har resulteret i en ny stamme med den beskrevne evne, se f.eks. Ullrich, A. m.fl., Science, b. 196, s. 1313, (1977) og Seeburg, P.H. m.fl., Nature, b. 270, s. 406, (1977). En til grund liggende omstændighed for 5 anvendelsen af denne teknologi til praktiske formål er, at DNA i alle levende organismer fra mikrober til mennesker er kemisk beslægtet, nemlig sammensat af de same fire nucleotider.
De væsentlige forskelle ligger i sekvensen af disse nucleotider i polymer-DNA-molekylet. Nu-cleotidsekvenseme benyttes til specifikation af aminosyresekvenseme for organismens protei ner. Skønt de fleste af proteinerne fra forskellige organismer adskiller sig indbyrdes, er kod-10 ningsforholdet mellem nucleotidsekvens og aminosyresekvens fundamentalt det samme for alle organismer. F.eks. vil den samme nucleotidsekvens, som er kodningssegmentet for ami-nosyresekvensen af humant væksthormon i humane hypofyseceller ved transformation til en mikroorganisme blive genkendt som kodende forden samme aminosyresekvens.
15 De her benyttede forkortelser fremgår af tabel 1.
Tabel 1 20 DNA = deoxyribonucleinsyre A = adenin RNA = ribonucleinsyre T = thymin cDNA = komplementært DNA G = guanin 25 (enzymatisk syntetiseret ud fra C = CytOSin en mRNA-sekvens) U = uracil mRNA = messenger-RNA ATP = adenosintriphosphat dATP = deoxyadenosintriphosphat TTP = thymidintriphosphat dCTP = deoxycytidintriphosphat EDTA = ethylendiamintetraeddikesyre 30
Kodningsforholdet mellem nucleotidsekvens i DNA og aminosyresekvens i protein kendes kollektivt som den genetiske kode, som fremgår af tabel 2.
35 3 DK 166784 B1
Tabel 2 Genetisk kode
5 Phenylalanin (Phe) TTK Histidin (His) CAK
Leucin (Leu) XTY Glutamin (Gin) CAJ
Isoleucin (Ile) ATM Asparagin (Asn) AAK
Methionin (Met) ATG Lysin (Lys) AAJ
Valin (Val) GTL Asparaginsyre (Asp) GAK
10 Serin (Ser) QRS Glutaminsyre (Glu) GAJ
Prolin (Pro) CCL Cystein (Cys) TGK
Threonin (Thr) ACL Tryptophan (Try) TGG
Alanin (Ala) GCL Arginin (Arg) WGZ
Tyrosin (Tyr) TAK Glycin (Gly) GGL
15 Endesignal TAJ
Endesignal TGA
Nøgle: hver 3-bogstavs-DNA-triplet svarer til et trinucleotid i mRNA med en 5'-ende til venstre og en 3'-ende til højre. Alle her anførte DNA-sekvenser er sådanne af den streng, hvis sekvens 20 svarer til mRNA-sekvensen, idet thymin er benyttet i stedet for uracil. Bogstaverne står for de purin- eller pyrimidinbaser, som danner DNA-sekvensen.
A = adenin G = guanin
25 C = cytosin J = A eller G
T = thymin K = T eller C
X = T eller C, hvis Y er A eller G L = A, T, C eller G
X = C, hvis Y er C eller T M = A, C eller T
Y = A, G, C eller T, hvis X er C
30 Y = A eller G, hvis X er T
W = C eller A, hvis Z er A eller G
W = C, hvis Z er C eller T
Z = A, G, C eller T, hvis WerC
Z = A eller G, hvis W er A
35 QR = TC, hvis S er A, G, C eller T
QR = AG, hvis S er T eller C
S = A, G, C eller T, hvis QR er TC
S = T eller C, hvis QR er AG
4 DK 166784 B1
Et vigtigt træk ved koden er til de foreliggende formål den omstændighed, at hver aminosyre er specificeret ved en trinucleotidsekvens, også betegnet en nucleotidtriplet. De phosphodiester-bindinger, som forener nabotripletter, er kemisk uskelnelige fra alle andre intemucleotidbindin-ger i DNA. Derfor kan nucleotidsekvensen ikke læses til at kode for en ganske bestemt amino-5 syresekvens uden yderligere oplysninger til bestemmelse af læserammen, hvilket er det udtryk, som benyttes til angivelse af den gruppe af tripletter, som bruges af cellen ved afkodning af det genetiske budskab.
I procaryote celler forudgås de endogene kodningssegmentertypisk af nucleotidsekvenser med 10 funktioner som initiator for transskription (mRNA-syntese) og initiator for translation (proteinsyntese), betegnet henholdsvis promotor og ribosomalbindingssite. Kodningssegmentet begynder omkring 3-11 nucleotider fra ribosomalbindingssitet. Det nøjagtige antal nucleotider, som kommer ind imellem ribosomalbindingssitet og initieringscodonen i kodningssegmentet synes ikke at være kritisk for translation af kodningssegmentet i korrekt læseramme. Udtrykket 15 "ekspressionskontrolsegment" benyttes her til angivelse af nucleotidsekvenserne omfattende en promotor, ribosomalbindingssite og en 3-11-nucleotidafstandsgruppe (spacer) efterfølgende det ribosomale bindingssite. I eucaryote celler kan reguleringen af transskription og translation være noget mere kompliceret, men gør også brug af sådanne nucleotidsekvenser.
20 Mange slags rekombinant-DNA-teknik omfatter to klasser af forbindelser, transfervektorer og restriktionsenzymer, som skal blive omtalt. En transfervektor er et DNA-molekyle, som blandt andet indeholder genetisk information, som sikrer sin egen replikation efter overførsel til en c/ værtsmikroorganismestamme. Eksempler på transfervektorer, som benyttes almindeligt i bakteriegenetik, er plasmider og DNA'et af visse bakteriophager. Skønt plasmider er blevet benyt-25 tet som transfervektorer ved det her beskrevne arbejde, vil det forstås, at andre typer af transfervektorer kan benyttes. Plasmid er det udtryk, som benyttes om enhver autonomt replike-rende DNA-enhed, som kan findes i en mikrobecelle, bortset fra genomet af værtscellen selv.
Et plasmid er ikke genetisk bundet til chromosomet af værtscellen. Plasmid-DNA'er eksisterer som dobbeltstrengede ringstrukturer, som normalt er af størrelsesordenen nogle få millioner 30 dalton i molekylvægt, skønt nogle er større end 108 dalton i molekylvægt. De repræsenterer normalt kun en lille procentdel af cellens totale DNA. Transfer-vektor-DNA er normalt separer-bart fra værtscelle-DNA i kraft af den store forskel mellem deres størrelser. Transfervektorer bærer genetisk information, som gør det muligt for dem at replikeres inde i værtscellen, i de fleste tilfælde uafhængigt af hastigheden for værtscelledelingen. Nogle plasmider har den 35 egenskab, at deres replikationshastighed kan kontrolleres af forskeren ved variationer i vækstbetingelserne. Ved en passende teknik kan plasmid-DNA-ringen åbnes, et fragment af heterologt DNA indsættes, og ringen lukkes igen, hvorved der dannes et forøget molekyle omfattende det indsatte DNA-segment. Bakteriophag-DNA kan bære et segment af heterologt DNA indsat i 5 DK 166784 B1 stedet for visse ikke-essentielle phaggener. I begge tilfælde tjener transfervektoren som bærer eller vektor for et indsat fragment af heterologt DNA.
Transferering udføres ved en proces, der kendes som transformation. Under transformation 5 inkorporerer værtsceller blandet med plasmid-DNA hele plasmidmolekyler i cellen. Skønt mekanismen ved processen ikke er klarlagt, er det muligt at maximere den andel af værtsceller, som er i stand til at optage plasmid-DNA og således at transformeres, ved hjælp af visse empirisk bestemte behandlinger. Når først en celle har inkorporeret et plasmid, replikeres dette inde i cellen, og plasmidkopieme fordeles til dattercellerne, når cellerne deler sig. Enhver ge-10 netisk information, som indeholdes i plasmid-DNA'ets nucleotidsekvens, kan principielt ekspri-meres i værtscellen. Typisk genkendes en transformeret værtscelle ved sin erhvervelse af egenskaber, som bæres af plasmidet, såsom resistens mod visse antibiotika. Forskellige plasmider kan genkendes gennem deres forskellige egenskaber eller kombination af de egenskaber, som de overfører på den værtscelle, som indeholder dem. Ethvert givet plasmid kan 15 fremstilles i mængde ved dyrkning af en ren kultur af celler indeholdende plasmidet og isolation af plasmid-DNA'et derfra.
Restriktionsendonucleaser er hydrolytiske enzymer, som er i stand til at katalysere sitespecifik spaltning af DNA-molekyler. Restriktionsendonucleasevirkningen afhænger af eksistensen af 20 den specifikke nucleotidsekvens. En sådan sekvens betegnes genkendelsessitet for restriktionsendonucleasen. Restriktionsendonucleaser fra en række kilder er blevet isoleret og karakteriseret ved hjælp af nucleotidsekvensen af deres genkendelessite. Nogle restriktionsendonucleaser hydrolyserer phosphodiesterbindingeme på begge strenge i samme punkt, hvorved der fremkommer stumpe ender. Andre katalyserer hydrolyse af bindinger, som er skilt fra 25 hinanden ved nogle få nucleotider, hvorved der dannes frie enkeltstrengede regioner ved hver ende af det spaltede molekyle. Sådanne enkeltstrengede ender er selvkomplementære og altså kohæsive og kan benyttes til genforening af det hydrolyserede DNA. Da ethvert DNA, som er i stand til at blive spaltet ved hjælp af et sådant enzym, må indeholde det samme genkendelsessite, vil de samme kohæsive ender blive dannet, så at det er muligt at forene hetero-30 loge sekvenser af DNA, som er blevet behandlet med en restriktionsendonuclease, til andre sekvenser, som er blevet behandlet på lignende måde (med samme restriktionsendonuclease), se Roberts, R.J., Crit. Rev. Biochem., b. 4, s. 123, (1976). Restriktionssites er forholdsvis sjældne i naturligt DNA, men den generelle anvendelighed af restriktionsendonucleaser er blevet kraftigt forøget ved den kemiske syntese af dobbeltstrengede oligonucleotider, som 35 bærer restriktionssitesekvenser. Derfor kan praktisk taget ethvert segment af DNA blive koblet til ethvert andet segment simpelthen ved tilknytning af det restriktionsoligonucleotid til enderne af segmentet, hvorpå man underkaster produktet den hydrolytiske virkning af den rette restrik-tionsendenuclease, hvorved de fornødne kohæsive ender dannes, se Heyneker, H.L. m.fl., 6 DK 166784 B1
Nature, b. 263, s. 748, (1976) og Scheller, R.H. m.fl., Science, b. 196, s. 177, (1977). Et vigtigt træk ved fordelingen af restriktionsendonucleasegenkendelsessites er den omstændighed, at de er tilfældigt fordelt i forhold til læserammen. Følgelig kan spaltning ved hjælp af restriktions-endonuciease foregå mellem nabocodoner, eller den kan foregå inde i en codon, jf. omtalen 5 ovenfor: Der skal en deoxynucleotidtriplet til at kode for en enkelt aminosyre, og en restriktions-endonuclease kan da ligeså godt spalte midt i en tripletcodon som mellem to nabocodoner.
Der findes mere generelle metoder til DNA-spaltning eller til endesekvensmodifikation. En række ikke-specifikke endonucleaser kan benyttes til spaltning af DNA tilfældigt som omtalt 10 nedenfor. Endesekvenser kan modificeres ved dannelse af oligonucleotidhaler af dA på den ene ende og dT på den anden eller af dG og dC til dannelse af sæder til forening uden noget behov for specifikke linkersekvenser.
Betegnelsen ekspression benyttes i erkendelse af den omstændighed, at en organisme sjæl-15 dent eller aldrig gør brug af alle sine genetisk bestemte egenskaber på samme tid. Selv i forholdsvis simple organismer såsom bakterier bliver mange proteiner, som cellen er i stand til at syntetisere, ikke syntetiseret, skønt de kan syntetiseres under passende omgivelsesbetingelser.
Når det proteinprodukt, som kodes af et bestemt gen, syntetiseres af organismen, siges genet at blive eksprimeret. Hvis proteinproduktet ikke fremstilles, eksprimeres genet ikke. Normalt 20 reguleres ekspressionen af gener i E. coli som generelt beskrevet nedenfor på en sådan måde, at proteiner, hvis funktion ikke er nyttig i givne omgivelser, ikke syntetiseres, og metabolisk energi bevares.
Den måde, hvorved genekspressionen kontrolleres i E. coli og gær, forstås godt på grund af 25 vidtstrakte studier i de sidste 20 år, se Hayes, W., The Genetics of Bacteria and their Viruses, 2. udgave, John Wiley & Sons, inc., New York, (1968) og Watson, J.D., The Molecular Biology of the Gene, 3. udgave, Benjamin, Menlo Park California, (1976). Disse undersøgelser har vist, at visse gener, normalt sådanne, som koder for proteiner, som udfører beslægtede funktioner i cellen, kan findes i en sammenhængende klynge i kontinuerlig sekvens. Klyngen kaldes en 30 operon. Alle gener i operonen transskriberes i samme retning begyndende med de codoner, som koder for N-terminalaminosyren af det første protein i sekvensen og fortsættende igennem til C-terminalenden af det sidste protein i operonen. Ved begyndelsen af operonen, proximalt til N-terminalaminosyrecodonen, eksisterer der en region af DNA'et, som betegnes kontrolregionen, og som omfatter et antal kontrollerende elementer omfattende operatoren, promotoren og 35 sekvenserne for bindingen af ribosomer. Funktionen af disse enheder er at tillade ekspressionen af disse gener under deres kontrol, at være responsiv over for organismens behov. F.eks. er de gener, der koder for enzymer, som udelukkende kræves til udnyttelse af lactose, normalt ikke i kendelig grad eksprimeret, med mindre lactose eller en analog deraf faktisk er til stede i 7 DK 166784 B1 mediet. De kontrolregionfunktioner, som må være til stede, for at ekspressionen skal foregår, er initieringen af transskription og initieringen af translation. Minimumfordringeme til uafhængig ekspression af et kodningssegment er derfor en promotor, et ribosomalt bindingssite og et 3- 11-nucleotidspacersegment. Nucleotidsekvenserne, som hidfører disse funktioner, er forholds-5 vis korte, så at størstedelen af et ekspressionskontrolsegment kan være af størrelsesordenen 15-25 nucleotider i længden. Ekspression af det første gen i sekvensen initieres ved initieringen af transskription og translation i den stilling, som koder for N-terminalaminosyren i det første protein i operonen. Ekspressionen af hvert gen efter dette punkt gennemføres derefter i rækkefølge, i det mindste indtil mødet med et endesignal eller en anden operon med sin egen 10 kontrolregion, som er indrettet til at reagere på et forskelligt sæt af nøglebetingelser i omgivelserne. Medens der er mange variationer i enkelthederne i dette skema, er det vigtige træk, at et gen for at blive eksprimeret i en vært såsom E. coli eller en eucaryot såsom gær må være lokaliseret på rette måde i forhold til en kontrolregion med transskriptionsinitiator- og translati-onsinitiatorfunktioner.
15
Det er blevet påvist, at gener, som ikke normalt er en del af en given operon, kan indsættes i operonen og kontrolleres af den. Den klassiske demonstration blev udført af Jacob, F. m.fl., J.
Mol. Biol., b. 13, s. 704, (1965). I dette eksperiment blev gener, som koder for enzymer, som er involveret i en purinbiosynteserute, transfereret til en region, som kontrolleres af lactoseopero-20 nen. Man iagttog da, at ekspressionen af purinbiosynteseenzymet blev undertrykt i fravær af lactose eller en lactoseanalog og blev gjort ikke-reagerende på de nøglebetingelser i omgivelserne, som normalt regulerer dets ekspression.
Foruden operatorregionen, som regulerer initieringen af transskriptionen af gener efter den, 25 vides der at eksistere codoner, der virker som stopsignaler, idet de angiver C-terminalenden af et givet protein, se tabel 2. Sådanne codoner kendes som endesignaler eller nonsenscodoner, da de normalt ikke koder for nogen aminosyre. Deletion af et endesignal mellem strukturale gener i en operon frembringer et sammensmeltet gen, som kan resultere i syntesen af et ki-mærisk protein eller fusionsprotein bestående af to aminosyresekvenser, som kodes af nabo-30 gener, hvilke to aminosyresekvenser er forenet ved hjælp af en peptidbinding. At sådanne ki-mæriske proteiner syntetiseres, når gener sammensmeltes, blev demonstreret af Benzer, S. og Champe, S.P., Proc. Nat. Acad. Sci., USA, b. 48, s. 114, (1962).
Når først et givet gen er blevet isoleret, renset og indsat i en transfervektor, overføres transfer-35 vektoren til en passende mikroorganisme, hvori genet replikeres, idet mikroorganismen formerer sig, og hvorfra genet kan isoleres igen ved konventionelle midler. Således tilvejebringes der en kontinuerligt fornyelig kilde for genet til yderligere manipulationer, modifikationer og overførsler til andre vektorer eller andre steder i samme vektor.
8 DK 166784 B1
Ekspression er blevet opnået i den kendte teknik ved overførsel af det klonede gen i passende orientering og læseramme i en kontrolregion, så at gennemlæsning fra værtsgenet resulterer i syntese af et kimærisk protein omfattende den aminosyresekvens, som kodes af det klonede 5 gen. Teknik til at konstruere en ekspressionstransfervektor med det klonede gen i rette stilling i forhold til en kontrolregion er beskrevet i Polisky, B. m.fl., Proc. Nat. Acad. Sci. USA, b. 73, s. 3727, (1978), Mercereau-Puijalon, O. m.fl., Nature, b. 275, s. 505, (1978) og Chang, A.C.Y. m.fl., Nature, b. 275, s. 617, (1978).
10 Som beskrevet i denne patentansøgning forenes det klonede gen med et værtskontrolfragment med henblik på opnåelse af ekspression af genet. Dette kontrolfragment kan bestå af ikke mere end denne del af kontrolregionen, som tilvejebringer transskriptionsinitiering og translationsinitiering, eller kan yderligere omfatte en del af et strukturelt gen, afhængende af placeringen af indsættelsessitet. Således er ekspressionsproduktet enten et ønsket protein, som kodes 15 af det klonede gen, i det følgende betegnet et ikke-fusionsprotein, eller et fusionsprotein, som kodes dels af den procaryote strukturelle gendel, dels af det klonede gen, dels af vilkårlige indskudte nucleotidsekvenser, som forbinder de to gener. Peptidbindingen mellem det ønskede eucaryote protein eller peptid, omfattende C-terminaldelen af fusionsproteinet, og resten betegnes her knudepunktbindingen.
20
Efter at proteinet er blevet fremstillet, må det renses. Der eksisterer forskellige fordele og ulemper ved rensningen af enten ikke-fusionsproteinet eller fusionsproteinet. Ikke-fusionsprote-inet fremstilles inde i cellen. Som en følge heraf må cellen underkastes lyse eller anden behandling til frigørelse af ikke-fusionsproteinet. Lysatet vil indeholde alle proteinerne i cellen 25 foruden ikke-fusionsproteinet, hvilket kan gøre rensningen af proteinet vanskelig. En anden ulempe er, at ikke-fusionsproteinet kan blive genkendt som et fremmed protein og undergå hurtig nedbrydning i cellen. Derfor kan ikke-fusionsproteinet muligvis ikke fås i rimelige udbytter. En væsentlig fordel ved et ikke-fusionsprotein er, at proteinet selv er det ønskede slutprodukt.
30
Stabiliteten af ekspressionsproduktet forøges hyppigt ved ekspression af et fusionsprotein. Værtsdelen af fusionsproteinet stabiliserer hyppigt ekspresionsproduktet mod intraceliulær nedbrydning. Endvidere er det ofte muligt at vælge et værtsprotein, som er beskyttet mod nedbrydning ved compartmentisering (dvs. lukket inde i et særligt område af cellen) eller ved 35 ekskretion fra cellen til vækstmediet. Den eucaryote gendel kan derfor med fordel knyttes til værtsgenet for et sådant protein. Et fusionsprotein bestående af et værtsprotein (N-terminal), som normalt ekskreteres eller compartmentiseres, og et eucaryot protein (C-terminal) vil sandsynligvis på lignende måde blive udskilt fra cellen eller compartmentiseret inde i den, fordi DK 166784 B1 g signalsekvensen af aminosyrer, som giver udskilbarhed, befinder sig på den N-terminale del af fusionsproteinet. I tilfælde af et fusionsprotein, som udskilles til cellemediet, forenkles rensningen i høj grad. I nogle tilfælde kan værtsdelen have bestemte fysiske egenskaber, som tillader brugen af enkle rensningsprocedurer. En væsentlig ulempe ved fusionsproteinet er, at værts-5 proteinet må Ijernes fra fusionsproteinet til opnåelse af det eucaryote protein.
Direkte ekspression som ikke-fusionsprotein vil normalt foretrækkes, hvis proteinet er stabilt i værtscellen. I mange tilfælde vil ulempen ved at måtte rense ekspressionsproduktet fra et cellelysat blive opvejet af fordelen ved ikke at være nødt til at benytte specifikke 10 spaltningsmidler til fjernelse af N-terminaldelen. Mest fordelagtigt er det, at det ønskede protein kan eksprimeres som et fusionsprotein omfattende en N-terminalsekvens med bestemte fysiske egenskaber, som er nyttige til rensning og er udstyret med en struktur i knudepunktet med den ønskede C-terminaldel, så at knudepunktbindingen defineret som ovenfor kan spaltes ved hjælp af midler, som ikke i væsentlig grad påvirker det ønskede C-terminalprotein eller -peptid.
15
Mange metoder til kemisk spaltning af peptider er blevet foreslået og undersøgt, se Spande, T.FI. m.fl., Adv. Protein Chem., b, 24, s. 97, (1970). Imidlertid er mange af disse uspecifikke, hvilket vil sige, at de spalter ved mange sites i et protein, se også en kort diskussion i The Proteins, 3. udgave, Leurath, H. og Hill, R.L., red., Acadmic Press, b. 3, s. 50-57, (1977).
20 Hydrolyse af peptidbindinger katalyseres af en række kendte proteolytiske enzymer, se The Enzymes, 3. udgave, Boyer, P.D., red., Acadmic Press, b. Ill, (1971), Methods in Enzymology, b. XIX, Perlmann, G.E. og Lorand, L, Red., Academic Press, (1970) og Methods in Enzymology, b. XLV, Lorand, L., red., Academic Press, (1976). Imidlertid er mange proteolytiske enzymer også uspecifikke med hensyn til spaltningssitet.
25
Specificiteten af hvert kemisk eller enzymatisk middel til spaltning beskrives normalt ved hjælp af aminosyrerester ved eller nær den hydrolyserede peptidbinding. Hydrolysen af en peptidbinding i et protein eller polypeptid betegnes her en spaltning af proteinet eller polypeptidet ved sitet for den hydrolyserede binding. De peptidbindinger, som hydrolyseres ved kemiske eller 30 enzymatiske midler, kendes normalt, se referencerne ovenfor. F.eks. spalter trypsin (3.4.4.4) på carboxylsiden af en arginin- eller lysinrest. (Tallene i parentes efter enzymet er dets specifikke identifikationsnomenklatur ifølge International Union of Biochemists). Således siges trypsin at være specifik for arginin eller lysin. Da trypsin kun hydrolyserer på carboxylsiden af arginin- eller lysinrester, siges det at have en snæver specificitet. På den anden side har pepsin 35 (3.4.4.1) en bred specificitet, og det vil spalte på carboxylsiden af de fleste aminosyrer, men fortrinsvis phenyialanin-, tyrosin-, tryptophan-, cystein-, cystin- eller leucinrester. Der kendes nogle få specifikke kemiske spaltningsreaktioner. F.eks. vil CNBr kun spalte ved methioninre-ster under passende betingelser. Imidlertid er vanskeligheden ved alle specifikke spaltnings- 10 DK 166784 B1 midler, som afhænger af eksistensen af en enkelt aminosyrerest ved eller nær spaltningspunktet, hvad enten de er kemiske eller enzymatiske, at sådanne metoder kun vil være nyttige i specifikke tilfælde, hvor det vides, at ingen sådan rest forekommer i det indre af aminosyrese-kvensen af den ønskede proteindel. Jo større det ønskede protein er, desto større er sandsyn-5 ligheden for, at den følsomme rest vil forekomme i det indre. Derfor baseres en teknik, som normalt er egnet til spaltnig af fusionsproteiner i et ønsket punkt, fortrinsvis på eksistensen af en sekvens af aminosyrer ved knudepunktbindingen, som har en lav sandsynlighed for forekomst i det indre af den ønskede proteindel.
10 Specificiteten for sitet af den hydrolyserede peptidbinding betegnes normalt den primære specificitet af enzymet. Således har trypsin en primær specificitet for arginin- og lysinrester.
Den primære specificitet af enzymer har været genstand for betydelig forskning. Det er blevet bestemt, at et bestemt enzym vil genkende og binde aminosyreresten i et proteinmolekyle svarende til enzymets primære specificitet og spalte proteinet ved dette punkt. Den del af 15 enzymet, som genkender og binder substratet og katalyserer reaktionen, betegnes det aktive site. F.eks. vil trypsin genkende og binde en argininrest i et protein og spalte proteinet på carboxylsiden af argininet. I mange år antog man, at kun aminosyreresteme svarende til den primære specificitet påvirker hydrolysespecificiteten af peptidbindingen ved enzymet, imidlertid har man bemærket, at aminosyrer i den umiddelbare nærhed af hydrolysesitet kan påvirket 20 bindingsaffiniteten af enzymet ved dette site. Adskillige eksempler på denne effekt kan vises på trypsin. Idet man betragter sekvensen -x-Arg-y, hvor x og y er aminosyrer, har det vist sig, at bindingsaffiniteten af trypsin ved Arg-y-bindingen reduceres væsentligt, hvis x er Glu eller Asp. På lignende måde har man vist, at bindingsaffiniteten yed en arginin- eller lysinrest i repetitive sekvenser af lysin, arginin eller kombinationer deraf er større, end hvis der var en en-25 kelt arginin- eller lysinrest til stede. Dette vil sige, at enzymet fortrinsvis bindes ved -Arg-Arg-x i forhold til y'-Arg-x, hvor y' er en aminosyre, der er forskellig fra arginin og lysin. Ligeledes synes trypsin ikke at hydrolysere -Arg-Pro- eller Lys-Pro-peptidbindingen, se Kasper, C.B., s. 137 i Protein Sequence Determination, Needleman, S.B., red., Springer-Verlag, New York, (1970).
30 For nylig har man også bestemt, at aminosyrer i nærheden af sitet for hydrolyse også vil blive genkendt og bundet af enzymet, se f.eks. Schechter, I. m.fl., Biochem. Biophys. Res. Comm., b. 27, s. 157, (1967), som meddeler, at papain (3.3.4.10) binder adskillige aminosyrerester i sit aktive site bestemt ud fra hydrolysen af peptider af forskellige længder. Et aktivt site, som binder adskillige aminosyrer, betegnes ofte et udvidet aktivt site. Specificiteten af et enzym for 35 de yderligere aminosyrer, som ikke befinder sig ved det umiddelbare hydrolysesite, betegnes undertiden den sekundære specificitet af enzymet. Det har vist sig, at mange enzymer har udvidede aktive sites. Adskillige yderligere eksempler på enzymer med udvidede aktive sites omfatter: Elastace (3.4.4.7) - Thompson, R.C. m.fl., Proc. Nat. Acad. Sci., USA, b. 67, s. 1734, 11 DK 166784 B1 (1970); α-chymotrypsin (3.4.4.5) - Bauer, C.A. m.fl., Biochem., b. 15, s. 1291 og 1296, (1976); chymosin (3.4.23.4) - Visser, S. m.fl., Biochem. Biophys. Acta, b. 438, s. 265, (1976); og enterokinase (3.4.4.8) - Mauraus, S. m.fl., J. Biol. Chem., b. 246, s. 5031, (1971), se også Fruton, J. S., Cold Spring Harbor Conf. Cell. Prolif., b. 2, s. 33, (1975). Det udvidede aktivi-5 tetssite synes i det mindste at forøge den katalytiske effektivitet af enzymet. Det kan også forøge bindingsaffiniteten af enzymet for peptidet, se Fruton, J.S. ovenfor. F.eks. fandt Chech-ter, I. m.fl., Biochem. Biophys. Res. Comm., b. 32, s. 898, (1969), at phenylalanin i sekvensen -x-Phe-y-z, hvor x, y og z er aminosyrer, forøger peptidets følsomhed over for hydrolyse med papain og ætter det enzymatiske angreb mod y-z-peptidbindingen. Valin og leucin kan også 10 give lignende resultater, når de benyttes i stedet for Phe i sekvensen ovenfor. Dette kune være en forklaring på den brede specificitet af papain, se Glazer, A.N. m.fl., s. 501 i The Enzymes citeret ovenfor. Således kan et enzym have en bred specificitet som et resultat af sin primære specificitet alene eller i kombination med sin sekundære specificitet (dvs. enzymet har et udvidet aktivt site).
15
Den foreliggende opfindelse anviser den procaryote eller eucaryote ekspression af et klonet kodningssegment på en sådan måde, at det ønskede protein fremstilles som et fusionsprotein, der er udrustet med yderligere specifikke aminosyresekvenser for at tillade specifik spaltning ved knudepunktbindingen af et fusionsprotein og for at tillade hurtig rensning. Opfindelsen an-20 viser et antal valgmuligheder afhængende af størrelsen og funktionen af det ønskede protein og fordelene ved ekspression som fusionsprotein sammenlignet med ikke-fusionsprotein.
I EP-A2-1930 anvises ekspression af fusionsproteiner, men her er det ønskede protein kun fusioneret med et spaltningssegment, som kan fraspaltes af henholdsvis signalpeptidase og 25 kemisk med CNBr. Der er ikke tale om samtidig af inkorporere et rensningssegment.
EP-B1-6694 anviser en sekvens omfattende den hydrofobe del af det DNA-segment, der koder for penicillinase eller præproinsulin. Formålet hermed er at fremme udskillelsen af det ønskede protein fra cellen, gennem membranen til det extracellulære medium. Ved udskillelsen spaltes 30 den hydrofobe sekvens, således at den ikke, som tilfældet er ved sekvensen ifølge opfindelsen, anvendes ved den efterfølgende rensning af det ønskede protein.
Til tilvejebringelse af generelt nyttige midler til specifik spaltning af knudepunktbindingeme vil et kemisk eller enzymatisk spaltningsmiddel med snæver specificitet ikke være egnet undtagen 35 i specielle tilfælde. Et spaltningsmiddel er ikke egnet, hvis dets spaltningssite forekommer inden for det eucaryote protein i fusionsproteinet. F.eks. kan et eucaryot protein indeholde adskillige arginin- og/eller lysinrester. Trypsin vil spalte på carboxylsiden af disse rester. Da spaltning derfor også vil foregå i det eucaryote protein, vil trypsin ikke være egnet til brug i 12 DK 166784 B1 forbindelse med den foreliggende opfindelse. Dette gælder også for mange kemiske spaltningsmidler. Således vil det ses, at til opnåelse af mere specifik spaltning er det nødvendigt at benytte et spaltningsmiddel, som vil have et spaltningssite i en specifik aminosyresekvens med to eller flere aminosyrerester. F.eks. ville det være ønskeligt for spaltningsmidlet at være spe-5 cifikt for en aminosyresekvens -x-y-z- og at spalte på carboxylsiden af z-resten. Sandsynligheden for, at en lignende sekvens forekommer i det eucaryote protein, vil være meget lille. Derfor vil sandsynligheden for spaltning i det eucaryote protein også være meget lille. Hele det eucaryote protein kan da fjernes og renses.
10 Den foreliggende opfindelse er indrettet på en sådan måde, at når et fusionsprotein eksprime-res, indsættes en specifik spaltningssekvens af en eller flere aminosyrer mellem værtsdelen og den eucaryote del af fusionsproteinet. Hvis sekvensen af den eucaryote del er kendt, er det muligt at udvælge en specifik spaltningssekvens af kun én aminosyrerest, sålænge denne rest ikke forekommer i det eucaryote protein. Det foretrækkes imidlertid at benytte en specifik 15 spaltningssekvens, som indeholder to eller flere aminosyrerester, som her undertiden betegnes som en udvidet specifik spaltningssekvens. Denne sekvenstype har fordelen bestående i de udvidede aktive sites af forskellige enzymer. Ved benyttelse af en udvidet specifik spaltningssekvens er det yderst sandsynligt, at spaltning kun vil forekomme i det ønskede site, knudepunktbindingen, og ikke inde i det ønskede protein. Den foreliggende opfindelse er vigtig inden-20 for rekombinant-DNA-teknologien. Ved indsættelse af en specifikt genkendelig aminosyresekvens mellem værtsproteindelen og den ønskede del af et fusionsprotein er det nu muligt specifikt at spalte den ønskede del ud af fusionsproteinet uden yderligere at påvirke den ønskede del.
25 Til praktiske formål behøver specificiteten af spaltningen ved knudepunktet ikke at være alt eller intet med hensyn til andre potentielle spaltningssites i det ønskede protein. Det er nok, hvis knudepunktbindingens spaltningssite er kinetisk tilstrækkeligt favoriseret, enten som følge af forøget bindingsaffinitet eller forøget omsætningshastighed, at knudepunktbindingen spaltes fortrinsmæssigt i forhold til andre sites, så at der kan opnås et rimeligt udbytte af det ønskede 30 protein. Reaktionsbetingelserne med hensyn til f.eks. temperatur, puffer, forhold mellem enzym og substrat og reaktionstid kan udvælgs til opnåelse af maximalt udbytte af det ønskede protein på en for fagfolk kendt måde.
For adskillige eucaryote og procaryote proteiner er det indledende translationsprodukt ikke 35 proteinet selv, men proteinet med ca. 20 yderligere aminosyrer på aminoenden af proteinet.
Den yderligere aminosyresekvens kaldes et signalpeptid. Signalpeptidet antages at være et specifikt signal for den vektorielle transport af det syntetiserede protein til det endoplasmiske reticulum og spaltes væk fra proteinet i denne fase, se Biobel, G. m.fl., J. Cell. Biol., b. 67, 13 DK 166784 B1 s. 835, (1975). Et specifikt spaltningsenzym, en signalpeptidase, er blevet iagttaget i et cellefrit system, som hydrolyserer peptidbindingen mellem signalpeptidet og det aktive protein i forbindelse med passage gennem en cellemembran, se Biobel, G. m.fl., Proc. Nat. Acad. Sci. USA, b. 75, s. 361,(1978).
5 DNA-sekvensen ifølge den foreliggende opfindelse omfatter en specifik spaltningslinker, som kan knyttes til enden af det isolerede eucaryote DNA-segment, som koder for N-enden af proteinet, der skal fremstilles, før indsætningen af segmentet i transfervektoren. Den specifikke spaltningslinker koder for en aminosyresekvens, som indeholder et specifikt spaltningssite, som 10 helst ikke forekommer i det ønskede protein fra fusionsproteinet. En fordel ved den foreliggende opfindelse er spaltningen ved aminoterminalsiden af den første aminosyre i N-enden af det ønskede protein. En anden fordel er, at kun lidt af det ønskede protein nedbrydes under spaltningen.
15 Til opnåele af ekspression som ikke-fusionsprotein kan man anvende syntetiske oligonucleotid-linkere omfattende en promotor, et ribosomalt bindingssite og en 3-11-nucleotidspacer. Denne linker, koblet med et kodende segment, tilvejebringer direkte ekspression af kodningssegmentet ved indsættelse i en transfervektor og benyttelse til transformering af en passende vært.
Under anvendelse af en sådan linker kan kodningssegmentet eksprimeres, selv om det er 20 indsat i en "tavs" reion af vektoren (en region, der normalt ikke eksprimeres), hvilket forøger området for valg af passende indsættelsessites. Fortrinsvis opnås direkte ekspression af kodningssegmentet, dog uden at man behøver at ty til et syntetisk promotorsegment. En ribosomal bindingssitelinker sammen med en 3-11-nucleotidspacer styrer reinitieringen af translationen af mRNA, som initieres ved det naturligt forekommende promotorsite. Derfor gælder det, at så 25 længe kodningssegmentet og ekspressionslinkeren er indsat i et transfervektorgen under naturligt forekommende promotorkontrol, resulterer reinitiering ved det indsatte ribosomale bindingssite i direkte ekspression af det tilknyttede kodningssegment. Fortrinsvis udføres indsætningen nær den eksisterende promotor mellem denne og det strukturelle gen, som den normalt kontrollerer.
30
Med henblik på forbedring af rensningen af fusionsproteinet omfatter DNA-sekvensen ifølge den foreliggende opfindelse en linker, som koder for aminosyresekvenser, som virker til forøgelse af letheden af rensningen. En sådan rensningssekvens kan også anvendes i et ikke-fusions-protein. F.eks. vil et polyanionisk aminosyresegment eller et polykationisk eller hydro-35 fobt segment blive tæt bundet af en række kendte fastfaseadsorbenter eller søjlematerialer. Specifikke aminosyresekvenser, som er genkendelige af specifikke bindingssubstanser, kan inkorporeres ved hver ende af det ønskede protein for at gøre det renseligt ved affinitetschro-matografi. Sådanne rensningssegmenter kan benyttes i forbindelse med et specifikt spaltnings- 14 DK 166784 B1 segment til opnåelse af simpel kvantitativ rensning af fusions- eller ikke-fusionsproteiner efterfulgt af specifik spaltning af rensningssegmentet og kvantitativ fjernelse deraf.
Ovenstående formål opnås gennem den foreliggende opfindelse véd en kombination af egen-5 skaberne af hvert syntetisk system til at løse de individuelle problemer, som fremkommer ved fremstillingen af det ønskede protein. Principperne for den foreliggende opfindelse anviser generelt anvendelige midler til ekspression af et kodende segment som et fusionsprotein med et rensningssegment og specifikt spalteligt fra ethvert protein eller peptid, som ikke udgør en del af det ønskede ekspressionsprodukt.
10
Den foreliggende opfindelse er baseret på et generelt princip til tilvejebringelse af specifikke oligonucleotidsegmenter (som her skal betegnes linkers), som knyttes i sekvens i et klonet DNA-kodningssegment. De omhandlede linkers meddeler ønskede funktionelle egenskaber på ekspressionen af det protein, som kodes af kodningssekvensen. Under anvendelse af de om-15 handlede linkers kan det ønskede protein generelt eksprimeres enten som et fusions- eller ikke- fusionsprotein. I princippet kan også flere linkers, som koder for yderligere sekvenser af aminosyrer tilknyttes, idet sekvenserne vælges til tilvejebringelse af egenskaber, som kan nyttiggøres i en forenklet rensningsproces. Som spaltningslinker kan bl.a. anvendes en linker, som koder for en aminosyresekvens af det udvidede specifikke spaltningssite i et proteolytisk enzym, samt 20 specifikke spaltningslinkers for enklere specifikke spaltningssites.
De benyttede oligonucleotidlinkers betegnes her "segmenter." Således betegnes det oligonu-cleotid, som koder for et specifikt spaltningssite, som et specifikt spaltningssegment; det, som koder for initiering af transskription og translation, betegnes et ekspressionskontrolsegment; 25 det, som koder for reinitiering af translation betegnes et ekspressionssegment, og det, som koder for specifik rensning, betegnes et rensningssegment. Den klonede nucleotidsekvens, som koder for det ønskede protein, betegnes kodningssegmentet. Ekspressionsproduktet er et protein eller polypeptid, som bærer forskellige identificerbare dele. Hvor det ønskede protein eller peptid eksprimeres som et fusionsprotein, betegnes den N-terminale aminosyresekvens, 30 som leveres af værts- eller transfervektoigenomet, værtsdelen. Hvor der er blevet benyttet en specifik spaltningslinker, betegnes den aminosyresekvens, som hidrører fra dens ekspression, den specifikke spaltningsdel, og hvor der er blevet tilknyttet et rensningssegment, betegnes dets ekspressionsprodukt rensningsdelen. Den del, som kodes af det klonede kodningssegment, betegnes det ønskede protein, hvilken betegnelse skal benyttes her til angivelse af en-35 hver størrelse af polypeptid, protein eller proteinfragment, som specificeres af kodningssegmentet.
15 DK 166784 B1
Det menes, at linkerne i DNA-sekvensen ifølge den foreliggende opfindelse kan knyttes til begge ender af kodningssegmentet til tilvejebringelse af den ønskede del ved enten aminoen-den eller carboxylenden af det ønskede protein. Det vil forstås, at til ekspression af enhver del, som er knyttet til carboxylenden af det ønskede protein, må kodningssegmentet ikke indeholde 5 en termineringscodon. Det vil endvidere forstås, at linkere, som er beregnet til ekspression af en del, som er knyttet til carboxylenden af det ønskede protein, må omfatte en termineringscodon, som er placeret passende ved enden af det segment, hvis ekspression ønskes.
Den foreliggende opfindelse muliggør valget af ekspresionen af et klonet kodningssegment 10 afhængende af egenskaberne af det ønskede protein og af den vært, som eksprimerer det. Værten kan være enten procaryot eller eucaryot. Hvor det ønskede protein er lille eller ustabilt i værten, vil man ofte foretrække at eksprimere et fusionsprotein. Brugen af en specifik spaltningslinker i DNA-sekvensen ifølge den foreliggende opfindelse vil da muliggøre den efterfølgende specifikke fjernelse af værtsdelen af fusionsproteinet. Ved anvendelse af et rensnings-15 segment tilvejebringes en region af fusionsproteinet, som meddeler funktionelle egenskaber, som kan udnyttes til tilvejebringelse af forenklet rensning før den specifikke spaltning. Efter den specifikke spaltning forbliver rensningsdelen knyttet til værtsdelen, og den forenkler adskillelsen af værtsdelen fra det ønskede protein. I nogle tilfælde kunne man omvendt foretrække at eksprimere det ønskede protein som et ikke-fusionsprotein. I det tilfælde giver brugen af et 20 ekspressionssegment eller en ekspressionskontrolsegmentlinker på bekvem måde direkte ekspression af kodningssegmentet. Det vil forstås, at sådan direkte ekspression afhænger af eksistensen af en initieringscodon. Hvis initieringscodonen ikke er indbefattet i kodningsegmentet, må den tilvejebringes som en del af et andet segment, f.eks. ekspressionssegmentet. Hvor en N-terminal methionin ikke er ønsket, kan et specifikt spaltningssegment indskydes mellem 25 initieringsmethionincodonen og kodningssegmentet. En rensningssegmentlinker kan inkluderes til opnåelse af hurtig rensning af ekspressionsproduktet. Alternativt kan brugen af en ekspresi-onssegmentlinker blive efterfulgt af en linker, som koder for et signalpeptid, som kan forårsage sekretion af ekspressionsproduktet fra værtscellen.
30 Den særlige kombination af linkere, som vælgs til at hjælpe ved ekspressionen af et givet ønsket protein, vil afhænge af karakteren af det ønskede protein og af funktionelle egenskaber af ekspressionssystemet. Nogle af de beskrevne linkere er egnede til procaryote og eucaryote værter, medens andre er specifikke for en bestemt type af værtscelle sådanne valg kan træffes af fagfolk.
35
De specifikke spaltningslinkere er deoxynucleotidsekvenser, som koder for aminosyresekven-ser, der indeholder specifikke spaltningssites. En specifik spaltningslinker er knyttet til et kodningssegment før transfereringen til en mikroorganisme. Fordelen ved en specifik spalt- 16 DK 166784 B1 ningslinker er, at den giver en specifik spaltningssekvens med et specifikt spaltningssite ved knudepunktbindingen i fusionsproteinet. Denne binding kan spaltes til dannelse af det ønskede protein.
5 Under anvendelse af gængs rekombinant-DNA-teknologi er det muligt at indsætte et isoleret kodningssegment i en transfervektor, at transformere en mikroorganisme med denne transfer-vektor og under passende betingelser at få kodningssegmentet eksprimeret af mikroorganismen. Hyppigt er det ønskeligt at forbinde kodningssegmentet med en del af et værtsgen, som koder for et protein, som normalt udskilles fra cellen. Dette gøres, så at ekspressionsproduktet, 10 et fusionsprotein omfattende en værtsproteindel og det ønskede protein, compartmentiseres eller udskilles fra cellen til dyrkningsmediet. Denne proces er ønskværdig, fordi den reducerer eller eliminerer nedbrydningen af det ønskede protein i cellen. I tilfælde af et fusionsprotein, som udskilles til dyrkningsmediet, er det lettere at rense fusionsproteinet. Fusionsproteinet er lettere at rense, fordi der er mindre totalt protein i dyrkningsmediet end i et helt cellelysat.
15
En særlig fordel ved fusionsproteinekspression er, at der ofte er velkendte midler til rensning af værtsdelen. Sådanne midler vil ofte ligeledes være anvendelige på fusionsproteinet. Affinitets-chromatografi foretrækkes, hvor den finder anvendelse.
20 Den største vanskelighed ved denne proces er behovet for at fjerne det ønskede protein fra værtsdelen i fusionsproteinet. Dette trin er nødvendigt til rensning af det ønskede protein. Dette er vanskeligt, fordi der normalt ikke findes noget specifikt spaltningssite mellem amino-enden af den ønskede del og carboxy-enden af værtsdelen, som alene kan angribes af specifikke kemiske eller enzymatiske midler. Således anviser den foreliggende opfindelse inkorporeringen 25 af en specifik spaltningssekvens mellem det ønskede protein og værtsdelen af fusionsproteinet.
Der er mange metoder til spaltning af proteiner som diskuteret ovenfor. Eksempler på kemiske midler omfatter cyanogenbromid (CNBr) og hydroxylamin, se Spande, T.F. m.fl., citeret oven-30 for. Eksempler på proteolytiske enzymer omfatter trypsin, papain, pepsin, thrombin (3.4.4.13) og enterokinase, se The Proteins, citeret ovenfor, Meth. Enzymol., b. XIX, citeret ovenfor, og Meth. Enzymol., b. XLV, citeret ovenfor. Imidlertid udviser mange af disse midler ikke tilstrækkelig specificitet til at være anvendelige i praksis. Dette vil sige, at mange af disse midler kun genkender en specifik aminosyrerest og spalter i dette punkt. Således vil disse midler bortset 35 fra meget få situationer forårsage spaltning inde i det ønskede protein.
Gennem den foreliggende opfindelse skabes der en situation for protein i lighed med restrikti-onsendonucleaser for DNA. Som diskuteret ovenfor vil et restriktionsenzym genkende en spe- 17 DK 166784 B1 cifik sekvens af DNA og spalte DNA'et i dette punkt. Den foreliggende opfindelse anviser en specifik aminosyresekvens indeholdende en eller flere aminosyrerester, som genkendes af et bestemt enzymatisk spaltningsmiddel. Den specifikke aminosyresekvens inkorporeres i et fusionsprotein mellem værtsdelen og det ønskede protein. Dette opnås ved kemisk syntese af 5 en deoxynucleotidsekvens, som koder for den specifikke aminosyresekvens. Denne DNA-sekvens knyttes derpå til et isoleret gen før sin inkorporering i en transfervektor. Denne DNA-sekvens betegnes her en specifik spaltningslinker. Den specifikke aminosyresekvens betegnes her en specifik spaltningsdel. Den specifikke spaltningsdel indeholder et specifikt spaltningssite. Den specifikke spaltningsdel vælges således, at den ikke eller højst sandsynligt ikke 10 forekommer i det ønskede protein. På denne måde skilles det ønskede protein fra værtsdelen af fusionsproteinet uden selv at blive nedbrudt.
Ved udvælgelsen af en specifik spaltningssekvens må flere faktorer tages i betragtning. Hvis det ønskede proteins aminosyresekvens kendes, er det forholdsvis simpelt at udvælge en 15 specifik spaltningssekvens. I dette tilfælde foretrækkes det, at den specifikke spaltningsse-' kvens ikke findes i det ønskede protein. Er dette alligevel tilfældet kan sekvensen muligvis anvendes alligevel, det er et spørgsmål om de relative spaltningshastigheder for de to steder, jf. omtalen i det følgende. F.eks. indeholder humant proinsulin ikke sekvensen X-Phe-Arg-Y. Enzymet kallikrein B (3.4.21.8) genkender denne sekvens og spalter på carboxylsiden af argi-20 ninet, se Fiedler, F., s. 289 i Meth. Enzymol., b. XLV, citeret ovenfor. Ved således at knytte den DNA-sekvens, som koder for Phe--Arg (TTKWGZ), til det isolerede humane proinsulingen før indsætningen, kan det fusionsprotein, som fremstilles ved ekspression, spaltes med kallikrein B til opnåelse af humant proinsulin. Når således den ønskede proteinsekvens er kendt, er det muligt at udvælge en aminosyresekvens som den specifikke spaltningssekvens, som genken-25 des specifikt af et kemisk eller enzymatisk spaltningsmiddel og ikke forekommer i den ønskede proteinsekvens.
Udvælgelse af den specifikke spaltningssekvens er vanskeligere, når det ønskede proteins aminosyresekvens er ukendt, i dette tilfælde foretrækkes det at benytte en sekvens med 30 mindst to aminosyrerester. Jo større antallet af aminosyrerester i den specifikke spaltningssekvens er, desto mindre er sandsynligheden for, at en lignende sekvens forekommer i det ønskede protein. Dette ville forøge sandsynligheden for alene at spalte det ønskede protein fra værtsdelen.
35 En anden faktor, som kan påvirke udvælgelsen af den specifikke spaltningssekvens, er hydrolysehastigheden for et bestemt spaltningsmiddel for lignende aminosyresekvenser. F.eks. vil enzym A genkende og spalte på carboxylsiden af C eller D i følgende aminosyresekvenser: -A-B-C- eller -A-B-D. Imidlertid er hydrolysehastigheden for den førstnævnte meget større end for 18 DK 166784 B1 den sidstnævnte. Lad os antage, at -A-B-C- vælges som den specifikke genkendelsessekvens, og at -A-B-D eksisterer i proteinet. Ved udtømmende hydrolyse med enzym A er det muligt at få spaltning på carboxylsiden af "C" og på carboxylsiden af "D". Imidlertid er hydrolysehastigheden for -A-B-C- meget større end for -A-B-D, så at det meste af de indledende spaltninger vil 5 foregå i -A-B-C, dvs. på carboxylsiden af C. Derfor kan en selektiv spaltning opnås ved det ønskede site, idet man tyer til en partiel hydrolyse. Skønt udbyttet kan blive nedsat, vil det stadig være stort nok til at retfærdiggøre brugen af enzym A i denne situation. Imidlertid er denne situation ikke den foretrukne.
10 Det udvidede aktive site er den vigtigste faktor at tage i betragtning ved valget af det rette enzym. Enzymet må være i stand til at genkende mindst to aminosyrerester og fortrinsvis flere end to. Dette vil nedsætte sandsynligheden for spaltning inde i det ønskede protein, som diskuteret ovenfor. F.eks. vil et enzym, som genkender aminosyresekvensen -X-Y-Z- og spalter på carboxylsiden af Z, være nyttigt i forbindelse med den foreliggende opfindelse. Et enzym, som 15 genkender en sekvens af flere aminosyrer, men kan spalte på carboxylsiden af to forskellige aminosyrer ved substitution i sekvensen, kan også være nyttigt, hvis hydrolysehastighedeme for de to er forskellige som diskuteret ovenfor. Et enzym, som spalter i den indre del af den specifikke spaltningssekvens, ville også være brugbart ved benyttelse i forbindelse med specifikke aminopeptidaser. F.eks. ville et enzym, som genkender aminosyresekvensen -A-B-C-D-20 og spalter på carboxylsiden af B, være nyttig ved anvendelse i forbindelse med en aminopepti-dase, som specifikt spalter C-D fra resten af det ønskede protein. Dette enzym ville også være nyttigt, hvis C-D- er N-enden af det ønskede protein.
Denne specifikke genkendelse og spaltning kan være funktionen af enzymet under dets nor-25 male enzymatiske betingelser eller under specielle restriktionsbetingelser. F.eks. har man vist, at aspergillopeptidase B har en meget snæver specificitet ved 0 eC, medens den har en ret bred specificitet ved 37 eC, se Spadari, S. m.fi., Biochim. Biophys. Acta, b. 359, s. 267, (1974). Følgende enzymer er eksempler på enzymer, som er nyttige i forbindelse med den foreliggende opfindelse: Enterokinase, kallikrein B eller chymosin. Enterokinase genkender sekven-30 sen X-(Asp)n-Lys-Y, hvor n = 2-4, og spalter på carboxylsiden af Lys. Bindingshastigheden forøges 10-20 gange, idet n forøges fra 2 til 4 som vist ved studier med syntetiske peptider, se Maroux, S. m.fi., citeret ovenfor. Det er for nylig blevet bestemt, at Glu eller en kombination af Asp og Glu kan benyttes i stedet for Asp, og at Arg kan benyttes i stedet for Lys, se Liepnieks, J., Ph.D. Thesis, Purdue University, (1978).
35
Kallikrein B genkender sekvensen X-Phe-Aig-Y og spalter på carboxylsiden af Arg, se Fiedler, F., citeret ovenfor. Chymosin genkender sekvensen X-Pro-His-Leu-Ser-Phe-Met-Ala-lle-Y og 19 DK 166784 B1 spalter Phe-Met-bindingen, se Vesser, S. m.fl. citeret ovenfor, og Vesser, S. m.fl., Biochim. Biophys. Acta, b. 481, s. 171, (1977).
Først vælges det rette spaltningsmiddel for et bestemt ønsket protein. Derpå syntetiserer man 5 kemisk en DNA-sekvens, som koder for den specifikke aminosyrespaltningssekvens, som dikteres af det rette spaltningsmiddel. DNA-sekvensen syntetiseres ved phosphotriestermeto-den som beskrevet af Itakura, K. m.fl., J. Biol. Chem., b. 250, s. 4592, (1975) og Itakura, K. m.fl., J. Am. Chem. soc., b. 97, s. 7326, (1975) eller andre passende syntetiske midler. Hvor f.eks. enterokinase er spaltningsmidlet, syntetiseres der en DNA-sekvens, som koder for Αερ-Ι 0 Asp-Asp-Asp-Lys. Denne DNA-sekvens ville da være GAK-| GAK2GAK3GAK1AAJ5. En foretrukket DNA-sekvens vil være baseret på en overvejelse af de codoner, som fortrinsvis benyttes i værtscellen. F.eks. i E. coli ville den foretrukne DNA-sekvens være GATGATGATGAT-AAA. DNA, som koder for et ønsket protein, isoleres under anvendelse af konventionel teknik såsom cDNA-teknikken, se f.eks. Ullrich, A. m.fl., citeret ovenfor, og Seeburg, P.H. m.fl., 15 citeret ovenfor. Den kemisk syntetiserede DNA-sekvens knyttes derpå til det isolerede DNA ved DNA-ligasekatalyseret stump-ende-ligering som beskrevet af Sgaramella, V. m.fl., Proc.
Nat. Acad. Sci. USA, b. 37, s. 1468, (1970). Dette specifikke spaltningslinker-gen-DNA behandles derpå ved tilsætning af en anden deoxynucleotidsekvens, som indeholder et restriktionssite og knytter denne anden sekvens til det specifikke spaltnings-linker-gen-DNA ved DNA-ligase-20 katalyseret stump-ende-ligering. Restriktionssitelinkere modificeres ifølge den foreliggende opfindelse til tilvejebringelse af 0,1 eller 2 yderligere deoxynucleotider. De sidste deoxynucle-otider tilvejebringer alle tre læserammer. Alternativt kan linkere syntetiseres, som indeholder en restriktionslinker, 0, 1 eller 2 yderligere deoxynucleotider og en specifik spaltningslinker.
Denne sammensatte linker kunne da knyttes til den isolerede kodningssekvens ved et enkelt 25 stump-ende-ligeringstrin. Eller to DNA-sekvenser kunne syntetiseres, den ene indeholdende en restriktionslinker og 0,1 eller 2 deoxynucleotider og den anden indeholdende den specifikke spaltningslinker. Disse to sekvenser kunne forenes ved stump-ende-ligering og derpå knyttes til den isolerede kodningssekvens ved stump-ende-ligering. Slutproduktet, dvs. restriktionslinker - 0,1 eller 2 deoxynucleotider - specifik spaltningslinker - DNA-kodningssekvens, indsættes 30 derpå i en transfervektor (i det følgende blot benævnt en vektor) under anvendelse af konventionel teknik. Det vil forstås af fagfolk, at ovenstående trin til stump-ende-ligering vil knytte linkersekvenserne til begge ender af kodningssegmentet. Da imidlertid sidstnævnte vil indeholde eller blive forsynet med en temineringscodon, vil de kodningssekvenser, som er tilknyttet længere henne i bevægelsesretningen for translationen fra termineringscodonen, forblive 35 utranslaterede. En mikroorganisme kan derpå transformeres med transfervektoren, og ekspression af genet opnås under passende betingelser. Det fusionsprodukt, som fås fra ekspressionen, renses, fortrinsvis som beskrevet nedenfor, og spaltes ved hjælp af udvalgte midler.
20 DK 166784 B1
Rensningssegmenter, der koder for aminosyresekvenser, som giver let rensning, kan inkluderes som linkere, så at den tilføjede rensningsdel er på N-terminalsiden af knudepunktbindingen og således fjernes efter specifik spaltning. Sådanne linkere kan separat ligeres eller inkorporeres med andre linkersegmenter i en enkelt sammensat linker.
5
De arter af aminosyresekvenser, som givér let rensning, omfatter polyanioniske segmenter (Asp/Glu)5_20 og polykationiske segmenter (Lys/Arg)5_2o, som let bindes til ionbyttere. Et polyanionisk segment kan tjene det dobbelte formål som en peptidokinase-(udvidet sitese-kvens), hvis det er udstyret med en C-terminallysin- eller -argininrest. Et hydrofobt segment 10 kan være (Leu/lleu/Val/Phe)io-20.·En mere sPec*fik enkelttrinsrensning kan opnås ved brug af affinitetschromatografi. I princippet kan affinitetsadsorbenten binde en vilkårlig del af det eks-primerede protein.
Fortrinsvis er den specifikke binding rettet mod den del, som er bestemt til at fjernes fra det 15 ønskede protein. Idet man har et givet fusionsprotein, kan den specifikke affinitet være en im-munokemisk binding af den procaryote del. Alternativt kan specificiteten tilvejebringes af rensningssegmentet. Det ønskede protein fjernes derpå fra det adsorberede kompleks ved specifik spaltning, og den uønskede del forbliver adsorberet og fraskilles let. Andre eksempler vil være indlysende for fagfolk.
20
Tilvejebringelsen af et yderst hydrofobt rensningssegment tillader også hurtig og specifik adskillelse ved absorption til hydrofobe (omvendt fase) fastfasebærere ved selektiv fældning og ved differentiel opløselighed i ikke-vandige medier.
25 Man kan også med linkere opnå ekspression af et kodningssegment som et ikke-fusionsprotein.
Den nødvendige linker for en sådan direkte ekspression er et ekspressionskontrolsegment omfattende en promotorsekvens, en ribosomalbindingssitesekvens og en spacer på 3-11 nu-cleotider. Ethvert kodningssegment, som tilvejebringer en initieringscodon (ATG) i en afstand på 3-11 nucleotider fra den ribosomale bindingssitesekvens, udtrykkes i korrekt læseramme.
30 Det er ikke nødvendigt at tilvejebringe et kodningssegment med ATG som sin 5'-ende, forudsat at ATG-sekvensen befinder sig inden for 3-11 nucleotiders afstand fra det ribosomale bindingssite i linkeren. Et eksempel på et procaryot ribosomalt bindingssite ville have følgende sekvens i sin plusstreng: L(n)TAGGAGGATCC, hvor L er A, T, C eller G, og n kan være 0, 1 eller 2. Af bekvemmelighedsgrunde betegnes DNA-sekvenser ved deres plusstreng. Imidlertid 35 vil det forstås, at alle sådanne linkersegmenter også har en minusstreng med komplementær basesekvens og modsat polaritet. Foranstående sekvens omfatter følgende elementer: en ribosomal bindingssitesekvens, som er praktisk taget homolog med 3-enden af 16S-riboso-malt-RNA som vist af Shine og Balgamo, Proc. Nat. Acad. Sci. USA, b. 71, s. 1342, (1974) og 21 DK 166784 B1 af Steitz og Jakes, Proc. Nat. Acad. Sci. USA, b. 72, s. 4734, (1975). De hidtil undersøgte ribosomale bindingssites er variable i deres grad af homologi med 16S-ribosomal-RNA-se-kvensen. Det maximale antal komplementære baser, som man hidtil har fundet, er syv. Den ovenfor beskrevne sekvens indeholder seks. Den ovenfor beskrevne sekvens indeholder også 5 en stopcodon (TAG), som er beregnet til at hindre gennemlæsningstranslation af ethvert budskab, som er initieret andetsteds. For at stopcodonen skal være i fase med det budskab, som skal termineres, er sekvensen forsynet med 0,1 eller 2 yderligere nucleotider. Inkluderingen af en termineringscodon er muligvis ikke nødvendig i visse tilfælde. En universel terminator, som tilvejebringer terminering i alle tre faser, tilvejebringes af sekvensen TAGLTAGLTAG. Det 10 ovenfor beskrevne ribosomale bindingssitesegment indeholder også en BamHI-linkersekvens, GGATCC. Linkeren er nyttig for tilknytning af yderligere sekvensmateriale til det ribosomale bindingssitesegment, til identificering af DNA-sekvenser, i hvilke linkeren er blevet indført, og i nogle tilfælde til indsættelse af den ribosomale bindingssitelinker.
15 Til forening af det ribosomale bindingssitesegment med kodningssegmentet ønskes en spacer- sekvens på 3-11 basepar. Dette kan mest bekvemt gøres ved stump-ende-ligering af en af de i handelen gående restriktionssitelinkere (Scheller m.fl., citeret ovenfor). Disse linkere kan modificeres efter ønske ved behandling med den rette restriktionsendonuclease efterfulgt af fyldning eller trimning af de således dannede uparrede ender til tilvejebringelse af den ønskede 20 spacersekvens. F.eks. kan EcoRI-linkeren GGAATTCC behandles med endonuclease-EcoRI efterfulgt af DNA-polymerase til udfyldning af den uparrede ende til tilvejebringelse af sekvensen AATTCC. Den ribosomale bindingssitesekvens, som bærer en BamHI-linkersekvens, behandles ligeledes med BamHI-endonuclease og DNA-polymerase, så at dens struktur nu er L(n)TAGGAGGATC. Stump-ende-ligering tilvejebringer sekvensen L(n)TAGGAGGATCAA-25 TTCC. Hvis et kodningssegment med en terminal ATG-initieringscodon tilknyttes, vil initieringscodonen være otte basepar fra det ribosomale bindingssite.
Funktionen af en ribosomal bindingssitelinker vil variere i afhængighed af det valgte indsættelsessite i vektoren. Hvis indsættelsen afbryder et normalt translateret budskab, vil den riboso-30 male bindingssitelinker sandsynligvis tjene som et reinitieringspunkt for transskription. Imidlertid kan effektiviteten af translationen muligvis forbedres ved at foretage indsættelsen i et site nær en eksisterende kendt promotor i retningen for normal transskription. F.eks. vil indsættelse i et site ved siden af promotoren i tryptophanoperonen resultere i direkte translation af det indsatte segment i stedet for de normalt eksprimerede tryptophanoperonproteiner under kontrol 35 af tryptophanpromotoren. Hvis man ønsker at indsætte kodningssegmentet i en tavs (normalt ikke udtrykt) region af vektoren, vil det være nødvendigt at tilvejebringe en promotorsekvens til sikring af den rette transskriptionsinitiering.
22 DK 166784 B1
Sekvenser, der kan fungere som initiatorer for procaryot transskription, kendes, se f.eks. Prib-now, D., Proc. Nat. Acad. Sci. USA, b. 72, s. 784, (1975). F.eks. synes sekvensen TATJATJ, hvor J er A eller G, at tilvejebringe promotorfunktion. I eucaryoter findes sekvensen TATAAA eller lignende sekvenser TATAAT, TATAAG i regionen før transskriptionsinitiering og er sand-5 synligvis en del af en promotorregion, se Gaunon, F. m.fl., Nature, b. 278, s. 428-34, (1979). Imidlertid kan andre nucleotider uden for den beskrevne sekvens modificere dens promotorfunktionseffektivitet på måder, som ikke i øjeblikket kan forudsiges. Medens det derfor i øjeblikket er muligt at tilvejebringe en ekspressionskontrolsegmentlinker, som omfatter både en syntetisk promotor og syntetiske ribosomale bindingssitesegmenter, foretrækkes det at benytte 10 naturligt forekommende promotorer, enten separat klonede eller ved indsættelse ved siden af.
En ribosomal bindingssitelinker, som egner sig til ekspression i eucaryote celler, er udrustet med et segment, som er homologt med terminalsekvenser i det 18S-ribosomal-RNA, som findes i eucaryoter, Hagenbuchle m.fl., Cell., b. 13, s. 551, (1978). Sekvensen GGATCCTTCC 15 kan syntetiseres simpelthen ved forening af sekvensen TTCC med 3'-enden af den i handelen gående BamHI-linker. Den resulterende sekvens GGATCCTTCC har otte baser, som er komplementære til 18S-ribosomal-RNA-sekvensen, og skulle derfor tilvejebringe et udmærket initieringssite for translation. Teknik i lighed med den tidligere åbenbarede kan benyttes til tilvejebringelse af de fornødne spacemucleotider. Desuden kan den ovenfor beskrevne eucaryote 20 ribosomale bindingssitesekvens forenes med sig selv ved stump-ende-ligering til opnåelse af to ribosomale bindingssites, det ene nær initieringscodonen, det andet 10 basepar borte. På lignende måde kan den procaryote ribosomale bindingssitelinker, som er beskrevet ovenfor, benyttes som spacer. Denne sidste tilvejebringer yderligere en termineringscodon, hvis det skulle vise sig ønskværdigt at forhindre gennemlæsningstranslation.
25
Opfindelsen skal forklares nærmere i forbindelse med eksemplerne.
I eksemplerne er af bekvemmelighedsgrunde henvist til en procaryot vært såsom E. coli, men de omhandlede linkere kan også benyttes til ekspression hos en eucaryot vært.
30
Eksempel 1
Dette eksempel beskriver fremstillingen af et klonet humant proinsulingen, syntese af en specifik spaltningslinker og foreningen af de to.
35
Der fremstilles en isoleret og renset (i det følgende "klonet") DNA-sekvens, som koder for humant proinsulin.
23 DK 166784 B1
Enterokinase vælges som det specifikke spaitningsmiddel. Den specifikke spaltningssekvens for enterokinase er Nhtø-Asp-Asp-Asp-Asp-Lys-COOH. DNA-sekvensen af plusstrengen, som koder for denne aminosyresekvens, er 5-GATGATGATGATAAA-3'. (Plusstrengen defineres som den streng, hvis nucleotidsekvens svarer til mRNA-sekvensen. Minusstrengen er den 5 streng, hvis sekvens er komplementær til mRNA-sekvensen). Denne DNA-sekvens er den specifikke linkersekvens, og den syntetiseres kemisk under anvendelse af phosphotrieseterme-toden ifølge Itakura, K. m.fl., citeret ovenfor (side 19).
Ovenstående sekvens stump-ende-ligeres til den i handelen gående Hindlll-linker, der, når den 10 spaltes med Hindlll-endonuclease, giver en specifik spaltningslinker, som egner sig til indsættelse i et Hindi Il-sæde. Nucleotidsekvensen i de to strenge i produktlinkeren er AGCTTGGATGAT GATGATAAA ACCTACTACTACTATTT 15
Ifølge konvention er den øverste streng plusstrengen, og den er vist med 5-enden til venstre og 3-enden til højre, medens den nederste streng har den modsatte polaritet. Ekspresion i en af de andre to læserammer tilvejebringes ved forudgående modifikation af Hindlll-iinkeren, enten ved fjernelse af et af de 3'-terminale G'er eller ved tilføjelse af et yderligere 3-terminalt G.
20 Den fremkomne sekvens af den sammensatte linker vil være et nucleotid mindre eller et nu-cleotid større, respektive, til tilvejebringelse af ekspression af den specifikke spaltningssitese-kvens og det kodningssegment, hvortil det er knyttet i korrekt læseramme.
Den specifikke spaltningslinker bliver stump-ende-ligeret med det klonede humane proinsulin-25 gen til frembringelse af en deoxynucleotidsekvens for plusstrengen indeholdende: 5'-Hindlll-linker - specifikspaltningslinker - humant proinsulingen-3’.
Eksempel 2
Dette eksempel beskriver kloningen af deoxynucleotidsekvensen fra eksempel 1 ind i et pas-30 sende ekspressionsplasmid og ekspressionen af den nævnte kodningssekvens.
Det specifikke spaltningslinkerhumanproinsulingen indsættes i en ekspressionstransfervektor.
Når indsættelsen sker i den korrekte orientering med hensyn til initiering af translation ved indsættelsessitet, og indsættelsen er i læserammefase med promotoren og ribosom-bindingssi-35 tet, syntetiseres proteinproduktet af det klonede kodningssegment ved aktivt at metabolisere værtscellerne, som transformeres ved hjælp af transfervektoren.
Når det klonede DNA-kodningssegment koder for et peptid eller et lille protein, foretrækkes det, at ekspressionstransfervektoren indeholder en del af et procaryot gen mellem promotoren og 24 DK 166784 B1 indsættelsessitet. Proteinproduktet i dette tilfælde er et fusionsprodukt. Fusionsproteinet søger at stabilisere det fremmede protein, som kodes af det indsatte gen i det intracellulære miljø i værten. Ekskretion af fusionsproduktet fra værtscellen kan også ske ved fusion med visse ekskreterbare værtsproteiner såsom beta-lactamase.
5
Der er blevet udviklet ekspressionsplasmider, hvor ekspressionen kontrolleres af lac-promoto-ren (Itakura, K. m.fl., Science, b. 198, s. 1056, (1977), Ullrich, A. m.fl., Excerpta Medica, (1979)) og af beta-lactamasepromotoren.
10 Den foretrukne metode til konstruktion af et ekspresionsplasmid er kemisk at syntetisere en DNA-sekvens indeholdende et restriktionssite, som findes inde i beta-lactamasegenet, og n-deoxynucleotider, hvor n = 0,1 eller 2, til tilvejebringelse af den rette læseramme. Denne sekvens stump-ende-ligeres derpå med det modificerede humane proinsulingen, som er fremstillet i eksempel 1. Denne nye DNA-sekvens og transfervektoren behandles derpå med samme 15 restriktionsenzym, se Heyneker, H.L. m.fl., citeret ovenfor, og Scheller, R.H. m.fl., citeret ovenfor. Den hidtil ukendte DNA-sekvens indsættes derpå i den transfervektor, som benyttes til transformation af en værtsmikroorganisme. En indsat DNA-sekvens i plusstrengen kan generelt vises som følger: S'-restriktionslinker-b^-specifik spaltningslinker-klonet gen-3', hvor b og c kan være en vilkårlig deoxynucleotidbase, og n og m er 0 eller hele tal, idet n+m = 0, 1 20 eller 2.
Ekspression detekteres ved måling af et produkt, som er i stand til at binde immunokemisk til antiinsulinantistof eller antiproinsulinantistof. Fusionsproteiner, som angiver ekspression, detekteres ved sammenligning af molekylvægtene af værtsproteinet, som bidrager med N-terminal-25 delen af fusionsproteinet i værtscellen, som er transformeret ved ekspressionsplasmider med og uden en indsættelse.
Fusionsproteinet til dette bestemte eksempel med formlen X-Asp-Asp-Asp-Asp-Lys-Y, hvor X er en del af beta-lactamaseproteinet, og Y er det humane proinsulinprotein, renses under an-30 vendelse af konventionel teknik. Fusionsproteinet spaltes under anvendelse af enterokinase efterfulgt af den procedure, som er beskrevet af Liepnieks, citeret ovenfor. Gelelektroforese udføres til bestemmelse af, om den rette spaltning er opnået. Humant proinsuiin tjener som standard. Der fås 2 bånd fra spaltningsproduktet, af hvilke det ene vandrer med den humane proinsulinstandard. Det humane proinsuiin renses derpå under anvendelse af konventionel 35 teknik.
25 DK 166784 B1
Eksempel 3
Der tilvejebringes en specifik rensningslinker ved modifikation af den linker, som er beskrevet i eksempel 1 med sekvensen 5'-GATGATGATGATAAA-3'. Sekvensen modificeres ved 3'-enden ved tilvejebringelse af et C eller fortrinsvis et T i stedet for A. Modifikationen kan udføres ved 5 brug af T^DNA-polymerase i nærvær af ATP og CTP til fjernelse af det 3'-terminale A efterfulgt af S1-nuclease til fjernelse af det 5'-terminale T på den komplementære streng. Et C eller fortrinsvis et T kan føjes til 3-enden, enten ved enzymatiske eller kemiske midler. Den fremkomne sekvens koder for aminosyrerne AspAspAspAspAsn. Den modificerede nucleotidse-kvens kobles derpå ved stump-ende-ligering til sin umodificerde homolog til dannelse af 5'-10 GAT GAT GAT GATAAT GATGAT GAT GATAAA-3'.
Ovenstående sekvens forbindes derpå med en Hindlll-linker som beskrevet i eksempel 1 og forbindes yderligere med et kodningssegment som beskrevet i eksempel 1.
15 Når linkeren eksprimeres i et fusionsprotein som beskrevet i eksempel 2, vil den medføre, at fusionsproteinet indeholder en polyanionisk del af en signifikant længde.
Fusionsproteinet vil derfor bindes tæt til anionbyttermaterialer såsom diethylaminoethylcellu-lose, selv under ionstyrkebetingelser, hvor praktisk taget alle andre proteiner i cellelysatet 20 elueres.
Fusionsproteinet elueres derpå enten fra ionbytteren eller behandles in situ med enterokinase. I det sidstnævnte tilfælde sker der fortrinsvis spaltning ved knudepunktbindingen, og det ønskede protein frigøres fra ionbytteren. Den procaryote del, som bærer den polyanioniske del, for-25 bliver bundet til ionbytteren. Når fusionsproteinet elueres fra ionbytteren før enterokinasebe-handling, vil inkubation med enterokinase spalte fortrinsvis knudepunktbindingen, og den procaryote del kan fjernes fra reaktionsblandingen ved fortrinsmæssig binding til en ionbytter som ovenfor. Ved ovenstående procedure opnås praktisk taget kvantitativ rensning af det ønskede protein i to trin.
30
Eksempel 4 I dette eksempel lettes ekspressionen af en kodningssekvens såsom den sekvens, som koder for humant proinsulin, ved brug af en ribosomal bindingssitelinker. Nucleotidsekvensen AGGA syntetiseres kemisk ved metoden ifølge Itakura m.fl., citeret ovenfor. Den syntetiske sekvens 35 forenes derpå kemisk ved stump-ende-ligering med BamHI-linkeren, GGATCC, som fås i handelen fra New England BioLabs, Cambridge, Massachusetts. Det fremkomne segment, AGG-AGGATCC, modificeres ved behandling med BamHI-endonuclease efterfulgt af DNA-polyme-rase I til udfyldning af den enkeltstrengede fremstikkende ende til dannelse af AGGAGGATC.
26 DK 166784 B1 På lignende måde behandles kodningssegmentet, først ved addition af en BamHl-linker og dernæst modifikation af linkeren med BamHI-endonuclease og DNA-polymerase I. De modificerede segmenter forenes derefter med hinanden ved stump-ende-ligering til dannelse af sekvensen AGGAGGATCGATCC-kodningssegment. Starten af kodningssegmentet befinder sig 5 da otte baser fra det ribosomale bindingssite.
Sekvensen: ribosomalt bindingssite - spacer - kodningssegment (humant proinsulin) modificeres yderligere med tilføjelsen af den rette restriktionslinker, afhængende af det ønskede indsættelsessite. F.eks. benyttes EcoRI-linker til indsættelse i det gen, som koder for beta-galac-10 tosidase. I modsætning til tidligere resultater resulterer ekspression imidlertid ikke i produktion af et fusionsprotein, da den ribosomale bindingssitelinker virker til at reinitiere translation, så at det segment, som koder for humant proinsulin, udtrykkes i sig selv. Ekspressionsproduktet detekteres ved immunokemiske midler.
15 Eksempel 5
Den ribosomale bindingssitelinker fra eksempel 4, det specifikke rensningssegment fra eksempel 3 og den specifikke spaltningslinker fra eksempel 1 kombineres ved stump-ende-ligering til dannelse af en sammensat linker med sekvensen AGGAGGATCGATCCATGGATGATG-ATGATAATGATGATGATGATAAA. Beskrevet i funktionelle udtryk har den sammensatte linker 20 sekvensen: ribosomalt bindingssite - spacer - startcodon - rensningsdel - specifikt spaltningssite - kodningssegment. Denne sammensætning modificeres yderligere ved tilknytning af en EcoRI-linker til lettelse af indsættelsen i R-j-sitet af et plasmid såsom pBGP 120, som er beskrevet af Poliski, B. m.fl., citeret ovenfor. Transformation med den fremkomne transfervektor tillader ekspression af humant proinsulin med en polyanionisk N-terminaldel. Ekspressionspro-25 duktet renses derpå som beskrevet i eksempel 3, hvorefter følger specifik spaltning under anvendelse af enterokinase. Den kombinerede teknik resulterer i produktion af højtrenset humant proinsulin. Den væsentlige fordel ved den kombinerede teknik ligger i, at når først de rette linkere er blevet knyttet til kodningssegmentet, sker ekspression af kodningssegmentet og specifik rensning af ekspressionproduktet ved forholdsvis simple procedurer, som kan udføres uden 30 vanskelighed i større målestok.
Som et yderligere alternativ kan den ovenfor beskrevne sammensatte linker modificeres yderligere før additionen af restriktionssitelinkeme ved addition af en sekvens, som er i stand til at fungere som promotor, f.eks. TATGATG. Brugen af en sådan promotorsekvens i kombination 35 med det netop beskrevne linkersegment gør det muligt at opnå ekspression med en større variation af indsættelsessites på transfervektoren, indbefattet dem, som normalt er tavse.

Claims (3)

27 DK 166784 B1
1. Rekombinant DNA-sekvens omfattende tre ikke naturligt sammenhængende segmenter, k e n d e t e g n e t ved, at det første segment koder for et eucaryot protein og støder op til 5 et andet segment, som koder for en specifik spaltningssekvens bestående af mindst to aminosyrer, og som støder op til et tredie segment, der koder for en rensningssekvens i form af et polykationisk peptid, et polyanionisk peptid eller et hydrofobt peptid, som ikke oprindeligt har været forbundet med det eucaryote protein, idet DNA-sekvensens ekspressionsprodukt spaltes specifikt af mindst et enzym udvalgt blandt enterokinase, kallikrein B og chymosin ved den 10 peptidbinding, som sammenkæder det eucaryote protein og den specifikke spaltningssekvens.
2. Mikroorganisme, kendetegnet ved, at den indeholder den rekombinante DNA-sekvens ifølge krav 1.
3. Fremgangsmåde til fremstilling af et færdigudviklet, eucaryot protein, kendeteg- n e t ved, at en mikroorganisme ifølge krav 2 dyrkes, at fusionsproteinet udvindes og spaltes under anvendelse af et enzym valgt blandt enterokinase, kallikrein B og chymosin, hvorefter det ønskede protein oprenses. 20
DK088881A 1980-02-29 1981-02-27 Rekombinant dna-sekvens, en mikroorganisme indeholdende sekvensen og en fremgangsmaade til fremstilling af et eucaryot protein DK166784B1 (da)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12587880A 1980-02-29 1980-02-29
US12587880 1980-02-29

Publications (2)

Publication Number Publication Date
DK88881A DK88881A (da) 1981-08-30
DK166784B1 true DK166784B1 (da) 1993-07-12

Family

ID=22421874

Family Applications (1)

Application Number Title Priority Date Filing Date
DK088881A DK166784B1 (da) 1980-02-29 1981-02-27 Rekombinant dna-sekvens, en mikroorganisme indeholdende sekvensen og en fremgangsmaade til fremstilling af et eucaryot protein

Country Status (10)

Country Link
EP (1) EP0035384B1 (da)
JP (1) JPH0669375B2 (da)
KR (1) KR860001305B1 (da)
AU (1) AU545394B2 (da)
CA (1) CA1200773A (da)
DE (1) DE3176248D1 (da)
DK (1) DK166784B1 (da)
IE (1) IE53311B1 (da)
IL (1) IL62237A (da)
ZA (1) ZA811308B (da)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1202581A (en) * 1980-03-27 1986-04-01 Saran A. Narang Adaptor molecules for dna and their application to synthesis of gene-derived products
US4338397A (en) * 1980-04-11 1982-07-06 President And Fellows Of Harvard College Mature protein synthesis
NZ199391A (en) * 1981-01-02 1985-12-13 Genentech Inc Chimeric polypeptides comprising a proinsulin sequence,and preparation by recombinant dna technique;production of human insulin
US4880911A (en) * 1982-03-19 1989-11-14 G. D. Searle & Co. Fused polypeptides and methods for their detection
US4532207A (en) * 1982-03-19 1985-07-30 G. D. Searle & Co. Process for the preparation of polypeptides utilizing a charged amino acid polymer and exopeptidase
JPS58183659A (ja) * 1982-03-31 1983-10-26 ジェネテイックス、インスチチュ−ト、インコ−ポレ−テッド 修飾プロインシュリン前駆体、これを暗号化するdna配列およびそれらの産生方法
GB2121054B (en) * 1982-05-25 1986-02-26 Lilly Co Eli Cloning vectors for expression of exogenous protein
WO1984001153A1 (en) * 1982-09-15 1984-03-29 Collaborative Res Inc Production of interferon in yeast by use of invertase promoter
SE8300693L (sv) * 1983-02-09 1984-08-10 Sven Lofdahl Sett att framstella och isolera proteiner och polypeptider samt en hybridvektor for detta
ATE220101T1 (de) * 1983-04-25 2002-07-15 Chiron Corp Hybrid-dns-synthesis von reifen insulinähnlichen wachstumsfaktoren
DE3316601A1 (de) * 1983-05-06 1984-11-08 Battelle-Institut E.V., 6000 Frankfurt Verfahren zur immobilisierung von proteinen oder enzymen
GB8314362D0 (en) * 1983-05-24 1983-06-29 Celltech Ltd Polypeptide and protein products
JP2551746B2 (ja) * 1983-07-19 1996-11-06 サントリー株式会社 改良プラスミドベクタ−およびその利用
US4935370A (en) * 1983-12-23 1990-06-19 Pfizer Inc. Expression plasmids for improved production of heterologous protein in bacteria
EP0147178B1 (en) * 1983-12-23 1991-08-14 Pfizer Inc. Expression plasmids for improved production of heterologous protein in bacteria
US4782137A (en) * 1984-01-24 1988-11-01 Immunex Corporation Synthesis of protein with an identification peptide, and hybrid polypeptide incorporating same
US4703004A (en) * 1984-01-24 1987-10-27 Immunex Corporation Synthesis of protein with an identification peptide
DK108685A (da) * 1984-03-19 1985-09-20 Fujisawa Pharmaceutical Co Vaekstfaktor i
US4745179A (en) * 1984-04-02 1988-05-17 Fujisawa Pharmaceutical Co., Ltd. 59 Valine insulin-like growth factor I and process for production thereof
JPS61501746A (ja) * 1984-04-05 1986-08-21 ライフ テクノロジ−ズ,インコ−ポレイテツド 核酸の固定化法
GB8412517D0 (en) * 1984-05-16 1984-06-20 Nagai K Recombinant fusion proteins
EP0163573B1 (en) * 1984-05-24 1989-09-06 Merck & Co. Inc. Site-specific proteolysis by renin
WO1986000619A1 (en) * 1984-07-13 1986-01-30 Chiron Corporation Prepro insulin-like growth factors i and ii
JPH062074B2 (ja) * 1984-07-27 1994-01-12 國男 山根 オリゴペプチドの製法
EP0173254B1 (en) * 1984-08-23 1991-07-24 Hans Joachim Wolf Dna sequences of the ebv genome, recombinant dna molecules, processes for producing ebv-related antigens, diagnostic compositions and pharmaceutical compositions containing said antigens
US5149657A (en) * 1984-09-13 1992-09-22 Enzon Labs Inc. Escherichia coli expression vector encoding bioadhesive precursor protein analogs comprising three to twenty repeats of the decapeptide (Ala-Lys-Pro-Ser-Tyr-Pro-Pro-Thr-Tyr-Lys)
AU589935B2 (en) * 1985-01-07 1989-10-26 Celltech Limited Recombinant DNA processes for the production of tissue inhibitor of metalloproteinase
JPS61264000A (ja) * 1985-03-21 1986-11-21 イミユネツクス コ−ポレイシヨン 標識ペプチドによるタンパク質の合成
DK151585D0 (da) * 1985-04-03 1985-04-03 Nordisk Gentofte Dna-sekvens
US5087564A (en) * 1985-06-20 1992-02-11 Monsanto Company Release of recombinant peptides from polypeptides using V8 endopeptidase
JPS62135500A (ja) * 1985-06-20 1987-06-18 モンサント コンパニ− ポリペプチドからのペプチドの放出
DE3523701A1 (de) * 1985-07-03 1987-01-08 Bayer Ag Verfahren zur herstellung von proteinen und polypeptiden
JPS62248489A (ja) * 1986-04-22 1987-10-29 Ajinomoto Co Inc 組換えdna及びそれを用いるポリペプチドの製造法
EP0244147A3 (en) * 1986-04-28 1989-04-05 Merck & Co. Inc. Purification process for hybrid proteins
FR2599380A1 (fr) * 1986-05-29 1987-12-04 Centre Nat Rech Scient Vecteur d'exportation de proteines chez escherichiacoli, bacteries transformees et procede pour la preparation de proteines
US5011912A (en) * 1986-12-19 1991-04-30 Immunex Corporation Hybridoma and monoclonal antibody for use in an immunoaffinity purification system
US4987070A (en) * 1987-03-04 1991-01-22 Suntory Limited Use of a 97 amino acid leader sequence from the E. coli B-galactosidase gene for the production of hanp and hptc as fusion proteins
US5013653A (en) * 1987-03-20 1991-05-07 Creative Biomolecules, Inc. Product and process for introduction of a hinge region into a fusion protein to facilitate cleavage
US5215896A (en) * 1987-03-20 1993-06-01 Creative Biomolecules, Inc. Leader sequences for the production of recombinant proteins
AU605291B2 (en) * 1987-03-20 1991-01-10 Micromet Ag Process for the purification of recombinant polypeptides
US5416007A (en) * 1987-03-20 1995-05-16 Creative Biomolecules, Inc. Enhanced proteolytic cleavage of recombinant fusion proteins
DE3716957A1 (de) * 1987-05-20 1988-12-01 Boehringer Mannheim Gmbh Expressionsvektor zur regulierbaren expression von fremdgenen in prokaryonten
JPH01117791A (ja) * 1987-10-31 1989-05-10 Wakunaga Pharmaceut Co Ltd 造成遺伝子
US5270176A (en) * 1987-11-20 1993-12-14 Hoechst Aktiengesellschaft Method for the selective cleavage of fusion proteins with lysostaphin
US5156968A (en) * 1988-06-24 1992-10-20 Genentech, Inc. Purified yeast ubiquitin hydrolase
DE3843894A1 (de) * 1988-12-24 1990-06-28 Behringwerke Ag Plasmide mit translations-start-stop-start codon-konfiguration zur expression von proteinen in e.coli
US5747334A (en) * 1990-02-15 1998-05-05 The University Of North Carolina At Chapel Hill Random peptide library
US5498538A (en) * 1990-02-15 1996-03-12 The University Of North Carolina At Chapel Hill Totally synthetic affinity reagents
CA2075974C (en) * 1990-02-15 2001-02-06 Dana M. Fowlkes Totally synthetic affinity reagents
JPH07108232B2 (ja) * 1990-10-09 1995-11-22 エム・ディ・リサーチ株式会社 ペプチド又は蛋白質の製造方法
US5646016A (en) * 1991-02-06 1997-07-08 Genetics Institute, Inc. Peptide and protein fusions to thioredoxin, thioredoxin-like molecules, and modified thioredoxin-like molecules
SE468050C (sv) * 1991-03-15 1998-04-27 Pharmacia & Upjohn Ab Rekombinant derivat av human faktor VIII
DK0618813T3 (da) * 1992-09-16 2002-03-11 Univ Tennessee Res Corp Antigen for M-hybridprotein og bærer for gruppe A streptococcal vaccine
ATE241642T1 (de) * 1993-02-04 2003-06-15 Denzyme Aps Verbessertes verfahren zur rückfaltung der proteine
US6147056A (en) * 1995-06-06 2000-11-14 Trustees Of Boston University Use of locally applied DNA fragments
US7094766B1 (en) 1995-06-06 2006-08-22 Trustees Of Boston University Use of locally applied DNA fragments
US20030032610A1 (en) 1996-06-03 2003-02-13 Gilchrest Barbara A. Method to inhibit cell growth using oligonucleotides
US6379903B1 (en) 1999-10-08 2002-04-30 Sigma-Aldrich Co. Purification of recombinant proteins fused to multiple epitopes
EP1274410A2 (en) 2000-03-31 2003-01-15 Trustees Of Boston University Use of locally applied dna fragments
WO2009058564A2 (en) 2007-11-01 2009-05-07 Maxygen, Inc. Immunosuppressive polypeptides and nucleic acids
NZ598458A (en) * 2009-08-27 2014-03-28 Novartis Ag Hybrid polypeptides including meningococcal fhbp sequences
JP2016518855A (ja) * 2013-05-24 2016-06-30 ノヴォ ノルディスク アー/エス 融合プロテアーゼ

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT373279B (de) * 1977-11-08 1984-01-10 Genentech Inc Verfahren zur herstellung eines rekombinationsclonbildungstraegers
AT373280B (de) * 1977-11-08 1984-01-10 Genentech Inc Verfahren zur erzeugung eines spezifischen polypeptids aus einem mikrobiellen rekombinations -clonbildungstraeger
US4411994A (en) * 1978-06-08 1983-10-25 The President And Fellows Of Harvard College Protein synthesis
US4342832A (en) * 1979-07-05 1982-08-03 Genentech, Inc. Method of constructing a replicable cloning vehicle having quasi-synthetic genes

Also Published As

Publication number Publication date
AU6792281A (en) 1981-09-03
DK88881A (da) 1981-08-30
EP0035384A3 (en) 1982-09-08
IE53311B1 (en) 1988-10-12
CA1200773A (en) 1986-02-18
IL62237A0 (en) 1981-05-20
EP0035384A2 (en) 1981-09-09
KR830005350A (ko) 1983-08-13
ZA811308B (en) 1982-03-31
EP0035384B1 (en) 1987-06-10
JPS56166200A (en) 1981-12-21
AU545394B2 (en) 1985-07-11
JPH0669375B2 (ja) 1994-09-07
KR860001305B1 (ko) 1986-09-11
DE3176248D1 (en) 1987-07-16
IL62237A (en) 1985-06-30
IE810433L (en) 1981-08-29

Similar Documents

Publication Publication Date Title
DK166784B1 (da) Rekombinant dna-sekvens, en mikroorganisme indeholdende sekvensen og en fremgangsmaade til fremstilling af et eucaryot protein
US4769326A (en) Expression linkers
JP2686090B2 (ja) 新規融合蛋白質およびその精製方法
JP2694840B2 (ja) ポリペプチドを微生物により発現させる方法
KR100316347B1 (ko) 대장균엔테로톡신ⅱ신호펩티드의변형체와인체성장호르몬의융합단백질을발현하는재조합미생물및그를이용한인체성장호르몬의제조방법
JPH08333395A (ja) ヒトプロインスリン誘導体およびヒトインスリンの製造方法
JP2001525662A (ja) 合成繰り返しdnaの調製方法
JP2000135092A (ja) オリゴペプチド反復単位を有する大ポリペプチド
JPH0376580A (ja) 大腸菌発現ベクターとそれを利用した抗ウイルス性タンパク質の製造方法
JP2637393B2 (ja) プロインシュリンおよびプレプロインシュリン産生暗号を有するヒト遺伝子
JPH1084978A (ja) 改良されたリボフラビン生産
JP2546979B2 (ja) 組換えd−ヒダントイナーゼ、その生産方法および使用
US5459051A (en) Methods and vectors for over-expression of ubiquitin fusion proteins in host cells
EP0170266B1 (en) Process for producing protein, and vector, recombinant dna and transformant used therefor
CN103275917A (zh) 一种tev蛋白酶表达工程菌及其构建和应用
CN116478969A (zh) 胶原酶突变体、促进重组胶原酶分泌表达的方法及其应用
CA1201075A (en) Expression linkers
CA1302321C (en) Preparation of polypeptides
JP5020487B2 (ja) 融合タンパク質発現用新規dna及び該dnaを用いたタンパク質の製造方法
EP0532043B1 (en) Factor Xa linker DNA
WO2009054754A1 (fr) Plasmide recombinant phins21 codant une protéine hybride avec la proinsuline humaine, souche de bactéries escherichia coli jm109/ phins21 productrice de la protéine hybride avec la proinsuline humaine et procédé de fabrication de proinsuline humaine
KR100202958B1 (ko) 인슐린 융합단백질로부터 인슐린을 생산하는데 있어서 효소적 절단을 가능케하는 인슐린 융합단백질 유전자를 가진 발현벡터 및 이를 이용한 사람 인슐린의 제조방법
JP2525413B2 (ja) L−フェニルアラニン・アンモニアリア−ゼ発現用組換え体プラスミド及び該プラスミドを有する形質転換株
Ma Expression and purification of alpha-human atrial natriuretic peptide in Escherichia coli by fusion with Erwinia chrysanthemi L-asparaginase
JPS63291583A (ja) L―フェニルアラニン・アンモニアリアーゼ