PT1121439E - Método e composições para inibir o crescimento de células neoplásticas - Google Patents

Método e composições para inibir o crescimento de células neoplásticas Download PDF

Info

Publication number
PT1121439E
PT1121439E PT99970398T PT99970398T PT1121439E PT 1121439 E PT1121439 E PT 1121439E PT 99970398 T PT99970398 T PT 99970398T PT 99970398 T PT99970398 T PT 99970398T PT 1121439 E PT1121439 E PT 1121439E
Authority
PT
Portugal
Prior art keywords
quot
polypeptide
amino acid
cells
acid sequence
Prior art date
Application number
PT99970398T
Other languages
English (en)
Inventor
Audrey Goddard
Austin L Gurney
Avi Ashkenazi
Robert D Klein
Mary Napier
William I Wood
Jean Yuan
Original Assignee
Genentech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genentech Inc filed Critical Genentech Inc
Publication of PT1121439E publication Critical patent/PT1121439E/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Neurosurgery (AREA)
  • Rheumatology (AREA)
  • Toxicology (AREA)
  • Pain & Pain Management (AREA)
  • Neurology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Description

ΕΡ 1 121 439 /PT
DESCRIÇÃO "Métodos e composições para inibir o crescimento de células neoplásicas"
CAMPO DA INVENÇÃO A presente invenção refere-se a métodos e composições para inibir o crescimento de células neoplásicas. Em particular, a presente invenção refere-se a composições antitumorais e métodos para o tratamento de tumores. A invenção refere-se também a métodos de pesquisa para identificar compostos inibidores do crescimento, e.g. antitumorais.
ANTECEDENTES DA INVENÇÃO
Os tumores malignos (cancros) são a segunda maior causa de morte nos Estados Unidos, a seguir à doença cardíaca (Boring et al., CA Cancel J. Clin., 43:7 (1993)). 0 cancro caracteriza-se pelo aumento do número de células anormais ou neoplásicas derivadas de um tecido normal que proliferam para formar uma massa tumoral, pela invasão de tecidos adjacentes por estas células de tumor neoplásicas e pela produção de células malignas que eventualmente se propagam através do sangue ou sistema linfático até nódulos linfáticos regionais e para locais distantes (metástases). Num estado canceroso, uma célula prolifera sob condições em que as células normais não iriam crescer. 0 cancro manifesta-se numa grande variedade de formas que se caracterizam por diferentes graus de invasão e agressividade.
Apesar dos avanços recentes na terapia do cancro, há uma grande necessidade de novos agentes terapêuticos capazes de inibir o crescimento de células neoplásicas. Deste modo, constitui um objectivo da presente invenção identificar compostos capazes de inibir o crescimento de células neoplásicas, tais como células cancerosas.
SUMÁRIO DA INVENÇÃO A presente invenção refere-se a métodos e composições para inibir o crescimento de células neoplásicas. Mais 2
ΕΡ 1 121 439 /PT particularmente, a invenção refere-se a métodos e composições para o tratamento de tumores, incluindo cancros, tais como cancro da mama, próstata, cólon, pulmão, ovários, rins e SNC, leucemia, melanoma, etc., em pacientes mamíferos, de preferência humanos.
Num aspecto, a presente invenção refere-se a composições úteis para inibir o crescimento de células neoplásicas, compreendendo uma quantidade eficaz de um polipéptido PR0211, ou um seu agonista, como definido nas reivindicações, em mistura com um transportador farmaceuticamente aceitável. Numa concretização preferida, a composição de matéria compreende uma quantidade inibidora do crescimento de um polipéptido PR0211, ou um seu agonista. Noutra concretização preferida, a composição compreende uma quantidade citotóxica de um polipéptido PR0211, ou um seu agonista. Opcionalmente, as composições de matéria podem conter um ou mais agentes inibidores de crescimento e/ou citotóxicos e/ou quimioterapêuticos, adicionais.
Noutro aspecto, a presente invenção refere-se a composições de matéria úteis para o tratamento de um tumor num mamífero, compreendendo uma quantidade terapeuticamente eficaz de um polipéptido PR0211 ou um seu agonista, como definido nas reivindicações. 0 tumor é de preferência um cancro.
Noutro aspecto, a invenção refere-se a um método in vitro para inibir o crescimento de uma célula de tumor compreendendo expor a célula a uma quantidade eficaz de um polipéptido PR0211 ou um seu agonista, como definido nas reivindicações. Numa concretização particular, o agonista é um anticorpo agonista anti-PR0211. A invenção também proporciona produtos para utilização em métodos de tratamento e a utilização de produtos na preparação de medicamentos para tratamentos médicos, ambos como definido nas reivindicações.
Ainda noutra concretização, a invenção refere-se a um artigo de fabrico compreendendo: um recipiente; e uma composição compreendendo um agente activo contido no recipiente, em que a composição é eficaz para inibir o crescimento de células neoplásicas, e.g., crescimento de 3
ΕΡ 1 121 439 /PT células de tumor e o agente activo na composição é um polipéptido PR0211 ou um seu agonista, como definido nas reivindicações. Numa concretização particular, o agonista é um anticorpo agonista anti-PR0211. Artigos de fabrico semelhantes compreendendo um polipéptido PR0211 ou um seu agonista como definido nas reivindicações numa guantidade gue é terapeuticamente eficaz para o tratamento de um tumor, também estão no âmbito da presente invenção. Também estão no âmbito da invenção os artigos de fabrico compreendendo um polipéptido PR0211 ou um seu agonista, como definido nas reivindicações e um agente inibidor de crescimento, agente citotóxico ou agente guimioterapêutico, adicional.
BREVE DESCRIÇÃO DAS FIGURAS A Figura 1 mostra uma seguência de nucleótidos (SEQ ID N0:1) de um ADNc de PR0211 de seguência nativa, em gue a SEQ ID N0:1 é um clone designado agui por "DNA32292-1131". A Figura 2 mostra a seguência de aminoácidos (SEQ ID NO:2) derivada da sequência codificante de SEQ ID N0:1 apresentada na Figura 1.
DESCRIÇÃO DETALHADA DA INVENÇÃO 0 termo polipéptido ou proteína "PR0211" quando aqui utilizado inclui PR0211 de sequência nativa, variantes (que são definidas aqui). 0 polipéptido PR0211 pode ser isolado de uma variedade de fontes, tal como de tipos de tecido humano, ou de outra fonte, ou preparado por métodos recombinantes e/ou sintéticos.
Um "PR0211 de sequência nativa" compreende um polipéptido com a mesma sequência de aminoácidos que o polipéptido PR0211 derivado da natureza. Este polipéptido PR0211 de sequência nativa pode ser isolado da natureza, ou pode ser produzido por meios recombinantes e/ou sintéticos. 0 termo "PR0211 de sequência nativa" inclui especificamente formas truncadas ou segregadas que ocorrem naturalmente (e.g., uma sequência de domínio extracelular), formas variantes que ocorrem naturalmente (e.g., formas resultantes de splicing 4
ΕΡ 1 121 439 /PT alternativo) e variantes alélicas do polipéptido PR0211 que ocorrem naturalmente. Numa concretização da invenção, o polipéptido PR0211 de sequência nativa é um polipéptido PR0211 de sequência nativa maduro ou de tamanho total, como apresentado na Figura 2 (SEQ ID NO: 2). Além disso, apesar do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2) ser apresentado como começando com o resíduo de metionina aí designado por aminoácido de posição 1, é conceptível e possível que outro resíduo de metionina localizado, quer a montante, quer a jusante da posição de aminoácido 1 na
Figura 2 (SEQ ID N0:2) possa ser utilizado como o resíduo de aminoácido de iniciação para o polipéptido PR0211. 0 "domínio extracelular" ou "ECD" de um polipéptido aqui descrito refere-se a uma forma do polipéptido que é essencialmente isenta dos domínios transmembranar e citoplasmático. Normalmente, um ECD de um polipéptido terá menos de cerca de 1% destes domínios transmembranares e/ou citoplasmáticos e preferencialmente terá menos de cerca de 0,5% destes domínios. Deve entender-se que quaisquer domínios transmembranares identificados para os polipéptidos da presente invenção são identificados de acordo com critérios utilizados por rotina na arte, para identificar esse tipo de domínio hidrófobo. As fronteiras exactas de um domínio transmembranar podem variar, mas muito provavelmente por não mais de cerca de 5 aminoácidos em qualquer das extremidades do domínio, como inicialmente identificado e como apresentado nas figuras anexas. Assim, numa concretização da presente invenção, o domínio extracelular de um polipéptido da presente invenção compreende os aminoácidos 1 a X da sequência de aminoácidos madura, em que X é qualquer aminoácido no espaço de 5 aminoácidos de qualquer dos lados da fronteira domínio extracelular/domínio transmembranar. A localização aproximada dos "péptidos de sinal" dos vários polipéptidos PRO aqui descritos está indicada nas figuras anexas. Deve ter-se em conta, no entanto, que a fronteira C-terminal de um péptido de sinal pode variar, mas muito provavelmente por não mais de cerca de 5 aminoácidos em qualquer dos lados da fronteira C-terminal do péptido de sinal, como aqui inicialmente identificado, em que a fronteira C-terminal do péptido de sinal pode ser identificada de acordo 5 ΕΡ 1 121 439 /PT com critérios utilizados por rotina na arte para identificar esse tipo de elemento de sequência de aminoácidos (e.g., Nielsen et al., Prot. Eng., K):l-6 (1997) e von Heinje et al., Nucl. Acids. Res., 1Λ: 4683-4690 (1986)). Além disso, também é reconhecido que, nalguns casos, a clivagem de uma sequência de sinal de um polipéptido segregado não é totalmente uniforme, resultando em mais do que uma espécie segregada. Estes polipéptidos maduros, em que o péptido de sinal é clivado num espaço de não mais de cerca de 5 aminoácidos em qualquer dos lados da fronteira C-terminal do péptido de sinal, como aqui identificado e os polinucleótidos que os codificam são contemplados na presente invenção. "Polipéptido variante de PR0211" significa um polipéptido PR0211 activo (outro que não o polipéptido PR0211 de sequência nativa) como definido a seguir, tendo pelo menos cerca de 80% de identidade de sequência de aminoácidos com a sequência de aminoácidos de (a) resíduos 1 ou cerca de 25 a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2), (b) X a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2) em que X é qualquer resíduo de aminoácido de 20 a 29 da Figura 2 (SEQ ID NO:2), ou (c) outro fragmento derivado especificamente da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2).
Estas variantes de PR0211 incluem, por exemplo, polipéptidos PR0211 em que um ou mais resíduos de aminoácido são adicionados, ou eliminados no terminal N ou C, bem como num ou mais domínios internos da sequência nativa.
Normalmente, uma variante de PR0211 terá pelo menos cerca de 80% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 81% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 82% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 83% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 84% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 85% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 86% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 87% de identidade de 6
ΕΡ 1 121 439 /PT sequência de aminoácidos, mais preferencialmente pelo menos cerca de 88% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 89% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 90% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 91% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 92% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 93% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 94% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 95% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 96% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 97% de identidade de sequência de aminoácidos, mais preferencialmente pelo menos cerca de 98% e ainda mais preferencialmente pelo menos cerca de 9 9% de identidade de sequência de aminoácidos com (a) resíduos 1 ou cerca de 25 a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2) (b) X a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2), em que X é qualquer resíduo de aminoácido de 20 a 29 da Figura 2 (SEQ ID NO:2), ou (c) outro fragmento derivado especificamente da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2).
Normalmente, os polipéptidos variantes de PR0211 têm pelo menos cerca de 10 aminoácidos de comprimento, muitas vezes pelo menos cerca de 20 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 30 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 40 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 50 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 60 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 70 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 80 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 90 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 100 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 150 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 200 aminoácidos de comprimento, mais frequentemente pelo menos 7
ΕΡ 1 121 439 /PT cerca de 250 aminoácidos de comprimento, mais frequentemente pelo menos cerca de 300 aminoácidos de comprimento, ou mais.
Como se pode ver a seguir, a Tabela 1 proporciona o código-fonte completo para o programa de computador de comparação de sequências ALIGN-2. Este código-fonte pode ser compilado de forma rotineira para utilização num sistema operativo UNIX, para se obter o programa de computador de comparação de sequências ALIGN-2.
Adicionalmente, as Tabelas 2A-2B mostram exemplos hipotéticos para utilizar o método descrito a seguir para determinar a % de identidade de sequência de aminoácidos (Tabelas 2A-2B) e a % de identidade de sequência de ácido nucleico (Tabelas 2C-2D) utilizando o programa de computador de comparação de sequências ALIGN-2, em que "PRO" representa a sequência de aminoácidos de um polipéptido PEACH de interesse, hipotético, "proteína de comparação" representa a sequência de aminoácidos de um polipéptido contra o qual o polipéptido "PRO" de interesse está a ser comparado, "PRO-ADN" representa PROXXX- hipotético ou uma sequência de ácido nucleico que codifica para PROXXX- de interesse, "ADN de comparação" representa a sequência de nucleótidos de uma molécula de ácido nucleico contra a qual a molécula de ácido nucleico "PRO-ADN" de interesse está a ser comparada, "X", "Y" e "Z" representam, cada um, diferentes resíduos de aminoácido hipotéticos e "N", "L" e "V" representam, cada um, diferentes nucleótidos hipotéticos. 8
ΕΡ 1 121 439 /PT
Tabela 1 /* * * C-C increased from 12 to 15
* Z is average of EQ
* B is average oí ND * maieit wish stop is stop-stop = 0; I (joker) match ~ 0 */
Idefine JM >8 f* value of a match wrtb a stop *i tat dayj261f26I - { /· A 8 C β E F G H I J K L M N O P Q RSTUVWXY2*/ /* A*/ {2,0.-2,0,0,4.1, -1,-1, 0,-1,-2, 4, 0, M. , 1. 0,-2, 1, 1,0,0,-6, 0,-3,0). 1* B *í {0,3,4,3,2,-5.0, 1,-2, 0,0,-3, -2, 2, M, -1, 1,0,0,0,0,-2,-5,0.-3, 1). Í*CV {-2,4,15,-5,-5,4,-3 ,-3.-2 , 0,-5,-6 1,-5,4 ',-5,4,0,-2, 0,-2,-8, 0,0,-5), í* D *7 { 0, 3,-5, 4, 3,-6, 1, 1,-2, 0, 0,4. -3, 2,, 2,-1,0,0,0,-2,-7, 0,4,2), }* E *í {0,2,-5,3,4,-5,0, 1,-2, 0, 0.-3, -2, 1, "m. -1, 2,-1,0,0,0,-2,-7, 0,4, 3), 1* F *1 {4,-5,4,4,-5. 0,-5, -2, 1, 0,-5, 2, , 0,4, 'm ,-5, -5,4,-3,-3,0,-1,0,0.7,-5), /*0*1 { 1,0,-3, 1,0,-5, 5. -2,-3. 0,-2,4, -3, 0, M, -1. -1,-3, 1,0.0,-1,-7, 0.-5, Q). í* H *7 {-1, 1,-3, 1, 1.-2,-2, 6,-2, 0.0,-2, -2, 2. 0. 3,2,-1,-1,0,-2.-3,0,0:2), /♦ J ♦/ (-1,-2.-2,-2,-2, 1,-3, *2,5, 0,-2, 2. ,2. *2, >1 .-2, -2,-2,-1,0,0,4,-5.0.-1,-2), 7* J *7 (0,0, 0,0,0.0.0. 0,0, 0,0,0. 0, 0, M, 0, 0,0,0,0,0, 0, Ô, 0,0,0), /* K *7 fl. 0,-5,0,0,-5.-2, 0,-2, 0, 5,-3. 0, i: M. -1, 1,3,0, 0, 0.-2.-3, 0.4, 0), Í*L*Í {-2,-3,-6,4,-3, 2.4, -2,2, 0,-3,6. 4, -3, M, ,-3, -2,-3,-3,-1,0, 2,-2. 0.-1,-2), í* M */ {-1,-2,-5,-3,-2, 0,-3, -2,2, 0, 0.4, 6, -2, Im, .-2, -1,0,-2,-1, 0,2,4. ¢5.-2,-1), f*K *t {0, 2,4, 2, 1,4, 0, 2,-2, 0, 1,-3, -2, 2,^ -1. 1, 0,1, 0,0,-2,4,0,-2. t), 7*0*/ Μ. M í,_ M, M , Μ, Μ, M, 0,_M, M,_M,_m", ,_M,_M ,_Μ^_Μ}, /v p ·} i* Q V 7*R*7 f*SV /* f */ /*v*t f* V *f /* W *1 t* X *t I* Y *1 1*2,*! , M, 6,0, 0, I, 0, 0,-1,-6,0,-5,0), „M. 0, 4, 1,-1,-1, 0,-2,-5, 0,4, 3}. M, 0,1, 6.0,-ί,Ο,-2, 2, 0,4, 0). "Μ. 1,-1. 0, 2, 1. 0.-1,-2. 0,-3,0), M, 0,-1,-1, 1,3,0,0,-5, 0,-3.0}. M, 0, 0, 0, 0, 0, O, 0, 0, 0, 0,0}, Jtf.-Í ,-2,-2,-1, 0. 0,4,-6, 0.-2.-2), "m,-6,-5, 2,-2,-5, 0,-6,17, 0. 0,-6), M. 0, 0, 0, 0, 0. 0, 0, 0, 0. 0,0). M,-5,4,4,-3,-3, 0,-2,0, 0.10,4), M. 0, 3, 0. 0, 0, 0.-2,-6, 0,4, 4) C 1,-1,-3,-1,.1,-5,.1, 0,-2, 0,-1.-3,-2,-1 { 0, 1,-5.2,2.-5,-1. 3.-2,0, 1,-2.-1. 1, {-2,0,-4,-1,-1,-4,-3,2,-2,0, 3,-3, 0,0, C 1,0, 0, 0,0,-3, 1.-1,-1,0,0,-3,-2.1, { 1,0,-2, 0,0,-3.0,-1,0.0,0,-1,-1,0, { 0, 0, 0, 0.0, 0, 0, 0, 0, 0, 0, 0, 0, 0,. { 0,-2,-2,-2,-2,-1,-1,-2.4, 0,-2, 2, 2,-2., {-6,-5,-8,-7,-7, 0,-7,-3,-5,0,-3,-2,-4,-4,' { 0. 0, 0, 0. 0, 0, 0, 0,0, 0,0, 0. 0, 0 {-3.-3, 0,-4,4,7,-5,0,-1,0,-4,-1,-2,-2, { 0. 1,-5, 2, 3,-5, 0, 2.-2, 0, 0,-2.-1, i.v 9
ΕΡ 1 121 439 /PT I* •t #include <stdio.h> #inciude <ciype.h> #define MAXJMP 16 /* max jumps in a diag */ ^define MAXGAP 24 /* dont continue to penalize gaps larger thatt th is */ mrtm JMPS 1024 /* max jmps in an path */ jfdefíite MX 4 í* save if there's at least MX-1 bases since iast jmp Ídífine DMAT 3 /* vaiuc of matchtng bases */ #deftne DMIS 0 /* penaltv Γογ mismatdted bases */ #define DINSO 8 i* penaltv for a gap *i MâtTtm D1NS1 I i* penaíry per base *f Mtfine PINSO 8 t* penaíty for a gap */ âtefme PINS1 4 1* penaíty per residue */ struct jmp { short n{MAXJMP]; /* síze of jmp (neg for dely) */ unsigned short xfMAXiMPJ; /* base no. of jmp in seq x */ >; f* íimíts seq to 2*16-1 *f struct diag { int score; /* score at fast jmp */ long offset; /* offset of prev block */ short ijrap; /* current jmp índex *1 struct jmp jp; /* list of jmps */ h slruct path { int spc; /* nutnber of leading spaces */ short n[JMPSj; !* size of jmp (gap) *i ): int xfJMPS]; t* loc of jmp (last elan before gap) */ char •ofiie; /* output file mmc V char *namex[2J; t* seq «ames: getseqsQ */ char *prog; · /* prog rume for err msgs */ char *seqx[2); )* seqs: getseqsO int dmax; t* best diag: nwO */ int diria xO; /* frnal diag *! int dna; /* set if dna: main{} */ int endgaps; /* s« if penalizing cnd gaps */ int gapx, gapy; /* total gaps in seqs *t int lenO, leni; /* seq lens */ int ngapx, ttgapy; /* total s»c of gaps */ int stnax; /* max score: nwQ */ int *xbm; f* bítmap for matchíng */ teng offset; /* current offset in jmp file *1 struct diag *dx; /* tiolds diagonais */ struct path ppPi; /* holds path for seqs */ di ar *calloc0, *malloc0. *index(). “sircpyO; char ♦getseqO. *gweallecQ; 10
ΕΡ 1 121 439 /PT /* Needleman-Wunsch alianment program * * usage: progs filei fiie2 * where fitei and fiíe2 are two dna or two proietn sequences. * The sequeitces eart be in upper- or lower-case an may conta in ambíguity * Any iittes begtnning with ‘‘ ' or ’ < ‘ are ignorai * Max file length is 65535 (límiied by unsigned short x in ihu jmp smict)
* A sequenee with 1/3 or more of its elemetus ACGTU is assutned to be DNA * Output is in tbe file "alignout” * * The program may create a tmp file in /itnp to lutid tnfo about tracebaek, * Original version developed under BSD 4. 3 on a vax 8650 */ íinciude *nw.h’ ftnclude "day.h* static _dhval[2d] — { i. 14,2,13,0,0,4.11,0,0,12,0,3,15,0,0,0,5,6,8.8,7,9,0,10,0 Y. stalic _pbvall26j - { 1,2|{1 < <('D'-,A'))|(1 < <('N‘-‘A')>, 4, 8. 16,32, 64, 128, 256, OxFFFFFFF, i<<10, 1< <11, 1< < 12, 1< <13, 1 < < 14, 1< <15, 1< <16, 1< <17, 1< < 18, 1<<19. !< <20, 1< <21, 1< <22, 1< <23, 1 < <24, 1< <25|{1< <{'E,-’A,))|0<«'Q'-'A‘)) maín mainfac, av) ínt ae; ehar *avf]; í prog = av[0J; if <ac != 3> { fpnmfisiderr,"usage: %s filei file2\n*, prog); fpnmf(siderr,'where filei and fde2 are two dna or wu proiein sequences.\n“); fpFintf(stdetT,"nie sequences can be in upper- or lower-case\n*>; fprímf(«ilerr,'Any ltnes beginníng wílh V or ’<' are tgiKjretftn"); fprintf(stderr,“Output is ir» tíw file \"align.oui\"’,r>'); exit(l); } natnex[Q) « avflj; nâírtex[l) — 3v{2}; seqx{0J = getseq(namex[01, &lenO); seqx[lj = getseq(namex[I], &íenl); xbm - (dna)? dbvai r jpbval; endgaps *= 0; /* l to penalize endgaps */ ofiie = "align.out“; /* output file */ nw(); readjmpsO: priwO; I* fili in die matrix, get the possible jmps V t* get the actual jmps */ I* pnnt siats, aiignmcnt */ > cleanuptô); I* uníink any tmp files */ 11
ΕΡ 1 121 439 /PT f* do lhe alignntem, retum best score; rnainO *dns: vatuej in Fiieh and Smuti. PNAS, 80, 1382-1386, 1983 * pio: PAM 250 values * When scores are «juat. wc prefer mismaiclies to any gap, prefer * a new gap to extendine ao ongotng gap, and prefw a gap in setjx * :o agap m seq y. nwO nw í
char *px, *i»y; /* secjs and ptrs *í int •ndely, *dely; f* k«q> irack uf dely *! int ndelx, delx; 1* keep tratk of deix */ int *tmp; 1* for swappinj rowO, rowl *t int mis; /* score for each cype */ Int tnsO, insl; /* insmton pentlties *! register td; f* diagonal Index */ rtglster «i /* jmp índex */ register *eo!0> *coU; /* score for curt, last taot*/ register *x. yy; i* index into seqs V d* - (struct diag *)g_calíoc{'w get diags\ !enO+ ienl +1, sãeoflatruct diag». ndely = {int *)g_caíloç(*to get ndety', tenl-f 1, siícof(lnt)}; dely = {int *)g_calioc{*to get dely", leni + 1, sizeof(int)); cofO = {int *}g C3líoc(*to get coIO', leni +1, sweof(iní)); ooU = (int *)g_calloc(*tô get eoli \ lent +1, si*eef{int)); isvsO = Wsa)*? OliíSO : PINSO; tnsl - <dna}7 EHNS1 : PINSÍ; smax « -10000; if (cndgaps) { for (co(0[0j = deiy{05 — -insO, yy = 1; yy < * leni; yy + +) { cotOfyy] “ deiytyyj = colOJyy-1] - tnsl; ottelylyyj yy; > eoiOfO) = 0; l* Watennan Buli Mailt Biol 84 *! else for (yy 1; yy < - leni; yy* +> delyjyy] = -ínsO;
/* fill in maich matrix V for (px » seqx{0J. xx -= l; xx < - íenO; px+ +, x*-r+) { /* witsaiúce first eijtry in ccl */ if (cndgaps) { if (xx == 1) cnilfúl = delx - -(ínsO-t-msl); eíse collfOJ = delx = coiOfOJ - ínsl; ndelx = xx; } else { cotí(0) ^ 0; delx * -insO; ndelx « 0; > 12
ΕΡ 1 121 439 /PT nw for (py = seqx(l], yy = I; yy < - leni; py+ + . yy + Ή { mis * colOlyy-lJ; tf (dm) mis + = (xbm{*px-'A']&xbrol*py~'A'])? DMAT ; DMSS; eise mis +» _day[*px-'A']l*py''A'); I* update penalty for del ín x seq; * favor new del over ongong del * ignore MAXGAP if wetghitng endgaps *t if (endgaps [ ] ndelytyy] < MAXGAP) { if (colOfyy) - insO > = delylyy]) { delylyy) = colOíyy) - <insO+insl); ndelyíyy] ~ 1; } eise { delylyy] insl; ndely[yy3+ + ; > } eise { if (colOlyy) - (insO+insl) > = delylyy]) { delylyy] = colOJyy] - {tnsO+insl); ndelylyy] = I; } eise ndelylyy] + + ; } /* update penalty for del tn y seq; * favor new del over ongong del */ if (endgaps | j ndelx < MAXGAP) { if (eotllyy-l) - insQ > « delx) ( delx = colI[yy-1 ] - (insO+insl); ndelx => i; }else{ delx r*= insl; ndelx+ +; } } eise { if (coll[yy-l] - (imO+insl) > = delx) { delx i= collfyy-1] - (ínsO+insl); ndelx «= ); } eise ndelx+ +; > l* ptek the maximum score; we’re favoring * mis over any dei and delx over dely */ 13
ΕΡ 1 121 439 /PT nw id = xx -yy + leni - l; if {mis > » ctelx && mis > = delyfyy]) coitfyy] = mis; elsc if (delx > ~ íitlylyyj) { eoli|yyi - delx; ij = dx[id].ijíi)j). lf<dx[id).jp.nfGj &&. (!dna j {(ndeíx > * MAXJMP && j» > dx[>tíJ.jp,X{ijJ+MX) 11 mis > dxfidJ.score+DINSO)) { dxl«l].ijmp++; if<++ij >« MAXJMP) { wriiejmps(id); ij - dxfidj.íjmp = 0; dx[id). offset - offset; offset -+·= saeoffstruct jmp) + sizeoffrffset); > > dxfidj.jp.nfij] » ndeh; <tx{ktj.jp.x(íj] « xx; dxfidj.score = delx; } eisc { coílíyy) «· «teJytyyJ; ij - dxUdl.ijmp:
if (dxlidl.jp.nf0) &&. (!dna 11 (ndelyfyy) > = MAXJMP && xx > dxftó}.jp.xfij) 4-MX) J j mis > dx|ui).score+DfNSO)) { dx[id).ijmp+ + ; if {++sj > * MAXJMP) í writejfnps(id); ij ® dxÊKQ.finp “ 0; dx(id].offsei — offset;
Offset +- =» sixeoffstruct jmp) + srzeofí-offsêO; > } dx[idj.jp.i»[ij} = -ndelyjyyj; dxfidí.jp.xfijj = xx; dxfid}.score = delyfyy);
If {xx = = lenO && yy < leni) { /* last coi if (encígaps) collfyyl -** insO? jnsl*{fenl yy); if (collfyy] > smax) { smax “ co!l[yy); dmax = id; }
I ) if {endgaps && xx < ienO) colifyy-l] -= íns0-rMet*(íe«0-x*); ír<coil[yy-l] > Stnax) { smax * cnil[yy-l]; dmax = id; } tmp “ eolO; coiO = coll; coll »» m>p: ) (vrnd) free((cfiar *)nde]y); (void) frecftchar *)dejy); (void) free((char *)col0); (void) free((tí>ar *jcoU}: } 14
ΕΡ 1 121 439 /PT i* * * priptO — only routtne visible otuside th is module * * statie:
* geimatO — trace bacfc best path, coum matdies: printO
* prjdignQ - print alignittcnt of deseríbed in array p[j: printO
* dumpblockQ - dump a bl«k of tines with numbers, siars: prjilignO
* numsO — put out a number line: dutnpbtockO
* putiineO ~ put out a iíne (namc, fnum], seq, [num|}: dunrpblockO
* starsO -pui a tine of stars: dumpblockQ * siripnanrteQ — strip any path and prefix from a seqname */ ffínclude 'nw.h' #d*ftne S?C 3 Mefíne PJLÍNE 256 1* maximum output tine */ «defina PJ5PC 3 1* space between name or num and satj */ extern _dayf36)[2$]; int dett; t* set output line Sength */ FILE *fx; pnntO f* output file */ print í int U. ly, fitstgap, íastgap; /* overiap */ if «fx ” fopen(ofi!e, *w"» = = O) { fprinjf(stderr,'%s: can’t wriie prog, otite); cleanup{!): } fpríntfífx, " <f1rst sequettee: %$ (length = %d}in", namexlO], ÍenO); íprimf/íx, " <second sequettee: %s (length %d)\n*. namcxfij, !en]}; oten — 60;
Ix = leríD; ty “ tenl; fírsigap - Íastgap — 0;
íf {dtnax < leni - i) { /* ieadíng gap in x *J pplOJ.spc » ftrstgap “ leni - dmax - 1; ly -= ppiOJ.spc; > eis* íf (dmax > leni - 1) { /* leading gap ín y */ ppí!). spc = fírstgap = dmax - (tenl - 1);
Ix ·« pp[l).spc; } if (draa.xO < ÍenO - 1) { I* traíliag gap itt x *í iasigap = ÍenO - dmaxG -1; ix - = Íastgap; } else íf (dmaxO > ÍenO - 1) ( I* traíling gap in y *1 íastgap “ droaxO - (tenO - í); iy Íastgap; } gstmaiflx, ly. firstgap, Íastgap): pr_a!ignQ; } 15
ΕΡ 1 121 439 /PT I* * trace back lhe best paih, couro nwtches *! static getmai(!x, Jy, fírsigap. lastgap) int Ix, ly; f* "core* (minus ettdgaps) */ ini firsrgap, lastgap, (* leading iratling overlap */ getmat t
Ent chor deubie register regíster dhar ttm, iO, il, siiO, síil; outx(32J;pet; ttG, nl; *p0, *pl: f* get total matches, score *7 iO » il “ stzO = 5tzl *= 0; pO ~ seqx[0] + ppfl}.spc; p! - seqxfl] + ppJGj.spe; nO = pp[i].spc + 1; nl — pp{0).spc + I; nro *» 0; wWie { *pfl && *pí ) { *f (sizO) { pí + +; ni + +;
SmO-; } else if (siz!) { pO+ + : n0+ 4; SI2.I—* > eke { if (xbmE*pO-'A'j&xbm[*pi--A’3) nm+ +; if («0+ + == ppfO|.x[iOj) mO = pp{OJ.nítO+ +]; if<ni + + == pp{l],x[ii]} sizl - ρρ[1},π{,ϋ + +]; p0+ 4*; p) + +; > > /* pct homoiogy: * if penaitzing eedgaps, base is lhe shorter seq * eíse, Xnock off overhangs and (ake shorter core */ if (endgaps) ix - (tenO < leni)? fenO ; leni; else
Ix ~ (Ix < ly)? Sx : íy; pct = 100.*{do«blí)nm/{do«bíe)lx; fprimfffx, "\rt"); fytrinlfltfx, ” < %d match%s in an overlap of Sd; %.2f perceitt similarirvtn", nm, (nm ** = 1)? : "es*. ix, pct); 16
ΕΡ 1 121 439 /PT íprintf(fx, * <gaps in fim stquencc: %d", gapx), ,,.getmat if ígapx) { (void) spriniffoísw, ' {%d %£%s}*, ngapx. (dna)? *base";“fes«£yt*, ingap* == 1)? ffcrintf{fx,*%s", çutx>; fprinif(fx, *> gaps in second sequenee: %d*. gapy); if (gapy) { (void) &primf(ouix, ’ (%d %$%$}', ngapy, (drsa)? "baseVresidue*, (figâpy - = 5)? *“:V);
Spriitif(fx,*%s\ oittx); } if (dna)
Iprintfffx, ”\n < score; %d {tnatcà - íid. tuisnwtch ~ %d, gap peaslty - %d 4 %d per base}\u", smax. DMAT, DMÍS, DINSO, DlNSi); else fprimfffx, “\n < score: %tí (Dajdioff PAM 250 tnatrix, gap penaíty =» %d + %d per residue)\n”, srriax, PÍNSO. P1N5I); if <endgaps) fpnmf(fx, "<endgaps penaiired, ieft endgapt %d 5£-&%s, rightendg&p: M %s%s\n". ftrstgap, (<t«a)? "base* : "residuc:', (firstgap — - i>? " : *s’, iasigap, fdna}? "base* : "residue*. (lastgap == 1)? *“ : *s'>; cise fpríntf(fx, *<endgaps noi penalt2ed\jT); slatic nm; statíc !imx; statfc UI2): slatic nc[2]; slatic nif2I; slatic stx|2}; slatic char *psl2]; static char *po[2]; slatic citar out[2]fP UNE); static cbar starfP UNE); f* * pfúr. aiignmem of described in struet path pp[] V stalie prjtisgn(> { f* matcfíes in core — for checking *> t* fengihs of strippwí file names *i /* jmp index for a paíb *f t* tiumber at start of correm Une *1 l* current eiem number — for gapping */ f* ptr to correm eiemem */ /* ptr ro nexi output char slot */ !* output line *! f* set by siarsO */ pralign f* char count *1 im rm; int more; registwr i; for (i = 0, Imax « 0; * < 2; i++) { nn — stnpnâmefnams *[<}), if{nn > Imax)
Imax = nn; nc[i} = 1; tii(ij - 1; sizjij = itíii ~ 0; ps|i) = seqxtí]; popj - CfUtjiJ, 17
ΕΡ 1 121 439 /PT ...pralign for (ttn = atn = 0, more = !; more; ) { for (i = more = 0; i < 2; í + +) { /* * do we have more of ihis sequeiteÈ?
V Íf{í*ps[i]) continue; more+ + ; íf (ppOi.spe) { /* leading space */ *po[iJ + + = ' pp[i|.spc ; } else sf (sizfi]} { /* in a gap *t «ρθβ]++ * V; siz{ij~; } else { /* we’re puumg a scq eiemertt */ *po[t] - *psfí]; if (i$lower(*ps[i])} •psíij = tmipper(*ps{t]); pO[i] + + ; ps{it+ ->; /* * are we at nwt gap for ihis seq? *! if (ni[i] pplrj.xlyli])) { !* * we aeed to roerge all gaps
* &t this location V 5w[i] = ppfi].nfij[iH+]; while (ni[ij = = pp(fjx[ijíij)> siíii] 4= ppfiin{ijF>l++]; } m[í] + + ; } }
If (4- + 011 -- --- ijíeji j | imore && nti) { dumpbíockO: for (t ” 0; i < 2; *+ +} polt] - ootfil; t* * dtimp a btoclc of lines, tnciuding wunhers, stars: pr_align0 *7 statíc dumpblock
dumpfeloeifO { registar i; for (i = 0; i < 2; t+ +) *po[i]- - ’\0“; 18
ΕΡ 1 121 439 /PT ...dumpbiock <vciá) pUICCW, fx>L for (i " 0; i < 2; i+ +) { if (*outfi] && (*oi:tíii !* ' ' || *(pe|i}) !* ' ')) { iF <i ==0} ftums(i); if{> ==0&&*oulUJj siarsÇtt puiliiwfi); if(i = = 0 && *oui|I|> fpriníRfx, star}: if (í -= =1) mims(i); > > }
!· * put out a mimbcr iinc: dumpbiockO */ static numsiis) int jí ; i char rtgister regí^tcr ehar nums /* intfex in oul[J boidiug setj line */ n!ine[P UN£j; ·. i; *pn, *px, *py; for (pn — niine, í = 0; i < lmax + P_SPC; ) + +, pn++J *pn = " for (i » ncfíx], py - uuijjx]; *py; py + + . pn++) { iH*py = = ' ’ Π *py =” *pn · ’ tKÈ { if {i%10 = = 0 11 <» -== i && ML»}!« 1» { j *» (i < 0)? -i: í; for Cpx — pn; j; j / - 10, px—) *px “ j%!0 + '0'; íf (t < 0) } } else í+ + ; rpn *í>* * <-·; } } *pn « 'V0'; nc[ix) => i; for {pn - ntuic; *pn; pn+ + > ívoid) pu!C(*pn. fx>; (void) putcOn*, fx); /* * put Out a line (Rime, [mim], saq, |num3>; dtmnpbiockO */ staiic putiine puiline(ix) int tx; { 19
ΕΡ 1 121 439 /PT ...pUttiRÊ iia i; regcster ehar *ps. for ípx “ namex(ix],> *= 0; *px *px ! - px + + , i + + ) (void) putc(*px, fx); for (; i < Imax+P SPC; 1+-7-) (void) pmc{’ \ fx); i* these coura from I : * aiO w current e temem (from 5) * nc[J is number at stan of currem linc *! for (px = outfixl; *px; px+ + ) (void) putc{*px&Ox7F, tx); (yoid) putc('\ii\ fx); } /* * ρω a hne crf stsrs (seqs always ia outfO). ow| 1)): dumpblotkO *1 statie starso stars { mt i; register diar *p0„ *pl, cx, *px; ir {!*ous[Q} 11 (*cuí{0) = = ‘ && *(po{0J) ‘ ( !*out[í| H (*oui(í] ==·'&& *Ípo[l|> =» = ' ·» return; px = $tar; for (í = tmax +P_SPC; í; i~) *px+ + = ‘'·. for (pO = ouí{0], p! = ou<[JJ; *pO<fc& *pl; p0+ + , p)++) { jf (isalpha{*pO) && isalphafpl)) { if (xbm^pO^Allt&xbmppKA*}) { cx = '*; nm -+ ·+; ) ílse íf <ϊ<3η$ && _dayf*pO*'A'][*pI-,À'J > 0) cx » V; else cu « ’ > cise ex - ’ *px+ + = cx; } *px+ + = '\n'; *px - '\0‘; } 20
ΕΡ 1 121 439 /PT I* * siríp paib or prefíx ffom pn, rcturn ten: pr_aligf>0 ·/ statk stripname stripnameípti) char *pn; ./* fiie ruime {may be parti} */ í register char *px, *py; py » 0; for <px <“ po; *px; p*+ +) tf (*px ™ => T) py s* px **· 1; íf{py> Çvo)d) strcpyípn, py); r*tttm<strien{pn»; } 21
ΕΡ 1 121 439 /PT /* * cteanupQ ~ cteanup any tmp fite * getseqO - read in sctj, ses dna. isit, istBXlea * g_ca;!ocO ~ callocO with error chcckm * readjmpsQ — gei the good jtnps, fiem imp file if necessary * writójmpsO — write a fitied artay of jmp.» to a tmp fite: nw() */ ftnciude "ftw.b' tfinelutte <sy$/fite.h> char ‘jttame = ‘Vtmp/hemgXXXXXX"; FILE *S; /* tmp fite for jrtips */ int cteanupQ: íoog iseeitQ: /* cleanup ftttp file */ /* * remove any tmp file if we bit>w */ cteanupfi) im i; Sf(fj) cleanup /* * read, ranrn pir io seq, set tina. teu. maxlett *sfcíp lines staning with or '>' * seq m uppcr m I ower case <7 t* fite nsnte *f !* seq ten */ I«nefi024J» *p$eq; *px, *py; natgc, tlen; *fp; getseq cter * getseqlfile, len> char *fiia; «Bt *tón; { char regtetw char ÍDl FILE if ((fp = fopsnífilc.V)) == 0) { fprintffst*teiT,'Ss: cân'l read %s\n\ prog, fite); exK(I); } tlen = natgc = 0; whíle (fgeis(iifíc, 1024. fp)} { tf ('fine. == j{ *iine ·»= '<’ |J *line = = '>') oantinut; Ιϋτφχ ** line; *px *W; px++·) if fisupper(*px) j | istewer(*p*)} tlen+ + ; } if ((pseq = malloe(f«insigned){lleii+6)}) “ ** 0} { fpritsf(stderr,*%s: maliocO faiied to get %ú bytes for SsW, prog, sletn-6, file). exit(l); } pseq[C>l ~ pseq[l] ~ pseqí3] ~ pseqPl » 10'; 22
ΕΡ 1 121 439 /PT ...getseq py = pseq + 4; «teu - lleri; rewind(fp). whilc (fgets(tinê, 1024, fp)) { ifflSne == |f *fi«e — = f| *line '>’) cominue; for {px - iine; *px ! = '\n'; px + + > { jf (isupper(*p*)> *py++ - V; dse 5f (islower(*px)} *py+ + = tcnJppef{*px); if {imfexCATGCUV(py-l)» naige ? +; > } *py++ ··' 'U>"; «py - '\0'; ívoíd) fclose(fp); dna = mígc > (tlen/3); return{pseq +4); } ctwr * gcailoc g_calSoc(msg, nx, si) char *tnsg: /* program, caliing routinc */ irti αχ, sx; /* numbsr and siae of elenaents *t { char «px, *eaUoc(): if ((px “ c3lioc<{uRstgned)nx. (twsigncd)sz)) == 0) { if («fiisg) { nx, sz); fprintftsaierr, ”%s: g_eaitocQ faiíed %5 (n-%d, Si~ 5á<3j\n‘, prog, msg, exiifJ), } } retur«(px); } /« * get fmat jmps frosn dx[] or imp fite, set ppD tescidmax: mainf) */ readjmps readjmps() { feit fd - -í; int sii, >0, tl; register i, j, XX;
if(0M (voíd) fctose®; if ((fd — open(jname> ORDONLY. 0)} < 0} { tprmtffstderr, '%$: easft openO %s\tT, prog, jruime): cieanupíi); } > for {t = lO = it = O. dmaxO - dmax, xx = lenO; ; i+ +) { white (I) { for (j “ dxjdmaxj.ijnip; j > = 0 dx(droax]-jp.xfjJ > =* xx; j-) 23
ΕΡ 1 121 439 /PT ...readjmps ií (j < 0 && dxtdmaxj.affset && fj) { (veíd) iseekffd, d*[dmax].offset, Ό): (void) fead(fd, (char *)id*[dmí*].jp. sizeeffstnjct jrap)); (void) readífd. (char *)&dx[draaxj.offset. sizeof(dxldmax.]-oí)sct.i): d«.}dmax].ijmp - MAXJMP-l; cise break; } if <i >-JMPS>{ fprimffstderr, ~%s: ιοο many gaps in alignmeni\n\ prng). cleanupíf); > >ro >“»>{ siz «* d*[dm<utjjp.n0l; xx = dxfdmaxlip.xíj!; dnaax +- siz; if (siz d0){ /* gap in second scq *1 pp{i].o[it] = -siz; xx + = siz; /* íd - XX - yy + leni - I */ pp[Ij.x[ilj = xx -dmax + ienl - Ϊ; gapy+ +; ngapy-= síí; 1* ignore MAXGAP when doing cndgaps */ siz - (-si* < MAXGAP j [ endgaps)? -siz ; MAXGAP; Π++. > else ir (siz > O) { ίψ gap in first seq V pp[0).n[i0] = siz; pp[0}.x[ioj = xx; gapx+4; ngapx + — siz; f* ignore MAXGAP when doittg endgsps */
Siz = (siz < MAXGAP i | endgaps)? siz : MAXGAP; i0+ +; > > eisc brcak; } /* reverse lhe crder of jmps *1 for (f “ 0» iQ—; j < iO; j4 4, iO—> f i = ppJOJ.nO); ppt0].n[j) = pp|0].n(i0]; ρρ(0],η[ι0) - i; i = ppfOi-xfj}; pp(0].x01 = ppí0].x[i0]; ppf01.x[iOJ = i; * ffflr (j = 0, if—; j < if; j+4, U-) { i = ppiU-nOJ; ppllJ.nU) - pp[l].n[il]; ppU]-"[il) “ ·; i - ppíll *ϋϊ: PPÍU-xíil - PPtD xtilj; ppíU-4íij ~«; } tf(fd > - 0> (void) ctose(fd); (void) unlinkOname); fj = 0; offsci ^ 0; } > 24
ΕΡ 1 121 439 /PT /* » wríce a fitSeJjmp »λι« ofl*et of lhe prev ene (ifany): «wO */ writcjmps^iO wntejraps in( ix; < «swr *mk!fmpO;
ffOSH if {mkiempOftw*) < O) { <primf($tderr, '5Ss; «i»*t mictempO Ss\n', prog. jname); eleanep(l), í if <{Ç " fopen(jnime, *w”>> «>>» 0> | fpnmf(st<im\ ~γ(%·, «m‘t wtiie *sta\ jwpg, jtsame); «*{!>; ) } (voíd) fwrite{{char *)&dx(ixl.jp, sieenf(smwi Jmp). 1. fj>-(veW fwnte{(d»ar K Jj>; }
Tabela 2A PRO XXXXXXXXXXXXXXX (comprimento = 15 aminoácidos)
Proteína de comparação XXXXXYYYYYYY (comprimento = 12 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácido com correspondência idêntica entre as duas sequências de polipéptido, tal como determinado por ALIGN-2) dividido por (o número total de resíduos de aminoácido do polipéptido PRO)= 5 dividido por 15 = 33,3%
Tabela 2B PRO XXXXXXXXXX (comprimento = 10 aminoácidos)
Proteína de comparação XXXXXYYYYYYZZYZ (comprimento = 15 aminoácidos) % de identidade de sequência de aminoácidos = (o número de resíduos de aminoácido com correspondência idêntica entre as duas sequências de polipéptido, tal como determinado por ALIGN-2) dividido por (o número total de resíduos de aminoácido do polipéptido PRO)= 5 dividido por 10 = 50% 25
ΕΡ 1 121 439 /PT
Tabela 2C PRO-ADN NNNNNNNNNNNNNN (comprimento = 14 aminoácidos) ADN de comparação NNNNNNLLLLLLLLLL (comprimento = 16 aminoácidos) % de identidade de sequência de ácido nucleico = (o número de nucleótidos com correspondência idêntica entre as duas sequências de ácido nucleico, tal como determinado por ALIGN-2) dividido por (o número total de nucleótidos da sequência de ácido nucleico PRO-ADN) = 6 dividido por 14 = 42,9%
Tabela 2D PRO-ADN NNNNNNNNNNNN (comprimento = 12 aminoácidos) ADN de comparação NNNNLLLVV (comprimento = 9 aminoácidos) % de identidade de sequência de ácido nucleico = (o número de nucleótidos com correspondência idêntica entre as duas sequências de ácido nucleico, tal como determinado por ALIGN-2) dividido por (o número total de nucleótidos da sequência de ácido nucleico PRO-ADN) = 4 dividido por 12 = 33,3% “Percentagem (%) de identidade de sequência de aminoácidos" em relação às sequências de polipéptido PR0211 aqui identificadas é definida como a percentagem de resíduos de aminoácido numa sequência candidata que são idênticos aos resíduos de aminoácido numa sequência de PR0211, após alinhamento das sequências e introdução de intervalos, se necessário, para obter a percentagem máxima de identidade de sequência e não considerando nenhuma substituição conservativa como parte da identidade de sequência. 0 alinhamento para fins de determinação da percentagem de identidade de sequência de aminoácidos pode ser conseguido de vários modos, que estão no âmbito dos conhecimentos na arte, por exemplo; utilizando programas de computador disponíveis ao público, tais como os programas BLAST, BLAST-2, ALIGN, ALIGN-2 ou Megalign (DNASTAR). Os peritos na arte podem determinar os parâmetros adequados para medir o alinhamento, incluindo quaisquer algoritmos necessários para alcançar um alinhamento máximo ao longo do comprimento total das sequências que estão a ser comparadas. Para os fins aqui descritos, no entanto, os 26
ΕΡ 1 121 439 /PT valores de % de identidade de sequência de aminoácidos são obtidos como descrito a seguir, utilizando o programa de computador de comparação de sequências ALIGN-2, em que o código-fonte completo para o programa ALIGN-2 é fornecido na Tabela 1. 0 programa de computador de comparação de sequências ALIGN-2 é da autoria da Genentech Inc. e o código-fonte apresentado na Tabela 1 foi apresentado com documentação para o utilizador no U.S. Copyright Office, Washington D.C., 20559, onde está registado com o N°. de registo da U.S. Copyright TXU510087. O programa ALIGN-2 está disponível ao público através da Genentech, Inc. São Francisco do sul, Califórnia, ou pode ser compilado a partir do código-fonte proporcionado na Tabela 1. O programa ALIGN-2 deverá ser compilado para utilização num sistema operativo UNIX, de preferência UNIX digital V4.0D. Todos os parâmetros de comparação de sequência são ajustados pelo programa ALIGN-2 e não variam.
Para os fins aqui descritos, a % de identidade de sequência de aminoácidos de uma determinada sequência de aminoácidos A em relação a, com, ou contra uma determinada sequência de aminoácidos B (que pode ser dito, de forma alternativa, como uma determinada sequência de aminoácidos A que tem ou compreende uma determinada % de identidade de sequência de aminoácidos em relação a, com, ou contra uma determinada sequência de aminoácidos B) é calculada como se segue:
100 vezes a fracção X/Y em que X é o número de resíduos de aminoácido pontuados como correspondências idênticas pelo programa de alinhamento de sequências ALIGN-2 nesse alinhamento do programa de A e B e em que Y é o número total de resíduos de aminoácido em B. Deve ter-se em conta que quando o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos de A em relação a B não será igual à % de identidade de sequência de aminoácidos de B em relação a A. Como exemplos de cálculos de % de identidade de sequência de aminoácidos, as
Tabelas 2A-2B mostram como calcular a % de identidade de sequência de aminoácidos da sequência de aminoácidos designada por "proteína de comparação" em relação à sequência de aminoácidos designado por "PRO". 27
ΕΡ 1 121 439 /PT
Salvo especificamente referido em contrário, todos os valores de % de identidade de sequência de aminoácidos aqui utilizados são obtidos como acima descrito utilizando o programa de computador de comparação de sequências ALIGN-2. No entanto, a % de identidade de sequência de aminoácidos também pode ser determinada utilizando o programa de comparação de sequências NCB1-BLAST2 (Altschul et al. , Nucleic Acids Res., 2_5: 3389-3402 (1997)). O programa de comparação de sequências NCB1-BLAST2 pode ser retirado da Internet em http://www.nc-bi.nlm.nih.gov. 0 NCBI-BLAST-2 utiliza vários parâmetros de pesquisa, sendo todos esses parâmetros de pesquisa ajustados para valores por defeito, incluindo, por exemplo, unmask = yes, strand = all, expected occurrences = 10, minimum low complexity length = 15/5, multi-pass e-value = 0,01, constant for multi-pass = 25, dropoff for final gapped alignment = 25 e scoring matrix = BLOSUM62.
Em situações em que o NCBI-BLAST2 é utilizado para comparação de sequências de aminoácidos, a % de identidade de sequência de aminoácidos de uma determinada sequência de aminoácidos A em relação a, com, ou contra uma determinada sequência de aminoácidos B (que pode ser dito, de forma alternativa, como uma determinada sequência de aminoácidos A que tem ou compreende uma determinada % de identidade de sequência de aminoácidos em relação a, com, ou contra uma determinada sequência de aminoácidos B) é calculada como se segue:
100 vezes a fracção X/Y em que X é o número de resíduos de aminoácido pontuados como correspondências idênticas pelo programa de alinhamento de sequências NCBI-BLAST2 nesse alinhamento de A e B do programa e em que Y é o número total de resíduos de aminoácido em B. Deve ter-se em conta que quando o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de identidade de sequência de aminoácidos de A em relação a B não será igual à % de identidade de sequência de aminoácidos de B em relação a A.
Adicionalmente, a % de identidade de sequência de aminoácidos também pode ser determinada utilizando o programa de computador WU-BLAST-2 (Altschul et al., Methods in
Enzymology, 266:460-480 (1996)). A maioria dos parâmetros de 28 ΕΡ 1 121 439 /PT pesquisa de WU-BLAST-2 é ajustada para valores por defeito. Os que não são ajustados para valores por defeito, i.e. os parâmetros ajustáveis, são ajustados com os seguintes valores: overlap span = 1, overlap fraction = 0,125, word threshold (T) = 11, e scoring matrix = BLOSUM62. Para os fins aqui descritos, um valor de % de identidade de sequência de aminoácidos é determinado dividindo (a) o número de resíduos de aminoácido idênticos correspondentes entre a sequência de aminoácidos do polipéptido PRO de interesse, tendo uma sequência derivada do polipéptido PRO nativo, e a sequência de aminoácidos de comparação de interesse (i.e., a sequência contra a qual o polipéptido PRO de interesse está a ser comparada, que pode ser um polipéptido variante de PRO) tal como determinado por WU-BLAST-2 por (b) número total de resíduos de aminoácido do polipéptido PRO de interesse. Por exemplo, na frase "um polipéptido compreendendo uma sequência de aminoácidos A que tem, ou tendo pelo menos 80% de identidade de sequência de aminoácidos com a sequência de aminoácidos B", a sequência de aminoácidos A é a sequência de aminoácidos de interesse de comparação e a sequência de aminoácidos B é a sequência de aminoácidos do polipéptido PRO de interesse. "Polinucleótido variante de PR0211" ou "sequência de ácido nucleico variante de PR0211" significa uma molécula de ácido nucleico que codifica para um polipéptido PR0211 activo como definido a seguir e que tem pelo menos cerca de 80% de identidade de sequência de ácido nucleico, quer com (a) uma sequência de ácido nucleico que codifica para os resíduos 1 ou cerca de 25 a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2), (b) uma sequência de ácido nucleico que codifica para os aminoácidos X a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO: 2), em que X é qualquer resíduo de aminoácido de 20 a 29 da Figura 2 (SEQ ID NO:2), ou (c) uma sequência de ácido nucleico que codifica para outro fragmento derivado especificamente da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2). Normalmente, um polinucleótido variante de PR0211 terá pelo menos cerca de 80% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 81% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 82% de identidade de sequência de ácido nucleico, 29
ΕΡ 1 121 439 /PT mais preferencialmente pelo menos cerca de 83% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 84% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 85% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 86% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 87% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 88% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 89% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 90% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 91% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 92% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 93% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 94% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 95% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 96% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 97% de identidade de sequência de ácido nucleico, mais preferencialmente pelo menos cerca de 98% de identidade de sequência de ácido nucleico e ainda mais preferencialmente pelo menos cerca de 99% de identidade de sequência de ácido nucleico, quer com (a) uma sequência de ácido nucleico que codifica para os resíduos 1 ou cerca de 25 a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2), (b) uma sequência de ácido nucleico que codifica para os aminoácidos X a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO: 2), em que X é qualquer resíduo de aminoácido de 20 a 29 da Figura 2 (SEQ ID NO:2), ou (c) uma sequência de ácido nucleico que codifica para outro fragmento derivado especificamente da sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2). As variantes do polinucleótido PR0211 não incluem a sequência de nucleótidos de PR0211 nativa.
Normalmente, os polinucleótidos variantes de PR0211 têm pelo menos cerca de 30 nucleótidos de comprimento, muitas 30 ΕΡ 1 121 439 /PT vezes pelo menos cerca de 60 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 90 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 120 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 150 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 180 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 210 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 240 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 270 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 300 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 450 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 600 nucleótidos de comprimento, mais frequentemente pelo menos cerca de 900 nucleótidos de comprimento, ou mais. "Percentagem (%) de identidade de sequência de ácido nucleico" em relação às sequências de ácido nucleico que codificam para o polipéptido PR0211 aqui identificadas, é definida como a percentagem de nucleótidos numa sequência candidata que são idênticos aos nucleótidos numa sequência de ácido nucleico que codifica para o polipéptido PR0211, após alinhamento das sequências e introdução de intervalos, se necessário, para se obter a percentagem máxima de identidade de sequência. O alinhamento para fins de determinação da percentagem de identidade de sequência de ácido nucleico pode ser conseguido de vários modos que são do conhecimento do perito na arte, por exemplo, utilizando programas de computador disponíveis ao público, tais como o programa BLAST, BLAST2, ALIGN, ALIGN2 ou Megalign (DNASTAR). Os peritos na arte podem determinar parâmetros adequados para medir o alinhamento, incluindo quaisquer algoritmos necessários para se obter um alinhamento máximo ao longo do comprimento total das sequências a ser comparadas. Para os fins aqui descritos, no entanto, os valores de % de identidade de sequência de ácido nucleico são obtidos como descrito a seguir, utilizando o programa de computador de comparação de sequências ALIGN-2, sendo o código-fonte completo para o programa ALIGN-2 fornecido na Tabela 1. O programa de computador de comparação de sequências ALIGN-2 é da autoria da Genentech, Inc. e o código-fonte apresentado na Tabela 1 foi apresentado com documentação para o utilizador no U.S. Copyright Office, 31
ΕΡ 1 121 439 /PT
Washington D.D., 20559, onde está registado com o N°. de registo da U.S. Copyright, TXU510087. O programa ALIGN-2 está disponível ao público através da Genentech, Inc. São Francisco do sul, Califórnia, ou pode ser compilado a partir do código-fonte fornecido na Tabela 1. O programa ALIGN-2 deverá ser compilado para utilização num sistema operativo UNIX, de preferência UNIX digital V4.0D. Todos os parâmetros de comparação de sequência são ajustados pelo programa ALIGN-2 e não variam.
Para os fins aqui descritos, a % de identidade de sequência de ácido nucleico de uma determinada sequência de ácido nucleico C em relação a, com, ou contra uma determinada sequência de ácido nucleico D (que pode ser dito, de forma alternativa, como uma determinada sequência de ácido nucleico C que tem ou compreende uma determinada % de identidade de sequência de ácido nucleico em relação a, com, ou contra uma determinada sequência de ácido nucleico D) é calculada como se segue:
100 vezes a fracção W/Z em que W é o número de nucleótidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências ALIGN-2 nesse alinhamento do programa de C e D e em que Z é o número total de nucleótidos em D. Deve ter-se em conta que quando o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de sequência de ácido nucleico de C em relação a D não será igual à % de identidade de sequência de ácido nucleico de D em relação a C. Como exemplos de cálculos de % de identidade de sequência de ácido nucleico as Tabelas 2C-2D mostram como calcular a % de identidade da sequência de ácido nucleico designada por "ADN de comparação" em relação à sequência de ácido nucleico designado por "PRO-ADN".
Salvo especificamente referido em contrário, todos os valores de % de identidade de sequência de ácido nucleico aqui utilizados são obtidos como acima descrito utilizando o programa de computador de comparação de sequências ALIGN-2. No entanto, a % de identidade de sequência de ácido nucleico também pode ser determinada utilizando o programa de comparação de sequências NCBI-BLAST2 (Altschul et al., Nucleic
Acids Res., 25:3389-3402 (1997)). O programa de comparaçao de 32 ΕΡ 1 121 439 /PT sequências NCBI-BLAST2 pode ser retirado da Internet em http://www.nc-bi.nim.nih.gov. 0 NCBI-BLAST-2 utiliza vários parâmetros de pesquisa, sendo todos estes parâmetros de pesquisa ajustados para valores por defeito incluindo, por exemplo, unmask = yes, strand = all, expected occurrences = 10, minimum low complexity length = 15/5, multi-pass e-value = 0,01, constant for multi-pass = 25, dropoff for final gapped alignment = 25 e scoring matrix = BLOSUM62.
Em situações em que o NCBI-BLAST2 é utilizado para comparação de sequências, a % de identidade de sequência de ácido nucleico de uma determinada sequência de ácido nucleico C em relação a, com, ou contra uma determinada sequência de ácido nucleico D (o que pode ser dito, de forma alternativa, como uma determinada sequência de ácido nucleico C que tem ou compreende uma determinada % de identidade de sequência de ácido nucleico em relação a, com, ou contra uma determinada sequência de ácido nucleico D) é calculada como se segue:
100 vezes a fracção W/Z em que W é o número de nucleótidos pontuados como correspondências idênticas pelo programa de alinhamento de sequências NCBI-BLAST2 nesse alinhamento do programa de C e D e em que Z é o número total de nucleótidos em D. Deve ter-se em conta que quando o comprimento da sequência de ácido nucleico C não é igual ao comprimento da sequência de ácido nucleico D, a % de identidade de sequência de ácido nucleico de C em relação a D não será igual à % de identidade de sequência de ácido nucleico de D em relação a C.
Adicionalmente, a % de identidade de sequência de ácido nucleico também pode ser determinada utilizando o programa de computador WU-BLAST-2 (Altschul et ai., Methods in Enzymology, 266:460-480 (1996)). A maioria dos parâmetros de pesquisa de WU-BLAST-2 é ajustada para valores por defeito. Os que não são ajustados para valores por defeito, i.e. os parâmetros ajustáveis, são ajustados com os seguintes valores: overlap span = 1, overlap fraction = 0,125, word threshold (T) = 11, e scoring matrix = BLOSUM62. Para os fins aqui descritos, um valor de % de identidade de sequência de ácido nucleico é determinado dividindo (a) o número de nucleótidos idênticos correspondentes entre a sequência de nucleótidos da molécula de ácido nucleico que codifica para o polipéptido PRO de 33 ΕΡ 1 121 439 /PT interesse, tendo uma sequência derivada da sequência de ácido nucleico que codifica para o polipéptido PRO de sequência nativa e a molécula de ácido nucleico de comparação de interesse (i.e., a sequência contra a qual a molécula de ácido nucleico que codifica para o polipéptido PRO de interesse está a ser comparada, que pode ser um polinucleótido variante de PRO) tal como determinado por WU-BLAST-2 por (b) número total de nucleótidos da molécula de ácido nucleico que codifica para o polipéptido PRO de interesse. Por exemplo, na frase "uma molécula de ácido nucleico isolada compreendendo uma sequência de ácido nucleico A que tem ou tendo pelo menos 80% de identidade de sequência de ácido nucleico com a sequência de ácido nucleico B", a sequência de ácido nucleico A é a molécula de ácido nucleico de comparação de interesse e a sequência de ácido nucleico B é a sequência de ácido nucleico da molécula de ácido nucleico que codifica para o polipéptido PRO de interesse.
Noutras concretizações, os polinucleótidos variantes de PR0211 são moléculas de ácido nucleico que codificam para um polipéptido PR0211 activo e que são capazes de hibridar, de preferência sob condições de hibridação e lavagem rigorosas, com sequências de nucleótidos que codificam para o polipéptido PR0211 de tamanho total apresentado na Figura 2 (SEQ ID NO:2). Os polipéptidos variantes de PR0211 podem ser os que são codificados por um polinucleótido variante de PR0211. O termo "positivos" no contexto das comparações de identidade de sequência de aminoácidos realizadas como descrito acima inclui resíduos de aminoácido nas sequências comparadas que são não só idênticos, mas também os que têm propriedades semelhantes. Os resíduos de aminoácido que têm um valor positivo para um resíduo de aminoácido de interesse são os que, ou são idênticos ao resíduo de aminoácido de interesse, ou são uma substituição preferida (como definido na Tabela 3 a seguir) do resíduo de aminoácido de interesse.
Para os fins aqui descritos, o valor de % de positivos de uma determinada sequência de aminoácidos A em relação a, com, ou contra uma determinada sequência de aminoácidos B (que pode ser dito, de forma alternativa, como uma determinada sequência de aminoácidos A que tem ou compreende uma determinada % de 34
ΕΡ 1 121 439 /PT positivos em relação a, com, ou contra uma determinada sequência de aminoácidos B) é calculada como se segue:
100 vezes a fracção X/Y em que X é o número de resíduos de aminoácido que pontuam como valor positivo, como definido acima pelo programa de alinhamento de sequências ALIGN-2 nesse alinhamento de A e B do programa e em que Y é o número total de resíduos de aminoácido em B. Deve ter-se em conta que quando o comprimento da sequência de aminoácidos A não é igual ao comprimento da sequência de aminoácidos B, a % de positivos de A em relação a B não será igual à % de positivos de B em relação a A. "Isolado" quando utilizado para descrever os vários polipéptidos aqui descritos, significa um polipéptido que foi identificado e separado e/ou recuperado de um componente do seu meio ambiente natural. De preferência, o polipéptido isolado é isento de associação com todos os componentes com os quais está naturalmente associado. Os componentes contaminantes do seu meio ambiente natural são materiais que iriam tipicamente interferir com as utilizações de diagnóstico ou terapêuticas do polipéptido e podem incluir enzimas, hormonas e outros solutos proteicos ou não proteicos. Em concretizações preferidas, o polipéptido será purificado (1) até um grau suficiente para se obterem pelo menos 15 resíduos N-terminais ou internos, da sequência de aminoácidos utilizando um sequenciador de copo giratório, ou (2) até à homogeneidade por SDS-PAGE, sob condições não redutoras ou redutoras utilizando coloração com azul de Coomassie ou, de preferência, com prata. Polipéptidos isolados incluem polipéptidos in situ dentro de células recombinantes, uma vez que pelo menos um componente do meio ambiente natural de PR0211, PR0228, PR0538, PR0172 ou PR0182 não estará presente.
Normalmente, no entanto, o polipéptido isolado será preparado por pelo menos um passo de purificação.
Uma molécula de ácido nucleico "isolada" que codifica para um polipéptido PR0211, ou uma molécula de ácido nucleico "isolada" que codifica para um anticorpo anti-PR0211 é uma molécula de ácido nucleico que é identificada e separada de pelo menos uma molécula de ácido nucleico contaminante com a qual está normalmente associada na fonte natural do ácido nucleico que codifica para PR0211, ou ácido nucleico que 35 ΕΡ 1 121 439 /PT codifica para o anti-PR0211. De preferência, o ácido nucleico isolado está isento de associação com todos os componentes com os quais está naturalmente associado. Uma molécula de ácido nucleico isolada que codifica para PR0211 ou uma molécula de ácido nucleico isolada que codifica para anti-PR0211 é outra diferente da forma ou arranjo em que é encontrada na natureza. As moléculas de ácido nucleico isoladas distinguem-se assim da molécula de ácido nucleico que codifica para PR0211, ou da molécula de ácido nucleico que codifica para anti-PR0211 como existem nas células naturais. No entanto, uma molécula de ácido nucleico isolada que codifica para um polipéptido PR0211 ou uma molécula de ácido nucleico isolada que codifica para um anticorpo anti-PR0211 inclui moléculas de ácido nucleico que codificam para PR0211 ou moléculas de ácido nucleico que codificam para anti-PR0211 contidas em células que normalmente expressam polipéptidos PR0211 ou anticorpos anti-PR0211, em que, por exemplo, a molécula de ácido nucleico está numa localização cromossómica diferente da de células naturais. 0 termo "sequências de controlo" refere-se a sequências de ADN necessárias para a expressão de uma sequência codificante ligada de forma operacional, num organismo hospedeiro particular. As sequências de controlo que são adequadas para procariotas, por exemplo, incluem um promotor, opcionalmente uma sequência de operador e um local de ligação ao ribossoma. É conhecido que as células eucariotas utilizam promotores, sinais de poliadenilação e potenciadores.
Um ácido nucleico está "ligado de forma operacional" quando é colocado numa relação funcional com outra sequência de ácido nucleico. Por exemplo, o ADN para uma pré-sequência ou comando secretor está ligado de forma operacional ao ADN para um polipéptido se é expresso como uma pré-proteína que participa na secreção do polipéptido; um promotor ou potenciador está ligado de forma operacional a uma sequência codificante se afecta a transcrição da sequência; ou um local de ligação ao ribossoma está ligado de forma operacional a uma sequência codificante se está posicionado de modo a facilitar a tradução. Em geral, "ligado de forma operacional" significa que as sequências de ADN a ser ligadas são contíguas e, no caso de um comando secretor, contíguas e em fase de leitura. No entanto, os potenciadores não têm que ser contíguos. A 36
ΕΡ 1 121 439 /PT ligação é realizada por ligação em locais de restrição convenientes. Se estes locais não existem, utilizam—se adaptadores ou ligantes de oligonucleótidos sintéticos, de acordo com a prática convencional. 0 termo "anticorpo" é utilizado no sentido mais lato e abrange especificamente, por exemplo, anticorpos monoclonais anti-PR0211 simples (incluindo anticorpos agonistas), composições de anticorpos anti-PR0211 com especificidade poliepitópica, anticorpos anti-PR0211 de cadeia simples e fragmentos de anticorpos anti-PR0211 (ver a seguir). 0 termo "anticorpo monoclonal", tal como agui utilizado, refere-se a um anticorpo obtido de uma população de anticorpos substancialmente homogéneos, i.e. os anticorpos individuais que constituem a população são idênticos, excepto quanto a possíveis mutações que ocorrem naturalmente, que poderão estar presentes em quantidades menores. 0 "rigor" das reacções de hibridação é facilmente determinado por um perito na arte e, em geral, é um cálculo empírico dependente do comprimento da sonda, temperatura de lavagem e concentração de sal. Em geral, sondas maiores requerem temperaturas mais elevadas para uma fusão adequada, enquanto que sondas mais curtas necessitam de temperaturas mais baixas. A hibridação depende em geral da capacidade do ADN desnaturado se fundir novamente quando estão presentes cadeias complementares num meio ambiente abaixo da sua temperatura de fusão. Quanto mais elevado for o grau de homologia desejado entre a sonda e a sequência que híbrida, mais elevada é a temperatura relativa que pode ser utilizada. Como resultado, segue-se que temperaturas relativas mais elevadas tenderão a tornar as condições de reacção mais rigorosas, enquanto que temperaturas mais baixas o farão menos. Para mais detalhes e explicações acerca do rigor das reacções de hibridação, veja-se Ausubel et al., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995). "Condições rigorosas" ou "condições de rigor elevado", como aqui definido, podem ser identificadas como aquelas que: (1) utilizam força iónica baixa e temperatura elevada para a lavagem, por exemplo, cloreto de sódio 0,015 M/citrato de 37
ΕΡ 1 121 439 /PT sódio 0,0015 M/dodecilsulfato de sódio a 0,1% a 50°C; (2) utilizar durante a hibridação um agente desnaturante, tal como formamida, por exemplo, formamida a 50% (v/v) com albumina de soro bovino a 0,1%/Ficoll a 0,1%/polivinilpirrolidona a 0,1%/tampão fosfato de sódio 50 mM a pH 6,5 com cloreto de sódio 750 mM, citrato de sódio 75 mM a 42°C; ou (3) utilizar formamida a 50%, 5 x SSC (NaCl 0, 75 M, citrato de sódio 0,075 M) , fosfato de sódio 50 mM (pH 6,8), pirofosfato de sódio a 0,1%, 5x solução de Denhardt, ADN de esperma de salmão tratado com ultra-sons (50 pg/ml), SDS a 0,1% e sulfato de dextrano a 10%, a 42°C, com lavagens a 42°C em 0,2x SSC (cloreto de sódio/citrato de sódio) e formamida a 50%, a 55°C, seguido de uma lavagem de rigor elevado consistindo de 0,lx SSC contendo EDTA, a 55°C. "Condições moderadamente rigorosas" podem ser identificadas como descrito por Sambrook et ai., Molecular Cloning: A Laboratory Manual, Nova Iorque: Cold Spring Harbor Press, 1989 e incluem a utilização de condições de solução de lavagem e hibridação (e.g. temperatura, força iónica e % de SDS) menos rigorosas que as descritas acima. Um exemplo de condições moderadamente rigorosas é a incubação durante a noite a 37°C numa solução compreendendo: formamida a 20%, 5 x SSC (NaCl 150 mM, citrato trissódico 15 mM) , fosfato de sódio 50 mM (pH 7,6), 5 x solução de Denhardt, sulfato de dextrano a 10% e ADN de esperma de salmão cortado, desnaturado, 20 mg/ml, seguido de lavagem dos filtros em 1 x SSC a cerca de 37-50°C. O perito na arte reconhecerá a forma de ajustar a temperatura, força iónica, etc., como necessário para acomodar factores como o tamanho da sonda e semelhantes. O termo "marcado com epítopo" quando aqui utilizado, refere-se a um polipéptido quimérico compreendendo um polipéptido PR0211 fundido com um "polipéptido marcador". 0 polipéptido marcador tem resíduos suficientes para proporcionar um epítopo contra o qual se pode produzir um anticorpo, mas é suficientemente curto de modo a não interferir com a actividade do polipéptido com o qual está fundido. O polipéptido marcador é também, de preferência, bastante único na medida em que o anticorpo não tem reacção cruzada substancial com outros epítopos. Os polipéptidos marcadores adequados têm geralmente, pelo menos seis resíduos 38
ΕΡ 1 121 439 /PT de aminoácido e têm normalmente entre cerca de 8 e 50 resíduos de aminoácido (de preferência entre cerca de 10 e 20 resíduos de aminoácido).
Tal como aqui utilizado, o termo "imunoadesina" designa moléculas do tipo anticorpo que combinam a especificidade de ligação de uma proteína heteróloga (uma "adesina") com as funções efectoras dos domínios constantes de imunoglobulina. Estruturalmente, as imunoadesinas compreendem uma fusão de uma sequência de aminoácidos com a especificidade de ligação desejada que é outra além do local de reconhecimento e de ligação ao antigénio de um anticorpo (i.e., é "heterólogo") e uma sequência de domínio constante de imunoglobulina. A parte de adesina de uma molécula de imunoadesina é tipicamente uma sequência de aminoácidos contígua compreendendo pelo menos o local de ligação de um receptor, ou um ligando. A sequência do domínio constante de imunoglobulina na imunoadesina pode ser obtida a partir de qualquer imunoglobulina, tal como os subtipos IgG-1, IgG-2, IgG-3, ou IgG-4, IgA (incluindo IgA-1 e IgA-2), IgE, IgD ou IgM. "Activo" ou "actividade" para os fins aqui descritos, refere-se a forma(s) de PR0211 que retêm uma actividade biológica e/ou imunológica do PR0211 nativo ou que ocorre naturalmente, em que actividade "biológica" se refere a uma função biológica (quer inibitória, quer estimuladora) causada por um PR0211 nativo ou que ocorre naturalmente, diferente da capacidade de induzir a produção de um anticorpo contra um epítopo antigénico que um PR0211 nativo ou que ocorre naturalmente possui e uma actividade "imunológica" refere-se à capacidade de induzir a produção de um anticorpo contra um epítopo antigénico que um PR0211 nativo ou que ocorre naturalmente possui. "Actividade biológica" no contexto de um anticorpo ou outro agonista que pode ser identificado pelos testes de pesquisa aqui descritos (e.g., uma molécula pequena orgânica ou inorgânica, péptido, etc.) é utilizada para designar a capacidade destas moléculas invocarem um ou mais dos efeitos aqui enumerados em relação à definição de "quantidade terapeuticamente eficaz". Numa concretização específica, "actividade biológica" é a capacidade de inibir o crescimento 39 ΕΡ 1 121 439 /PT ou proliferação de células neoplásicas. Uma actividade biológica preferida é a inibição, incluindo atrasar ou parar completamente, do crescimento de uma célula de tumor alvo (e.g., cancro). Outra actividade biológica preferida é a actividade citotóxica que resulta na morte da célula de tumor alvo (e.g., cancro). Ainda outra actividade biológica preferida é a indução de apoptose de uma célula de tumor alvo (e.g., cancro). A frase "actividade imunológica" significa reactividade cruzada imunológica com pelo menos um epítopo de um polipéptido PR0211. “Reactividade cruzada imunológica" tal como aqui utilizado, significa que o polipéptido candidato é capaz de inibir competitivamente a actividade biológica qualitativa de um polipéptido PR0211 que tem esta actividade, com anti-soros policlonais produzidos contra o polipéptido PR0211 activo conhecido. Estes anti-soros são preparados de modo convencional injectando cabras ou coelhos, por exemplo, subcutaneamente, com o análogo activo conhecido em adjuvante de Freund completo, seguido de injecção intraperitoneal ou subcutânea de reforço em Freund incompleto. A reactividade cruzada imunológica é preferencialmente "específica", o que significa que a afinidade de ligação da molécula com reactividade cruzada imunológica (e.g., anticorpo) identificado, com o polipéptido PR0211 correspondente é significativamente mais elevada (de preferência, pelo menos cerca de 2 vezes, mais preferencialmente pelo menos cerca de 4 vezes, ainda mais preferencialmente pelo menos cerca de 6 vezes, muito preferencialmente pelo menos cerca de 8 vezes mais elevada) do que a afinidade de ligação dessa molécula com qualquer outro polipéptido nativo conhecido. "Tumor", tal como aqui utilizado, refere-se a todo o crescimento e proliferação de células neoplásicas, quer malignas, quer benignas e a todas as células e tecidos pré-cancerosos e cancerosos.
Os termos "cancro" e "canceroso" referem-se a, ou descrevem a condição fisiológica em mamíferos que se caracteriza tipicamente por um crescimento celular 40 ΕΡ 1 121 439 /PT desregulado. Exemplo de cancro incluem, mas não se limitam a, carcinoma, linfoma, blastoma, sarcoma e leucemia. Exemplos mais particulares destes cancros incluem cancro da mama, cancro da próstata, cancro do cólon, cancro de células escamosas, cancro de pulmão de células pequenas, cancro de pulmão de células não pequenas, cancro dos ovários, cancro cervical, cancro gastrointestinal, cancro pancreático, glioblastoma, cancro do figado, cancro da bexiga, hepatoma, cancro colorrectal, carcinoma endometrial, carcinoma das glândulas salivares, cancro do rim, cancro vulvar, cancro da tiróide, carcinoma hepático e vários tipos de cancro da cabeça e pescoço. "Tratamento" é uma intervenção realizada com a intenção de prevenir o desenvolvimento ou alterar a patologia de um distúrbio. Deste modo, "tratamento" refere-se, quer a tratamento terapêutico, quer a medidas profiláticas ou preventivas. Aqueles que necessitam de tratamento incluem os que já têm o distúrbio, bem como aqueles em que se pretende prevenir o distúrbio. No tratamento de um tumor (e.g. cancro), um agente terapêutico pode diminuir directamente a patologia das células de tumor, ou tornar as células de tumor mais susceptiveis a tratamento por outros agentes terapêuticos, e.g. radiação e/ou quimioterapia. A "patologia" do cancro inclui todos os fenómenos que comprometem o bem-estar do paciente. Isto inclui, sem limitação, crescimento celular anormal ou incontrolado, metástases, interferência com o funcionamento normal das células vizinhas, libertação de citóquinas ou outros produtos secretórios a níveis anormais, supressão ou agravamento da resposta inflamatória ou imunológica, etc.
Uma "quantidade eficaz" de um polipéptido aqui descrito ou um seu agonista, em relação à inibição do crescimento de células neoplásicas é uma quantidade capaz de inibir, nalguma extensão, o crescimento de células alvo. O termo inclui uma quantidade capaz de invocar um efeito inibidor do crescimento, citostático e/ou citotóxico e/ou apoptose das células alvo. Uma "quantidade eficaz" de um polipéptido PR0211 ou um seu agonista para fins de inibição do crescimento de células 41 ΕΡ 1 121 439 /PT neoplásicas, pode ser determinado empiricamente e de um modo rotineiro.
Uma "quantidade terapeuticamente eficaz" em relação ao tratamento de um tumor, refere-se a uma quantidade capaz de invocar um ou mais dos efeitos seguintes: (1) inibição, nalguma extensão, do crescimento de tumor, retardamento e paragem completa do crescimento; (2) redução no número de células de tumor; (3) redução no tamanho do tumor; (4) inibição (i.e. redução, retardamento ou paragem completa) da infiltração de células de tumor em órgãos periféricos; (5) inibição (i.e. redução, retardamento ou paragem completa) de metástases; (6) aumento da resposta imunitária antitumoral que pode, mas não tem que, resultar na regressão ou rejeição do tumor; e/ou (7) alivio, nalguma extensão, de um ou mais sintomas associados com o distúrbio. Uma "quantidade terapeuticamente eficaz" de um polipéptido PR0211 ou um seu agonista para os fins de tratamento do tumor pode ser determinada empiricamente e de um modo rotineiro.
Uma "quantidade inibidora do crescimento" de um polipéptido PR0211 ou um seu agonista é uma quantidade capaz de inibir o crescimento de uma célula, em especial um tumor, e.g., célula de cancro, quer in vitro ou in vivo. Uma "quantidade inibidora do crescimento" de um polipéptido PR0211 ou um seu agonista para os fins de inibição do crescimento neoplásico pode ser determinada empiricamente e de um modo rotineiro.
Uma "quantidade citotóxica" de um polipéptido PR0211 ou um seu agonista, é uma quantidade capaz de provocar a destruição de uma célula, em especial um tumor, e.g., célula de cancro, quer in vitro, ou in vivo. Uma "quantidade citotóxica" de um polipéptido PR0211 ou um seu agonista para os fins de inibição do crescimento de células neoplásicas pode ser determinada empiricamente e de um modo rotineiro. 0 termo "agente citotóxico" tal como aqui utilizado, refere-se a uma substância que inibe ou impede a função das células e/ou causa destruição das células. 0 termo inclui isótopos radioactivos (e.g. I131, I125, Y90 e Re186), agentes quimioterapêuticos, toxinas, tais como toxinas 42
ΕΡ 1 121 439 /PT enzimaticamente activas de origem bacteriana, fúngica, de plantas ou animais, ou seus fragmentos.
Um "agente quimioterapêutico" é um composto químico útil no tratamento do tumor, e.g., cancro. Exemplos de agentes quimioterapêuticos incluem adriamicina, doxorrubicina, epirrubicina, 5-fluorouracilo, citosina arabinósido ("Ara-C"), ciclofosfamida, tiotepa, bussulfano, citoxina, taxóides, e.g. paclitaxel (Taxol, Bristol-Myers Squibb Oncology, Princeton, NJ), e doxetaxel (Taxotere, Rhône-Poulenc Rorer, Antony, Rnace), toxotere, metotrexato, cisplatina, melfalan, vinblastina, bleomicina, etoposido, ifosfamida, mitomicina C, mitoxantrona, vincristina, vinorelbina, carboplatina, teniposido, daunomicina, carminomicina, aminopterina, dactinomicina, mitomicinas, esperamicinas (veja-se Pat. US N°. 4 675 187), melfalan e outras mostardas de azoto relacionadas. Também se incluem nesta definição agentes hormonais que actuam para regular ou inibir a acção hormonal em tumores, tais como tamoxifeno e onapristona.
Um "agente inibidor do crescimento", quando aqui utilizado, refere-se a um composto ou composição que inibe o crescimento de uma célula, em especial um tumor, e.g. célula cancerosa, quer in vitro, ou in vivo. Assim, o agente inibidor do crescimento é um que reduz significativamente a percentagem de células alvo na fase S. Exemplos de agentes inibidores do crescimento incluem agentes que bloqueiam a progressão do ciclo celular (noutra altura que não a fase S) , tais como agentes que induzem a paragem na fase G1 e paragem na fase M. Os bloqueadores de fase M clássicos incluem as vincas (vincristina e vinblastina) , taxol, e inibidores topo II tais como doxorrubicina, epirrubicina, daunorrubicina, etoposido, e bleomicina. Os agentes que induzem paragem na fase G1 irão também arrastar para uma paragem na fase-S, por exemplo, agentes alquilantes de ADN, tais como tamoxifeno, prednisona, dacarbazina, mecloretamina, cisplatina, metotrexato, 5-fluorouracilo, e ara-C. Outras informações podem ser encontradas em The Molecular Basis of Câncer, Mendelsohn e Israel, eds., Capítulo 1, intitulado "Cell cycle regulation, oncogens, and antineoplastic drugs" de Murakami et al. (WB Saunders: Filadélfia, 1995), especialmente p. 13. 43
ΕΡ 1 121 439 /PT Ο termo "citóquina" é um termo genérico para proteínas libertadas por uma população de células que actuam noutra célula como mediadores celulares. Exemplos destas citóquinas incluem linfóquinas, monóquinas e hormonas polipeptídicas tradicionais. Inclui-se nas citóquinas a hormona de crescimento, tal como hormona de crescimento humana, hormona de crescimento humana de N-metionilo e hormona de crescimento bovina; hormona paratiróide; tiroxina; insulina; pró-insulina; relaxina; pró-relaxina; hormonas glicoproteicas - tais como a hormona estimuladora de folículo (FSH), hormona estimuladora da tiróide (TSH), e hormona luteinizante (LH) ; factor de crescimento hepático; factor de crescimento de fibroblastos; prolactina; lactogénio da placenta; factor de necrose de tumor-α e β; substância inibidora de mulleriano; péptido associado a gonadotrofina de ratinho; inibina; activina; factor de crescimento endotelial vascular; integrina; trombopoietina (TPO); factores de crescimento nervoso tais como NGF-β; factor de crescimento de plaquetas; factores de crescimento transformantes (TGF), tais como TGF-α e TGF-β; factor de crescimento tipo insulina-I e II; eritropoietina (EPO); factores osteoindutores; interferões, tais como interferão-α, -β, e -γ; factores estimuladores de colónias (CSF) , tais como CSF de macrófagos (M-CSF) ; CSF de granulócito-macrófago (GM-CSF); e CSF de granulócito (G-CSF); interleucinas (IL), tais como IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL—8, IL-9, IL-11, IL-12; um factor de necrose de tumor, tal como TNF-α ou TNF-β; e outros factores polipeptídicos incluindo LIF e ligando kit (KL). Tal como aqui utilizado, o termo citóquina inclui proteínas de fontes naturais ou de cultura de células recombinante e equivalentes biologicamente activos das citóquinas de sequência nativa. 0 termo "prodroga" tal como utilizado neste pedido, refere-se a uma forma precursora ou derivada de uma substância farmaceuticamente activa que é menos citotóxica para as células de tumor em comparação com a droga mãe e é capaz de ser enzimaticamente activada ou convertida na forma mãe mais activa. Veja-se, e.g., Wilman, "Prodrugs in Câncer Chemotherapy", Biochemical Society Transactions, 14, pp. 375-382, 615th. Meeting Belfast (1986) e Stella et al., "Prodrugs: A Chemical Approach to Targeted Drug Delivery," Directed Druq Delivery, Borchardt et al., (ed.), pp. 247-267, Humana Press 44 ΕΡ 1 121 439 /PT (1985). As prodrogas da presente invenção incluem, mas não se limitam a, prodrogas contendo fosfato, prodrogas contendo tiofosfato, prodrogas glicosiladas ou prodrogas contendo fenilacetamida opcionalmente substituída, 5-fluorocitosina e outras prodrogas de 5-fluorouridina que podem ser derivatizadas numa forma de prodroga para utilização na presente invenção incluem, mas não se limitam aos agentes quimioterapêuticos descritos acima. 0 termo "agonista" é utilizado no sentido mais lato e inclui qualquer molécula que mimetiza uma actividade biológica de um polipéptido PR0211 nativo aqui descrito. As moléculas de agonista adequadas incluem especificamente anticorpos ou fragmentos de anticorpo agonistas, fragmentos ou variantes de sequências de aminoácidos de polipéptidos PR0211 nativos, péptidos, moléculas orgânicas pequenas, etc. Os métodos para identificar agonistas de um polipéptido PR0211 podem compreender contactar uma célula de tumor com um agonista candidato e medir a inibição do crescimento da célula de tumor.
Administração "crónica" refere-se a administração do(s) agente num modo contínuo, ao contrário de um modo agudo, de modo a manter o efeito terapêutico (actividade) inicial durante um período de tempo alargado. Administração "intermitente" é o tratamento que não é consecutivamente realizado sem interrupção, mas tem, pelo contrário, uma natureza cíclica. "Mamífero" para fins de tratamento refere-se a qualquer animal classificado como mamífero, incluindo humanos, animais domésticos e de quinta e animais de zoológico, desporto ou animais de estimação, tais como cães, gatos, gado bovino, cavalos, ovelhas, porcos, cabras, coelhos, etc. De preferência, o mamífero é um humano.
Administração "em combinação com" um ou mais outros agentes terapêuticos inclui a administração simultânea (concorrente) e consecutiva por qualquer ordem. "Transportadores" tal como aqui utilizado inclui transportadores, excipientes ou estabilizantes 45
ΕΡ 1 121 439 /PT farmaceuticamente aceitáveis que são não tóxicos para a célula ou mamífero exposto a eles, nas dosagens e concentrações utilizadas. Muitas vezes, o transportador fisiologicamente aceitável é uma solução tamponada a um pH, aquosa. Exemplos de transportadores fisiologicamente aceitáveis incluem tampões como fosfato, citrato e outros ácidos orgânicos; antioxidantes incluindo ácido ascórbico; polipéptidos de baixo peso molecular (menos de cerca de 10 resíduos); proteínas, tais como albumina de soro, gelatina ou imunoglobulinas; polímeros hidrófilos, tais como polivinilpirrolidona; aminoácidos, tais como glicina, glutamina, asparagina, arginina ou lisina; monossacáridos, dissacáridos e outros hidratos de carbono incluindo glucose, manose ou dextrinas; agentes quelantes, tais como EDTA; álcoois de glícidos, tais como manitol ou sorbitol; contra-iões formadores de sal, tais como sódio; e/ou tensioactivos nao íonicos, tais como TWEEN , polietilenoglicol (PEG) e PLURONICS™. "Anticorpos nativos" e "imunoglobulinas nativas" são normalmente glicoproteínas heterotetraméricas de cerca de 150 000 daltons, compostas por duas cadeias leves (L) idênticas e duas cadeias pesadas (H) idênticas. Cada cadeia leve está ligada a uma cadeia pesada por uma ligação dissulfureto covalente, enquanto que o número de ligações dissulfureto varia entre as cadeias pesadas de diferentes isotipos de imunoglobulinas diferentes. Cada cadeia pesada e leve também tem pontes dissulfureto intracadeia espaçadas regularmente. Cada cadeia pesada tem numa extremidade um domínio variável (VH) seguido de um número de domínios constantes. Cada cadeia leve tem um domínio variável numa extremidade (VL) e um domínio constante na sua outra extremidade: o domínio constante da cadeia leve está alinhado com o primeiro domínio constante da cadeia pesada e o domínio variável de cadeia leve está alinhado com o domínio variável da cadeia pesada. Pensa-se que resíduos de aminoácido particulares formam uma interface entre os domínios variáveis de cadeia leve e cadeia pesada. O termo "variável" refere-se ao facto de determinadas porções dos domínios variáveis diferirem grandemente em sequência entre anticorpos e serem utilizados na ligação e especificidade de cada anticorpo particular para o seu 46
ΕΡ 1 121 439 /PT antigénio particular. No entanto, a variabilidade não está uniformemente distribuída ao longo dos domínios variáveis dos anticorpos. Está concentrada em três segmentos designados por regiões determinantes de complementaridade (CDR) ou regiões hipervariáveis, guer nos domínios variáveis de cadeia leve, guer de cadeia pesada. As porções mais altamente conservadas dos domínios variáveis são designadas por seguência esgueleto (FR). Os domínios variáveis das cadeias pesada e leve nativas compreendem cada um guatro regiões FR, que adoptam essencialmente uma configuração de folha-β, ligados por três CDR, que formam laçadas ligando, e por vezes fazendo parte da estrutura de folha-β. As CDR em cada cadeia são mantidas numa proximidade estreita pelas regiões FR e com as CDR da outra cadeia contribuem para a formação do local de ligação ao antigénio dos anticorpos (veja-se, Kabat et al., NIH Publ. N°.91-3242, Vol.I, páginas 647-669 (1991)). Os domínios constantes não estão envolvidos directamente na ligação de um anticorpo a um antigénio, mas exibem várias funções efectoras, tais como a participação do anticorpo na toxicidade celular dependente de anticorpos. 0 termo "região hipervariável" quando aqui utilizado, refere-se aos resíduos de aminoácido de um anticorpo que são responsáveis pela ligação ao antigénio. A região hipervariável compreende resíduos de aminoácido de uma região "determinante de complementaridade" ou "CDR" (i.e., resíduos 24-34 (Ll), 50-56 (L2) e 89-97 (L3) no domínio variável de cadeia leve e 31- 35 (Hl), 50-65 (H2) e 95-102 (H3) no domínio variável de cadeia pesada; Kabat et al., Sequences of Proteins of
Immunological Interest, 5a Ed. Public Health Service, National Institute of Health, Bethesda, MD. [1991]) e/ou os resíduos de uma "laçada hipervariável" (i.e., resíduos 26-32 (Ll), 50-52 (L2) e 91-96 (L3) no domínio variável de cadeia leve e 26-32 (Hl), 53-55 (H2) e 96-101 (H3) no domínio variável de cadeia pesada; Clothia e Lesk, J. Mol. Biol., 196:901-917 [1987]).
Resíduos de "sequência esqueleto" ou "FR" são os resíduos de domínio variável diferentes dos resíduos da região hipervariável como aqui definido. "Fragmentos de anticorpo" compreendem uma porção de um anticorpo intacto, de preferência a região de ligação ao antigénio ou região variável do anticorpo intacto. Exemplos de 47 ΕΡ 1 121 439 /PT fragmentos de anticorpo incluem fragmentos Fab, Fab', F(ab')2 e Fv; diacorpos; anticorpos lineares (Zapata et ai., Protein Eng. 8 (10):1057-1062 [1995]); moléculas de anticorpo de cadeia simples; e anticorpos multiespecíficos formados a partir de fragmentos de anticorpo. A digestão dos anticorpos com papaina produz dois fragmentos de ligação ao antigénio idênticos; designados por fragmentos "Fab", cada um com um local de ligação ao antigénio único e um fragmento "Fc" residual, uma designação que reflecte a capacidade de cristalizar facilmente. O tratamento com pepsina origina um fragmento F(ab')2 que tem dois locais de combinação com o antigénio e é ainda capaz de reticular com o antigénio. "Fv" é o fragmento de anticorpo mínimo que contém um local de reconhecimento e ligação ao antigénio completo. Esta região consiste de um dímero de um domínio variável de cadeia pesada e um de cadeia leve em associação estreita, não covalente. É nesta configuração que as três CDR de cada domínio variável interagem para definir um local de ligação ao antigénio na superfície do dímero VH-VL. Em conjunto, as seis CDR conferem ao anticorpo a especificidade de ligação ao antigénio. No entanto, mesmo um único domínio variável (ou metade de um Fv compreendendo apenas três CDR específicas para um antigénio) tem a capacidade de reconhecer e se ligar ao antigénio, embora com uma afinidade menor que o local de ligação completo. O fragmento Fab também contém o domínio constante da cadeia leve e o primeiro domínio constante (CHI) da cadeia pesada. Os fragmentos Fab diferem dos fragmentos Fab' pela adição de alguns resíduos no terminal carboxilo do domínio CHI de cadeia pesada, incluindo uma ou mais cisteínas da região dobradiça do anticorpo. Fab'-SH é a designação aqui utilizada para Fab' em que o(s) resíduo de cisteína dos domínios constantes tem um grupo tiol livre. Os fragmentos de anticorpo F(ab')2 foram originalmente produzidos como pares de fragmentos Fab' que têm cisteínas dobradiça entre eles. Também são conhecidos outros acoplamentos químicos de fragmentos de anticorpo. 48
ΕΡ 1 121 439 /PT
As "cadeias leves" de anticorpos (imunoglobulinas) de quaisquer espécies vertebradas podem ser atribuídas a um de dois tipos claramente distintos, designados por capa e lambda, com base nas sequências de aminoácidos dos seus domínios constantes.
Dependendo da sequência de aminoácidos do domínio constante das suas cadeias pesadas, as imunoglobulinas podem ser distribuídas por diferentes classes. Há cinco classes principais de imunoglobulinas: IgA, IgD, IgE, IgG e IgM e várias destas podem ser ainda divididas em subclasses (isotipos), e.g.r IgGl, IgG2, IgG3, IgG4, IgA e IgA2. 0 termo "anticorpo monoclonal", tal como aqui utilizado, refere-se a um anticorpo obtido de uma população de anticorpos substancialmente homogéneos, i.e. os anticorpos individuais que constituem a população são idênticos, excepto quanto a possíveis mutações que ocorrem naturalmente, que poderão estar presentes em quantidades menores. Os anticorpos monoclonais são altamente específicos, sendo dirigidos contra um único local antigénico. Além disso, ao contrário das preparações de anticorpo convencionais (policlonais), que tipicamente incluem diferentes anticorpos dirigidos contra diferentes determinantes (epítopos), cada anticorpo monoclonal é dirigido contra um único determinante no antigénio. Além da sua especificidade, os anticorpos monoclonais são vantajosos na medida em que são sintetizados pela cultura de hibridoma, não contaminados por outras imunoglobulinas. 0 modificador "monoclonal" indica que o anticorpo é obtido a partir de uma população de anticorpos substancialmente homogénea e não deve ser entendido como sendo necessária a produção do anticorpo por qualquer método particular. Por exemplo, os anticorpos monoclonais a ser utilizados de acordo com a presente invenção podem ser produzidos pelo método do hibridoma primeiro descrito por Kohler et al. , Nature, 256:495 (1975), ou podem ser produzidos por métodos de ADN recombinante (veja-se, e.g., Patente US N° . 4.816.567). Os "anticorpos monoclonais" também podem ser isolados a partir de bibliotecas de anticorpos em fagos, utilizando as técnicas descritas em Clackson et al., Nature, 352:624-628 (1991) e Marks et al., J. Mol. Biol., 222:581-597 (1991), por exemplo. 49
ΕΡ 1 121 439 /PT
Os anticorpos monoclonais incluem aqui especificamente anticorpos "quiméricos" (imunoglobulinas) em que uma porção da cadeia pesada e/ou leve é idêntica a, ou homóloga às sequências correspondentes em anticorpos derivados de uma espécie particular, ou que pertencem a uma classe ou subclasse particular de anticorpos, enquanto que o restante da(s) cadeia é idêntico a, ou homólogo às sequências correspondentes em anticorpos derivados de outra espécie, ou pertencentes a outra classe ou subclasse de anticorpo, bem como fragmentos destes anticorpos, desde que estes exibam a actividade biológica desejada (Patente US N°. 4.816.567; Morrison et ai., Proc. Nat1. Acad. Sei. USA, 81:6851-6855 (1984)).
As formas "humanizadas" de anticorpos não humanos (e.g. murideo) são imunoglobulinas quiméricas, cadeias de imunoglobulina ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de ligação ao antigénio de anticorpos) que contêm a sequência mínima derivada da imunoglobulina não humana. Na sua maioria, os anticorpos humanizados são imunoglobulinas humanas (anticorpos receptores) em que resíduos de uma CDR do receptor são substituídos por resíduos de uma CDR de uma espécie não humana (anticorpo dador), tal como um ratinho, rato ou coelho, com a especificidade, afinidade e capacidade desejadas. Nalguns casos, os resíduos da FR de Fv da imunoglobulina humana são substituídos por resíduos não humanos correspondentes. Além disso, os anticorpos humanizados podem compreender resíduos que não são encontrados nem no anticorpo receptor, nem nas sequências CDR ou sequências esqueleto importadas. Estas modificações são feitas para refinar e maximizar ainda mais a performance do anticorpo. Em geral, o anticorpo humanizado compreenderá substancialmente todo, de pelo menos um, e tipicamente dois domínios variáveis, em que todas, ou substancialmente todas as regiões CDR correspondem às de uma imunoglobulina não humana e todas ou substancialmente todas as regiões FR são as de uma sequência de imunoglobulina humana. 0 anticorpo humanizado também irá compreender, de forma óptima, pelo menos uma porção de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana. Para mais detalhes, veja-se Jones et al., Nature, 321:522-525 (1986); Reichmann et al., Nature, 332:323-329 (1988); e Presta, Curr. Op. Struct. Biol., 2:593-596 (1992). 0 50
ΕΡ 1 121 439 /PT anticorpo humanizado inclui um anticorpo PRIMATIZED™ em que a região de ligação ao antigénio do anticorpo é derivada de um anticorpo produzido por imunização de macacos Macaca com o antigénio de interesse.
Os fragmentos de anticorpo "Fv de cadeia simples" ou "sFv" compreendem os domínios VH e VL de anticorpo, em que estes domínios estão presentes numa única cadeia de polipéptido. De preferência, o polipéptido Fv compreende também um ligante de polipéptido entre os domínios VH e VL, o que permite que o sFv forme a estrutura desejada para ligação ao antigénio. Para uma revisão sobre sFv, veja-se Pluckthun em The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg e Moore eds., Springer-Verlag, Nova Iorque, pp. 269-315 (1994). O termo "diacorpos" refere-se a fragmentos de anticorpo pequenos com dois locais de ligação ao antigénio, que compreendem um domínio variável de cadeia pesada (VH) ligado a um domínio variável de cadeia leve (VL) na mesma cadeia de polipéptido (VH-VL) . Utilizando um ligante que é demasiado curto para permitir o emparelhamento entre os dois domínios na mesma cadeia, os domínios são forçados a emparelhar com os domínios complementares de outra cadeia e criar dois locais de ligação ao antigénio. Os diacorpos estão descritos em mais detalhe, por exemplo, na EP 404.097; WO 93/11161; e Hollinger et ai., Proc. Natl. Acad. Sei. USA, _^0:6444-6448 (1983).
Um anticorpo "isolado" é um que foi identificado e separado e/ou recuperado a partir de um componente do seu meio ambiente natural. Os componentes contaminantes do seu meio ambiente natural são materiais que iriam interferir com as utilizações de diagnóstico ou terapêuticas do anticorpo e podem incluir enzimas, hormonas e outros solutos proteicos ou não proteicos. Em concretizações preferidas, o anticorpo será purificado (1) para mais do que 95% em peso de anticorpo, tal como determinado pelo método de Lowry e muito preferencialmente mais do que 99% em peso, (2) a um grau suficiente para se obterem pelo menos 15 resíduos do terminal N ou internos da sequência de aminoácidos, utilizando um sequenciador de copo giratório, ou (3) até à homogeneidade, por SDS-PAGE, sob condições redutoras ou não redutoras, 51
ΕΡ 1 121 439 /PT utilizando coloração com azul de Coomassie ou, de preferência, com prata. O anticorpo isolado inclui o anticorpo in situ dentro de células recombinantes, uma vez que pelo menos um componente do meio ambiente natural do anticorpo não estará presente. Normalmente, no entanto, o anticorpo isolado será preparado por pelo menos um passo de purificação. A palavra "marcador" quando aqui utilizada, refere-se a um composto ou composição detectável que é conjugado directa ou indirectamente com o anticorpo de modo a produzir um anticorpo "marcado". 0 marcador pode ser ele próprio detectável (e.g., marcadores de radioisótopos ou fluorescentes) ou, no caso de um marcador enzimático, pode catalisar a alteração química de um composto ou composição substrato que é detectável. 0 termo "fase sólida" significa uma matriz não aquosa à qual o anticorpo da presente invenção pode aderir. Exemplos de fases sólidas aqui abrangidas incluem as formadas parcial ou inteiramente de vidro (e.g., vidro de poro controlado), polissacáridos (e.g., agarose), poliacrilamidas, poliestireno, poli(álcool vinílico) e silicones. Em certas concretizações, dependendo do contexto, a fase sólida pode compreender o poço de uma placa de teste; noutras é uma coluna de purificação (e.g., uma coluna de cromatografia de afinidade). Este termo também inclui uma fase sólida descontínua de partículas discretas, tais como as descritas na patente US N°. 4.275.149.
Um "lipossoma" é uma vesícula pequena composta por vários tipos de lípidos, fosfolípidos e/ou tensioactivos que é útil para fornecer uma droga (tal como um polipéptido PR0211 ou anticorpo contra este) a um mamífero. Os componentes do lipossoma são normalmente organizados numa formação em bicamada, semelhante à organização de lípidos das membranas biológicas.
Uma "molécula pequena" é aqui definida como tendo um peso molecular inferior a cerca de 500 Daltons. 52
ΕΡ 1 121 439 /PT II. Composições e Métodos A. Polipéptidos PR0211 de tamanho total 0 presente pedido descreve uma sequência de nucleótidos isolada que codifica para um polipéptido designado no presente pedido por PR0211. Em particular, o ADNc que codifica para o polipéptido PR0211 foi identificado e isolado, como descrito em maior pormenor nos Exemplos a seguir.
Como descrito nos Exemplos a seguir, um clone de ADNc que codifica para o polipéptido PR0211 foi depositado na ATCC. A sequência de nucleótidos efectiva dos clones pode ser facilmente determinada pelo perito na arte, por sequenciação dos clones depositados, utilizando métodos de rotina na arte. A sequência de aminoácidos prevista pode ser determinada a partir das sequências de nucleótidos utilizando conhecimentos de rotina. Para o polipéptido PR0211 e ácido nucleico codificante aqui descrito, os requerentes identificaram o que se pensa ser a fase de leitura melhor identificável com a informação de sequência disponível na altura. B. Variantes de PR0211
Além do polipéptido PR0211 de sequência nativa de tamanho total aqui descrito, é contemplado que se podem preparar variantes de PR0211. As variantes de PR0211 podem ser preparadas introduzindo alterações de nucleótidos adequadas no ADN de PR0211 e/ou por síntese do polipéptido PR0211 desejado. Os peritos na arte irão entender que as alterações de aminoácidos podem alterar processos pós-tradução do polipéptido PR0211, tais como alteração do número ou posição dos locais de glicosilação, ou alteração das características de ancoragem na membrana.
As variações no PR0211 de sequência nativa de tamanho total ou em vários domínios do PR0211 aqui descrito podem ser feitas, por exemplo, utilizando qualquer uma das técnicas e linhas de orientação para mutações conservativas e não conservativas apresentadas, por exemplo, na patente US N°. 5 364 934. As variações podem ser uma substituição, eliminação ou inserção de um ou mais codões que codificam para PR0211, o 53
ΕΡ 1 121 439 /PT que resulta numa alteração na sequência de aminoácidos de PR0211, em comparação com o PR0211 de sequência nativa. Opcionalmente, a variação é por substituição de pelo menos um aminoácido por qualquer outro aminoácido, num ou mais dos domínios do PR0211. A linha de orientação na determinação de qual o resíduo de aminoácido que pode ser introduzido, substituído ou eliminado sem afectar de forma adversa a actividade desejada, pode ser encontrada comparando a sequência do PR0211 com a de moléculas de proteína conhecidas, homólogas, e minimizando o número de alterações de sequência de aminoácido feitas em regiões de homologia elevada. As substituições de aminoácidos podem ser o resultado de substituir um aminoácidos por outro aminoácido com propriedades estruturais e/ou químicas semelhantes, tal como a substituição de uma leucina por uma serina, i.e., substituições de aminoácidos conservativas. As inserções ou eliminações podem ser opcionalmente na gama de cerca de 1 a 5 aminoácidos. A variação permitida pode ser determinada fazendo sistematicamente inserções, eliminações ou substituições de aminoácidos na sequência e testando as variantes resultantes quanto à actividade exibida pela sequência nativa de tamanho total ou madura.
Proporcionam-se aqui fragmentos do polipéptido PR0211. Estes fragmentos podem ser truncados no terminal N ou no terminal C ou podem não ter resíduos internos, por exemplo, quando comparados com uma proteína nativa de tamanho total. Alguns fragmentos não possuem resíduos de aminoácido que não são essenciais para uma actividade biológica desejada do polipéptido PR0211.
Os fragmentos de PR0211 podem ser preparados por qualquer uma de várias técnicas convencionais. Os fragmentos de péptido desejados podem ser sintetizados quimicamente. Uma abordagem alternativa envolve produzir fragmentos de PR0211 por digestão enzimática, e.g., tratando a proteína com uma enzima conhecida por clivar proteínas em locais definidos por resíduos de aminoácido particulares, ou por digestão do ADN com enzimas de restrição adequadas e isolando o fragmento desejado. Ainda outra técnica adequada envolve isolar e amplificar um fragmento de ADN que codifica para um fragmento de polipéptido desejado, por reacção em cadeia com polimerase (PCR). Os 54
ΕΡ 1 121 439 /PT oligonucleótidos que definem os terminais desejados do fragmento de ADN são utilizados nos iniciadores 5' e 3' na PCR: De preferência, os fragmentos do polipéptido PR0211 partilham pelo menos uma actividade biológica e/ou imunológica com o polipéptido PR0211 nativo apresentado na Figura 2 (SEQ ID NO:2).
Em concretizações particulares, as substituições conservativas de interesse são apresentadas na Tabela 3, sob o titulo substituições preferidas. Se essas substituições resultam numa alteração na actividade biológica, então introduzem-se alterações mais substanciais, denominadas substituições exemplo na Tabela 3, ou, como melhor descrito a seguir com referência às classes de aminoácidos, e os produtos são pesquisados.
Tabela 3
Resíduo original Substituições exemplificativas Substitui preferi Ala (A) vai; leu; ile vai Arg (R) lys; gin; asn lys Asn (N) gin; his; lys; arg gin Asp (D) glu glu Cys (C) ser ser Gin (Q) asn asn Glu (E) asp asp Gly (G) pro; ala ala His (H) asn; gin; lys; arg arg Ile (I) leu; vai; met; ala; phe; norleucina leu Leu (L) norleucina; ile; vai; met; ala; phe ile Lys (K) arg; gin; asn arg Met (M) leu; phe; ile leu Phe (F) leu; vai; ile; ala; tyr leu Pro (P) ala ala Ser (S) thr thr Thr (T) ser ser Trp (W) tyr; phe tyr Tyr (Y) trp; phe; thr; ser phe Vai (V) ile; leu; met; phe; ala; norleucina leu 55
ΕΡ 1 121 439 /PT
As modificações substanciais na função ou identidade imunológica do polipéptido PR0211 são realizadas seleccionando substituições que diferem significativamente no seu efeito em manter (a) a estrutura do esqueleto do polipéptido na área de substituição, por exemplo, numa conformação de folha ou hélice, (b) a carga ou hidrofobicidade da molécula no local alvo, ou (c) o volume da cadeia lateral. Os resíduos que ocorrem naturalmente são divididos em grupos com base em propriedades de cadeia lateral comuns: (1) hidrófobo: norleucina, met, ala, vai, leu, ile; (2) hidrófilo neutro: cys, ser, thr; (3) ácido: asp, glu; (4) básico: asn, gin, his, to >1 1-1 arg; (5) resíduos que influenciam a orientação da cadeia: pro; e (6) aromático: trp, tyr, phe
As substituições não conservativas irão incluir trocar um membro de uma destas classes por outra classe. Estes resíduos substituídos também podem ser introduzidos em locais de substituição conservativa ou, mais preferencialmente nos locais remanescentes (não conservativos).
As variações podem ser feitas utilizando métodos conhecidos na arte, tais como mutagénese mediada por oligonucleótidos (dirigida para um local), pesquisa de alanina e mutagénese de PCR. A mutagénese dirigida para um local [Cárter et al., Nucl. Acids Res., _13_:4331 (1986); Zoller et al., Nucl. Acids Res., 1_0 :6487 (1987)], mutagénese de cassete [Wells et al., Gene, 3_4:315 (1985)], mutagénese de selecção de restrição [Wells et al., Philos. Trans. R. Soc. London SerA, 317:415 (1986)], ou outras técnicas conhecidas podem ser realizadas no ADN clonado para produzir o ADN variante de PR0211, PR0228, PR0538, PR0172 ou PR0182.
Também se pode utilizar análise de aminoácidos de pesquisa para identificar um ou mais aminoácidos ao longo de uma sequência contígua. De entre os aminoácidos de pesquisa preferidos salientam-se os aminoácidos neutros, pequenos. Estes aminoácidos incluem alanina, glicina, serina e cisteína. A alanina é tipicamente um aminoácido de pesquisa preferido 56
ΕΡ 1 121 439 /PT entre este grupo, pois elimina a cadeia lateral para além do carbono-beta e é menos provável que altere a conformação da cadeia principal da variante [Cunningham e Wells, Science, 244:1081-1085 (1989)]. A alanina também é tipicamente preferida, pois é o aminoácido mais comum. Além disso, ela é frequentemente encontrada, quer em posições enterradas, quer expostas [Creigton, The Proteins (W.H. Freeman & Co. , N.Y.);
Chothia, J. Mol. Biol., 150: 1 (1976)]. Se a substituição de alalina não origina quantidades adequadas da variante pode-se utilizar um aminoácido isotérico. C. Modificações de PR0211
As modificações covalentes de PR0211 estão incluídas no âmbito da presente invenção. Um tipo de modificação covalente inclui reagir resíduos de aminoácido alvo de um polipéptido PR0211 com um agente de derivação orgânico que é capaz de reagir com cadeias laterais seleccionadas, ou com os resíduos N- ou C-terminais de PR0211. A derivatização com agentes bifuncionais é útil, por exemplo, para reticular PR0211 com uma matriz ou superfície de suporte insolúvel em água, para utilização no método para purificar anticorpos anti-PR0211 e vice-versa. Os agentes de reticulação normalmente utilizados incluem, e.g., 1,1-bis(diazoacetil)-2-feniletano, gluteraldeído, ésteres de N-hidroxissuccinimida, por exemplo, ésteres com ácido 4-azidossalicílico, imidoésteres homobifuncionais, incluindo ésteres de dissuccinimidilo, tais como 3,3'-ditiobis(succinimidilpropionato), maleimidas bifuncionais, tais como bis-N-maleimido-1,8-octano e agentes tais como metil-3-[(p-azidofenil)ditio]propioimidato.
Outras modificações incluem desamidação de resíduos de glutaminilo e asparaginilo nos resíduos glutamilo e aspartilo correspondentes, respectivamente, hidroxilação de prolina e lisina, fosforilação de grupos hidroxilo de resíduos serilo ou treonilo, metilação dos grupos α-amino das cadeias laterais de lisina, arginina e histidina [T.E. Creighton, Proteins: Structure and Molecular Properties, W.H. Freeman & Co., São Francisco, pp. 79-86 (1983)], acetilação da amina N-terminal e amidação de qualquer grupo carboxilo C-terminal. 57
ΕΡ 1 121 439 /PT
Outro tipo de modificação covalente do polipéptido PR0211 incluída no âmbito da presente invenção compreende alterar o padrão de glicosilação nativo do polipéptido. "Alterar o padrão de glicosilação nativo" significa para os fins aqui descritos, eliminar uma ou mais porções de hidrato de carbono encontradas no PR0211 de sequência nativa (quer removendo o local de glicosilação subjacente, quer eliminando a glicosilação por meios químicos e/ou enzimáticos) e/ou adicionando um ou mais locais de glicosilação que não estão presentes no PR0211 de sequência nativa.
Adicionalmente, a frase inclui alterações qualitativas na gl icosilação das proteínas nativas, envolvendo uma alteração na natureza e proporções das várias porções de hidrato de carbono presentes. A adição de locais de glicosilação ao polipéptido PR0211 pode ser realizada alterando a sequência de aminoácidos. A alteração pode ser feita, por exemplo, por adição de, ou substituição por um ou mais resíduos de serina ou treonina no PR0211 de sequência nativa (para locais de glicosilação ligados a 0) . A sequência de aminoácidos de PR0211 pode ser opcionalmente alterada por alterações ao nível do ADN, particularmente por mutação do ADN que codifica para o polipéptido PR0211 em bases pré-seleccionadas, de modo que serão produzidos codões que se irão traduzir nos aminoácidos desejados.
Outro meio para aumentar o número de porções de hidrato de carbono no polipéptido PR0211 é por acoplamento químico ou enzimático de glicósidos ao polipéptido. Estes métodos estão descritos na arte, e.g., na WO 87/05330 publicada em 11 de Setembro de 1987 e em Aplin e Wriston, CRC Crit. Rev. Biochem., pp. 259-306 (1981). A remoção de porções de hidrato de carbono presentes no polipéptido PR0211 pode ser conseguida química ou enzimaticamente, ou por substituição mutacional de codões que codificam para resíduos de aminoácido que servem como alvos para a glicosilação. As técnicas de desglicosilação química são conhecidas na arte e são descritas, por exemplo, por Hakimuddin et al., Arch. Biochem. Biophys, 259:52 (1987) e por 58
ΕΡ 1 121 439 /PT
Edge et al., Anal. Biochem., 118;131 (1981). A clivagem enzimática de porções de hidrato de carbono em polipéptidos pode ser conseguida utilizando uma variedade de endo- e exo-glicosidases, como descrito por Thotakura et al., Meth. Enzymol., 138:350 (1987).
Outro tipo de modificação covalente de PR0211 compreende ligar o polipéptido PR0211 a um de uma variedade de polímeros não proteicos, e.g., polietilenoglicol (PEG), polipropilenoglicol ou polioxialquilenos, do modo apresentado nas patentes US Nos. 4.640.835; 4.496.689; 4.301.144; 4.670.417; 4.791.192 ou 4.179.337. O polipéptido PR0211 da presente invenção pode também ser modificado de modo a formar uma molécula quimérica compreendendo PR0211 fundido com outro polipéptido ou sequência de aminoácidos, heterólogos.
Numa concretização, uma molécula quimérica deste tipo compreende uma fusão do polipéptido PR0211 com um polipéptido marcador que proporciona um epítopo ao qual um anticorpo anti-marcador se pode ligar selectivamente. O marcador de epítopo é geralmente colocado no terminal amino ou carboxilo do polipéptido PR0211. A presença destas formas do polipéptido PR0211 marcadas com epítopo pode ser detectada utilizando um anticorpo contra o polipéptido marcador. Além disso, a adição do marcador de epítopo permite que o PR0211 seja facilmente purificado por purificação por afinidade, utilizando um anticorpo anti-marcador, ou outro tipo de matriz de afinidade que se liga ao marcador de epítopo. Vários polipéptidos marcadores e seus anticorpos respectivos são bem conhecidos na arte. Exemplos incluem marcadores de poli-histidina (poli-his) ou poli-histidina-glicina (poli-his-gly); o polipéptido marcador flu HA e o seu anticorpo 12CA5 [Field et ai., Mol. Cell. Biol., 8_:2159-2165 (1988)]; o marcador c-myc e os anticorpos 8F9, 3C7, 6E10, G4, B7 e 9E10 contra estes [Evan et al. Molecular and Cellular Biology, 5_:3610-3616 (1985)]; e o marcador de glicoproteína D (gD) do vírus de herpes simples e o seu anticorpo [Paborsky et al., Protein Engineering, 3_ (6 ) : 547-553 (1990)]. Outros polipéptidos marcadores incluem o péptido-Flag [Hopp et alBioTechnology, 6_:1204-1210 (1988)]; o péptido de epítopo KT3 [Martin et al., Science, 255:192-194 59 ΕΡ 1 121 439 /PT (1992)]; um péptido de epítopo de α-tubulina [Skinner et al., J. Biol. Chem., 266:15163-15166 (1991)]; e o marcador peptídico de proteína do gene 10 de T7 [Lutz-Freyermuth et al., Proc. Natl. Acad. Sei. USA, 8_7: 6393-6397 (1990)].
Numa concretização alternativa, a molécula quimérica pode compreender uma fusão do polipéptido PR0211, PR0228, PR0538, PR0172 ou PR0182 com uma imunoglobulina ou uma região particular de uma imunoglobulina. Para uma forma bivalente da molécula quimérica (também designada por "imunoadesina"), esta fusão pode ser com a região Fc de uma molécula de IgG. As fusões de Ig incluem, de preferência, a substituição de uma forma solúvel (domínio transmembranar eliminado ou inactivado) de um polipéptido PR0211 no lugar de pelo menos uma região variável numa molécula de Ig. Numa concretização particularmente preferida, a fusão de imunoglobulina inclui as regiões dobradiça, CH2 e CH3 ou as regiões dobradiça, CHI, CH2 e CH3 de uma molécula de IgGl. Para a produção de fusões de imunoglobulina veja-se também a patente US N° . 5 428 130, concedida em 27 de Junho de 1995. D. Preparação de PR0211 A descrição a seguir refere-se essencialmente à produção de PR0211 por cultura de células transformadas ou transfectadas com um vector contendo ácido nucleico de PR0211. Contempla-se, obviamente, que se podem utilizar métodos alternativos, que são bem conhecidos na arte, para preparar PR0211. Por exemplo, a sequência do polipéptido PR0211, ou suas porções, pode ser produzida por síntese de péptidos directa utilizando técnicas de fase sólida [veja-se e.g., Stewart et al., Solid-Phase Synthesis, W.H. Freeman Co., São Francisco, CA (1969); Merrifield, J. Am. Chem. Soc., 85:2149-2154 (1963)]. A síntese de proteínas in vitro pode ser realizada utilizando técnicas manuais, ou por automatização. A síntese automatizada pode ser realizada, por exemplo, utilizando um sintetizador de péptidos da Applied Biosystems (Foster City, CA) utilizando as instruções do fabricante. Podem-se sintetizar quimicamente, separadamente, várias porções de PR0211 e combiná-las utilizando métodos químicos ou enzimáticos para produzir o PR0211 de tamanho total. 60 ΕΡ 1 121 439 /PT 1. Isolamento de ADN que codifica para PR0211
Pode-se obter ADN que codifica para PR0211 a partir de uma biblioteca de ADNc preparada a partir de tecido que se pensa possuir o ARNm de PR0211 e expressá-lo a um nível detectável. Assim, pode-se obter ADN de PR0211 humano de forma conveniente a partir de uma biblioteca de ADNc preparada a partir de tecido humano, tal como descrito nos Exemplos. O qene que codifica para PR0211 também pode ser obtido a partir de uma biblioteca genómica ou por procedimentos de síntese conhecidos (e.g. síntese de ácidos nucleicos automatizada).
As bibliotecas podem ser pesquisadas com sondas (tais como anticorpos contra PR0211 ou oligonucleótidos de pelo menos cerca de 20-80 bases) concebidos para identificar o gene de interesse ou a proteína codificada por este. A pesquisa da biblioteca de ADNc ou genómica com a sonda seleccionada pode ser realizada utilizando procedimentos convencionais, tais como os descritos em Sambrook et al., Molecular Cloning: A Laboratory Manual (Nova Iorque: Cold Spring Harbor Laboratory Press, 1989) . Um meio alternativo para isolar o gene que codifica para PR0211 é utilizar metodologia de PCR [Sambrook et al., supra; Dieffenbach et al., PCR Primer: A Laboratory Manual (Cold Spring Harbor Laboratory Press, 1995)].
Os exemplos a seguir descrevem técnicas para pesquisar uma biblioteca de ADNc. As sequências de oligonucleótidos seleccionadas como sondas deverão ter um tamanho suficiente e ser suficientemente não ambíguas para minimizar os falsos positivos. O oligonucleótido é preferencialmente marcado de modo a poder ser detectado por hibridação com o ADN da biblioteca que está a ser pesquisada. Os métodos de marcação são bem conhecidos na arte e incluem a utilização de marcadores radioactivos, tais como ATP marcado com 32P, biotinilação ou marcação enzimática. As condições de hibridação, incluindo rigor moderado e rigor elevado, são proporcionadas em Sambrook et al., supra.
As sequências identificadas nestes métodos de pesquisa de bibliotecas podem ser comparadas e alinhadas com outras sequências conhecidas depositadas e disponíveis em bases de dados públicas, tais como a Genebank, ou outras bases de dados 61
ΕΡ 1 121 439 /PT de sequências privadas. A identidade de sequência (quer ao nível de aminoácidos, quer de nucleótidos) dentro de regiões definidas da molécula ou ao longo da sequência de tamanho total pode ser determinada utilizando métodos conhecidos na arte e como aqui descrito. 0 ácido nucleico com a sequência codificante de proteína pode ser obtido por pesquisa de bibliotecas de ADNc ou genómicas seleccionadas, utilizando a sequência de aminoácidos deduzida aqui descrita pela primeira vez e, se necessário, utilizando procedimentos convencionais de alongamento de iniciadores, como descrito em Sambrook et al., supra, para detectar precursores e processar intermediários de ARNm que poderão não ter sido transcritos inversamente para ADNc. 2. Selecção e transformação de células hospedeiras
As células hospedeiras são transfectadas ou transformadas com vectores de expressão ou clonagem aqui descritos para a produção de PR0211 e cultivadas em meio nutriente convencional modificado, como adequado para induzir promotores, seleccionar transformantes ou amplificar os genes que codificam para as sequências desejadas. As condições de cultura, tais como meios, temperatura, pH e semelhantes, podem ser seleccionadas pelo perito na arte sem experimentação excessiva. Em geral, os princípios, protocolos, e técnicas práticas para maximizar a produtividade das culturas de células podem ser encontrados em Mammalian Cell Biotechnology: A Praticai Approach, M. Butler, ed. (IRL Press, 1991) e Sambrook et al., supra.
Os métodos de transfecção de células eucariotas e transformação de células procariotas são conhecidos dos peritos na arte, por exemplo, mediados por CaCl2, CaP04, lipossomas e electroporação. Dependendo da célula hospedeira utilizada, a transformação é realizada utilizando técnicas convencionais adequadas para estas células. 0 tratamento de cálcio utilizando cloreto de cálcio, como descrito em Sambrook et al., supra, ou electroporação, é geralmente utilizado para procariotas. A infecção com Agrobacterium tumefaciens é utilizada para transformação de determinadas células de planta, como descrito por Shaw et al., Gene 2_3:315 (1983) e WO 89/05859 publicada em 29 de Junho de 1989. Para células de 62 ΕΡ 1 121 439 /PT mamífero sem estas paredes celulares, pode-se utilizar o método de precipitação com fosfato de cálcio de Graham e van der Eb, Virology, _52:456-457 (1978). Foram descritos aspectos gerais de transfecções do sistema de células hospedeiras de mamífero na patente US N°. 4.399.216. As transformações em levedura são tipicamente realizadas de acordo com o método de Van Solingen et al., J. Bact., 130:946 (1977) e Hsiao et al., Proc. Natl. Acad. Sei. (USA), 16_: 3829 (1979). No entanto, também se podem utilizar outros métodos para introduzir ADN nas células, tais como por micro-injecção nuclear, electroporação, fusão de protoplastos bacterianos com células intactas ou policatiões, e.g., polibreno, poliornitina. Para várias técnicas de transformação de células de mamifero, veja-se Keown et ai., Methods in Enzymology, 185:527-537 (1990) e Mansour et al., Nature, 336:348-352 (1988).
As células hospedeiras adeguadas para clonagem ou expressão do ADN nos vectores agui descritos incluem células de procariotas, de levedura, ou de eucariotas superiores. Procariotas adeguados incluem, mas não se limitam a eubactérias, tais como organismos Gram-negativos ou Gram-positivos, por exemplo, Enterobacteriaceae, tal como E. coli. Estão disponíveis ao público várias estirpes de E. coli, tais como E. coli Kl 2 estirpe MM294 (ATCC 31,446); E. coli X1776 (ATCC 31,537); E. coli estirpe W3110 (ATCC 27,325) e K5 772 (ATCC 53,635). Outras células procariotas hospedeiras adequadas incluem Enterobacteriaceae, tal como Escherichia, e.g., E. coli, Enterobacter, Erwinia, Klebsiella, Proteus, Salmonella, e.g., Salmonella typhimurium, Serratia, e.g., Serratia marcescans e Shigella, bem como Bacilli, tal como B. subtilis e B. licheniformis (e.g., B. licheniformis 41P descrito na DD 266.710 publicada em 12 de Abril de 1989), Pseudomonas, tal como P. aeruginosa, e Streptomyces. Estes exemplos são ilustrativos e não limitativos. A estirpe W3110 é um hospedeiro ou hospedeiro progenitor particularmente preferido, pois é uma estirpe hospedeira comum para fermentações de produtos de ADN recombinantes. De preferência, a célula hospedeira segrega quantidades mínimas de enzimas proteolíticas. Por exemplo, a estirpe W3110 pode ser modificada para realizar uma mutação genética nos genes que codificam para proteínas endógenas do hospedeiro, em que exemplos destes hospedeiros incluem E. coli W3110 estirpe 1A2 63
ΕΡ 1 121 439 /PT que tem o genótipo completo tonA; E. coli W3110 estirpe 9E4, que tem o genótipo completo tonA ptr3; E. coli W3110 estirpe 27C7 (ATCC 55.244), que tem o genótipo completo tonA ptr3 phoA E15 (argF-lac)169 degP ompT karf; E. coli W3110 estirpe 37D6, que tem o genótipo completo tonA ptr3 phoA E15 (argF-lac) 169 degP ompT rbs7 ilvG kan ; E. coli W3110 estirpe 40B4, que é a estirpe 37D6 com uma mutação de eliminação degP de não resistência a canamicina; e uma estirpe de E. coli com protease periplasmática mutante descrita na Patente US N°. 4 946 783 concedida em 7 de Agosto de 1990. Alternativamente, são adequados métodos de clonagem in vitro, e.g., PCR ou outras reacções de polimerase de ácido nucleico.
Além dos procariotas, os micróbios eucariotas, tais como fungos filamentosos ou leveduras, são hospedeiros de clonagem ou expressão adequados para vectores que codificam para PR0211. A Saccharomyces cerevisiae é um microorganismo hospedeiro eucariótico inferior normalmente utilizado. Outros incluem Schizosaccharomyces pombe (Beach e Nurse, Nature, 290 : 140 [1981]; EP 139.383 publicada em 2 de Maio de 1985); hospedeiros Kluyveromyces (Patente US N°. 4 943 529; Fleer et al., Bi o/Technology, £:968-975 (1991)) tais como, e.g., K. lactis (MW98-8C, CBS683, CBS4574; Louvencourt et al., J.
Bacteriol., 154(2): 737-42 [1983]), K. fragilis (ATCC 12.424), K. bulgaricus (ATCC 16,045), K. wickeramii (ATCC 24.178), K. waltii (ATCC 56,500), K. drosophilarum (ATCC 36.906; Van den Berg et al., Bi o/Technology, 8_:135 (1990)), K. thermotolerans, e K. marxianus; yarrowia (EP 402.226); Pichia pastoris (EP 183.070; Sreekrishna et al., J. Basic Microbiol. , £8:265-278 [1988]); Candida; Trichoderma reesia (EP 244,234); Neurospora crassa (Case et al., Proc. Natl. Acad. Sei. USA, 7_6,5259-5263 [1979]); Schwanniomyces tal como
Schwanniomyces occidentalis (EP 394.538 publicada em 31 de Outubro de 1990); e fungos filamentosos tais como, e.g., Neurospora, Penicillium, Tolypocladiuni (WO 91/00357 publicada em 10 de Janeiro de 1991), e hospedeiros Aspergillus tais como A. nidulans (Ballance et al., Biochem. Biophys. Res. Commun., 112:284-289 [1983]; Tilburn et al., Gene, 26:205-221 [1983];
Yelton et al., Proc. Natl. Acad. Sei. USA, 81: 1470-1474 [1984]) e A. niger (Kelly e Hynes, EMBO J., £:475-479 [1985]).
As leveduras metilotróficas são aqui adequadas e incluem, mas não se limitam a leveduras capazes de crescer em metanol, 64
ΕΡ 1 121 439 /PT seleccionadas dos géneros consistindo de Hansenula, Candida, Kloeckera, Pichia, Saccharomyces, Torulopsis, e Rhodotorula. Uma lista de espécies que são exemplos desta classe de leveduras pode ser encontrada em C. Anthony, The Biochemistry of Methylotrophs, 269 (1982).
As células hospedeiras adequadas para a expressão de PR0211 glicosilado são derivadas de organismos pluricelulares. Exemplos de células invertebradas incluem células de insecto, tais como Drosophila S2 e Spodoptera Sf9, bem como células de planta. Exemplos de linhas celulares hospedeiras de mamífero úteis incluem células de ovário de hamster chinês (CHO) e COS. Exemplos mais específicos incluem a linha CV1 de rim de macaco transformada por SV40 (COS-7, ATCC CRL 1651); linha de rim embrionário humano (293 ou células 293 subclonadas para crescimento em cultura em suspensão, Graham et al., J. Gen Virol., 3_6:59 (1977)); células de ovário de hamster chinês/DHFR (CHO, Urlaub e Chasin, Proc. Natl. Acad. Sei. USA, 7_7:4216 (1980)); células de Sertoli de ratinho, (TM4, Mather,
Biol. Reprod., 2_3 :243-251 (1980)); células de pulmão humano (W138, ATCC CCL 75); células de fígado humano (Hep G2, HB 8065); e tumor mamário de ratinho (MMT 060562, ATCC CCL51). A selecção da célula hospedeira adequada está no âmbito da especialidade na arte. 3. Selecção e utilização de um vector replicável O ácido nucleico (e.g. ADNc ou ADN genómico) que codifica para PR0211 pode ser inserido num vector replicável para clonagem (amplificação do ADN), ou para expressão. Vários vectores estão disponíveis ao público. O vector pode, por exemplo, ser na forma de um plasmídeo, cosmídeo, partícula virai ou fago. A sequência de ácido nucleico adequada pode ser inserida no vector por uma variedade de procedimentos. Em geral, o ADN é inserido num local (s) de endonuclease de restrição adequado, utilizando técnicas conhecidas na arte. Os componentes de vector incluem geralmente, mas não se limitam a, um ou mais de entre uma sequência de sinal, uma origem de replicação, um ou mais genes marcadores, um elemento potenciador, um promotor e uma sequência de terminação da transcrição. A construção de vectores adequados contendo um ou 65 ΕΡ 1 121 439 /PT mais destes componentes utiliza técnicas de ligação convencionais que são conhecidas do perito na arte. 0 PR0211 pode ser produzido de forma recombinante, não só directamente, mas também como um polipéptido de fusão com um polipéptido heterólogo que pode ser uma sequência de sinal, ou outro polipéptido com um local de clivagem especifico no terminal N da proteína madura ou polipéptido. Em geral, a sequência de sinal pode ser um componente do vector, ou pode ser parte do ADN que codifica para PR0211 que é inserido no vector. A sequência de sinal pode ser uma sequência de sinal procariótica seleccionada, por exemplo, do grupo da fosfatase alcalina, penicilinase, Ipp, ou comandos de Enterotoxina II estáveis ao calor. Para a secreção em levedura a sequência de sinal pode ser, e.g., o comando de invertase de levedura, comando do factor alfa (incluindo comandos de factor-α de Saccharomyces e Kluyveromyces, estando este último descrito na patente US N°. 5.010.182), ou comando de fosfatase ácida, o comando de glucoamilase de C. albicans (EP 362.179 publicada em 4 de Abril de 1990) ou o sinal descrito na WO 90/13646 publicada em 15 de Novembro de 1990. Na expressão em células de mamífero, podem-se utilizar sequências de sinal de mamífero para dirigir a secreção da proteína, tais como sequências de sinal de polipéptidos segregados, da mesma, ou de espécies relacionadas, bem como comandos secretores virais.
Quer os vectores de expressão, quer de clonagem, contêm uma sequência de ácido nucleico que permite que o vector se replique numa ou mais células hospedeiras seleccionadas. Estas sequências são bem conhecidas para uma variedade de bactérias, leveduras e vírus. A origem de replicação do plasmídeo pBR322 é adequada para a maioria das bactérias Gram-negativas, a origem do plasmídeo 2μ é adequada para levedura e várias origens virais (SV40, polioma, adenovírus, VSV ou BPV) são úteis para clonar vectores em células de mamífero.
Os vectores de expressão e clonagem irão conter tipicamente um gene de selecção, também designado por marcador seleccionável. Os genes de selecção típicos codificam para proteínas que (a) conferem resistência a antibióticos ou outras toxinas, e.g., ampicilina, neomicina, metotrexato ou tetraciclina, (b) complementam deficiências auxotróficas, ou 66 ΕΡ 1 121 439 /PT (c) fornecem nutrientes críticos, não disponíveis de meios complexos, e.g. o gene que codifica para D-alanina racemase para Bacilli.
Um exemplo de marcadores seleccionáveis adequados para células de mamífero é o que permite a identificação de células competentes para incorporar o ácido nucleico que codifica para PR0211, tal como DHFR ou timidina-quinase. Uma célula hospedeira adequada quando se utiliza o DHFR do tipo selvagem é a linha celular CHO deficiente em actividade de DHFR, preparada e propagada como descrito por Urlaub et al., Proc. Natl. Acad. Sei. USA, TJ_:A216 (1980). Um gene de selecção adequado para utilização em levedura é o gene trpl presente no plasmídeo de levedura YRp7 [Stinchcomb et al., Nature, 282:39 (1979); Kingsman et al., Gene, (1979); Tschemper et al., Gene, 10:157 (1980)]. O gene trpl proporciona um marcador de selecção para uma estirpe mutante de levedura que não possui a capacidade de crescer em triptofano, por exemplo ATCC N°. 44076 ou PEP4-1 [Jones, Genetics, 8_5:12 (1977)].
Os vectores de expressão e clonagem contêm normalmente um promotor ligado de forma operacional à sequência de ácido nucleico que codifica para PR0211, para dirigir a síntese de ARNm. Os promotores reconhecidos por uma variedade de células hospedeiras potenciais são bem conhecidos. Os promotores adequados para utilização com hospedeiros procariotas incluem os sistemas promotores de β-lactamase e lactose [Chang et al., Nature, 275:615 (1978); Goeddel et al., Nature, 282:544 (1979)], fosfatase alcalina, um sistema promotor de triptofano (trp) [Goeddel, Nucleic Acids Res., _8:4057 (1980); EP 36.776] e promotores híbridos, tais como o promotor tac [deBoer et al., Proc. Natl. Acad. Sei. USA, 8_0:21-25 (1983)]. Os promotores para utilização em sistemas bacterianos também irão conter uma sequência de Shine-Dalgarno (S.D.) ligada de forma operacional ao ADN que codifica para PR0211. (1978) ] , como
Exemplos de sequências promotoras adequadas para utilização com hospedeiros de levedura incluem os promotores para 3-fosfoglicerato-quinase [Hitzeman et al., J. Biol. Chem., 255:2073 (1980)] ou outras enzimas glicolíticas [Hess et al., J. Adv. Enzyme Reg., T_:1A9 (1968); Holland, Biochemistry, 17:4900 (1978)], tais como enolase, 67
ΕΡ 1 121 439 /PT gliceraldeído-3-fosfato-desidrogenase, hexoquinase, piruvato-descarboxilase, fosfofruto-quinase, glucose-6-fosfato- isomerase, 3-fosfoglicerato-mutase, piruvato-quinase, triosefosfato-isomerase, fosfoglucose-isomerase e glucoquinase.
Outros promotores de levedura que são promotores indutíveis com a vantagem adicional da transcrição controlada por condições de crescimento, são as regiões promotoras para a álcool-desidrogenase 2, isocitocromo C, fosfatase ácida, enzimas degradativas associadas com o metabolismo de azoto, metalotioneina, gliceraldeido-3-fosfato-desidrogenase e enzimas responsáveis pela utilização de maltose e galactose. Os vectores e promotores adequados para utilização na expressão em levedura estão melhor descritos na EP 73.657. A transcrição de PR0211 a partir de vectores em células hospedeiras de mamífero é controlada, por exemplo, por promotores obtidos dos genomas de vírus, tais como o vírus de polioma, poxvírus de aves (UK 2.211.504 publicada em 5 de Julho de 1989), adenovírus (tal como adenovírus 2), vírus de papiloma de bovino, vírus de sarcoma de aves, citomegalovírus, um retrovírus, vírus de hepatite B e vírus de símio 40 (SV40), de promotores de mamífero heterólogos, e.g., o promotor de actina ou um promotor de imunoglobulina, e de promotores de choque térmico, desde que estes promotores sejam compatíveis com os sistemas de células hospedeiras. A transcrição de um ADN que codifica para o PR0211 por eucariotas superiores pode ser aumentada inserindo uma sequência potenciadora no vector. Os potenciadores são elementos de ADN que actuam em cis, normalmente de cerca de 10 a 300 pb, que actuam num promotor para aumentar a sua transcrição. Muitas sequências potenciadoras são agora conhecidas de genes de mamífero (globina, elastase, albumina, α-fetoproteína e insulina). Tipicamente, no entanto, utilizar-se-á um potenciador de um vírus de célula eucariota. Exemplos incluem o potenciador de SV40 no lado tardio da origem de replicação (pb 100-270), o potenciador do promotor precoce de citomegalovírus, o potenciador de polioma no lado tardio da origem de replicação e potenciadores de adenovírus. O potenciador pode ser sujeito a splicing no vector numa 68
ΕΡ 1 121 439 /PT posição 5' ou 3' em relação à sequência codificante de PR0211, mas localiza-se de preferência num local 5' em relação ao promotor.
Os vectores de expressão utilizados em células hospedeiras eucariotas (leveduras, fungos, insectos, plantas, animais, humanos ou células nucleadas de outros organismos pluricelulares) também irão conter sequências necessárias para a terminação da transcrição e para estabilizar o ARNm. Estas sequências estão normalmente disponíveis nas regiões não traduzidas 5' e, ocasionalmente, 3', de ADN ou ADNc eucariótico ou virai. Estas regiões contêm segmentos de nucleótidos transcritos como fragmentos poliadenilados na porção não traduzida do ARNm que codifica para PR0211.
Ainda outros métodos, vectores e células hospedeiras adequados para adaptação à síntese de PR0211 em cultura de células de vertebrados, recombinante, estão descritos em Gething et al., Nature, 293:620-625 (1981); Mantei et al.,
Nature, 281:40-46 (1979); EP 117.060; e EP 117.058. 4. Detecção da amplificação/expressão de genes A amplificação e/ou expressão de genes pode ser medida numa amostra directamente, por exemplo, por transferência de Southern, transferência de Northern, convencionais, para quantificar a transcrição de ARNm [Thomas, Proc. Natl. Acad.
Sei. USA, 7_7:5201-5205 (1980)], dot blot (análise de ADN) ou hibridação in situ, utilizando uma sonda marcada de forma adequada, com base nas sequências aqui proporcionadas. Alternativamente, podem-se utilizar anticorpos que podem reconhecer dúplices específicas, incluindo dúplices de ADN, dúplices de ARN e dúplices híbridas de ADN-ARN, ou dúplices de ADN-proteína. Os anticorpos, por outro lado, podem ser marcados e o teste pode ser realizado estando a dúplex ligada a uma superfície, de modo que por formação da dúplex na superfície se pode determinar a presença de anticorpo ligado à dúplex. A expressão de genes, alternativamente, pode ser medida por métodos imunológicos, tais como coloração imuno- histoquímica de células ou secções de tecido e teste de 69 ΕΡ 1 121 439 /PT cultura de células ou fluidos corporais, para quantificar directamente a expressão do produto do gene. Os anticorpos úteis para a coloração imuno-histoquímica e/ou teste de fluidos de amostra podem ser ou monoclonais, ou policlonais e podem ser preparados em qualquer mamífero. De forma conveniente, os anticorpos podem ser preparados contra um polipéptido PR0211 de sequência nativa ou contra um péptido sintético baseado nas sequências de ADN aqui proporcionadas, ou contra uma sequência exógena fundida com ADN de PR0211 e que codifica para um epítopo de anticorpo específico. 5. Purificação do polipéptido
Podem-se recuperar formas de PR0211 a partir do meio de cultura ou de lisados de células hospedeiras. Se ligadas à membrana, elas podem ser libertadas da membrana utilizando uma solução detergente adequada (e.g., Triton-X 100), ou por clivagem enzimática. As células utilizadas na expressão de PR0211 podem ser rompidas por vários meios físicos ou químicos, tais como ciclos de congelação-descongelação, aplicação de ultra-sons, rompimento mecânico ou agentes de lise celular.
Pode ser desejável purificar o PR0211 a partir de proteínas ou polipéptidos de células recombinantes. Os procedimentos seguintes são exemplos de procedimentos de purificação adequados: por fraccionamento numa coluna de troca iónica; precipitação com etanol; HPLC de fase inversa; cromatografia em sílica ou numa resina de troca catiónica, tal como DEAE; cromatofocagem; SDS-PAGE; precipitação com sulfato de amónio; filtração em gel utilizando, por exemplo, Sephadex G-75; colunas de proteína A Sepharose para remover contaminantes, tais como IgG; e colunas quelantes de metal para ligar formas do PR0211 marcadas com epítopos. Podem-se utilizar vários métodos de purificação de proteína e estes métodos são conhecidos na arte e estão descritos, por exemplo, em Deutscher, Methods in Enzymology, 182 (1990); Scopes, Protein Purification: Principies and Practice, Springer-Verlag, Nova Iorque (1982). 0(s) passo de purificação seleccionado irá depender, por exemplo, da natureza do processo de produção utilizado e do PR0211 particular produzido. 70
ΕΡ 1 121 439 /PT Ε. Anticorpos
Alguns candidatos de drogas para utilização nas composições e métodos da presente invenção são anticorpos e fragmentos de anticorpo que mimetizam a actividade de um polipéptido PR0211. 1. Anticorpos policlonais
Os métodos para preparar anticorpos policlonais são conhecidos dos peritos na arte. Os anticorpos policlonais podem ser produzidos num mamífero, por exemplo, por uma ou mais injecções de um agente imunizante e, se desejado, um adjuvante. Tipicamente, o agente imunizante e/ou adjuvante será injectado no mamífero por injecções subcutâneas ou intraperitoneais múltiplas. O agente imunizante pode incluir o polipéptido PR0211 ou uma sua proteína de fusão. Poderá ser útil conjugar o agente imunizante com uma proteína que se sabe ser imunogénica no mamífero a ser imunizado. Exemplos destas proteínas imunogénicas incluem, mas não se limitam a, hemocianina de lapa buraco de fechadura, albumina do soro, tiroglobulina de bovino e inibidor de tripsina de semente de soja. Exemplos de adjuvantes que podem ser utilizados incluem adjuvante completo de Freund e adjuvante MPL-TDM (monofosforil-Lípido A, dicorinomicolato de trealose sintético). O protocolo de imunização pode ser seleccionado por um perito na arte sem experimentação excessiva. 2. Anticorpos monoclonais
Os anticorpos podem, alternativamente, ser anticorpos monoclonais. Os anticorpos monoclonais podem ser preparados utilizando métodos de hibridoma, tais como os descritos por Kohler e Milstein, Nature, 256;495 (1975). Num método de hibridoma, um ratinho, hamster ou outro animal hospedeiro adequado, é tipicamente imunizado com um agente imunizante para desencadear linfócitos que produzem, ou são capazes de produzir anticorpos que se irão ligar especificamente ao agente imunizante. Alternativamente, os linfócitos podem ser imunizados in vitro. 71
ΕΡ 1 121 439 /PT Ο agente de imunização irá incluir tipicamente o polipéptido PR0211 ou uma sua proteína de fusão. Em geral, utilizam-se, quer linfócitos de sangue periférico ("PBL") quando se pretendem células de origem humana, ou utilizam-se células de baço ou células de nódulos linfáticos quando se pretendem fontes de mamífero não humano. Os linfócitos são então fundidos com uma linha celular imortalizada utilizando um agente de fusão adequado, tal como polietilenoglicol, para formar uma célula de hibridoma [Goding, Monoclonal Antibodies: Principies and Practice, Academic Press, (1986) pp. 59-103]. As linhas celulares imortalizadas são normalmente células de mamífero transformadas, em particular células de mieloma originárias de roedores, bovinos ou humanas. Normalmente utilizam-se linhas celulares de mieloma de rato ou ratinho. As células de hibridoma podem ser cultivadas num meio de cultura adequado que contém de preferência uma ou mais substâncias que inibem o crescimento ou sobrevivência das células imortalizadas, não fundidas. Por exemplo, se as células progenitoras não possuem a enzima hipoxantina guanina fosforribosil-transferase (HGPRT ou HPRT), o meio de cultura para os hibridomas incluirá tipicamente hipoxantina, aminopterina e timidina ("meio HAT") substâncias que impedem o crescimento de células deficientes em HGPRT.
As linhas celulares imortalizadas preferidas são as que se fundem de forma eficaz, suportam uma expressão de anticorpo de nível elevado, estável, pelas células que produzem anticorpo seleccionadas e são sensíveis a um meio, tal como o meio HAT. As linhas celulares imortalizadas mais preferidas são linhas de mieloma de murídeo que podem ser obtidas, por exemplo, do Salk Institute Cell Distribution Center, San Diego, Califórnia e da American Type Culture Collection, Manassas, Virgínia. As linhas celulares de mieloma humano e heteromieloma ratinho-humano também foram descritas para a produção de anticorpos monoclonais humanos [Kozbor, J. Immunol., 133:3001 (1984); Brodeur et al., Monoclonal Antibody Production Techniques and Applications, Mareei Dekker, Inc., Nova Iorque, (1987) pp. 51-63]. O meio de cultura em que as células de hibridoma são cultivadas pode ser testado quanto à presença de anticorpos monoclonais dirigidos contra PR0211. De preferência, a 72
ΕΡ 1 121 439 /PT especificidade de ligação de anticorpos monoclonais produzidos pelas células de hibridoma é determinada por imunoprecipitação ou por um teste de ligação in vitro, tal como radioimunoensaio (RIA), ou ensaio imunoabsorvente com enzima ligada (ELISA). Estas técnicas e testes são conhecidos na arte. A afinidade de ligação do anticorpo monoclonal pode, por exemplo, ser determinada pela análise de Scatchard de Munson e Pollard, Anal. Biochem., 107:220 (1980).
Após as células de hibridoma desejadas serem identificadas, os clones podem ser subclonados por procedimentos de diluição limitante e crescidos por métodos convencionais [Goding, supra]. Os meios de cultura adequados para este fim incluem, por exemplo, o meio de Eagle modificado da Dulbecco e meio RPMI-1640. Alternativamente, as células de hibridoma podem ser crescidas in vivo como ascites, num mamífero.
Os anticorpos monoclonais segregados pelos subclones podem ser isolados ou purificados a partir do meio de cultura ou fluido de ascites, por procedimentos convencionais de purificação de imunoglobulina tais como, por exemplo, proteína A-Sepharose, cromatografia de hidroxilapatite, electroforese em gel, diálise ou cromatografia de afinidade.
Os anticorpos monoclonais podem também ser obtidos por métodos de ADN recombinantes, tais como os descritos na patente US 4.816.567. O ADN que codifica para os anticorpos monoclonais da invenção pode ser facilmente isolado e sequenciado utilizando procedimentos convencionais (e.g., utilizando sondas de oligonucleótido que são capazes de se ligar especificamente a genes que codificam para as cadeias pesada e leve de anticorpos de murídeo). As células de hibridoma da invenção servem como uma fonte preferida deste ADN. Uma vez isolado, o ADN pode ser colocado em vectores de expressão, que são então transfectados para células hospedeiras, tais como células COS de símio, células de ovário de hamster chinês (CHO) ou células de mieloma que não produzem de outro modo proteína imunoglobulina, para se obter a síntese de anticorpos monoclonais nas células hospedeiras recombinantes. O ADN também pode ser modificado, por exemplo, substituindo a sequência codificante para os domínios 73 ΕΡ 1 121 439 /PT constantes de cadeia pesada e leve humana, no lugar das sequências de murídeo homólogas [Patente US N° . 4 816 567; Morrison et al., supra] ou ligando de forma covalente à sequência codificante de imunoglobulina, toda ou parte da sequência codificante para um polipéptido não imunoglobulina. Este polipéptido não imunoglobulina pode ser substituído pelos domínios constantes de um anticorpo da invenção, ou pode ser substituído pelos domínios variáveis de um local de combinação com antigénio de um anticorpo da invenção, para criar um anticorpo bivalente, quimérico.
Os anticorpos podem ser anticorpos monovalentes. Os métodos para preparar anticorpos monovalentes são bem conhecidos na arte. Por exemplo, um método envolve a expressão recombinante da cadeia leve de imunoglobulina e a cadeia pesada modificada. A cadeia pesada está truncada geralmente em qualquer ponto na região Fc, de modo a impedir a reticulação da cadeia pesada. Alternativamente, os resíduos de cisteína relevantes são substituídos por outro resíduo de aminoácido, ou são eliminados de modos a impedir a reticulação.
Os métodos in vitro também são adequados para preparar anticorpos monovalentes. A digestão de anticorpos para produzir fragmentos seus, em particular fragmentos Fab, pode ser realizada utilizando técnicas de rotina conhecidas na arte. 3. Anticorpos humanos e humanizados
Os anticorpos da invenção podem também compreender anticorpos humanizados ou anticorpos humanos. As formas humanizadas de anticorpos não humanos (e.g. de murídeo) são imunoglobulinas quiméricas, cadeias de imunoglobulinas ou seus fragmentos (tais como Fv, Fab, Fab', F(ab')2 ou outras subsequências de anticorpos de ligação ao antigénio) que contêm a sequência mínima derivada da imunoglobulina não humana. Os anticorpos humanizados incluem imunoglobulinas humanas (anticorpo receptor) em que os resíduos de uma região determinante de complementaridade (CDR) do receptor são substituídos por resíduos de uma CDR de uma espécie não humana (anticorpo dador), tal como um ratinho, rato ou coelho, com a especificidade, afinidade e capacidade desejadas. Nalguns 74 ΕΡ 1 121 439 /PT casos, os resíduos da sequência esqueleto de Fv da imunoglobulina humana são substituídos por resíduos não humanos correspondentes. Os anticorpos humanizados podem também compreender resíduos que não são encontrados nem no anticorpo receptor, nem nas sequências CDR ou sequências esqueleto importadas. Em geral, o anticorpo humanizado compreenderá substancialmente todo de pelo menos um, e tipicamente dois domínios variáveis, em que todas, ou substancialmente todas as regiões CDR correspondem às de uma imunoglobulina não humana e todas ou substancialmente todas as regiões FR são as de uma sequência de consenso de imunoglobulina humana. 0 anticorpo humanizado também irá compreender, de forma óptima, pelo menos uma porção de uma região constante de imunoglobulina (Fc), tipicamente a de uma imunoglobulina humana [Jones et al., Nature, 321:522-525 (1986); Riechmann et al., Nature, 332:323-329 (1988); e Presta, Curr. Op. Struct. Biol., 2_: 593 — 596 (1992)].
Os métodos para humanizar anticorpos não humanos são bem conhecidos na arte. Em geral, um anticorpo humanizado tem um ou mais resíduos de aminoácido introduzidos nele de uma fonte que é não humana. Estes resíduos de aminoácido não humanos são muitas vezes designados por resíduos de "importação", que são tipicamente retirados de um domínio variável de "importação". A humanização pode ser essencialmente realizada de acordo com o método de Winter e colaboradores [Jones et al., Nature, 321;522-525 (1986); Riechmann et al., Nature, 332:323-327 (1988); Verhoeyen et ai., Science, 239:1534-1536 (1988)], substituindo CDR ou sequências de CDR de roedores pelas sequências correspondentes de um anticorpo humano. Deste modo, estes anticorpos "humanizados" são anticorpos quiméricos (Patente US N°. 4.816.567), em que substancialmente menos do que um domínio variável humano intacto foi substituído pela sequência correspondente de uma espécie não humana. Na prática, os anticorpos humanizados são tipicamente anticorpos humanos em que alguns resíduos de CDR e possivelmente alguns resíduos de FR são substituídos por resíduos de locais análogos em anticorpos de roedores.
Também se podem produzir anticorpos humanos utilizando várias técnicas conhecidas na arte, incluindo bibliotecas de apresentação em fagos [Hoogenboom e Winter, J. Mol. Biol., 75
ΕΡ 1 121 439 /PT 227:381 (1991); Marks et al.r J. Mol. Biol., 222:581 (1991)]. As técnicas de Cole et al. e Boerner et al. também estão disponíveis para a preparação de anticorpos monoclonais humanos (Cole et al., Monoclonal Antibodies and Câncer Therapy, Alan R. Liss, p. 77 (1985) e Boerner et al., J.
Immunol., 147 (1) : 86-95 (1991)]. De igual modo, podem-se produzir anticorpos humanos introduzindo loci de imunoglobulina humana em animais transgénicos, e.g., ratinhos em que os genes de imunoglobulina endógenos foram parcial ou completamente inactivados. Aquando do desafio, observa-se a produção de anticorpos humanos que se assemelha bastante bem à observada em humanos, em todos os aspectos, incluindo o rearranjo, organização de genes e repertório de anticorpos. Esta abordagem está descrita, por exemplo, nas Patentes US Nos. 5 545 807; 5 545 806; 5 569 825; 5 625 126; 5 633 425; 5 661 016, e nas seguintes publicações científicas: Marks et al., Bio/Technology 10, 779-783 (1992); Lonberg et al., Nature 368 856-859 (1994); Morrison, Nature 368, 812-13 (1994); Fishwild et al., Nature Biotechnology 14, 845-51 (1996); Neuberger, Nature Biotechnology 14, 826 (1996); Lonberg e
Huszar, Intern. Rev. Immunol. 13 65-93 (1995). 4. Anticorpos biespecíficos
Os anticorpos biespecíficos são anticorpos monoclonais, de preferência humanos ou humanizados, que têm especificidades de ligação para pelo menos dois antigénios diferentes. No presente caso, uma das especificidades de ligação é para PR0211, a outra é para qualquer outro antigénio e, de preferência, para uma proteína de superfície celular, ou receptor, ou subunidade de receptor.
Os métodos para produzir anticorpos biespecíficos são conhecidos na arte. Tradicionalmente, a produção recombinante de anticorpos biespecíficos baseia-se na co-expressão de dois pares de cadeia pesada/cadeia leve de imunoglobulina, em que as duas cadeias pesadas têm especificidades diferentes [Milstein e Cuello, Nature, 305:537-539 (1983)]. Devido ao sortido aleatório de cadeias pesadas e leves de imunoglobulina, estes hibridomas (quadromas) produzem uma mistura potencial de dez moléculas de anticorpo diferentes, das quais apenas uma tem a estrutura biespecífica correcta. A 76 ΕΡ 1 121 439 /PT purificação da molécula correcta é normalmente realizada por passos de cromatografia de afinidade. Estão descritos processos semelhantes na WO 93/08829, publicada em 13 de Maio de 1993 e em Traunecker et al., EMBO J., 1_0: 3655-3659 (1991).
Os domínios variáveis de anticorpo com as especificidades de ligação desejadas (locais de combinação de anticorpo-antigénio) podem ser fundidos com sequências de domínio constante de imunoglobulina. A fusão é de preferência com um domínio constante de cadeia pesada de imunoglobulina, compreendendo pelo menos parte das regiões dobradiça, CH2 e CH3. É preferido que a primeira região constante de cadeia pesada (CHI) contendo o local necessário para ligação à cadeia leve esteja presente em pelo menos uma das fusões. Os ADN que codificam para as fusões de cadeia pesada de imunoglobulina e, se desejado, a cadeia leve de imunoglobulina, são inseridos em vectores de expressão separados e são co-transfectados num organismo hospedeiro adequado. Para mais detalhes sobre a produção de anticorpos biespecíficos veja-se, por exemplo, Suresh et al., Methods in Enzymology, 121:210 (1986).
De acordo com outra abordagem descrita na WO 96/27011, a interface entre um par de moléculas de anticorpo pode ser manipulada para maximizar a percentagem de heterodímeros que são recuperados da cultura de células recombinante. A interface preferida compreende pelo menos uma parte da região CH3 de um domínio constante de anticorpo. Neste método, uma ou mais cadeias laterais de aminoácido pequenas da interface da primeira molécula de anticorpo são substituídas por cadeias laterais maiores (e.g. tirosina e triptofano). São criadas "cavidades" compensatórias de tamanho idêntico ou semelhante ao da(s) cadeia lateral grande na interface da segunda molécula de anticorpo, substituindo cadeias laterais de aminoácido grandes por outras mais pequenas (e.g. alanina ou treonina). Isto proporciona um mecanismo para aumentar o rendimento do heterodímero em relação a outros produtos finais indesejados, tais como homodímeros.
Podem-se preparar anticorpos biespecíficos como anticorpos de tamanho total ou fragmentos de anticorpo (e.g. anticorpos biespecíficos F(ab')2). As técnicas para produzir anticorpos biespecíficos a partir de fragmentos de anticorpo 77 ΕΡ 1 121 439 /PT foram descritas na literatura. Por exemplo, podem-se preparar anticorpos biespecificos utilizando ligação química. Brennan et al., Science 229:81 (1985) descrevem um procedimento em que anticorpos intactos são clivados proteoliticamente para produzir fragmentos F(ab')2· Estes fragmentos são reduzidos na presença do agente complexante de ditiol, arsenito de sódio, para estabilizar ditióis vizinhos e prevenir a formação de ligações dissulfureto intermoleculares. Os fragmentos Fab' produzidos são então convertidos em derivados tionitrobenzoato (TNB). Um dos derivados Fab'-TNB é então reconvertido no Fab'-tiol por redução com mercaptoetilamina e é misturado com uma quantidade equimolar do outro derivado Fab'-TNB, para formar o anticorpo biespecifico. Os anticorpos biespecificos produzidos podem ser utilizados como agentes para a imobilização selectiva de enzimas.
Os fragmentos Fab' podem ser directamente recuperados de E. coli e quimicamente acoplados para formar anticorpos biespecificos. Shalaby et al., J. Exp. Med. 175:217-225 (1992) descrevem a produção de uma molécula de anticorpo biespecífico F(ab')2 totalmente humanizada. Cada fragmento Fab' foi segregado separadamente a partir de E. coli e submetido a acoplamento químico directo in vitro, para formar o anticorpo biespecífico. 0 anticorpo biespecífico assim formado era capaz de se ligar a células que sobre-expressam o receptor ErbB2 e a células T humanas normais, bem como desencadear a actividade lítica de linfócitos citotóxicos humanos contra alvos de tumor da mama humano.
Também foram descritas várias técnicas para produzir e isolar fragmentos de anticorpo biespecificos, directamente a partir da cultura de células recombinantes. Por exemplo, foram produzidos anticorpos biespecificos utilizando "fechos de correr" de leucina. Kostelny et al., J. Immunol. 148 (5) : 1547-1553 (1992) . Os péptidos "fecho de correr" de leucina das proteínas Fos e Jun foram ligados às porções Fab' de dois anticorpos diferentes, por fusão de genes. Os homodímeros de anticorpo foram reduzidos na região dobradiça para formar monómeros e em seguida foram re-oxidados para formar os heterodímeros de anticorpo. Este método também pode ser utilizado para a produção de homodímeros de anticorpo. A tecnologia de "diacorpos" descrita por Hollinger et al., Proc. 78
ΕΡ 1 121 439 /PT
Natl. Acad. Sei. USA 9_0: 6444-6448 (1993) proporcionou um mecanismo alternativo para produzir fragmentos de anticorpo biespecificos. Os fragmentos compreendem um domínio variável de cadeia pesada (VH) ligado a um domínio variável de cadeia leve (VL) por um ligante que é demasiado curto para permitir o emparelhamento entre os dois domínios na mesma cadeia. Assim, os domínios VH e VL de um fragmento são forçados a emparelhar com os domínios VL e VH complementares de outro fragmento, formando assim dois locais de ligação ao antigénio. Outra estratégia para produzir fragmentos de anticorpo biespecificos utilizando dímeros Fv de cadeia simples (sFv) também foi referida. Veja-se Gruber et al., J. Immunol. 152:5368 (1994). São contemplados anticorpos com mais de duas valências. Por exemplo, podem-se preparar anticorpos triespecíficos. Tutt et al., J. Immunol. 147:60 (1991).
Exemplos de anticorpos biespecificos podem ligar-se a dois epítopos diferentes num determinado polipéptido PR0211 aqui descrito. Alternativamente, pode-se combinar um braço anti-polipéptido PR0211 com um braço que se liga a uma molécula desencadeadora num leucócito, tal como uma molécula receptora de células T (e.g., CD2, CD3, CD28, ou B7) , ou receptores Fc para IgG (FcyR) , tais como FcyRI (CD64), FcyRII (CD32) e FcyRlll (CD16) de modo a focar os mecanismos de defesa celular para a célula que expressa o polipéptido PR0211 particular. Os anticorpos biespecificos também podem ser utilizados para localizar agentes citotóxicos em células que expressam um polipéptido PR0211 particular. Estes anticorpos possuem um braço de ligação a PR0211 e um braço que se liga a um agente citotóxico ou a um quelante de radionuclido, tal como EOTUBE, DPTA, DOTA, ou TETA. Outro anticorpo biespecífico de interesse liga-se ao polipéptido PR0211 e liga-se também ao factor tecidular (TF). 5. Anticorpos heteroconjugados
Os anticorpos heteroconjugados também estão no âmbito da presente invenção. Os anticorpos heteroconjugados são compostos por dois anticorpos ligados de forma covalente. Estes anticorpos foram, por exemplo, propostos para direccionar células do sistema imunitário para células 79 ΕΡ 1 121 439 /PT indesejadas [Patente US N°. 4 676 980], e para o tratamento da infecção por VIH [WO 91/00360; WO 92/200373; EP 03089]. É contemplado que os anticorpos possam ser preparados in vitro utilizando métodos conhecidos em química de proteínas sintéticas, incluindo os que envolvem agentes de reticulação. Por exemplo, podem-se construir imunotoxinas utilizando uma reacção de troca de dissulfureto ou formando uma ligação 3 tioéter. Exemplos de reagentes adequados para este fim incluem iminotiolato e metil-4-mercaptobutirimidato e os descritos, por exemplo, na Patente US N°. 4 676 980. 6. Manipulação da função efectora
Pode ser desejável modificar o anticorpo da invenção em relação à função efectora, de modo a aumentar, e.g., a eficácia do anticorpo no tratamento de cancro. Por exemplo, pode-se introduzir um resíduo(s) de cisteína na região Fc, permitindo desse modo a formação de ligações dissulfureto intercadeia, nesta região. O anticorpo homodimérico assim produzido pode ter uma capacidade de internalização melhorada e/ou morte celular mediada por complemento aumentada e citotoxicidade celular dependente de anticorpos (ADCC). Veja-se Caron et al., J. Exp Med., 176: 1191-1195 (1992) e Shopes, J. Immunol., 148: 2918-2922 (1992). Os anticorpos homodiméricos com actividade antitumoral melhorada também podem ser preparados utilizando agentes de reticulação heterobifuncionais, como descrito em Wolff et al. Câncer Research, 53: 2560-2565 (1993). Alternativamente, um anticorpo pode ser manipulado para ter regiões Fc duplas e pode, assim, ter capacidades de lise do complemento e ADCC, melhoradas. Veja-se Stevenson et al., Anti-Cancer Drug Design, 3: 219-230 (1989) . 7. Imunoconjugados A invenção também se refere a imunoconjugados compreendendo um anticorpo conjugado com um agente citotóxico, tal como um agente quimioterapêutico, toxina (por exemplo, uma toxina enzimaticamente activa de origem bacteriana, fúngica, de planta, ou animal, ou seus fragmentos), ou um isótopo radioactivo (isto é, um radioconjugado). 80
ΕΡ 1 121 439 /PT
Os agentes quimioterapêuticos úteis na produção destes imunoconjugados foram descritos acima. As toxinas enzimaticamente activas e seus fragmentos que podem ser utilizados incluem a cadeia A de difteria, fragmentos activos não ligantes da toxina de difteria, cadeia A de exotoxina (de Pseudomonas aeruginosa) , cadeia A de ricina, cadeia A de abrina, cadeia A de modecina, alfa-sarcina, proteínas de Aleurites fordii, proteínas de diantina, proteínas de Phytolaca americana (PAPI, PAPII, and PAP-S), inibidor de momordica charantia, curcina, crotina, inibidor de sapaonaria officinalis, gelonina, mitogelina, restrictocina, fenomicina, enomicina, e os tricotecenos. Estão disponíveis vários radionuclidos para a produção de anticorpos radioconjugados. Exemplos incluem 212Bi, 131I, 131ln, 90Y, e 186Re.
Os conjugados do anticorpo e agente citotóxico são produzidos utilizando uma variedade de agentes de acoplamento de proteína bifuncionais, tais como N-succinimidil-3-(2-piridilditiol)propionato (SPDP), iminotiolano (IT), derivados bifuncionais de imidoésteres (tais como adipimidato de dimetilo HCL), ésteres activos (tais como suberato de dissuccinimidilo), aldeídos (tais como glutareldeído), compostos bis-azido (tais como bis(p- azidobenzoil)hexanodiamina), derivados de bis-diazónio (tais como bis-(p-diazónio-benzoil)etilenodiamina), diisocianatos (tais como 2,β-diisocianato de tolueno), e compostos de flúor bis-activos (tais como 1,5-difluoro-2,4-dinitrobenzeno). Por exemplo, pode-se preparar uma imunotoxina de ricina como descrito em Vitetta et al., Science, 238: 1098 (1987). O ácido 1-isotiocianatobenzi1-3-metildietilenotriaminapentacético (MX-DTPA) marcado com carbono 14 é um exemplo de agente quelante para a conjugação de radionuclido com o anticorpo. Veja-se WO94/11026.
Noutra concretização, o anticorpo pode ser conjugado com um "receptor" (tal como estreptavidina) para utilização no pré-direccionamento para um tumor, em que o conjugado anticorpo-receptor é administrado ao paciente, seguido de remoção do conjugado não ligado da circulação, utilizando um agente de eliminação e em seguida administração de um "ligando" (e.g. avidina) que é conjugado com um agente citotóxico (e.g., um radionucleótido). 81 ΕΡ 1 121 439 /PT 8. Imunolipossomas
Os anticorpos aqui descritos também podem ser formulados como imunolipossomas. Os lipossomas que contêm o anticorpo são preparados por métodos conhecidos na arte, tal como descrito em Epstein et al., Proc. Natl. Acad. Sei. USA, 82: 3688 (1985); Hwang et al., Proc. Natl Acad. Sei. USA, 77: 4030 (1980); e Pat. US Nos. 4 485 045 e 4 544 545. Os lipossomas com tempo de circulação melhorado estão descritos na Patente US N°. 5 013 556.
Lipossomas particularmente úteis podem ser produzidos pelo método de evaporação de fase inversa com uma composição de lipidos que compreende fosfatidileolina, colesterol, e fosfatidiletanolamina derivatizada com PEG (PEG-PE). Os lipossomas são extrudidos através de filtros com um tamanho de poro definido, para se obterem lipossomas com o diâmetro desejado. Os fragmentos Fab' de anticorpo da presente invenção podem ser conjugados com os lipossomas, como descrito em Martin et al., J. Biol. Chem., 257: 286-288 (1982) através de uma reacção de interpermuta de dissulfureto. Um agente quimioterapêutico (tal como doxorrubicina) está opcionalmente contido no lipossoma. Veja-se Gabizon et al., J. National Câncer Inst., 8_1 (19): 1484 (1989). F. Identificação de proteínas capazes de inibir o crescimento e proliferação de células neoplásicas
As proteínas descritas no presente pedido foram testadas num painel de 60 linhas celulares de tumor actualmente utilizadas na pesquisa de investigação de identificação de drogas in vitro, orientada para doenças, do National Câncer Institute (NCI). O objectivo desta pesquisa é identificar moléculas que tenham actividade citotóxica e/ou citostática contra diferentes tipos de tumor. O NCI pesquisa mais de 10.000 novas moléculas por ano (Monks et al., J. Natl. Câncer Inst. , 8_3:757-766 (1991); Boyd, Câncer: Princ. Pract. Oncol. Update, 3(10):1-12 ([1989]). As linhas celulares de tumor utilizadas neste estudo foram descritas em Monks et al., supra. As linhas celulares cujo crescimento foi significativamente inibido pelas proteínas do presente pedido estão especificadas nos exemplos. 82
ΕΡ 1 121 439 /PT
Os resultados mostraram que as proteínas testadas apresentam actividades citostáticas e, nalguns casos e concentrações, actividades citotóxicas numa variedade de linhas celulares de cancro e são, portanto, candidatos úteis para terapia de tumor.
Também se podem utilizar outros testes baseados em células e modelos animais para tumores (e.g., cancros) para verificar as identificações da pesquisa de cancro do NCI e para melhor compreender a relação entre a proteína aqui identificada e o desenvolvimento e patogénese do crescimento celular neoplásico. Por exemplo, podem-se utilizar culturas primárias derivadas de tumores em animais transgénicos (como descrito a seguir) nos testes baseados em células aqui descritos, embora se prefiram linhas celulares estáveis. As técnicas para derivar linhas celulares continuas a partir de animais transgénicos são bem conhecidas na arte (veja-se, e.g., Small et al., Mol. Cell. Biol., _5:642-648 [1985]). G. Modelos animais
Pode-se utilizar uma variedade de modelos animais bem conhecidos para melhor compreender o papel das moléculas aqui identificadas no desenvolvimento e patogénese de tumores e para testar a eficácia de agentes terapêuticos candidatos, incluindo anticorpos e outros agonistas dos polipéptidos nativos, incluindo agonistas de moléculas pequenas. A natureza in vivo destes modelos torna-os particularmente preditivos das respostas em pacientes humanos. Os modelos animais de tumores e cancros (e.g., cancro da mama, cancro do cólon, cancro da próstata, cancro do pulmão, etc.) incluem quer animais não recombinantes, quer recombinantes (transgénicos). Os modelos animais não recombinantes incluem, por exemplo, modelos de roedores, e.g., murideo. Estes modelos podem ser produzidos introduzindo células de tumor em ratinhos isogénicos utilizando técnicas convencionais, e.g., injecção subcutânea, injecção na veia da cauda, implantação de baço, implantação intraperitoneal, implantação sob a cápsula renal, ou implantação de ortopina, e.g., células de cancro do cólon implantadas em tecido colónico. (veja-se, e.g., publicação PCT N°. WO 97/33551, publicada em 18 de Setembro de 1997). 83
ΕΡ 1 121 439 /PT
Provavelmente, a espécie animal mais frequentemente utilizada em estudos oncológicos é o ratinho imunodeficiente e, em particular, ratinhos atimicos. A constatação de que o ratinho atimico com hipo/aplasia podia ser utilizado com sucesso como hospedeiro para xenoenxertos de tumor humano levou à sua vasta utilização para este fim. 0 gene nu recessivo autossómico foi introduzido num grande número de estirpes congénicas distintas de ratinho atimico, incluindo, por exemplo ASW, A/He, AKR, BALB/c, B10.LP, C17, C3H, C57BL, C57, CBA, DBA, DDD, I/st, NC, NFR, NFS, NFS/N, NZB, NZC, NZW, P, RIII e SJL. Adicionalmente, uma grande variedade de outros animais com defeitos imunológicos herdados, além do ratinho atimico, foram criados e utilizados como receptores de xenoenxertos de tumor. Para mais detalhes veja-se, e.g., The Nude Mouse in Oncology Research, E. Boven e B. Winograd, eds., CRC Press, Inc., 1991.
As células introduzidas nestes animais podem ser derivadas de linhas celulares de tumor/cancro conhecidas, tais como, qualquer das linhas celulares de tumor acima descritas e, por exemplo a linha celular B104-1-1 (linha celular NIH-3T3 estável, transfectada com o proto-oncogene neu); células NIH-3T3 transfectadas com ras-; Caco-2 (ATCC HTB-37); uma linha celular de adenocarcinoma de cólon humano de grau II moderadamente bem diferenciado, HT-29 (ATCC HTB-38), ou de tumores e cancros. As amostras de tumor ou células cancerosas podem ser obtidas de pacientes submetidos a cirurgia, utilizando condições convencionais, envolvendo congelação e armazenamento em azoto liquido (Karmali et al., Br. J. Câncer, 48:689-696 [1983]) .
As células de tumor podem ser introduzidas em animais, tais como ratinhos atimicos, por uma variedade de procedimentos. 0 espaço subcutâneo (s.c.) em ratinhos é muito adequado para a implantação de tumores. Os tumores podem ser transplantados s.c. como blocos sólidos, como biópsias por agulha por utilização de um trocarte, ou como suspensões de células. Para implantação de blocos sólidos ou trocarte, introduzem-se fragmentos de tecido de tumor de tamanho adequado no espaço s.c.. As suspensões de células são preparadas de fresco a partir de tumores primários ou linhas celulares de tumor, estáveis e injectadas subcutaneamente. As 84
ΕΡ 1 121 439 /PT células de tumor também podem ser injectadas como implantes subdérmicos. Nesta localização, o inoculo é depositado entre a parte inferior do tecido conjuntivo dérmico e o tecido s.c.. Boven e Winograd (1991), supra. Os modelos animais de cancro da mama podem ser produzidos, por exemplo, por implantação de células de neuroblastoma de rato (a partir do qual se isolou inicialmente o oncogene neu), ou células NIH-3T3 transformadas com neu, em ratinhos atimicos, essencialmente como descrito por Drebin et al., Proc. Natl. Acad. Sei. USA, 83:9129-9133 (1986) .
De igual modo, podem-se produzir modelos animais de cancro do cólon passando células de cancro do cólon em animais, e.g., ratinhos atimicos, levando ao aparecimento de tumores nestes animais. Um modelo de transplante ortotópico de cancro do cólon humano em ratinhos atimicos foi descrito, por exemplo, por Wang et al., Câncer Research, 5_4:4726-4728 (1994) e Too et al., Câncer Research, 5_5:681-684 (1995). Este modelo baseia-se no designado "METAMOUSE" comercializado pela AntiCancer, Inc., (San Diego, Califórnia).
Os tumores que se desenvolvem em animais podem ser removidos e cultivados in vitro. As células de culturas in vitro podem ser passadas para animais. Estes tumores podem servir como alvos para novos testes ou pesquisa de drogas. Alternativamente, os tumores resultantes da passagem podem ser isolados e o ARN das células pré-passagem e células isoladas após um ou mais ciclos de passagem analisados quanto a expressão diferencial de genes de interesse. Estas técnicas de passagem podem ser realizadas com quaisquer linhas celulares de tumor ou cancro conhecidas.
Por exemplo, Meth A, CMS4, CMS5, CMS21, e WEHI-164 são fibrossarcomas de ratinhos fêmea BALB/c, induzidos quimicamente (DeLeo et al., J. Exp. Med. 146:720 [1977]), que proporcionam um sistema modelo altamente controlável, para estudar as actividades antitumorais de vários agentes (Palladino et al., J. Immunol., 138:4023-4032 [1987]) . Em resumo, as células de tumor são propagadas em cultura de células in vitro. Antes da injecção nos animais, as linhas celulares são lavadas e suspensas em tampão, a uma densidade celular de cerca de 10xl06 a 10xl07 células/ml. Os animais são 85
ΕΡ 1 121 439 /PT então infectados subcutaneamente com 10 a 100 μΐ da suspensão celular, deixando decorrer uma a três semanas para aparecer um tumor.
Adicionalmente, o carcinoma de pulmão de Lewis (3LL) de ratinhos, que é um dos tumores experimentais mais amplamente estudados, pode ser utilizado como um modelo de tumor de investigação. A eficácia neste modelo de tumor foi correlacionada com efeitos benéficos no tratamento de pacientes humanos diagnosticados com carcinoma do pulmão de células pequenas (SCCL). Este tumor pode ser introduzido em ratinhos normais por injecção de fragmentos de tumor de um ratinho afectado ou de células mantidas em cultura (Zupi et ai., Br. J. Câncer, 41, supl. 4:309 [1980]), e há evidências que indicam que o tumor pode ser iniciado por injecção de mesmo uma única célula e que uma proporção muito elevada de células de tumor infectadas sobrevive. Para mais informação acerca deste modelo, veja-se Zacharski, Haemostasis, 16:300-320 [1986]) .
Uma forma de avaliar a eficácia de um composto de teste num modelo animal num tumor implantado, é medir o tamanho do tumor antes e depois do tratamento. Tradicionalmente, o tamanho dos tumores implantados foi medido com um calibrador deslizante em duas ou três dimensões. A medição limitada a duas dimensões não reflecte de forma precisa o tamanho do tumor, deste modo, este é normalmente convertido no volume correspondente utilizando uma fórmula matemática. No entanto, a medição do tamanho do tumor é muito imprecisa. Os efeitos terapêuticos de um candidato de droga podem ser melhor descritos como um atraso de crescimento induzido por tratamento e atraso de crescimento específico. Outra variável importante na descrição do crescimento do tumor é o tempo de duplicação do volume do tumor. Também estão disponíveis programas de computador para o cálculo e descrição do crescimento do tumor, tal como o programa descrito por Rygaard e Spang-Thomsen, Proc. 6th Int. Workshop on Immune-Deficient Animais, Wu e Sheng eds., Basel, 1989, 301. Deve referir-se, no entanto, que a necrose e respostas inflamatórias após o tratamento podem resultar efectivamente num aumento do tamanho do tumor, pelo menos inicialmente. Assim, estas alterações 86 ΕΡ 1 121 439 /PT deverão ser cuidadosamente monitorizadas, por uma combinação de um método morfométrico e análise de citometria de fluxo.
Os modelos animais recombinantes (transgénicos) podem ser manipulados introduzindo a porção codificante dos genes aqui identificados no genoma de animais de interesse, utilizando técnicas convencionais para produzir animais transgénicos. Os animais que podem servir como um alvo para a manipulação transgénica incluem, sem limitação, ratinhos, ratos, coelhos, porquinhos-da-india, ovelhas, cabras, porcos e primatas não humanos, e.g., babuínos, chimpanzés e macacos. As técnicas conhecidas na arte para introduzir um transgene nestes animais incluem a micro-injecção pronucleica (Hoppe e Wanger, Patente US N° . 4 873 191); transferência de genes mediada por retrovírus para linhas germinativas (e.g., Van der Putten et al., Proc. Natl. Acad. Sei. USA, 82, 6148-615 [1985]); direccionamento de genes em células estaminais embrionárias (Thompson et al., Cell, 56, 313-321 [1989]); electroporação de embriões (Lo, Mol. Cel. Biol., 3_, 1803-1814 [1983]); transferência de genes mediada por esperma (Lavitrano et al., Cell, 57, 727-73 11.9691). Para revisão veja-se, por exemplo, Patente US N°. 4.736. 866.
Para os fins da presente invenção, os animais transgénicos incluem os que transportam o transgene apenas em parte das suas células ("animais mosaico"). O transgene pode ser integrado, quer como um transgene único, ou em concatâmeros, e.g., organizados uns a seguir aos outros cabeça-com-cabeça ou cabeça-com-cauda. A introdução selectiva de um transgene num tipo de célula particular também é possível seguindo, por exemplo, a técnica de Lasko et al., Proc. Natl. Acad. Sei. USA, 89, 6232-636 (1992). A expressão do transgene em animais transgénicos pode ser monitorizada por técnicas convencionais. Por exemplo, pode-se utilizar análise de transferência de Southern ou amplificação por PCR para verificar a integração do transgene. O nível de expressão de ARNm pode então ser analisado utilizando técnicas como hibridação in situ, análise de transferência de Northern, PCR ou imunocitoquímica. Os animais são também analisados quanto a sinais de desenvolvimento de tumor ou cancro. 87
ΕΡ 1 121 439 /PT A eficácia de anticorpos que se ligam especificamente aos polipéptidos aqui identificados e outros candidatos de droga pode ser testada também no tratamento de tumores animais espontâneos. Um alvo adequado para estes estudos é o carcinoma de células escamosas (SCC) orais de felino. 0 SCC oral de felino é um tumor maligno altamente invasivo que é a malignidade oral mais comum em gatos, representando mais de 60% dos tumores orais referidos nesta espécie. Raramente forma metástases para locais distantes, embora esta baixa incidência das metástases possa ser apenas um reflexo dos curtos tempos de sobrevivência dos gatos com este tumor. Estes tumores não são normalmente passíveis de cirurgia, essencialmente devido à anatomia da cavidade oral felina. Actualmente, não há nenhum tratamento eficaz para este tumor. Antes de entrar no estudo, cada gato é submetido a um exame clínico completo, biópsia e é pesquisado por tomografia computadorizada (TC). Os gatos diagnosticados com tumores de células escamosas sublinguais são excluídos do estudo. A língua pode ficar paralisada como resultado deste tumor e mesmo que o tratamento mate o tumor, os animais poderão não ser capazes de se alimentar. Cada gato é tratado repetidamente, durante um maior período de tempo. Serão tiradas fotografias dos tumores diariamente, durante o período de tratamento e em cada nova análise subsequente. Após o tratamento, cada gato é submetido a outro varrimento de TC. Os varrimentos de TC e radiogramas torácicos são avaliados a cada 8 semanas em seguida. Os dados são avaliados quanto a diferenças na sobrevivência, resposta e toxicidade em comparação com grupos de controlo. Uma resposta positiva poderá necessitar de evidências de regressão do tumor, de preferência com melhoria da qualidade de vida e/ou maior esperança de vida.
Adicionalmente, também se podem testar outros tumores animais espontâneos, tais como fibrossarcoma, adenocarcinoma, linfoma, condroma, leiomiossarcoma de cães, gatos, e babuínos. De entre estes, o adenocarcinoma mamário de cães e gatos é um modelo preferido, dado que a sua aparência e comportamento são muito semelhantes aos de humanos. No entanto, a utilização 88 ΕΡ 1 121 439 /PT deste modelo é limitada pela ocorrência rara de deste tipo de tumor em animais. H. Testes de pesquisa para candidatos a drogas
Os testes de pesquisa para candidatos a drogas são concebidos para identificar compostos que se ligam de forma competitiva a, ou complexam com o(s) receptor dos polipéptidos aqui identificados, ou que sinalizam de outro modo através deste receptor(es). Estes testes de pesquisa irão incluir testes passíveis de uma pesquisa de bibliotecas químicas com rendimento elevado, tornando-os particularmente adequados para identificar candidatos a drogas de pequenas moléculas. As moléculas pequenas contempladas incluem compostos orgânicos ou inorgânicos sintéticos, incluindo péptidos, de preferência péptidos solúveis, fusões (poli)péptido-imunoglobulina e, em particular, anticorpos incluindo, sem limitação, anticorpos poli- e monoclonais e fragmentos de anticorpo, anticorpos de cadeia simples, anticorpos anti-idiotipo e versões quiméricas ou humanizadas destes anticorpos ou fragmentos, bem como anticorpos humanos e fragmentos de anticorpo. Os testes podem ser realizados numa variedade de formatos, incluindo testes de ligação proteína-proteína, testes de pesquisa bioquímicos, imunoensaios e testes baseados em células, que estão bem caracterizados na arte.
Em testes de ligação, a interacção é a ligação e o complexo formado pode ser isolado ou detectado na mistura reaccional. Numa concretização particular, um receptor de um polipéptido codificado pelo gene aqui identificado ou o candidato a droga é imobilizado numa fase sólida, e.g., numa placa de microtítulo, por ligações covalentes ou não covalentes. A ligação não covalente é geralmente realizada revestindo a superfície sólida com uma solução do polipéptido e secando. Alternativamente, um anticorpo imobilizado, e.g., um anticorpo monoclonal, específico para o polipéptido a ser imobilizado pode ser utilizado para o ancorar a uma superfície sólida. 0 teste é realizado adicionando o componente não imobilizado, que pode ser marcado por um marcador detectável, ao componente imobilizado, e.g., a superfície revestida contendo o componente ancorado. Quando a reacção está completa, os componentes não reagidos são removidos, e.g., por 89
ΕΡ 1 121 439 /PT lavagem e os complexos ancorados na superfície sólida são detectados. Quando o componente originalmente não imobilizado transporta um marcador detectável, a detecção do marcador imobilizado na superfície indica que ocorreu complexação. Quando o componente originalmente não imobilizado não transporta um marcador, a complexação pode ser detectada, por exemplo, utilizando um anticorpo marcado, que se liga especificamente ao complexo imobilizado.
Se o composto candidato interage com, mas não se liga a um receptor particular, a sua interacção com esse polipéptido pode ser testada por métodos bem conhecidos para a detecção de interacções proteína-proteína. Estes testes incluem abordagens tradicionais, tais como, e.g., reticulação, co-imunoprecipitação e co-purificação através de gradientes ou colunas cromatográficas. Além disso, as interacções proteína-proteína podem ser monitorizadas utilizando um sistema genético baseado em levedura, descrito por Fields e colaboradores (Fields e Song, Nature (Londres), 340:245-246 (1989); Chien et al., Proc. Natl. Acad Sei. USA, 88 : 9578-9582 (1991)) como descrito por Chevray e Nathans, Proc. Natl. Acad Sei. USA, 89: 5789-5793 (1991). Muitos activadores da transcrição, tais como GAL4 de levedura, consistem de dois domínios modulares fisicamente discretos, um que actua como domínio de ligação a ADN, o outro funcionando como domínio de activação da transcrição. O sistema de expressão de levedura descrito nas publicações anteriores (geralmente designado por “sistema de dois híbridos") tira vantagem desta propriedade e utiliza duas proteínas híbridas, uma em que a proteína alvo está fundida com o domínio de ligação ao ADN de GAL4 e outra em que as proteínas activadoras candidatas estão fundidas com o domínio de activação. A expressão de um gene repórter GAL1-lacZ sob o controlo de um promotor activado por GAL-4 depende da reconstituição da actividade de GAL4 através da interacção proteína-proteína. As colónias que contêm polipéptidos que interagem são detectadas com um substrato cromogénico para β-galactosidase. Está disponível no mercado, da Clontech, um kit completo (MATCHMAKER™) para identificar interacções proteína-proteína entre duas proteínas específicas, utilizando a técnica de dois híbridos. Este sistema também pode ser alargado para mapear domínios de proteína em interacções de 90 ΕΡ 1 121 439 /PT proteína específicas, bem como para revelar resíduos de aminoácido que são cruciais para estas interacções. I. Composições farmacêuticas
Os polipéptidos da presente invenção, anticorpos agonistas que se ligam especificamente a proteínas aqui identificadas, bem como outras moléculas identificadas pelos testes de pesquisa aqui descritos, podem ser administrados para o tratamento de tumores, incluindo cancros, na forma de composições farmacêuticas.
Quando se utilizam fragmentos de anticorpo, é preferido o fragmento inibidor menor que se liga especificamente ao domínio de ligação da proteína alvo. Por exemplo, com base nas sequências de região variável de um anticorpo, podem-se conceber moléculas de péptido que retêm a capacidade de se ligar à sequência de proteína alvo. Estes péptidos podem ser sintetizados quimicamente e/ou produzidos por tecnologia de ADN recombinante (veja-se, e.g., Marasco et al., Proc. Natl. Acad. Sei. USA 90: 7889-7893 [1993]). A formulação aqui descrita pode também conter mais do que um composto activo, como necessário para a indicação particular a ser tratada, de preferência os que têm actividades complementares que não se afectam umas às outras de forma adversa. Alternativamente, ou em adição, a composição pode compreender um agente que potência a sua função, tal como, por exemplo, um agente citotóxico, citóquina, agente quimioterapêutico ou agente inibidor do crescimento. Estas moléculas estão adequadamente presentes em combinação, em quantidades que são eficazes para os fins pretendidos.
As formulações terapêuticas dos polipéptidos aqui identificados, ou seus agonistas, são preparadas para armazenamento misturando o ingrediente activo tendo o grau de pureza desejado, com transportadores, excipientes ou estabilizantes farmaceuticamente aceitáveis, opcionais (Remington's Pharmaceutical Sciences 16a edição, Osol, A. Ed. [1980]), na forma de formulações liofilizadas ou soluções aquosas. Os transportadores, excipientes ou estabilizantes aceitáveis são não tóxicos para os receptores nas dosagens e 91
ΕΡ 1 121 439 /PT concentrações utilizadas e incluem tampões, tais como fosfato, citrato e outros ácidos orgânicos; antioxidantes, incluindo ácido ascórbico e metionina; conservantes (tais como cloreto de octadecildimetilbenzilamónio; cloreto de hexametónio; cloreto de benzalcónio, cloreto de benzetónio; fenol, álcool butílico ou benzílico; alquilparabenos, tais como metilparabeno ou propilparabeno; catecol; resorcinol; ciclo-hexanol; 3-pentanol; e m-cresol); polipéptidos de baixo peso molecular (inferior a cerca de 10 resíduos); proteínas, tais como albumina de soro, gelatina, ou imunoglobulinas; polímeros hidrófilos, tais como polivinilpirrolidona; aminoácidos, tais como glicina, glutamina, asparagina, histidina, arginina, ou lisina; monossacáridos, dissacáridos, e outros hidratos de carbono, incluindo glucose, manose, ou dextrinas; agentes quelantes, tais como EDTA; glícidos, tais como sacarose, manitol, trealose ou sorbitol; contra-iões formadores de sal, tais como sódio; complexos metálicos (e.g. complexos de Zn-proteína); e/ou tensioactivos não iónicos, tais como TWEEN™, PLURONICS™ ou polietilenoglicol (PEG). A formulação aqui descrita pode também conter mais do que um composto activo, como necessário para a indicação particular a ser tratada, de preferência os que têm actividades complementares que não se afectam umas às outras de forma adversa. Alternativamente, ou em adição, a composição pode compreender um agente citotóxico, citóquina, ou agente inibidor do crescimento. Estas moléculas estão adequadamente presentes em combinação, em quantidades que são eficazes para os fins pretendidos.
Os ingredientes activos também podem ser incluídos em microcápsulas preparadas, por exemplo, por técnicas de coacervação ou por polimerização interfacial, por exemplo, microcápsulas de hidroximetilcelulose ou de gelatina e microcápsulas de poli(metilmetacilato), respectivamente, em sistemas de fornecimento de drogas coloidais (por exemplo, lipossomas, microesferas de albumina, microemulsões, nanopartícuias e nanocápsulas) ou em macroemulsões. Estas técnicas estão descritas em Reminqton's Pharmaceutical
Sciences, 16a edição, Oslo, A. Ed. (1980). 92
ΕΡ 1 121 439 /PT
As formulações a ser utilizadas para administração in vivo deverão ser estéreis. Isto é facilmente conseguido por filtração através de membranas de filtração estéreis, antes ou depois de liofilização e reconstituição.
As composições terapêuticas aqui descritas são geralmente colocadas num recipiente com uma porta de acesso estéril, por exemplo, um saco de solução intravenosa ou frasco com uma rolha perfurável por meio de uma agulha de injecção hipodérmica.
Podem-se preparar preparações de libertação controlada. Exemplos adequados de preparações de libertação controlada incluem matrizes semipermeáveis de polímeros hidrófobos sólidos contendo o anticorpo, as quais são na forma de artigos moldados, e.g., películas ou microcápsulas. Exemplos de matrizes de libertação controlada incluem poliésteres, hidrogéis (por exemplo, poli(2-hidroxietilmetacrilato) ou poli(álcool vinílico)), polilactidos (Pat. US N°. 3 773 919), copolímeros de ácido L-glutâmico e γ-etil-L-glutamato, etileno-acetato de vinilo não degradável, copolímeros de ácido láctico-ácido glicólico degradáveis, tais como LUPRON DEPOT™ (microesferas injectáveis compostas por copolímero de ácido láctico-ácido glicólico e acetato de leuprolida), e ácido poli-D-(-)-3-hidroxibutírico. Apesar dos polímeros, tais como etileno-acetato de vinilo e ácido láctico-ácido glicólico, permitirem a libertação de moléculas durante mais de 100 dias, alguns hidrogéis libertam proteínas durante períodos de tempo menores. Quando os anticorpos encapsulados permanecem no corpo durante um tempo prolongado, eles podem-se desnaturar ou agregar, como resultado da exposição à humidade a 37°C, resultando numa perda de actividade biológica e possíveis alterações na imunogenicidade. Podem-se delinear estratégias racionais para a estabilização, dependendo do mecanismo envolvido. Por exemplo, quando se verifica que o mecanismo de agregação é a formação de ligações S-S intermoleculares através da interpermuta tio-dissulfureto, a estabilização pode ser conseguida modificando resíduos de sulfidrilo, liofilizando a partir de soluções ácidas, controlando o teor de humidade, utilizando aditivos adequados, e desenvolvendo composições de matriz de polímeros específicas. 93
ΕΡ 1 121 439 /PT J. Métodos de tratamento É contemplado que os polipéptidos da presente invenção e seus agonistas, incluindo anticorpos, péptidos e agonistas de moléculas pequenas, possam ser utilizados para tratar vários tumores, e.g., cancros. Exemplos de condições ou distúrbios a ser tratados incluem tumores benignos ou malignos (e.g., carcinomas renal, do fígado, rim, bexiga, mama, gástrico, ovárico, colorrectal, da próstata, pancreático, do pulmão, vulvar, da tiróide, hepático; sarcomas; glioblastomas; e vários tumores da cabeça e pescoço); leucemias e malignidades linfóides; outros distúrbios, tais como distúrbio neuronal, glial, de astrócitos, hipotalâmico e outros glandular, macrofágico, epitelial, estromal e blastocélico; e distúrbios inflamatórios, angiogénicos e imunológicos. Os agentes antitumorais da presente invenção (incluindo os polipéptidos aqui descritos e agonistas que mimetizam a sua actividade), e.g., anticorpos, péptidos e moléculas orgânicas pequenas) são administrados a um mamífero, de preferência um humano, de acordo com métodos conhecidos, tais como administração intravenosa como um bólus, ou por infusão contínua durante um período de tempo, ou pelas vias intramuscular, intraperitoneal, intracerebrospinal, intra-ocular, intra-arterial, intralesional, subcutânea, intra-articular, intra-sinovial, intratecal, oral, tópica ou por inalação.
Podem-se combinar outros regimes terapêuticos com a administração dos agentes anticancerosos da presente invenção. Por exemplo, o paciente a ser tratado com estes agentes anticancerosos pode também receber terapia de radiação. Alternativamente, ou em adição, pode-se administrar um agente quimioterapêutico ao paciente. A preparação e esquemas de dosagem para estes agentes quimioterapêuticos podem ser utilizados de acordo com as instruções do fabricante, ou como determinado empiricamente pelo perito na arte. A preparação e esquemas de dosagem para esta quimioterapia também estão descritos em Chemotherapy Service Ed., M.C. Perry, Williams & Wilkins, Baltimore, MD (1992). 0 agente quimioterapêutico pode preceder, ou suceder à administração do agente antitumoral da presente invenção, ou pode ser administrado em simultâneo com este. Os agentes anticancerosos da presente invenção podem ser combinados com um composto anti-estrogénio, tal como 94
ΕΡ 1 121 439 /PT tamoxifeno, ou um anti-progesterona, tal como onapristona (veja-se EP616812) em dosagens conhecidas para estas moléculas.
Poderá ser desejável administrar também anticorpos contra antigénios associados a tumores, tais como anticorpos que se ligam a ErbB2, EGFR, ErbB3, ErbB4, ou factor de crescimento endotelial vascular (VEGF). Alternativamente, ou em adição, dois ou mais anticorpos que se ligam ao mesmo, ou a dois ou mais antigénios associados a cancro diferentes podem ser co-administrados ao paciente. Por vezes, pode ser benéfico administrar também uma ou mais citóquinas ao paciente. Numa concretização preferida, os agentes anticancerosos aqui descritos são co-administrados com um agente inibidor do crescimento. Por exemplo, o agente inibidor do crescimento pode ser administrado primeiro, seguido da administração de um agente anticanceroso da presente invenção. No entanto, também é contemplada a administração simultânea ou administração do agente anticanceroso da presente invenção primeiro. As dosagens adequadas para o agente inibidor de crescimento são as actualmente utilizadas e podem ser diminuídas devido à acção combinada (sinergia) do agente inibidor de crescimento e o anticorpo aqui descritos.
Para a prevenção ou tratamento de doenças, a dosagem adequada de um agente antitumoral aqui descrito dependerá do tipo de doença a ser tratada, como definido acima, da gravidade e evolução da doença, do facto de o agente ser administrado para fins preventivos ou terapêuticos, da terapia anterior, do historial clínico do paciente e da resposta ao agente e do critério do médico assistente. 0 agente é adequadamente administrado ao paciente de uma só vez, ou ao longo de uma série de tratamentos. As experiências animais proporcionam uma linha de orientação fiável para a determinação de doses eficazes para terapia humana. 0 escalonamento de doses eficazes inter-espécies pode ser realizado seguindo os princípios estipulados por Mordenti, J. e Chappell, W. "The use of interspecies scaling in toxicokinetics" In Toxicokinetics and New Drug Development, Yacobi et al.r Eds., Pergamon Press, Nova Iorque 1989, pp. 42-96 . 95
ΕΡ 1 121 439 /PT
Por exemplo, dependendo do tipo e gravidade da doença, cerca de 1 pg/kg a 15 mg/kg (e.g. 0,1-20 mg/kg) de um agente antitumoral é uma dosagem candidata inicial para administração ao paciente, quer seja, por exemplo, por uma ou mais administrações separadas, ou por infusão continua. Uma dose diária típica pode variar entre cerca de 1 pg/kg a 100 mg/kg ou mais, dependendo dos factores acima mencionados. Para administrações repetidas ao longo de vários dias ou mais, dependendo da condição, o tratamento é mantido até ocorrer uma supressão desejada dos sintomas da doença. No entanto, poderão ser úteis outros regimes de dosagem. O progresso desta terapia é facilmente monitorizado por técnicas e testes convencionais. A linha de orientação quanto a dosagens e métodos de fornecimento particulares é proporcionada na literatura; veja-se, por exemplo, Pat. US Nos. 4 657 760; 5 206 344; ou 5 225 212. Prevê-se que diferentes formulações serão eficazes para diferentes compostos de tratamento e diferentes distúrbios, que a administração tendo como alvo um órgão ou tecido, por exemplo, pode necessitar de fornecimento de um modo diferente de outro órgão ou tecido. K. Artigos de fabrico
Noutra concretização da invenção, é proporcionado um artigo de fabrico contendo materiais úteis para o diagnóstico ou tratamento dos distúrbios descritos acima. O artigo de fabrico compreende um recipiente e um rótulo. Recipientes adequados incluem, por exemplo, garrafas, frascos, seringas e tubos de ensaio. Os recipientes podem ser formados a partir de uma variedade de materiais, tais como vidro ou plástico. O recipiente contém uma composição que é eficaz para o diagnóstico ou tratamento da condição e pode ter uma porta de acesso estéril (por exemplo, o recipiente pode ser um saco de solução intravenosa, ou um frasco com uma rolha perfurável por uma agulha de injecção hipodérmica). O agente activo na composição é um agente antitumoral da presente invenção. O rótulo no, ou associado com o recipiente indica que a composição é utilizada para diagnosticar ou tratar a condição de escolha. O artigo de fabrico pode ainda compreender um segundo recipiente compreendendo um tampão farmaceuticamente aceitável, tal como solução salina tamponada com fosfato, solução de Ringer e solução de dextrose. Pode ainda incluir 96 ΕΡ 1 121 439 /PT outros materiais desejáveis do ponto de vista comercial e do utilizador, incluindo outros tampões, diluentes, filtros, agulhas, seringas e folhetos informativos com instruções de utilização.
Os exemplos seguintes são fornecidos apenas para fins ilustrativos e não pretendem limitar o âmbito da presente invenção em nenhum modo.
EXEMPLOS
Os reagentes disponíveis no mercado referidos nos exemplos foram utilizados de acordo com as instruções do fabricante, salvo indicação em contrário. A fonte das células identificadas nos exemplos seguintes e ao longo do pedido por números de acesso da ATCC é a American Type Culture Collection, Manassas, VA.
EXEMPLO I
Isolamento do clone de ADNc que codifica para PRQ211 (A) PRQ211
As sequências de domínio extracelular (ECD) (incluindo a sequência de sinal de secreção, se existente) de cerca de 950 proteínas segregadas conhecidas da base de dados pública Swiss-Prot foram utilizadas para pesquisar bases de dados EST. As bases de dados EST incluíam bases de dados de EST públicas (e.g., GenBank) e uma base de dados de EST de proprietário (LIFESEQ®, Incyte Pharmaceuticals, Paio Alto, CA). A pesquisa foi realizada utilizando o programa de computador BLAST ou BLAST2 [Altschul et al., Methods in Enzymology, 266:460-480 (1996)] como comparação das sequências de proteína de ECD com uma tradução de 6 fases das sequências EST. As comparações que resultam numa pontuação BLAST de 70 (ou nalguns casos, 90) ou superior, que não codificavam para proteínas conhecidas foram agrupadas e organizadas em sequências de ADN de consenso com o programa "phrap" (Phil Green, Universidade de Washington, Seattle, Washington). 97
ΕΡ 1 121 439 /PT
Uma sequência de consenso de ADN foi organizada em relação a outras sequências EST utilizando phrap, como acima descrito. Esta sequência de consenso é aqui designada por DNA28730. Nalguns casos, a sequência de consenso deriva de uma sequência de ADN de consenso intermédia que foi alongada utilizando ciclos repetidos de BLAST e phrap para alongar essa sequência de consenso intermédia tanto quanto possível, utilizando as fontes das sequências EST discutidas acima.
Com base na sequência de consenso DNA28730, sintetizaram-se oligonucleótidos: 1) para identificar por PCR uma biblioteca de ADNc que continha a sequência de interesse e 2) para utilizar como sondas para isolar um clone da sequência codificante de tamanho total para PR0211. Os iniciadores de PCR de sentido directo e inverso têm normalmente de 20 a 30 nucleótidos e são muitas vezes concebidos para originar um produto de PCR com cerca de 100-1000 pb de comprimento. As sequências sonda têm tipicamente 40-55 pb de comprimento. Nalguns casos, sintetizam-se oligonucleótidos adicionais quando a sequência de consenso é superior a cerca de 1-1,5 kpb. De modo a pesquisar várias bibliotecas quanto a um clone de tamanho total, pesquisou-se ADN das bibliotecas por amplificação por PCR, como descrito por Ausubel et al., Current Protocols in Molecular Bioloqy, supra, com o par de iniciadores de PCR. Utilizou-se então uma biblioteca positiva para isolar clones que codificam para o gene de interesse, utilizando a sonda de oligonucleótidos e um dos pares de iniciadores.
Sintetizaram-se iniciadores de PCR (sentido directo e inverso):
Iniciador de PCR de sentido directo 5'-AGAGTGTATCTCTGGCTACGC-3' (SEQ ID NO:3)
Iniciador de PCR de sentido inverso 5'-TAAGTCCGGCACATTACAGGTC.3' (SEQ ID NO:4)
Adicionalmente, construiu-se uma sonda de hibridação de oligonucleótido sintético a partir da sequência de consenso DNA28730 que tinha a seguinte sequência de nucleótidos: 98
ΕΡ 1 121 439 /PT
Sonda de hibridação 5'-AGGGAGCACGGACAGTGTGCAGATGTGGACGAGTGCTCACTAGCA-3' (SEQ ID NO:5) O ARN para construção das bibliotecas de ADNc foi isolado a partir de tecido de pulmão fetal humano. As bibliotecas de ADNc utilizadas para isolar os clones de ADNc foram construídas por métodos convencionais, utilizando reagentes disponíveis no mercado, tais como os da Invitrogen, San Diego, CA. 0 ADNc foi iniciado com oligo dT contendo um local Notl, ligado de forma romba a adaptadores Sall tratados com hemiquinase, clivado com Notl, separado por tamanho adequado por electroforese em gel e clonado numa orientação definida num vector de clonagem adequado (tal como pRKB ou pRKD; pRK5B é um precursor de pRK5D que não contém o local Sfil; veja-se, Holmes et al., Science, 253:1278-1280 (1991)) nos locais únicos de Xhol e Notl. A sequenciação de ADN dos clones isolados como descrito acima originou a sequência de ADN de tamanho total para um polipéptido PR0211 de tamanho total (aqui designado como DNA32292-1131 [Figura 1, SEQ ID NO:l]) e a sequência de proteína derivada para esse polipéptido PR0211. O clone de tamanho total identificado acima continha uma única fase de leitura aberta com um local de iniciação da tradução aparente, nas posições de nucleótido 65-67 e um sinal de terminação nas posições de nucleótido 1124-1126 (Figura 1, SEQ ID NO: 1). 0 precursor de polipéptido previsto tem 353 aminoácidos de comprimento, tem um peso molecular calculado de aproximadamente 38 190 daltons. A análise da sequência de PR0211 de tamanho total apresentada na Figura 2 (SEQ ID NO: 2) evidencia a presença de uma variedade de domínios de polipéptido importantes, em que as localizações dadas para os domínios de polipéptido importantes são aproximadas das descritas acima. A análise da sequência de PR0211 de tamanho total evidenciou o seguinte: um péptido de sinal de cerca do aminoácido 1 a cerca do aminoácido 24; locais de N-glicosilação de cerca do aminoácido 190 a cerca do aminoácido 194 e de cerca do aminoácido 251 a cerca do aminoácido 255; locais de ligação de glicosaminoglicano de cerca do aminoácido 149 a cerca do aminoácido 153 e de cerca 99
ΕΡ 1 121 439 /PT do aminoácido 155 a cerca do aminoácido 159; um local de fosforilação de proteína-quinase dependente de AMPc e GMPc de cerca do aminoácido 26 a cerca do aminoácido 30; locais de fosforilação de caseína-quinase II de cerca do aminoácido 58 a cerca do aminoácido 62, de cerca do aminoácido 66 a cerca do aminoácido 70, de cerca do aminoácido 86 a cerca do aminoácido 90, de cerca do aminoácido 197 a cerca do aminoácido 201, de cerca do aminoácido 210 a cerca do aminoácido 214, de cerca do aminoácido 255 a cerca do aminoácido 259, de cerca do aminoácido 295 a cerca do aminoácido 299, de cerca do aminoácido 339 a cerca do aminoácido 343, e de cerca do aminoácido 349 a cerca do aminoácido 3 53; um local de fosforilação de tirosina-quinase de cerca do aminoácido 303 a cerca do aminoácido 310; locais de N-miristoilação de cerca do aminoácido 44 a cerca do aminoácido 50, de cerca do aminoácido 54 a cerca do aminoácido 60, de cerca do aminoácido 55 a cerca do aminoácido 61, de cerca do aminoácido 81 a cerca do aminoácido CO de cerca do aminoácido 150 a cerca do aminoácido 156, de cerca do aminoácido 158 a cerca do aminoácido 164, de cerca do aminoácido 164 a cerca do aminoácido 170, de cerca do aminoácido 252 a cerca do aminoácido 258, e de cerca do aminoácido 313 a cerca do aminoácido 319; um local de hidroxilaçao de ácido aspártico e asparagina de cerca do aminoácido 308 a cerca do aminoácido 320; uma assinatura de padrão de cisteina de domínio do tipo EGF de cerca do aminoácido 166 a cerca do aminoácido 178; e um padrão de "fecho de correr" de leucina de cerca do aminoácido 94 a cerca do aminoácido 116. O clone DNA32292-1131 foi depositado na ATCC em 16 de Setembro de 1997 e foi-lhe atribuído o N°. de depósito ATCC 209258.
Uma análise da base de dados Dayhoff (versão 35.45 SwissProt 35), utilizando a análise de alinhamento de sequências WU-BLAST2 da sequência de tamanho total apresentada na Fiqura 2 (SEQ ID NO:2), evidenciou uma identidade de sequência entre a sequência de aminoácidos de PR0211 e EGF humano. 100
ΕΡ 1 121 439 /PT EXEMPLO 2
Expressão de PRQ211 em E. coli
Este exemplo ilustra a preparaçao de uma forma não glicosilada de PR0211 por expressão recombinante em E. coli. A sequência de ADN que codifica para PR0211 é inicialmente amplificada utilizando iniciadores de PCR seleccionados. Os iniciadores deverão conter locais de enzimas de restrição que correspondem aos locais das enzimas de restrição no vector de expressão seleccionado. Pode-se utilizar uma variedade de vectores de expressão. Um exemplo de um vector adequado é pBR322 (derivado de E. coli; veja-se Bolívar et al., Gene, 2_:95 (1977)) que contém genes para resistência a ampicilina e tetraciclina. O vector é digerido com enzimas de restrição e desfosforilado. As sequências amplificadas por PCR são então ligadas no vector. O vector irá incluir de preferência sequências que codificam para um gene de resistência a antibióticos, um promotor trp, um comando poli-his (incluindo os primeiros seis codões STII, sequência poli-his e local de clivagem de enteroquinase), a região codificante de PR0211, terminador de transcrição lambda e um gene argU. A mistura de ligação é então utilizada para transformar uma estirpe de E. coli seleccionada, utilizando os métodos descritos em Sambrook et al., supra. Os transformantes são identificados pela sua capacidade de crescer em placas LB e as colónias resistentes a antibiótico são então seleccionadas. O ADN plasmídico pode ser isolado e confirmado por análise de restrição e sequenciação de ADN.
Os clones seleccionados podem ser crescidos durante a noite em meio de cultura líquido, tal como caldo LB suplementado com antibióticos. A cultura durante a noite pode ser subsequentemente utilizada para inocular uma cultura em maior escala. As células são então crescidas até uma densidade óptica desejada, durante a qual o promotor de expressão é accionado. 101
ΕΡ 1 121 439 /PT
Após cultura das células durante mais algumas horas, as células podem ser recolhidas por centrifugação. O sedimento celular obtido por centrifugação pode ser solubilizado utilizando vários agentes conhecidos na arte e a proteína PR0211 solubilizada pode então ser purificada utilizando uma coluna quelante de metal, sob condições que permitem uma ligação forte da proteína. O PR0211 pode ser expresso em E. coli numa forma marcada com poli-his, utilizando o procedimento seguinte. O ADN que codifica para PR0211 é inicialmente amplificado utilizando iniciadores de PCR seleccionados. Os iniciadores irão conter locais de enzimas de restrição que correspondem aos locais de enzimas de restrição no vector de expressão seleccionado e outras sequências úteis que proporcionam uma iniciação da tradução eficaz e fiável, a purificação rápida numa coluna de quelatação de metal e a remoção proteolítica com enteroquinase. As sequências marcadas com poli-His, amplificadas por PCR são então ligadas num vector de expressão que é utilizado para transformar um hospedeiro E. coli baseado na estirpe 52 (W3110 fuhA(tonA) lon galE rpoHts(htpRts) clpP(lacIq). Os transformantes são primeiro crescidos em LB contendo carbenicilina 50 mg/ml a 30°C com agitação, até se atingir uma DCboo de 3-5. As culturas são então diluídas 50-100 vezes em meio CRAP (preparado misturando 3,57 g de (NH4) 2S04, 0,71 g de citrato de sódio-2H20, 1, 07 g de KC1, 5,36 g de extracto de levedura da Difco, 5,36 g de hicase SF Sheffield em 500 ml de água, bem como MPOS 110 mM, pH 7,3, glucose a 0,55% (p/v) e MgS04 7 mM) e crescidas durante aproximadamente 20-30 horas a 30°C, com agitação. As amostras são removidas para verificar a expressão por análise de SDS-PAGE e o volume de cultura é centrifugado para sedimentar as células. Os sedimentos celulares são congelados até purificação e re-enrolamento. A pasta de E. coli de fermentações de 0,5 a 11 (sedimentos de 6-10 g) é ressuspensa em 10 volumes (p/v) de tampão guanidina 7 M, Tris 20 mM, pH 8. Adiciona-se sulfito de sódio sólido e tetrationato de sódio para se obterem concentrações finais de 0,1 M e 0,02 M, respectivamente, e a solução é agitada durante a noite a 4°C. Este passo resulta numa proteína desnaturada com todos os resíduos de cisteína 102
ΕΡ 1 121 439 /PT bloqueados por sulfitolização. A solução é centrifugada a 40.000 rpm numa Ultracentrífuga Beckman durante 30 min. O sobrenadante é diluído com 3-5 volumes de tampão de coluna de quelato de metal (guanidina 6 M, Tris 20 mM, pH 7,4) e filtrado através de filtros de 0,22 micron, para clarificar. O extracto clarificado é carregado numa coluna de quelato de metal Ni2+-NTA de 5 ml da Qiagen, equilibrada no tampão da coluna de quelato de metal. A coluna é lavada com tampão adicional contendo imidazolo 50 mM (Calbiochem, grau Utrol), pH 7,4. A proteína é eluída com tampão contendo imidazolo 250 mM. As fracções que contêm a proteína desejada são reunidas e armazenadas a 4°C. A concentração de proteína é estimada pela sua absorvância a 280 nm utilizando o coeficiente de extinção calculado com base na sua sequência de aminoácidos.
As proteínas são enroladas de novo diluindo a amostra lentamente em tampão de re-enrolamento preparado de fresco, que consiste de: Tris 20 mM, pH 8,6, NaCl 0,3 M, ureia 2,5 M, cisteína 5 mM, glicina 20 mM e EDTA 1 mM. Os volumes de re-enrolamento são seleccionados de modo a que a concentração de proteína final seja entre 50 a 100 microgramas/ml. A solução de re-enrolamento é agitada lentamente a 4°C, durante 12-36 horas. A reacção de re-enrolamento é neutralizada por adição de TFA a uma concentração final de 0,4% (pH de aproximadamente 3). Antes de mais purificação da proteína, a solução é filtrada através de um filtro de 0,22 micron e adiciona-se acetonitrilo numa concentração final de 2-10%. A proteína re-enrolada é cromatografada numa coluna de fase reversa Poros RI/H utilizando um tampão móvel de TFA a 0,1% com eluição com um gradiente de acetonitrilo de 10 a 80%.
Analisam-se alíquotas de fracções com absorvância A2so em geles de poliacrilamida com SDS e as fracções contendo proteína re-enrolada homogénea são reunidas. Em geral, as espécies re-enroladas de forma adequada da maioria das proteínas são eluídas nas concentrações mais baixas de acetonitrilo, uma vez que essas espécies são as mais compactas, tendo os seus interiores hidrófobos protegidos da interacção com a resina de fase reversa. As espécies agregadas são normalmente eluídas a concentrações de acetonitrilo mais elevadas. Além de separar formas de proteínas com o enrolamento errado, da forma 103
ΕΡ 1 121 439 /PT desejada, o passo de fase reversa também remove a endotoxina das amostras.
As fracções que contêm o polipéptido PR0211 enrolado desejado são reunidas e o acetonitrilo é removido utilizando uma corrente suave de azoto, dirigida para a solução. As proteinas são formuladas em Hepes 20 mM, pH 6,8 com cloreto de sódio 0,14 M e manitol a 4%, por diálise ou filtração em gel, utilizando resinas G25 Superfine (Pharmacia) equilibradas no tampão de formulação e esterilizadas por filtração. EXEMPLO 3
Expressão de PR0211 em células de mamífero
Este exemplo ilustra a preparação de uma forma de PR0211 potencialmente glicosilada, por expressão recombinante em células de mamífero. O vector pRK5 (veja-se EP 307.247, publicada em 15 de Março de 1989) é utilizado como vector de expressão. Opcionalmente, o ADN de PR0211 é ligado em pRK5 com enzimas de restrição seleccionadas para permitir a inserção do ADN de PR0211 utilizando métodos de ligação, tais como os descritos em Sambrook et al., supra. O vector resultante é designado por pRK5-PR0211.
Numa concretização, as células hospedeiras seleccionadas podem ser células 293. As células 293 humanas (ATCC CCL 1573) são crescidas até à confluência em placas de cultura de tecidos em meio, tal como DMEM suplementado com soro fetal de vitela e, opcionalmente, componentes nutrientes e/ou antibióticos. Misturam-se cerca de 10 pg de ADN pRK5-PR0211 com cerca de 1 pg de ADN que codifica para o gene VA ARN [Thimmappaya et al., Cell, 3_1:543 (1982)] e dissolve-se em 500 pl de Tris-HCl 1 mM, EDTA 0,1 mM, CaCl2 0,227 Μ. A esta mistura adicionam-se, gota a gota, 500 pl de HEPES 50 mM (pH 7,35), NaCl 280 mM, NaP04 1,5 mM, e deixa-se formar um precipitado durante 10 minutos a 25°C. O precipitado é suspenso e adicionado às células 293 e deixado assentar durante cerca de quatro horas a 37°C. O meio de cultura é removido por aspiração e adicionam-se 2 ml de glicerol a 20% 104
ΕΡ 1 121 439 /PT em PBS, durante 30 segundos. As células 293 são então lavadas com meio isento de soro, adiciona-se meio fresco e as células são incubadas durante cerca de 5 dias.
Aproximadamente 24 horas após as transfecções, o meio de cultura é removido e substituído com meio de cultura (isolado) ou meio de cultura contendo 35S-cisteína 200 yCi/ml e 35S-metionina 200 yCi/ml. Após uma incubação de 12 horas, o meio condicionado é recolhido, concentrado num filtro giratório e carregado num gel de SDS a 15%. O gel processado pode ser seco e exposto a película durante um período de tempo seleccionado para revelar a presença do polipéptido PR0211. As culturas gue contêm células transfectadas podem ser submetidas a nova incubação (em meio isento de soro) e o meio é testado em bioensaios seleccionados.
Numa técnica alternativa, o PR0211 pode ser introduzido em células 293 de forma transitória, utilizando o método de sulfato de dextrano descrito por Somparyrac et al., Proc. Nat 1. Acad Sei., 1_2 :7575 (1981). As células 293 são crescidas a uma densidade máxima num frasco giratório e adicionam-se 700 yg de ADN pRK5-PR0211. As células são primeiro concentradas a partir do frasco giratório por centrifugação e lavadas com PBS. O precipitado de ADN-dextrano é incubado no sedimento celular durante guatro horas. As células são tratadas com glicerol a 20% durante 90 segundos, lavadas com meio de cultura de tecidos e reintroduzidas no frasco giratório contendo meio de cultura de tecidos, insulina de bovino 5 yg/ml e transferrina de bovino 0,1 yg/ml. Após cerca de quatro dias, o meio condicionado é centrifugado e filtrado para remover células e restos celulares. A amostra que contém PR0211 expresso pode então ser concentrada e purificada por qualquer método seleccionado, tal como diálise e/ou cromatografia em coluna.
Noutra concretização, o PR0211 pode ser expresso em células CHO. O pRK5-PR0211 pode ser transfectado em células CHO utilizando reagentes conhecidos, tais como CaP04 ou DEAE-dextrano. Como descrito acima, as culturas de células podem ser incubadas e o meio substituído com meio de cultura (isolado) ou meio contendo um marcador radioactivo, tal como 35S-metionina. Após determinação da presença de um polipéptido 105
ΕΡ 1 121 439 /PT PR0211, ο meio de cultura pode ser substituído com meio isento de soro. De preferência, as culturas são incubadas durante cerca de 6 dias e em seguida o meio condicionado é recolhido. O meio contendo o PR0211 expresso pode ser então concentrado e purificado por qualquer método seleccionado. O PR0211 marcado com epítopo pode também ser expresso em células CHO hospedeiras. O PR0211 pode ser subclonado fora do vector pRK5. A inserção do subclone pode ser submetida a PCR para fundir em fase com um marcador de epítopo seleccionado, tal como um marcador poli-his, num vector de expressão de Baculovírus. A inserção de PR0211 marcado com poli-his pode ser então subclonada num vector dirigido por SV40 contendo um marcador de selecção, tal como DHFR, para selecção de clones estáveis. Por fim, as células CHO podem ser transfectadas (como descrito acima) com o vector dirigido por SV40. A marcação pode ser realizada, como descrito acima, para verificar a expressão. O meio de cultura contendo o PR0211 marcado com poli-His, expresso, pode então ser concentrado e purificado por qualquer método seleccionado, tal como por cromatografia de afinidade de quelato de Ni2+. O PR0211 também pode ser expresso em células CHO e/ou COS por um procedimento de expressão transitória, ou em células CHO, por outro procedimento de expressão estável. A expressão estável em células CHO é realizada utilizando o seguinte procedimento. As proteínas são expressas como uma construção de IgG (imunoadesina) em que as sequências codificantes para as formas solúveis (e.g. domínio extracelular) das proteínas respectivas são fundidas com uma sequência da região constante de IgGl contendo os domínios dobradiça, CH2 e CH2 e/ou como uma forma marcada com poli-His.
Após amplificação por PCR, os ADN respectivos são subclonados num vector de expressão CHO utilizando técnicas convencionais descritas em Ausubel et al., Current Protocols of Molecular Bioloqy, Unidade 3.16, John Wiley and Sons (1997) . Os vectores de expressão CHO são construídos de modo a terem locais de restrição 5' e 3' compatíveis do ADN de interesse, para permitir o vaivém conveniente de ADNc. O vector utilizado na expressão em células CHO é como descrito 106
ΕΡ 1 121 439 /PT em Lucas et al., Nucl. Acids Res. 24; 9 (1774-1779 (1996), e utiliza o promotor precoce/potenciador de SV40 para dirigir a expressão do ADNc de interesse e di-hidrofolato-redutase (DHFR). A expressão de DHFR permite a selecção para a manutenção estável do plasmídeo após transfecção.
Introduzem-se doze microgramas do ADN plasmídico desejado em aproximadamente 10 milhões de células CHO utilizando reagentes de transfecção disponíveis no mercado Superfect® (Quiagen), Dosper® ou Fugene® (Boehringer Mannheim). As células são crescidas como descrito em Lucas et al., supra. Aproximadamente 3 x 10~7 células são congeladas numa ampola para posterior crescimento e produção, como descrito a seguir.
As ampolas contendo o ADN plasmídico são descongeladas colocando num banho de água e misturando num vórtex. Os conteúdos são pipetados para um tubo de centrífuga contendo 10 ml de meio e centrifugados a 1000 rpm durante 5 minutos. O sobrenadante é aspirado e as células são ressuspensas em 10 ml de meio selectivo (PS20 filtrado em 0,2 pm com soro fetal de bovino a 5% diafiltrado em 0,2 pm) . As células são então divididas em alíquotas num frasco giratório de 100 ml contendo 90 ml de meio selectivo. Após 1-2 dias, as células são transferidas para um frasco giratório de 250 ml cheio com 150 ml de meio de crescimento selectivo e incubadas a 37°C. Após mais 2-3 dias, semeiam-se frascos giratórios de 250 ml, 500 ml e 2000 ml com 3 x 105 células/ml. O meio celular é trocado por meio fresco por centrifugação e ressuspensão em meio de produção. Embora se possa utilizar qualquer meio de CHO adequado, pode efectivamente utilizar-se um meio de produção descrito na Patente US N°. 5.122.469, concedida em 16 de Junho de 1992. Semeia-se um frasco giratório de produção de 3 1 a 1,2 x 106 células/ml. No dia 0, determina-se o número de células e pH. No dia 1, retira-se uma amostra do frasco giratório e inicia-se a desgasificação com ar filtrado. No dia 2, retira-se uma amostra do frasco giratório, a temperatura é alterada para 33°C, e adicionam-se 30 ml de glucose 500 g/1 e 0,6 ml de anti-espumante a 10% (e.g., emulsão de polidimetilsiloxano a 35%, emulsão Dow Corning 365 de grau médico) . Ao longo da produção, o pH é ajustado como necessário para o manter à volta de 7,2. Após 10 dias, ou até a viabilidade diminuir abaixo dos 70%, a cultura de células é 107 ΕΡ 1 121 439 /PT recolhida por centrifugação e filtração através de um filtro de 0,22 pm. O filtrado é, ou armazenado a 4°C, ou imediatamente carregado em colunas, para purificação.
Para as construções marcadas com poli-His, as proteínas são purificadas utilizando uma coluna Ni2+-NTA (Qiagen) . Antes da purificação, adiciona-se imidazolo ao meio condicionado a uma concentração de 5 mM. O meio condicionado é bombeado para uma coluna Ni2+-NTA de 6 ml eguilibrada em tampão Hepes 2 0 mM, pH 7,4, contendo NaCl 0,3 M e imidazolo 5 mM, a um fluxo de 4-5 ml/min, a 4°C. Após carga, a coluna é lavada com tampão de eguilíbrio adicional e a proteína é eluída com tampão de equilíbrio contendo imidazolo 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada num tampão de armazenamento contendo Hepes 10 mM, NaCl 0,14 M e manitol a 4%, pH 6,8, com uma coluna G25 Superfine de 25 ml (Pharmacia) e armazenada a -80°C.
As construções de imunoadesina (contendo Fc) são purificadas a partir do meio condicionado, como se segue. O meio condicionado é bombeado para uma coluna de Proteína A de 5 ml (Pharmacia) que foi equilibrada em tampão fosfato de Na 20 mM, pH 6,8. Após carga, a coluna é lavada extensivamente com tampão de equilíbrio antes de eluição com ácido cítrico 100 mM, pH 3,5. A proteína eluída é imediatamente neutralizada recolhendo fracções de 1 ml em tubos contendo 275 μΐ de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada em tampão de armazenamento, como descrito acima para as proteínas marcadas com poli-His. A homogeneidade é determinada por geles de poliacrilamida com SDS e por sequenciação de aminoácido N-terminais, por degradação de Edman. O PR0211 foi expresso de forma estável em células CHO pelo método acima descrito. Em experiências relacionadas, referidas em WO 00/21996, o PR0211 foi expresso em células CHO pelo procedimento de expressão transitória. 108
ΕΡ 1 121 439 /PT EXEMPLO 4
Expressão de PRQ211 em levedura O método seguinte descreve a expressão recombinante de PR0211 em levedura.
Primeiro, são construídos vectores de expressão de levedura para a produção ou secreção intracelular de PR0211 a partir do promotor ADH2/GAPDH. O ADN que codifica para PR0211 e o promotor são inseridos em locais de enzimas de restrição adequados no plasmídeo seleccionado, para dirigir a expressão intracelular de PR0211. Para secreção, o ADN que codifica para PR0211 pode ser clonado no plasmídeo seleccionado, juntamente com ADN que codifica para o promotor ADH2/GAPDH, um péptido de sinal de PR0211 nativo ou outro péptido de sinal de mamífero, ou, por exemplo, uma sequência de sinal/comando secretora de factor alfa ou invertase de levedura e sequências ligantes (se necessário) para expressão de PR0211.
As células de levedura, tais como a estirpe AB110 de levedura, podem então ser transformadas com os plasmídeos de expressão descritos acima e cultivadas em meio de fermentação seleccionado. Os sobrenadantes de leveduras transformadas podem ser analisados por precipitação com ácido tricloroacético a 10% e separação por SDS-PAGE, seguido de coloração dos geles com azul de Coomassie. O PR0211 recombinante pode ser subsequentemente isolado e purificado removendo as células de levedura do meio de fermentação por centrifugação e concentrando em seguida o meio, utilizando filtros de cartucho seleccionados. O concentrado contendo PR0211 pode ser ainda purificado utilizando resinas de cromatografia em coluna seleccionadas. EXEMPLO 5
Expressão de PR0211 em células de insecto infectadas com baculovírus 0 método seguinte descreve a expressão recombinante de PR0211 em células de insecto infectadas com baculovírus. 109
ΕΡ 1 121 439 /PT A sequência que codifica para PR0211 é fundida a montante de um marcador de epítopo contido num vector de expressão de baculovirus. Estes marcadores de epítopo incluem marcadores de poli-his e marcadores de imunoglobulina (tal como regiões Fc de IgG). Pode-se utilizar uma variedade de plasmídeos, incluindo plasmídeos derivados de plasmídeos disponíveis no mercado, tais como pVLl393 (Novagen). Em resumo, a sequência que codifica para PR0211 ou a porção desejada da sequência codificante de PR0211 (tal como a sequência que codifica para o domínio extracelular de uma proteína transmembranar, ou a sequência que codifica para a proteína madura no caso da proteína ser extracelular) é amplificada por PCR com iniciadores complementares às regiões 5' e 3'. O iniciador 5' pode incorporar locais de enzimas de restrição flanqueadores (seleccionados) . O produto é então diferido com as enzimas de restrição seleccionadas e subclonado no vector de expressão. O baculovirus recombinante é produzido por co-transfecção do plasmídeo acima e ADN do vírus BaculoGold™ (Pharmingen) em células de Spodoptera frugiperda ("Sf9") (ATCC CRL 1711) utilizando lipofectina (disponível no mercado da GIBCO-BRL). Após 4-5 dias de incubação a 28°C, os vírus libertados são recolhidos e utilizados para posteriores amplificações. A infecção virai e expressão de proteínas são realizadas como descrito por 0'Reilley et al., Baculovirus expression vectors: A Laboratory Manual, Oxford: Oxford University Press (1994). 0 PR0211 marcado com poli-His expresso pode então ser purificado, por exemplo por cromatografia de afinidade com quelato de Ni2+ como se segue. Preparam-se extractos de células Sf9 infectadas com vírus recombinantes, como descrito por Rupert et al., Nature, 362:175-179 (1993) . Em resumo, as células Sf9 são lavadas, ressuspensas em tampão de ultra-sons (Hepes 25 ml, pH 7,9; MgCl2 12,5 mM; EDTA 0,1 mM; glicerol a 10%; NP-40 a 0,1%; KC1 0,4 M), e tratadas com ultra-sons duas vezes durante 20 segundos, em gelo. O material tratado com ultra-sons é clarificado por centrifugação, e o sobrenadante é diluído 50 vezes em tampão de carga (fosfato 50 mM, NaCl 300 mM, glicerol a 10%, pH 7,8) e filtrado através de um filtro de 0,45 mm. Prepara-se uma coluna de agarose Ni2+-NTA (disponível no mercado da Qiagen) com um volume de leito de 110 ΕΡ 1 121 439 /PT 5 ml, lava-se com 25 ml de água e equilibra-se com 25 ml de tampão de carga. O extracto celular filtrado é carregado na coluna a 0,5 ml por minuto. A coluna é lavada até uma A28o de linha de base com tampão de carga, altura em que é iniciada a recolha de fracções. Em seguida, a coluna é lavada com um segundo tampão de lavagem (fosfato 50 mM; NaCl 300 mM, glicerol a 10%, pH 6,0), que elui proteínas não especificamente ligadas. Após se atingir novamente a A28o de linha de base, a coluna é desenvolvida com um gradiente de imidazolo de 0 a 500 mM no segundo tampão de lavagem. Recolhem-se fracções de 1 ml e analisam-se por SDS-PAGE e coloração com prata, ou transferência de Western com Ni2+-NTA-conjugado com fosfatase alcalina (Qiagen). As fracções que contêm o PR0211 marcado com Hisio eluídas são reunidas e dialisadas contra tampão de carga.
Alternativamente, a purificação do PR0211 marcado com IgG (ou marcado com Fc) pode ser realizada utilizando técnicas cromatográficas conhecidas, incluindo, por exemplo, cromatografia em coluna com Proteína A ou proteína G.
Após amplificação por PCR, as sequências codificantes respectivas são subclonadas num vector de expressão de baculovírus (pb.PH.IgG para fusões de IgG e pb.PH.His.c para proteínas marcadas com poli-His), e o vector e ADN de baculovírus Baculogold® (Pharmingen) são co-transfectados em 105 células de Spodoptera frugiperda ("Sf9") (ATCC CRL 1711), utilizando Lipofectina (Gibco BRL). pb.PH.IgG e pb.PH.His são modificações do vector de expressão de baculovírus disponível no mercado pVL1393 (Pharmingen), com regiões poliligantes modificadas para incluir as sequências marcadoras His ou Fc. As células são crescidas em meio TNM-FH de Hink suplementado com FBS a 10% (Hyclone) . As células são incubadas durante 5 dias a 28°C. O sobrenadante é recolhido e subsequentemente utilizado para a primeira amplificação virai, infectando células Sf9 em meio TNM-FH de Hink suplementado com FBS a 10% a uma multiplicidade de infecção (MOI) aproximada de 10. As células são incubadas durante 3 dias a 28°C. O sobrenadante é recolhido e a expressão das construções no vector de expressão de baculovírus é determinada por ligação por lotes de 1 ml de sobrenadante a 25 ml de pérolas Ni2+-NTA (QIAGEN) para proteínas marcadas com histidina, ou pérolas de Protein-A 111
ΕΡ 1 121 439 /PT
Sepharose CL-4B (Pharmacia) para proteínas marcadas com IgG seguido de análise de SDS-PAGE comparando com uma concentração conhecida de padrão de proteína, por coloração com azul de Coomassie. 0 primeiro sobrenadante de amplificação virai é utilizado para infectar uma cultura de frasco giratório (500 ml) de células Sf9 crescidas em meio ESF-921 (Expression Systems LLC) a uma MOI aproximada de 0,1. As células são incubadas durante 3 dias a 28°C. O sobrenadante é recolhido e filtrado. A ligação por lotes e análise de SDS-PAGE são repetidas, como necessário, até se confirmar expressão da cultura do frasco giratório. 0 meio condicionado das células transfectadas (0,5 a 3 L) é recolhido por centrifugação para remover as células e filtrado através de filtros de 0,22 micron. Para as construções marcadas com poli-His, a construção de proteína é purificada utilizando uma coluna de Ni2+-NTA (Qiagen) . Antes da purificação, adiciona-se imidazolo ao meio condicionado, a uma concentração de 5 mM. O meio condicionado é bombeado para uma coluna de 6 ml de Ni2+-NTA equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazolo 5 mM a um fluxo de 4-5 ml/min, a 4°C. Após carga, a coluna é lavada com tampão de equilíbrio adicional e a proteína é eluída com tampão de equilíbrio contendo imidazolo 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada num tampão de armazenamento contendo Hepes 10 mM, NaCl 0,14 M e manitol a 4%, pH 6,8, com uma coluna G25 Superfine de 25 ml (Pharmacia) e armazenado a -80°C.
As construções de imunoadesina (contendo Fc) de proteínas são purificadas a partir do meio condicionado, como se segue. O meio condicionado é bombeado para uma coluna de proteína A de 5 ml (Pharmacia) que foi equilibrada em tampão fosfato de Na 20 mM, pH 6,8. Após carga, a coluna é bem lavada com tampão de equilíbrio antes de eluição com ácido cítrico 100 mM, pH 3,5. A proteína eluída é imediatamente neutralizada recolhendo fracções de 1 ml para tubos contendo 275 ml de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada em tampão de armazenamento como descrito acima para as proteínas marcadas com poli-His. A 112
ΕΡ 1 121 439 /PT homogeneidade das proteínas é verificada por electroforese em gel de poliacrilamida com SDS (PEG) e sequenciação de aminoácidos N-terminais por degradação de Edman. Em experiências relacionadas, descritas em WO 00/21996, o PR0228, PR0538 e PR0172 foram expressos em células de insecto Sf9 infectadas com baculovírus.
Alternativamente, pode-se utilizar um procedimento de baculovírus modificado, incorporando células high-5. Neste procedimento, o ADN que codifica para a sequência desejada é amplificado com sistemas adequados, tais como Pfu (Stratagene) , ou fundido a montante (5' em relação a) de um marcador de epítopo contido num vector de expressão de baculovírus. Estes marcadores de epítopo incluem marcadores poli-His e marcadores de imunoglobulina (tal como regiões Fc de IgG) . Pode-se utilizar uma variedade de plasmídeos, incluindo plasmídeos derivados de plasmídeos disponíveis no mercado, tais como pIE 1-1 (Novagen). Os vectores pIEl-1 e pIEl-2 são concebidos para expressão constitutiva de proteínas recombinantes a partir do promotor iel de baculovírus em células de insecto transformadas de forma estável (1). Os plasmídeos diferem apenas na orientação dos locais de clonagem múltiplos e contêm todas as sequências promotoras que se sabe serem importantes para a expressão de genes mediada por iel em células de insecto não infectadas, bem como o elemento potenciador hr5. O pIEl-1 e pIEl-2 incluem o local de iniciação de tradução e podem ser utilizados para produzir proteínas de fusão. Em resumo, a sequência desejada ou a porção da sequência desejada (tal como a sequência que codifica para o domínio extracelular de uma proteína transmembranar) é amplificada por PCR com iniciadores complementares às regiões 5' e 3' . O iniciador 5' pode incorporar locais de enzimas de restrição flanqueadores (seleccionados) . O produto é então digerido com as enzimas de restrição seleccionadas e subclonado no vector de expressão. Por exemplo, os derivados de pIEl-1 podem incluir a região Fc de IgG humana (pb.PH.IgG), ou um marcador de 8 histidinas (pb.PH.His) a jusante (3'-em relação a) da sequência desejada. De preferência, a construção do vector é sequenciada para confirmação. 113
ΕΡ 1 121 439 /PT
As células high-5 são crescidas até uma confluência de 50% sob as condições de 27°C, sem CO2, sem pen/estrep. Para cada placa de 150 mm, misturam-se 30 yg de vector baseado em plE contendo a seguência com 1 ml de meio Ex-Cell (Meio: Ex-Cell 401 + 1/100 L-Glu JRH Biosciences #14401-78P (nota: este meio é sensível à luz)), e num tubo separado, misturam-se 100 μΐ de CellFectin (CellFECTIN (GibcoBRL # 10362-010)(agitado num vórtex para misturar)) com 1 ml de meio Ex-Cell. As duas soluções são combinadas e deixadas a incubar à temperatura ambiente durante 15 minutos. Adicionam-se 8 ml de meio Ex-Cell aos 2 ml de mistura ADN/CellFECTIN e coloca-se uma camada destes em células high-5 gue foram lavadas uma vez com meio Ex-Cell. A placa é então incubada no escuro durante 1 hora, à temperatura ambiente. A mistura ADN/CellFECTIN é em seguida aspirada e as células são lavadas uma vez com Ex-Cell para remover o excesso de CellFECTIN, adicionam-se 30 ml de meio Ex-Cell fresco e as células são incubadas durante 3 dias a 28°C. 0 sobrenadante é recolhido e a expressão da seguência no vector de expressão de baculovírus é determinada por ligação por lotes de 1 ml de sobrenadante a 25 ml de pérolas
Ni2+-NTA (QIAGEN) para proteínas marcadas com histidina, ou pérolas de Proteína-A Sepharose CL-4B (Pharmacia) para proteínas marcadas com IgG, seguido de análise de SDS-PAGE, comparando com uma concentração conhecida de padrão de proteína, por coloração com azul de Coomassie. 0 meio condicionado das células transfectadas (0,5 a 3 1) é recolhido por centrifugação para remover as células e filtrado através de filtros de 0,22 micron. Para as construções marcadas com poli-His, a proteína compreendendo a seguência é purificada utilizando uma coluna de Ni2+-NTA (Qiagen). Antes da purificação, adiciona-se imidazolo ao meio condicionado, a uma concentração de 5 mM. O meio condicionado é bombeado para uma coluna de Ni2+-NTA de 6 ml equilibrada em tampão Hepes 20 mM, pH 7,4, contendo NaCl 0,3 M e imidazolo 5 mM a um fluxo de 4-5 ml/min, a 48°C. Após carga, a coluna é lavada com tampão de equilíbrio adicional e a proteína é eluída com tampão de equilíbrio contendo imidazolo 0,25 Μ. A proteína altamente purificada é subsequentemente dessalinizada num tampão de armazenamento contendo Hepes 10 mM, NaCl 0,14 M e manitol a 4%, pH 6,8, com uma coluna G25 Superfine de 25 ml (Pharmacia) e armazenado a -80°C. 114
ΕΡ 1 121 439 /PT
As construções de imunoadesina (contendo Fc) de proteínas são purificadas a partir do meio condicionado, como se segue. O meio condicionado é bombeado para uma coluna de proteína A de 5 ml (Pharmacia) que foi equilibrada em tampão fosfato de Na 20 mM, pH 6,8. Após carga, a coluna é bem lavada vezes com tampão de equilíbrio antes de eluição com ácido cítrico 100 mM, pH 3,5. A proteína eluída é imediatamente neutralizada recolhendo fracções de 1 ml para tubos contendo 275 ml de tampão Tris 1 M, pH 9. A proteína altamente purificada é subsequentemente dessalinizada em tampão de armazenamento, como descrito acima para as proteínas marcadas com poli-His. A homogeneidade da sequência é verificada por geles de poliacrilamida com SDS e sequenciação de aminoácidos N-terminais por degradação de Edman e outros procedimentos analíticos, como desejado, ou necessário. O PR0211 foi expresso utilizando o procedimento de baculovírus acima descrito, utilizando células high-5. EXEMPLO 6
Preparação de anticorpos que se ligam a PR0211
Este exemplo ilustra a preparaçao de anticorpos monoclonais que se podem ligar especificamente a PR0211.
As técnicas para produzir os anticorpos monoclonais são conhecidas na arte e estão descritas, por exemplo, em Goding, supra. Os imunogénios que podem ser utilizados incluem PR0211 purificado, proteínas de fusão contendo PR0211 e células que expressam PR0211 recombinante na superfície celular. A selecção do imunogénio pode ser feita pelo perito na arte sem experimentação excessiva.
Os ratinhos, tais como Balb/c são imunizados com o imunogénio PR0211 emulsionado em adjuvante de Freund incompleto e injectados, subcutânea ou intraperitonealmente numa quantidade de 1-100 microgramas. Alternativamente, o imunogénio é emulsionado em adjuvante MPL-TDM (Ribi Immunochemical Research, Hamilton, MT) e injectado nas almofadas das patas traseiras do animal. Os ratinhos 115
ΕΡ 1 121 439 /PT imunizados levam em seguida um reforço 10 a 12 dias mais tarde, com imunogénio adicional emulsionado no adjuvante seleccionado. Em seguida, durante várias semanas, os ratinhos podem também levar um reforço com injecções de imunização adicionais. Podem-se obter periodicamente amostras de soro dos ratinhos por sangramento retro-orbital para testar em testes ELISA, para detectar anticorpos anti-PR0211.
Após se ter detectado um titulo de anticorpo adequado, os animais “positivos" para anticorpos podem ser injectados com uma injecção intravenosa final de PR0211. Três a quatro dias mais tarde os ratinhos são sacrificados e as células do baço são recolhidas. As células do baço são então fundidas (utilizando polietilenoglicol a 35%) com uma linha celular de mieloma de murideo seleccionada, tal como P3X63AgU.l, disponível da ATCC, N° . CRL 1597. As fusões produzem células de hibridoma que podem ser em seguida plaqueadas em placas de cultura de tecidos de 96 poços contendo meio HAT (hipoxantina, aminopterina e timidina) para inibir a proliferação de células não fundidas, híbridos de mieloma e híbridos de células de baço.
As células de hibridoma serão pesquisadas num ELISA quanto à reactividade contra PR0211. A determinação de células de hibridoma "positivas" que segregam os anticorpos monoclonais desejados contra PR0211 está no âmbito dos conhecimentos na arte.
As células de hibridoma positivas podem ser injectadas intraperitonealmente em ratinhos Balb/c isogénicos, para produzir ascites contendo os anticorpos monoclonais anti-PR0211. Alternativamente, as células de hibridoma podem ser crescidas em frascos ou garrafas rotativas de cultura de tecidos. A purificação dos anticorpos monoclonais produzidos nas ascites pode ser realizada utilizando precipitação com sulfato de amónio, seguida de cromatografia de exclusão em gel. Alternativamente, pode-se utilizar cromatografia de afinidade baseada na ligação de anticorpo a proteína A ou proteína G. 116
ΕΡ 1 121 439 /PT EXEMPLO 7
Purificação de polipéptidos PR0211 utilizando anticorpos específicos
Os polipéptidos PR0211 nativos ou recombinantes podem ser purificados por uma variedade de técnicas convencionais na arte de purificação de proteínas. Por exemplo, o polipéptido pro-PR0211, polipéptido PR0211 maduro ou polipéptido pré-PR0211 são purificados por cromatografia de imunoafinidade utilizando anticorpos específicos para o polipéptido PR0211 de interesse. Em geral, uma coluna de imunoafinidade é construída acoplando de forma covalente o anticorpo anti-polipéptido PR0211 a uma resina cromatográfica activada.
As imunoglobulinas policlonais são preparadas a partir de soros imunes, quer por precipitação com sulfato de amónio, quer por purificação em Proteína A imobilizada (Pharmacia LKB Biotechnology, Piscataway, N.J.). De igual modo, os anticorpos monoclonais são preparados a partir de fluido ascítico de ratinho por precipitação com sulfato de amónio ou cromatografia em Proteína A imobilizada. A imunoglobulina parcialmente purificada é ligada de forma covalente a uma resina cromatográfica, tal como SEPHAROSE™ (Pharmacia LKB Biotechnology) activada com CnBr. 0 anticorpo é acoplado à resina, a resina é bloqueada e a resina derivada é lavada de acordo com as instruções do fabricante.
Utiliza-se uma coluna de imunoafinidade deste tipo na purificação do polipéptido PR0211, preparando uma fracção das células contendo polipéptido PR0211 numa forma solúvel. Esta preparação é derivada por solubilização das células totais ou de uma fracção subcelular obtida por centrifugação diferencial, por adição de detergente ou por outros métodos bem conhecidos na arte. Alternativamente, o polipéptido PR0211 solúvel contendo uma sequência de sinal pode ser segregado em quantidade útil no meio em que as células são crescidas.
Uma preparação contendo polipéptido PR0211 solúvel é passada numa coluna de imunoafinidade e a coluna é lavada sob condições que permitem a absorvância preferencial do polipéptido PR0211 (e.g. tampões de força iónica elevada na 117 ΕΡ 1 121 439 /PT presença de detergente). Em seguida, a coluna é eluída sob condições que rompem a ligação anticorpo/polipéptido PR0211 (e.g. um tampão de pH baixo, tal como aproximadamente pH 2-3 ou uma concentração elevada de um agente caotrópico, tal como ureia ou ião tiocianato) e o polipéptido PR0211 é recolhido. EXEMPLO 8
Pesquisa de drogas A presente invenção é particularmente útil para pesquisar compostos utilizando polipéptidos PR0211 ou seus fragmentos de ligação em qualquer uma de uma variedade de técnicas de pesquisa de drogas. 0 polipéptido PR0211 ou fragmento utilizado neste teste pode estar livre em solução, ou fixo num suporte sólido, ou ser transportado numa superfície celular ou estar localizado intracelularmente. Um método de pesquisa de drogas utiliza células hospedeiras eucariotas ou procariotas que são transformadas de forma estável com ácidos nucleicos recombinantes que expressam o polipéptido PR0211 ou fragmento. As drogas são pesquisadas contra estas células transformadas em testes de ligação competitiva. Estas células, quer na forma viável, quer fixada, podem ser utilizadas para testes de ligação convencionais. Pode-se medir, por exemplo, a formação de complexos entre o polipéptido PR0211 ou um fragmento e o agente a ser testado. Alternativamente, pode-se analisar a diminuição na formação de complexo entre o polipéptido PR0211 e a sua célula alvo ou receptores alvo, causada pelo agente a ser testado.
Assim, a presente invenção proporciona métodos para pesquisar drogas ou quaisquer outros agentes que podem afectar uma doença ou distúrbio associado com o polipéptido PR0211. Estes métodos compreendem contactar este agente com um polipéptido PR0211 ou seu fragmento e testar (i) quanto à presença de um complexo entre o agente e o polipéptido PR0211 ou fragmento, ou (ii) quanto à presença de um complexo entre o polipéptido PR0211 ou fragmento e a célula, por métodos bem conhecidos na arte. Nestes testes de ligação competitiva, o polipéptido PR0211 ou fragmento é tipicamente marcado. Após uma incubação adequada, o polipéptido PR0211 livre ou fragmento é separado do que está presente na forma ligada e a 118
ΕΡ 1 121 439 /PT quantidade de marcador livre ou não complexado é uma medida da capacidade do agente particular se ligar ao polipéptido PR0211, ou interferir com o complexo polipéptido PR0211/célula.
Outra técnica para a pesquisa de drogas proporciona uma pesquisa com rendimento elevado para compostos com afinidade de ligação adequada para um polipéptido e está descrita em detalhe na WO 84/03564, publicada em 13 de Setembro de 1984. Em resumo, sintetizam-se grandes quantidades de compostos de teste de péptidos pequenos, diferentes, num substrato sólido, tal como pregos de plástico ou alguma outra superfície. Tal como aplicado a um polipéptido PR0211, os compostos de teste de péptidos são reagidos com o polipéptido PR0211 e lavados. O polipéptido PR0211 ligado é detectado por métodos bem conhecidos na arte. O polipéptido PR0211 purificado pode também ser utilizado para revestir directamente placas para utilização nas técnicas de pesquisa de drogas anteriormente mencionadas. Adicionalmente, podem-se utilizar anticorpos não neutralizantes para capturar o péptido e imobilizá-lo no suporte sólido. A presente invenção também contempla a utilização de testes de pesquisa de drogas competitivos, em que os anticorpos neutralizantes com capacidade de ligação ao polipéptido PR0211 competem especificamente com um composto de teste para a ligação ao polipéptido PR0211 ou seus fragmentos. Deste modo, os anticorpos podem ser utilizados para detectar a presença de qualquer péptido que partilha um ou mais determinantes antigénicos com o polipéptido PR0211. EXEMPLO 9
Concepção racional de drogas 0 objectivo da concepção racional de drogas é produzir análogos estruturais de um polipéptido biologicamente activo de interesse (i.e. um polipéptido PR0211) ou de moléculas pequenas com as quais ele interage, e.g., agonistas, antagonistas ou inibidores. Qualquer destes exemplos pode ser utilizado para modelar drogas que são formas mais activas ou estáveis do polipéptido PR0211, ou que melhoram ou interferem 119 ΕΡ 1 121 439 /PT com a função do polipéptido PR0211 in vivo (cf Hodgson, Bio/Technology, 9_: 19-21 (1991)).
Numa abordagem, a estrutura tridimensional do polipéptido PR0211 ou de um complexo polipéptido PR0211-inibidor, é determinada por cristalografia de raios-X, por modelação em computador ou, mais tipicamente, por uma combinação das duas abordagens. Ambas, a forma e carga do polipéptido PR0211 devem ser determinadas para elucidar a estrutura e determinar o(s) local activo da molécula. Menos freguentemente, pode-se obter informação útil a respeito da estrutura do polipéptido PR0211 por modelação baseada na estrutura de proteínas homólogas. Em ambos os casos, a informação estrutural relevante é utilizada para conceber moléculas do tipo polipéptido PR0211 análogas, ou para identificar inibidores eficazes. Exemplos úteis de concepção racional de drogas incluem moléculas gue têm uma actividade ou estabilidade melhorada, como demonstrado por Braxton e Wells, Biochemistry, 3JL: 7796-7801 (1992) ou gue actuam como inibidores, agonistas, ou antagonistas de péptidos nativos, como demonstrado por Athauda et al., Biochem., 113:742-746 (1993) .
Também é possível isolar um anticorpo específico para o alvo, seleccionado por um teste funcional, como descrito acima, e em seguida resolver a sua estrutura de cristal. Esta abordagem, em princípio, origina um núcleo de fármaco, sobre o qual se pode basear a concepção subsequente da droga. É possível contornar a cristalografia de proteína produzindo anticorpos anti-idiotípicos (anti-id) para um anticorpo farmacologicamente activo, funcional. Tal como uma imagem num espelho de uma imagem num espelho, é esperado que o local de ligação dos anti-id seja um análogo do receptor original. 0 anti-id pode ser então utilizado para identificar e isolar péptidos de bancos de péptidos produzidos química ou biologicamente. Os péptidos isolados irão então actuar como núcleo de fármaco.
Por meio da presente invenção podem-se disponibilizar quantidades suficientes do polipéptido PR0211 para realizar estudos analíticos, tal como cristalografia de raios-X. Além disso, o conhecimento da sequência de aminoácidos do polipéptido PR0211 aqui proporcionada irá fornecer uma linha 120 ΕΡ 1 121 439 /PT de orientação para os que utilizam técnicas de modelação em computador, em vez de, ou em adição à cristalografia de raios-X. EXEMPLO 10
Teste antitumoral in vitro A actividade antiproliferativa dos polipéptidos PR0211 foi determinada num teste de investigação, de pesquisa de drogas anticancerosas in vitro orientada pela doença, do National Câncer Institute (NCI), utilizando um teste de ligação do corante sulforrodamina B (SRB) essencialmente como descrito por Skehan et al., J. Natl. Câncer Inst., 82 : 1107-1112 (1990). As 60 linhas celulares de tumor utilizadas neste estudo ("o painel NCI"), bem como as condições para a sua manutenção e cultura in vitro foram descritas por Monks et al., J. Natl. Câncer Inst. 83:757-766 (1991). A finalidade desta pesquisa é avaliar inicialmente a actividade citotóxica e/ou citostática dos compostos de teste contra diferentes tipos de tumores (Monks et al., supra; Boyd, Câncer Princ. Pract. Oncol. Update, 3(10):1-12 [1989]).
As células de aproximadamente 60 linhas celulares de tumor foram recolhidas com tripsina/EDTA (Gibco), lavadas uma vez, ressuspensas em IMEM e a sua viabilidade foi determinada. As suspensões de células foram adicionadas por pipeta (volume de 100 μΐ) em placas de microtitulo de 96 poços separadas. A densidade celular para a incubação de 6 dias era inferior à da incubação de 2 dias, para evitar o sobre-crescimento. Deixou-se decorrer um período de pré-incubação dos inóculos de 24 horas a 37°C, para estabilização. Adicionaram-se diluições de duas vezes a concentração de teste pretendida no tempo zero, em alíquotas de 100 μΐ, aos poços da placa de microtitulo (diluição 1:2). Os compostos de teste foram analisados a 5 diluições semi-log (1000 a 100 000 vezes). As incubações ocorreram durante dois dias e seis dias numa atmosfera de CO2 a 5% e humidade a 100%.
Após incubação, o meio foi removido e as células foram fixadas em 0,1 ml de ácido tricloroacético a 10%, a 40°C. As placas foram lavadas cinco vezes com água desionizada, secas, 121
ΕΡ 1 121 439 /PT coradas durante 30 minutos com 0,1 ml de corante sulforrodamina B a 0,4% (Sigma) dissolvido em ácido acético a 1%, enxaguadas quatro vezes com ácido acético a 1% para remover o corante não ligado, secas e o corante foi extraido durante cinco minutos com 0,1 ml de base Tris 10 mM [tris(hidroximetil)aminometano], pH 10,5. A absorvância (DO) de sulf orrodamina B a 492 nm foi medida utilizando um leitor de placas de microtitulo de 96 poços com interface de computador.
Uma amostra de teste é considerada positiva se apresenta um efeito inibidor do crescimento de pelo menos 40%, a uma ou mais concentrações. Os resultados são apresentados na Tabela 5 seguinte, em que as abreviaturas do tipo de células de tumor são como se segue: NSCL = carcinoma de pulmão de células não pequenas; SNC = sistema nervoso central
Tabela 5
Composto Concentração Dias Tipo de Célula Tumoral Designação PR0211 0,65 nM 6 NSCL HOP62 PR0211 6, 50 nM 6 Leucemia RPMI-8226 PR0211 6, 50 nM 6 Leucemia HL-60 (TB) PR0211 6, 50 nM 6 NSCL NCI-H522 PR0211 6, 50 nM 6 SNC SF-539 PR0211 6, 50 nM 6 Melanoma LOX IMVI PR0211 6, 50 nM 6 Mama MDA-MB—435 PR0211 3, 90 nM 6 Leucemia MOLT-4 PR0211 3, 90 nM 6 SNC U251 PR0211 3, 90 nM 6 Mama MCF7 PR0211 39, 00 nM 6 Leucemia HT-60 (TB) PR0211 39, 00 nM 6 Leucemia MOLT-4 PR0211 39, 00 nM 6 NSCL EKVX PR0211 39, 00 nM 6 NSCL NCI-H23 PR0211 39, 00 nM 6 NSCL NCI-H322M PR0211 39, 00 nM 6 NSCL NCI-H46 0 PR0211 39, 00 nM 6 Cólon HCT-116 PR0211 39, 00 nM 6 Cólon HT29 PR0211 39, 00 nM 6 SNC SF-268 PR0211 39, 00 nM 6 SNC SF-295 122
ΕΡ 1 121 439 /PT
Composto Concentração Dias Tipo de Célula Tumoral Designação PR0211 39, 00 nM 6 SNC SNB-19 PR0211 39, 00 nM 6 SNC U251 PR0211 39, 00 nM 6 Melanoma LOX IMVI PR0211 39, 00 nM 6 Melanoma SK-MEL—5 PR0211 39, 00 nM 6 Melanoma UACC-257 PR0211 39, 00 nM 6 Melanoma UACC-62 PR0211 39, 00 nM 6 Ovárico OVCAR-8 PR0211 39, 00 nM 6 Renal RXF 393 PR0211 39, 00 nM 6 Mama MCF7 PR0211 39, 00 nM 6 Mama NCI/ADR-REHS5 7 8T PR0211 39, 00 nM 6 Mama T-47D PR0211 39, 00 nM 2 Leucemia HL-60 (TB) PR0211 39, 00 nM 2 Leucemia SR PR0211 39, 00 nM 2 NSCL NCI-H23 PR0211 39, 00 nM 2 Cólon HCT- 116 PR0211 39, 00 nM 2 Melanoma LOX-IMVI PR0211 39, 00 nM 2 Melanoma SK-MEL—5 PR0211 39, 00 nM 2 Mama T-47D
DEPÓSITO DE MATERIAL
Os materiais seguintes foram depositados na American Type Culture Collection, 10801 University Blvd., Manassas, VA 20110-2209, EUA (ATCC):
Material N°. Dep. ATCC Data de depósito DNA32292-1131 209258 16 de Setembro de 1997
Estes depósitos foram feitos sob as condições do Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microorganismos para Efeitos do Procedimento em Matéria de Patentes e seus regulamentos (tratado de Budapeste). Isto assegura a manutenção de uma cultura viável do depósito durante 30 anos a partir da data de depósito. Os depósitos serão disponibilizado pela ATCC nos termos do tratado de Budapeste e sujeito a um acordo entre a Genentech, Inc. e a 123
ΕΡ 1 121 439 /PT ATCC, o que assegura uma disponibilidade permanente e sem restrições da progénie da cultura do depósito ao público, após concessão da patente US pertinente, ou após disponibilização ao público de qualquer pedido de patente US ou estrangeira, de acordo com o que ocorrer primeiro, e assegura a disponibilidade da progénie a quem o agente de patentes e marcas registadas dos EUA determinar que tem direito, de acordo com a 35 USC §122 e regras do agente conformes com esta (incluindo 37 CFR §1.14 com referência particular a 886 OG 638) . 0 cessionário do presente pedido concordou que se uma cultura dos materiais depositados morrer, ou for perdida, ou destruída quando cultivada sob condições adequadas, os materiais serão prontamente substituídos após notificação, com outros do mesmo. A disponibilidade do material depositado não deve ser entendida como uma licença para praticar a invenção, em contravenção dos direitos concedidos sob a autoridade de qualquer governo, em acordo com as suas leis sobre patentes. 0 fascículo escrito acima é considerado suficiente para permitir a um perito na arte praticar a invenção. A presente invenção não deve ser limitada no seu âmbito pela construção depositada, uma vez que a concretização depositada pretende ser apenas uma ilustração de alguns aspectos da invenção. 0 depósito de material não constitui admissão de que a descrição escrita aqui contida é inadequada para a prática de qualquer aspecto da invenção, incluindo o seu melhor modo, nem deve ser entendida como limitando o âmbito das reivindicações às ilustrações específicas que representa. De facto, várias modificações em adição às apresentadas e descritas aqui serão evidentes para os peritos na arte a partir da descrição anterior e estão no âmbito das reivindicações anexas.
Listagem de sequências <110> Genentech, Inc.
Avi Ashkenazi,
Audrey Goddard,
Austin L. Gurney Robert D. Klein Mary Napier William I. Wood Jean Yuan 124
ΕΡ 1 121 439 /PT <120> Métodos e composições para inibição do crescimento de células neoplásicas
<130> P1694R1 PCT <140 PCT/US99/23089 <141> 1999-10-05 <150> US 60/104,080 <151> 1998-10-13 <160> 5 <210> 1 <211> 1364 <212> ADN <213> Homo Sapien <400> 1 ggccggagca gcacggccgc aggacctgga gctccggctg cgtcttcccg 50 cagcgctacc cgccatgcgc ctgccgcgcc gggccgcgct ggggctcctg 100 ccgcttctgc tgctgctgcc gcccgcgccg gaggccgcca agaagccgac 150 gccctgccac crggtgecrggg ggctggtgga caagtttaac caggggatgg 200 tggacaccgc aaagaagaac tttggcggcg ggaacacggc ctgggaggaa 250 aagacgccgC ccaagtacga gtccagcgag attcgcctgc tggagatcct 300 ggaggggctg tgcgagagca gcgacttcga atgcaatcag atgctagagg 350 cgcaggagga gcacctggag gcctggtggc tgcagctgaa gagcgaatat 400 cctgacttat tcgagtggtt ttgtgtgaag acactgaaag tgtgctgctc 450 tccaggaacc tacggtcccg actgtctcgc atgccagggc ggatcccaga 500 ggccctgcag cgggaatggc cactgcagcg gagatgggag cagacagggc 550 gacgggtcct gccggtgcca catggggtac cagggcccgc tgCgcactga 600 ctgcatggac ggctacttca gctcgctccg gaacgagacc cacagcatct 650 gcacagcctg tgacgagtcc tgcaagacgt gctcgggcct gaccaacaga 700 gactgcggcg agtgtgaagt gggctgggtg ctggacgagg gcgcctgtgt 750 ggatgtggac gagtgtgcgg ccgagccgcc tccctgcagc gctgcgcagt eoo tctgtaagaa cgccaacggc tcctacacgt gcgaagagtg tgactccagc 850 125
ΕΡ 1 121 439 /PT cgtgtgggct gcacagggga aggcccagga aactgtaaag agtgtatctc 900 tggctacgcg agggagcacg gacagtgtgc agatgtggac gagtgctcac 950 tagcagaaaa aacctgtgtg aggaaaaacg aaaactgcta caatactcca 1000 gggagctacg tctgtgtgtg tcctgacggc ttcgaagaaa cggaagatgc 1050 ctgtgtgccg ccggcagagg ctgaagccac agaaggagaa agcccgacac 1100 agctgccctc ccgcgaagac ctgtaatgtg ccggacttac cctttaaatt 1150 attcagaagg atgtcccgtg gaaaatgtgg ccctgaggat gccgtctcct 1200 gcagtggaca gcggcgggga gaggctgcct gcCctctaac ggttgattct 1250 catttgtccc ttaaacagct gcatttcttg gttgttctta aacagacttg 1300 tatattttga tacagttctt tgtaataaaa ttgaccattg taggtaatca 1350 ggaggaaaaa aaaa 1364 <210> 2 <211> 353
<212> PRT <213> Homo Sapien <400> 2 Met Arg 1 Leu Pro Arg 5 Arg Ala Ala Leu Gly 10 Leu Leu pro Leu Leu 15 Leu Leu Leu Pro Pro 20 Ala Pro Glu Ala Ala 25 Lys Lys Pro Thr Pro 30 Cys HÍS Arg Cys Arg 35 Gly Leu Vai Asp Lys 40 Phe Asn Gin Gly Met 45 Vai Asp Thr Ala Lys SO Lys Asn Phe Gly Gly 55 Gly Asn Thr Ala Trp 60 Glu Glu Lys Thr Leu 65 Ser Lys Tyr Glu Ser 70 Ser Glu Ile Arg Leu 75 Leu Glu Ile Leu Glu 80 Gly Leu Cys Glu Ser 85 Ser Asp Phe Glu Cys 90 Asn Gin Met Leu Glu 95 Ala Gin Glu Glu His 100 Leu Glu Ala Trp Trp 105 Leu Gin Leu Lys Ser 110 Glu Tyr Pro Asp Leu 115 Phe Glu Trp Phe Cys 120 Vai Lys Thr Leu Lys 125 Vai Cys Cys Ser Pro 130 Gly Thr Tyr Gly Pro 135 Asp Cys Leu Ala Cys 140 Gin Gly Gly Ser Gin 145 Arg Pro Cys Ser Gly ISO Asn Gly His Cys Ser 155 Gly Asp Gly Ser Arg 160 Gin Gly Asp Gly Ser 165 Cys Arg Cys His Met 170 Gly Tyr Gin Gly Pro 175 Leu Cys Thr Asp Cys 1B0 126
ΕΡ 1 121 439 /PT
Met Asp Gly Tyr Phe 185 Ser Ser Leu Arg Asn 190 Glu Thr His Ser Ile 195 Cys Thr Ala Cys Asp 200 Glu Ser Cys Lys Thr 205 Cys Ser Gly Leu Thr 210 Asn Arg Asp Cys Gly 215 Glu Cys Glu Val Gly 220 Trp Val Leu Asp Glu 225 Gly Ala Cys Vai Asp 230 Vai Asp Glu Cys Ala 23S Ala Glu Pro Pro Pro 240 Cys Ser Ala Ala Gin 245 Phe Cys Lys Asn Ala 250 Asn Gly Ser Tyr Thr 255 Cys Glu Glu Cys Asp 260 Ser Ser Cys Val Gly 265 Cys Thr Gly Glu Gly 270 Pro Gly Asn Cys Lys 275 Glu Cys Ile Ser Gly 280 Tyr Ala Arg Glu His 285 Gly Gin cys Ala Asp 290 Val Asp Glu Cys Ser 295 Leu Ala Glu Lys Thr 300 Cys Vai Arg Lys Asn 305 Glu Asn Cys Tyr Asn 310 Thr Pro Gly Ser Tyr 315 Vai Cys Vai Cys Pro 320 Asp Gly Phe Glu Glu 325 Thr Glu Asp Ala Cys 330 Vai Pro Pro Ala Glu 335 Ala Glu Ala Thr Glu 340 Gly Glu Ser Pro Thr 345 Gin Leu Pro Ser Arg 350 Glu Asp Leu 353
<210> 3 <211> 21 <212> ADN <213> Sequência Artificial <220> <223> Sonda Oligonucleotidica Sintética <400> 3 agagtgtatc tctggctacg c 21
<210> 4 <211> 22 <212> ADN <213> Sequência Artificial <220> <223> Sonda Oligonucleotidica Sintética <400> 4 taagtccggc acattacagg tc 22
<210> 5 <211> 45 <212> ADN <213> Sequência Artificial <220> <223> Sonda Oligonucleotidica Sintética 127 ΕΡ 1 121 439 /PT <400> 5 agggagcacg gacagtgtgc agatgtggac gagtgctcac tagca 45
Lisboa,

Claims (10)

  1. ΕΡ 1 121 439 /PT 1/2 REIVINDICAÇÕES 1. Utilização de um polipéptido PR0211, ou de um seu agonista, na preparação de um medicamento para o tratamento de um tumor num mamífero, por inibição directa da proliferação de células do tumor, em que o referido polipéptido PR0211 compreende pelo menos 80% de identidade de sequência de aminoácidos com (a) os resíduos 1 ou cerca de 25 a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO: 2) , ou (b) X a 353 do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO: 2), em que X é qualquer resíduo de aminoácido de 20 a 29 da Figura 2 (SEQ ID NO:2) e em que o referido agonista é um anticorpo agonista contra o referido polipéptido PR0211, ou um fragmento do polipéptido PR0211 apresentado na Figura 2 (SEQ ID NO:2).
  2. 2. Utilização de acordo com a reivindicação 1, em que o medicamento compreende uma quantidade citotóxica do referido polipéptido PR0211, ou do seu agonista referido.
  3. 3. Utilização de acordo com a reivindicação 1 ou a reivindicação 2 em que o medicamento compreende também um outro agente inibidor do crescimento, agente citotóxico ou agente quimioterapêutico.
  4. 4. Utilização de acordo com qualquer uma das reivindicações anteriores, em que o referido polipéptido PR0211 compreende a sequência de aminoácidos apresentada na Figura 2 (SEQ ID NO:2).
  5. 5. Utilização de acordo com qualquer uma das reivindicações anteriores, em que o referido tumor é um cancro.
  6. 6. Utilização de acordo com a reivindicação 5, em que o cancro é seleccionado do grupo constituído por cancro da mama, cancro dos ovários, cancro renal, cancro colorrectal, cancro uterino, cancro da próstata, cancro do pulmão, cancro da bexiga, cancro do sistema nervoso central, melanoma e leucemia. ΕΡ 1 121 439 /PT 2/2
  7. 7. Método para inibir o crescimento de uma célula de tumor compreendendo expor a referida célula de tumor a uma quantidade eficaz de um polipéptido PR0211 ou seu agonista, como definido em qualquer uma das reivindicações 1 a 4, em que o referido passo de exposição ocorre in vitro.
  8. 8. Artigo de fabrico compreendendo: um recipiente, uma composição compreendendo um ingrediente activo contido no recipiente, em que o referido ingrediente activo na composição é um polipéptido PR0211 ou um seu agonista, como definido em qualquer uma das reivindicações 1 a 4; e, ou um rótulo sobre, ou associado ao recipiente, em que o rótulo indica que a composição é para utilização como definido em qualquer uma das reivindicações 1 a 6; ou um folheto informativo com instruções para utilização, como definido em qualquer uma das reivindicações 1 a 6.
  9. 9. Artigo de fabrico de acordo com a reivindicação 8, em que o agente activo está presente numa quantidade que é eficaz para o tratamento de um tumor num mamífero.
  10. 10. Artigo de fabrico de acordo com a reivindicação 8 ou a reivindicação 9, em que a referida composição compreende também um outro agente inibidor do crescimento, agente citotóxico ou agente quimioterapêutico. Lisboa,
PT99970398T 1998-10-13 1999-10-05 Método e composições para inibir o crescimento de células neoplásticas PT1121439E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10408098P 1998-10-13 1998-10-13

Publications (1)

Publication Number Publication Date
PT1121439E true PT1121439E (pt) 2006-12-29

Family

ID=22298575

Family Applications (2)

Application Number Title Priority Date Filing Date
PT99970398T PT1121439E (pt) 1998-10-13 1999-10-05 Método e composições para inibir o crescimento de células neoplásticas
PT04025897T PT1518930E (pt) 1998-10-13 1999-10-05 Métodos e composições para inibir o crescimento de células neoplásticas

Family Applications After (1)

Application Number Title Priority Date Filing Date
PT04025897T PT1518930E (pt) 1998-10-13 1999-10-05 Métodos e composições para inibir o crescimento de células neoplásticas

Country Status (15)

Country Link
EP (1) EP1121439B1 (pt)
JP (1) JP2002527452A (pt)
KR (2) KR100448427B1 (pt)
AT (2) ATE363536T1 (pt)
AU (1) AU758462B2 (pt)
CA (1) CA2344465A1 (pt)
DE (2) DE69936234T2 (pt)
DK (2) DK1121439T3 (pt)
ES (2) ES2290606T3 (pt)
IL (3) IL142088A0 (pt)
MX (1) MXPA01003636A (pt)
NZ (1) NZ510584A (pt)
PT (2) PT1121439E (pt)
WO (1) WO2000021996A2 (pt)
ZA (1) ZA200102380B (pt)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7169906B2 (en) 1997-09-17 2007-01-30 Genentech, Inc. PRO211 polypeptides
US6974689B1 (en) 1997-09-18 2005-12-13 Genentech, Inc. Nucleic acid encoding PRO211 polypeptides
CA2406855A1 (en) 2000-04-21 2001-11-01 Takeda Chemical Industries, Ltd. Novel insulin/igf/relaxin family polypeptides and dnas thereof
CN101951885A (zh) * 2007-12-28 2011-01-19 生物发明国际公司 制剂

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ226799A (en) * 1987-11-06 1991-08-27 Oncogen Breast cancer inhibitory factor and method for inhibiting proliferation of neoplastic cells and compositions therefor
US5814307A (en) * 1989-04-10 1998-09-29 Bristol-Myers Squibb Company Method for regulating cell growth, leukocyte differentiation and tumor cell growth using Oncostatin M to stimulate synthesis of IL-6
US5416192A (en) * 1990-04-03 1995-05-16 Bristol-Myers Squibb Company Epithelins: novel cysteine-rich growth modulating proteins
WO1999014327A2 (en) * 1997-09-17 1999-03-25 Genentech, Inc. Genes amplified in tumours, antibodies against the proteins coded thereby, and their use in diagnosis and treatment of cancer
NZ503343A (en) * 1997-09-17 2002-09-27 Genentech Inc Secreted and transmembrane polypeptides and use to induce apoptosis of tumour cells

Also Published As

Publication number Publication date
IL142088A (en) 2008-11-26
EP1121439A2 (en) 2001-08-08
WO2000021996A3 (en) 2000-11-09
IL142088A0 (en) 2002-03-10
DE69936234D1 (de) 2007-07-12
ES2290606T3 (es) 2008-02-16
EP1121439B1 (en) 2006-07-12
KR100448427B1 (ko) 2004-09-16
PT1518930E (pt) 2007-09-04
NZ510584A (en) 2003-04-29
ATE332970T1 (de) 2006-08-15
AU758462B2 (en) 2003-03-20
ZA200102380B (en) 2002-03-22
DE69932342D1 (de) 2006-08-24
AU1200500A (en) 2000-05-01
KR100448426B1 (ko) 2004-09-13
DK1121439T3 (da) 2006-11-13
DK1518930T3 (da) 2007-10-01
DE69932342T2 (de) 2007-07-12
KR20010085915A (ko) 2001-09-07
CA2344465A1 (en) 2000-04-20
KR20030096387A (ko) 2003-12-24
JP2002527452A (ja) 2002-08-27
WO2000021996A2 (en) 2000-04-20
DE69936234T2 (de) 2008-03-06
ATE363536T1 (de) 2007-06-15
IL189502A0 (en) 2008-06-05
ES2268901T3 (es) 2007-03-16
MXPA01003636A (es) 2003-10-14

Similar Documents

Publication Publication Date Title
AU768230B2 (en) Methods and compositions for inhibiting neoplastic cell growth
ES2287020T3 (es) Procedimiento y composiciones para inhibir el crecimiento de celulas neoplasicas.
ES2577532T3 (es) Nueva composición y métodos para el tratamiento de enfermedades relacionadas con el sistema inmune
JP2012246296A (ja) 血管形成及び心血管疾患の調節に使用する肝細胞成長因子の新規インヒビター
WO2000075327A1 (en) Methods and compositions for inhibiting neoplastic cell growth
US20020010137A1 (en) Methods and compositions for inhibiting neoplastic cell growth
ZA200103885B (en) Methods and compositions for inhibiting neoplastic cell growth.
CA2390685C (en) Methods and compositions for inhibiting neoplastic cell growth
AU3107000A (en) Methods and compositions for inhibiting neoplastic cell growth
PT1121439E (pt) Método e composições para inibir o crescimento de células neoplásticas
ES2316454T3 (es) Metodo de inhibicion de pap1 inducido por il-22.
EP1484338B1 (en) Methods and compositions for inhibiting neoplastic cell growth
AU2003204815B2 (en) Methods and compositions for inhibiting neoplastic cell growth
EP1518930B1 (en) Methods and compositions for inhibiting neoplastic cell growth
AU2003257515B2 (en) Methods and compositions for inhibiting neoplastic cell growth
ZA200103883B (en) Method and compositions for inhibiting neoplastic cell growth.
MXPA01005418A (en) Methods and compositions for inhibiting neoplastic cell growth