PT1015477E - 32 proteínas humanas segregadas - Google Patents

32 proteínas humanas segregadas Download PDF

Info

Publication number
PT1015477E
PT1015477E PT98926105T PT98926105T PT1015477E PT 1015477 E PT1015477 E PT 1015477E PT 98926105 T PT98926105 T PT 98926105T PT 98926105 T PT98926105 T PT 98926105T PT 1015477 E PT1015477 E PT 1015477E
Authority
PT
Portugal
Prior art keywords
polypeptide
polynucleotide
cells
sequence
seq
Prior art date
Application number
PT98926105T
Other languages
English (en)
Inventor
Guo-Liang Yu
Steven M Ruben
Craig A Rosen
Patrick J Dillon
Jian Ni
Kenneth C Carter
Gregory A Endress
Ping Feng
Original Assignee
Human Genome Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Human Genome Sciences Inc filed Critical Human Genome Sciences Inc
Publication of PT1015477E publication Critical patent/PT1015477E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/525Tumour necrosis factor [TNF]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

DESCRIÇÃO "32 PROTEÍNAS HUMANAS SEGREGADAS"
Campo da Invenção
Esta invenção refere-se a polinucleótidos identificados de novo e aos polipéptidos codificados por estes polinucleótidos, utilizações de tais polinucleótidos e polipéptidos, e sua produção.
Antecedentes da Invenção
Ao contrário da bactéria, a qual existe como um único compartimento rodeado por uma membrana, as células humanas e de outros eucariotas são subdivididas por membranas em muitos compartimentos funcionalmente distintos. Cada compartimento membranar, ou organelo, contém diferentes proteínas essenciais para a função do organelo. A célula utiliza "sinais de triagem", que são motivos de aminoácidos localizados na proteína, de modo a direccionar proteínas para organelos celulares particulares.
Um tipo de sinal de triagem, denominado sequência sinal, um péptido sinal ou uma sequência condutora, dirige uma classe de proteínas para um organelo denominado retículo endoplasmático (ER) . 0 ER separa as proteínas membranares de todos os outros tipos de proteínas. Uma vez localizados no ER, ambos os grupos de proteínas podem ser, adicionalmente, dirigidos para outro organelo denominado aparelho de Golgi. Aqui, o Golgi distribui 1 as proteínas para vesículas, incluindo vesículas secretórias, a membrana celular, lisossomas e os outros organelos.
As proteínas dirigidas para o ER por uma sequência sinal podem ser libertadas dentro do espaço extracelular como uma proteína segregada. Por exemplo, as vesículas contendo proteínas segregadas podem fundir-se com a membrana celular e libertar os seus conteúdos para o espaço extracelular - um processo denominado exocitose. A exocitose pode ocorrer de modo constitutivo ou após recepção de um sinal desencadeador. No último caso, as proteínas são armazenadas em vesículas secretórias (ou grânulos secretórios) até ao desencadeamento da exocitose. De um modo semelhante, as proteínas que residem na membrana celular também podem ser segregadas para o espaço extracelular por clivagem proteolítica de um "ligante" que fixa a proteína à membrana. Não obstante o grande progresso realizado nos últimos anos, foi identificado apenas um pequeno número de genes codificando proteínas humanas segregadas. Estas proteínas segregadas incluem os comercialmente valiosos insulina humana, interferão, Factor VIII, hormona humana do crescimento, activador do plasminogénio tecidular e eritropoietina. Deste modo, à luz do papel omnipresente das proteínas segregadas na fisiologia humana, existe uma necessidade para a identificação e caracterização de novas proteínas humanas segregadas e dos genes que as codificam. Este conhecimento irá permitir a alguém detectar, tratar e prevenir distúrbios médicos, através da utilização de proteínas segregadas ou dos genes que as codificam. 2
Sumário da Invenção A presente invenção refere-se a novos polinucleótidos e aos polipéptidos codificados. Além do mais, a presente invenção refere-se a vectores, células hospedeiras, anticorpos e métodos recombinantes para produção dos polipéptidos e polinucleótidos. Também são proporcionados métodos de diagnóstico para detecção de distúrbios relacionados com os polipéptidos e composições farmacêuticas. A invenção refere-se, adicionalmente, a métodos de rastreio para identificação de agentes de ligação dos polipéptidos.
Especificamente, a presente invenção refere-se a um polinucleótido seleccionado do grupo consistindo de: (a) um polinucleótido tendo a sequência nucleotidica integral da SEQ ID N°: 23; (b) um polinucleótido tendo a sequência nucleotidica integral daquela sequência de ADNc incluída no Depósito ATCC N° 209075 que é hibridável sob condições restringentes a SEQ ID N°: 23; (c) um fragmento polinucleotídico que compreende 150 nucleótidos contíguos da SEQ ID N°: 23; (d) um fragmento polinucleotídico que compreende 150 nucleótidos da sequência de ADNc incluída no Depósito ATCC N° 209075 que é hibridável sob condições restringentes a SEQ ID N°: 23; (e) um polinucleótido codificando um fragmento polipeptídico, em que o referido fragmento polipeptídico compreende 40 ou 50 resíduos de aminoácidos contíguos de comprimento da SEQ ID N°: 60; 3 (f) um polinucleótido codificando um fragmento polipeptidico codificado pela sequência de ADNc incluída no Depósito ATCC N° 209075, que é hibridável sob condições restringentes a SEQ ID N°: 23, em que o referido fragmento polipeptidico compreende 40 ou 50 resíduos de aminoácidos contíguos da SEQ ID N°: 60; (g) um polinucleótido codificando um fragmento polipeptidico da SEQ ID N°: 60, ou um seu fragmento polipeptidico, codificado pela sequência de ADNc incluída no Depósito ATCC N° 209075, em que o referido fragmento polipeptidico compreende 40 ou 50 resíduos de aminoácidos contíguos de comprimento e tem actividade biológica; (h) um polinucleótido codificando um polipéptido de comprimento completo da SEQ ID N°: 60 ou sendo codificado pela sequência de ADNc incluída no Depósito ATCC N° 209075, que é hibridável sob condições restringentes a SEQ ID N°: 23; (i) um polinucleótido que é, pelo menos, 95% idêntico a, pelo menos, 150 nucleótidos contíguos de um polinucleótido como definido em qualquer uma de (a) a (h) ; (j) um polinucleótido codificando um polipéptido tendo uma sequência de aminoácidos, pelo menos, 95% idêntica à sequência de aminoácidos de um polipéptido codificado por um polinucleótido de qualquer uma de (a) a (i); e ou a cadeia complementar de polinucleótido (a) a (j). A presente invenção também se refere ao gene correspondendo à sequência de ADNc da SEQ ID N°: 23 ou codificando o polipéptido tendo a sequência de aminoácidos da SEQ ID N°: 60. Além disso, a presente invenção refere-se a um vector compreendendo o polinucleótido da invenção. 4 A presente invenção também se refere a um método de preparação de uma célula hospedeira recombinante, compreendendo a introdução do polinucleótido ou do vector da invenção.
Além disso, a presente invenção refere-se a uma célula hospedeira recombinante contendo o polinucleótido ou o vector da invenção ou produzido pelo supramencionado método de preparação de uma célula hospedeira recombinante. A presente invenção também se refere a um método de preparação de um polipéptido codificado pelo polinucleótido da invenção compreendendo; (a) cultivar a supramencionada célula hospedeira recombinante que expressa o referido polipéptido, sob condições que o referido polipéptido seja expresso; e (b) recuperar o referido polipéptido.
Além disso, a presente invenção refere-se a um polipéptido codificado pelo polinucleótido da invenção ou obtenível pelo supramencionado método de preparação de um polipéptido. A presente invenção também se refere a um anticorpo que se liga especificamente ao polipéptido da invenção. A presente invenção refere-se, adicionalmente, a um antagonista compreendendo um polinucleótido anti-sentido ao polinucleótido da invenção, capaz de se ligar ao referido polinucleótido e bloquear a tradução no polipéptido codificado. 5 A presente invenção também se refere a um método para identificação de antagonistas ou agonistas do polipéptido da invenção, compreendendo: (a) produzir células que expressam o referido polipéptido; (b) colocar em contacto o polipéptido produzido na etapa (a) com uma amostra de teste potencialmente contendo um antagonista ou agonista; e (c) identificar um antagonista ou agonista, através da observação da ligação e inibição ou estimulação de actividade do referido polipéptido.
Além disso, a presente invenção refere-se a um método de diagnóstico in vitro de um estado patológico, ou uma susceptibilidade a um estado patológico, num indivíduo, compreendendo: (a) determinar a presença ou ausência de uma mutação no polinucleótido ou no gene da invenção; e (b) diagnosticar um estado patológico, ou uma susceptibilidade a um estado patológico, com base na presença ou ausência da referida mutação. A presente invenção também se refere a um método de diagnóstico in vitro de um estado patológico, ou uma susceptibilidade a um estado patológico, num indivíduo, compreendendo: (a) determinar a presença ou quantidade de expressão do polipéptido da invenção numa amostra biológica; e 6 (b) diagnosticar um estado patológico, ou uma susceptibilidade a um estado patológico, com base na presença ou quantidade de expressão do polipétido.
Além disso, a presente invenção refere-se a um método para identificação de um parceiro de ligação para o polipéptido da invenção, compreendendo: (a) colocar em contacto o referido polipéptido com um parceiro de ligação; e (b) determinar se o parceiro de ligação influência uma actividade do polipéptido.
Adicionalmente, a presente invenção refere-se a uma composição farmacêutica compreendendo o polinucleótido da invenção, o polipéptido da invenção, um ADN codificando e capaz de expressar o referido polipéptido in vivo, o anticorpo da invenção, o antagonista da invenção e, opcionalmente, um transportador farmaceuticamente aceitável. A presente invenção também se refere a uma composição de diagnóstico, compreendendo o polinucleótido ou o anticorpo da invenção.
Finalmente, a presente invenção também se refere a um método para a produção de uma composição farmacêutica, compreendendo as etapas do método anteriormente mencionado para identificação de antagonistas ou agonistas e (d) formular o composto identificado na etapa (c) numa forma farmaceuticamente aceitável. 7
Descrição Detalhada
Definições
As seguintes definições são proporcionadas para facilitar a compreensão de determinados termos utilizados em toda esta descrição.
Na presente invenção, "isolado" refere-se a material removido do seu ambiente original (e. g., o ambiente natural se for de ocorrência natural) e, deste modo, é alterado "pela mão do homem" a partir do seu estado natural. Por exemplo, um polinucleótido isolado poderia ser parte de um vector ou uma composição de matéria ou poderia estar contido dentro de uma célula e ser, ainda, "isolado", em virtude de esse vector, composição de matéria ou célula particular não ser o ambiente original do polinucleótido.
Na presente invenção, uma proteina "segregada" refere-se àquelas proteínas capazes de serem direccionadas para o ER, vesículas secretórias ou o espaço extracelular como resultado de uma sequência sinal, assim como àquelas proteínas libertadas dentro do espaço extracelular, sem conterem, necessariamente, uma sequência sinal. Se a proteína segregada for libertada dentro do espaço extracelular, a proteína segregada pode sofrer processamento extracelular, de modo a produzir uma proteína "madura". A libertação dentro do espaço extracelular pode ocorrer por muitos mecanismos, incluindo exocitose e clivagem proteolítica.
Como aqui utilizado, um "polinucleótido" refere-se a uma molécula tendo uma sequência de ácido nucleico contida na SEQ ID N°: 23 ou ao ADNc contido dentro do clone depositado com o Depósito ATCC N° 209075 ou seus variantes, como definido acima em (a) a (j). Por exemplo, o polinucleótido pode conter a sequência nucleotidica da sequência de ADNc de comprimento completo, incluindo as sequências não traduzidas 5' e 3', a reqião codificante, com ou sem a sequência sinal, a região codificante de proteína segregada, assim como fragmentos, epitopos, domínios e variantes da sequência de ácido nucleico de acordo com as definições acima em (a) a (j). Além do mais, como aqui utilizado, um "polipéptido" refere-se a uma molécula tendo a sequência de aminoácidos traduzida, produzida a partir do polinucleótido como definido acima em de uma forma geral.
Na presente descrição, a sequência de comprimento completo, identificada como SEQ ID N°: X, era frequentemente produzida através das sequências de sobreposição contidas em múltiplos clones (análise contig) . Um clone representativo contendo a totalidade ou a maior parte da sequência para SEQ ID N°: X foi depositado na American Type Culture Collection ("ATCC"). Como mostrado na Tabela 1, cada clone é identificado por um ADNc Clone ID (Identificador) e o Número de Depósito ATCC. A ATCC está localizada em 10801 University Boulevard, Manassas, Virgínia 20110-2209, EUA. O depósito ATCC foi realizado de acordo com os termos do Tratado de Budapeste, no reconhecimento internacional do depósito de microrganismos para efeitos de processo de patente.
Um "polinucleótido" da presente invenção também inclui aqueles polinucleótidos capazes de hibridarem, sob condições de hibridação restringentes, com as sequências contidas na SEQ ID N°: 23, o seu complemento, ou o ADNc dentro do clone depositado com o Depósito ATCC N° 209075, desde que a sequência 9 de hibridação tenha, pelo menos, 95% de identidade da sequência com, pelo menos, 150 nucleótidos contíguos de um polinucleótido definido em qualquer uma das reivindicações l(a) a (h) ou codifique um polipéptido tendo uma sequência de aminoácidos, pelo menos, 95% idêntica à sequência de aminoácidos de um polipéptido codificado por um polinucleótido de qualquer uma das reivindicações l(a) a (i) . "Condições de hibridação restringentes" refere-se a uma incubação de um dia para o outro, a 42 °C, numa solução compreendendo formamida a 50%, 5x SSC (NaCl a 750 mM, citrato de sódio a 75 mM), fosfato de sódio a 50 mM (pH 7,6), 5x de solução de Denhardt, sulfato de dextrano a 10% e ADN de esperma de salmão desnaturado cortado, a 20 pg/mL, seguido de lavagem dos filtros em 0,lx SSC, a cerca de 65 °C. São também descritas moléculas de ácidos nucleicos que se hibridam com os polinucleótidos da presente invenção a baixas condições de hibridação restringentes. As alterações na restringência de hibridação e detecção de sinal são principalmente realizadas através da manipulação da concentração de formamida (percentagens inferiores de formamida resultam em restringência diminuída); condições salinas ou temperatura. Por exemplo, baixas condições de restringência, incluem uma incubação, de um dia para o outro, a 37 °C, numa solução compreendendo 6X SSPE (20X SSPE = NaCl a 3 M; NaH2P04 a 0,2 M; EDTA a 0,02 M, pH 7,4), SDS a 0,5%, formamida a 30%, ADN de bloqueio de esperma de salmão a 100 pg/mL; seguido de lavagens, a 50 °C, com 1XSSPE, SDS a 0,1%. Adicionalmente, de modo a alcançar restringência ainda mais baixa, as lavagens realizadas após hibridação restringente podem ser realizadas a concentrações salinas superiores (e. g., 5X SSC). 10 É de notar que podem ser realizadas variações nas condições anteriores, através da inclusão e/ou substituição de reagentes de bloqueio alternativos, utilizados para suprimir o fundo em experiências de hibridação. Reagentes tipicos de bloqueio incluem reagente de Denhardt, BLOTTO, heparina, ADN de esperma de salmão desnaturado e formulações proprietárias comercialmente disponíveis. A inclusão de reagentes de bloqueio específicos pode requerer modificação das condições de hibridação anteriormente descritas, em virtude de problemas com compatibilidade.
Certamente, um polinucleótido que se híbrida apenas a sequências poliA+ (tal como qualquer aparelho poliA+ 3' terminal de um ADNc mostrado na listagem da sequências), ou a um segmento complementar de resíduos T (ou U), não estaria incluído na definição de "polinucleótido", visto que um tal polinucleótido iria hibridar-se a qualquer molécula de ácido nucleico contendo um segmento poli (A) ou ao seu complemento (e. g., sob um aspecto prático, qualquer clone de ADNc de cadeia dupla). 0 polinucleótido da presente invenção pode ser composto por qualquer polirribonucleótido ou polidesoxirribonucleótido que pode ser ARN ou ADN não modificado ou ARN ou ADN modificado. Por exemplo, os polinucleótidos podem ser compostos por ADN de cadeia simples e cadeia dupla, ADN que é uma mistura de regiões de cadeia simples e cadeia dupla, ARN de cadeia simples e cadeia dupla e ARN que é uma mistura de regiões de cadeia simples e cadeia dupla, moléculas híbridas compreendendo ADN e ARN que podem ser de cadeia simples ou, de um modo mais típico, de cadeia dupla ou uma mistura de regiões de cadeia simples e cadeia dupla. Adicionalmente, o polinucleótido pode ser composto por regiões de cadeia tripla, compreendendo ARN ou ADN, ou ARN e 11 ADN. Um polinucleótido também pode conter uma ou mais bases modificadas ou estruturas de ADN ou ARN modificadas para estabilidade ou para outras razões. Bases "modificadas" incluem, por exemplo, bases tritiladas e bases pouco habituais, tal como inosina. Uma variedade de modificações pode ser realizada a ADN e ARN; deste modo, "polinucleótido" engloba formas quimicamente, enzimaticamente ou metabolicamente modificadas. 0 polipéptido da presente invenção pode ser composto por aminoácidos ligados entre si por ligações peptidicas ou ligações peptidicas modificadas, i. e., isoésteres peptidicos e pode conter aminoácidos que não os 20 aminoácidos codificados por gene. Os polipéptidos podem ser modificados por processos naturais, tal como processamento pós-traducional, ou por técnicas de modificação química que são bem conhecidas na matéria. Tais modificações estão bem descritas em textos básicos e em monografias mais detalhadas, assim como numa volumosa literatura de investigação. As modificações podem ocorrer em qualquer parte num polipéptido, incluindo a estrutura do péptido, as cadeias laterais dos aminoácidos e as extremidades amino ou carboxilo. Será entendido que, num determinado polipéptido, o mesmo tipo de modificação pode estar presente no mesmo ou em graus variáveis em vários sítios. Igualmente, um determinado polipéptido pode conter muitos tipos de modificações. Os polipéptidos podem ser ramificados, por exemplo, como resultado de ubiquitinação e os mesmos podem ser cíclicos, com ou sem ramificação. Os polipéptidos cíclicos, ramificados e cíclicos ramificados podem resultar de processos naturais de pós-tradução ou podem ser preparados por métodos sintéticos. As modificações incluem acetilação, acilação, ribosilação de ADP, amidação, conjugação covalente de flavina, conjugação covalente de uma fracção heme, conjugação covalente 12 de um nucleótido ou derivado de nucleótido, conjugação covalente de um lípido ou derivado de lipido, conjugação covalente de fosfotidilinositol, ligação cruzada, ciclização, formação de ligação dissulfureto, desmetilação, formação de ligações cruzadas covalentes, formação de cisteina, formação de piroglutamato, formilação, carboxilação gama, glicosilação, formação de âncora GPI, hidroxilação, iodinação, metilação, miristoilação, oxidação, pegilação, processamento proteolitico, fosforilação, prenilação, racemização, selenoilação, sulfatação, adição mediada por transferência de ARN de aminoácidos para proteínas, tais como arginilação e ubiquitinação (Ver, por exemplo, PROTEINS - STRUCTURE AND MOLECULAR PROPERTIES, 2a Ed., T. E. Creighton, W. H. Freeman and Company, Nova Iorque (1993); POSTTRANSLATIONAL COVALENT MODIFICATION OF PROTEINS, B. C. Johnson, Ed., Academic Press, Nova Iorque, p. 1-12 (1983); Seifter et ai. Meth Enzymol 182:626-646 (1990); Rattan et al., Ann NY Acad Sei 663:48-62 (1992)). A "SEQ ID N° : X" refere-se a uma sequência polinucleotidica, enquanto a "SEQ ID N°: Y" refere-se a uma sequência polipeptídica, ambas as sequências identificadas por um número inteiro especificado na Tabela 1. "Um polipéptido tendo actividade biológica" refere-se a polipéptidos exibindo actividade semelhante, mas não necessariamente idêntica a uma actividade de um polipéptido da presente invenção, incluindo formas maduras, como medidas num particular ensaio biológico, com ou sem dependência de dose. No caso de existir dependência de dose, não necessita de ser idêntica àquela do polipéptido mas, em vez disso, substancialmente semelhante à dose-dependência numa determinada actividade em comparação com o polipéptido da presente invenção 13 (i. e., ο polipéptido candidato irá exibir maior actividade ou não deve exceder cerca de 25 vezes menos e, de um modo preferido, não deve exceder cerca de dez vezes menos actividade e, de um modo muito preferido, não deve exceder cerca de três vezes menos actividade, relativamente ao polipéptido da presente invenção).
Polinucleótidos e Polipéptidos da Invenção ou aqui divulgados CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE Na 1
Este gene mapeia para o cromossoma 3 e, por conseguinte, os polinucleótidos aqui divulgados podem ser utilizados em análise de ligação como um marcador para o cromossoma 3.
Este gene é expresso em diversos tecidos fetais, incluindo cérebro, figado e pulmão e, em menor escala, em tecidos de adulto, particularmente, pele.
Por conseguinte, os Polinucleótidos e polipéptidos divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, uma variedade de cancros, particularmente, do cérebro, figado e pulmão. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema nervoso central, sistema 14 hepático e sistema hepático, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., cérebro e outro tecido do sistema nervoso, fígado, pulmão e pele e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis como um alvo para uma variedade de agentes de bloqueio, visto ser provável que estejam envolvidos na promoção de uma variedade de cancros. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N» 2
Os polipéptidos aqui divulgados compreendem a sequência: MSVPAFIDISEE DQAAE LRAYLKSKGAEISEENSE GGLHVDLAQIIEAC DVCLEEDDKDVESVMNSWSLLLILEPDKQEAUESLCEKLVKFREGERPSLRLQ LLSNLFHGMDKNTPVRYTVYCSLIKVAASCGAIQYIPTELDQVRKWISDWNLTT EKKHTLLRLLYEALVDCKKSDAASKVMVELLGSYTEDNASQARVDAHRCIVRA LKDPNAFLFDHLLTLKPVKFLEGELLIDLLTIFVSAKLASYVKFYQNNKDFIDSL GLLHEQNMAKMRLLTFMGMAVENKEISFDTMQQELQIGADDVEAFVIDAVRTK MVYCKIDQTQRKVWSHSTHRTFGKQQWQQLYDTLNAWKQNLNKVKNSLLS LSDT (SEQ ID N°: 85), MSVPAFIDlSEED (SEQ ID N°: 86), QAAELRAYLKSKG AE (SEQ ID N°: 87), ISEENSEGGLHVDLAQI (SEQ ID N°: 88), IEACDVCLKED DKDVESV (SEQ ID N°: ), VARPSSLFRSAWSCEW (SEQ ID N°: 90), LRLQLLS NLFHG (SEQ ID N°: 91), 15 KDVESVMNSWSLLUL (SEQ ID N°: 92), DAASKVMV ELLGSYTEDNASQARVDA (SEQ ID N° : 93) e/ou VEAFVIDAVR (SEQ ID N°: 94). Os polinucleótidos codificando estes polipéptidos também são divulgados.
Este gene é expresso em osso e, em menor escala, no cérebro, pulmão, células T, músculo, pele, testículo, baço e macrófagos.
Por conseguinte, os polinucleótidos e polipéptidos divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, cancro ósseo, osteoartrite e doenças auto-imunes. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido (s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário e sistema esquelético, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., cérebro e outro tecido do sistema nervoso, células T e outras células e tecido do sistema imunitário, pulmão, músculo, pele e tecidos feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 49 como resíduos: Arg-31 16 a Ser-37, Met-50 a Val-56, Glu-80 a Trp-87, Thr-94 a His-99, Tyr-129 a Ser-135, Tyr-193 a Phe-199, Ser-274 a Gln-285 e/ou
Ala-293 a Lys-302. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 3 0 produto de tradução deste gene partilha homologia da sequência com diversas cinases. 0 homólogo mais próximo é o TIF1 de murganho que é uma proteína nuclear de murganho. 0 TIF1 melhora RXR e RAR AF-2 em levedura e interage, num modo dependente de ligando, com diversos receptores nucleares em células de levedura e mamífero, assim como in vitro. Notavelmente, estas interacções requerem os aminoácidos constituindo o domínio de activação de AF-2 conservados em todos os NRs activos. Além do mais, o antagonista AF-2 do receptor de estrogénio (ER) hidroxitamoxifeno não consegue promover a interacção de ER-TIF1. Propõe-se que TIF1, o qual contém vários domínios conservados verificados em proteínas regulatórias transcricionais, é um mediador de AF-2 dependente de ligando. Interessantemente, na oncoproteína T18 de murganho, a fracção N-terminal de TIF1 está fundida a B-raf.
Este gene é expresso principalmente em células T activadas e, em menor escala, em vários outros tecidos, incluindo testículos e cérebro.
Por conseguinte, os polinucleótidos e polipéptidos divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados, a doenças auto-imunes, SIDA, 17 leucemias e vários outros cancros. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células T e outras células e tecido do sistema imunitário e cérebro e outro tecido do sistema nervoso e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 50 como resíduos: Ala-31 a Glu-36. A distribuição tecidular e homologia com TIF indicam que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para modulação de receptor nuclear e interacção de ligando em diversos distúrbios imunitários. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 4
Este gene mapeia para o cromossoma 11. Consequentemente, os polinucleótidos aqui divulgados podem ser utilizados em análise de ligação como um marcador para o cromossoma 11. Em formas de realização específicas, os polipéptidos divulgados compreendem a sequência: 18 MSEIYLRCQDEQQYARWMAGCRLASKGRTMADSSY (SEQ ID N°: 95), LVAPRF QRKFKAKQLTPRILEAHQNVAQLSLAEAQLRFIQAWQSL (SEQ ID N°: 96), VGD WKTWRF SNMRQWNVNWDIR (SEQ ID N° : 97), EEIDCTEEEMMVFAALQYH INKLSQS (SEQ ID N° : 98) e/ou EEIDCTEEEMMVFAALQYHINKLSQS (SEQ ID N° : 99) . Os polinucleótidos codificando estes polipéptidos também são divulgados.
Este gene é expresso principalmente em vários tipos de leucócitos, incluindo monócitos, células T e neutrófilos e, em menor escala, num número limitado de outros tecidos, incluindo veia umbilical e figado.
Por conseguinte, os polinucleótidos e polipéptidos divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula (s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, várias doenças do sistema imunitário, incluindo SIDA, doenças de imunodeficiência e distúrbios auto-imunes. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido (s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células sanguíneas, figado e tecido vascular outros tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica 19 padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 51 como resíduos: Ser-3 a Pro-9, Leu-17 a Leu-29, Asp-64 a Pro-69, He-105 a Gln-110, The-183 a Gln-200, Cys-239 a Arg-247, Ser-256 a Met-261, Gln-280 a Ala-296, Arg-310 a Thr-321, Lys-363 a Asp-368, Ser-395 a Trp-400 e/ou Thr-443 a Asp-453. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para terapia de substituição numa variedade de distúrbios do sistema imunitário. CARACTERISTICAS DE PROTEÍNA CODIFICADA POR GENE N2 5
Este gene é expresso principalmente no cérebro e pouco ou nada em qualquer outro tecido.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios do humor, distúrbio bipolar e depressão unipolar. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos, são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema nervoso central, a expressão deste gene a níveis significativamente superiores ou 20 inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., cérebro e outro tecido do sistema nervoso e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 52 como resíduos: Met-1 a Gly-8, Pro-10 a Arg-17, Pro-45 a Ser-55 e/ou Gly-63 a Tyr-74. A distribuição tecidular deste gene, principalmente no cérebro, indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para a detecção/tratamento de estados de doença neurodegenerativa e distúrbios de comportamento, tais como Doença de Alzheimer, Doença de Parkinson, Doença de Huntington, esquizofrenia, mania, demência, paranoia, distúrbio obsessivo compulsivo e distúrbio de pânico. Também, dada a expressão específica de cérebro deste gene, a região promotora deste gene contém um elemento específico de cérebro que poderia ser utilizado para direccionamento de expressão de sistemas vectores para o cérebro em terapia de substituição génica. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N- 6
Este gene mapeia para o cromossoma 1 e, por conseguinte, os polinucleótidos aqui divulgados podem ser utilizados em análise de ligação como um marcador para o cromossoma 1. 21
Este gene é expresso abundantemente em rabdomiossarcoma, é expresso a um elevado nível e em diferentes regiões do cérebro e glândula pituitária e, em menor escala, numa variedade de outros tecidos.
Por conseguinte, os polinucleótidos e polipéptidos divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios neurológicos e distúrbios musculares. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do cérebro, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., músculo liso, cérebro e outro tecido do sistema nervoso e pituitária e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A expressão abundante deste gene em rabdomiossarcoma indica um papel para o produto proteico, na detecção e/ou tratamento de distúrbios de músculo esquelético, incluindo degenerescência muscular, deperdição muscular e rabdomiólise. Alem disso, a expressão no cérebro indica um papel para o produto proteico deste gene na detecção/tratamento de estados de doença 22 neurodegenerativa e distúrbios de comportamento, tais como Doença de Alzheimer, Doença de Parkinson, Doença de Huntington, esquizofrenia, mania, demência, paranoia, distúrbio obsessivo compulsivo e distúrbio de pânico. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N® 7 0 produto de tradução deste gene partilha homologia da sequência com o gene TDAG51 que se pensa ser importante na mediação de apoptose e morte celular, por ligação da estimulação de TCR à expressão de Fas. Em formas de realização especificas, os polipéptidos da invenção compreendem a sequência: KELSFARIKAVECVESTGR HIYFTLV (SEQ ID N° : 100) e/ou GWNAQITLGLVKFKNQQ (SEQ ID N°: 101).
Este gene é expresso em diversos tecidos humanos, incluindo macrófagos.
Por conseguinte, os polinucleótidos e polipéptidos divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios imunitários. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., macrófagos e 23 outras células sanguíneas e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 54 como resíduos: Met-1 a Pró-9, Gln-43 a Glu-49 e/ou Phe-95 a Arg-102. A distribuição tecidular e homologia com o gene TDAG51 indicam que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para diagnóstico e intervenção de distúrbios imunitários, tais como imunodeficiência, alergia, infecção, inflamação, transplantação de tecido/órgão. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 8
Este gene é expresso em tecido da mama e células amnióticas e, em menor escala, em músculo liso, células T e cérebro infantil.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, síndrome de insuficiência fetal e deperdição embrionária. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um 24 determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema reprodutor feminino, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., tecido mamário, células amnióticas, músculo liso, cérebro e outro tecido do sistema nervoso e células T e outras células e tecido do sistema imunitário e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 9
Em formas de realização específicas, os polipéptidos aqui divulgados compreendem a sequência:
LVLGLSXLNNSYNFSF (SEQ ID N° : 102), HWIGSQAEEGQYSLNF
(SEQ ID N° : 103), HNCNNSVPGKEHPFDITVM (SEQ ID N° : 104), FIKYVLSD KEKKVFGIV (SEQ ID N° : 105), IPMQVLANVAY11 (SEQ ID N° : 106), IPMQVL ANVAYII (SEQ ID N°: 107), DGKVAVNLAKLKLFR (SEQ ID N° : 108) e/ou IREKNPDGFLSAA (SEQ ID N° : 109). Os polinucleótidos codificando estes polipéptidos também são divulgados.
Este gene é principalmente expresso no fígado fetal, baço e glândula pituitária e, em menor escala, em múltiplos tecidos.
Por conseguinte, os polinucleótidos e polipéptidos divulgados, são úteis como reagentes para identificação 25 diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios imunitários e cancro. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, dos sistemas hepático, imunitário e hematopoiético, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., figado, baço e glândula pituitária e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 56 como resíduos: Ser-62 a Cys-71, Thr-78 a Leu-86, Ser-104 a
Lys-109, Ser-130 a Ala-135 e/ou Gln-168 a Asp-174. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para diagnóstico e tratamento de distúrbios hepáticos e distúrbios dos sistemas imunitário e hematopoiético, tais como insuficiência hepática, hepatite, doenças alcoólicas do fígado, hipertensão portal, lesão tóxica do fígado, transplantação de fígado e neoplasma do fígado. A expressão no fígado e baço fetais, também indica a sua função em hematopoiese e, por conseguinte, o gene pode ser útil em distúrbios hematopoiéticos, incluindo anemia, leucemia ou radioterapia/quimioterapia do 26 cancro. A expressão na glândula pituitária pode indicar a sua utilização em distúrbios endócrinos com manifestações sistémicas ou especificas. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 10
O produto de tradução deste gene partilha homologia da sequência com uma proteína de ligação de ADN de galinha que se pensa ser importante na regulação transcricional da expressão génica. Os polipéptidos aqui divulgados compreendem a sequência: MMFGGYETI (SEQ ID N° : 110), YRDESSSELSVDSEVEFQLYSQIH
(SEQ ID N°: 111), YAQDLDDVIREEEHEEKNSGNSESSSSKPNQKKLIVLSDSEVI
QLSDGSEVITLSDEDSIYRCKGKNVRVQAQENAHGLSSSLQSNELVDKKCKSDI EKPKSEERSGVIREVMIIEVSSSEEEESTISEGDNVESW (SEQ ID N° : 112), MLLG
CEVDDKDDDILLNLVGCENSVTEGEDGINWSIS (SEQ ID N°: 113), DKDIEAQI
ANNRTPGRWT (SEQ ID N°: 114), QRYYSANKNIICRNCDKRGHLSKNCPLP RKV (SEQ ID N°: 115) e/ou RRCFLCSRRGHLLYSCPAPLCEYCPVPKMLDHS CLFRHSWDKQCDRCHMLGHYTDACTEDNRQYHLTTKPGPPKKPKTPSRPSAL AYCYHCAQKGHYGHECPEREVYDPSPVSPFICYYXDKYEIQEREKRLKQKIKV XKKNGVIPEPSKLPYIKAANENPHHDIRKORASWKSNRWPQ (SEQ ID N° : 116). Os polinucleótidos codificando estes polipéptidos também são divulgados.
Este gene é expresso nas amígdalas e medula óssea.
Por conseguinte, os polinucleótidos e polipéptidos divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios dos sistemas imunitário, hematopoiético e linfático. De um modo semelhante, 27 os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, dos sistemas imunitário, hematopoiético e linfático, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., amígdalas e medula óssea e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular e homologia com proteína de ligação de ADN indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para o tratamento e diagnóstico de distúrbios nos sistemas imunitário, hematopoiético e linfático. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N& 11
Este gene é expresso em células dendríticas e T.
Por conseguinte, os polinucleótidos e polipéptidos, aqui divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios do sistema 28 imunitário. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células dendríticas e células T e outras células e tecido do sistema imunitário e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para o tratamento e diagnóstico de distúrbios do sistema imunitário, particularmente, aqueles envolvendo células dendríticas ou T, tal como inflamação. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N& 12
Este gene é expresso em neutrófilos activados, células endoteliais, células T e, em menor escala, no cérebro e fígado.
Por conseguinte, os polinucleótidos e polipéptidos, aqui divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que 29 incluem, mas não estão limitados a, SIDA, distúrbios imunitários e susceptibilidade a doença infecciosa. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário e pele, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., neutrófilos e outras células sanguíneas, células endoteliais, células T e outras células e tecido do sistema imunitário, cérebro e outro tecido do sistema nervoso e fígado e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 59 como resíduos: Glu-41 a Val-46.
Este produto génico é útil para o diagnóstico e/ou tratamento de uma variedade de distúrbios, incluindo distúrbios hematopoiéticos, distúrbios neurológicos, doença do fígado e distúrbios envolvendo angiogénese. CARACTERISTICAS DE PROTEÍNA CODIFICADA POR GENE Na 13
Este gene é expresso em queratinócitos e, em menor escala, em células endoteliais e placenta. 30
Por conseguinte, os polinucleótidos e polipéptidos da invenção são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, cicatrização comprometida. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, da pele, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., queratinócitos e outras células da pele, células endoteliais e placenta e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nivel de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 60 como resíduos: Pro-35 a Trp-42, Ala-53 a Asp-62 e/ou Arg-103 a Pro-113. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para o tratamento de deficiência de cicatrização e distúrbios de pele. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE Ne 14
Este gene é expresso no rim e, em menor escala, em tecidos embrionários. 31
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, insuficiência renal. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do rim, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., rim, tecido embrionário e outro tecido em rápido desenvolvimento (e. g., em divisão) e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 15
Este gene é expresso principalmente no cérebro e, em menor escala, no fígado.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, depressão, depressão maníaca 32 e outros distúrbios mentais. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema nervoso central, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., cérebro e outro tecido do sistema nervoso e figado e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nivel de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para o tratamento de distúrbios do sistema nervoso central, tais como depressão e outras enfermidades mentais. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE P 16
Este gene é expresso em cérebro fetal e, em menor escala, em placenta, células endoteliais, pulmão fetal e células T.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, restenose, defeitos de 33 nascença e distúrbios imunitários. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema cardiovascular e processo do desenvolvimento, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., placenta, células endoteliais, pulmão e células T e outras células e tecido do sistema imunitário e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 63 como resíduos: Gln-36 a Lys-42 e/ou Glu-89 a
Arg-104. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para o desenvolvimento de agonistas e/ou antagonistas para tratamento de distúrbios do sistema nervoso e desenvolvimento fetal. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE NS 17
Este gene é expresso em hemangiopericitoma e, em menor escala, em tecido fetal. 34
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, hemangiopericitomas e outros cancros, assim como distúrbios do desenvolvimento. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., tecido vascular, tecido pericítico e tecido em desenvolvimento e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 64 como resíduos: Glu-43 a Pro-51, Gly-71 a Arg-82, Pro-96 a Arg-103 e/ou Thr-130 a Gly-140.
Considera-se que os polinucleótidos e polipéptidos relacionados com este gene, são úteis para o tratamento e diagnóstico de tumores, particularmente, hemangiopericitomas e para o tratamento de distúrbios do desenvolvimento. 35 CARACTERISTICAS DE PROTEÍNA CODIFICADA POR GENE Ns 18
Este gene é expresso em fígado fetal e, em menor escala, em cérebro e células T.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios fetais, desenvolvimento fetal e distúrbios imunitários. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema hepático, sistema nervoso e sistema imunitário, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., fígado, cérebro e outro tecido do sistema nervoso e células T e outras células e tecido do sistema imunitário e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para a identificação de agonistas e/ou antagonistas para tratamento de enfermidades mentais, tais como 36 esquizofrenia e depressão. 0 produto génico também pode ser útil para monitorização do desenvolvimento fetal durante a gravidez. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE NS 19
Este gene é expresso em células T e, em menor escala, em cérebro.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, doenças do sistema nervoso central e distúrbios imunitários. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema nervoso central e sistema imunitário, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células T e outras células e tecido do sistema imunitário e cérebro e outro tecido do sistema nervoso e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na 37 SEQ ID N°: 66 como resíduos: Lys-69 a Leu-74, Ser-92 a Phe-97, Asp-109 a Leu-117, Leu-142 a Ser-159, Thr-166 a Glu-183, Ala-191 a Glu-205 e/ou Pro-213 a Glu-220. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para o desenvolvimento de fármacos para tratamento de distúrbios afectando o sistema nervoso central e sistema imunitário. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 20 O produto de tradução deste gene partilha homologia da sequência com uma ORF de C. elegans que parece ser uma proteína transmembranar. (Ver o Acesso Genbank N° 790406). Este contig tem duas deslocações de fase prováveis entre as fases +2 e +3, com base na homologia com o gene de C. elegans. Esta deslocação de fase pode ser facilmente resolvida por sequenciação do clone depositado. Além do mais, este gene mapeia para o cromossoma 8 e, por conseguinte, pode ser utilizado como um marcador em análise de ligação para o cromossoma 8.
Este gene é expresso ubiquamente, incluindo células T e amígdala.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, cancro. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos, são úteis no provimento de sondas imunológicas 38 para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário e sistema endócrino, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células T e outras células e tecido do sistema imunitário, amígdala e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular ubíqua e homologia com uma proteína do tipo transmembranar de C. elegans, indica que o produto proteico deste gene desempenha um papel importante, tanto em vertebrados como invertebrados e é útil para diagnóstico ou tratamento de distúrbios relacionados com este gene. CARACTERISTICAS DE PROTEÍNA CODIFICADA POR GENE N2 21
Este gene é expresso principalmente em células embrionárias e testículos e, em menor escala, em células de ovário, hepatoma, rim, endotélio e músculo liso.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa 39 amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbio metabólico, desenvolvimento embrionário anómalo e tumor. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, dos tecidos embrionários ou vasculares, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., tecido de ovário e outro tecido reprodutor, rim, células endoteliais e células de músculo liso e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nivel de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular e homologia com NADH desidrogenase indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para diagnóstico e/ou tratamento de distúrbios metabólicos, particularmente, envolvendo tecidos embrionários e vasculares. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE Ns 22 0 produto de tradução deste gene partilha homologia da sequência com o receptor adrenérgico alfa 1C que se pensa ser importante na transmissão de sinal neuronal. 40
Este gene é expresso principalmente em nódulo linfático da mama e, em menor escala, em cancro uterino e tumor testicular.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios neurológicos. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, neurológico, nódulo linfático da mama, cancro uterino e testículo, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., tecido da mama, tecido linfóide, tecido uterino e testículo e outro tecido reprodutor e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular e homologia com o receptor adrenérgico alfa 1C, indicam que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para a transmissão de sinais a neurónios. 41 CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 23
O produto de tradução deste gene partilha homologia da sequência com o receptor ligado a proteína G, a qual se pensa ser importante na mediação de uma ampla variedade de funções fisiológicas e pertence a uma superfamília de genes com membros, variando entre receptor de quimiocina e receptor de bradicinina. Este gene também foi recentemente clonado por outro grupo, designando o gene de homólogo do receptor de activação de plaquetas. (Ver o Acesso Genbank N° 2580588). Fragmentos polipeptídicos preferidos compreendem a sequência de aminoácidos: LSIIFLAFVSIDRCLQL (SEQ ID N°: 117) e GSCFAIWAFIQENTNHRCVSIY LINLLTADFLLTLALPVKIWDLGVAPWKLKIFHCQVTACLIYIN (SEQ ID N° : 118). São também preferidos fragmentos polinucleotídicos codificando estes fragmentos polipeptídicos.
Este gene é expresso principalmente em células imunitárias, particularmente, linfócitos.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios de linfócitos e outras células imunitárias. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão 42 deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., linfócitos e outras células e tecido do sistema imunitário e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 70 como resíduos: Asp-59 a
Asn-65, Lys-72 a Trp-79, Tyr-110 a Val-121 e/ou Ala-204 a
Asn-215. A distribuição tecidular e homologia com receptor ligado a proteína G indicam que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis como receptor de quimiocina em linfócitos que regulam resposta imunitária. CARACTERISTICAS DE PROTEÍNA CODIFICADA POR GENE N5 24 O produto de tradução deste gene partilha homologia da sequência com a proteína dissulfureto isomerase, que se pensa ser importante no enrolamento proteico e interacção proteína-proteína. Este gene também partilha homologia com genes tendo domínios de tioredoxina. (Ver o Acesso N° 1943817) . Este gene também mapeia para o cromossoma 9 e, por conseguinte, pode ser útil em análise de ligação como um marcador para o cromossoma 9. 43
Este gene é expresso principalmente em tecidos tumorais e, em menor escala, numa ampla variedade de tecidos normais.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios em virtude de enrolamento proteico inapropriado e interacção proteína-proteína. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do processo tumorigénico, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Epitopos preferidos incluem aqueles compreendendo uma sequência mostrada na SEQ ID N°: 71 como resíduos: Glu- 78 a Asn-83, Asp-91 a Gln-100, Glu-122 a Ser-128, Arg-137 a Pro-143, Asp-157 a Asn-162, Glu-168 a Asn-174, Ser-199 a Gly-206, Pro-213 a Ala-218, Glu-251 a Thr-257, Ser-353 a His-361, Gly-363 a Ala-375, Pro-382 a Phe-387 e/ou Arg-401 a Leu-406. A distribuição tecidular e homologia com a proteína dissulfureto isomerase, indicam que os polinucleótidos e 44 polipéptidos correspondendo a este gene, são úteis para regulação do enrolamento proteico e interacção proteina-proteina em tecidos tumorais. CARACTERÍSTICAS de proteína CODIFICADA POR GENE N2 25
Este gene é expresso principalmente em leucócitos envolvidos em defesa imunitária, incluindo células T, macrófagos, neutrófilos e, em menor escala, em membrana sinovial, tumor de glândula supra-renal, adipose e placenta.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, defeitos ou distúrbios em leucócitos. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, dos sistemas imunitário e de defesa, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., leucócitos e outras células e tecidos do sistema imunitário, membrana sinovial, glândula supra-renal, adipose e placenta e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão 45 génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para regulação da função leucocitária e podem ser utilizados para diagnóstico e tratamento de distúrbios em sistemas imunitários e de defesa. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N® 26
Este gene é expresso numa variedade de tecidos e tipos de células, incluindo cancro do cólon, cancro da mama, neutrófilos, células T, medula espinal, fibroblastos e células endoteliais vasculares.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, cancro, distúrbio e anormalidades em leucócitos e outros tecidos. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, aqueles envolvidos em tumorigénese e sistemas de defesa imunitária, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., cólon, tecido da mama, neutrófilos, células T e 46 outras células sanguíneas, medula espinal e outro tecido do sistema nervoso, células endoteliais, tecido vascular e fibroblastos e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para diagnóstico e tratamento de cancro ou distúrbios do sistema imunitário. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N* 27
0 produto de tradução deste gene partilha homologia da sequência com um polipéptido pancreático de murganho. (Ver o Acesso Genbank N° 200464) . Deste modo, é provável que este gene tenha actividade semelhante à do polipéptido pancreático de murganho. Fragmentos polipeptídicos preferidos compreendem a sequência de aminoácidos: APLETMQNKPRAPQKRALPFPEL ELRDYASVLTRYSLGLRNKEPSLGHRWGTQKLGRSPC (SEQ ID N° : 119). São também preferidos fragmentos polinucleotídicos codificando este fragmento polipeptídico.
Este gene é expresso principalmente em neutrófilos e, em menor escala, em células endoteliais induzidas. 47
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios na adesão de neutrófilos ou leucócitos. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., neutrófilos e outras células sanguíneas e células endoteliais e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para regulação da adesão de neutrófilos ou leucócitos a células endoteliais. Pode ser utilizada para diagnosticar ou tratar distúrbios associados a neutrófilos e células endoteliais vasculares. 48 CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N& 28
Este gene é expresso principalmente em BPH da próstata.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, hipertrofia benigna da próstata. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema urinário masculino, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., próstata e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os polinucleótidos e polipéptidos correspondendo a este gene, são úteis para diagnóstico e tratamento de hipertrofia benigna da próstata ou cancro da próstata. 49 CARACTERÍSTICAS de proteína CODIFICADA POR GENE NS 29 O produto de tradução deste gene partilha homologia da sequência com C16C10.7, um gene de C. elegans semelhante a proteina de dedo de zinco, uma proteína envolvida em ligação de ADN. Deste modo, é esperado que esta proteina partilhe determinadas actividades biológicas com C16C10.7, incluindo actividade de ligação de ADN.
Este gene é expresso principalmente em células τ activadas e, em menor escala, em cérebro fetal, células amnióticas induzidas por TNF e epididimo.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios imunitários ou neurodegenerativos. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido (s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, dos sistemas imunitário e nervoso central, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células T e outras células e tecido do sistema imunitário, cérebro e outro tecido do sistema nervoso, células amnióticas e epididimo e outro tecido reprodutor e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo 50 tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, í. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para o diagnóstico e tratamento de distúrbios imunitários e/ou neurodegenerativos e promoção da sobrevivência e diferenciação de neurónios. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 30
Este gene é expresso principalmente em células T e, em menor escala, na medula óssea.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados, são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, distúrbios imunológicos, incluindo doença auto-imune. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema imunitário, a expressão deste gene a níveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos e tipos de células (e. g., células τ e outras células e tecido do sistema imunitário e medula óssea e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou 51 célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. Pensa-se que este gene mapeia para o cromossoma 4: Mapa de transcrito: WI-11395, Ch.4, D4S395-D4S414; Mapa de ponto branco: WI-11395, Ch.4, 498.0 cR; acessos dbSTS: G21269. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para diagnóstico e tratamento de distúrbios imunologicamente mediados, visto que se pensa que desempenham um papel na proliferação, sobrevivência, diferenciação e/ou activação de uma variedade de células hematopoiéticas, incluindo progenitores precoces ou células estaminais hematopoiéticas. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N2 31
Este gene é expresso principalmente em pele humana.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, cicatrização e cancros de pele. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial dos tecido(s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema tegumentário, a expressão deste gene a níveis 52 significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., pele e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular indica que os produtos proteicos deste gene, são úteis para diagnóstico e tratamento de cancros da pele e cicatrização. CARACTERÍSTICAS DE PROTEÍNA CODIFICADA POR GENE N& 32 0 produto de tradução deste gene partilha homologia da sequência com Pré-albumina de Lágrima humana (Acesso Genbank N° gil307518) e proteína de ligação de Odor de rato (Acesso Genbank N° gil207551), a qual se pensa serem ambas importantes em ligação e transporte moleculares.
Este gene é expresso principalmente no tumor do endométrio.
Por conseguinte, os polinucleótidos e polipéptidos aqui divulgados são úteis como reagentes para identificação diferencial do tecido(s) ou tipo(s) de célula(s) presentes numa amostra biológica e para diagnóstico de doenças e estados que incluem, mas não estão limitados a, cancros do endométrio, pele e sistema hematopoiético. De um modo semelhante, os polipéptidos e anticorpos dirigidos para estes polipéptidos são úteis no provimento de sondas imunológicas para identificação diferencial 53 dos tecido (s) ou tipo(s) de célula(s). Para um determinado número de distúrbios dos tecidos ou células anteriores, particularmente, do sistema hematopoiético, a expressão deste gene a niveis significativamente superiores ou inferiores pode ser rotineiramente detectada em determinados tecidos (e. g., células e tecido do sistema imunitário e endométrio e outro tecido do sistema reprodutor e tecidos cancerosos e feridos) ou fluidos corporais (e. g., soro, plasma, urina, fluido sinovial ou fluido espinal) ou outra amostra de tecido ou célula retirada de um indivíduo tendo um tal distúrbio, relativamente ao nível de expressão génica padrão, i. e., o nível de expressão em tecido ou fluido corporal saudável de um indivíduo não tendo o distúrbio. A distribuição tecidular e homologia com a família génica de ligação e transporte moleculares indicam que os produtos proteicos deste gene, são úteis para o diagnóstico e tratamento de cancros do endométrio e sistema hematopoiético, assim como para o tratamento de distúrbios auto-imunes, tal como inflamação. 54 S- s
Gene N° ID de Clone de ADNc N° e Data de Depósito ATCC Vector NT SEQ ID N°: X Seq. NT Total 5' NT de Seq. de Clone 3' NT de Seq. de Clone 5' NT de Codão de Iniciação 5' NT de Primeiro AA de Pep. Sinal AA SEQ ID N°: Y Primeiro de Pep. Sinal Último AA de Pep. Sinal Primeiro AA de Porção Segregada Último AA de ORF 1 HSVBZ80 209075 05/22/97 Uni-ZAP XR 11 1169 64 1060 162 162 48 1 38 39 145 2 HTAAU21 209075 05/22/97 Uni-ZAP XR 12 1310 1 1310 283 283 49 1 18 19 311 3 HTLEK16 209075 05/22/97 Uni-ZAP XR 13 1139 19 1111 251 50 1 21 22 46 4 HUSIR91 209075 05/22/97 pSportl 14 2271 743 2271 59 59 51 1 23 24 466 4 HUSIR91 209075 05/22/97 pSportl 43 2581 1035 2164 1148 1148 80 1 27 28 207 5 HADMC21 209075 05/22/97 pBluescript 15 626 60 479 91 91 52 1 51 52 82 6 HAGFM45 209075 05/22/97 Uni-ZAP XR 16 2118 1170 2058 1248 1248 53 1 16 17 62 7 HAIBE65 209075 05/22/97 Uni-ZAP XR 17 1076 396 993 528 528 54 1 31 32 123 8 HAQBH57 209075 05/22/97 Uni-ZAP XR 18 1379 420 1306 618 618 55 1 25 26 179 (continuação) 9 9
Gene N° ID de Clone de ADNc N° e Data de Depósito ATCC Vector NI SEQ ID N°: X Seq. NI Total 5' NT de Seq. de Clone 3' NT de Seq. de Clone 5' NT de Codão de Iniciação 5' NI de Primeiro AA de Pep. Sinal AA SEQ ID N°: Y Primeiro de Pep. Sinal Último AA de Pep. Sinal Primeiro AA de Porção Segregada Último AA de ORF 9 HATCX80 209075 05/22/97 Uni-ZAP XR 19 1337 47 1337 199 199 56 1 18 19 286 10 HCFLQ84 209075 05/22/97 pSportl 20 1390 237 1390 410 410 57 1 20 21 33 11 HCFLS78 209075 05/22/97 pSportl 21 1431 178 981 420 420 58 1 21 22 23 12 HTADI12 209075 05/22/97 Uni-ZAP XR 22 2539 69 2539 104 104 59 1 27 28 46 13 HEMCM42 209075 05/22/97 Uni-ZAP XR 23 1041 48 1007 58 58 60 1 29 30 113 14 HEONP72 209075 05/22/97 pSportl 24 1962 1 1947 181 181 61 1 19 20 31 15 HFCDW34 209075 05/22/97 Uni-ZAP XR 25 1228 321 1228 525 525 62 1 24 25 80 16 HTTEU91 209075 05/22/97 Uni-ZAP XR 26 1340 325 1340 15 15 63 1 18 19 103 17 HHGBF89 209075 05/22/97 Lambda ZAP II 27 806 31 806 77 77 64 1 19 20 145 17 HHGBF89 209075 LambdaZAP 45 796 31 796 77 77 82 1 25 26 145 (continuação)
Gene N° ID de Clone de ADNc N° e Data de Depósito ATCC Vector NI SEQ ID N°: X Seq. NI Total 5' NT de Seq. de Clone 3' NT de Seq. de Clone 5' NT de Codão de Iniciação 5' NI de Primeiro AA de Pep. Sinal AA SEQ ID N°: Y Primeiro de Pep. Sinal Último AA de Pep. Sinal Primeiro AA de Porção Segregada Último AA de ORF 05/22/97 II 18 HKIYQ65 209075 05/22/97 pBluescript 28 696 1 684 98 98 65 1 17 18 30 19 HKMLN27 209075 05/22/97 pBluescript 29 1007 71 963 129 129 66 1 23 24 259 20 HKIAC30 209022 05/08/97 Uni-ZAP XR 30 2017 126 2007 161 161 67 1 22 21 HKIXB95 209022 05/08/97 pBluescript 31 699 196 699 230 230 68 1 22 23 26 22 HLMIY86 209022 05/08/97 Lambda ZAP II 32 1264 1 1264 342 69 1 16 17 28 23 HLYAZ61 209022 05/08/97 pSportl 33 997 74 997 205 205 70 1 20 21 215 24 HMQDT36 209022 05/08/97 Uni-ZAP XR 34 1914 37 1897 192 192 71 1 32 33 406 25 HNEDF25 209022 05/08/97 Uni-ZAP XR 35 1020 11 1020 211 72 1 8 26 HNFET17 209022 05/08/97 Uni-ZAP XR 36 781 31 781 100 100 73 1 33 (continuação) 5 8
Gene N° ID de Clone de ADNc N° e Data de Depósito ATCC Vector NT SEQ ID N°: X Seq. NI Total 5' NT de Seq. de Clone 3' NI de Seq. de Clone 5' NI de Codão de Iniciação 5' NT de Primeiro AA de Pep. Sinal AA SEQ ID N°: Y Primeiro de Pep. Sinal Último AA de Pep. Sinal Primeiro AA de Porção Segregada Último AA de ORF 27 HNHCR46 209022 05/08/97 Uni-ZAP XR 37 966 507 948 576 74 1 29 30 56 28 HPWAS91 209022 05/08/97 Uni-ZAP XR 38 416 1 416 95 95 75 1 24 25 25 29 HWTAW41 209022 05/08/97 Uni-ZAP XR 39 1114 804 1114 843 843 76 1 14 30 HBMUT52 209022 05/08/97 Uni-ZAP XR 40 602 142 602 204 204 77 1 26 27 32 31 HERAG83 209022 05/08/97 Uni-ZAP XR 41 970 1 970 110 110 78 1 22 23 22 32 HETFI51 209022 05/08/97 Uni-ZAP XR 42 1002 1 1002 43 43 79 1 21 22 172 32 HETFI51 209022 05/08/97 Uni-ZAP XR 47 981 1 981 23 23 84 1 17 18 30 A Tabela 1 resume a informação correspondendo a cada "Gene N°" anteriormente descrito. A sequência nucleotídica identificada como "NT SEQ ID N°: X" foi agrupada a partir da sequências parcialmente homólogas ("de sobreposição"), obtidas do "ADNc clone ID" identificado na Tabela 1 e, em alguns casos, de clones de adn relacionados adicionais. As sequências de sobreposição foram agrupadas numa única sequência contígua de elevada redundância (habitualmente três a cinco sequências de sobreposição em cada posição de nucleótido), resultando numa sequência final identificada como SEQ ID N°: x. 0 ADNc Clone ID foi depositado na data e dado o correspondente número de depósito listado em "Depósito ATCC N° Z e Data". Alguns dos depósitos contêm múltiplos clones diferentes correspondendo ao mesmo gene. "Vector" refere-se ao tipo de vector contido no ADNc Clone ID. "Seq. NT Total" refere-se ao número total de nucleótidos no contig identificado por "Gene N°". 0 clone depositado pode conter a totalidade ou a maior parte destas sequências, reflectidas pela posição de nucleótido indicada como "5' NT de Seq. de Clone" e a "3' NT de Seq. de Clone" da SEQ ID N°: X. A posição de nucleótido da SEQ ID N°: X do putativo codão de iniciação (metionina) é identificada como "5' NT de Codão de Iniciação". De um modo semelhante, a posição de nucleótido da SEQ ID N°: X da sequência sinal prevista é identificada como "5' NT de Primeiro AA de Pep. Sinal". A sequência de aminoácidos traduzida, iniciando com a metionina, é identificada como "AA SEQ ID N°: Y", embora outras fases de leitura também possam ser facilmente traduzidas utilizando técnicas de biologia molecular conhecidas. 59 A primeira e última posição de aminoácido da SEQ ID N°: Y do péptido sinal previsto, são identificadas como "Primeiro AA de Pep. Sinal" e "Último AA de Pep. Sinal". A primeira posição de aminoácido prevista da SEQ ID N°: Y da porção segregada é identificada como "Primeiro AA Previsto de Porção Segregada". Finalmente, a posição de aminoácido da SEQ ID N°: Y do último aminoácido na fase de leitura aberta é identificada como "Último AA de ORF". A SEQ ID N°: x e a SEQ id N°: Y traduzida são suficientemente precisas e, de outro modo, adequadas para uma variedade de utilizações bem conhecidas na técnica e adicionalmente descritas abaixo. Por exemplo, SEQ ID N°: X é útil para concepção de sondas de hibridação de ácido nucleico que irão detectar sequências de ácido nucleico contidas na SEQ ID N°: X ou o ADNc contido no clone depositado. Estas sondas também irão hibridar com moléculas de ácidos nucleicos em amostras biológicas possibilitando, desse modo, uma variedade de métodos forenses e de diagnóstico da invenção. De um modo semelhante, os polipéptidos identificados da SEQ ID N°: Y podem ser utilizados para produzir anticorpos que se ligam especificamente às proteínas segregadas, codificadas pelos clones de ADNc identificados na Tabela 1. Não obstante, sequências de ADN produzidas por reacções de sequenciação podem conter erros de sequenciação. Os erros existem como nucleótidos erradamente identificados ou como inserções ou deleções de nucleótidos na sequência de ADN produzida. Os nucleótidos erradamente inseridos ou delecionados causam desvios de fase nas fases de leitura da sequência de aminoácidos prevista. Nestes casos, a sequência de aminoácidos prevista diverge da sequência de aminoácidos real, ainda que a 60 sequência de ADN produzida possa ser mais de 99,9% idêntica à sequência de ADN real (por exemplo, inserção ou deleção de uma base numa fase de leitura aberta de mais de 1000 bases).
Consequentemente, para aquelas aplicações requerendo precisão na sequência nucleotídica ou na sequência de aminoácidos, a presente invenção proporciona não apenas a sequência nucleotidica produzida, identificada como SEQ ID N°: 23 e a sequência de aminoácidos traduzida prevista, identificada como SEQ ID N°: 60, mas também uma amostra de ADN plasmídico contendo um ADNc humano da invenção, depositado com a ATCC, como mostrado na Tabela 1. A sequência nucleotidica de cada clone depositado pode ser facilmente determinada através da sequenciação do clone depositado, de acordo com métodos conhecidos. A sequência de aminoácidos prevista pode ser, depois, verificada a partir de tais depósitos. Além do mais, a sequência de aminoácidos da proteína codificada por um clone particular também pode ser directamente determinada por sequenciação peptídica ou através da expressão da proteína numa célula hospedeira adequada, contendo o ADNc humano depositado, recolha da proteína e determinação da sua sequência. A presente invenção também se refere aos genes correspondendo a SEQ ID N°: 23, SEQ ID N°: 60 ou ao clone depositado. O gene correspondente pode ser isolado de acordo com métodos conhecidos, utilizando a informação da sequência aqui divulgada. Tais métodos incluem a preparação de sondas ou iniciadores a partir da sequência divulgada e a identificação ou amplificação do gene correspondente a partir de fontes apropriadas de material genómico. 61 São também proporcionados na presente invenção homólogos de espécie, desde que sejam abrangidos pela reivindicação 1. Os homólogos de espécie podem ser isolados e identificados através da preparação de sondas ou iniciadores adequados, a partir das sequências aqui proporcionadas e do rastreio de uma fonte adequada de ácido nucleico para o homólogo desejado.
Os polipéptidos da invenção podem ser preparados de qualquer modo adequado. Tais polipéptidos incluem polipéptidos de ocorrência natural isolados, polipéptidos recombinantemente produzidos, polipéptidos sinteticamente produzidos ou polipéptidos produzidos por uma combinação destes métodos. Os meios para preparar tais polipéptidos são bem compreendidos na técnica.
Os polipéptidos podem ser na forma de uma proteína segregada, incluindo a forma madura ou podem ser uma parte de uma proteína maior, tal como uma proteína de fusão (ver abaixo). É, frequentemente, vantajoso incluir uma sequência de aminoácidos adicional que contenha sequências secretórias ou condutoras, pro-sequências, sequências que auxiliem na purificação, tais como múltiplos resíduos de histidina ou uma sequência adicional para estabilidade durante produção recombinante.
Os polipéptidos da presente invenção são proporcionados, de um modo preferido, numa forma isolada e, de um modo preferido, são substancialmente purificados. Uma versão recombinantemente produzida de um polipéptido, incluindo o polipéptido segregado, pode ser substancialmente purificada pelo método de uma etapa, descrito em Smith e Johnson, Gene 67:31-40 (1988). Os polipéptidos da invenção também podem ser purificados a partir 62 de fontes naturais ou recombinantes, utilizando anticorpos da invenção deduzidos contra a proteína segregada, em métodos que são bem conhecidos na técnica.
Sequências Sinal
Os métodos para prever se uma proteína tem uma sequência sinal, assim como o ponto de clivagem para essa sequência, estão disponíveis. Por exemplo, o método de McGeoch, virus Res. 3:271-286 (1985), utiliza a informação de uma curta região N-terminal carregada e uma subsequente região não carregada da proteína completa (não clivada). 0 método de von Heinje, Nucleic Acids Res. 14:4683-4690 (1986) utiliza a informação dos resíduos rodeando o sítio de clivagem, tipicamente resíduos -13 a +2, onde +1 indica a extremidade amino da proteína segregada. A exactidão da previsão dos pontos de clivagem de proteínas secretórias de mamífero conhecidas para cada destes métodos é na gama de 75-80%. (von Heinje, supra). Contudo, os dois métodos sem sempre produzem o mesmo ponto(s) de clivagem previsto para uma determinada proteína.
No presente caso, a sequência de aminoácidos deduzida do polipéptido segregado foi analisada por um programa de computador denominado SignalP (Henrik Nielsen et al., Protein Engineering 10:1-6 (1997)) que prevê a localização celular de uma proteína com base na sequência de aminoácidos. Como parte desta previsão computacional de localização, podem ser utilizados os métodos de McGeoch e von Heinje. A análise das sequências de aminoácidos das proteínas segregadas aqui descritas por este programa, proporcionou os resultados mostrados na Tabela 1. 63
Contudo, como um especialista na técnica entenderia, por vezes os sitios de clivagem variam de organismo para organismo e não podem ser previstos com certeza absoluta. Consequentemente, a presente invenção proporciona polipéptidos segregados, tendo uma sequência mostrada na SEQ ID N°: 60, que tem uma extremidade N iniciando dentro de 5 residuos (í. e., + ou - 5 residuos) do ponto de clivagem previsto. De um modo semelhante, também é reconhecido que, em alguns casos, a clivagem da sequência sinal de uma proteína segregada não é inteiramente uniforme, resultando em mais de uma espécie segregada. Estes polipéptidos e os polinucleótidos codificando tais polipéptidos são contemplados pela presente invenção.
Além do mais, a sequência sinal identificada pela análise anterior pode não prever necessariamente a sequência sinal de ocorrência natural. Por exemplo, a sequência sinal de ocorrência natural pode ser mais a montante da sequência sinal prevista. Contudo, é provável que a sequência sinal prevista seja capaz de dirigir a proteína segregada para o ER. Estes polipéptidos e os polinucleótidos codificando tais polipéptidos são contemplados pela presente invenção.
Variantes Polinucleotídicos e Polipeptídicos "Variante", refere-se a um polinucleótido ou polipéptido diferindo do polinucleótido ou polipéptido da presente invenção, mas retendo as suas propriedades essenciais. Em geral, os variantes são, em geral, estreitamente semelhantes e, em muitas regiões, idênticos ao polinucleótido ou polipéptido da presente invenção. 64
Por um polinucleótido tendo uma sequência nucleotídica, pelo menos, por exemplo, 95% "idêntica" a uma sequência nucleotidica de referência da presente invenção, significa que a sequência nucleotidica do polinucleótido é idêntica à sequência de referência, com a excepção de que a sequência polinucleotidica pode incluir até cinco mutações pontuais por cada 100 nucleótidos da sequência nucleotidica de referência codificando o polipéptido. Por outras palavras, de modo a obter-se um polinucleótido tendo uma sequência nucleotidica, pelo menos, 95% idêntica a uma sequência nucleotidica de referência, até 5% dos nucleótidos na sequência de referência podem ser delecionados ou substituídos com outro nucleótido, ou um número de nucleótidos até 5% dos nucleótidos totais na sequência de referência pode ser inserido dentro da sequência de referência. A sequência de pesquisa pode ser uma sequência integral mostrada na Tabela 1, a ORF (fase de leitura aberta) ou qualquer fragmento especificado, como aqui se descreve.
Na prática, se qualquer molécula particular de ácido nucleico ou polipéptido for, pelo menos, 90%, 95%, 96%, 97%, 98% ou 99% idêntica a uma sequência nucleotídica da presença invenção, pode ser determinada de um modo convencional, utilizando programas de computador conhecidos. Um método preferido para determinar a melhor correspondência global entre uma sequência de pesquisa (uma sequência da presente invenção) e uma sequência submetida, também referido como um alinhamento da sequência global, pode ser determinado utilizando o programa de computador FASTDB, com base no algoritmo de Brutlag et al. {Comp. App. Biosci. (1990) 6:237-245). Num alinhamento da sequência, as sequências de pesquisa e submetida são ambas sequências de ADN. Uma sequência de ARN pode ser comparada 65 através da conversão de U em T. 0 resultado do referido alinhamento da sequência global é em percentagem de identidade. Os parâmetros preferidos utilizados num alinhamento FASTDB das sequências de ADN para calcular a percentagem de identidade são: Matriz=Unitária, k-tuplo=4, Penalidade de Erro-de-Emparelhamento=l, Penalidade de Junção=30, Comprimento de Grupo de Aleatorização=0, Pontuação de Exclusão=l, Penalidade de Lacuna=5, Penalidade de Tamanho de Lacuna=0,05, Tamanho de Janela=500 ou o comprimento da sequência nucleotidica submetida, consoante o que for mais pequeno.
Se a sequência submetida for mais curta do que a sequência de pesquisa, em virtude de deleções 5' ou 3', não em virtude de deleções internas, deve ser realizada uma correcção manual aos resultados. Isso acontece em virtude de o programa FASTDB não ter em conta truncamentos 5' e 3' da sequência submetida, quando se calcula a percentagem de identidade. Para sequências submetidas truncadas nas extremidades 5' ou 3', relativamente à sequência de pesquisa, a percentagem de identidade é correlacionada através do cálculo do número de bases da sequência de pesquisa que estão 5' e 3' da sequência submetida, que não são correspondentes/alinhadas, como uma percentagem das bases totais da sequência de pesquisa. Se um nucleótido é correspondente/alinhado, é determinado por resultados do alinhamento da sequência FASTDB. Esta percentagem é, depois, subtraída da percentagem de identidade, calculada pelo programa FASTDB anterior, utilizando os parâmetros especificados, de modo a chegar a uma pontuação de percentagem de identidade final. Esta pontuação corrigida é aquilo que é utilizado para efeitos da presente invenção. Apenas as bases fora das bases 5' e 3' da sequência submetida, como exibidas pelo alinhamento FASTDB, que não são correspondentes/alinhadas com a sequência de pesquisa, 66 são calculadas para efeitos de ajuste manual da pontuação de percentagem de identidade.
Por exemplo, uma sequência submetida de 90 bases é alinhada a uma sequência de pesquisa de 100 bases, de modo a determinar a percentagem de identidade. As deleções ocorrem na extremidade 5' da sequência submetida e, por conseguinte, o alinhamento FASTDB não mostra uma correspondência/alinhamento das primeiras 10 bases na extremidade 5'. As 10 bases desemparelhadas representam 10% da sequência (número de bases nas extremidades 5' e 3' não correspondentes/número total de bases na sequência de pesquisa), portanto subtrai-se 10% da pontuação de percentagem de identidade calculada pelo programa FASTDB. Se as restantes 90 bases fossem perfeitamente correspondentes, a percentagem de identidade final seria 90%. Noutro exemplo, uma sequência submetida de 90 bases é comparada com uma sequência de pesquisa de 100 bases. Desta vez, as deleções são deleções internas, de modo que não existam bases em 5' ou 3' da sequência submetida que não sejam correspondentes/alinhadas com a pesquisa. Neste caso, a percentagem de identidade calculada por FASTDB não é manualmente corrigida. Mais uma vez, apenas bases 5' e 3' da sequência submetida que não são correspondentes/alinhadas com a sequência de pesquisa são manualmente corrigidas. Para efeitos da presente invenção, não devem ser realizadas outras correcções manuais.
Por um polipéptido tendo uma sequência de aminoácidos, pelo menos, por exemplo, 95% "idêntica" a uma sequência de aminoácidos de pesquisa da presente invenção, significa que a sequência de aminoácidos do polipéptido submetido é idêntica à sequência de pesquisa, com a excepção de que a sequência polipeptidica submetida, pode incluir até cinco alterações de 67 aminoácidos por cada 100 aminoácidos da sequência de aminoácidos de pesquisa. Por outras palavras, de modo a obter-se um polipéptido tendo uma sequência de aminoácidos, pelo menos, 95% idêntica a uma sequência de aminoácidos de pesquisa, até 5% dos resíduos de aminoácidos na sequência submetida, podem ser inseridos, delecionados (indels) ou substituídos com outros aminoácidos. Estas alterações da sequência de referência podem ocorrer nas posições amino ou carboxilo terminais da sequência de aminoácidos de referência ou em qualquer parte entre aquelas posições terminais, dispersas individualmente entre resíduos na sequência de referência ou em um ou mais grupos contíguos dentro da sequência de referência.
Na prática, se qualquer polipéptido particular for, pelo menos, 90%, 95%, 96%, 97%, 98% ou 99% idêntico, por exemplo, à sequência de aminoácidos mostrada na Tabela 1 ou à sequência de aminoácidos codificada por ADN depositado, o clone pode ser determinado de um modo convencional, utilizando programas de computador conhecidos. Um método preferido para determinar a melhor correspondência global entre uma sequência de pesquisa (uma sequência da presente invenção) e uma sequência submetida, também referido como um alinhamento da sequência global, pode ser determinado utilizando o programa de computador FASTDB, com base no algoritmo de Brutlag et al. (Comp. App. Biosci. (1990) 6:237-245). Num alinhamento da sequência, as sequências de pesquisa e submetida ou são ambas sequências nucleotídicas ou ambas sequências de aminoácidos. O resultado do referido alinhamento da sequência global é em percentagem de identidade. Parâmetros preferidos utilizados num alinhamento de aminoácidos FASTDB são: Matriz=PAM, k-tuplo=2, Penalidade de Erro-de-Emparelhamento=l, Penalidade de Junção=20, Comprimento de Grupo de Aleatorização=0, Pontuação de Exclusão=l, Tamanho de 68
Janela=comprimento da sequência, Penalidade de Lacuna=5, Penalidade de Tamanho de Lacuna=0,05 Tamanho de Janela=500 ou o comprimento da sequência de aminoácido submetida, consoante o que for mais pequeno.
Se a sequência submetida for mais curta do que a sequência de pesquisa, em virtude de deleções N-terminais ou C-terminais, não em virtude de deleções internas, deve ser realizada uma correcção manual aos resultados. Isso acontece em virtude do programa FASTDB não ter em conta truncamentos N-terminais ou C-terminais da sequência submetida, quando se calcula a percentagem de identidade global. Para sequências submetidas truncadas nas extremidades N e C, relativamente à sequência de pesquisa, a percentagem de identidade é correlacionada através do cálculo do número de residuos da sequência de pesquisa que estão N-terminal e C-terminal da sequência submetida, que não são correspondentes/alinhados com um correspondente resíduo submetido, como uma percentagem das bases totais da sequência de pesquisa. Se um resíduo é correspondente/alinhado, é determinado por resultados do alinhamento da sequência FASTDB. Esta percentagem é, depois, subtraída da percentagem de identidade, calculada pelo programa FASTDB anterior, utilizando os parâmetros especificados, de modo a chegar a uma pontuação de percentagem de identidade final. Esta pontuação de percentagem de identidade final é aquilo que é utilizado para efeitos da presente invenção. Apenas os resíduos para as extremidades N e C da sequência submetida que não são correspondentes/alinhados com a sequência de pesquisa, são considerados para efeitos de ajuste manual da pontuação de percentagem de identidade, isto é, apenas as posições de resíduos de pesquisa fora dos resíduos N-terminais e C-terminais mais distantes da sequência submetida. 69
Por exemplo, uma sequência submetida de 90 resíduos de aminoácidos é alinhada a uma sequência de pesquisa de 100 resíduos, de modo a determinar a percentagem de identidade. A deleção ocorre na extremidade N da sequência submetida e, por conseguinte, o alinhamento FASTDB não mostra uma correspondência/alinhamento dos primeiros 10 resíduos na extremidade N. Os 10 resíduos desemparelhados representam 10% da sequência (número de resíduos nas extremidades N e C não correspondentes/número total de resíduos na sequência de pesquisa), portanto subtrai-se 10% da pontuação de percentagem de identidade calculada pelo programa FASTDB. Se os restantes 90 resíduos fossem perfeitamente correspondentes, a percentagem de identidade final seria 90%. Noutro exemplo, uma sequência submetida de 90 resíduos é comparada com uma sequência de pesquisa de 100 resíduos. Desta vez, as deleções são deleções internas, de modo que não existam resíduos na extremidade N ou C da sequência submetida que não sejam correspondentes/alinhados com a pesquisa. Neste caso, a percentagem de identidade calculada por FASTDB não é manualmente corrigida. Mais uma vez, apenas as posições de resíduos fora das extremidades N-terminais e C-terminais da sequência submetida, como exibido no alinhamento FASTDB, que não são correspondentes/alinhadas com a sequência de pesquisa, são manualmente corrigidas. Para efeitos da presente invenção, não devem ser realizadas outras correcções manuais.
Os variantes podem conter alterações nas regiões codificantes, regiões não codificantes ou ambas. São especialmente preferidos variantes polinucleotídicos contendo alterações que produzem substituições silenciosas, adições ou deleções, mas não alteram as propriedades ou actividades do polipéptido codificado. São preferidos os variantes 70 nucleotídicos produzidos por substituições silenciosas em virtude da degenerescência do código genético. Além do mais, também são preferidos os variantes nos quais 5-10, 1-5 ou 1-2 aminoácidos são substituídos, delecionados ou adicionados em qualquer combinação. Os variantes polinucleotídicos podem ser produzidos por uma variedade de razões, e. g., optimizar a expressão de codão para um hospedeiro particular (alterar codões no ARNm humano para aqueles preferidos por um hospedeiro bacteriano, tal como E. coli).
Os variantes de ocorrência natural são denominados "variantes alélicos" e referem-se a uma de várias formas alternativas de um gene ocupando um determinado lócus num cromossoma de um organismo. (Genes II, Lewin, B., ed., John Wiley & Sons, Nova Iorque (1985)). Estes variantes alélicos podem variar ao nível polinucleotídico e/ou polipeptídico. Alternativamente, os variantes de ocorrência não natural podem ser produzidos por técnicas de mutagénese ou por síntese directa.
Utilizando métodos conhecidos de engenharia de proteínas e tecnologia de ADN recombinante, podem ser gerados variantes para melhorar ou alterar as características dos polipéptidos da presente invenção. Por exemplo, podem ser delecionados um ou mais aminoácidos da extremidade N ou extremidade C da proteína segregada, sem perda substancial de função biológica. Os autores de Ron et al., J. Biol. Chem. 268: 2984-2988 (1993), referiram proteínas KGF variantes tendo actividade de ligação de heparina, mesmo após deleção de 3, 8 ou 27 resíduos de aminoácidos amino-terminais. De um modo semelhante, o interferão gama exibiu actividade até dez vezes superior, após deleção de 8-10 resíduos 71 de aminoácidos da extremidade carboxilo desta proteína. (Dobeli et al.r J. Biotechnology 7:199-216 (1988)).
Além do mais, a ampla evidência demonstra que os variantes retêm, frequentemente, uma actividade biológica semelhante àquela da proteína de ocorrência natural. Por exemplo, Gayle e colaboradores (J. Biol. Chem 268:22105-22111 (1993)) conduziram extensa análise mutacional da citocina humana IL-la. Utilizaram mutagénese aleatória para produzir mais de 3500 mutantes de IL-la individuais que perfaziam uma média de 2,5 alterações de aminoácidos por variante, ao longo de todo o comprimento da molécula. Foram examinadas múltiplas mutações em cada posição possível de aminoácido. Os investigadores verificaram que "a maior parte da molécula poderia ser alterada com pouco efeito quer sobre [ligação ou actividade biológica]". (Ver, Resumo). De facto, apenas 23 sequências de aminoácidos únicas, de mais de 3500 sequências nucleotídicas examinadas, produziram uma proteína que diferiam significativamente em actividade das de tipo selvagem.
Além disso, mesmo se a deleção de um ou mais aminoácidos da extremidade N ou extremidade C de um polipéptido resultar em modificação ou perda de uma ou mais funções biológicas, podem ser ainda retidas outras actividades biológicas. Por exemplo, a capacidade de um variante de deleção induzir e/ou ligar-se a anticorpos que reconhecem a forma segregada, será provavelmente retida, quando menos do que a maioria dos resíduos da forma segregada for removida da extremidade N ou extremidade C. Se um polipéptido particular, desprovido de resíduos N-terminais ou C-terminais de uma proteína, retém tais actividades imunogénicas pode ser facilmente determinado por métodos de rotina aqui descritos e, de outro modo, conhecidos na técnica. 72
Assim, a invenção inclui, adicionalmente, variantes polipeptídicos dentro dos âmbitos das reivindicações que mostram actividade biológica substancial. Tais variantes incluem deleções, inserções, inversões, repetições e substituições, seleccionadas de acordo com regras gerais conhecidas na técnica, de modo a terem pouco efeito sobre actividade. Por exemplo, orientação que diz respeito ao modo como preparar substituições de aminoácidos fenotipicamente silenciosas é proporcionada em Bowie, J. U. et al., Science 247:1306-1310 (1990), em que os autores indicam que existem duas estratégias principais para estudar a tolerância à alteração de uma sequência de aminoácidos. A primeira estratégia explora a tolerância de substituições de aminoácidos por selecção natural durante o processo de evolução. Através da comparação das sequências de aminoácidos em diferentes espécies, podem ser identificados aminoácidos conservados. É provável que estes aminoácidos conservados sejam importantes para a função de proteína. Em contraste, as posições de aminoácido onde as substituições foram toleradas por selecção natural indicam que estas posições não são críticas para a função de proteína. Deste modo, posições tolerando substituição de aminoácido poderiam ser modificadas mantendo ainda, simultaneamente, a actividade biológica da proteína. A segunda estratégia utiliza a engenharia genética para introduzir alterações de aminoácidos em posições específicas de um gene, clonado para identificar regiões críticas para função de proteína. Por exemplo, pode ser utilizada mutagénese dirigida pontual ou mutagénese de rastreio de alanina (introdução de mutações de alanina únicas em cada resíduo na molécula). (Cunningham e Wells, Science 244:1081-1085 (1989)). As moléculas 73 mutantes resultantes podem ser, depois, testadas para actividade biológica.
Como afirmam os autores, estas duas estratégias revelaram que as proteínas são surpreendentemente tolerantes a substituições de aminoácidos. Os autores indicam, adicionalmente, que alterações de aminoácidos são susceptíveis de ser permissivas a determinadas posições de aminoácidos na proteína. Por exemplo, os resíduos de aminoácidos mais profundos (dentro da estrutura terciária da proteína) requerem cadeias laterais não polares, enquanto a poucas características de cadeias laterais de superfície são, em geral, conservadas. Além do mais, as substituições de aminoácidos conservativas toleradas envolvem a substituição dos aminoácidos alifáticos ou hidrófobos Ala, Vai, Leu e Ile; substituição dos resíduos hidroxilos Ser e Thr; substituição dos resíduos acídicos Asp e Glu; substituição dos resíduos de amida Asn e Gin, substituição dos resíduos básicos Lys, Arg e His; substituição dos resíduos aromáticos Phe, Tyr e Trp e substituição dos aminoácidos de pequeno tamanho Ala, Ser, Thr, Met e Gly. Além da substituição conservativa de aminoácido, os variantes da presente invenção, como definidos nas reivindicações, incluem (i) substituições com um ou mais dos resíduos de aminoácidos não conservados, onde os resíduos de aminoácidos substituídos podem ou não ser um codificado pelo código genético, ou (ii) substituição com um ou mais de resíduos de aminoácidos tendo um grupo substituinte, ou (iii) fusão do polipéptido maduro com outro composto, tal como um composto para aumentar a estabilidade e/ou solubilidade do polipéptido (por exemplo, polietilenoglicol) ou (iv) fusão do polipéptido com aminoácidos adicionais, tal como uma região peptídica de fusão IgG Fc, ou sequência condutora ou secretória ou uma sequência facilitando purificação. Considera-se que tais polipéptidos 74 variantes estão dentro do conhecimento dos especialistas na técnica, a partir dos presentes ensinamentos.
Por exemplo, variantes polipeptidicos, contendo substituições de aminoácidos, de aminoácidos carregados com outros aminoácidos carregados ou neutros, podem produzir proteínas com características melhoradas, tal como menos agregação. A agregação de formulações farmacêuticas reduz a actividade e aumenta a depuração, em virtude da actividade imunogénica do agregado. (Pinckard et al., Clin. Exp. immunol. 2:331-340 (1967); Robbins et al., Diabetes 36: 838-845 (1987); Cleland et al., Crit. Rev. Therapeutic Drug Carrier Systems 10:307-377 (1993)).
Fragmentos Polinucleotídicos e Polipeptidicos
Na presente descrição, um "fragmento polinucleotídico" refere-se a um curto polinucleótido tendo uma sequência de ácido nucleico contida no clone depositado ou mostrada na SEQ ID N°: 23. Os curtos fragmentos nucleotídicos têm, pelo menos, cerca de 15 nt, pelo menos, cerca de 20 nt, pelo menos, cerca de 30 nt ou, pelo menos, cerca de 40 nt em comprimento. Pretende-se que um fragmento "pelo menos, 20 nt em comprimento", por exemplo, inclua 20 ou mais bases contíguas da sequência de ADNc contida no clone depositado ou na sequência nucleotídica mostrada na SEQ ID N°: 23. Estes fragmentos nucleotídicos são úteis como sondas e iniciadores de diagnóstico, como aqui discutido. Fragmentos maiores (e. g., 150, 500, 600 nucleótidos) são parte da invenção. 75
Além do mais, exemplos representativos de fragmentos polinucleotídicos da descrição incluem, por exemplo, fragmentos tendo uma sequência de cerca do nucleótido número 1-50, 51-100, 101-150, 151-200, 201-250, 251-300, 301-350, 351-400, 401-450, 451-500, 501-550, 551-600, 651-700, 701-750, 751-800, 800-850, 851-900, 901-950 ou 951-1000 da SEQ ID N°: 23 ou do ADNc contido no clone depositado. Neste contexto "cerca de" inclui as gamas particularmente, enumeradas, maiores ou menores, em vários (5, 4, 3, 2 ou 1) nucleótidos, numa das extremidades ou em ambas as extremidades. De um modo preferido, estes fragmentos codificam um polipéptido que tem actividade biológica. De um modo mais preferido, estes polinucleótidos podem ser utilizados como sondas ou iniciadores, como aqui discutido.
Na presente descrição, um "fragmento polipeptídico" refere-se a uma curta sequência de aminoácidos contida na SEQ ID N°: 60 ou codificada pelo ADNc contido no clone depositado. Fragmentos de proteína podem ser "independentes", ou compreendidos dentro de um polipéptido maior, do qual o fragmento forma uma parte ou região, de um modo muito preferido, como uma única região contígua. Exemplos representativos de fragmentos polipeptidicos da descrição incluem, por exemplo, fragmentos de cerca do aminoácido número 1-20, 21-40, 41-60, 61-80 ou 81-100. Além do mais, os fragmentos polipeptidicos da invenção podem ter cerca de 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 ou 150 aminoácidos em comprimento. Neste contexto "cerca de" inclui as gamas particularmente, enumeradas, maiores ou menores, em vários (5, 4, 3, 2 ou 1) aminoácidos, num dos extremos ou em ambos os extremos.
Fragmentos polipeptidicos preferidos incluem a proteína segregada, assim como a forma madura. Fragmentos polipeptidicos 76 preferidos adicionais, incluem a proteína segregada ou a forma madura, tendo uma série contínua de resíduos delecionados da extremidade amino ou da extremidade carboxilo, ou ambas. Por exemplo, qualquer número de aminoácidos, variando entre 1-60, pode ser delecionado da extremidade amino, quer do polipéptido segregado ou da forma madura. De um modo semelhante, qualquer número de aminoácidos, variando entre 1-30, pode ser delecionado da extremidade carboxilo da proteína segregada ou forma madura. Além disso, é preferida qualquer combinação das deleções de extremidade amino e carboxilo anteriores. De um modo semelhante, são também preferidos fragmentos polinucleotídicos codificando estes fragmentos polipeptídicos. São também preferidos fragmentos polipeptídicos e polinucleotídicos, caracterizados por domínios estruturais ou funcionais, tais como fragmentos que compreendem hélice alfa e regiões de formação de hélice alfa, folha beta e regiões de formação de folha beta, dobra e regiões de formação de dobra, espiral e regiões de formação de espiral, regiões hidrófilas, regiões hidrófobas, regiões anfifílicas alfa, regiões anfifílicas beta, regiões flexíveis, regiões de formação de superfície, regiões de ligação de substrato e regiões de elevado índice antigénico. Os fragmentos polipeptídicos da SEQ ID N°: 60 abrangidos por domínios conservados estão especificamente contemplados pela presente invenção. Além do mais, também estão contemplados fragmentos polinucleotídicos codificando estes domínios.
Outros fragmentos preferidos são os fragmentos biologicamente activos. Fragmentos biologicamente activos são aqueles exibindo actividade semelhante, mas não necessariamente idêntica, a uma actividade do polipéptido da presente invenção. 77 A actividade biológica dos fragmentos pode incluir uma actividade desejada melhorada ou uma actividade indesejável diminuída.
Epitopos & Anticorpos
Na presente descrição, "epitopos" refere-se a fragmentos polipeptídicos tendo actividade antigénica ou imunogénica num animal, especialmente num humano. Uma forma de realização preferida de um fragmento polipeptidico da presente invenção, refere-se a fragmentos compreendendo um epitopo. Consequentemente, são igualmente preferidos polinucleótidos da presente invenção codificando tais fragmentos. Uma região de uma molécula de proteína à qual um anticorpo se pode ligar é definida como um "epitopo antigénico". Em contraste, um "epitopo imunogénico" é definido como uma parte de uma proteína que deduz uma resposta de anticorpo. (Ver, por exemplo, Geysen et al., Proc. Natl. Acad. Sei. USA 81:3998- 4002 (1983)).
Os fragmentos que funcionam como epitopos podem ser produzidos por qualquer meio convencional. (Ver, e. g., Houghten, R. A., Proc. Natl. Acad. Sei. USA 82:5131-5135 (1985), adicionalmente descrito na Patente U.S. N° 4631211).
Na presente descrição, epitopos antigénicos contêm, de um modo preferido, uma sequência de, pelo menos, sete, de um modo mais preferido, pelo menos, nove e, de um modo muito preferido, entre cerca de 15 a cerca de 30 aminoácidos. Os epitopos antigénicos são úteis para deduzir anticorpos, incluindo anticorpos monoclonais que se ligam especificamente ao epitopo. 78 (Ver, por exemplo, Wilson et al., Cell 37:767-778 (1984); Sutcliffe, J. G. et al., Science 219:660-666 (1983)).
De um modo semelhante, os epitopos imunogénicos podem ser utilizados para induzir anticorpos de acordo com métodos bem conhecidos na técnica. (Ver, por exemplo, Sutcliffe et al., supra; Wilson et al., supra; Chow, M. et al., Proc. Natl. Acad. Sei. USA 82:910-914; e Bittle, F. J. et al., J. Gen. Virol. 66:2347-2354 (1985)). Um epitopo imunogénico preferido inclui a proteína segregada. Os epitopos imunogénicos podem ser apresentados juntamente com uma proteína transportadora, tal como uma albumina, a um sistema animal (tal como coelho ou murganho) ou, se forem suficientemente compridos (pelo menos, cerca de 25 aminoácidos), sem um transportador. Contudo, foi mostrado que epitopos imunogénicos compreendendo apenas 8 a 10 aminoácidos são suficientes para deduzir anticorpos capazes de se ligarem, no mínimo, a epitopos lineares num polipéptido desnaturado (e. g., numa transferência de Western).
Como aqui utilizado, o termo "anticorpo" (Ab) ou "anticorpo monoclonal" (Mab), tenciona incluir moléculas intactas, assim como fragmentos de anticorpo (tais como, por exemplo, fragmentos Fab e F(ab')2) que são capazes de se ligarem especificamente a proteína. Os fragmentos Fab e F(ab')2 carecem do fragmento Fc de anticorpo intacto, são depurados mais rapidamente da circulação e podem ter menos ligação tecidular não específica do que um anticorpo intacto. (Wahl et al., J. Nucl. Med. 24:316-325 (1983)). Deste modo, estes fragmentos são preferidos, assim como os produtos de um fab ou outra biblioteca de expressão de imunoglobulina. Além do mais, os anticorpos da presente invenção incluem anticorpos quiméricos, de cadeia simples e humanizados. 79
Proteínas de Fusão
Qualquer polipéptido da presente invenção pode ser utilizado para produzir proteínas de fusão. Por exemplo, o polipéptido da presente invenção, quando fundido a uma segunda proteína, pode ser utilizado como uma cauda antigénica. Os anticorpos deduzidos contra o polipéptido da presente invenção podem ser utilizados para detectar indirectamente a segunda proteína, através de ligação ao polipéptido. Além do mais, em virtude das proteínas segregadas visarem localizações celulares com base em sinais de tráfego, os polipéptidos da presente invenção podem ser utilizados como moléculas de direccionamento, uma vez fundidas a outras proteínas.
Exemplos de domínios que podem ser fundidos a polipéptidos da presente invenção incluem, não apenas sequências sinal heterólogas, mas também outras regiões funcionais heterólogas. A fusão não necessita necessariamente de ser directa mas pode ocorrer por meio das sequências liganteas.
Além do mais, as proteínas de fusão também podem ser manipuladas, do modo a melhorar características do polipéptido da presente invenção. Por exemplo, uma região de aminoácidos adicionais, particularmente, aminoácidos carregados, pode ser adicionada à extremidade N de um polipéptido, de modo a melhorar a estabilidade e persistência durante a purificação da célula hospedeira ou manipulação e armazenamento subsequentes. Igualmente, podem ser adicionadas fracções peptidicas ao polipéptido, de modo a facilitar a purificação. Tais regiões podem ser removidas antes da preparação final do polipéptido. A adição de fracções peptidicas para facilitar a manipulação dos polipéptidos são técnicas familiares e de rotina na matéria. 80
Além do mais, os polipéptidos da presente invenção, incluindo fragmentos e, especificamente, epitopos, podem ser combinados com partes do domínio constante de imunoglobulinas (IgG), resultando em polipéptidos quiméricos. Estas proteínas de fusão facilitam a purificação e mostram uma meia-vida aumentada in vivo. Um exemplo referido descreve proteínas quiméricas, consistindo nos primeiros dois domínios do polipéptido CD4 humano e diversos domínios das regiões constantes das cadeias pesada ou leve de imunoglobulinas de mamífero. (documento EP A 394827; Traunecker et al., Nature 331:84-86 (1988)).
Proteínas de fusão tendo estruturas diméricas ligadas por dissulfureto (em virtude da IgG) também podem ser mais eficientes na ligação e neutralização de outras moléculas do que a proteína, ou fragmento de proteína, monomérica segregada isoladamente. (Fountoulakis et al., J. Biochem. 270:3958-3964 (1995) ) .
De um modo semelhante, o documento EP-A-0464533 (documento equivalente no Canadá 2045869) divulga proteínas de fusão, compreendendo diversas porções de região constante de moléculas de imunoglobulina, juntamente com outra proteína humana ou sua parte. Em muitos casos, a parte Fc numa proteína de fusão é benéfica em terapia e diagnóstico e, deste modo, pode resultar, por exemplo, em propriedades farmacocinéticas melhoradas, (documento EP-A 0232262). Alternativamente, a deleção da parte Fc seria desejada, depois da proteína de fusão ter sido expressa, detectada e purificada. Por exemplo, a porção Fc pode impedir terapia e diagnóstico, se a proteína de fusão for utilizada como um antigénio para imunizações. Na descoberta de fármacos, por exemplo, proteínas humanas, tal como hIL-5, foram fundidas com porções Fc, para efeitos de ensaios de rastreio de alta capacidade, de modo a identificar antagonistas de hIL-5. 81 J. Molecular Recognition 8:52-58 (Ver, D. Bennett et al., (1995); K. Johanson et al., J. Biol. Chem. 270:9459-9471 (1995) ) .
Além do mais, os polipéptidos da presente invenção podem ser fundidos a sequências marcadoras, tal como um péptido que facilite a purificação do polipéptido fundido. Em formas de realização preferidas, a sequência de aminoácidos marcadora é um péptido hexa-histidina, tal como a cauda tag proporcionada num vector pQE (QIAGEN, Inc., 9259 Eton Avenue, Chatsworth, CA, 91311), entre outros, muitos dos quais estão comercialmente disponíveis. Como descrito em Gentz et al., Proc. Natl. Acad. Sei. USA 86:821-824 (1989), por exemplo, hexa-histidina proporciona purificação conveniente da proteína de fusão. Outra cauda peptídica útil para purificação, a cauda "HA", corresponde a um epitopo derivado da proteína hemaglutinina de influenza. Brooks et al., Cell, 37: 767 (1984).
Deste modo, qualquer destas fusões anteriores pode ser manipulada utilizando os polinucleótidos ou os polipéptidos da presente invenção.
Produção de Vectores, Células Hospedeiras e Proteína A presente invenção também se refere a vectores contendo o polinucleótido da presente invenção, células hospedeiras e a produção de polipéptidos por técnicas recombinantes. O vector pode ser, por exemplo, um fago, plasmídeo, virai ou vector retroviral. Os vectores retrovirais podem ser de replicação competente ou de replicação defeituosa. No último caso, a 82 propagação virai irá ocorrer, em geral, apenas em células hospedeiras de complementação.
Os polinucleótidos podem ser ligados a um vector contendo um marcador seleccionável para propagação num hospedeiro. Em geral, um vector plasmídico é introduzido num precipitado, tal como um precipitado de fosfato de cálcio ou num complexo com um lipido carregado. Se o vector for um virus, pode ser empacotado in vitro, utilizando uma linha celular de empacotamento apropriada e, depois, transduzido dentro de células hospedeiras. 0 inserto polinucleotidico deve ser operativamente ligado a um promotor apropriado, tal como o promotor PL do fago lambda, os promotores de E. coli lac, trp, phoA e tac, os promotores precoces e tardios de SV40 e promotores de LTRs retrovirais, para nomear alguns. Outros promotores adequados serão conhecidos do especialista na técnica. As construções de expressão irão, adicionalmente, conter sítios para iniciação de transcrição, terminação e, na região transcrita, um sítio de ligação de ribossoma para tradução. A porção codificante dos transcritos expressos pelas construções irá incluir, de um modo preferido, um codão de iniciação de tradução no início e um codão de terminação (UAA, UGA ou UAG) apropriadamente posicionado na extremidade do polipéptido, de modo a ser traduzido.
Como indicado, os vectores de expressão irão, de um modo preferido, incluir, pelo menos, um marcador seleccionável. Tais marcadores incluem resistência de di-hidrofolato redutase, G418 ou neomicina, para cultura celular eucariótica e genes de resistência a tetraciclina, canamicina ou ampicilina para cultivo em E. coli e outras bactérias. Exemplos representativos de hospedeiros apropriados incluem, mas não estão limitados a, 83 células bacterianas, tais como células de E. coli, Streptomyces e Salmonella typhimurium; células fúngicas, tal como células de levedura; células de insecto, tais como células de Drosophila S2 e Spodoptera Sf9; células animais, tais como CHO, COS, 293 e células de melanoma de Bowes; e células vegetais. São conhecidos na técnica meios de cultura e condições apropriadas para as células hospedeiras anteriormente descritas.
De entre os vectores preferidos para utilização em bactérias incluem-se pQE70, pQE60 e pQE-9, disponíveis a partir de QIAGEN, Inc.; vectores pBluescript, vectores Phagescript, pNH8A, pNH16a, pNHl8A, pNH46A, disponíveis a partir de Stratagene Cloning Systems, Inc.·, e ptrc99a, pKK223-3, pKK233-3, pDR540, pRlT5 disponíveis a partir de Pharmacia Biotech, inc. De entre os vectores eucarióticos preferidos estão pWLNEO, pSV2CAT, pOG44, pXTl e pSG, disponíveis a partir de Stratagene; e pSVK3, pBPV, pMSG e pSVL, disponíveis a partir de Pharmacia. Outros vectores adequados irão ser facilmente perceptíveis ao especialista na técnica. A introdução da construção dentro da célula hospedeira pode ser afectada por transfecção de fosfato de cálcio, transfecção mediada por DEAE-dextrano, transfecção mediada por lípido catiónico, electroporação, transdução, infecção ou outros métodos. Tais métodos são descritos em muitos manuais de laboratório padrão, tal como Davis et al.r Methods In Molecular Biology (1986). Está especificamente contemplado que os polipéptidos da presente invenção podem, de facto, ser expressos por uma célula hospedeira desprovida de um vector recombinante. 84
Um polipéptido desta invenção pode ser recuperado e purificado a partir de culturas celulares recombinantes por métodos bem conhecidos, incluindo precipitação por sulfato de amónio ou etanol, extracção ácida, cromatografia de permuta aniónica ou catiónica, cromatografia de fosfocelulose, cromatografia de interacção hidrófoba, cromatografia de afinidade, cromatografia de hidroxilapatite e cromatografia de lectina. De um modo muito preferido, a cromatografia liquida de alta resolução ("HPLC") é empregue para purificação.
Os polipéptidos da presente invenção e, de um modo preferido, a forma segregada, também podem ser recuperados a partir de: produtos purificados a partir de fontes naturais, incluindo fluidos corporais, tecidos e células, quer directamente isolados ou cultivados; produtos de processos sintéticos químicos; e produtos produzidos por técnicas recombinantes a partir de um hospedeiro procariótico ou eucariótico incluindo, por exemplo, células bacterianas, de levedura, de plantas superiores, de insecto e de mamífero. Dependendo do hospedeiro empregue num processo de produção recombinante, os polipéptidos da presente invenção podem ser glicosilados ou podem ser não glicosilados. Adicionalmente, os polipéptidos da invenção também podem incluir um resíduo de metionina modificado inicial, em alguns casos como resultado de processos mediados por hospedeiro. Deste modo, é sabido na técnica que a metionina N-terminal codificada pelo codão de iniciação de tradução é, em geral, removida com elevada eficiência de qualquer proteína, após tradução em todas as células eucarióticas. Embora a metionina N-terminal na maioria das proteínas também seja eficientemente removida na maioria dos procariotas, para algumas proteínas, este processo de remoção 85 procariótico é ineficiente, dependendo da natureza do aminoácido ao qual a metionina N-terminal está covalentemente ligada.
Utilizações dos Polinucleótidos
Cada dos polinucleótidos aqui identificados pode ser utilizado em numerosas formas como reagentes. A seguinte descrição deve ser considerada exemplificativa e utiliza técnicas conhecidas.
Os polinucleótidos da presente invenção são úteis para identificação cromossómica. Existe uma necessidade continuada para identificar novos marcadores cromossómicos, uma vez que poucos reagentes de marcação cromossómica, com base em dados da sequência reais (polimorfismos de repetição), estão presentemente disponíveis. Cada polinucleótido da presente invenção pode ser utilizado como um marcador cromossómico.
Resumidamente, as sequências podem ser mapeadas para cromossomas através da preparação de iniciadores de PCR (de um modo preferido 15-25 pb) a partir da sequência mostrada na SEQ ID N°: 23. Os iniciadores podem ser seleccionados utilizando análise de computador, de modo que os iniciadores não abarquem mais de um exão previsto no ADN genómico. Estes iniciadores são, depois, utilizados para rastreio de PCR de híbridos de células somáticas contendo cromossomas individuais humanos. Apenas aqueles híbridos contendo o gene humano correspondendo à SEQ ID N°: 23 irão produzir um fragmento amplificado.
De um modo semelhante, os híbridos somáticos proporcionam um método rápido de mapeamento de PCR dos polinucleótidos para 86 particulares cromossomas. Três ou mais clones podem ser atribuídos, por dia, utilizando um único termociclador. Além do mais, a sublocalização dos polinucleótidos pode ser alcançada com painéis de fragmentos cromossómicos específicos. Outras estratégias de mapeamento génico que podem ser utilizadas incluem hibridação in situ, pré-rastreio com cromossomas marcados separados por citometria de fluxo e pré-selecção por hibridação a bibliotecas específicas de ADN de construção de cromossomas. A localização cromossómica precisa dos polinucleótidos também pode ser alcançada utilizando hibridação de fluorescência in situ (FISH) de uma propagação cromossómica de metafase. Esta técnica utiliza polinucleótidos tão curtos quanto 500 ou 600 bases; contudo, polinucleótidos de 2000-4000 pb são preferidos. Para uma revisão desta técnica, ver Verma et al., "Human Chromosomes: a Manual of Basic Techniques", Pergamon Press, Nova Iorque (1988) .
Para mapeamento cromossómico, os polinucleótidos podem ser utilizados individualmente (para marcar um único cromossoma ou um único sítio nesse cromossoma) ou em painéis (para marcação de múltiplos sítios e/ou múltiplos cromossomas). Polinucleótidos preferidos correspondem às regiões não codificantes do ADNc, em virtude das sequências codificantes serem mais provavelmente conservadas dentro de famílias génicas aumentando, deste modo, as probabilidades de hibridação cruzada durante o mapeamento cromossómico.
Depois de um polinucleótido ter sido mapeado para uma localização cromossómica precisa, a posição física do polinucleótido pode ser utilizada em análise de ligação. A 87 análise de ligação estabelece co-herança entre uma localização cromossómica e apresentação de uma doença particular. (Dados de mapeamento de doença verificam-se, por exemplo, em V. McKusick, Mendelian Inheritance in Man (disponível na Internet através da Johns Hopkins University Welch Medicai Library)) . Assumindo resolução de mapeamento de 1 megabase e um gene por 20 kb, um ADNc localizado de modo preciso para uma região cromossómica associada à doença poderia ser de 50-500 potenciais genes causativos.
Deste modo, após o estabelecimento de co-herança, podem ser examinadas diferenças no polinucleótido e no correspondente gene entre indivíduos afectados e não afectados. Primeiro, alterações estruturais visíveis nos cromossomas, tais como deleções ou translocações, são examinadas em propagações cromossómicas ou por PCR. Se não existirem alterações estruturais, a presença de mutações pontuais é averiguada. Mutações observadas em alguns ou todos os indivíduos afectados, mas não em indivíduos normais, indicam que a mutação pode causar a doença. Contudo, a sequenciação completa do polipéptido e do gene correspondente a partir de vários indivíduos normais é requerida para distinguir a mutação de um polimorfismo. Se um novo polimorfismo for identificado, este polipéptido polimórfico pode ser utilizado para análise de ligação adicional.
Além disso, expressão aumentada ou diminuída do gene em indivíduos afectados, em comparação com indivíduos não afectados, pode ser avaliada utilizando polinucleótidos da presente invenção. Qualquer destas alterações (expressão alterada, rearranjo cromossómico ou mutação) pode ser utilizada como um marcador de diagnóstico ou prognóstico. 88
Adicionalmente ao precedente, um polinucleótido pode ser utilizado para controlar a expressão génica através da formação de hélice tripla ou ADN ou ARN anti-sentido. Ambos os métodos baseiam-se em ligação do polinucleótido a ADN ou ARN. Para estas técnicas, polinucleótidos preferidos têm, habitualmente 20 a 40 bases em comprimento e complementares à região do gene envolvida em transcrição (hélice tripla - ver Lee et al., Nucl. Acids Res. 6:3073 (1979); Cooney et al., Science 241:456 (1988); e Dervan et al., Science 251:1360 (1991)) ou ao próprio ARNm (anti-sentido - Okano, J. Neurochem. 56:560 (1991); Oligodeoxy-nucleotides as Antisense Inhibitors of Gene Expression, CRC Press, Boca Raton, FL (1988)). A formação de hélice tripla resulta, optimalmente, num corte da transcrição de ARN a partir de ADN, enquanto a a hibridação de ARN anti-sentido bloqueia a tradução de uma molécula de ARNm em polipéptido. Ambas as técnicas são eficazes em sistemas modelo e a informação aqui divulgada pode ser utilizada para conceber polinucleótidos anti-sentido ou de hélice tripla, num esforço para tratar doença.
Os polinucleótidos da presente invenção também são úteis em terapia génica. Um objectivo da terapia génica é inserir um gene normal dentro de um organismo tendo um gene defeituoso, num esforço para corrigir o defeito genético. Os polinucleótidos divulgados na presente invenção oferecem um meio de direccionamento de tais defeitos genéticos num modo altamente preciso. Outro objectivo é inserir num novo gene que não estava presente no genoma hospedeiro produzindo, desse modo, uma nova característica na célula hospedeira.
Os polinucleótidos também são úteis para identificação de indivíduos a partir de amostras biológicas diminutas. As forças 89 armadas dos Estados Unidos, por exemplo, estão a considerar a utilização de polimorfismo de comprimento de fragmentos de restrição (RFLP) para identificação do seu pessoal. Nesta técnica, o ADN genómico de um indivíduo é digerido com uma ou mais enzimas de restrição e sondado numa transferência de Southern, de modo a produzir bandas únicas para identificação do pessoal. Este método não sofre das actuais limitações dos "Cartões Identificativos" que podem ser perdidos, trocados ou roubados, tornando a identificação positiva difícil. Os polinucleótidos da presente invenção podem ser utilizados como marcadores de ADN adicionais para RFLP.
Os polinucleótidos da presente invenção também podem ser utilizados como uma alternativa a RFLP, através da determinação da sequência de ADN base-por-base real de porções seleccionadas do genoma de um indivíduo. Estas sequências podem ser utilizadas para preparar iniciadores de PCR para amplificação e isolamento desse ADN seleccionado que pode ser, depois, sequenciado. Utilizando esta técnica, os indivíduos podem ser identificados, pelo facto de que cada indivíduo terá um conjunto único das sequências de ADN. Após o estabelecimento de uma base de dados ID única para um indivíduo, a identificação positiva desse indivíduo, vivo ou morto, pode ser realizada a partir de amostras tecidulares extremamente pequenas. A biologia forense também beneficia da utilização de técnicas de identificação baseadas em ADN, como aqui divulgadas. As sequências de ADN retiradas de amostras biológicas muito pequenas, tal como tecidos, e. g., cabelo ou pele, ou fluidos corporais, e. g., sangue, saliva, sémen, etc., podem ser amplificadas utilizando PCR. Numa técnica da técnica anterior, sequências génicas amplificadas a partir de locí polimórficos, 90 tal como gene DQa de classe II de HLA, são utilizadas em biologia forense para identificar indivíduos. (Erlich, H., PCR Technology, Freeman and Co. (1992)). Depois destes loci polimórficos específicos serem amplificados, são digeridos com uma ou mais enzimas de restrição, produzindo um conjunto de identificação de bandas numa transferência de Southern, sondada com ADN correspondendo ao gene DQa de classe II de HLA. De um modo semelhante, os polinucleótidos da presente invenção podem ser utilizados como marcadores polimórficos para efeitos forenses.
Também existe uma necessidade para reagentes capazes de identificarem a fonte de um particular tecido. Tal necessidade surge, por exemplo, em cenário forense quando confrontada com tecido de origem desconhecida. Reagentes apropriados podem compreender, por exemplo, sondas ou iniciadores de ADN específicos para um tecido particular, preparados a partir das sequências da presente invenção. Painéis de tais reagentes podem identificar tecido por espécie e/ou por tipo de órgão. Num modo semelhante, estes reagentes podem ser utilizados para rastrear culturas de tecido para contaminação.
No mínimo, os polinucleótidos da presente invenção podem ser utilizados como marcadores de peso molecular em géis de Southern, como sondas de diagnóstico para a presença de um ARNm específico num particular tipo de célula, como uma sonda para "subtrair" sequências conhecidas no processo de descoberta de novos polinucleótidos, para selecção e preparação de oligómeros para conjugação a um "chip génico" ou outro suporte, para deduzir anticorpos anti-ADN, utilizando técnicas de imunização de ADN e como um antigénio para deduzir uma resposta imunitária. 91
Utilizações dos Polipéptidos
Cada dos polipéptidos aqui identificados pode ser utilizado de numerosas formas. A seguinte descrição deve ser considerada exemplificativa e utiliza técnicas conhecidas.
Um polipéptido da presente invenção pode ser utilizado para ensaiar niveis de proteína numa amostra biológica, utilizando técnicas baseadas em anticorpo. Por exemplo, a expressão de proteína em tecidos pode ser estudada com métodos imuno-histológicos clássicos. (Jalkanen, M., et al., J. Cell. Biol. 101:976-985 (1985); Jalkanen, M., et al., J. Cell. Biol. 105:3087-3096 (1987)). Outros métodos baseados em anticorpo úteis para detecção de expressão génica de proteína incluem imunoensaios, tais como o ensaio de imunoabsorção enzimática (ELISA) e o radioimunoensaio (RIA). Os marcadores de ensaio de anticorpo adequados são conhecidos na técnica e incluem msrcsdores enzimáticos, tais como, glucose oxidase e radioisótopos, tais como iodo (1251, 1211), carbono (14C), enxofre (35S), trítio (3H), índio (112ln) e tecnécio (99mTc) e marcadores fluorescentes, tais como fluoresceína e rodamina e biotina.
Adicionalmente ao ensaio de níveis de proteína segregada numa amostra biológica, as proteínas também podem ser detectadas in vivo por imagiologia. As etiquetas ou os marcadores de anticorpo para imagiologia in vivo de proteína incluem aqueles detectáveis por radiografia X, RMN ou ESR. Para radiografia X, marcas adequadas incluem radioisótopos, tais como bário ou césio, que emitem radiação detectável mas não são manifestamente nocivos para o indivíduo. Marcadores adequados para RMN e ESR, incluem aqueles com um spin característico detectável, tal como 92 deutério que pode ser incorporado dentro do anticorpo através da marcação de nutrientes para o hibridoma relevante.
Um anticorpo, ou fragmento de anticorpo, especifico de proteína que tenha sido marcado com uma fracção de imagiologia detectável apropriada, tal como um radioisótopo (por exemplo, 1311, 112ln, 99mTc), uma substância radio-opaca ou um material detectável por ressonância magnética nuclear, é introduzido (por exemplo, parentericamente, subcutaneamente ou intraperitonealmente) dentro do mamífero. Será compreendido na técnica que o tamanho do indivíduo e o sistema de imagiologia utilizado irão determinar a quantidade de fracção de imagiologia necessária para produzir imagens de diagnóstico. No caso de uma fracção de radioisótopo, para um indivíduo humano, a quantidade de radioactividade injectada irá, normalmente, variar entre cerca de 5 e 20 milicuries de 99mTc. O anticorpo, ou fragmento de anticorpo, marcado irá, depois, de um modo preferido, acumular-se no local das células que contêm a proteína específica. A imagiologia tumoral in vivo é descrita em S.W. Burchiel et al., “Immunopharmacokinetics of Radiolabeled Antibodies and Their Fragments". (Capítulo 13 em Tumor Imaging: The Radiochemical Detection of Câncer, S.W. Burchiel e B. A. Rhodes, eds., Masson Publishing Inc. (1982)).
Deste modo, a invenção proporciona um método de diagnóstico de um distúrbio que envolve (a) ensaiar a expressão de um polipéptido da presente invenção em células ou fluido corporal de um indivíduo; (b) comparar o nível de expressão génica com um nível de expressão génica padrão, pelo que um aumento ou diminuição no nível de expressão génica polipeptídica ensaiado, comparativamente com o nível de expressão padrão, seja indicativo de um distúrbio. 93
Além do mais, os polipéptidos da presente invenção podem ser utilizados para tratar doença. Por exemplo, pode ser administrado a doentes, um polipéptido da presente invenção, num esforço para restituir niveis ausentes ou diminuídos do polipéptido (e. g., insulina), para suplementar níveis ausentes ou diminuídos de um polipéptido diferente (e. g., hemoglobina S por hemoglobina B), para inibir a actividade de um polipéptido (e. g., um oncogene), para activar a actividade de um polipéptido (e. g., através da ligação a um receptor), para reduzir a actividade de um receptor ligado a membrana, colocando-o em competição com ligando livre (e. g., receptores de TNF solúveis utilizados na redução de inflamação) ou para conduzir a uma desejada resposta (e. g., crescimento de vaso sanguíneo) .
De um modo semelhante, anticorpos dirigidos para um polipéptido da presente invenção, também podem ser utilizados para tratar doença. Por exemplo, a administração de um anticorpo dirigido para um polipéptido da presente invenção pode ligar e reduzir a sobreprodução do polipéptido. De um modo semelhante, a administração de um anticorpo pode activar o polipéptido, tal como através da ligação a um polipéptido ligado a uma membrana (receptor).
No mínimo, os polipéptidos da presente invenção podem ser utilizados como marcadores de peso molecular em géis de SDS-PAGE ou em colunas de filtração em gel de crivo molecular, utilizando métodos bem conhecidos dos especialistas na técnica. Os polipéptidos também podem ser utilizados para deduzir anticorpos que, por sua vez, são utilizados para medir expressão de proteína a partir de uma célula recombinante, como uma forma de avaliar a transformação da célula hospedeira. Além do mais, os 94 polipéptidos da presente invenção podem ser utilizados para testar as seguintes actividades biológicas.
Actividades Biológicas
Os polinucleótidos e polipéptidos da presente invenção podem ser utilizados em ensaios para testar para uma ou mais actividades biológicas. Se estes polinucleótidos e polipéptidos exibirem actividade num particular ensaio, é provável que estas moléculas possam estar envolvidas nas doenças associadas à actividade biológica. Deste modo, os polinucleótidos e polipéptidos poderiam ser utilizados para tratar a doença associada.
Actividade Imunitária
Um polipéptido ou polinucleótido da presente descrição pode ser útil no tratamento de deficiências ou distúrbios do sistema imunitário, através da activação ou inibição da proliferação, diferenciação ou mobilização (quimiotaxia) de células imunitárias. As células imunitárias desenvolvem-se através de um processo denominado hematopoiese, produzindo células mielóides (plaquetas, glóbulos vermelhos, neutrófilos e macrófagos) e linfóides (linfócitos B e T) a partir de células estaminais pluripotentes. A etiologia destas deficiências ou distúrbios imunitários pode ser genética, somática, tais como cancro ou alguns distúrbios auto-imunes, adquirida (e. g., por quimioterapia ou toxinas) ou infecciosa. Além do mais, um polinucleótido ou polipéptido da presente descrição pode ser 95 utilizado como um marcador ou detector de uma doença particular ou distúrbio do sistema imunitário.
Um polinucleótido ou polipéptido da presente descrição pode ser útil no tratamento ou detecção de deficiências ou distúrbios de células hematopoiéticas. 0 polipéptido ou polinucleótido poderia ser utilizado para aumentar a diferenciação e proliferação de células hematopoiéticas, incluindo as células estaminais pluripotentes, num esforço para tratar aqueles distúrbios associados a uma diminuição em determinados (ou muitos) tipos de células hematopoiéticas. Exemplos de sindromes de deficiência imunológica incluem mas não estão limitados a: distúrbios de proteína sanguínea (e. g. agamaglobulinemia, disgamaglobulinemia), ataxia telangiectasia, imunodeficiência variável comum, Sindrome de Digeorge, infecção por HIV, infecção por HTLV-BLV, sindrome de deficiência de adesão de leucócito, linfopenia, disfunção bactericida fagocitica, imunodeficiência combinada grave (SClDs), Distúrbio de Wiskott-Aldrich, anemia, trombocitopenia ou hemoglobinúria.
Além do mais, um polipéptido ou polinucleótido da presente descrição também poderia ser utilizado para modular a actividade hemostática (a paragem de hemorragia) ou trombolitica (formação de coágulo) . Por exemplo, através do aumento da actividade hemostática ou trombolitica, o polinucleótido ou polipéptido poderia ser utilizado para tratar distúrbios de coagulação sanguínea (e. g., afibrinogenemia, deficiências de factor), distúrbios de plaqueta sanguínea (e. g. trombocitopenia) ou feridas resultando de trauma, cirurgia ou outras causas. Alternativamente, um polinucleótido ou polipéptido da presente descrição que pode diminuir a actividade hemostática ou trombolitica, poderia ser utilizado para inibir ou dissolver a 96 coagulação. Estas moléculas poderiam ser importantes no tratamento de ataques de coração (enfarte), apoplexias ou cicatrização.
Um polinucleótido ou polipéptido da presente descrição também pode ser útil no tratamento ou detecção de distúrbios auto-imunes. Muitos distúrbios auto-imunes resultam de reconhecimento inapropriado de próprio como material estranho por células imunitárias. Este reconhecimento inapropriado resulta numa resposta imunitária conduzindo à destruição do tecido hospedeiro. Por conseguinte, a administração de um polipéptido ou polinucleótido da presente descrição que inibe uma resposta imunitária, particularmente, a proliferação, diferenciação ou quimiotaxia de células T, pode ser uma terapia eficaz na prevenção de distúrbios auto-imunes.
Exemplos de distúrbios auto-imunes que podem ser tratados ou detectados incluem, mas não estão limitados a: Doença de Addison, anemia hemolitica, sindrome antifosfolipidica, artrite reumatóide, dermatite, encefalomielite alérgica, glomerulonefrite, Sindrome de Goodpasture, Doença de Graves, Esclerose Múltipla, Miastenia Grave, Nevrite, Oftalmia, Penfigóide Bolhoso, Pênfigo, Poliendocrinopatias, Púrpura, Doença de Reiter, Sindrome de Stiff-Man, Tiroidite Auto-imune, Lúpus Eritematoso Sistémico, Inflamação Pulmonar Auto-imune, Sindrome de Guillain-Barre, diabetes Mellitus dependente de insulina e doença ocular auto-imune inflamatória.
De um modo semelhante, reacções e estados alérgicos, tais como asma (particularmente, asma alérgica) ou outros problemas respiratórios, também podem ser tratados por um polipéptido ou polinucleótido da presente descrição. Além do mais, estas 97 moléculas podem ser utilizadas para tratar anafilaxia, hipersensibilidade a uma molécula antigénica ou incompatibilidade de grupo sanguíneo.
Um polinucleótido ou polipéptido da presente descrição também pode ser utilizado para tratar e/ou prevenir a rejeição de órgão ou doença de enxerto versus hospedeiro (GVHD). A rejeição de órgão ocorre por destruição de célula imunitária de hospedeiro do tecido transplantado através de uma resposta imunitária. De um modo semelhante, uma resposta imunitária também está envolvida em GVHD mas, neste caso, as células imunitárias transplantadas estranhas destroem os tecidos do hospedeiro. A administração de um polipéptido ou polinucleótido da presente descrição que inibe uma resposta imunitária, particularmente, a proliferação, diferenciação ou quimiotaxia de células T, pode ser uma terapia eficaz na prevenção de rejeição de órgão ou GVHD.
De um modo semelhante, um polipéptido ou polinucleótido da presente descrição também pode ser utilizado para modular a inflamação. Por exemplo, o polipéptido ou polinucleótido pode inibir a proliferação e diferenciação de células envolvidas numa resposta inflamatória. Estas moléculas podem ser utilizadas para tratar estados inflamatórios, estados crónicos e agudos, incluindo inflamação associada a infecção (e. g., choque séptico, sépsis ou síndrome de resposta inflamatória sistémica (SIRS)), lesão de isquemia-reperfusão, letalidade de endotoxina, artrite, rejeição hiperaguda mediada por complemento, nefrite, lesão pulmonar induzida por citocina ou quimiocina, doença inflamatória intestinal, doença de Crohn ou resultando de sobreprodução de citocinas (e. g., TNF ou IL-1). 98
Distúrbios Hiperproliferativos
Um polipéptido ou polinucleótido da presente descrição pode ser utilizado para tratar ou detectar distúrbios hiperproliferativos, incluindo neoplasmas. 0 polipéptido ou polinucleótido pode inibir a proliferação do distúrbio através de interacções directas ou indirectas. Alternativamente, o polipéptido ou polinucleótido, pode proliferar outras células que podem inibir o distúrbio hiperproliferativo.
Por exemplo, através do aumento de uma resposta imunitária, particularmente, aumento de qualidades antigénicas do distúrbio hiperproliferativo ou através da proliferação, diferenciação ou mobilização de células T, os distúrbios hiperproliferativos podem ser tratados. Esta resposta imunitária pode ser aumentada, através do melhoramento de uma resposta imunitária existente ou através da iniciação de uma nova resposta imunitária. Alternativamente, a diminuição de uma resposta imunitária também pode ser um método de tratamento de distúrbios hiperproliferativos, tal como um agente quimioterapêutico.
Exemplos de distúrbios hiperproliferativos que podem ser tratados ou detectados por um polinucleótido ou polipéptido da presente invenção incluem, mas não estão limitados a, neoplasmas localizados no: abdómen, osso, mama, sistema digestivo, figado, pâncreas, peritoneu, glândulas endócrinas (supra-renal, paratiróide, pituitária, testículos, ovário, timo, tiróide), olho, cabeça e pescoço, nervoso (central e periférico), sistema linfático, pélvico, pele, tecido mole, baço, torácico e urogenital. 99
De um modo semelhante, outros distúrbios hiperproliferativos também podem ser tratados ou detectados por um polinucleótido ou polipéptido da presente descrição. Exemplos de tais distúrbios hiperproliferativos incluem, mas não estão limitados a: hipergamaglobulinemia, distúrbios linfoproliferativos, paraproteinemias, púrpura, sarcoidose, Sindrome de Sezary, Macroglobulinemia de Waldenstron, Doença de Gaucher, histiocitose e qualquer outra doença hiperproliferativa, além de neoplasia, localizada num sistema orgânico listado anteriormente.
Doença Infecciosa
Um polipéptido ou polinucleótido da presente descrição pode ser utilizado para tratar ou detectar agentes infecciosos. Por exemplo, através do aumento da resposta imunitária, particularmente, aumentando a proliferação e diferenciação de células B e/ou T, podem ser tratadas doenças infecciosas. A resposta imunitária pode ser aumentada através do melhoramento de uma resposta imunitária existente ou através da iniciação de uma nova resposta imunitária. Alternativamente, o polipéptido ou polinucleótido também pode inibir directamente o agente infeccioso, sem necessariamente deduzir uma resposta imunitária.
Os virus são um exemplo de um agente infeccioso que pode causar doença ou sintomas que podem ser tratados ou detectados por um polinucleótido ou polipéptido da presente descrição. Exemplos de virus, incluem mas não estão limitados às seguintes familias de ADN e ARN virai: Arbovírus, Adenoviridae, Arenaviridae, Arterivirus, Birnaviridae, Bunyaviridae, Caliciviridae, Circoviridae, Coronaviridae, Flaviviridae, 100
Hepadnaviridae (Hepatite), Herpesviridae (tais como Citomegalovírus, Herpes Simplex, Herpes Zoster), Mononegavírus (e. g., Paramyxoviridae, Morbilivírus, Rhabdoviridae), Orthomyxoviridae (e. g., Influenza), Papovaviridae, Parvoviridae, Picomaviridae, Poxviridae (tais como Varíola ou Vacínia), Reoviridae (e. g.r Rotavírus), Retroviridae (HTLV-I, HTLV-II, Lentivírus) e Togaviridae (e. g., Rubivírus). Vírus abrangidos por estas famílias podem causar uma variedade de doenças ou sintomas, incluindo mas não limitados a: artrite, bronquiolite, encefalite, infecções oculares (e. g., conjuntivite, queratite), síndrome de fadiga crónica, hepatite (A, B, C, E, Activa Crónica, Delta), meningite, infecções oportunistas (e. g., SIDA), pneumonia, Linfoma de Burkitt, varicela, febre hemorrágica, Sarampo, Papeira, Parainfluenza, Raiva, a constipação comum, Polio, leucemia, Rubéola, doenças sexualmente transmitidas, doenças de pele (e. g., Kaposi, verrugas) e viremia. Um polipéptido ou polinucleótido da presente descrição pode ser utilizado para tratar ou detectar qualquer destes sintomas ou doenças.
De um modo semelhante, agentes bacterianos ou fúngicos que podem causar doença ou sintomas e que podem ser tratados ou detectados por um polinucleótido ou polipéptido da presente descrição, incluem mas não se limitam às seguintes famílias bacterianas Gram-Negativas e Gram-positivas e fungos: Actinomycetales (e. g., Corinebactéria, Micobactéria, Norcardia), Aspergíllosís, Bacillaceae (e. g., Antraz, Clostridium), Bacteroidaceae, Blastomycosis, Bordetella, Borrelia, Brucellosis, Candidiasis, Campylobacter, Coccidioidomycosis, Cryptococcosis, Dermatocycoses, Enterobacteriaceae {Klebsiella, Salmonella, Serratia, Yersinia), Erysipelothrix, Helicobacter, Legionellosis, Leptospirosis, 101 histeria, Mycoplasmatales, Neisseriaceae (e. g., Acinetobacter, Gonorreia, Meningococo), Infecções por Pasteurellacea (e. g., Actinobacillus, Heamophilus, Pasteurella), Pseudomonas, Rickettsiaceae, Chlamydiaceae, Sífilis e Estafilococo. Estas famílias bacterianas ou fúngicas podem causar as seguintes doenças ou sintomas, incluindo mas não limitados a: bacteremia, endocardite, infecções oculares (conjuntivite, tuberculose, uveíte), gengivite, infecções oportunistas (e. g., infecções relacionadas com SIDA), paroniquia, infecções relacionadas com prótese, Doença de Reiter, infecções do aparelho respiratório, tais como Tosse Convulsa ou Empiema, sépsis, Doença de Lyme, Doença das Arranhaduras de Gato, Disenteria, Febre Paratifóide, intoxicação alimentar, Tifoide, pneumonia, Gonorreia, meningite, Clamídia, Sífilis, Difteria, Lepra, Paratuberculose, Tuberculose, Lúpus, Botulismo, gangrena, tétano, impetigo, Febre Reumática, Escarlatina, doenças sexualmente transmitidas, doenças de pele (e. g., celulite, dermatocicoses), toxemia, infecções do aparelho urinário, infecções de feridas. Um polipéptido ou polinucleótido da presente descrição pode ser utilizado para tratar ou detectar qualquer destes sintomas ou doenças.
Além do mais, agentes parasíticos causando doença ou sintomas que podem ser tratados ou detectados por um polinucleótido ou polipéptido da presente descrição incluem, mas não se limitam, às seguintes famílias: Amebiasis, Babesiosis, Coccidiosis, Cryptosporidiosis, Dientamoebiasis, Dourine, Ectoparasitic, Giardiasis, Helminthiasis, Leishmaniasis,
Theileriasis, Toxoplasmosis, Trypanosomiasis e Trichomonas.
Estes parasitas podem causar uma variedade de doenças ou sintomas, incluindo mas não limitados a: Sarna, Trombiculíase, infecções oculares, doença intestinal (e. g., disenteria, 102 giardíase), doença do fígado, doença do pulmão, infecções oportunistas (e. g., relacionadas com SIDA), Malária, complicações da gravidez e toxoplasmose. Um polipéptido ou polinucleótido da presente descrição pode ser utilizado para tratar ou detectar qualquer destes sintomas ou doenças.
De um modo preferido, o tratamento utilizando um polipéptido ou polinucleótido da presente descrição poderia ser quer através da administração de uma quantidade eficaz do polipéptido ao doente ou através da remoção de células do doente, proporcionando as células com o polinucleótido e devolvendo as células manipuladas ao doente (terapia ex vivo). Além do mais, o polipéptido ou polinucleótido pode ser utilizado como um antigénio numa vacina, de modo a deduzir uma resposta imunitária contra doença infecciosa.
Regeneração
Um polinucleótido ou polipéptido da presente descrição pode ser utilizado para diferenciar, proliferar e atrair células, conduzindo à regeneração de tecidos. (Ver, Science 276:59-87 (1997)). A regeneração de tecidos poderia ser utilizada para reparar, substituir ou proteger tecido danificado por defeitos congénitos, trauma (feridas, queimaduras, incisões ou úlceras), idade, doença (e. g. osteoporose, osteocondrite, doença periodontal, insuficiência hepática), cirurgia, incluindo cirurgia plástica cosmética, fibrose, lesão de reperfusão ou dano de citocina sistémico. 103
Tecidos que poderiam ser regenerados utilizando a presente invenção incluem órgãos (e. g., pâncreas, figado, intestino, rim, pele, endotélio), músculo (liso, esquelético ou cardiaco), vascular (incluindo endotélio vascular), nervoso, hematopoiético e tecido esquelético (osso, cartilagem, tendão e ligamento). De um modo preferido, a regeneração ocorre com ou sem diminuição de cicatriz. A regeneração também pode incluir angiogénese.
Além do mais, um polinucleótido ou polipéptido da presente descrição pode aumentar a regeneração de tecidos difíceis de curar. Por exemplo, a regeneração aumentada de tendão/ligamento poderia acelerar o tempo de recuperação após lesão. 0 polinucleótido ou polipéptido também poderia ser utilizado profilacticamente, num esforço para evitar o dano. Doenças específicas que poderiam ser tratadas, incluem de tendinite, sindrome do túnel cárpico e outros defeitos de tendão ou ligamento. Um exemplo adicional de regeneração de tecido de feridas não cicatrizantes, inclui úlceras de pressão, úlceras associadas a insuficiência vascular, feridas cirúrgicas e traumáticas.
De um modo semelhante, tecido nervoso e de cérebro também poderia ser regenerado, através da utilização de um polinucleótido ou polipéptido da presente descrição para proliferar e diferenciar células nervosas. As doenças que poderiam ser tratadas utilizando este método, incluem doenças do sistema nervoso central e periférico, neuropatias ou distúrbios mecânicos e traumáticos (e. g., distúrbios da medula espinal, trauma da cabeça, doença vascular cerebral e apoplexia). Especificamente, doenças associadas a lesões do nervo periférico, neuropatia periférica (e. g., resultando de quimioterapia ou outras terapias médicas), neuropatias 104 localizadas e doenças do sistema nervoso central (e. g., doença de Alzheimer, doença de Parkinson, doença de Huntington, esclerose lateral amiotrófica e síndrome de Shy-Drager), poderiam todas ser tratadas utilizando o polinucleótido ou polipéptido da presente descrição.
Quimiotaxia
Um polinucleótido ou polipéptido da presente descrição pode ter actividade de quimiotaxia. Uma molécula quimiotáxica atrai ou mobiliza células (e. g., monócitos, fibroblastos, neutrófilos, células T, mastócitos, eosinófilos, células epiteliais e/ou endoteliais) para um particular local no corpo, tais como inflamação, infecção ou local de hiperproliferação. As células mobilizadas podem, depois, combater e/ou curar o particular trauma ou anormalidade.
Um polinucleótido ou polipéptido da presente descrição pode aumentar a actividade de quimiotaxia de células particulares. Estas moléculas quimiotáxicas podem ser, depois, utilizadas para tratar inflamação, infecção, distúrbios hiperproliferativos ou qualquer distúrbio do sistema imunitário, através do aumento do número de células direccionadas para uma localização particular no corpo. Por exemplo, as moléculas quimiotáxicas podem ser utilizadas para tratar feridas e outros traumas em tecidos, através da atracção de células imunitárias ao local lesionado. As moléculas quimiotáxicas da presente descrição também podem atrair fibroblastos que podem ser utilizados para tratar feridas. 105
Também está contemplado que um polinucleótido ou polipéptido da presente descrição pode inibir a actividade quimiotáctica. Estas moléculas também poderiam ser utilizadas para tratar distúrbios. Deste modo, o polinucleótido ou polipéptido poderia ser utilizado como um inibidor de quimiotaxia.
Actividade de Ligação
Um polipéptido da presente descrição pode ser utilizado para rastrear para moléculas que se ligam ao polipéptido ou para moléculas às quais o polipéptido se liga. A ligação do polipéptido e da molécula pode activar (agonista), aumentar, inibir (antagonista) ou diminuir a actividade do polipéptido ou da molécula ligada. Exemplos de tais moléculas incluem anticorpos, oligonucleótidos, proteínas (e. g., receptores) ou moléculas pequenas.
De um modo preferido, a molécula é estreitamente relacionada com o ligando natural do polipéptido, e. g., um fragmento do ligando, ou um substrato natural, um ligando, um mimético estrutural ou funcional. (Ver, Coligan et al., Current Protocols in Immunology 1(2): Capitulo 5 (1991)). De um modo semelhante, a molécula pode ser estreitamente relacionada com o receptor natural, ao qual o polipéptido se liga ou, pelo menos, um fragmento do receptor capaz de ser ligado pelo polipéptido (e. g., sitio activo). Em qualquer caso, a molécula pode ser racionalmente concebida utilizando técnicas conhecidas.
De um modo preferido, o rastreio para estas moléculas envolve a produção de células apropriadas que expressam os 106 polipéptidos como uma proteína segregada ou sobre a membrana celular. As células preferidas incluem células de mamíferos, levedura, Drosophila ou E. coli. Células expressando o polipéptido (ou membrana celular contendo o polipéptido expresso) são, depois, de um modo preferido, colocadas em contacto com um composto de teste, potencialmente contendo a molécula a observar ligação, estimulação ou inibição de actividade do polipéptido ou da molécula. 0 ensaio pode simplesmente testar a ligação de um composto candidato ao polipéptido, em que a ligação é detectada por um marcador, ou num ensaio envolvendo competição com um competidor marcado. Adicionalmente, o ensaio pode testar se o composto candidato resulta num sinal produzido, através de ligação ao polipéptido.
Alternativamente, o ensaio pode ser efectuado utilizando preparações livres de células, polipéptido/molécula afixado a um suporte sólido, bibliotecas químicas ou misturas de produtos naturais. 0 ensaio também pode simplesmente compreender as etapas de mistura de um composto candidato com uma solução contendo um polipéptido, medição da actividade ou ligação do polipéptido/molécula e comparação da actividade ou ligação do polipéptido/molécula a um padrão.
De um modo preferido, um ensaio ELISA pode medir o nível ou actividade de polipéptido numa amostra (e. g., amostra biológica), utilizando um anticorpo monoclonal ou policlonal. 0 anticorpo pode medir o nível ou actividade de polipéptido através da ligação, directamente ou indirectamente, ao polipéptido ou através da competição com o polipéptido por um substrato. 107 A totalidade destes ensaios anteriores pode ser utilizada como marcadores de diagnóstico ou prognóstico. As moléculas identificadas, utilizando estes ensaios, podem ser utilizadas para tratar doença ou para conduzir a um particular resultado num doente (e. g., crescimento de vaso sanguíneo) através da activação ou inibição do polipéptido/molécula. Além do mais, os ensaios podem identificar agentes que podem inibir ou melhorar a produção do polipéptido a partir de células ou tecidos, adequadamente, manipulados.
Por conseguinte, a invenção inclui um método de identificação de compostos que se ligam a um polipéptido da invenção, compreendendo as etapas de: (a) incubar um composto de ligação candidato com um polipéptido da invenção; e (b) determinar se a ligação ocorreu. Além do mais, a descrição inclui um método de identificação de agonistas/antagonistas, compreendendo as etapas de: (a) incubar um composto candidato com um polipéptido da invenção, (b) ensaiar uma actividade biológica e (b) determinar se uma actividade biológica do polipéptido foi alterada.
Outras Actividades
Um polipéptido ou polinucleótido da presente invenção também pode aumentar ou diminuir a diferenciação ou proliferação de células estaminais embrionárias, além, como discutido anteriormente, da linhagem hematopoiética.
Um polipéptido ou polinucleótido da presente invenção também pode ser utilizado para modular características de mamífero, tal como altura corporal, peso, cor de cabelo, cor dos 108 olhos, pele, percentagem de tecido adiposo, pigmentação, tamanho e forma (e. g., cirurgia cosmética). De um modo semelhante, um polipéptido ou polinucleótido da presente invenção pode ser utilizado para modular metabolismo de mamífero afectando catabolismo, anabolismo, processamento, utilização e armazenamento de energia.
Um polipéptido ou polinucleótido da presente invenção pode ser utilizado para alterar o estado mental ou estado físico de um mamífero, através da influência de biorritmos, ritmos cardíacos, depressão (incluindo distúrbios depressivos), tendência para a violência, tolerância à dor, capacidades reprodutoras (de um modo preferido, por actividade de Activina ou semelhante a Inibina), níveis hormonais ou endócrinos, apetite, libido, memória, stress ou outras qualidades cognitivas.
Um polipéptido ou polinucleótido da presente invenção também pode ser utilizado como um aditivo ou conservante alimentar, de modo a aumentar ou diminuir capacidades de armazenamento, teor de gordura, lípido, proteína, hidrato de carbono, vitaminas, minerais, cofactores ou outros componentes nutricionais .
Outros Itens E descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotídica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, cerca de 50 nucleótidos contíguos na sequência nucleotídica da SEQ ID N°: 23, como definida na Tabela 1. 109
Também é descrita uma molécula de ácido nucleico, em que a referida sequência de nucleótidos contíguos está incluída na sequência nucleotídica da SEQ ID N°: 23, na gama de posições iniciando com o nucleótido em torno da posição do Nucleótido 5' da Sequência de Clone e terminando com o nucleótido em torno da posição do Nucleótido 3' da Sequência de Clone, como definida para SEQ ID N°: 23 na Tabela 1.
Também é descrita uma molécula de ácido nucleico, em que a referida sequência de nucleótidos contíguos está incluída na sequência nucleotídica da SEQ ID N°: 23, na gama de posições iniciando com o nucleótido em torno da posição do Nucleótido 5' do Codão de Iniciação e terminando com o nucleótido em torno da posição do Nucleótido 3' da Sequência de Clone, como definida para SEQ ID N°: 23 na Tabela 1.
De um modo semelhante, é descrita uma molécula de ácido nucleico, em que a referida sequência de nucleótidos contíguos está incluída na sequência nucleotídica da SEQ ID N°: 23, na gama de posições iniciando com o nucleótido em torno da posição do Nucleótido 5' do Primeiro Aminoácido do Péptido Sinal e terminando com o nucleótido em torno da posição do Nucleótido 3' da Sequência de Clone, como definida para SEQ ID N°: 23 na Tabela 1.
Uma forma de realização preferida da presente invenção é uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotídica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, cerca de 150 nucleótidos contíguos na sequência nucleotídica da SEQ ID N°: 23. 110 É adicionalmente descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, cerca de 500 nucleótidos contíguos na sequência nucleotidica da SEQ ID N°: 23. É adicionalmente descrita uma molécula de ácido nucleico, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica à sequência nucleotidica da SEQ ID N°: 23, iniciando com o nucleótido em torno da posição do Nucleótido 5' do Primeiro Aminoácido do Péptido Sinal e terminando com o nucleótido em torno da posição do Nucleótido 3' da Sequência de Clone, como definida para SEQ ID N°: 23 na Tabela 1. É adicionalmente descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica à sequência nucleotidica completa da SEQ ID N°: 23 .
Também é descrita uma molécula de ácido nucleico isolada que se híbrida, sob condições de hibridação restringentes, a uma molécula de ácido nucleico, em que a referida molécula de ácido nucleico que se híbrida não se híbrida, sob condições de hibridação restringentes, a uma molécula de ácido nucleico tendo uma sequência nucleotidica, consistindo apenas em resíduos A ou apenas em resíduos T. É também preferida uma molécula de ADN que compreende um clone de ADNc humano, identificado como Depósito ATCC N° 209075, molécula de ADN que está contida no material depositado com a American Type Culture Collection e atribuído o Número de 111
Depósito ATCC mostrado na Tabela 1 para o referido Identificador de Clone de ADNc.
Também é descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos na sequência nucleotidica de um clone de ADNc humano, molécula de ADN que está contida no depósito atribuído o Número de Depósito ATCC 209075.
Também é descrita uma molécula de ácido nucleico isolada, em que a referida sequência de, pelo menos, 50 nucleótidos contíguos está incluída na sequência nucleotidica da sequência da fase de leitura aberta completa, codificada pelo referido clone de ADNc humano.
Também é preferida uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica à sequência de, pelo menos, 150 nucleótidos contíguos na sequência nucleotidica codificada pelo referido clone de ADNc humano. É adicionalmente descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica à sequência de, pelo menos, 500 nucleótidos contíguos na sequência nucleotidica codificada pelo referido clone de ADNc humano. É adicionalmente descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica à sequência nucleotidica completa codificada pelo referido clone de ADNc humano. 112 É adicionalmente descrito um método para detecção numa amostra biológica de uma molécula de ácido nucleico, compreendendo uma sequência nucleotídica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência nucleotídica da SEQ id N°: 23, como definida na Tabela 1; e uma sequência nucleotídica codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075; método que compreende uma etapa de comparar uma sequência nucleotídica de, pelo menos, uma molécula de ácido nucleico na referida amostra com uma sequência seleccionada do referido grupo e determinar se a sequência da referida molécula de ácido nucleico na referida amostra é, pelo menos, 95% idêntica à referida sequência seleccionada.
Também é descrito o método anterior, em que a referida etapa de comparação da sequências compreende a determinação da extensão de hibridação de ácido nucleico entre moléculas de ácidos nucleicos na referida amostra e uma molécula de ácido nucleico, compreendendo a referida sequência seleccionada do referido grupo. De um modo semelhante, também é descrito o método anterior, em que a referida etapa de comparação da sequências é realizada através da comparação da sequência nucleotídica, determinada a partir de uma molécula de ácido nucleico na referida amostra, com a referida sequência seleccionada do referido grupo. As moléculas de ácidos nucleicos podem compreender moléculas de ADN ou moléculas de ARN. É adicionalmente descrito um método para identificação da espécie, tecido ou tipo de célula de uma amostra biológica, método que compreende uma etapa de detecção de moléculas de 113 ácidos nucleicos na referida amostra, se existirem, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência nucleotidica da SEQ ID N°: 23, como definida na Tabela 1; e uma sequência nucleotidica codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. O método para identificação da espécie, tecido ou tipo de célula de uma amostra biológica pode compreender uma etapa de detecção de moléculas de ácidos nucleicos, compreendendo uma sequência nucleotidica num painel de, pelo menos, duas sequências nucleotídicas, em que, pelo menos, uma sequência no referido painel é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos numa sequência seleccionada do referido grupo.
Também é preferido um método para diagnóstico, num indivíduo, de um estado patológico associado a estrutura ou expressão anormal de um gene, codificando uma proteína segregada identificada na Tabela 1, método que compreende uma etapa de detecção numa amostra biológica, obtida do referido indivíduo, de moléculas de ácidos nucleicos, se existirem, compreendendo uma sequência nucleotidica que é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos, numa sequência seleccionada do grupo consistindo em: uma sequência nucleotidica da SEQ ID N°: 23; e uma sequência nucleotidica codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. 114 0 método para diagnóstico de um estado patológico pode compreender uma etapa de detecção de moléculas de ácidos nucleicos, compreendendo uma sequência nucleotídica num painel de, pelo menos, duas sequências nucleotidicas, em que, pelo menos, uma sequência no referido painel é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos numa sequência seleccionada do referido grupo.
Também é descrita uma composição de matéria compreendendo moléculas de ácidos nucleicos isoladas, em que as sequências nucleotidicas das referidas moléculas de ácidos nucleicos compreendem um painel de, pelo menos, duas sequências nucleotidicas, em que, pelo menos, uma sequência no referido painel é, pelo menos, 95% idêntica a uma sequência de, pelo menos, 50 nucleótidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência nucleotídica da SEQ ID N°: 23, como definida na Tabela 1; e uma sequência nucleotídica codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. As moléculas de ácidos nucleicos podem compreender moléculas de ADN ou moléculas de ARN.
Também é descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 90% idêntica a uma sequência de, pelo menos, cerca de 10 aminoácidos contíguos na sequência de aminoácidos da SEQ ID N°: 60, como definida na
Tabela 1. 115
Também é descrito um polipéptido, em que a referida sequência de aminoácidos contíguos está incluída na sequência de aminoácidos da SEQ ID N°: 60, na gama de posições iniciando com o resíduo em torno da posição do Primeiro Aminoácido da Porção Segregada e terminando com o resíduo em torno do Último Aminoácido da Fase de Leitura Aberta, como mostrado para SEQ ID N°: 60, na Tabela 1.
Também é descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 90% idêntica a uma sequência de, pelo menos, cerca de 30 aminoácidos contíguos na sequência de aminoácidos da SEQ ID N°: 60.
Também é descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 90% idêntica a uma sequência de, pelo menos, cerca de 100 aminoácidos contíguos na sequência de aminoácidos da SEQ ID N°: 60.
Também é descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 95% idêntica à sequência de aminoácidos completa da SEQ ID N°: 60. É adicionalmente descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 90% idêntica a uma sequência de, pelo menos, cerca de 10 aminoácidos contíguos na sequência de aminoácidos completa de uma proteína segregada, codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. É adicionalmente descrito um polipéptido, em que a referida sequência de aminoácidos contíguos está incluída na sequência de 116 aminoácidos de uma porção segregada da proteína segregada, codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075.
Também é descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 95% idêntica a uma sequência de, pelo menos, cerca de 30 aminoácidos contíguos na sequência de aminoácidos da porção segregada da proteína, codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075.
Também é descrito um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 95% idêntica a uma sequência de, pelo menos, cerca de 100 aminoácidos contíguos na sequência de aminoácidos da porção segregada da proteína, codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. É preferido um polipéptido isolado, compreendendo uma sequência de aminoácidos, pelo menos, 95% idêntica à sequência de aminoácidos da porção segregada da proteína, codificada pelo clone de ADNc humano contido no depósito com o Número de Depósito ATCC 209075.
É adicionalmente descrito um anticorpo isolado que se liga especificamente a um polipéptido, compreendendo uma sequência de aminoácidos que é, pelo menos, 90% idêntica a uma sequência de, pelo menos, 10 aminoácidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ ID 117 Ν°: 60, como definida na Tabela 1; e uma sequência de aminoácidos completa de uma proteína codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. É adicionalmente descrito um método para detecção numa amostra biológica de um polipéptido, compreendendo uma sequência de aminoácidos que é, pelo menos, 90% idêntica a uma sequência de, pelo menos, 10 aminoácidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ ID N°: 60, como definida na Tabela 1; e uma sequência de aminoácidos completa de uma proteína codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075; método que compreende uma etapa de comparar uma sequência de aminoácidos de, pelo menos, uma molécula polipeptídica na referida amostra com uma sequência seleccionada do referido grupo e determinar se a sequência da referida molécula polipeptídica na referida amostra é, pelo menos, 90% idêntica à referida sequência de, pelo menos, 10 aminoácidos contíguos.
Também é descrito o método anterior, em que a referida etapa de comparar uma sequência de aminoácidos de, pelo menos, uma molécula polipeptídica na referida amostra com uma sequência seleccionada do referido grupo, compreende a determinação da extensão de ligação específica de polipéptidos na referida amostra a um anticorpo que se liga especificamente a um polipéptido, compreendendo uma sequência de aminoácidos que é, pelo menos, 90% idêntica a uma sequência de, pelo menos, 10 aminoácidos contíguos numa sequência seleccionada do grupo 118 consistindo em: uma sequência de aminoácidos da SEQ ID N°: 60, como definida na Tabela 1; e uma sequência de aminoácidos completa de uma proteina codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075.
Também é descrito o método anterior, em que a referida etapa de comparação da sequências é realizada através da comparação da sequência de aminoácidos, determinada a partir de uma molécula polipeptídica na referida amostra, com a referida sequência seleccionada do referido grupo.
Também é descrito um método para identificação da espécie, tecido ou tipo de célula de uma amostra biológica, método que compreende uma etapa de detecção de moléculas polipeptídicas na referida amostra, se existirem, compreendendo uma sequência de aminoácidos que é, pelo menos, 90% idêntica a uma sequência de, pelo menos, 10 de aminoácidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ ID N°: 60, como definida na Tabela 1; e uma sequência de aminoácidos completa de uma proteina segregada codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075.
Também é descrito o método anterior para identificação da espécie, tecido ou tipo de célula de uma amostra biológica, método que compreende uma etapa de detecção de moléculas polipeptídicas compreendendo uma sequência de aminoácidos num painel de, pelo menos, duas sequências de aminoácidos, em que, pelo meos, uma sequência no referido painel é, pelo menos, 90% 119 idêntica a uma sequência de, pelo menos, 10 de aminoácidos contíguos numa sequência seleccionada do grupo anterior.
Também é preferido um método para diagnóstico, num indivíduo, de um estado patológico associado a estrutura ou expressão anómala de um gene, codificando uma proteína segregada identificada na Tabela 1, método que compreende uma etapa de detecção numa amostra biológica, obtida das moléculas polipeptídicas do referido indivíduo, compreendendo uma sequência de aminoácidos num painel de, pelo menos, duas sequências de aminoácidos, em que, pelo menos, uma sequência no referido painel é, pelo menos, 90% idêntica a uma sequência de, pelo menos, 10 aminoácidos contíguos, numa sequência seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ ID N°: 60, como definida na Tabela 1; e uma sequência de aminoácidos completa de uma proteína segregada codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075.
Em qualquer destes métodos, a etapa de detecção das referidas moléculas polipeptídicas inclui a utilização de um anticorpo.
Também é descrita uma molécula de ácido nucleico isolada, compreendendo uma sequência nucleotídica que é, pelo menos, 95% idêntica a uma sequência nucleotídica codificando um polipéptido, em que o referido polipéptido compreende uma sequência de aminoácidos que é, pelo menos, 90% idêntica a uma sequência de, pelo menos, 10 aminoácidos contíguos numa sequência seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ ID N°: 60; e uma sequência de aminoácidos 120 completa de uma proteína segregada codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075.
Também é descrita uma molécula de ácido nucleico isolada, em que a referida sequência nucleotídica codificando um polipéptido foi optimizada para expressão do referido polipéptido num hospedeiro procariótico.
Também é descrita uma molécula de ácido nucleico isolada, em que o referido polipéptido compreende uma sequência de aminoácidos seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ id N°: 60, como definida na Tabela 1; e uma sequência de aminoácidos completa de uma proteína segregada codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. É adicionalmente descrito um método de preparação de um vector recombinante, compreendendo a inserção de qualquer das moléculas de ácidos nucleicos isoladas anteriores dentro de um vector. Também é preferido o vector recombinante produzido por este método. Também é preferido um método de preparação de uma célula hospedeira recombinante, compreendendo a introdução do vector dentro de uma célula hospedeira, assim como a célula hospedeira recombinante produzida por este método.
Também é preferido um método de preparação de um polipéptido isolado, compreendendo o cultivo desta célula hospedeira recombinante sob condições de modo a que o referido polipéptido seja expresso e a recuperação do referido 121 polipéptido. Também é preferido este método de preparação de um polipéptido isolado, em que a referida célula hospedeira recombinante é uma célula eucariótica e o referido polipéptido é uma porção segregada de uma proteína humana segregada, compreendendo uma sequência de aminoácidos seleccionada do grupo consistindo em: uma sequência de aminoácidos da SEQ id N°: 60, iniciando com o resíduo na posição do Primeiro Aminoácido da Porção Segregada da SEQ ID N°: 6 0 mostrada na Tabela 1 e referida posição do Primeiro Aminoácido da Porção Segregada da SEQ ID N°: 60 é definida na Tabela 1; e uma sequência de aminoácidos de uma porção segregada de uma proteína codificada por um clone de ADNc humano, identificado por um Identificador de Clone de ADNc na Tabela 1 e contido no depósito com o Número de Depósito ATCC 209075. O polipéptido isolado produzido por este método também é preferido.
Também é descrito um método de tratamento de um indivíduo a necessitar de um nível aumentado de uma actividade de proteína segregada, método que compreende administrar a um tal indivíduo uma composição farmacêutica compreendendo uma quantidade de um polipéptido, polinucleótido ou anticorpo isolado da invenção reivindicada, eficaz para aumentar o nível da referida actividade de proteína no referido indivíduo.
Tendo a invenção sido descrita na generalidade, a mesma irá ser mais facilmente compreendida, por referência aos exemplos seguintes que são proporcionados a título de ilustração e não devem ser vistos como limitativos. 122
Exemplos
Exemplo 1: Isolamento de um Clone de ADNc Seleccionado a
Partir da Amostra Depositada
Cada clone de ADNc num depósito ATCC citado está contido num vector plasmidico. A Tabela 1 identifica os vectores utilizados para construir a biblioteca de ADNc, a partir da qual cada clone foi isolado. Em muitos casos, o vector utilizado para construir a biblioteca é um vector fágico, a partir do qual um plasmideo foi excisado. A Tabela imediatamente abaixo correlaciona o plasmideo relacionado para cada vector fágico, utilizado na construção da biblioteca de ADNc. Por exemplo, se um particular clone for identificado na Tabela 1 como sendo isolado no vector "Lambda depositado é em "pBluescript". Zap", o correspondente clone Vector Utilizado para Plasmideo Depositado Construir a Biblioteca Correspondente Lambda Zap pBluescript (pBS) Uni-Zap XR pBluescript (pBS) Zap Express pBK lafmid BA plasmideo BA pSportl pSportl pCMVSport 2.0 pCMVSport 2.0 pCMVSport 3.0 pCMVSport 3.0 pCR®2.1 pCR®2.1 123
Vectores Lambda Zap (Patentes U.S. Nos 5128256 e 5286636), Uni-Zap XR (Patentes U.S. Nos 5128256 e 5286636), Zap Express (Patentes U.S. Nos 5128256 e 5286636), pBluescript (pBS) (Short, J. M. et al., Nucleic Acids Res. 16:7583-7600 (1988);
Alting-Mees, Μ. A. e Short, J. M., Nucleic Acids Res. 17:9494 (1989)) e pBK (Alting-Mees, Μ. A. et al., Strategies 5:58-61 (1992)), estão comercialmente disponíveis a partir de Stratagene Cloning Systems, Inc., 11011 N. Torrey Pines Road, La Jolla, CA, 92037. O pBS contém um gene de resistência a ampicilina e o pBK contém um gene de resistência a neomicina. Ambos podem ser transformados dentro da estirpe de E. coli XL-1 Blue, também disponível a partir de Stratagene. O pBS apresenta-se em 4 formas SK+, SK-, KS+ e KS. Os S e K referem-se à orientação do poliligante em relação às sequências iniciadoras T7 e T3 que flanqueiam a região poliligantea ("S" é para Saci e "K" é para Kpnl que são os primeiros sítios em cada extremidade respectiva do ligante) . "+" ou referem-se à orientação da origem de replicação fl ("ori"), de modo a que numa orientação, o resgate de cadeia simples iniciado a partir da orientação ori fl gere ADN de cadeia sentido e, na outra, anti-sentido.
Os vectores pSportl, pCMVSport 2.0 e pCMVSport 3.0, foram obtidos da Life Technologies, Inc., P. O. Box 6009,
Gaithersburg, MD 20897. Todos os vectores Sport contêm um gene de resistência a ampicilina e podem ser transformados dentro da estirpe de E. coli DH10B, também disponível a partir de Life
Technologies. (Ver, por exemplo, Gruber, C. E., et al., Focus 15:59 (1993)). O vector lafmid BA (Bento Soares, Columbia
University, Ni) contém um gene de resistência a ampicilina e pode ser transformado dentro da estirpe de E. coli XL-1 Blue. O vector pCR®2.1, que está disponível a partir de Invitrogen, 1600 Faraday Avenue, Carlsbad, CA 92008, contém um gene de 124 resistência a ampicilina e pode ser transformado dentro da estirpe de E. coli DH10B, disponível a partir de Life Technologies. (Ver, por exemplo, Clark, J. M., Nuc. Acids Res. 16:9677-9686 (1988) e Mead, D. et al., Bio/Technology 9: (1991)). De um modo preferido, um polinucleótido da presente invenção não compreende as sequências do vector fágico identificadas para o particular clone na Tabela 1, assim como as correspondentes sequências do vector plasmídico designadas anteriormente.
Ao material depositado na amostra atribuiu-se o Número de Depósito ATCC citado na Tabela 1, visto que qualquer determinado clone de , também pode conter um ou mais plasmídeos adicionais, compreendendo cada, um clone de ADNc diferente daquele determinado clone. Deste modo, os depósitos partilhando o mesmo Número de Depósito ATCC contêm, pelo menos, um plasmídeo para cada clone de ADNc identificado na Tabela 1. Tipicamente, cada amostra de depósito ATCC citado na Tabela 1 compreende uma mistura de, aproximadamente, quantidades iguais (em peso) de cerca de 50 ADNs plasmídicos, contendo cada um clone de ADNc diferente; mas um tal depósito de amostra, pode incluir plasmídeos para mais ou menos de 50 clones de ADNc, até cerca de 500 clones de ADNc.
Podem ser utilizadas duas abordagens para isolar um particular clone a partir do depósito da amostra de ADN plasmídicos citados para esse clone na Tabela 1. Primeiro, um plasmídeo é directamente isolado através do rastreio dos clones, utilizando uma sonda polinucleotídica correspondendo a SEQ ID N°: X. 125
Particularmente, é sintetizado um polinucleótido especifico com 30-40 nucleótidos, utilizando um sintetizador de ADN da Applied Biosystems, de acordo com a sequência referida. O oligonucleótido é marcado, por exemplo, com 32Ρ-γ-ΑΤΡ, utilizando T4 polinucleótido cinase e purificado de acordo com métodos de rotina, (e. g., Maniatis et al., Molecular Clonlng: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring, NI (1982)). A mistura plasmidica é transformada dentro de um hospedeiro adequado, como indicado anteriormente (tal como XL-1 Blue (Stratagene)), utilizando técnicas conhecidas dos especialistas na técnica, tais como aquelas proporcionadas pelo fornecedor do vector ou em publicações relacionadas ou patentes citadas anteriormente. Os transformantes são plaqueados em placas de ágar a 1,5% (contendo o agente de selecção apropriado, e. g., ampicilina) até uma densidade de cerca de 150 transformantes (colónias) por placa. Estas placas são rastreadas, utilizando membranas de Nylon de acordo com métodos de rotina para rastreio de colónias bacterianas (e. g., Sambrook et al., Molecular
Clonlng: A Laboratory Manual, 2a Edição, (1989), Cold Spring Harbor Laboratory Press, páginas 1.93 a 1.104) ou outras técnicas conhecidas dos especialistas na técnica.
Alternativamente, dois iniciadores de 17-20 nucleótidos derivados de ambas as extremidades da SEQ ID N°: X (i. e., dentro da região da SEQ ID N°: X ligada pelo 5' NT e o 3' NT do clone definido na Tabela 1) são sintetizados e utilizados para amplificar o desejado ADNc, utilizando o plasmideo de ADNc depositado como um molde. A reacção de polimerização em cadeia é efectuada sob condições de rotina, por exemplo, em 25 pL de mistura de reacção com 0,5 pg do molde de ADNc anterior. Uma mistura de reacção conveniente é MgCl2 a 1,5-5 mM, gelatina a 0,01% (p/v), 20 pM de cada dATP, dCTP, dGTP, dTTP, 25 pmol de 126 cada iniciador e 0,25 Unidades de Taq polimerase. São realizados trinta e cinco ciclos de PCR (desnaturação a 94 °C, durante 1 min.; emparelhamento a 55 °C, durante 1 min.; alongamento a 72 °C, durante 1 min.) com um termociclador automatizado Perkin-Elmer Cetus. O produto amplificado é analisado por electrof orese em gel de agarose e a banda de adn com peso molecular esperado é excisada e purificada. O produto de PCR é verificado como sendo a sequência seleccionada por subclonagem e sequenciação do produto de ADN.
Estão disponíveis vários métodos para a identificação das porções 5' ou 3' não codificantes de um gene que pode não estar presente no clone depositado. Estes métodos incluem, mas não estão limitados a, sondagem de filtro, enriquecimento de clone utilizando sondas especificas e protocolos semelhantes ou idênticos para protocolos "RACE" 5' e 3' que são bem conhecidos na técnica. Por exemplo, um método semelhante a RACE 5' está disponível para produzir a extremidade 5' em falta de um desejado transcrito de comprimento completo. (Fromont-Racine et al., Nucleic Acids Res. 21(7):1683-1684 (1993)).
Resumidamente, um oligonucleótido específico de ARN é ligado às extremidades 5' de uma população de ARN, presumivelmente contendo transcritos de ARN de gene de comprimento completo. Um conjunto de iniciadores, contendo um iniciador específico para o oligonucleótido de ARN ligado e um iniciador específico para uma sequência conhecida do gene de interesse, é utilizado para amplificar por PCR a porção 5' do gene de comprimento completo gene desejado. Este produto amplificado pode ser, depois, sequenciado e utilizado para produzir o gene de comprimento completo. 127
Este método anterior começa com ARN total isolado da fonte desejada, embora possa ser utilizado ARN poli-A+. A preparação de ARN pode ser, depois, tratada, se necessário, com fosfatase de modo a eliminar grupos fosfato 5' em ARN degradado ou danificado que possa interferir com a etapa de ARN ligase posterior. A fosfatase deve ser, depois, inactivada e o ARN tratado com pirofosfatase ácida do tabaco, para remover a estrutura cap presente nas extremidades 5' de ARN mensageiros. Esta reacção deixa o grupo fosfato 5' na extremidade 5' do ARN com cap clivado que pode ser, depois, ligado a um oligonucleótido de ARN utilizando T4 ARN ligase.
Esta preparação de ARN modificada é utilizada como um molde para sintese de primeira cadeia de ADNc, utilizando um oligonucleótido especifico de gene. A reacção de sintese de primeira cadeia é utilizada como um molde para amplificação por PCR da desejada extremidade 5', utilizando um iniciador especifico para o oligonucleótido de ARN ligado e um iniciador especifico para a sequência conhecida do gene de interesse. 0 produto resultante é, depois, sequenciado e analisado, de modo a confirmar que a sequência da extremidade 5' pertence a um gene desejado.
Exemplo 2: Isolamento de Clones Genómicos Correspondendo a um Polinucleótido
Uma biblioteca PI genómica humana (Genomic Systems, Inc.) é rastreada por PCR utilizando iniciadores seleccionados para a sequência de ADNc correspondendo a SEQ ID N°: X, de acordo com o método descrito no Exemplo 1. (Ver, também, Sambrook). 128
Exemplo 3: Distribuição Tecidular de Polipéptido A distribuição tecidular de expressão de ARNm de polinucleótidos da presente invenção é determinada, utilizando protocolos para análise de transferência de Northern, descrita, entre outros, por Sambrook et al. Por exemplo, uma sonda de ADNc produzida pelo método descrito no Exemplo 1 e marcada com P utilizando o sistema de marcação de ADN rediprime™ (Amersham Life Science), de acordo com instruções do fabricante. Após marcação, a sonda é purificada utilizando coluna CHROMA SPIN-100™ (Clontech Laboratories, Inc.), de acordo com o protocolo do fabricante número PT1200-1. A sonda marcada purificada é, depois, utilizada para examinar diversos tecidos humanos para expressão de ARNm.
Transferências Northern de Múltiplos Tecidos (MTN), contendo diversos tecidos humanos (H) ou tecidos de sistema imunitário humano (IM) (Clontech), são examinadas com a sonda marcada utilizando solução de hibridação ExpressHyb™ (Clontech), de acordo com o protocolo do fabricante número PT1190-1. Após hibridação e lavagem, as transferências são montadas e expostas a filme, a -70 °C, de um dia para o outro e os filmes são revelados de acordo com processos padrão.
Exemplo 4: Mapeamento Cromossómico dos Polinucleótidos É concebido um conjunto de iniciadores oligonucleotidico de acordo com a sequência na extremidade 5' da SEQ ID N°: x. O iniciador abarca, de um modo preferido, cerca de 100 nucleótidos. Este conjunto de iniciadores é, depois, utilizado numa reacção de polimerização em cadeia, sob o 129 seguinte conjunto de condições: 30 segundos, 95 °C; minuto, 56 °C; minuto, 70 °C. Este ciclo é repetido 32 vezes, seguido de um ciclo de 5 minutos, a 70 °C. ADN de humano, murganho e hamster é utilizado como molde, adicionalmente a um painel hibrido de célula somática, contendo cromossomas ou fragmentos de cromossomas individuais (Bios, Inc) . As reacções são analisadas, quer em géis de poliacrilamida a 8% ou géis de agarose a 3,5%. O mapeamento cromossómico é determinado pela presença de um fragmento de PCR de, aproximadamente, 100 pb no hibrido particular de célula somática.
Exemplo 5: Expressão Bacteriana de um Polipéptido
Um polinucleótido codificando um polipéptido da presente invenção é amplificado utilizando iniciadores oligonucleotídicos de PCR, correspondendo às extremidades 5' e 3' da sequência de ADN, como delineado no Exemplo 1, de modo a sintetizar fragmentos de inserção. Os iniciadores utilizados para amplificar o inserto de ADNc devem, de um modo preferido, conter sítios de restrição, tais como BamHl e Xbal, na extremidade 5' dos iniciadores, para clonar o produto amplificado dentro do vector de expressão. Por exemplo, BamHl e Xbal correspondem aos sítios de restrição enzimática no vector de expressão bacteriano pQE-9. (Qiagen, Inc., Chatsworth, CA). Este vector plasmídico codifica resistência antibiótica (Ampr), uma origem de replicação bacteriana (ori), um promotor/operador (P/O) regulável por IPTG, um sítio de ligação ribossómico (RBS), uma cauda de 6 histidinas (β-His) e sítios de clonagem de restrição enzimática. O vector pQE-9 é digerido com BamHl e Xbal e o fragmento amplificado é ligado dentro do vector pQE-9, mantendo a fase de 130 leitura iniciada no RBS bacteriano. A mistura de ligação é, depois, utilizada para transformar a estirpe de E. coli M 15/rep4 (Qiagen, Inc.) que contém múltiplas cópias do plasmideo pREP4, que expressa o repressor lacl e também confere resistência a canamicina (Kanr) . Os transformantes são identificados pela sua capacidade de crescerem em placas LB e as colónias resistentes a ampicilina/canamicina são seleccionadas. 0 ADN plasmidico é isolado e confirmado por análise de restrição.
Clones contendo as desejadas construções são cultivados, de um dia para o outro (0/N), em cultura liquida em meios LB suplementados, tanto com Amp (100 pg/mL) como Kan (25 pg/mL) . A cultura O/N é utilizada para inocular um cultura de grandes dimensões, a uma razão de 1:100 a 1:250. As células são cultivadas para uma densidade óptica 600 (O.D.600) compreendida entre 0,4 e 0,6. O IPTG (isopropil-B-D-tiogalacto piranósido) é, depois, adicionado para uma concentração final de 1 mM. O IPTG induz, através de inactivação do repressor lacl, desimpedindo o P/O, conduzindo a expressão génica aumentada.
As células são cultivadas durante 3 a 4 horas extra. As células são, depois, recolhidas por centrifugação (20 min., a 6000 X g) . O sedimento celular é solubilizado no agente caotrópico, Guanidina HC1 a 6 Molar, através de agitação, durante 3-4 horas, a 4 °C. Os residuos celulares são removidos por centrifugação e o sobrenadante contendo o polipéptido é carregado numa coluna de resina de afinidade de ácido de níquel-nitrilo-tri-acético ("Ni-NTA") (disponível a partir de QIAGEN, Inc., supra). As proteínas com uma cauda 6 x His ligam-se à resina Ni-NTA com elevada afinidade e podem ser purificadas 131 num simples processo de uma etapa (para detalhes ver: The QIAexpressionist (1995) QIAGEN, Inc., supra).
Resumidamente, o sobrenadante é carregado na coluna em guanidina-HCl a 6 M, pH 8, a coluna é primeiro lavada com 10 volumes de guanidina-HCl a 6 M, pH 8, depois, lavada com 10 volumes de guanidina-HCl a 6 M, pH 6 e, finalmente, o polipéptido é eluido com guanidina-HCl a 6 M, pH 5. A proteina purificada é, depois, renaturada através da sua diálise contra solução salina tamponada com fosfatos (PBS) ou tampão de Na-acetato a 50 mM, pH 6, mais NaCl a 200 mM.
Alternativamente, a proteina pode ser reenrolada com sucesso, enquanto imobilizada na coluna Ni-NTA. As condições recomendadas são como se segue: renaturar utilizando um gradiente linear de ureia, a 6 M-l M, em NaCl a 500 mM, glicerol a 20%, Tris/HCl a 20 mM, pH 7,4, contendo inibidores de protease. A renaturação deve ser realizada ao longo de um período de 1,5 horas, ou mais. Após renaturação, as proteínas são eluidas pela adição de immidazole a 250 mM. O imidazole é removido por uma etapa de diálise final contra tampão de PBS ou acetato de sódio a 50 mM, pH 6, mais NaCl a 200 mM. A proteína purificada é armazenada a 4o C ou congelada a -80° C.
Adicionalmente ao vector de expressão anterior, a presente invenção inclui, adicionalmente, um vector de expressão compreendendo elementos operadores e promotores fágicos, operativamente ligados a um polinucleótido da presente invenção, denominado pHE4a. (Acesso ATCC Número 209645, depositado a 25 de Fevereiro de 1998) . Este vector contém: 1) um gene da neomicinafosfotransferase como um marcador de selecção, 2) uma origem de replicação de E. coli, 3) uma sequência promotora 132 fágica T5, 4) duas sequências operadoras lac, 5) uma sequência de Shine-Delgarno e 6) o qene repressor do operão de lactose (laclq). A origem de replicação (oriC) é derivada de pUC19 (LTI, Gaithersburg, MD) . As sequências promotoras e operadoras são preparadas sinteticamente. 0 ADN pode ser inserido dentro do pHEa através da restrição do vector com Ndel e Xbal, BamHI, Xhol ou Asp718, correndo o produto restringido num gel e isolamento do fragmento maior (o fragmento de enchimento deve ter cerca de 310 pares de bases) . O inserto de ADN é gerado de acordo com o protocolo de PCR descrito no Exemplo 1, utilizando iniciadores de PCR tendo sitios de restrição para Ndel (iniciador 5') e Xbal, BamHI, Xhol ou Asp718 (iniciador 3')· O inserto de PCR é purificado em gel e restringido com enzimas compatíveis. O inserto e vector são ligados de acordo com protocolos padrão. O vector manipulado poderia ser facilmente substituído no protocolo anterior para expressar proteína num sistema bacteriano.
Exemplo 6: Purificação de um Polipéptido a partir de um Corpo de Inclusão O seguinte método alternativo pode ser utilizado para purificar um polipéptido expresso em E. coli, quando está presente na forma de corpos de inclusão. Salvo especificado em contrário, a totalidade das etapas seguintes é conduzida a 4-10 °C. 133
Após conclusão da fase de produção da fermentação de E. coli, a cultura celular é arrefecida para 4-10 °C e as células são recolhidas por centrifugação continua, a 15000 rpm (Heraeus Sepatech). Com base no rendimento esperado de proteína por peso unitário da pasta celular e da quantidade de proteína purificada requerida, uma quantidade apropriada de pasta celular, em peso, é suspensa num solução tampão contendo Tris a 100 mM, EDTA a 50 mM, pH 7,4. As células são dispersas para uma suspensão homogénea utilizando uma misturadora de elevado cisalhamento.
As células são, depois, lisadas através da passagem da solução através de um microfluidificador (Microfuidics, Corp. ou apv Gaulin, inc.), duas vezes, a 4000-6000 psi. O homogeneizado é, depois, misturado com solução de NaCl para uma concentração final de 0,5 M de NaCl, seguido de centrifugação a 7000 x g, durante 15 min. O sedimento resultante é lavado de novo, utilizando NaCl a 0,5 M, Tris a 100 mM, EDTA a 50 mM, pH 7,4.
Os corpos de inclusão lavados resultantes são solubilizados com cloridrato de guanidina a 1,5 M (GuHCl), durante 2-4 horas. Após centrifugação a 7000 x g, durante 15 min., o sedimento é descartado e o polipéptido contendo sobrenadante é incubado, a 4 °C, de um dia para o outro, de modo a permitir extracção de GuHCl adicional.
Após centrifugação de elevada velocidade (30000 x g), de modo a remover partículas insolúveis, a proteína solubilizada com GuHCl é reenrolada, através da rápida mistura do extracto de GuHCl com 20 volumes de tampão contendo sódio a 50 mM, pH 4,5, NaCl a 150 mM, EDTA a 2 mM, através de agitação vigorosa. A solução de proteína reenrolada diluída é mantida a 4 °C, sem 134 mistura, durante 12 horas, antes de etapas de purificação adicionais.
De modo a clarificar a solução de polipéptido reenrolado, é empregue uma unidade de filtração tangencial anteriormente preparada, equipada com filtro de membrana de 0,16 pm, com área de superfície apropriada (e. g., Filtron), equilibrada com acetato de sódio a 40 mM, pH 6,0. A amostra filtrada é carregada numa resina de permuta catiónica (e. g., Poros HS-50, Perseptive Biosystems). A coluna é lavada com acetato de sódio a 40 mM, pH 6.0 e eluída com 250 mM, 500 mM, 1000 mM e 1500 mM de NaCl no mesmo tampão, num modo por etapas. A absorvência a 280 nm do efluente é continuamente monitorizada. As fracções são recolhidas e adicionalmente analisadas por SDS-PAGE.
Fracções contendo o polipéptido são, depois, agregadas e misturadas com 4 volumes de água. A amostra diluída é, depois, carregada num conjunto de colunas em série, anteriormente preparado, de resinas de permuta aniónica forte (Poros HQ-50, Perseptive Biosystems) e aniónica fraca (Poros CM-20, Perseptive Biosystems). As colunas são equilibradas com acetato de sódio a 40 mM, pH 6,0. Ambas as colunas são lavadas com acetato de sódio a 40 mM, pH 6,0, NaCl a 200 mM. A coluna CM-20 é, depois, eluída utilizando um gradiente linear de 10 volumes de coluna, variando entre NaCl a 0,2 M, acetato de sódio a 50 mM, pH 6,0 e NaCl a 1.0 M, acetato de sódio a 50 mM, pH 6,5. As fracções são recolhidas sob monitorização A28o constante do efluente. As fracções contendo o polipéptido (determinado, por exemplo, por SDS-PAGE a 16%) são, depois, agregadas.
Após as etapas anteriores de reenrolamento e purificação, o polipéptido resultante deve exibir pureza superior a 95%. Não 135 deverão ser observadas importantes bandas contaminantes a partir do gel SDS-PAGE a 16% corado com azul de Commassie, quando são carregados 5 pg de proteína purificada. A proteína purificada também pode ser testada para contaminação de endotoxina/LPS e, tipicamente, o teor de LPS é inferior a 0,1 ng/mL, de acordo com ensaios LAL.
Exemplo 7: Clonagem e Expressão de um Polipéptido num Baculovírus
Sistema de Expressão
Neste exemplo, o vector vaivém plasmídico pA2 é utilizado para inserir um polinucleótido dentro de um baculovírus, de modo a expressar um polipéptido. Este vector de expressão contém o forte promotor de poliedrina do vírus da poliedrose nuclear de Autographa californica (AcMNPV), seguido de sítios de restrição convenientes, tais como BamHI, Xba I e Asp718. O sítio de poliadenilação do vírus símio 40 ("SV40"), é utilizado para poliadenilação eficiente. Para fácil selecção de vírus recombinante, o plasmídeo contém o gene da beta-galactosidase de E. coli, sob o controlo de um fraco promotor de Drosophila na mesma orientação, seguido do sinal de poliadenilação do gene de poliedrina. Os genes inseridos são flanqueados em ambos os lados por sequências virais para recombinação homóloga de mediação celular com ADN virai de tipo selvagem, de modo a produzir um vírus viável que expressa o polinucleótido clonado.
Muitos outros vectores de baculovírus podem ser utilizados em vez do anterior vector, tais como pAc373, pVL941 e pAcIMl, como um especialista na técnica facilmente entenderia, desde que 136 a construção proporcione sinais apropriadamente localizados para transcrição, tradução, secreção e semelhantes, incluindo um péptido sinal e um AUG, em fase, como requerido. Tais vectores são descritos, por exemplo, em Luckow et al., Virology 170:31-39 (1989) .
Especificamente, a sequência de ADNc contida no clone depositado, incluindo o codão de iniciação AUG e a sequência condutora naturalmente associada identificada na Tabela 1, é amplificada, utilizando o protocolo de PCR descrito no Exemplo 1. Se a sequência sinal de ocorrência natural for utilizada para produzir a proteína segregada, o vector pA2 não necessita de um segundo péptido sinal. Alternativamente, o vector pode ser modificado (pA2 GP) para incluir uma sequência condutora de baculovírus, utilizando o método padrão descrito em Summers et ai., "A Manual of Methods for Baculovírus Vectors and Insect Cell Culture Procedures", Texas Agricultural Experimental Station Bulletin N° 1555 (1987). O fragmento amplificado é isolado a partir de um gel de agarose a 1% utilizando um kit comercialmente disponível ("Geneclean", BIO 101 Inc., La Jolla, Ca.). O fragmento é, depois, digerido com enzimas de restrição apropriadas e de novo purificado num gel de agarose a 1%. O plasmídeo é digerido com as enzimas de restrição correspondentes e, opcionalmente, pode ser desfosforilado, utilizando fosfatase intestinal de vitelo, utilizando processos de rotina conhecidos na técnica. O adn é, depois, isolado a partir de um gel de agarose a 1% utilizando um kit comercialmente disponível ("Geneclean" BIO 101 Inc., La Jolla, Ca.) . 137 0 fragmento e o plasmídeo desfosforilado são ligados entre si com T4 ADN ligase. HB101 de E. coli ou outros hospedeiros de E. coli adequados, tal como células XL-1 Blue {Stratagene Cloning Systems, La Jolla, CA) são transformados com a mistura de ligação e propagados em placas de cultura. As bactérias contendo o plasmídeo são identificadas através da digestão do ADN de colónias individuais e análise do produto de digestão por electroforese em gel. A sequência do fragmento clonado é confirmada por sequenciação de ADN.
Cinco pg de um plasmídeo contendo o polinucleótido são co-transfectados com 1,0 pg de um ADN de baculovírus linearizado comercialmente disponível ("ADN de baculovírus BaculoGold™", Pharmingen, San Diego, CA), utilizando o método de lipofecção descrito por Felgner et al., Proc. Natl. Acad. Sei. USA 84:7413-7417 (1987). Um pg de ADN de vírus BaculoGold™ e 5 pg do plasmídeo são misturados num poço estéril de uma placa de microtitulação contendo 50 pL de meio livre de soro Grace (Life Technologies Inc., Gaithersburg, MD). Posteriormente, 10 pL de Lipofectina mais 90 pL de meio Grace são adicionados, misturados e incubados, durante 15 minutos, à temperatura ambiente. Depois, a mistura de transfecção é adicionada gota-a-gota a células de insecto Sf9 (ATCC CRL 1711), inoculadas numa placa de cultura de tecidos de 35 mm com 1 mL de meio Grace sem soro. A placa é, depois, incubada durante 5 horas, a 27 °C. A solução de transfecção é, depois, removida da placa e é adicionado 1 mL de meio de insecto Grace suplementado com soro de vitelo fetal a 10%. O cultivo é, depois, continuado a 27 °C, durante quatro dias.
Após quatro dias, o sobrenadante é recolhido e é realizado um ensaio de placa, como descrito por Summers e Smith, supra. É 138 utilizado um gel de agarose com "Blue Gal" (Life Technologies Inc., Gaithersburg), de modo a permitir identificação e isolamento fáceis de clones expressando gal, que produzem placas coradas de azul. (Uma descrição detalhada de um "ensaio de placa" deste tipo também pode ser encontrado no guia do utilizador para cultura de células de insecto e baculovirologia, distribuído por Life Technologies Inc., Gaithersburg, página 9-10). Após incubação apropriada, as placas coradas de azul são recolhidas com a ponta de um micropipetador (e. g., Eppendorf). O ágar contendo os vírus recombinantes é, depois, ressuspenso num tubo de microcentrífuga, contendo 200 pL de meio Grace e a suspensão contendo o baculovírus recombinante é utilizada para infectar células Sf9 inoculadas em placas de 35 mm. Quatro dias mais tarde, os sobrenadantes destas placas de cultura são recolhidos e, depois, armazenados a 4 °C.
De modo verificar a expressão dos polipéptidos, células Sf9 são cultivadas em meio Grace suplementado com FBS a 10% inactivado por calor. As células são infectadas com o baculovírus recombinante contendo o polinucleótido, a uma multiplicidade de infecção ("MOI") de cerca de 2. Se se desejarem proteínas marcadas radioactivamente, 6 horas mais tarde o meio é removido e substituído com meio SF900 II, menos metionina e cisteína (disponível a partir de Life Technologies Inc., Rockville, MD). Após 42 horas, são adicionados 5 pCi de 35S-metionina e 5 pCi de 35S-cisteina (disponível a partir de Amersham). As células são adicionalmente incubadas, durante 16 horas e, depois, são recolhidas por centrifugação. As proteínas no sobrenadante, assim como as proteínas intracelulares, são analisadas por SDS-PAGE, seguido de auto-radiografia (ser marcado radioactivamente). 139 A microsequenciação da sequência de aminoácidos da extremidade amino de proteína purificada pode ser utilizada para determinar a sequência amino-terminal da proteína produzida.
Exemplo 8: Expressão de um Polipéptido em Células de Mamífero 0 polipéptido da presente invenção pode ser expresso numa célula de mamífero. Um vector de expressão de mamífero típico contém um elemento promotor que medeia a iniciação de transcrição de ARNm, uma sequência codificante de proteína e sinais requeridos para a terminação de transcrição e poliadenilação do transcrito. Elementos adicionais incluem estimuladores, sequências de Kozak e sequências intermédias flanqueadas por sítios dadores e aceitadores para excisão de ARN. A transcrição altamente eficiente é alcançada com os promotores precoce e tardio de SV40, as repetições terminais longas (LTRS) de Retrovírus, e. g., RSV, HTLVI, HIVI e o promotor precoce do citomegalovírus (CMV). Contudo, podem ser, igualmente, utilizados elementos celulares (e. g., o promotor de actina humana).
Vectores de expressão adequados para utilização na prática da presente invenção incluem, por exemplo, vectores, tais como pSVL e pMSG (Pharmaciâ, Uppsala, Suécia), pRSVcat (ATCC 37152), pSV2dhfr (ATCC 37146), pBC12MI (ATCC 67109), pCMVSport 2.0 e pCMVSport 3.0. Células hospedeiras de mamífero que poderiam ser utilizadas incluem as células humanas Hela, 293, H9 e Jurkat, células de murganho NIH3T3 e C127, células Cos 1, Cos 7 e CV1, células quail QC1-3, células L de murganho e células de ovário de hamster Chinês (CHO). 140
Alternativamente, o polipéptido pode ser expresso em linhas celulares estáveis contendo o polinucleótido integrado dentro de um cromossoma. A co-transfecção com um marcador seleccionável, tais como dhfr, gpt, neomicina, higromicina permite a identificação e isolamento das células transfectadas. 0 gene transfectado também pode ser amplificado para expressar grandes quantidades da proteína codificada. 0 marcador DHFR (di-hidrofolato redutase) é útil no desenvolvimento de linhas celulares que transportam várias centenas ou mesmo vários milhares de cópias do gene de interesse. (Ver, e. g., Alt, F. W., et al., J. Biol. Chem. 253:1357-1370 (1978); Hamlin, J. L. e Ma, C., Biochem. et Biophys. Acta, 1097:107-143 (1990); Page, M. J. e Sydenham, Μ. A., Biotechnology 9:64-68 (1991)). Outro marcador de selecção útil é a enzima glutamina sintase (GS) (Murphy et al., Biochem J. 227:277-279 (1991); Bebbington et al., Bio/Technology 10:169-175 (1992)). Utilizando estes marcadores, as células de mamifero são cultivadas em meio selectivo e as células com a resistência mais elevada são seleccionadas. Estas linhas celulares contêm o gene(s) amplificado integrado dentro de um cromossoma. As células de ovário de hamster Chinês (CHO) e NSO são, frequentemente, utilizadas para a produção de proteínas.
Derivados do plasmídeo pSV2-dhfr (Acesso ATCC N° 37146), os vectores de expressão pC4 (Acesso ATCC N° 209646) e pC6 (Acesso ATCC N° 209647) contêm o forte promotor (LTR) do Vírus do Sarcoma de Rous (Cullen et al., Molecular and Cellular Bíology, 438-447 (Março de 1985)) mais um fragmento do estimulador CMV (Boshart et al., Cell 41:521-530 (1985)). Sítios de múltipla clonagem, e. g., com os sítios de clivagem de restrição enzimática BamHI, Xbal e Asp718, facilitam a clonagem do gene de 141 interesse. Os vectores também contêm o intrão 3', o sinal de poliadenilação e terminação do gene de pré-proinsulina de rato e o gene DHFR de murganho sob controlo do promotor precoce de SV4 0 .
Especificamente, o plasmideo pC6, por exemplo, é digerido com enzimas de restrição apropriadas e, depois, desfosforilado utilizando fosfatase intestinal de vitelo por processos conhecidos na técnica. 0 vector é, depois, isolado a partir de um gel de agarose a 1%.
Um polinucleótido da presente invenção é amplificado de acordo com o protocolo delineado no Exemplo 1. Se a sequência sinal de ocorrência natural for utilizada para produzir a proteína segregada, o vector não necessita de um segundo péptido sinal. Alternativamente, se a sequência sinal de ocorrência natural não for utilizada, o vector pode ser modificado para incluir uma sequência sinal heteróloga. (Ver, e. g., o documento WO 96/34891.) 0 fragmento amplificado é isolado a partir de um gel de agarose a 1% utilizando um kit comercialmente disponível ("Geneclean", BIO 101 Inc., La Jolla, Ca.). 0 fragmento é, depois, digerido com enzimas de restrição apropriadas e de novo purificado num gel de agarose a 1%. 0 fragmento amplificado é, depois, digerido com as mesmas enzimas de restrição e purificado num gel de agarose a 1%. 0 fragmento isolado e o vector desfosforilado são, depois, ligados com T4 ADN ligase. As células de E. coli HB 101 ou XL-1 Blue são, depois, transformadas e as bactérias que contêm o fragmento 142 inserido dentro do plasmideo pC6 são identificadas utilizando, por exemplo, análise de restrição enzimática.
As células de ovário de hamster Chinês desprovidas de um gene de DHFR activo, são utilizadas para transfecção. Cinco pg do plasmideo de expressão pC6 são co-transfectados com 0,5 pg do plasmideo pSVneo, utilizando lipofectina (Felgner et al., supra). O plasmideo pSV2-neo contém um marcador seleccionável dominante, o gene neo de Tn5 codificando uma enzima que confere resistência a um grupo de antibióticos, incluindo G418. As células são inoculadas em MEM menos alfa, suplementado com G418 a 1 mg/mL. Após 2 dias, as células são tripsinizadas e inoculadas em placas de clonagem de hibridoma (Greiner, Alemanha) em MEM menos alfa, suplementado com 10, 25 ou 50 ng/mL de metotrexato mais G418 a 1 mg/mL. Após cerca de 10-14 dias, os clones únicos são tripsinizados e, depois, semeados em placas de Petri de 6 poços ou balões de vidro de 10 mL, utilizando diferentes concentrações de metotrexato (50 nM, 100 nM, 200 nM, 400 nM, 800 nM) . Os clones crescendo às concentrações mais elevadas de metotrexato são, depois, transferidos para novas placas de 6 poços contendo concentrações ainda maiores de metotrexato (1 mM, 2 pM, 5 pM, 10 mM, 20 mM) . O mesmo processo é repetido até que sejam obtidos clones que cresçam a uma concentração de 100 - 200 pM. A expressão do produto génico desejado é analisada, por exemplo, por SDS-PAGE e transferência de Western ou por análise de HPLC de fase reversa.
Exemplo 9: Fusões de Proteína
Os polipéptidos da presente invenção são, de um modo preferido, fundidos a outras proteínas. Estas proteínas de fusão 143 podem ser utilizadas para uma variedade de aplicações. Por exemplo, a fusão dos presentes polipéptidos a cauda His, cauda HA, proteína A, dominios igG e proteína de ligação a maltose facilita a purificação. (Ver o Exemplo 5; ver, também, o documento EP A 394827; Traunecker, et al., Nature 331:84-86 (1988)). De um modo semelhante, a fusão a igG-1, igG-3 e albumina aumenta o tempo de meia-vida in vivo. Sinais de localização nuclear, fundidos aos polipéptidos da presente invenção, podem direccionar a proteína para uma localização subcelular especifica, enquanto a heterodímero ou homodímeros covalentes podem aumentar ou diminuir a actividade de uma proteína de fusão. As proteínas de fusão também podem criar moléculas quiméricas tendo mais de uma função. Finalmente, as proteínas de fusão podem aumentar a solubilidade e/ou estabilidade da proteina fundida, comparativamente com proteína não fundida. A totalidade dos tipos de proteínas de fusão anteriormente descritos pode ser preparada através da modificação do protocolo seguinte, que delineia a fusão de um polipéptido a uma molécula de IgG ou do protocolo descrito no
Exemplo 5.
Resumidamente, a porção Fc humana da molécula de IgG pode ser amplificada por PCR, utilizando iniciadores que abarcam as extremidades 5' e 3' da sequência descrita abaixo. Estes iniciadores também devem ter sítios de restrição enzimática convenientes que facilitarão a clonagem dentro de um vector de expressão, de um modo preferido, um vector de expressão de mamífero.
Por exemplo, se for utilizado pC4 (Acesso N° 209646), a porção Fc humana pode ser ligada dentro do sítio de clonagem de
BamHI. É de notar que o sitio BamHI 3' não deve ser destruído. 144
Depois, o vector contendo a porção Fc humana é restringido novamente com BamHl, linearizando o vector, e um polinucleótido da presente invenção, isolado pelo protocolo de PCR descrito no Exemplo 1, é ligado dentro deste sitio BamHl. É de notar que o polinucleótido é clonado sem um codão de terminação, de outro modo, uma proteina de fusão não irá ser produzida.
Se a sequência sinal de ocorrência natural for utilizada para produzir a proteina segregada, o pC4 não necessita de um segundo péptido sinal. Alternativamente, se a sequência sinal de ocorrência natural não for utilizada, o vector pode ser modificado para incluir uma sequência sinal heteróloga. (Ver, e. g., o documento WO 96/34891).
Região Fc de igG humana:
GGGATCCGGAGCCCAAATCTTCTGACAAAACTGACACATGCCCACCGTGCC
CAGCACCTGAATTCGAGGGTGCACCGTCAGTCTTCCTCTTCCCCCCAAAACC
CAAGGACACCCTCATGATCTCCCGGACTCCTGAGGTCACATGCGTGGTGGT
GGACGTAAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACG
GCGTGGAGGTGCAT AATGCCAAGACAAAGCCGCGGGAGGAGCAGT ACAAC
AGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTG
AATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAACCCCC
ATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGT
GTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCT
GACCTGCCTGGTCAAAGGCTTCTATCCAAGCGACATCGCCGTGGAGTGGGA
GAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGG
ACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCA GGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGC ACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGAGTGC GACGGCCGCGACTCTAGAGGAT (SEQ ID N2: 1) 145
Exemplo 10: Produção de um Anticorpo a partir de um Polipéptido
Os anticorpos da presente invenção podem ser preparados por uma variedade de métodos. (Ver, Current Protocols, Capitulo 2). Por exemplo, as células expressando um polipéptido da presente invenção são administradas a um animal, de modo a induzir a produção de soros contendo anticorpos policlonais. Num método preferido, uma preparação da proteína segregada é preparada e purificada, de modo a torná-la substancialmente livre de contaminantes naturais. Uma tal preparação é, depois, introduzida dentro de um animal, para produzir anti-soros policlonais de maior actividade especifica.
No método mais preferido, os anticorpos da presente invenção são anticorpos monoclonais (ou os seus fragmentos de ligação de proteina). Tais anticorpos monoclonais podem ser preparados utilizando tecnologia de hibridoma. (Kõhler et al., Nature 256:495 (1975); Kõhler et al., Eur. J. Immunol. 6:511 (1976); Kõhler et al., Eur. J. Immunol. 6:292 (1976); Hammerling et al., in: Monoclonal Antlbodles and T-Cell Hybridomas, Elsevier, N.Y., p. 563-681 (1981)). Em geral, tais processos envolvem a imunização de um animal (de um modo preferido, um murganho) com polipéptido ou, de um modo mais preferido, com uma célula expressando polipéptido segregado. Tais células podem ser cultivadas em qualquer meio de cultura de tecidos adequado; contudo, é preferido cultivar células em meio de Eagle modificado por Earle, suplementado com soro bovino fetal a 10% (inactivado a cerca de 56 °C) e suplementado com cerca de 10 g/L de aminoácidos não essenciais, cerca de 1000 U/mL de penicilina e cerca de 100 pg/mL de estreptomicina. 146
Os esplenócitos de tais murganhos são extraídos e fundidos com uma linha celular de mieloma adequada. Pode ser empregue qualquer linha celular de mieloma adequada, de acordo com a presente invenção; contudo, é preferido empregar a linha celular de mieloma progenitora (SP20), disponível a partir da ATCC. Após fusão, as células de hibridoma , são selectivamente mantidas em meio HAT e, depois, clonadas por diluição limitante, como descrito por Wands et al. (Gastroenterology 80:225-232 (1981)). As células de hibridoma obtidas através de uma tal selecção são, depois, ensaiadas para identificar clones que segregam anticorpos capazes de se ligarem ao polipéptido.
Alternativamente, podem ser produzidos anticorpos adicionais capazes de se ligarem ao polipéptido num processo de duas etapas, utilizando anticorpos anti-idiotípicos. Um tal método faz utilização do facto de que os anticorpos serem eles próprios antigénios e, por conseguinte, é possível obter-se um anticorpo que se liga a um segundo anticorpo. De acordo com este método, anticorpos específicos de proteína são utilizados para imunizar um animal, de um modo preferido, um murganho. Os esplenócitos de um tal animal são, depois, utilizados para produzir células de hibridoma e as células de hibridoma são rastreadas para identificar clones que produzem um anticorpo, cuja capacidade para se ligar ao anticorpo específico de proteína pode ser bloqueada pelo polipéptido. Tais anticorpos compreendem anticorpos anti-idiotípicos para o anticorpo específico de proteína e podem ser utilizados para imunizar um animal, de modo a induzir formação de anticorpos específicos de proteína adicionais.
Será entendido que Fab e F(ab')2 e outros fragmentos dos anticorpos da presente invenção, podem ser utilizados de acordo 147 com os métodos aqui divulgados. Tais fragmentos são tipicamente produzidos por clivagem proteolítica, utilizando enzimas, tais como papaina (para produzir fragmentos Fab) ou pepsina (para produzir fragmentos F(ab')2). Alternativamente, podem ser produzidos fragmentos de ligação a proteína segregada através da aplicação de tecnologia de ADN recombinante ou através de química sintética.
Para utilização in vivo de anticorpos em humanos, pode ser preferido utilizar anticorpos monoclonais quiméricos "humanizados". Tais anticorpos podem ser produzidos utilizando construções genéticas derivadas de células de hibridoma produzindo os anticorpos monoclonais anteriormente descritos. Os métodos para produção de anticorpos quiméricos são conhecidos na técnica. (Ver, para revisão, Morrison, Science 229:1202 (1985); Oi et al., BioTechniques 4:214 (1986); Cabilly et ai., Patente U.S. N° 4816567; Taniguchi et al., documento EP 171496; Morrison et al., documento EP 173494; Neuberger et al., documento WO 8601533; Robinson et al., documento WO 8702671; Boulianne et al., Nature 312:643 (1984); Neuberger et al., Nature 314:268 (1985)).
Exemplo 11: Produção De Proteína Segregada Para Ensaios De Rastreio De Alta Capacidade O seguinte protocolo produz um sobrenadante contendo um polipéptido para ser testado. O sobrenadante pode ser, depois, utilizado nos Ensaios de Rastreio descritos nos Exemplos 13-20.
Primeiro, diluir a solução-mãe de Poli-D-Lisina (documento 644587 Boehringer-Mannheim) (1 mg/mL em PBS) 1:20 em PBS (sem 148 cálcio ou magnésio 17-516F Biowhittaker) para uma solução de trabalho de 50 pg/mL. Adicionar 200 pL desta solução a cada poço (placas de 24 poços) e incubar, à t.a., durante 20 minutos. Assegurar a distribuição da solução sobre cada poço (nota: pode ser utilizado um pipetador de 12 canais com pontas de dois em dois canais). Aspirar para fora a solução de Poli-D-Lisina e enxaguar com 1 mL de PBS (Solução Salina Tamponada com Fosfatos). O PBS deve permanecer no poço até imediatamente antes do plaqueamento das células e as placas podem ser revestidas com poli-lisina antecipadamente, durante até duas semanas.
Plaquear células 293T (não transportar células além de P+20) a 2 x 105 células/poço em 5 mL de DMEM (Meio de Eagle Modificado por Dulbecco) (com 4,5 G/L de glucose e L-glutamina (12-604F Biowhittaker))/10% de FBS inactivado por calor (14-503F Biowhittaker)/lx Penstrep(17-602E Biowhittaker). Deixar as células crescer de um dia para o outro.
No dia seguinte, misturar entre si num recipiente de solução estéril: 300 pL de Lipofectamina (18324-012 Gibco/BRL) e 5 mL de Optimem I (31985070 Gibco/BRL)/placa de 96 poços. Com um pipetador multicanal de pequeno volume aliquotar, aproximadamente, 2 pg de um vector de expressão contendo um inserto polinucleotidico, produzido pelos métodos descritos nos Exemplos 8 ou 9, para dentro de uma placa de fundo redondo de 96 poços apropriadamente rotulada. Com um pipetador multicanal, adicionar 50 pL da mistura Lipof ectamina/Optimem I a cada poço. Pipetar para cima e para baixo suavemente, de modo a misturar. Incubar, à t.a., 15-45 minutos. Após cerca de 20 minutos, utilizar um pipetador multicanal para adicionar 150 pL de Optimem I a cada poço. Como controlo, uma placa de ADN vector 149 desprovido de um inserto deve ser transfectada com cada conjunto de transfecções.
De um modo preferido, a transfecção deve ser realizada através de trabalho em equipa das seguintes tarefas. Através de trabalho em equipa, o tempo dispendido lava, é cortado pela metade e as células não passam demasiado tempo em PBS. Primeiro, a pessoa remove por aspiração os meios de quatro placas de 24 poços de células e, depois, a pessoa B cada poço com 0,5-1 mL de PBS. A pessoa A, depois, remove por aspiração o PBS enxaguado e a pessoa B, utilizando um pipetador de 12 canais com pontas de dois em dois canais, adiciona 200 pL de complexo de ADN/Lipofectamina/Optimem I aos poços impares primeiro, depois aos onze poços, a cada fileira nas placas de 24 poços. Incubar, a 37 °C, durante 6 horas.
Enquanto as células estão em incubação, preparar meios apropriados, BSA a 1% em DMEM com lx penstrep ou meios CHO-5 (116,6 mg/L de CaCl2 (anid.); 0,00130 mg/L de CuS04-5H20; 0, 050 mg/L de Fe (N03) 3-9H20; 0,417 mg/L de FeS04-7H20; 311,80 mg/L de KC1; 28,64 mg/L de MgCl2; 48,84 mg/L de MgS04; 6995,50 mg/L de NaCl; 2400,0 mg/L de NaHC03; 62,50 mg/L de NaH2PO4-H20; 71,02 mg/L de Na2HP04; 0,4320 mg/L de ZnS04-7H20; 0, 002 mg/L de Ácido Araquidónico; 1,022 mg/L de Colesterol; 0,070 mg/L de DL-alfa-Tocoferol-Acetato; 0,0520 mg/L de Ácido Linoleico; 0,010 mg/L de Ácido Linolénico; 0,010 mg/L de Ácido Mirístico; 0,010 mg/L de Ácido Oleico; 0,010 mg/L de Ácido Palmítrico; 0,010 mg/L de Ácido Palmitico; 100 mg/L de Plurónico F-68; 0,010 mg/L de Ácido Esteárico; 2,20 mg/L de Tween 80; 4551 mg/L de D-Glucose; 130,85 mg/mL de L- Alanina; 147,50 mg/mL de L-Arginina-HCL; 7,50 mg/mL de L-Asparagina-H20; 6,65 mg/mL de Ácido L-Aspártico; 29,56 mg/mL de L-Cistina-2HC1-H20; 31,29 mg/mL de L-Cistina-2HC1; 7,35 mg/mL 150 de Ácido L-Glutâmico; 365,0 mg/mL de L-Glutamina; 18,75 mg/mL de Glicina; 52,48 mg/mL de L-Histidina-HCl-H20; 106,97 mg/mL de L-Isoleucina; 111,45 mg/mL de L-Leucina; 163,75 mg/mL de L-Lisina HC1; 32,34 mg/mL de L-Metionina; 68,48 mg/mL de L-Fenilalainina; 40,0 mg/mL de L-Prolina; 26,25 mg/mL de L-Serina; 101,05 mg/mL de L-Treonina; 19,22 mg/mL de L-Triptofano; 91,79 mg/mL de L-Tirosina-2Na-2H20; 99,65 mg/mL de L-Valina; 0,0035 mg/L de Biotina; 3,24 mg/L de D-Ca Pantotenato; 11,78 mg/L de Cloreto de Colina; 4,65 mg/L de Ácido Fólico; 15,60 mg/L de i-Inositol; 3,02 mg/L de Niacinamida; 3,00 mg/L de Piridoxal HC1; 0,031 mg/L de Piridoxina HC1; 0,319 mg/L de Riboflavina; 3,17 mg/L de Tiamina HC1; 0,365 mg/L de Timidina; e 0, 680 mg/L de Vitamina Βχ2; 25 mM de Tampão HEPES; 2,39 mg/L de Na Hipoxantina; 0,105 mg/L de Ácido Lipóico; 0,081 mg/L de Putrescina-2HC1 de Sódio; 55,0 mg/L de Piruvato de Sódio; 0, 0067 mg/L de Selenito de Sódio; 20 μΜ de Etanolamina; 0,122 mg/L de Citrato Férrico; 41,70 mg/L de Metil-B-Ciclodextrina complexada com Ácido Linoleico; 33,33 mg/L de Metil-B-Ciclodextrina complexada com Ácido Oleico; e 10 mg/L de Metil-B-Ciclodextrina complexada com Retinal) com 2 mM de Glutamina e lx penstrep. (BSA (81-068-3 Bayer) 100 g, dissolvidos em 1 L de DMEM para uma solução-mãe de BSA a 10%) . Filtrar os meios e recolher 50 pL para ensaio de endotoxina em 15 mL de poliestireno cónico. A reacção de transfecção é terminada, de um modo preferido, por trabalho em equipa, no fim do período de incubação. A pessoa A remoção por aspiração os meios de transfecção, enquanto a pessoa B adiciona 1,5 mL de meios apropriados a cada poço. Incubar, a 37 °C, durante 45 ou 72 horas, dependendo dos meios utilizados: BSA a 1%, durante 45 horas ou CHO-5, durante 72 horas. 151
No dia quatro, utilizando um pipetador multicanal de 300 pL, aliquotar 600 pL numa placa de profundidade de 1 mL e o restante sobrenadante para dentro de um poço de profundidade de 2 mL. Os sobrenadantes de cada poço podem ser, depois, utilizados nos ensaios descritos nos Exemplos 13-20. É especificamente compreendido que, quando a actividade é obtida em qualquer dos ensaios descritos abaixo utilizando um sobrenadante, a actividade tem origem a partir do polipéptido directamente (e. g., como uma proteína segregada) ou pelo polipéptido induzindo expressão de outras proteínas que são, depois, segregadas para dentro do sobrenadante. Deste modo, a invenção proporciona adicionalmente um método de identificação da proteína no sobrenadante, caracterizado por uma actividade num ensaio particular.
Exemplo 12: Construção da Construção de Repórter GAS
Uma via de transdução de sinal envolvida na diferenciação e proliferação de células é denominada via Jaks-STAT. As proteínas activadas na via Jaks-STAT ligam-se a elementos do sítio de activação gama "GAS" ou elemento responsivo sensível a interferão ("ISRE"), localizados no promotor em muitos genes. A ligação de uma proteína a estes elementos altera a expressão do gene associado.
Os elementos GAS e ISRE são reconhecidos por uma classe de factores de transcrição denominados Transdutores de Sinal e Activadores de Transcrição, ou "STAT". Existem seis membros da família STAT. Statl e Stat3 estão presentes em muitos tipos de 152 células, como está Stat2 (como resposta a IFN-alfa está disseminado). O Stat4 está mais restringido e não está em muitos tipos de células, embora se tenha verificado em células T auxiliares de classe I, após tratamento com IL-12. Stat5 foi originalmente denominado factor de crescimento mamário, mas verificou-se em concentrações superiores em outras células, incluindo células mielóides. Pode ser activado em células de cultura de tecidos por muitas citocinas.
Os STAT são activados para se translocarem do citoplasma para o núcleo após fosforilação de tirosina por um conjunto de cinases, conhecidas como a família de Cinase Janus ("Jaks") . As Jaks representam uma família distinta de tirosina-cinases solúveis e incluem Tyk2, Jakl, Jak2 e Jak3. Estas cinases exibem significativa semelhança da sequência e são, em geral, cataliticamente inactivas em células em repouso.
As Jaks são activadas por uma ampla gama de receptores, sumariados na Tabela abaixo. (Adaptado a partir da revisão por Schidler e Darnell, Ann. Rev. Biochem. 64:621-51 (1995)). Uma família de receptores de citocina, capaz de activar as Jaks, é dividida em dois grupos: (a) a Classe 1 inclui receptores para IL-2, IL-3, IL-4, IL-6, IL-7, IL-9, IL-11, IL-12, IL-15, Epo, PRL, GH, G-CSF, GM-CSF, LIF, CNTF e trombopoietina; e (b) a Classe 2 inclui iFN-a, IFN-g e IL-10. Os receptores de Classe 1 partilham um motivo de cisteína conservado (um conjunto de quatro cisteínas conservadas e um triptofano) e um motivo WSXWS (uma região proximal de membrana codificando Trp-Ser-Xxx-Trp-Ser (SEQ ID N°: 2)).
Deste modo, na ligação de um ligando a um receptor, as Jaks são activadas que, por sua vez activam STAT que, depois, se 153 translocam e ligam a elementos GAS. 0 processo integral está abrangido na via de transdução de sinal Jaks-STAT.
Por conseguinte, a activação da via Jaks-STAT, reflectida pela ligação do elemento GAS ou do elemento ISRE, pode ser utilizada para indicar proteínas envolvidas na proliferação e diferenciação de células. Por exemplo, factores de crescimento e citocinas são conhecidos por activarem a via Jaks-STAT. (Ver a Tabela abaixo). Deste modo, através da utilização de elementos GAS ligados a moléculas repórter, podem ser identificados activadores da via Jaks-STAT.
Ligando tyk2 JAKs Jakl Jak2 Jak3 ST AT GAS (elementos) ou ISRE Família IFN IFN-a/B + + - - 1,2,3 ISRE IFN-g + + - 1 GAS (IRFI>Lys6>IFP) 11-10 + 7 7 - 1,3 Família gpl30 IL-6 + + + 7 1,3 GAS (IRFl>Lys6>IFP) (Pleiotrópico) II- 7 + 7 7 1,3 11(Pleiotrópico) OnM (Pleiotrópico) ? + + 7 1,3 LIF (Pleiotrópico) 7 + + 7 1,3 CNTF -/ + + + 7 1,3 154 (continuação)
Ligando tyk2 JAKs Jakl Jak2 Jak3 ST AT GAS (elementos) ou ISRE (Pleiotrópico) G-CSF (Pleiotrópico) 7 + 7 7 1,3 IL-12 (Pleiotrópico) + + + 1,3 Familia g-C IL-2 (linfócitos) - + - + 1,3,5 GAS IL-4 (linfa/mielóide) — + — + 6 GAS (IRFI = IFP>>Ly6)(IgH) IL-7 (linfócitos) - + - + 5 GAS IL-9 (linfócitos) - + - + 5 GAS IL-13 (linfócito) - + 7 7 6 GAS IL-15 7 + 7 + 5 GAS Familia gp!40 IL-3 (mielóide) - - + - 5 GAS (IRFI>IFP»Ly6) IL-5 (mielóide) - - + - 5 GAS GM-CSF (mielóide) Familia da hormona do crescimento + 5 GAS GH 7 - + - 5 PRL 7 + /- + - 1,3,5 EPO 7 _ + _ 5 GAS(B- 155 (continuação)
Ligando tyk2 JAKs Jak2 Jak3 ST AT GAS (elementos) ou
Jakl ISRE CAS>IRFI=IFP>>Ly6)
Receptor de Tirosinas-cinases EGF ? + + 1,3 GAS (IRFl) PDGF ? + + - 1,3 CSF-1 ? + + - 1,3 GAS (não IRFl)
De modo a construir um elemento promotor contendo GAS sintético que é utilizado nos Ensaios Biológicos descritos nos Exemplos 13-14, é empregue uma estratégia baseada em PCR para produzir uma sequência promotora GAS-SV40. 0 iniciador 5' contém quatro cópias em série do sitio de ligação GAS verificado no promotor IRF1 e que se demonstrou anteriormente ligar-se a STAT, após indução com uma gama de citocinas (Rothman et al., Immunity 1:457-468 (1994)), embora possam ser utilizados outros elementos GAS ou ISRE como alternativa. 0 iniciador 5' também contém 18 pb da sequência complementar à sequência promotora precoce de SV40 e é flanqueada com um sitio Xhol. A sequência do iniciador 5' é: 5’:GCGCCTCGAGATTTCCCCGAAATCTAGATTTCCCCGAAATGATTTCCCCG AAATGATTTCCCCGAAATATCTGCCATCTCAATTAG:3’ (SEQ id P: 3) 0 iniciador a jusante é complementar ao promotor de SV40 é flanqueado com um sitio Hind III: 5':GCGGCAAGCTTTTTGCAAAGCCTAGGC:3' (SEQ ID N°: 4) 156 A amplificação por PCR é realizada utilizando o molde do promotor de SV40 presente no plasmideo B-gal:promotor, obtido a partir de Clontech. 0 fragmento de PCR resultante é digerido com Xhol/Hind III e subclonado dentro de BLSK2-. (Stratagene). A sequenciação com iniciadores directos e inversos confirma que o inserto contém a seguinte sequência: 5 ’ :CTCG AG ATTTCCCCGAAATCT AGATTTCCCCG AAATGATTTCCCCGAAATG ATTTCCCCG A AATATCTGCCATCTC AATT AGTCAGCAACC ATAGTCCCGCCC CT AACTCCGCCCATCCCGCCCCT AACTCCGCCC AGTTCCGCCCATTCTCCGC CCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGC CTCTGAGCT ATTCC AG AAGT AGTG AGGAGGCTTTTTTGGAGGCCT AGGCTTT TGCAAAAAGCTT:3' (SEQ ID N2: 5)
Com este elemento promotor GAS ligado ao promotor de SV40, uma construção repórter GAS:SEAP2 é manipulada em seguida. Aqui, a molécula repórter é uma fosfatase alcalina segregada ou "SEAP". Claramente, contudo, pode ser qualquer molécula repórter em vez de SEAP, neste ou em qualquer dos outros Exemplos. Moléculas repórter bem conhecidas que podem ser utilizadas em vez de SEAP incluem cloranfenicol acetiltransferase (CAT), luciferase, fosfatase alcalina, B-galactosidase, proteína verde fluorescente (GFP) ou qualquer proteína detectável por um anticorpo. A sequência anterior confirmou que o elemento promotor sintético GAS-SV40 está subclonado dentro do vector pSEAP-Promotor, obtido a partir de Clontech, utilizando HindIII e Xhol, substituindo eficazmente o promotor de SV40 com o elemento promotor amplificado GAS:SV40, de modo a criar o vector GAS-SEAP. Contudo, este vector não contém um gene de resistência 157 a neomicina e, por conseguinte, não é preferido para sistemas de expressão de mamífero.
Deste modo, para produzir linhas celulares de mamífero estáveis expressando o repórter GAS-SEAP, a cassete GAS-SEAP é removida do vector GAS-SEAP utilizando Sall e Notl e inserida dentro de uma estrutura de vector contendo o gene de resistência a neomicina, tal como pGFP-1 (Clontech), utilizando estes sítios de restrição no sítio de múltipla clonagem, de modo a criar o vector GAS-SEAP/Neo. Depois de este vector ser transfectado em células de mamífero, este vector pode ser, depois, utilizado como uma molécula repórter para ligação de GAS, como descrito nos Exemplos 13-14.
Utilizando a descrição anterior podem ser preparadas outras construções e substituindo GAS com uma sequência promotora diferente. Por exemplo, a construção de moléculas repórter contendo sequências promotoras NFK-B e EGR é descrita nos Exemplos 15 e 16. Contudo, muitos outros promotores podem ser substituídos utilizando os protocolos descritos nestes Exemplos. Por exemplo, os promotores SRE, IL-2, NFAT ou Osteocalcina podem ser substituídos, isoladamente ou em combinação (e. g., GAS/NF-KB/EGR, GAS/NF-KB, I]-2/NFAT OU NF-KB/GAS). De um modo semelhante, outras linhas celulares podem ser utilizadas para testar actividade de construção repórter, tais como HELA (epitelial), HUVEC (endotelial), Reh (célula B), Saos-2 (osteoblasto), HUVAC (aórtica) ou Cardiomiócito. 158
Exemplo 13: Ensaio de Rastreio de Alta Capacidade para Actividade de Célula T. 0 protocolo seguinte é utilizado para avaliar actividade de célula T através da identificação de factores, tais como factores de crescimento e citocinas, que podem proliferar ou diferenciar-se em células T. A actividade de célula T é avaliada utilizando a construção GAS/SEAP/Neo, produzida no Exemplo 12. Deste modo, factores que aumentam a actividade de SEAP indicam a capacidade para activar a via de transdução de sinal Jaks-STAT. A célula T utilizada neste ensaio é células T Jurkat (Acesso ATCC N° TIB-152), embora também possam ser utilizadas células Molt-3 (Acesso ATCC N° CRL-1552) e células Molt-4 (Acesso ATCC N° CRL-1582) .
As células T Jurkat são células auxiliares CD4+ Thl linfoblásticas. Para produzir linhas celulares estáveis, aproximadamente 2 milhões de células Jurkat são transfectadas com o vector GAS-SEAP/neo utilizando DMRIE-C (Life Technologies) (processo de transfecção descrito abaixo). As células transfectadas são inoculadas até uma densidade de, aproximadamente, 20000 células por poço e são seleccionados os transfectantes resistentes a 1 mg/mL de genticina. As colónias resistentes são expandidas e, depois, testadas para a sua resposta a concentrações crescentes de interferão gama. A dose-resposta de um clone seleccionado é demonstrada.
Especificamente, o protocolo seguinte produzirá células suficientes para 75 poços contendo 200 pL de células. Deste modo, ou é aumentada a escala ou realizado em múltiplo, de modo a produzir células suficientes para múltiplas placas de 96 poços. As células Jurkat são mantidas em RPMI + 10% de soro com 159 1% de Pen-Strep. Combinar 2,5 mL de OPTI-MEM (Life Technologies) com 10 μg de ADN plasmidico num frasco T25. Adicionar 2,5 mL de OPTI-MEM contendo 50 pL de DMRIE-C e incubar, à temperatura ambiente, durante 15-45 min.
Durante o período de incubação, contar a concentração celular, centrifugar o número requerido de células (1O7 por transfecção) e ressuspender em OPTI-MEM para uma concentração final de 107 células/mL. Depois, adicionar 1 mL de 1 x 107 células em OPTI-mem a um frasco T25 e incubar, a 37 °C, durante 6 h. Após a incubação, adicionar 10 mL de RPMI + 15% de soro.
As linhas repórter Jurkat:GAS-SEAP estáveis são mantidas em RPMI + 10% de soro, 1 mg/mL de Genticina e 1% de Pen-Strep. Estas células são tratadas com sobrenadantes contendo um polipéptido como produzido pelo protocolo descrito no Exemplo 11.
No dia de tratamento com o sobrenadante, as células devem ser lavadas e ressuspensas em novo RPMI + 10% de soro, até uma densidade de 500000 células por mL. O número exacto de células requerido irá depender do número de sobrenadantes sendo rastreado. Para uma placa de 96 poços são requeridas, aproximadamente, 10 milhões de células (para 10 placas, 100 milhões de células).
Transferir as células para um barquinho reservatório triangular, para dosear as células para dentro de uma placa de 96 poços, utilizando uma pipeta de 12 canais. Utilizando uma pipeta de 12 canais, transferir 200 pL de células para dentro de 160 cada poço (adicionando, por conseguinte, 100000 células por poço).
Depois de todas as placas terem sido inoculadas, 50 pL dos sobrenadantes são transferidos directamente da placa de 96 poços contendo o sobrenadante para dentro de cada poço, utilizando uma pipeta de 12 canais. Adicionalmente, uma dose de interferão gama exógeno (0,1, 1,0, 10 ng) é adicionada aos poços H9, H10 e Hll, de modo a servirem como controlos positivos adicionais para o ensaio.
As placas de 96 poços contendo células Jurkat tratadas com sobrenadantes são colocadas numa incubadora, durante 48 h. (nota: este tempo é variável entre 48-72 h.). Amostras de 35 pL de cada poço são, depois, transferidas para uma placa de 96 poços opaca utilizando uma pipeta de 12 canais. As placas opacas devem ser cobertas (utilizando capas de celofane) e armazenadas a -20 °C, até que sejam realizados os ensaios SEAP de acordo com o Exemplo 17. As placas contendo as restantes células tratadas são colocadas a 4 °C e servem como uma fonte de material para repetir o ensaio num poço especifico, se desejado.
Como um controlo positivo, podem ser utilizadas 100 Unidades/mL de interferão gama que se sabe que activa células T Jurkat. É tipicamente observada uma indução superior a 30 vezes nos poços de controlo positivo. 161
Exemplo 14: Ensaio de Rastreio de Alta Capacidade Identificando Actividade Mielóide 0 protocolo seguinte é utilizado para avaliar actividade mielóide através da identificação de factores, tais como factores de crescimento e citocinas que podem proliferar ou diferenciar-se em células mielóides. A actividade mielóide é avaliada utilizando a construção GAS/SEAP/Neo, produzida no Exemplo 12. Deste modo, factores que aumentam a actividade de SEAP indicam a capacidade para activar a via de transdução de sinal Jaks-STAT. A célula mielóide utilizada neste ensaio é U937, uma linha celular pré-monocitica, embora possam ser utilizadas TF-1, HL60 ou KG1.
De modo a transfectar, de forma transiente, células U937 com a construção GAS/SEAP/Neo produzida no Exemplo 12, é utilizado um método DEAE-Dextrano (Kharbanda et al., 1994, Cell Growth & Differentiation, 5:259-265). Primeiro, recolher 2xl0e7 células U937 e lavar com PBS. As células U937 são habitualmente cultivadas em meio RPMI 1640 contendo 10% de soro bovino fetal (FBS) inactivado por calor, suplementado com 100 unidades/mL de penicilina e 100 mg/mL de estreptomicina.
Em seguida, suspender as células em 1 mL de tampão Tris-HCl a 20 mM (pH 7,4) contendo 0,5 mg/mL de DEAE-Dextrano, 8 pg de ADN plasmidico de GAS-SEAP2, NaCl a 140 mM, KC1 a 5 mM, Na2HP04.7H20 a 375 μΜ, MgCl2 a 1 mM e CaCl2 a 675 μΜ. Incubar, a 37 °C, durante 45 min.
Lavar as células com meio RPMI 1640 contendo 10% de FBS e, depois, ressuspender em 10 mL de meio completo e incubar, a 37 °C, durante 36 h. 162
As células GAS-SEAP/U937 estáveis são obtidas através do crescimento das células em 400 pg/mL de G418. O meio livre de G418 é utilizado para crescimento de rotina, mas a cada mês ou de dois em dois meses, as células devem ser re-cultivadas em 400 pg/mL de G418 para dois subcultivos.
Estas células são testadas através da recolha de lxlO8 células (são suficiente para ensaio de dez placas de 96 poços) e lavadas com PBS. Suspender as células em 200 mL do meio de crescimento anteriormente descrito, com uma densidade final de 5xl05 células/mL. Plaquear 200 pL de células por poço na placa de 96 poços (ou lxlO5 células/poço).
Adicionar 50 pL do sobrenadante preparado pelo protocolo descrito no Exemplo 11. Incubar a 37 °C, durante 48 a 72 h. Como um controlo positivo, podem ser utilizadas 100 Unidades/mL de interferão gama que se sabe que activa células U937. É tipicamente observada uma indução superior a 30 vezes nos poços de controlo positivo. Ensaiar com SEAP o sobrenadante, de acordo com o protocolo descrito no Exemplo 17.
Exemplo 15: Ensaio de Rastreio de Alta Capacidade Identificando Actividade Neuronal.
Quando as células sofrem diferenciação e proliferação, é activado um grupo de genes através de muitas vias de transdução de sinal diferentes. Um destes genes, EGRl (gene 1 de resposta de crescimento precoce), é induzido em diversos tecidos e tipos de células após activação. O promotor de EGRl é responsável por tal indução. Utilizando o promotor de EGRl ligado a moléculas repórter, a activação de células pode ser avaliada. 163
Particularmente, é utilizado o protocolo seguinte para avaliar actividade neuronal em linhas celulares PC12. As células PC12 (células de fenocromocitoma de rato) são conhecidas por se diferenciarem e/ou proliferarem por activação com um determinado número de mitogénios, tais como TPA (acetato de tetradecanoil forbol), NGF (factor de crescimento nervoso) e EGF (factor de crescimento epidérmico). A expressão génica de EGRl é activada durante este tratamento. Deste modo, através da transfecção de modo estável de células PC12 com uma construção contendo um promotor de EGR ligado ao repórter SEAP, a activação de células PC12 pode ser avaliada. A construção repórter EGR/SEAP pode ser agrupada pelo protocolo seguinte. A sequência promotora de EGR-1 (-633 a +1) (Sakamoto K et al., Oncogene 6:867-871 (1991)) pode ser amplificada por PCR a partir de ADN genómico humano, utilizando os seguintes iniciadores: 5' GCGCTCGAGGGATGACAGCGATAGAACCCCGG -3' (SEQ ID N°: 6) 5' GCGAAGCTTCGCGACTCCCCGGATCCGCCTC-3' (SEQ ID N°: 7)
Utilizando o vector GAS:SEAP/Neo produzido no Exemplo 12, o produto amplificado de EGRl pode ser, depois, inserido dentro deste vector. Linearizar o vector GAS:SEAP/Neo utilizando as enzimas de restrição Xhol/Hindlll, removendo o enchimento GAS/SV40. Restringir o produto amplificado de EGRl com estas mesmas enzimas. Ligar o vector e o promotor de EGRl.
De modo a preparar placas de 96 poços para cultura celular, dois mL de uma solução de revestimento (diluição 1:30 de colagénio tipo I (Upstate Biotech Inc. Cat N° 08-115) em etanol a 30% (esterilizado por filtração)) são adicionados, por uma 164 placa de 10 cm, ou 50 mL por poço da placa de 96 poços e deixada a secar ao ar, durante 2 h.
As células PC12 são rotineiramente cultivadas em meio RPMI-1640 (Bio Whittaker) contendo 10% de soro de cavalo (JRH BIOSCIENCES, Cat. N° 12449-78P), 5% de soro bovino fetal (FBS) inactivado por calor, suplementado com 100 unidades/mL de penicilina e 100 pg/mL de estreptomicina, numa placa de cultura de tecidos de 10 cm pré-revestida. De três ou de quatro em quatro dias são realizados um a quatro subcultivos. As células são removidas das placas através de raspagem e ressuspensas com pipetagem para cima e para baixo, durante mais de 15 vezes.
Transfectar a construção EGR/SEAP/Neo para PC12, utilizando o protocolo de Lipofectamina descrito no Exemplo 11. As células EGR-SEAP/PC12 estáveis são obtidas através do crescimento das células em 300 pg/mL de G418. O meio livre de G418 é utilizado para crescimento de rotina, mas a cada mês ou de dois em dois meses, as células devem ser re-cultivadas em 300 pg/mL de G418 para dois subcultivos.
De modo a ensaiar para actividade neuronal, uma placa de 10 cm com células em torno de 70 a 80% confluentes é rastreada através da remoção do meio antigo. Lavar as células uma vez com PBS (Solução salina tamponada com fosfatos). Depois, submeter as células a inanição em meio pobre em soro (RPMI-1640 contendo 1% de soro de cavalo e 0,5% de FBS com antibióticos), de um dia para o outro.
Na manhã seguinte, remover o meio e lavar as células com PBS. Raspar as células da placa, suspender as células do poço em 2 mL de meio pobre em soro. Contar o número de células e 165 adicionar mais meio pobre em soro, de modo a atingir uma densidade celular final de 5xl05 células/mL.
Adicionar 200 pL da suspensão celular a cada poço da placa de 96 poços (equivalente a lxlO5 células/poço) . Adicionar 50 pL de sobrenadante produzido pelo Exemplo 11, 37 °C, durante 48 a 72 h. Como um controlo positivo, pode ser utilizado um factor de crescimento conhecido por activar células PC12 através de EGR, tal como 50 ng/pL de factor de crescimento neuronal (NGF) . É tipicamente verificada uma indução de SEAP superior a cinquenta vezes nos poços de controlo positivo. Ensaiar por SEAP o sobrenadante de acordo com o Exemplo 17.
Exemplo 16: Ensaio de Rastreio de Alta Capacidade para Actividade de Célula T O NF-κΒ (Factor Nuclear kB) é um factor de transcrição activado por uma ampla variedade de agentes, incluindo as citocinas inflamatórias IL-1 e TNF, CD30 e CD40, linfotoxina alfa e linfotoxina beta, por exposição a LPS ou trombina e por expressão de determinados produtos génicos virais. Como um factor de transcrição, o NF-κΒ regula a expressão de genes envolvidos na activação celular imunitária, controlo de apoptose (o NF-κΒ parece blindar as células da apoptose), desenvolvimento de células B e T, respostas antivirais e antimicrobianas e respostas a múltiplo stress.
Em condições não estimuladas, o NF-κΒ é retido no citoplasma com I-κΒ (Inibidor kB) . Contudo, após estimulação, o Ι-kB é fosforilado e degradado, causando o deslocamento de NF-kB para o núcleo activando, desse modo, a transcrição de genes 166 alvo. Genes alvo activados por NF-κΒ incluem IL-2, IL-6, GM-CSF, ICAM-1 e MHC de classe 1.
Em virtude do seu papel central e capacidade para responder a uma gama de estímulos, construções repórter utilizando o elemento promotor NF-κΒ, são utilizadas para rastrear os sobrenadantes produzidos no Exemplo 11. Activadores ou inibidores de NF-kB seriam úteis no tratamento de doenças. Por exemplo, inibidores de NF-κΒ poderiam ser utilizados para tratar aquelas doenças relacionadas com a activação aguda ou crónica de NF-kB, tal como artrite reumatóide.
De modo a construir um vector contendo o elemento promotor NF-κΒ, é empregue uma estratégia baseada em PCR. 0 iniciador a montante contém quatro cópias em série do sítio de ligação de NF-κΒ (GGGGACTTTCCC) (SEQ ID N°: 8), 18 pb da sequência complementar à extremidade 5' da sequência promotora precoce de SV40 e é flanqueado com um sitio Xhol:
5’:GCGGCCTCGAGGGGA(mTCCCGGGGACTTTCCGGGGACnTCCGGGAC TTTCCATCCTGCCATCTCAATTAG:3’ (SEQ ID W: 9) 0 iniciador a jusante é complementar à extremidade 3' do promotor de SV40 e é flanqueado com um sitio Hind III: 5' :GCGGCAAGCTTTTTGCAAAGCCTAGGC:3' (SEQ ID N° : 4) A amplificação por PCR é realizada utilizando o molde do promotor de SV40 presente no plasmídeo pB-gal:promotor, obtido da Clontech. 0 fragmento de PCR resultante é digerido com Xhol e
HindIII e subclonado dentro de BLSK2-. (Stratagene) A sequenciação com os iniciadores T7 e T3 confirma que o inserto contém a seguinte sequência: 167 5 * :CTCG AGGGGACTTTCCCGGGGACTTTCCGGGGACTTTCCGGG ACTTTCC ATCTGCCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCA TCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACT AATTrTTTTTATTrATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTC C AGAAGTAGTG AGG AGGCTTTTTTGG AGGCCT AGGCTTTTGC AAAAAGCTT: 3’ (SEQ ID NS; 10)
Em seguida, substituir o elemento promotor minimo de SV40, presente no plasmideo SEAP2-promotor (Clontech), com este fragmento NF-KB/SV40, utilizando Xhol e HindIII. Contudo, este vector não contém um gene de resistência a neomicina e, por conseguinte, não é preferido para sistemas de expressão de mamífero.
Para produzir linhas celulares de mamífero estáveis, a cassete NF-kB/SV40/SEAP é removida do vector NF-kB/SEAP anterior, utilizando as enzimas de restrição Sall e Notl e inserida dentro de um vector contendo resistência a neomicina. Particularmente, a cassete NF-KB/SV40/SEAP foi inserida dentro de pGFP-1 (Clontech), substituindo o gene GFP, após restrição de pGFP-1 com Sall e Notl.
Depois do vector NF-KB/SV40/SEAP/Neo ser criado, células T Jurkat estáveis são criadas e mantidas de acordo com o protocolo descrito no Exemplo 13. De um modo semelhante, o método para ensaiar sobrenadantes com estas células T Jurkat estáveis também é descrito no Exemplo 13. Como um controlo positivo, o TNF alfa exógeno (0,1, 1, 10 ng) é adicionado aos poços H9, H10 e Hll, com uma activação de 5-10 vezes tipicamente observada. 168
Exemplo 17: Ensaio para Actividade de SEAP
Como uma molécula repórter para os ensaios descritos nos Exemplos 13-16, a actividade de SEAP é ensaiada utilizando o kit Tropix Phospho-light (Cat. BP-400), de acordo com seguinte processo geral. 0 kit Tropix Phospho-light proporciona a Diluição, Ensaio e Tampões de Reacção utilizados abaixo.
Iniciar um doseador com o Tampão de Diluição 2,5x e dispensar 15 pL de tampão de diluição 2,5x para dentro de placas Optiplate contendo 35 pL de um sobrenadante. Selar as placas com um selante plástico e incubar, a 65 °C, durante 30 min. Separar as placas Optiplate para evitar aquecimento desigual.
Arrefecer as amostras para temperatura ambiente, durante 15 minutos. Esvaziar o doseador e iniciar com o Tampão de Ensaio. Adicionar 50 pL de Tampão de Ensaio e incubar, à temperatura ambiente, 5 min. Esvaziar o doseador e iniciar com o Tampão de Reacção (ver a tabela abaixo). Adicionar 50 pL de Tampão de Reacção e incubar, à temperatura ambiente, 20 minutos. Uma vez que a intensidade do sinal quimioluminescente é dependente do tempo e demora cerca de 10 minutos a ler 5 placas no luminómetro, devem tratar-se 5 placas de cada vez e começar o segundo conjunto 10 minutos mais tarde.
Ler a unidade de luz relativa no luminómetro. Marcar H12 como branco e imprimir os resultados. Um aumento em quimioluminescência indica actividade repórter. 169
Formulação de Tampão de Reacção: N° de placas Rxn diluente de tampão (mL) CSPD (mL) 10 60 3 11 65 3,25 12 70 3,5 13 75 3, 75 14 80 4 15 85 4,25 16 90 4,5 17 95 4, 75 18 100 5 19 105 5,25 20 110 5,5 21 115 5, 75 22 120 6 23 125 6,25 24 130 6,5 25 135 6,75 26 140 7 27 145 7,25 28 150 7,5 29 155 7, 75 30 160 8 31 165 8,25 32 170 8,5 33 175 8, 75 170 N° de placas Rxn diluente de tampão (mL) CSPD (mL) 34 180 9 35 185 9,25 36 190 9,5 37 195 9, 75 38 200 10 39 205 10, 25 40 210 10, 5 41 215 10, 75 42 220 11 43 225 11, 25 44 230 11,5 45 235 11, 75 46 240 12 47 245 12,25 48 250 12,5 49 255 12, 75 50 260 13
Exemplo 18: Ensaio de Rastreio de Alta Capacidade Identificando Alterações em Concentração de Molécula Pequena e Permeabilidade de Membrana
Sabe-se que a ligação de um ligando a um receptor altera níveis intracelulares de moléculas pequenas, tal como cálcio, potássio, sódio e pH, assim como altera o potencial de membrana. 171
Estas alterações podem ser medidas num ensaio, de modo a identificar sobrenadantes que se ligam a receptores de uma particular célula. Embora a protocolo seguinte descreva um ensaio para cálcio, este protocolo pode ser facilmente modificado para detectar alterações em potássio, sódio, pH, potencial de membrana ou qualquer outra molécula pequena que seja detectável por uma sonda fluorescente. 0 ensaio seguinte utiliza Leitor de Placas de Imagiologia Fluorométrica ("FLIPR") para medir alterações em moléculas fluorescentes (Sondas Moleculares) que se ligam a moléculas pequenas. Claramente, qualquer molécula fluorescente detectando uma molécula pequena pode ser utilizada no lugar da molécula fluorescente de cálcio, fluo-3, aqui utilizada.
Para células aderentes, semear as células a 10000-20000 células/poço numa placa de 96 poços preta Co-star com fundo raso. A placa é incubada numa incubadora de CO2 durante 20 horas. As células aderentes são lavadas duas vezes num lavador Biotek com 200 pL de HBSS (Solução Salino Equilibrada de Hank) deixando 100 pL de tampão após a lavagem final.
Uma solução-mãe de 1 mg/mL de fluo-3 é preparada em 10% de DMSO de ácido plurónico. Para carregar as células com fluo-3, 50 pL de 12 pg/mL de fluo-3 são adicionados a cada poço. A placa é incubada, a 37 °C, numa incubadora de CO2, durante 60 min. A placa é lavada quatro vezes no lavador Biotek com HBSS, deixando 100 pL de tampão.
Para células não aderentes, as células são separadas dos meios de cultura por concentração no fundo do tubo. As células são ressuspendidas para 2-5xl06 células/mL com HBSS num tubo 172 cónico de 50 mL. 4 pL de solução de fluo-3 a 1 mg/mL em 10% de DMSO de ácido plurónico são adicionados a cada mL de suspensão celular. O tubo é, depois, colocado num banho-maria, a 37 °C, durante 30-60 min. As células são lavadas duas vezes com HBSS, ressuspendidas para lxlO6 células/mL e dispensadas dentro de uma microplaca, 100 pL/poço. A placa é centrifugada, a 1000 rpm, durante 5 min. A placa é, depois, lavada uma vez em Denley
CellWash com 200 pL, seguida de uma etapa de aspiração para 100 pL de volume final.
Para um ensaio não baseado em células, cada poço contém uma molécula fluorescente, tal como fluo-3. O sobrenadante é adicionado ao poço e uma alteração em fluorescência é detectada.
De modo a medir a fluorescência de cálcio intracelular, o FLIPR é regulado para os seguintes parâmetros: (1) Ganho de sistema é 300-800 mW; (2) Tempo de exposição é 0,4 segundos; (3) F/diafragma de câmara é F/2; (4) Excitação é 488 nm; (5) Emissão é 530 nm; e (6) Adição de amostra é 50 pL. A emissão aumentada a 530 nm indica um evento de sinalização extracelular que resultou num aumento na concentração de Ca++ intracelular.
Exemplo 19: Ensaio de Rastreio de Alta Capacidade Identificando Actividade de Tirosina-cinase
As Proteínas Tirosinas-Cinases (PTK) representam um grupo diverso de cinases transmembranares e citoplasmáticas. Dentro do grupo de Receptores de Proteína Tirosina-Cinase (RPTK), estão receptores para uma gama de factores de crescimento mitogénicos e metabólicos incluindo os PDGF, FGF, EGF, NGF, HGF e subfamílias de receptores de Insulina. Adicionalmente, existe 173 uma grande família de RPTK relativamente à qual o correspondente ligando é desconhecido. Os ligandos para RPTK incluem, principalmente, pequenas proteínas segregadas, mas também proteínas membranares e de matriz extracelular. A activação de RPTK por ligandos envolve dimerização de receptor mediada por ligando, resultando na transfosforilação das subunidades de receptor e activação das tirosinas-cinases citoplasmáticas. As tirosinas-cinases citoplasmáticas incluem tirosinas-cinases associadas a receptor da família src (e. g., src, yes, lck, lyn, fyn) e proteínas tirosinas-cinases não ligadas a receptor e citosólicas, tal como a família Jak, cujos membros medeiam a transdução de sinal desencadeada pela superfamília de receptores de citocina (e. g., as Interleucinas, Interferões, GM-CSF e Leptina).
Em virtude da ampla gama de factores conhecidos capazes de estimularem actividade de tirosina-cinase, é de interesse a identificação de novas proteínas humanas segregadas, capazes de activarem vias de transdução de sinal de tirosina-cinase. Por conseguinte, o seguinte protocolo é concebido para identificar aquelas novas proteínas humanas segregadas, capazes de activarem as vias de transdução de sinal de tirosina-cinase.
Semear células alvo (e. g., queratinócitos primários) a uma densidade de, aproximadamente, 25000 células por poço em Loprodyne Silent Screen Plates de 96 poços, adquiridas a Nalge Nunc (Naperville, IL) . As placas são esterilizadas com duas enxaguadelas de 30 minutos com etanol a 100%, enxaguadas com água e secas, de um dia para o outro. Algumas placas são revestidas, durante 2 h., com 100 mL de colagénio tipo I de grau de cultura celular (50 mg/mL), gelatina (2%) ou polilisina 174 (50 mg/mL), podendo ser todos adquiridos a Sigma Chemicals (St. Louis, MO), ou 10% de Matrigel, adquirido a Becton Dickinson (Bedford, MA), ou soro de vitelo, enxaguadas com PBS e armazenadas a 4 °C. O crescimento celular nestas placas é ensaiado através da sementeira de 5000 células/poço em meio de crescimento e quantificação indirecta do número de células, através da utilização de alamarBlue, como descrito pelo fabricante Alamar Biosciences, Inc. (Sacramento, CA) . Após 48 h., coberturas de placas Falcon N° 3071 da Becton Dickinson (Bedford, MA) são utilizadas para cobrir as Loprodyne Silent Screen Plates. As placas de cultura celular Falcon Microtest III também podem ser utilizadas em algumas experiências de proliferação.
De modo a preparar extractos, células A431 são inoculadas sobre as membranas de nylon de placas Loprodyne (20000/200 mL/poço) e cultivadas, de um dia para o outro, em meio completo. As células são submetidas a quiescência por incubação em meio basal livre de soro, durante 24 h. Após 5-20 minutos de tratamento com EGF (60 ng/mL) ou 50 pL do sobrenadante produzido no Exemplo 11, o meio foi removido e 100 mL de tampão de extracção ( (HEPES a 20 mM, pH 7,5, NaCl a 0,15 M, Triton X-100 a 1%, SDS a 0,1%, Na3P04 a 2 mM, Na4P207 a 2 mM e um cocktail de inibidores de protease (N° 1836170), obtido da Boeheringer Mannheim (Indianapolis, IN), são adicionados a cada poço e a placa é agitada num agitador rotativo, durante 5 minutos, a 4 °C. A placa é, depois, colocada num colector de transferência a vácuo e o extracto filtrado através dos fundos de membrana de 0,45 mm de cada poço utilizando vácuo doméstico. Os extractos são recolhidos numa captura/placa de 96 poços no fundo do colector a vácuo e imediatamente colocados sobre gelo. De modo a obter-se extractos 175 clarificados por centrifugação, o conteúdo de cada poço, após solubilização com detergente durante 5 minutos, é removido e centrifugado, durante 15 minutos, a 4 °C, a 16000 x g.
Testar os extractos filtrados para níveis de actividade de tirosina-cinase. Embora sejam conhecidos muitos métodos de detecção de actividade de tirosina-cinase, é aqui descrito um método.
Em geral, a actividade de tirosina-cinase de um sobrenadante é avaliada através da determinação da sua capacidade para fosforilar um resíduo de tirosina num substrato específico (um péptido biotinilado). Péptidos biotinilados que podem ser utilizados para este efeito incluem PSKl (correspondendo aos aminoácidos 6-20 da cinase de divisão celular cdc2-p34) e PSK2 (correspondendo aos aminoácidos 1-17 de gastrina). Ambos os péptidos são substratos para uma gama de tirosinas-cinases e estão disponíveis a partir da Boehringer Mannheim. A reacção de tirosina-cinase é implementada através da adição dos seguintes componentes, por ordem. Primeiro, adicionar 10 pL de Péptido Biotinilado a 5 μΜ, depois, 10 pL de ATP/Mg2+ (ATP a 5 mM/MgCl2 a 50 mM), depois, 10 pL de Tampão de Ensaio 5x (cloridrato de imidazole a 40 mM, pH 7,3, beta-glicerofosfato a 40 mM, EGTA a 1 mM, MgCl2 a 100 mM, MnCl2 a 5 mM, BSA a 0,5 mg/mL), depois, 5 pL de Vanadato de Sódio (1 mM) e, depois, 5 pL de água. Misturar os componentes suavemente e pré-incubar a mistura de reacção, a 30 °C, durante 2 min. iniciar a reacção através da adição de 10 pL da enzima de controlo ou do sobrenadante filtrado. 176 A reacção de ensaio de tirosina-cinase é, depois, terminada através da adição de 10 pL de EDTA a 120 mM e colocar as reacções sobre gelo. A actividade de tirosina-cinase é determinada através da transferência de alíquota de 50 pL de mistura de reacção para um módulo de placa de microtitulação (MTP) e incubação a 37 °C, durante 20 min. Isto permite que a placa de 96 poços revestida com estreptavadina se associe com o péptido biotinilado. Lavar o módulo mtp com 300 pL/poço de PBS quatro vezes. Em seguida, adicionar 75 pL de anticorpo anti-fosfotirosina conjugado a peroxidase de rábano (anti-P-Tyr-POD (0,5 pg/mL)) a cada poço e incubar, a 37 °C, durante uma hora. Lavar o poço como anteriormente.
Em seguida, adicionar 100 pL de solução de substrato de peroxidase (Boehringer Mannheim) e incubar à temperatura ambiente durante, pelo menos, 5 min. (até 30 min.). Medir a absorvência da amostra a 405 nm através da utilização de leitor ELISA. O nivel de actividade de peroxidase ligada é quantificado utilizando um leitor ELISA e reflecte o nivel de actividade de tirosina-cinase.
Exemplo 20: Ensaio de Rastreio de Alta Capacidade Identificando Actividade de Fosforilagão
Como uma potencial alternativa e/ou complemento ao ensaio de actividade de proteína tirosina-cinase descrito no Exemplo 19, também pode ser utilizado um ensaio que detecte activação (fosforilação) de importantes intermediários de transdução de sinal intracelulares. Por exemplo, como se descreve abaixo, um 177 ensaio particular pode detectar fosforilação de tirosina-cinases Erk-1 e Erk-2. Contudo, a fosforilação de outras moléculas, tais como Raf, JNK, p38 MAP, cinase cinase Map (MEK), cinase MEK, Src, cinase Especifica de Músculo (MuSK), IRAK, Tec e Janus, assim como qualquer outra molécula de fosfoserina, fosfotirosina ou fosfotreonina, pode ser detectada através da substituição destas moléculas por Erk-1 ou Erk-2 no seguinte ensaio.
Especificamente, as placas de ensaio são preparadas através do revestimento dos poços de uma placa de ELISA de 96 poços com 0,1 mL de proteína G (1 pg/mL), durante 2 h, à temp. ambiente (t.a.). As placas são, depois, enxaguadas com PBS e bloqueadas com BSA/PBS a 3%, durante 1 h., à t.a. As placas de proteína G são, depois, tratadas com 2 anticorpos monoclonais comerciais (100 ng/poço) contra Erk-1 e Erk-2 (1 h. à t.a.) (Santa Cruz Biotechnology). (De modo a detectar outras moléculas, esta etapa pode ser facilmente modificada através da substituição de um anticorpo monoclonal detectando qualquer das moléculas anteriormente descritas). Após 3-5 enxaguadelas com PBS, as placas são armazenadas, a 4 °C, até à sua utilização. Células A431 são inoculadas, a 20000/poço, numa placa de filtro Loprodyne de 96 poços e cultivadas, de um dia para o outro, em meio de crescimento. As células são, depois, submetidas a inanição, durante 48 h, em meio basal (DMEM) e, depois, tratadas com EGF (6 ng/poço) ou 50 pL dos sobrenadantes obtidos no Exemplo 11, durante 5-20 minutos. As células são, depois, solubilizadas e os extractos filtrados directamente para dentro da placa de ensaio.
Após incubação com o extracto, durante 1 h, à t.a., os poços, são de novo, enxaguados. Como um controlo positivo, é 178 utilizada uma preparação comercial de cinase MAP (10 ng/poço), em vez do extracto A431. As placas são, depois, tratadas com um anticorpo policlonal (coelho) (1 pg/mL) comercial que reconhece especificamente o epitopo fosforilado das cinases Erk-1 e Erk-2 (1 h, à t.a.). Este anticorpo é biotinilado por processos padrão. O anticorpo policlonal ligado é, depois, quantificado por incubações sucessivas com reagente de estimulação de fluorescência, Európio-estreptavidina e Európio, no instrumento Wallac DELFIA (fluorescência de resolução temporal). Um sinal fluorescente aumentado acima do fundo indica uma fosforilação.
Exemplo 21: Método de Determinação de Alterações num Gene Correspondendo a um Polinucleótido ARN isolado a partir de famílias integrais ou indivíduos doentes, apresentando-se com um fenótipo de interesse (tal como uma doença), deve ser isolado. O ADNc é, depois, produzido a partir destas amostras de ARN, utilizando protocolos conhecidos na técnica. (Ver, Sambrook). O ADNc é, depois, utilizado como um molde para PCR, empregando iniciadores circundando regiões de interesse na SEQ ID N°: X. Condições de PCR sugeridas consistem em 35 ciclos a 95 °C, durante 30 segundos; 60-120 segundos a 52-58 °C; e 60-120 segundos a 70 °C, utilizando soluções tampão descritas em Sidransky, D., et al., Science 252:706 (1991) .
Os produtos de PCR são, depois, sequenciados utilizando iniciadores marcados em qualquer extremidade 5' com T4 polinucleótido cinase, empregando SequiTherm Polimerase. (Epicentre Technologies) . Os bordos intrão-exão de exões
seleccionados também são determinados e os produtos de PCR 179 genómicos analisados, de modo a confirmar os resultados. Os produtos de PCR albergando mutações suspeitas são, depois, clonados e sequenciados, de modo a validar os resultados da sequenciação directa.
Os produtos de PCR são clonados em vectores com caudas T, como descritos em Holton, T.A. e Graham, M.W., Nucleic Acids Research, 19:1156 (1991) e sequenciados com T7 polimerase (United States Biochemical). Indivíduos afectados são identificados por mutações não presentes em indivíduos não afectados.
Os rearranjos genómicos também são observados como um método de determinação de alterações num gene correspondendo a um polinucleótido. Clones genómicos, isolados de acordo com o Exemplo 2, são Nick-traduzidos com 5'-trifosfato de digoxigenindesoxi-uridina (Boehringer Manheim), e FISH, realizada como descrito em Johnson, Cg. et al., Methods Cell Biol. 35:73-99 (1991). A hibridação com a sonda marcada é efectuada utilizando um vasto excesso de ADN cot-1 humano, para hibridação específica ao correspondente lócus genómico.
Os cromossomas são contrastados com 4,6-diamino-2-fenilidole e iodeto de propídio, produzindo uma combinação de bandas C e R. As imagens alinhadas para mapeamento preciso são obtidas utilizando um conjunto de filtro de banda tripla (Chroma Technology, Brattleboro, VT), em combinação com uma câmara com dispositivo de acoplamento de carga arrefecido (Photometrics, Tucson, AZ) e filtros de comprimento de onda de excitação variável. (Johnson, Cv. et al., Genet. Anal. Tech. Appl., 8:75 (1991)). A recolha de imagem, análise e medições de comprimento fraccionado cromossómico são realizadas utilizando o ISee 180
Graphical Program System. (Inovision Corporation, Durham, NC) . As alterações cromossómicas da região genómica hibridada pela sonda são identificadas como inserções, deleções e translocações. Estas alterações são utilizadas como um marcador de diagnóstico para uma doença associada.
Exemplo 22: Método de Detecção de Níveis Anormais de um Polipéptido numa Amostra Biológica
Um polipéptido da presente invenção pode ser detectado numa amostra biológica e, se um nivel aumentado ou diminuído do polipéptido for detectado, este polipéptido é um marcador para um particular fenótipo. Os métodos de detecção são numerosos e, deste modo, compreende-se que um especialista na técnica possa modificar o seguinte ensaio de modo a servir as suas particulares necessidades.
Por exemplo, os ELISA de sanduíche de anticorpo são utilizados para detectar polipéptidos numa amostra, de um modo preferido, uma amostra biológica. Poços de uma placa de microtitulação são revestidos com anticorpos específicos, a uma concentração final de 0,2 a 10 pg/mL. Os anticorpos são monoclonais ou policlonais e são produzidos pelo método descrito no Exemplo 10. Os poços são bloqueados, de modo que a ligação não específica do polipéptido aos poços seja reduzida.
Os poços revestidos são, depois, incubados durante > 2 horas, à t.a., com uma amostra contendo o polipéptido. De um modo preferido, devem ser utilizadas diluições em série da amostra, de modo a validar os resultados. 181
As placas são, depois, lavadas três vezes com água desionizada ou destilada, de modo a remover polipéptido não ligado.
Em seguida, 50 pL de conjugado de fosfatase alcalina especifica de anticorpo, a uma concentração de 25-400 ng, são adicionados e incubados, durante 2 horas, à temperatura ambiente. As placas são, de novo, lavadas, três vezes com água desionizada ou destilada, de modo a remover conjugado não ligado.
Adicionar 75 pL de solução de substrato 4-metilumbeliferil fosfato (MUP) ou p-nitrofenil fosfato (NPP) a cada poço e incubar, 1 hora, à temperatura ambiente. Medir a reacção com um leitor de placas de microtitulação. Preparar uma curva-padrão, utilizando diluições em série de uma amostra de controlo e representar graficamente a concentração de polipéptido no eixo X (escala log) e a fluorescência ou absorvência no eixo Y (escala linear). Interpolar a concentração do polipéptido na amostra utilizando a curva-padrão.
Exemplo 23: Formulando um Polipéptido A composição de polipéptido segregado será formulada e doseada num modo consistente com boas práticas médicas, tendo em conta o estado clinico do indivíduo doente (especialmente os efeitos secundários do tratamento com o polipéptido segregado isoladamente), o local de distribuição, o método de administração, o programa de administração e outros factores conhecidos dos médicos. A "quantidade eficaz" para os presentes efeitos é, deste modo, determinada por tais considerações. 182
Como uma proposição geral, a quantidade farmaceuticamente eficaz total de polipéptido segregado, administrada parentericamente por dose, será na gama de cerca de 1 pg/kg/dia a 10 mg/kg/dia de peso corporal de doente embora, como notado anteriormente, esta estará submetida a discrição terapêutica. De um modo mais preferido, esta dose é, pelo menos, 0,01 mg/kg/dia e, de um modo muito preferido, para humanos, entre cerca de 0,01 e 1 mg/kg/dia para a hormona. Se proporcionado continuamente, o polipéptido segregado é tipicamente administrado a uma taxa de dose de cerca de 1 pg/kg/hora a cerca de 50 pg/kg/hora, por 1-4 injecções por dia ou por infusões subcutâneas contínuas, por exemplo, utilizando uma minibomba. Também pode ser empregue um saco de solução intravenosa. A duração de tratamento necessária para observar alterações e o intervalo após tratamento para que ocorram respostas parece variar, dependendo do efeito desejado.
As composições farmacêuticas contendo a proteína segregada da invenção são administradas oralmente, rectalmente, parentericamente, intracistemalmente, intravaginalmente, intraperitonealmente, topicamente (como pós, pomadas, géis, gotas ou adesivo transdérmico), bucalmente ou como uma spray oral ou nasal. "Veículo farmaceuticamente aceitável" refere-se a um espessante, diluente, material de encapsulamento não tóxico, sólido, semi-sólido ou líquido ou formulação auxiliar de qualquer tipo. O termo "parentérico", como aqui utilizado, refere-se a modos de administração que incluem injecção e infusão intravenosa, intramuscular, intraperitoneal, intra-esternal, subcutânea e intra-articular. O polipéptido segregado também é adequadamente administrado por sistemas de libertação prolongada. Exemplos adequados de 183 composições de libertação prolongada incluem matrizes poliméricas semipermeáveis na forma de peças com determinada forma, e. g., filmes, ou microcápsulas. Matrizes de libertação prolongada incluem poliláctidos (Pat. U.S. N° 3773919, documento EP 58481), copolimeros de ácido L-glutâmico e gama-etil-L-glutamato (Sidman, U. et al., Biopolymers 22:547-556 (1983)), poli (2- hidroxietil metacrilato) (R. Langer et al., J. Biomed. Mater. Res. 15:167-277 (1981) e R. Langer, Chem. Tech. 12:98-105 (1982)), acetato de etileno vinilico (R. Langer et al.) ou ácido poli-D- (-)-3-hidroxibutirico (documento EP 133988). Composições de libertação prolongada também incluem polipéptidos aprisionados em lipossomas. Lipossomas contendo o polipéptido segregado são preparados por métodos conhecidos per se: Documento DE 3218121; Epstein et al., Proc. Natl. Acad. Sei. USA 82:3688-3692 (1985); Hwang et al., Proc. Natl. Acad. Sei. USA 77:4030-4034 (1980); documentos EP 52322; EP 36676; EP 88046; EP 143949; EP 142641; Pedido de Patente Japonesa 83-118008; Pat. U.S. Nos 4485045 e 4544545; e documento EP 102324. Habitualmente, os lipossomas são do tipo unilamelar pequeno (cerca de 200-800 Angstroms), nos quais o teor de lipido é superior a cerca de 30 mol. de percentagem de colesterol, sendo a proporção seleccionada ajustada para terapia óptima de polipéptido segregado.
Para administração parentérica, numa forma de realização, o polipéptido segregado é formulado, em geral, através da sua mistura a um grau de pureza desejado, numa forma injectável de dosagem (solução, suspensão ou emulsão, com um veiculo farmaceuticamente aceitável, í. e., um que seja não tóxico para os receptores, às dosagens e concentrações empregues, e seja compatível com outros ingredientes da formulação. Por exemplo, a formulação, de um modo preferido, não inclui agentes de oxidação 184 e outros compostos que sejam conhecidos por serem deletérios para polipéptidos.
Em geral, as formulações são preparadas através da colocação em contacto do polipéptido, uniformemente e intimamente, com veículos líquidos ou veículos sólidos finamente divididos ou ambos. Depois, se necessário, o produto é formado na formulação desejada. De um modo preferido, o veículo é um veículo parentérico, de um modo mais preferido, uma solução que seja isotónica com o sangue do receptor. Exemplos de tais transportadores veículos incluem água, solução salina, solução de Ringer e solução de dextrose. Veículos não aquosos, tais como óleos fixos e oleato de etilo, também são aqui úteis, assim como lipossomas. 0 veículo, adequadamente, contém quantidades menores de aditivos, tais como substâncias que melhoram a isotonicidade e estabilidade química. Tais materiais são não tóxicos para os receptores às dosagens e concentrações empregues e incluem tampões, tais como fosfato, citrato, succinato, ácido acético e outros ácidos orgânicos ou seus sais; antioxidantes, tal como ácido ascórbico; polipéptidos de baixo peso molecular (menos de cerca de dez resíduos), e. g., poliarginina ou tripéptidos; proteínas, tais como albumina sérica, gelatina ou imunoglobulinas; polímeros hidrófilos, tal como polivinilpirrolidona; aminoácidos, tais como glicina, ácido glutâmico, ácido aspártico ou arginina; monossacáridos, dissacáridos e outros hidratos de carbono, incluindo celulose ou seus derivados, glucose, manose ou dextrinas; agentes quelantes, tal como EDTA; álcoois de açúcares, tais como manitol ou sorbitol; iões homólogos, tal como sódio; e/ou surfactantes não iónicos, tais como polissorbatos, poloxameros ou PEG. 185 0 polipéptido segregado é tipicamente formulado em tais transportadores, a uma concentração de cerca de 0,1 mg/mL a 100 mg/mL, de um modo preferido 1-10 mg/mL, a um pH de cerca de 3 a 8. Será compreendido que a utilização de determinados dos excipientes, veículos ou estabilizantes anteriores, irá resultar na formação de sais polipeptídicos.
Qualquer polipéptido a ser utilizado paa administração terapêutica pode ser estéril. A esterilidade é facilmente alcançada por filtração através de membranas de filtração estéreis (e. g., membranas de 0,2 mícron). As composições polipeptídicas terapêuticas são, em geral, colocadas dentro de um recipiente tendo uma porta de acesso estéril, por exemplo, um saco de solução intravenosa ou um frasquinho tendo uma rolha perfurável por uma agulha de injecção hipodérmica.
Habitualmente, os polipéptidos serão armazenados em recipientes unitários ou multi-dose, por exemplo, ampolas ou frasquinhos selados, como uma solução aquosa ou como uma formulação liofilizada para reconstituição. Como um exemplo de uma formulação liofilizada, frasquinhos de 10 mL são enchidos com 5 mL de solução polipeptídica aquosa esterilizada por filtração a 1% (p/v) e a mistura resultante é liofilizada. A solução de infusão é preparada através da reconstituição do polipéptido liofilizado, utilizando Água para Injectável bacteriostática. A invenção também proporciona uma embalagem ou kit farmacêutico, compreendendo um ou mais recipientes cheios com um ou mais dos ingredientes das composições farmacêuticas da invenção. Associada a tal recipiente(s) pode estar uma advertência na forma prescrita por uma agência governamental 186 regulando a preparação, utilização ou venda de medicamentos ou produtos biológicos, advertência que reflecte a aprovação pela agência, da preparação, utilização ou venda para administração humana. Adicionalmente, os polipéptidos da presente invenção podem ser empregues em conjunto com outros compostos terapêuticos.
Exemplo 24: Método de Tratamento de Níveis Diminuídos do Polipéptido
Será entendido que os estados causados por uma diminuição no nivel de expressão padrão ou normal de uma proteína segregada num indivíduo podem ser tratados através da administração do polipéptido da presente invenção, de um modo preferido, na forma segregada. Deste modo, a invenção também proporciona um método de tratamento de um indivíduo a necessitar de um nível aumentado do polipéptido, compreendendo administrar a um tal indivíduo uma composição farmacêutica compreendendo uma quantidade do polipéptido, de modo a aumentar o nível de actividade do polipéptido num tal indivíduo.
Por exemplo, um doente com níveis diminuídos de um polipéptido recebe uma dose diária de 0,1-100 pg/kg do polipéptido, durante seis dias consecutivos. De um modo preferido, o polipéptido é na forma segregada. Os detalhes exactos do esquema de doseamento, com base na administração e formulação, são proporcionados no Exemplo 23. 187
Exemplo 25: Método de Tratamento de Níveis Aumentados do Polipéptido A tecnologia anti-sentido é utilizada para inibir a produção de um polipéptido da presente invenção. Esta tecnologia é um exemplo de um método de diminuição dos níveis de um polipéptido, de um modo preferido, uma forma segregada, em virtude de uma variedade de etiologias, tal como cancro.
Por exemplo, a um doente diagnosticado com níveis anormalmente aumentados de um polipéptido, são administrados polinucleótidos anti-sentido intravenosamente, a 0,5, 1,0, 1,5, 2,0 e 3,0 mg/kg/dia, durante 21 dias. Este tratamento é repetido, após um período de repouso de 7 dias, se o tratamento foi bem tolerado. A formulação do polinucleótido anti-sentido é proporcionada no Exemplo 23.
Exemplo 26: Método de Tratamento Utilizando Terapia Génica
Um método de terapia génica transplanta fibroblastos que são capazes de expressarem um polipéptido, para um doente. Rm geral, os fibroblastos são obtidos de um indivíduo por biopsia de pele. O tecido resultante é colocado em meio de cultura de tecidos e separado em pequenos pedaços. Pequenas porções do tecido são colocadas numa superfície húmida de um frasco de cultura de tecidos, aproximadamente, são colocados dez pedaços em cada frasco. O frasco é virado ao contrário, fechado hermeticamente e deixado à temperatura ambiente, de um dia para o outro. Após 24 horas à temperatura ambiente, o frasco é invertido e as porções de tecido permanecem fixadas ao fundo do frasco e são adicionados meios novos (e. g., meios F12 de Ham, 188 com 10% de FBS, penicilina e estreptomicina) . Os frascos são, depois, incubados a 37 °C durante, aproximadamente, uma semana.
Neste momento, são adicionados meios novos e subsequentemente mudados a cada vários dias. Depois de mais duas
semanas em cultura, uma monocamada de fibroblastos emerge. A monocamada é tripsinizada e pesada para dentro de frascos maiores. pMV-7 (Kirschmeier, P.T. et al., D NA, 7:219-25 (1988)), flanqueado pelas repetições terminais longas do virus do sarcoma murino de Moloney, é digerido com EcoRI e HindIII e subsequentemente tratado com fosfatase intestinal de vitelo. O vector linear é fraccionado em gel de agarose e purificado, utilizando esférulas de vidro. O ADNc codificando um polipéptido da presente invenção pode ser amplificado, utilizando iniciadores de PCR que correspondem às sequências das extremidades 5' e 3', como mostradas no Exemplo 1. De um modo preferido, o iniciador 5' contém um sitio EcoRI e o iniciador 3' inclui um sitio HindIII. Quantidades iguais da estrutura linear do virus do sarcoma murino de Moloney e do fragmento EcoRI e HindIII amplificado, são adicionados em conjunto, na presença de T4 ADN ligase. A mistura resultante é mantida sob condições apropriadas para ligação dos dois fragmentos. A mistura de ligação é, depois, utilizada para transformar bactérias HB101 que são, depois, plaqueadas sobre ágar contendo canamicina, para efeitos de confirmar que o vector tem o gene de interesse adequadamente inserido.
As células de empacotamento anfotrópicas pA317 ou GP+aml2 são cultivadas em cultura de tecidos até densidade confluente, 189 em Meio de Eagle Modificado por Dulbecco (DMEM) com 10% de soro de vitelo (CS), penicilina e estreptomicina. O vector MSV contendo o gene é, depois, adicionado aos meios e as células de empacotamento transduzidas com o vector. As células de empacotamento produzem, agora, partículas virais infecciosas contendo o gene (as células de empacotamento são, agora, referidas como células produtoras). São adicionados novos meios às células produtoras transduzidas e, subsequentemente, os meios são recolhidos de uma placa de 10 cm de células produtoras confluentes. Os meios gastos, contendo as partículas virais infecciosas, são filtrados através de um filtro millipore, de modo a removerem-se células produtoras desprendidas e estes meios são, depois, utilizados para infectar células de fibroblastos. Os meios são removidos de uma placa subconfluente de fibroblastos e rapidamente substituídos com os meios das células produtoras. Estes meios são removidos e substituídos com novos meios. Se o título de vírus for elevado, então virtualmente todos os fibroblastos serão infectados e não é requerida selecção. Se o título for muito baixo, então é necessário utilizar um vector retroviral que tenha um marcador seleccionável, tais como neo ou his. Depois dos fibroblastos terem sido eficientemente infectados, os fibroblastos são analisados, de modo a determinar se é produzida proteína.
Os fibroblastos manipulados são, depois, transplantados para o hospedeiro, isoladamente ou após terem sido cultivados até confluência em esférulas microveículoas cytodex 3. 190 LISTAGEM DA SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE: Human Genome Sciences, Inc., et al. (ii) título DE INVENÇÃO: 32 Proteínas Humanas Segregadas (iii) NÚMERO DA SEQUÊNCIAS: 120 (iv) ENDEREÇO PARA CORRESPONDÊNCIA: (A) DESTINATÁRIO: Human Genome Sciences, Inc. (B) RUA: 9410 Key West Avenue (C) CIDADE: Rockville (D) ESTADO: Maryland
(E) PAÍS: EUA (F) CÓDIGO POSTAL: 20850 (v) FORMA DE LEITURA POR COMPUTADOR: (A) TIPO DE MEIO: Disquete, 3,50 polegadas, armazenamento de 1,4 Mb (B) COMPUTADOR: HP Vectra 486/33 (C) SISTEMA OPERATIVO: MSDOS, versão 6.2 (D) SOFTWARE: ASCII Text (vi) DADOS DO PRESENTE PEDIDO: (A) NÚMERO DE PEDIDO: (B) DATA DE APRESENTAÇÃO: 27 de Maio de 1998 (C) CLASSIFICAÇÃO: 191 (vii) DADOS DOS PEDIDOS ANTERIORES: (A) NÚMERO DE PEDIDO: (B) DATA DE APRESENTAÇÃO: (viii) INFORMAÇÃO DO MANDATÁRIO/AGENTE: (A) NOME: A. Anders Brookes (B) NÚMERO DE REGISTO: 36373
(C) REFERÊNCIA/NÚMERO DE REGISTO: PZ006PCT (vi) INFORMAÇÃO DE TELECOMUNICAÇÕES: (A) TELEFONE: (301) 309-8504 (B) TELEFAX: (301) 309-8439 (2) INFORMAÇÃO PARA SEQ ID N°: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 733 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 1: 192 GGGATCOGGA GCCCAAATCT TCTGACAAAA CTCACACATG CCCACCGTGC CCAGCACCTG 60 AATTCGAGGG TGCACCGTCA GTCTTCCTCT TCCCCCCAAA ACCCAAGGAC ACCCTCATGA 120 TCTCCCGGAC TCCTGAGGTC ACATGCGTGG TGGTGGACGT AAGCCACGAA GACCCTGAGG 180 TCAAGTTCAA CTG3TACGTG GACGGCGTGG AGGTGCATAA TGCCAAGACA AAGCCGCGGG 240 AGGAGCAGTA CAACAGCACG TACCGTGTGG TCAGCGTCCT CACCGTCCTG CACCAGGACT 300 GQCTGAATGG CAAGGAGTAC AAGTGCAAGG TCTCCAACAA AGCCCTCCCA ACCCCCATCG 360 AGAAAACCAT CTCCAAAGCC AAAGGGCAGC CCCGAGAACC ACAGGTGTAC ACCCTGCCCC 420 CATCCCGGGA TGAGCTCACC AAGAACCAGG TCAGCCIGAC CTGCCTGGTC AAAGGCTTCT 480 ATCCAAGCGA CATCGCCGTG GAGTGGGAGA GCAATGGGCA GCCGGAGAAC AACTACAAGA 540 CCACGCCTCC CGTGCTGGAC TCCGACGGCT CCTTCTTCCT CTACAGCAAG CTCACCGTGG 600 ACAAGAGCAG GTGGCAGCAG GGGAACGTCT TCTCATGCTC CGTGATGCAT GAGGCTCTGC 660 ACAACCACTA CACGCAGAAG AGCCTCTCCC TGTCTCCGGG TAAATGAGTG CGACX3GCCGC 720 GACTCTAGAG GAT 733 (2) INFORMAÇÃO PARA SEQ ID N°: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 5 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 2:
Trp Ser Xaa Trp Ser 193 (2) INFORMAÇÃO PARA SEQ ID N°: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 86 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 3: GCGCCTCGAG ATTTCCCCGA MTCTAGATT TCCCCGAAAT GATTTCCCCG MATGATTTC 60 CCCGAAATAT CTGCCATCTC AATTAG 86 (2) INFORMAÇÃO PARA SEQ ID N°: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 4: GCGGCAAGCT TTTTGCAAAG CCTAGGC 27 194 (2) INFORMAÇÃO PARA SEQ ID N°: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 271 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 5: CTCGAGATTT CCCCGAAATC TAGATTTCCC CGAAATGATT TCCCCGAAAT GATITCCCCG 60 AAATATCTGC CATCTCAATT AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC 120 GCCCCTAACT CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA ΤΤΠΤΓΓΓΑΤ 180 7TATGCAGAG GCCGAGGCCG CCTCGGCCTC TGAGCTATTC CAGAAGTAGT GAGGAGGCTT 240 TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT T 271 (2) INFORMAÇÃO PARA SEQ ID N°: 6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 6: GCGCTCGAGG GATGACAGCG ATAGAACCCC GG 32 195 (2) INFORMAÇÃO PARA SEQ ID N°: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 7 GCGAAGCTTC GCGACTCCCC GGATCCGCCT C 31 (2) INFORMAÇÃO PARA SEQ ID N°: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 12 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 8 GGGGACTTTC CC 12 (2) INFORMAÇÃO PARA SEQ ID N°: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 73 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 196 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 9: GCGGCCTCGA GGGGACTTTC CCGGGGACTT TCCGGGGACT TTCCGGGACT TTCCATCCTG 60 CCATCTCAAT TAG 73 (2) INFORMAÇÃO PARA SEQ ID N°: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 256 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 10: CTCGAGGGGA CTTTCCCGGG GACTTTCCGG GGACTTTCCG GGACnTCCA TCTGCCATCT 60 CAATTAGTCA GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC 120 CAGTTCOGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT ΠΤΑΠΤΑΤΰ CAGAGGCCGA 180 GGCCGCCTOG GCCTCTGAGC TATTCCAGAA GTAGTGAGGA GGCTTTTJTG GAGGCCTAGG 240 CTnTGCAAA AAGCTT 256 (2) INFORMAÇÃO PARA SEQ ID N°: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1169 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 197 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 11: GGGGCGCAAA TAGGGTCAGT GGGCCGCTTG GCGKTGTTCG TTGCGGTACC AGGTCCGCGT 60 GAGGGGTTCG GGGGTTCTGG GCAGGCACAA TGGCGTCTCG AGCAGGCCCG CGAGCGGCCG 120 RCACCGACGC AGCGAGCTTT CAGCACCGGG AGCGCGTCGC CATGCACTAC CAGATGAGTG 180 TGACCCTCAA GTATGAAATC AAGAAGCTGA TCTACGTACA TCTGGTCATA TGGCTGCTGC 240 TGGTTGCTAA GATGAGCGTG GGACACCTGA GGCTCTTGTC ACATGATCAG GTGGCCATGC 300 CCTATCAGTG GGAATACCCG TATTTGCTGA GCATTTTGCC CTCTCTCTTG GGCCTTCTCT 360 CCTTTCCCCG CAACAACATT AGCTACCTGG TGCTCTCCAT GATCAGCATG GGACTCTTTT 420 CCATCGCTCC ACTCATTTAT GGCAGCATGG AGATGTTCCC TGCTGCACAG CCTTCTACCC 480 CCATGGCAAG GCCTACOGTT TCCTCTTTGG TTTTTCTGCC GTTTCCATCA TGTACCTGGT 540 GTTGGTGTTG GCAGTGCAAG TGCATGCCTG GCAGTTGTAC TACAGCAAGA AGCTCCTAGA 600 CTCTTGGTTC ACCAGCACAC AGGAGAAGAA GCATAAATGA AGCCTCTTTG GGGTGAAGCC 660 TGGACATCCC ATCGAATGAA AGGACACTAG TACAGCGGTT CCAAAATCCC TTCTGGTGAT 720 TTTAGCAGCT GTGATGTTGG TACCTGGTGC AGACCCAGGC CAAAGTTCTG GAAAGCTCCT 780 TTTGCCATCT GCTGAGGTGG CAAAACTATA ATTTATTCCT GGTTGGCTAG AACTGGGTGA 840 CCAACAGCTA TGAAACAAAT TTCAGCTGTT TGAAGTTGAA CTTTGAGGTT TTTCTTTAAG 900 AATGAGCTTC GTCCTTGCCT CTACTCGGTC ATTCTCCCCA TTTCCATCCA OTACCCCTTA 960 GCCATTGAGA CTAAAGGAAA TAGGGAATAA ATCAAATTAC TTCATCTCTA GGTCACGGGT 1020 CAGGAAACAT TTGGGCAGCT GCTCCCTTGG CAGCTGTGGT CTCCTCTCCA AAGCATTTTA 1080 ATTAAAAACC TCAATAAAGA TGCCX7TGCCC ACAAAAAAAA AAAAAAAAAA AATTCGGGGG 1140 GGGGCCCGGG NMCCMTTN GCCCCTANA 1169 (2) INFORMAÇÃO PARA SEQ ID N°: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1310 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 198 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 12: AATTCGGCAC GAGGCAGCGT CGCGCGGCCC AGTTCCCTTT TCCGGTOGGC GTGGTCTTGC 60 GAGTGGAGTG TCCGCTGTGC CCGGGCCTGC ACCATGAGCG TCCCGGCCTT CATCGACATC 120 AGTGAAGAAG ATCAGGCTGC TGAGCTTCGT GCTTATCTGA AATCTAAAGG AGCTGAGATT 180 TCAGAAGAGA ACTCGGAAGG TGGACTTCAT GTTGATTTAG CTCAAATTAT TGAAGCCTGT 240 GATGTGTGTC TGAAGGAGGA TGATAAAGAT GTTGAAAGTG TGATGAACAG TGTGGTATCC 300 CTACTCTTGA TCCTGGAACC AGACAAGCAA GAAGCTTTGA TTGAAAGCCT ATGTGAAAAG 360 CTGGTCAAAT TTCGCGAAGG TGAACGCCCG TCTCTGAGAC TGCAGTTGTT AAGCAACCTT 420 TTCCACGGGA TGGATAAGAA TACTCCTGTA AGATACACAG TGTATTGCAG CCTTATTAAA 480 GTGGCAGCAT CTTGTGGGGC CATCCAGTAC ATCCCAACTG AGCTGGATCA AGTTAGAAAA 540 TGGATTTCTG ACTGGAATCT CACCACTGAA AAAAAGCACA CCCTTTTAAG ACTACTTTAT 600 GAGGCACTTG TGGATTGTAA GAAGAGTGAT GCTGCTTCAA AAGTCATGGT GGAATTGCTC 660 GGAAGTTACA CAGAGGACAA TGCTTCCCAG GCTCGAGTTG ATGCCCACAG GTGTATTGTA 720 CGAGCATTGA AAGATCCAAA TGCATTTCTT TTTGACCACC TTCTTACTTT AAAACCAGTC 780 AAGTTTTTGG AAGGCGAGCT TATTCATGAT CTTTTAACCA TTTTTGTGAG TGCTAAATTG 840 GCATCATATG TCAAGTTTTA TCAGAATAAT AAAGACITCA TTGATTCACT TGGCCTGTTA 900 CATGAACAGA ATATGGCAAA AATGAGACTA CTTACTTTTA TGGGAATGGC AGTAGAAAAT 960 AAGGAAATTT CTTTTGACAC AATGCAGCAA GAACTTCAGA TTGGAGCTGA TGATGTTGAA 1020 GCATTTGTTA TTGACGCCGT AAGAACTAAA ATGGTCTACT GCAAAATTGA TCAGACCCAG 1080 AGAAAAGTAG TTGTCAGTCA TAGCACACAT CGGACATTTG GAAAACAGCA GTGGCAACAA 1140 CTGTATGACA CACTTAATGC CTGGAAACAA AATCTGAACA AAGTGAAAAA CAGCCTTTTG 1200 AGTCTTTCTG ATACCTGAGT TTTTATGCTT ATAATTTTTG TTCTTTGAAA AAAAAGCCCT 1260 AAATCATAÕT AAAACATTAT AAACTAAAAA AAAAAAAAAA AAAAAAAAAA 1310 199 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1139 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 13: AQGGCANACT TACAGAGATA TCATATGAGA TCACCCCTCG CATTCGTGTC TGGCGCCAGA 60 CCCTCGAGCG GTGCCGGAGC GCASCCAGGT GTGCTTGTGC CTGGGCCAGC TGGAGAGGTC 120 CATTGCCTGG GANGAAGTCT GTCAACAAAG TGACATGTCT AGTCTGCCGG AAGGGTGACA 180 ATGATGAGTT TCTTCTGCTT TGTGATGGGT GTRACCGTGG CTGCCACATT TACTGCCATC 240 GTCCCAAGAT GGAGGCTGTC CCAGAAGGAG ATTGGTTCTG TACTGTCTGT TTGGCTCAGC 300 AGGTGGAGGG AGAATTCACT CAGAAGCCTG GTTTCCCAAA GCGTGGCCAG AAGCGGAAAA 360 GTGGTTATTC GCTGAACTTC TCAGAGGGTG ATGGCCGCCG ACGCCGGGTA CTGTTGAGGG 420 GCCGAGAAAG CCCAGCAGCA GGGCCTCGGT ACTCGGAAGA AGGGCTCTCC CCCTCCAAGC 480 GGCGGCGACT CTCTATGCGG AACCACCACA GTGATCTCAC ATTTTGOGAG ATTATCCTGA 540 TGGAGATGGA GTCCCATGAT GCAGCCTGGC CTTTCCTAGA GCCTGTGAAC CCACGTTTGG 600 TGAGTGGGTA CCGGCGCATC ATCAAAAATC CTATGGATTT TTCCACCATG CGGGAGCGGC 660 TGCTCAGGGG AGGGTACACC AGCTCAGAGG AGTTTGCGGC TGATGCCCTC CTGGTATTTG 720 ACAACTGCCA GACTTTCAAC GAGGATGACT CTGAAGTAGG CAAGGCTGGG CACATCATGC 780 GCCGCTTCTT CGAGAGCCGC TGGGAGGAGT TTTATCAGGG AAAACAGGCC AATCTGTGAG 840 GCAAGGGAGG TGGGGAGTCA CCTTGTGGCA TCTCCCCCCA CCTTCCAAAC AAAAACCTGC 900 CATTTTCACC TGCTGATGCT GCCCTGGGTC CAGACTCAAG TCAGATACAA CCCTGATTTT 960 TGACCTTNCC CTTGGCAGTG CCCCACATCC TCTTATTCCT ACATCCCTTT CTCCCTTCCC 1020 TCCTCTPGCT CCTCAAGTAA GAGGTGCAGA GATGAGGTCC TTCTGGACTA AAAGCCAAAA 1080 AAAGAAAGAA AAAAAWAAAA AAAAAAAAAA ΑΑΆΑΆΑΑΑΑΑ AAAAAAAAAA AAAAAAAAN 1139 200 (2) INFORMAÇÃO PARA SEQ ID N°: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2271 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 14: GTTCCGGGGG ATGCCAGCTC ACTTCTCGGA CAGCGCCCAG ACTGAGGCCT GCTACCACAT 60 GCTGAGCCGG CCCCAGCCGC CACCCGACCC CCTCCTGCTC CAGCGTCTGC CACGGCCCAG 120 CTCCCTGTCA GACAAGACCC AGCTCCACAG CAGGTGGCTG GACTCGTCGC GGTGTCTCAT 180 GCAGCAGGGC ATCAAGGCCG GGGACGCACT CTGGCTGCGC TTCAAGTACT ACAGCTTCTT 240 CGATTTGGAT CCCAAGACAG ACCCCGTGCG GCTGACACAG CTGTATGAGC AGGCCCGGTG 300 GGACCTGCTG CTGGAGGAGA TTGACTCCAC CGAGGAGGAG ATGATGGTGT TTGCCGCCCT 360 GCAGTACCAC ATCAACAAGC TGTCCCAGAG CGGGGAGGTG GGGGAGCCGG CTGGCACAGA 420 201 CCCAGGGCTG GACGACCTGG ATGTGGCCCT GAGCAACCTG GAGGTGAAGC TGGAGGGGTC 480 GGCGCCCACA GATGTGCTGG ACAGCCTCAC CACCATCCCA GAGCTCAAGG ACCATCTCCG 540 AATCTTTCGG CCCCGGAAGC TGACCCTGAA GGGCTACCGC CAACACTGGG TGGTGTTCAA 600 GGAGACCACA CTGTCCTACT ACAAGAGCCA GGACGAGGCC CCTGGGGACC CCATTCAGCA 660 GCTCAACCTC AAGGGCTGTG AGGTGGTTCC CGATGTTAAC GTCTCCGGCC AGAAGTTCTG 720 CATTAAACTC CTAGTGCCCT CCCCTGAGGG CATGAGTGAG ATCTACCTGC GGTGCCAGGA 780 TGAGCAGCAG TATGCCCGCT GGATGGCTGG CTGCCGCCTG GCCTCCAAAG GCCGCACCAT 840 GGCCGACAGC AGCTACACCA GCGAGGTGCA QGCCATCCTG GCCTTCCTCA GCCTGCAGCG 900 CACGGGCAGT GGGGGCCCGG GCAACCACCC CCACGGCCCT GATGCCTCTG CCGAGGGCCT 960 CAACCCCTAC GGCCTCGTTG CCCCCCGTTT CCAGCGAAAG TTCAAGGCCA AGCAGCTCAC 1020 CCCACGGATC CTCGAAGCCC ACCAGAATGT GGCCCAGTTG TCGCTGGCAG AGGCCCAGCT 1080 GCGCTTCATC CAGGCCTGGC AGTCCCTGCC CGACTTCGGC ATCTCCTATG TCATGGTCAG 1140 GTTCAAGGGC AGCAGGAAAG ACGAGATCCT GGGCATCGCC AACAACCGAC TGATCCGCAT 1200 CGACTTGGCC GTGGGCGACG TGGTCAAGAC CTGGCGTTTC AGCAACATGC GCCAGTGGAA 1260 TGTCAACTGG GACATCCGGC AGGTGGCCAT CGAGTTTGAT GAACACATCA ATGTGGCCTT 1320 CAGCTGCGTG TCTGCCAGCT GCCGAATTGT ACACGAGTAT ATCGGGGGCT ACATTTTCCT 1380 GTCGACGCGG GAGCGGGCCC GTGGGGAGGA GCTGGATGAA GACCTCTTCC TGCAGCTCAC 1440 CGGGGGCCAT GAGGCCTTCT GAGGGCTGTC TGATTGCCCC TGCCCTGCTC ACCACCCTGT 1500 CACAGCCACT CCCAAGCCCA CACCCACAGG GGCTCACTGC CCCACACCOG CTCCAGGCAG 1560 GCACCCAGCT GGGCATTTCA CCTGCTGTCA CTGACTTTGT GCAGGCCAAG GACCTGGCAG 1620 GGCCAGACGC TGTACCATCA CCCAGGCCAG GGATGGGGGT GGGGGTCCCT GAGCTCATGT 1680 GGTGCCCCCT TTCCTTGTCT GAGTGGCTGA GGCTGATACC CCTGACCTAT CTGCAGTCCC 1740 CCAGCACACA AGGAAGACCA GATGTAGCTA CAGGATGATG AAACATGGTT TCAAACGAGT 1800 TCTTTCTTGT TACTTTTTAA AATTTCTTTT TTATAAATTA ATATTTTATT GTTGGATCCT 1860 CCTCCTTTCT CTGGAGCTGT GCTTGGGGCT ACTCTGACAC TCTGTCTCTT CATCACCAGC 1920 CAAGGAAAGG GGCnTCCTG ATAAAGACAA GAGTTGGTTA GAGAAAGGGA CACCTAAGTC 1980 AGTCTAGGGT TGGAAGCTAG GAGAGAGGTG AGGGCAGAAG GGCACAGCTT TCAGGAACAA 2040 GGAATAGGGG CTGGGGTKGT KGTTCTCACG GGTAGGCGTA CCTGCAGGGC CTCCTTGAAG 2100 202 TACTTGGGAA GGAGGAAGCC ATCAGTATTC CCTGGAGTCA GAATCACCCC ATTGGCAGAS 2160 CGGAAGAAGG GTATTCCATC TGCTGACAGA GCCAGAGATG TGACTCATGC CCTCCCCGAA 2220 GGCAAAGTCA OCTCCTGCTT TGTCCAGACT CACCTGCCAG AGCCAGGGGT C 2271 (2) INFORMAÇÃO PARA SEQ ID N°: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 626 pares de bases (B) TIPO: ácido nucleico (C) tipo de cadeia: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID N°: 15: ACAACAAACA tcgaaaatcg antatgtgcc ccgaaaagtc ggaacgcaqg CAATCAGTCC 60 GCACGMGCGC AAGTTCAACA TGAAGATGAT ATGAGGCCGG GGCGGGGGGO AGGGACCCCC 120 GGGCGGCCGG GCAGGGGAAG GGGCCTGGCC GCCACCTGCT CACTCTCCAG TCCTTCCCAC 180 CTCCTCCCTA CCCTTCTACA CACGTTCTCT TTCTCCCTCC CGCCTCCGTC CCCTGCTGCC 240 CCCCGCCAGC CCTCACCACC TGCCCTCCTT CTACCAGGAC CTCAGAAGCC CAGACCTGGG 300 GACCCCACCT ACACAGGGGC ATTGACAGAC TGGAGTTGAA AGCOGACGAA CCGACACGCG 360 GCAGAGTCAA TAATTCAATA AAAAAGTTAC GAACTTTCTC TGTAACTTGG GmTCAATAA 420 TTATGGATTT TTATGAAAAC TTGAAATAAT AAAAAGAGAA AAAAACTATT TCCTATAGCT 480 AGTCGGAATG CAAACTTTTG ACGTCCTGAT TGCTCCAGGG CCCTCTTTCC AACTCAGTTT 540 CTTGTTTTTC CTCTTCCTCC TCCTCCTCTT CTTCCTCCTT TCTTTCICIT NCCCCATGGG 600 GGAGG3GTTC ATTCAGGGAA AACAGG 626 203 (2) INFORMAÇÃO PARA SEQ ID N°: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2118 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 16: TTTTCCAGCC ATCTCACTAA TTGTCMTTC CTACCAACTA TTGACAGAAT ACAGAGTTGA 60 TTTTTTAATA AAAAGTTATA TATAATTATC CCTTTAATTA AAGGGAGCAA AGGGGCGTTC 120 CACATGGACA GAGGCTTGGA CCGAGGCCTG GTCACAGCAG CGAGCATCCA GGGTTTGCAG 180 GGACGATGTT ACAGACTCTG TTTTCTGOCT GGCGTTTCAC TTGTCTCTGC TCCTAGCCTG 240 TGCTCTGCCA GCAGCACAGA CATCTGCTCC ATCAGACCTC TTCCAITTTG CACAGGGAGT 300 GCAGGAGGTG AATGTTCACT TTCTGTTCTC CAGTGTCACT GTTCTGTTTC CACGGGATGG 360 AAAGCGCATG GGCCTGTGTC CATTGTAGAT TTCCTTCTAG ATTTCTGTGT ACACACACTT 420 GATTGTTCTG GATGAATGTC TTTTTTAATA CTCCGAAAAT TTCATCATCT AAGAAAATGA 480 TTCCATACAA ATAACTCAGC ACACAAGTGA CCCAGGACAT ATGCCTGCCA AAGGGATGTG 540 TTAGAAGGCT GCCTTCTCAT GOGCATTGTC ACTTGGATCT TGTGGTGAGG ACGGCCCCAT 600 CTTTCTTGCC ACAGATTGAG GCCACTTTTG AGCAAGGGAG ATCCTGGAGT TAAGACAGGT 660 GTTGGGGGCA GCCTGTATTT TACCCTAGGG GCAGGTCTGC ATGGTGACCC CACATYGCAC 720 TGGTAAACCA TTTGAGTCCC ACTCTTCATC CTGGAAGTGG GAACTGGAGT CCCACCCACA 780 GTGCATTCAG AAAGCATGCT GTGTGGGGGC TGCTTCTCAG GAGGCCAGGC CCTTCTGAGC 840 GGAACCGTCC TGGAGAGAGC CTGCCCTCGT 1TCCAGGCTG CAGCCGTAAC GCACTTTCTC 900 CCAGGCTGAG GGCGGGTGTT CTGGGGTGTC TGCCCTCTGT CGGCCCTGCT TCCTGCCAGG 960 ACGTGGCCTC TTCCGATCCT TTTCTCTCAG ACACTGGAGG TCTCTTCTGC CATTGTGCTG 1020 GTCCCATCCC AAGAATTGTA GGACAGAGAC CACACTGGGT CGGOGGACAC AAAGTCCATC 1080 CAGGACCCAG GCCGCAGAGG GAGCAGGAAG AGATGCTGAT AGTTTGATCT AGAAACCAGC 1140 AGCTACTGGC TCAAATTCAG GTTCTGGCGT CAAATAGCGA CATTTCCAGT TTCTCTTAAA 1200 AACCGTGTTT GGTTTCAGTT GGGATAGGCT TGTTTTGTCT GTTGAAAATG TTTCTAGTTT 1260 204 TTTTTCTTTC ATTTTTCTCT CATTCCATTT CTGCCTTAAC TTTAGTTTGT TCACAGGGAG 1320 GCAAAGCTGA CATGAACCTT TTGTCGTGGG ACTTCAGGCC ACATTGGCTT GAAGGCATTC 1380 GTTTCCTTCT GGGGTGGGGA CAGGCCCTCA TGGCAGGCIT GTTCCCGTGG CTCTGAGCGA 1440 GGCCTCTTCC TGCTGGGCTC CCAGACTCCT GCATCCAGGC CCCCACCTTC TCGGCTTCTG 1500 GTTnTCTTT CTTTTTGGTA GAACACAACA TCTACCATTC AGTTAAACCT TCTTTATCTC 1560 CTCCTYTGGC ATCCATTTTT CCAAAGAAGA GTCGAGTCCT CTGAGGTCTG TGCTTGAAAR 1620 CCGTCCGAAG GCATTCTTGT TAGCTTTGCT TTTCTCCCCA TATCCCAAGG CGAAGCGCTG 1680 AGATTCTTCC ATCTAAAAAA CCCTCGACCC GAAACCCTCA CCAGATAAAC TACAGTTTGT 1740 TTAGGAGGCC CTGACCTTCA TGGTGTCTTT GAAGCCCAAC CACTCGGTTT CCTTCGGATT 1800 TTCCTCCCTT TGTTCGGGGT TTGGTTTGGC TCCTCTGTGT GTGTCCGTAT CTTGTTCGGT 1860 GTCCTCGAGG TTGAGCTTCA CTCCACTGCG GCAGAGGCAG CGTGCACACT OQGATTTGCT 1920 ACGTTTCTAT ATATCTTGAA GCTAAATGTA TATATGAGTA GTTTGCCATG AGATAACACA 1980 GTGTAAACAG TAGACACCCA GAAATCGTGA CTTCTGTGTT CTCTCCATTT GAGTATTTTG 2040 ΤΑΑΤΠΤΡΓΓ GAAATATTTG TGGACATAAA TAAAACCAAG CTACACTACA AAAAAAAAAA 2100 AAAAAAACTG GAGACTAG 2118 (A) COMPRIMENTO: 1076 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 17: GCCCAAGGAG CTCAGCTTCG CCCGCATCAA GGCCGTTGAG TGCGTGGAGA GCACCGGGCG 60 CCACATCTAC TTCACGCTGG TGACCGAAGG GWGCGGCGAG ATCGACTTCC GCTGCCCCCT 120 GGAAGATCCC GGCTGGAACG CCCAGATCAC (XTAGGCCTG GTCAAGTTCA AGAACCAGCA 180 205 GGCCATCCAG ACAGTGCGGG CCCGGCAGAG CCTCGGGACC GGGACCCTCG TGTCCTAAAC 240 CACCGGGCGC ACCATCTTTC CTTCATGCTA CCCACCACCT CAGTGCTGAG GTCAAGGCAG 300 CTTCSTTGTT CCCTCTGGCT TGTGGGGGCA CGGCTGTSYT CCATGTGGCA AGGTGGAAGG 360 CATGGACGTG TGGAGGAGGC GCTGGAGCTG AAGGAATGGA CGAGCCCTGG GAGGAGGGCA 420 GAAGGCTACG CAGGGCTGAG GATGAAGATG CAGCCCCTGG ATGGTCCCAG ACTCTCAGGA 480 CATGCCCAGC TCAGGGGCTT CGAGCCACAG GCCTGGCCTC ATATGGCATG AGGGGGAGCT 540 GGCATAGGAG CCCCCTCCCT GCTGTGGTCC TGCCCTCTGT CCTGCAGACT GCTCTTAGCC 600 CCCTQGCTTT GTGCCAGGCC TGGAGGAGGG CAGTCCCCCA TGGGGTGCCG AGCCAACGCC 660 TCAGGAATCA GGAGGCCAGC CTGGTACCAA AAGGAGTACC CAGGGCCTGG TACCCAGGCC 720 CACTCCAGAA TGGCCTCTGG ACTCACCITG AGAAGGGGGA GCTGCTGGGC CTAAAGCCCA 780 CTCCTGGGGG TCTCCTGCTG CTTAGGTCCT TTTGGGACCC CCACCCATCC AGGCCCTTTC 840 TTTGCACACT TCTTCCCCCA CCTCTAYGCA TCTTCCCCCC ACTGCGGTGT TCGGCCTGAA 900 GGTGGTGGGG GTGAGGGGGG GTTTGGCCAT TAGCATTTCA TGTCTTTCCC CAAATGAAGA 960 TGCCCTGCAA AQGGCAGTMA ACCACAAAAA AAAAAAAAAA AAAAACWGG GGGGGGGGCC 1020 CCGTTAACCA TTTTGCCCTN ATAGGGGGGN GGTTTTTAAA AATTAATTGG GCCCGG 1076 (2) INFORMAÇÃO PARA SEQ ID N°: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1379 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 18: GGCACGAGCA CCCTCCCACA CCTCCCTGAA CTTCCATCTG ATCGACTTCA ACTTGCTGAT 60 GGTGACCACC ATCGTTCTGG GCCGCCX3CTT CATTGGGTCC ATCGTGAAGG AGGCCTCTCA 120 206 GAGGGGGAAG GTCTCCCTCT TTCGCTCCAT CCTGCTGTTC CTCACTCGCT TCACCGTTCT 180 CACGGCAACA GGCTGGAGTC TGTGCCGATC CCTCATCCAC CTCTTCAGGA CCTACTCCTT 240 CCTGAACCTC CTGTTCCTCT GCTATCCGTT TGGGATGTAC ATTCCGTTCC TGCARCTGAA 300 1TKCGAMCTY CGSAAGACAA GCCTCTTCAA CCACATGGCC TCCATGGGGC CCCGGGAGGC 360 GGTCAGTGGC CTGGCAAAGA GCCGGGACTA CCTCCTGACA CTGCGGGAGA CGTGGAAGCA 420 GCACASAAGA CAGCTGTATG GCCCGGACGC CATGCCCACC CATGCCTGCT GCCTGTCGCC 480 CAGCCTCATC CGCAGTGAGG TGGAGTTOCT CAAGATGGAC TTCAACTGGC GCATGAAGGA 540 AGTGCTCGTS AGCTCCATGC TGAGCGCCTA CTATGTGGCC TTTGTGCCTG TYTGGTTCGT 600 GAAGAACACA CATTACTATG ACAAGCGCTG GTCCTGTGNA ACTCTTCCTG CTGGTGTCCA 660 TCAGCACCTC CGTGATCCTC ATGCAGCACC TGCTGCNTGC CAGCTACTGT GACCTGCTGC 720 ACAAQGCCGC CGCCCATCTG GGCTGTTGGC AGAAGGTGGA CCCAGCQCTG TGCTCCAACG 780 TGCTGCAGCA CCCGTGGACT GAAGAATGCA TGTGGCCGCA GGGCXJTGCTG GTGAAGCACA 840 GCAAGAACGT CTACAAAGCC GTAGGCCAMW ACAAMGTGGC TATCCCCTCT GACCJPCTCCC 900 ACTTCCGCTT CCAKTTCTTT TTCAGCAAAC CCCTGCOGAT CCTCAACATC CTCCTGCTGC 960 TGGAGGGCGC TCTCATTGTC TATCAGCTGT ACTCCCTAAT GTCCTCTGAA AAGTGGCACC 1020 AGACCATCTC GCTGGCCCTC ATCCTCTTCA GCAACTACTA TGCCTTCTTC AAGCTGCTCC 1080 GGGACCGCTT GGTATTGGGC AAGGCCTACT CATACTCTGC TAGCCCCCAG AGAGACCTGG 1140 ACCACCGTTT CTCCTGAGCC CTGGGGTCAC CTCAGC3GACA GCGTCCAGGC TTCAGCAAGG 1200 GCTCCCTGGC AAGGGGCTGT TGGGTAGAAG TGGTGGTGGG G3GGACAAAA GACAAAAAAA 1260 TCCACCAGAG CTTTGTATTT TTGTTACGTA CTGTTTCTTT GATAATTGAT GTGATAAGGA 1320 AAAAAGTCCT ATTTTTATAC TCCCAANMAA AAAAAAAAAA NAAAAAGCGG CCGAAAGCT 1379 (2) INFORMAÇÃO PARA SEQ ID N°: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1337 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla 207 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 19: CTGGTGTTGG GCCTGAGCCN CCTCAACAAC TCCTACAACT TCAGTTTCCA CGTGGTGATC 60 GGCTCTCAGG CGGAAGAAGG CCAGTACAGC CTGAACTTCC ACAACTGCAA CAATTCAGTG 120 CCAGGAAAGG AGCATCCATT CGACATCACG GTGATGATCC GGGAGAAGAA CCCCGATGGC 180 TTCCTGTCGG CAGCGGAGAT GCCCCTTTTC AAGCTCTACA TGGTCATGTC OGCCTGCTTC 240 CTGGCCGCTG GCATCTTCTG GGTGTCCATC CTCTGCAGGA ACACGTACAG CGTCTTCAAG 300 ATCCACTGGC TCATGGCGGC CTTGGCCTTC ACCAAGAGCA TCTCTCTCCT CTTCCACAGC 360 ATCAACTACT ACTTCATCAA CAGCCAGGGG CCACCCCATC GAAGGCCTTG CCGKCATGTA 420 CTACATCGCA CACCTGCTGA AQGGCGCCCT CCTCTTCATC ACCATCGCCC TGATTGGCTC 480 A03CTGGGCT TCATCAAGTA CGTCCTGTCG GATAAGGAGA AGAAGGTCTT TGGGATCGTG 540 ATCCCCATGC AGGTCCTGGC CAACGTGGCC TACATCATCA TCGAGTCCCG CGAGGAAGGC 600 GCCACGAACT ACGTGCTGTG GAAGGAGATT TTGTTCCTGG TGGACCTCAT CTGCTGTGGT 660 GCCATCCTGT TCCCCGTAGT CTGGTCCATC CGGCATCTCC AGGATGCGTC TGGCACAGAC 720 GGGAAGGTGG CAGTGAACCT GGCCAAGCTG AAGCTGTTCC GGCATTACTA TGTCATGGTC 780 ATCTGCTACG TCTACTTCAC CCGCATCATC GCCATCCTGC TGCAGGTGGC TGTGCCCTTT 840 CAGTGGCAGT GGCTGTACMA GCTCTTGGTG GARGGCTCCA CCCTCGCCTT CTTCGTGCTC 900 ACGGGCTACA AGTTCCAGCC CACAGGGAAC AACCCGTACC TGCAGCTGCC CCAGGAGGAC 960 GAGGAGGATG TTCAGATGGA GCAAGTAATG ACGGACTCTG GGTTCCGGGA AGGCCTCTCC 1020 AAAGTCAACA AAACAGCCAG CGGGCGGGAA CTGTTATGAT CACCTCCACA TCTCAGACCA 1080 AAGGGTCGTC CTCCCCCAGC ATTTCTCACT CCTGCCCTTC TTCCACAGCG TATGTGGGGA 1140 GGTGGAGGGG TCCATGTCGA CCAGGCGCCC AGCTCCCGGG ACSCCGGTTC CCGGACAAGC 1200 CCATTTGGAA GAAGAGTCCC TTCCTCCCCC CAAATATTGG GCAGCCCTGT CCTTACCCCG 1260 GGACCACCCC TCCCTTCCAG CTATGTGTAC AATAATGACC AATCTGTTTG GCTAAAAAAA 1320 AAAAAAAAAA AACTCGA 1337 208 (2) INFORMAÇÃO PARA SEQ ID N°: 20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1390 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 20: GCCGTTTTGG TTCCCGGTTG GTGCTTCCTG TTCGCAGCTG CGGCACTTCA AGGTTACTGA 60 CTTTTTATGA TGTTTGGTGG CTATGAGACT ATAGAWGCRT RSGRRGATGA TYTTTATOGA 120 GATGAGTCAT CTAGTGAACT GAGTGTTGAT AGTGAGGTGG AATTTCAACT CTATAGCCAA 180 ATTCATTATG CCCAAGATCT TGATGATGTC ATCAGGGAGG AAGAGCATGA AGAAAAGAAC 240 TCTGGGAATT CGGAATCTTC GAGTAGTAAA CCAAATCAGA AGAAGCTAAT CGTCCTTTCA 300 1 1 TCATCCAGCT GTCAGATGGG TCAGAGGTCA TCACTTTGTC TGATGAAGAC 360 AGTATTTATA GATGTAAAGG AAAGAATGTT AGAGTTCAAG CACAAGAAAA TGCCCATGGT 420 CTTTCTTCTT CTCTTCAATC TAATGAGCTG GTTGATAAGA AATGCAAGAG TGATATTGAG 480 AAGCCTAAAT CTGAAGAGAG ATCAGGTGTA ATCCGAGAGG TCATGATTAT AGAGGTCAGT 540 TCAAGTGAAG AGGAAGAGAG CACCATTTCA GAAGGTGATA ATGTGGAAAG CTGGATGCTA 600 CTGGGATGTG AAGTAGATGA TAAAGATGAT GATATCCTTC TCAACCTTGT GGGATGTGAA 660 AACTCTGTTA CTGAAGGAGA AGATGGTATA AACTGGTCCA TCAGTGACAA AGACATTGAG 720 GCCCAGATAG CTAATAACCG AACACCTGGA AGATGGACCC AGCGGTACTA TTCAGCCAAC 780 AAAAACATTA TCTGTAGAAA TTGTGACAAA CGTGGTCATT TATCAAAAAA CTGCCCCTTA 840 CCACGAAAAG TTCGTCGCTG CTTCCTGTGC TCCAGGAGAG GACATCTCCT GTATTCCTGT 900 CCAGCCCCCC TTTGCGAATA CTGTCCTGTG CCTAAGATGT TGGACCACTC ATGTCTTTTC 960 AGACATTCCT GGGATAAACA GTGTGACCGA TGTCATATGC TAGGCCACTA TACAGATGCT 1020 209 TGCACAGAAA TCTGGAGGCA GTATCACCTA ACGACCAAAC CTGGACCACC CAAAAAGCCG 1080 AAGACCCCTT CAAGACCATC AGCCTTAGCA TATTGCTATC ACTGCGCGCA AAAAGGCCAT 1140 TATGGACACG AATGTCCAGA AAGAGAAGTG TATGACCCGT CTCCAGTATC TCCATTCATC 1200 TGCTACTATG RTGACAAATA TGAAATTCAG GAGAGAGAAA AGAGACTAAA ACAAAAAATA 1260 AAAGTANTCA AGAAAAATGG GGTTATCCCA GAGCCATCCA AGCTACCTTA TATAAAAGCA 1320 GCAAATGAGA ACCCCCACCA TGATATAAGG AAGGGCCGTG CCTCATGGAA AAGCAACAGG 1380 TGGCCTCAAG 1390 (2) INFORMAÇÃO PARA SEQ ID N°: 21: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1431 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 21: GCCTGCAGTC GACACTAGTG GATCCAAAGA ATTCGGCCTG TGCGAGTAGG CGCTTGQGCA 60 CTCAGTCTCC CTGGCGAGCG ACGGGCAGAA ATCTCGAACC AGTGGAQCGC ACTCGTAACC 120 TGGATCCCAG AAGGTCGCGA AGGCAGTACC GTTTCCTCAG CGGCGGACTG CTGCAGTAAG 180 AATGTCTTTT CCACCTCATT TGAATCGCCC TCCCATGGGA ATCCCAGCAC TCCCACCAGG 240 GATCCCACCC CCGCAGTTTC CAGGATTTCC TCCACCTGTA CCTCCAGGGA CCCCAATGAT 300 TCCTGTACCA ATGAGCATTA TGGCTCCTGC TCCAACTGTC TTAGTACCCA CTGTGTCTAT 360 GGTTGGAAAG CATTTGGGCG CAAGAAAGGA TCATCCAGGC TTAAAGGCTA AAGAAAATGA 420 TGAAAATTGT GGTCCTACTA CCACTGTTTT TGTTGGCAAC ATTTCCGAGA AAGCTTCAGA 480 CATGCTTATA AGACAACTCT TAGCTAAATG TGGTTTGGTT TTGAGCTGGA AGAGAGTACA 540 AGGTGCTTCC GGAAAGCTTC AAGCCTTCGG ATTCTGTGAG TACAAGGAGC CAGAATCTAC 600 210 660
CCTCCGTGCA CTCAGATTAT TACATGACCT GCAAATTGGA GAGAAAAAGC TACTCGTTAA AGTTGATGCA AAGACAAAGG CACAGCTGGA TGAATGGAAA GCAAAGAAGA AAGCTTCTAA TGGGAATGCA AGGCCAGAAA CTGTCACTAA TGACGATGAA GAAGCCTTGG ATGAAGAAAC AAAGAGGAGA GATCAGATGA TTAAAGGGGC TATTGAAGTT TTAATTCGTG AATACTCCAG TGAGCTAAAT GCCCCCTCAC AGGAATCTGA TTCTCACCCC AGGAAGAAGA AGAAGGAAAA GAAGGAGGAC ATTTTCCGCA GATTTCCAGT GGCCCCACTG ATCCCTTATC CACTCATCAC TAAGGAGGAT ATAAATGCTA TAGAAATGGA AGAAGACAAA AGAGACCTGA TATCTCGAGA GATCAGCAAA TTCAGAGACA CACATAAGAA ACTGGAAGAA GAGAAAGGCA AAAAGGAAAA AGAAAGACAG GAAATTGAGA AAGAACGGAG AGAAAGAGAG AGGGAGCGTG AAAGGGAACG AGAAAGGCGA GAACGGGAAC GAGAAAGGGA AAGAGAACGT GAACGAGAAA AGGAGAAAGA
ACGGGAGCGG GAACGAGAAC GGGATAGGGA CCGTGACCGG ACAAAAGAGA GAGACCGAGA TCGGGATCGA GAGAGAGATC GTCACCGGGA TAGAGAAAGG AGCTCAGATC GTAATAAGGA TCGCATTCGA TCAAGAGAAA AAAGCAGAGA TCGTGAAAGG GAACGAGAGC GGGAAAGAGA GACAGAGAGA GAACGAGAGC GAGAACGAGA ACGGGAGCGA GAGAGAGAAG C (2) INFORMAÇÃO PARA SEQ ID N°: 22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2539 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 22:
GGGTGCAGGA GTGCCACCCC CAGGGCCCTG TCAACCTCTC TTTTCTCCTC CATGGCTGTC TGCCTGCGTA TCTGTCTCTG AGAATCCTCG GGGCGGTCAG GGGATGTCAG GAGGGGAAGG AGCCGCCCTC CCTATCTTGC TGCTCCTCTT GGCACTCAGG GGCACCTTCC ATGGAGCCAG 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1431 60 120 211 180 ACCGGGTGGA GGGGCTTCTG GGATTTGGTG TCTGCTGCTG CCAGAGCAGG AACCCCCAGT 240 CTAGGACTTG GGCATTTTAA CAGGGAGAAA GTAGTGGCTT CCCTTTTCTC TCTCTCCTCC 300 TTTTTCCCTT TAAGCCCACA GATTCAGGTC ATGCCAAAAG CTCTCTGGTT GTAACCTGGA 360 GACATGTGGA GGGGAATGGC GATGGGATTA TAGGACTCTC CCCATCTCGG GCCCTGACCC 420 TGACCCTTGC CACCAACCCA AAGACAGCTG GTGGGTTTCC CCTTGGAGAM AATCCTGCGT 480 TTGCCTGGGC CGGCCCTGGC TGCCCTCAGC TTTOGCTGAT CTGCCCGGGC TGGAGCCTCC 540 CATCACCCCG CTTCTTGTTG GGCCTCAGGC ACTGGTTACC AGAAGGGGGT CTQGGTCTGC 600 TCAGGAATCA TGTTTTGTAG CACCTCCTGT TGGAGGGGTG GAGGGATGTT GCCCTGAGCC 660 AGGCTGAGAC TAGAACCCCA TCTTCCCTGA GCCAGGCTGA GACTAGAACC CCATCTTCCC 720 CACCACGCCA CCCCIGTGST KGCTACAGGA GCACAGTAGT GAAGGCCTGA GCTCCAGGTT 780 TGAAAGACCC AACTGGAGCG TGGGGCGGGC AGGCAGGGGT TAGTGAAAGG ACACTTCCAG 840 GGTTAGGACA GAGCATTTAG CCTTCTGGAA GAACCCCTGC CTGGGGTGGG ACTGTGCAGG 900 CCAGAGAAGG TGGCATGGGC CTGAACCCAC CTGGACTGAC TTCTGCACTG AAGCCACAGA 960 TGGAGGGTAG GCTGGTGGGT GGGGGTGGTT OGTTCTCTAG CCGGGGCAGA CACCCAGCTG 1020 GCTGGGTCCT TCCTCAGCCT TGCCTCCTCC TGTCCCCAAC CCTTTCCTTT CCTCCTGCTT 1080 GCGGACTGCT GGTCCCCTCT CCTTCCCTCC TTCCAGCTGT TTCTAGTTAC CACCTACCCC 1140 TGGGCCGTGG ACTGATCAGA CCAGCATTCA AAATAAAAGT TTGTTCCAAG TTGACAGTGT 1200 GGTGCTCCCT GCCCAGCCCC TCCAGGTGGA GGTGCTGCCA CGGGAACGCA GTTGCTCTGC 1260 CTGCCCTGGG CCCCTGGCGA CANTGGGAGC AGGGCAGTGC TGTGAGGAGC CCAGCTTTCC 1320 CAGTCAGGCA GGCATGGCTT CCGTGTTCAG GCTCCCTCAC CAGCTGGTGA CACGGGACAA 1380 GCTTACAAAC CTTCTCTGAA CCTCAGTTTT CTCATTTACA AGAGGCAAAG CATCCATCAC 1440 CTTGTGTGGA TTCARAGAAT GTRAGGCCCT GGGGTGTCCT ACACAAGGGA AAGGCTTGCT 1500 CAGTGAGCGG TCTGCACACC GTTAGCCACC CTGCCACCTC TGTGCCCTGG GCAGGCTCCA 1560 AAGGAAAGCT CTGGCTGGGA CTGCCRGGAG TCTCACACGC TCCTGTTGAC ATTCCCAGCA 1620 GCTGCCCCTG AGGTCGATGT TTGTTCTGTT TTTCTTTTTC TTTTTTGAGA CGGAGTCTCG 1680 CTGTGTTGCC AGGCTGGAGT GCAGTGGTGT GATCTCTGCT CACTGCAACC TCCGCCTGCC 1740 AGTTTCMGT GATTCTCTGC CTCAGCCTTC TGAGTAGCTG GGACTACAGG TGCACGCCAC 1800 212
CACGCCCAGC TAACTTTTTG TATTTWAGTA GAGACAGGGT TTCGCCATGT CGGCCAGGGT GGTCTTGATC TCCTGACCTC ATGATCCACC CGCCTCAGCC TCCCAAAGTG CTGGGATTAC AGGTATGAGC CACCGCACCG GGCCTGTTCT ATTTTTCTAG TTAAGGGAAC TGAAGCTCAG ARAGGTGTCA CCAGCARGTG TTCATTCCCA TGCCAGCCTT GCCCCCCGGC TTTTCCCAGG CAGGCTCCTG CGTGCCCACT GGCTCCAGCC TGGTCCTCTG TCTCTTGGCT GCTTCACTCC TGCTCTTTGT CCCGACTCTG GCCCTGCTTA CAGGGGCCAC TACCTGCTGG TGCCTCCATA ACAAGCGTCT GGCGTTGAGA CCCCTGGCAT GGCAGGGGCT TTGGGGTCTG GTTTCCACAA GGCTTAGCCA TGGCAGAACC TCGTTTTATT TTAACTCTTT GCCCCTACAA ACAAACAGCA GTACTTGCCA GAACCATTCT TGGGATTCAG GAGCTCGGGC GACTGCCTTG GCCTCTGGCC GCACCCAGGA GGGTGGGGTT GGATCTGTGT AGTTGCCAGG CCCACACCTG CCAGCAGGGG GCTGACTGGA TCCATGCTTT ACTGTGTTTA ATGGGGGTAA CAGGGGTCCC TACAGCCCTC CCAGYTAAAM ATTTGGAACA AAACACCAGC CCTTTTGTAG TGGATGCAGA ATAAAATTGT TAATCCAATC AAAAAAAAA (2) INFORMAÇÃO PARA SEQ ID N°: 23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1041 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 23:
TCGACCCACG CGTCCGCCCA CGCGTCCGCC CACGCGTCCG GGCGCAGGAC GTGCACTATG GCTCGGGGCT CGCTGCGCCG GTTGCTGCGG CTCCTCGTGC TGGGGCTCTG GCTGGCGTTG CTGCGCTCCG TGGCCGGGGA GCAAGCGCCA GGCACCGCCC CCTGCTCCCG CGGCAGCTCC TGGAGCGCGG ACCTGGACAA GTGCATGGAC TGCGCGTCTT GCAGGGCGCG ACCGCACAGC 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2539 60 120 180 213 240 GACTTCTGCC TGGGCTGCGC TGCAGCACCT CCTGCCCCCT TCCGGCTGCT TTGGCCCATC 300 CTTGGGGGCG CTCTGAGCCT GACCTTCGTG CTGGGGCTGC TTTCTGGCTT TTTGGTCTGG 360 AGACGATGCC GCAGAGAGAG AAGTTCACCA CCCCCATAGA GGAGACCGGC GGAGAGGGCT 420 GCCCAGCTGT GGCGCTGATC CAGTGACAAT GTGCCCCCTG CCAGCCQGGG CTCGCCCACT 480 CATCATTCAT TCATCCATTC TAGAGCCAGT CTCTGCCTCC CAGACGCGGC GGGAGCAAGC 540 TCCTCCAACC ACAAGGGGGG TGGGGGGCGG TGAATCACCT CYGAGGCCTG GGCCCAGGGT 600 TCAGGGGAAC TTCCAAGGTG TCTGGTTGCC CTGCCTCTGG CTCCAGAACA GAAAGGGAGC 660 CTCACGCTGG CTCACACAAA ACAGCTGACA CTGACTAAGG AACTGCAGCA TTTGCACAGG 720 GGAGGGGGGT GCCCTCCTTC CTAGAGGCCC TGGGGGCCAG GCTGACTTGG GGGGCAGACT 780 TGACACTAGG CCCCACTCAC TCAGATGTCC TGAAATTCCA CCACGGGGGT CACCCTGGGG 840 GGTTAGGGAC CTATTTTTAA CACTAGGGGG CTGGCCCACT AGGAGGGCTG GCCCTAAGAT 900 ACAGACCCCC CCAACTCCCC AAAGCGGGGA GGAGATATTT ATTTTGGGGA GAGTTTGGAG 960 GGGAGGGAGA ATTTATTAAT AAAAGAATCT TTAACTTTAA AAAAAAAAAA AAAAAAGGGC 1020 GGCCGCTCTA GAGGATCCCT C 1041 (2) INFORMAÇÃO PARA SEQ ID N°: 24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1962 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 24: ACCCACGCGT CCGGTACAAA ACACAGTTTT ATTCTATGAA AATTTTGAGA TTATTAGAAA 60 CATTAGATTT AGGGTTGCAT ATTAAAAACT ATATCCATTT TGCCTTATTA TTTAGTGTCT 120 CACTCAGGAT ATAACACACT ATAATAGAAA ATGTAGACTT CAGAATCAGG TATATTTGAG 180 ATGGTTTGTA TACTGGTTCT GACACTTGTT AGCTATTCAT CTTTGGTAAA TTCCCCATTA 240 214 CCCTTTGTKC ACCTATWTGT GGGGATCAGT GCATAGTGTG TGTWAAGCAT TTAATACCTG 300 GCAAGTGTTC AGCAAATTTT TTGTTCTATA TATTTATTAT TTGATTATTG GCCCTGAGGA 360 GTAGGTGTTT GTTTSITTGT TTGTTTGTTT AGTTTTATTT CTCATCTCCT CAGGAACACA 420 AATGAAACTT GGATATTGTT ATGGTGCTTT TOATAATATA TTTATTATTT TCAGCAATTN 480 ATTCTTGTTA AAACAATTTC TTATGACAAG TTACTCATCT TCAATGGTGA GAAGAAATCT 540 AGCTCAGAAT ΑΑΤΑΤΑΤΓΤΤ TAGTGTTTGT ATCTCTGGAT ACTCATTTTG CTCATTGCCA 600 CGTAAAGTAA AAAAATACAT AAATTACCTT ATTCCAATGT AATATCTTCA GGATAGTCAT 660 gggcaaggaa ttaatcacat taagagataa CTGCAACTAA GCACTATTTG AGGTGACTTC 720 TGTGQAAAAA AAATTAATYC TTTACCATTG CAGCG1TCTG CCCTAGGTCC AAATGTTACC 780 AAAATCACTC TAGAATCTTT TCTTGCCTGG AAGAAAAGGA AAAGACAAGA AAAGATTGAT 840 AAACTTGAAC AAGATATGGA AAGAAGGAAA GCTGACTTCA AAGCAGGGAA AGCACTAGTG 900 ATCAGTGGTC GTGAAGTGTT TGAATTTCGT CCTGAACTGG TCAATGATGA TGATGAGGAA 960 GCAGATGATA CCCGCTACAC CCAGGGAACA GGTGGTGATG AGGTTGATGA TTCAGTGAGT 1020 GTAAATGACA TAGATTTAAG CCTGTACATC CCAAGAGATG TAGATGAAAC AGGTATTACT 1080 GTAGCCAGTC TTGAAAGATT CAGCACATAT ACTTCAGATA AAGATGAAAA CAAATTAAGT 1140 GAAGCTTCTG GAGGTAGGGC TGAAAATGGT GAAAGAAGTG ACTTGGAAGA GGACAACGAG 1200 AGGGAGGGAA CGGAAAATGG AGCCATTGAT GCTGTTCCTG TTGATGAAAA TCTTTTCACT 1260 GGAGAGGATT TGGATGAACT AGAAGAAGAA TTAAATACAC TTGATTTAGA AGAATGACAC 1320 CAAACACATC GCTGAAAAAA TTAAGTCAGC TCAGCACGAG TTGAAATTGA CTACATTAAT 1380 TTCTTTCCAC CTAGAATCAA CAGGATGTTT ATTTCCTATG CTGATTCTGG AGGAGTTAAC 1440 CTCCTGCAAA AAAGGCATCT TGTCCCTACA TCTTCTCTTC TGACTTTGGC TACATCTCAT 1500 AGTAAGTTCA GAGTAGTTCA TGATAAATTG AAAATATAAT GGTCATTGCA GAAAATGATT 1560 GATGTTGTAA CTGTCCACCC AAGTAAGAAG TGTATCTGCC TTTCCATCTT TTGGTTTTCA 1620 TTTGGGCATG TGCTATTACC AGAAACAACA AACTTATATT TAAAATACCC TTCATTTGAC 1680 ACAGTTTTTA ATGAGTGATT TAATTTCCTC TGTATTTCTA TGTTTAGAAG ACTGCCTAAA 1740 ACATGAGCAC TCTACTTCAT AAAGGAAACG CGTATGCAGA TTCAGTATTG TGTATCTTTG 1800 GACAATTAGA TGGACATTTA AAATGGAACT TCTTTTATCT GACAGGATCA GCTACAATGC 1860 CCTGTGTTAA ATTGTTTAAA AGTTTCCCTT TTCTTTTTTG CCAATAAAGT TGTAAATAAA 1920 GACCATCATA CATTAAAATC CAAAAAAAAA AAAAAAAAAA AA 1962 215 (2) INFORMAÇÃO PARA SEQ ID N°: 25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1228 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 25: GGCTGCCCAG GCCCCGCACT GGAAGAGCCT CCAGCAGCAA GATGTGACCG YTGTGCCGAT 60 GAGCCCCAGC AGCCACTCCC CAGAGGGGAG GCCTCCACCT CTGCTGCCTG GGGGTCCAGT 120 GTGTAAGGCA GCTGCATCTG CACCGAGCTC CCTCCTGGAC CAGCCGTGCC TCTGCCCCGC 180 ACCCTCTGTC CGCACCGCTG TTGCCCTGAC AACGCCGGAT ATCACATTGG TTCTGCCCCC 240 TGACATCATC CAACAGGAAG CGTCACCCTG AGGGAGGAGA CAGAAGCCTG GGCCAGGTGA 300 ACAGTCGTAT AGCAGCCACT CCAGCCTCTG CTGCAGCAGC CACCCTGGAT GTOGCTGTTC 360 GGAGAGGCCT GTCCCACGGA GCCCAGAGGC TGCTGTGCGT GGCCCTGGGA CAGCTGGACC 420 GGCCTCCAGA CCTCGCCCAT GACGGGAGGA GTCTGTGGCT GAACATCAGG GGCAAGGAGG 480 CGGCTGCCCT ATCCATGTTC CATGTCTCCA CGCCACTGCC AGTGATGACC GGTGGTTTCC S40 TGAGCTGCAT CTTGGGCTTG GTGCTGCCCC TGGCCTATGN TTCCAGCCTG ACCTGGTGCT 600 GGTGGCGCTG GGGCCTGCCA NTGCCTGCAG GGCCCCCACG CTGCACTCCT GGCTGCAATG 660 CTTCGGGGGC TGGCAGGGGG CCGAGTCCTG GCCCTCCTGG AGGAGAACTC CACACCCCAG 720 CTAGCAGGGA TCCTGGCCCG GGTGCTGAAT GGAGAGGCAC CTCCTAGCCT AGGCCCTTCC 780 TCTGTGGCCT CCCCAGAGGA CGTCCAGGCC CTGATGTACC TGAGAGGGCA GCTGGAGCCT 840 CAGTGGAAGA TGTTGCAGTG CCATCCTCAC CTGGTGGCTT GAAATCGGCC AAGGTGGGAG 900 CATTTACACC GCAGAAATGA CACCGCACGC CAGCGCCCCG CGGCCGCGAT CCGGACCCCA 960 AGCCCACGGC TCCCTCGACT CTGGGGCACG GAACCCCGCC CACTCCCAAT CCCCGCGCCC 1020 216 1080
CGCCCTCTCC CACCCGTGCT TCCCCCGCTC CACCCCTCAC CTCACCTCGC CCCSGCCCCA CCCAxX;GCGC cccggcccgt cccatcgagg cccatgcaac ccacgctcgg tyccgttccg GCCCCTGCGC TCKCGCTKNS TTCGCTCCCC GCCCTTGCGC CGTTAGTAAA CATCGCTCAA ACGAAAAAAA AAAAAAAAAA AAACTCGA (2) INFORMAÇÃO PARA SEQ ID N°: 26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1340 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 26:
AATTCGGCAG AGAGATGGCC GCCCCCGTGG ATCTAGAGCT GAAGAAGGCC TTCACAGAGC TTCAAGCCAA AGTTATTGAC ACTCAACAGA AGGTGAAGCT CGCAGACATA CAGATTGAAC AGCTAAACAG AACGAAAAAG CATGCACATC TTACAGATAC AGAGATCATG ACTTTGGTAG ATGAGACTAA CATGTATGAA GGTGTAGGAA GAATGTTTAT TCTTCAGTCC AAGGAAGCAA TTCACAGTCA GCTGTTAGAG AAGCAGAAAA TAGCAGAAGA AAAAATTAAA GAACTAGAAC AGAAAAAGTC CTACCTGGAG CGACGTTAAA GGAAGCTGAG GACAACATCC GGGAGATGCT GATGGCACGA AGGGCCCAGT AGGGAGCCTC TCTGGGAAGC TCTTCCTCCT GCCCCTCCCA TTCCTGGTGG GGGCAGAGGA GTGTCTGCAG GGAAACAGCT TCTCCTCTGC CCCGATGGAT GCTTTATTTG GATGGCCTGG CAACATCACA TTTTCTGCAT CACCCTGAGC CCCATTTGCT TCCCAGCCCT GGAGTTTTTA CCCGGCTTTG CTGCCACCTC TGCCCAGGAC ACKCTTCCCT CTCGGGATGT GTGATGAACT CCCAGGAGAG GGAAGATGGG AGCCAGGGCA AGATAGGAAG CTCTGCCTGA GCTTTCCACT AGGCACGCCA GCCAGACCAA TAAAAAGCGT CTGTCCCACT CTGCTAAGCC TGGTTTTCTT GAGCAGAGGG ATGGAACAGA GGGTGAGAGA GGCAGTGGCC
1140 1200 122B 60 120 180 240 300 360 420 480 540 600 660 720 217 780 GTCTCCACCT CAGCTCCTGC TCCCTCTGCA TCAGAGCCCT TCCTTTCTTG GGGGATGGGC 840 CTTGCCNTCT TCTCTTTTCC CTTCCTGTAC CTTTGACTAA CGCTCAGCTT CCGGGCCTGC 900 ATGCAGTAGA CAGAAGAGGA AGAAAGAACA GATGTTCACA GCTGAATCTC AGTGAACAGA 960 ATAGCAGTCC CTGGATGGCA GTCTGCCTAA AGATTCCTTT CCCTGCCTTC TCCCATACAT 1020 TCCAAAAGGA AGTTCAACAG TAAGCAGCAC CTCCAAGACT GTCTCCTTTY GGCCARTATC 1080 ATAAGATGGA CGCCATAATC CTGAGGCCTC CTAGAGGCTG AGGGGGCAAC GGTGTGATCC 1140 AGCTGGCTCA TCCCAGCCAG GTGGGCCAAT TATTCAATTT TCAAGAATTT TGTTGCAAGC 1200 CAGTTGTCAA ACACAGCCAT TATAATTATG TAAATTTGCA AATTATGTTA AAAACAAGGA 1260 CAATAAATAT TCAAAATGCA TCCCTAAWWA AAAAAAAAAA AANGGGNGGC CGCNCTAGGG 1320 GATCCAAGCT TACGTACGCG 1340 (2) INFORMAÇÃO PARA SEQ ID N°: 27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 806 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 27: ACCTTCTTCC ATCTTTAGTC CCTTGGGCTC TGCTACCCTC CTGCTGGAGG TGAGAGCATC 60 CTGTGTCCAA CCAGAGATGC CCTCTGGCTT TCAGACCTGC CTGCTTTTCA CCCTCAGCCC 120 TrrcTCACTC AGCAAAATTG tgggggtccc TAGTCAGCAG CTCCCTGGGC AGCTCTCTGA 180 GCAAQGTGGT CTCTGTGGTC ATGAAGGAGA GCCGGCTAGG ACAGTGCCGG AAACTCAGCT 240 GCCTCTCCCC TTCAACTCAG CTGGCCCCCX: GCACCTGAAG TGCACAQGAG CCGGGAAGAG 300 AGTCTGGAGC CCACCCCGGA GGGCAGCACA GGAGGTGTCT CTGCAGCTGG TGTCCTGCCA 360 CCCCTGCAGG CAGCACACGT CCCGGGCATT CTCCTTAGCC ACAGACAGAA CAGCCAGTGC 420 218 480
CAGAGTCTGC TGTCGTTCCC CTTTAAGCAC ACTCATTCAC CACACCCGAG GAGGCCAGAG GTGCAGGGAG CATGGGCTGT CGCTTCCCCT TTAAGCACAC TCATTCACCA CACCCGAGGA GGCCAGAAGT GCAGGGAGCA TGGGCTGGGT GCACCTCCGC AGGAGAGAAG GCTGAGCCAC CGCCGTCCCG GGAGCCCGGC TCCCAGGCCT CTCGTTTTCC CCTACCTCCC TAAGACTTTT CTGTCACTCT CTGGCCATTG AAAGGCTTCT GTTCCTTAAA GTGCTGTTAC ACTCTCCTTT CCCAGGATGC AGCAAGCCAA AACAGTACCA CTGCACGTCA GCCTGGGTGA CAGAGTGAGA CCCTATCTTA AAAAAAAAAA AAAAAA (2) INFORMAÇÃO PARA SEQ ID N°: 28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 696 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 28:
GAGTTCCCNA CGCGGTGGCG NCCGTTTTAG AAA1TAGTGG ATCCCCCCGG GCTGGCAGGG AATTCGGCAC GAGCACAGAG GAAAGCGGGT GCCCGGCATG GCCATCCTGA TGTTGCTGGC GGGATCCCCA TGCACCTTGT CCTTCTCCAC TGATACTGGC AGCTCGGCTC CTGGACCCAA GATCCCTTGA GTGGAATTCT GCAGTGCAAG AGCCCTTCGT GGGAGCTGTC CCATGT1TCC ATGGTCCCCA GTCTCCCCTC CACTTGGTQG GGTCACCAAC TACTCACCAG AAGGGGGCTT ACCAAGAAAG CCCTAAAAAG CTGTTGACTT ATCTGCGCTT GTTCCAACTC TTATCCCCCC AACCTGCCCT ACCACCACCA CGCGCTCAGC CTGATGTGTT TACATGGTAC TGTATGTATG GGAGAGCAGA CTGCACCCTC CAGCAACAAC AGATGAAAGC CAGTGAGCCT ACTAACCGTG
CCATCTTGCA AACTACACTT TAAAAAAAAC TCATTGCTTT GTATTCTAGT AACCAATATG TGCAGTATAC GTTGAATGTA TATGAACATA CTTTCCTATT TCTGTTCTTT GAAAATGTCA 540 600 660 720 780 806 60 120 180 240 300 360 420 480 540 219 600 660
GAAATATTTT TTTCTITCTC ATTTTATGTT GAACTAAAAA GGATTAAAAA AAAAATCTCC AGAMAAAAAA AAAAAAAAAA AAATTACTGC GGTCCG (2) INFORMAÇÃO PARA SEQ ID N°: 29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1007 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 29:
AATTCGGCAC GAGGAAAAAA TACCATTTGT GTATGATACC CAATTTGGAT CTCAATTTGG ATAGAGATTT GGTGCTTCCA GATGTRAGTT ATCAGGTGGA ATCCAGTGAG GAGGATCAGT CTCAGACTAT GGATCCTCAA GGACAAACTC TGCTGCTTTT TCTCTTTGTG GATTTCCACA GTGCATTTCC AGTCCAGCAA ATGGAAATCT GGGGAGTCTA TACTTTGCTC ACAACTCATC TCAATGCCAT CCTTGTGGAG AGCCACAGTG TAGTGCAAGG TTCCATOCAA TTCACTGTGG ACAAGGTCTT GGAGCAACAT CACCAGGCTG CCAAGGCTCA GCAGAAACTA CAGGCCTCAC TCTCAGTGGC TGTGAACTCC ATCATGAGTA TTCTGACTGG AAGCACTAGG AGCAGCTTCC GAAAGATGTG TCTCCAGACC CTTCAAGCAG CTGACACACA AGAGTTCAGG ACCAAACTGC ACAAAGTATT TCGTGAGATC ACCCAACACC AATTTCTTCA CCACTGCTCA TGTGAGGTGA AGCAGCTAAC CCTAGAAAAA AAGGACTCAG CCCAGGGCAC TGAGGACGCA CCTGATAACA GCAGCCTGGA GCTCCTAGCA GATACCAGCG GGCAAGCAGA AAACAAGAGG CTCAAGAGGG GCAGCCCCCG CATAGAGGAG ATGCGAGCTC TGCGCTCTGC CAGGGCCCCG AGCCCGTCAG AGGCCGCCCC GCGCCGCCCG GAAGCCACCG CGGCCCCCCT CACTCCTAGA GGAAGGGAGC ACCGCGAGGC TCACGGCAGG GCCCTGGCGC CGGGCAGGGC GAGCCTCGGA AGCCGCCTGG 696 60 120 ISO 240 300 360 420 480 540 600 660 720 780 220 840 900
AGGACGTGCT GTGGCTGCAG GAGGTCTCCA ACCTCTCAGA GTGGCTGAGT CCCAGCCCTG GGCCCTGAGC CGGGTCCCCT TNCGCAAGCG CCCACCGATC OGGARGCTCC GGGCAGCCGT TATCCCGTGG TTTAATMAG TGCCGCGCGC TCACCAAAAA AAAAAAA (2) INFORMAÇÃO PARA SEQ ID N°: 30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2017 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 30:
AATTCGGCAC GAGCGGATCC GTTGCGGCTG CAGCTCTGCA GTCGGGCCGT TCCTTCGCCG CCGCCAGGGG TAGCGGTGTA GCTGCGCACG TCGCGCGCGC TACCGCACCC AGGTTCGGCC CGTAGCCTCT GGCAGCCCGG CGCCATCTTC ATCGAGCGCC ATGGCCGCAG CCTGCGGGCC GGGAGCGGCG GGTACTGCTT GCTCCTCGGC TTGCATTTGT TTCTGCTGAC CGCGGGCCCT GCCTGGGCTG GAACGACCCT GACAGAATGT TGCTGCGGGA TGTAAAAGCT CTTACCCTCC ACTATGACCG CTATACCACC TCCCGCAGCT GGATCCCATC CCACAGTTGA AATGTGTTGG AGGCACAGCT GGTTGTGATT CTTATACCCC AAAAGTCATA CAGTGTCAGA ACAAAGGCTG GGATGGGTAT GATGTACAGT GGGAATGTAA GACGGACTTA GATATTGCAT ACAAATTTGG AAAAACTGTG GTGAGCTGTG AAGGCTATGA GTCCTCTGAA GACCAGTATG TACTAAGAGG ttcttgtggc ttggagtata atttagatta TACAGAACTT GGCCTGCAGA AACTGAAGGA GTCTGGAAAG CAGCACGGCT TTGCCTCTTT CTCTGATTAT TATTATAAGT GCTCCTCGGC GGATTCCTGT AACATGAGTG GATTGATrAC CATCGTGGTA CTCCTTGGGA TCGCCTTTGT AGTCTATAAG CTG1TCCTGA GTGACGGGCA GTATTCTCCT CCACCGTACT CTGAGTATCC 960 1007 60 120 180 240 300 360 420 480 540 600 660 720 221 780 TCCATTTTCC CACCGTTACC AGAGATTCAC CAACTCAGCA GGACCTCCTC CCCCAGGCTT 840 TAAGTCTGAG TTCACAGGAC CACAGAATAC TGGCCATGGT GCAACTTCTG GTTTTCGCAG 900 TGCTTTTACA GGACAACAAG GATATGAAAA TTCAGGACCA GGGTTCTGGA CAGGCTTGGG 960 AACTGGTGGA ATACTAGGAT ATTTGTTTGG CAGCAATAGA GCGGCAACAC CCTTCTCAGA 1020 CTCGTGGTAC TACCCGTCCT ATCCTCCCTC CTACCCTGGC ACGTGGAATA GGGCTTACTC 1080 ACCCCTTCAT GGAGGCTCGG GCAGCTATTC GGTATGTTCA AACTCAGACA CGAAAACCAG 1140 AACTGCATCA GGATATGGTG GTACCAGGAG ACGATAAAGT AGAAAGTTGG AGTCAAACAC 1200 TGGATGCAGA AATTTTGGAT TTTTCATCAC TTTCTCTTTA GAAAAAAAGT ACTACCTGTT 1260 AACAATTGGG AAAAGGGGAT ATTCAAAAGT TCTGTGGTGT TATGTCCAGT GTAGCTTTTT 1320 GTATTCTATT ATTTGAGGCT AAAAGTTGAT GTGTGACAAA ATACTTATGT GTTGTATGTC 1380 AGTGTAACAT GCAGATGTAT ATTGCAGTTT TTGAAAGTGA TCATTACTGT GGAATGCTAA 1440 AAATACATTA ATTTCTAAAA CCTGTGATGC CCTAAGAAGC ATTAAGAATG AAGGTGTTGT 1500 ACTAATAGAA ACTAAGTACA GAAAATTTCA GTTTTAGGTG GTTGTAGCTG ATGAGTTATT 1560 ACCTCATAGA GACTATAATA TTCTATTTGG TATTATATTA TTTGATGTTT GCTGTTCTTC 1620 AAACATTTAA ATCAAGCTTT GGACTAATTA TGCTAATTTG TGAGTTCTCA TCACTTTTCA 1680 GCTCTGAAGC TTTGAATCAT TCAGTGGTCG AGATOGCCTT CTGGTAACTG AATATTACCT 1740 TCTGTAGGAA AAGGTGGAAA ATAAGCATCT AGAAGGTTGT TGTGAATGAC TCTGTGCTGG 1800 CAAAAATGCT TGAAACCTCT ATATTTCTTT OGTTCATAAG AGGTAAAGGT CAAATTTTTC 1860 AACAAAAGTC TTTTAATAAC AAAAGCATGC AGTTCTCTGT GAAATCTCAA ATATTGTTGT 1920 AATAGrrCTGT TTCAATCTTA AAAAGAATCA ATAAAAACAA ACAAGGGAAA AAAAAAAAAA 1980 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA 2017 (2) INFORMAÇÃO PARA SEQ ID N°: 31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 699 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla 222 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 31: GNGTTTTTTC CAGCCAGGAA GTGACCGNTA CTGCAGCACG AGANAGATTG GTTGGGTTGG 60 TTGRAMTGA CYCTGAACAT TTATTTCCAT TGCAATTTCT GTGGCTGAGG AGACTTAAAC 120 TTTACAAGTA TTATCCTTTT AAGATCATTT TAATTTTAGT TGAGTGCAGA GGGCTTTTAT 180 AACAAACGTG CAGAAATTTT GGAGGGCTGT GATTTTTCCA GTATTAAACA TGCATGCATT 240 AATCTTGCAG TTTATTTTCT CATTGTGTAT GTATATATCG CTTTTCTCTG CAGCACGATT 300 TCTCTTTTGA TAAWKCCCTT TAGGGCACAA CTAGTTATCA GTAACTGAAT GTATCTTAAT 360 CATTATGGCT GCTTCTGTTT TTTCATTAAC AAAGGTTATT CATATGTTAG CATATAGTTT 420 CITTGCACCC ACTATTTATG TCTGAATCAT TTGTCACAAG AGAGTGTGTG CTGATGAGAT 480 TGTAAGTTTG TGTGTTTAAA CTTTITTTTG AGCGAGGGAA GAAAAAGCTG TATGCATTTC 540 ATTGCTGTCT ACAGGTTTCT TTCAGATTAT GTICATQGGT TPGTGTGTAT ACAATATGAA 600 GAATGATCTG AAGTAATTGT GCTGTATTTA TGTTTATTCA CCAGTCTTTG ΑΤΤΑΑΑΤΑΑΛ 660 AAGGAAAACC AGAAAAAAAA AAAAAAAAAA AAAAAAAAA 699 (2) INFORMAÇÃO PARA SEQ ID N°: 32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1264 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 223 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 32: GGCACGAGGG CACTGTTTCC TCAGTCCATG GCTGAGTACA TCACCGGTGT TTTCTCTCTT 60 ATTCCTCCCA TCAAGCCTAA AAGGAATCTC TATTGGAGAT ACTGCCATTA GTGTTCCTTT 120 TATAGGTGAG GAACTGAGGC ATAKAGGGTT CCCCAGTTGA ACCAACTGAT AAATAGTAGA 180 ACTTGGATTT TAATTCAGTC TTGATGCCAG GGATAAGGCT CTTACTTTCT ACCTTAGGCT 240 ATrTCTAGGA AACGCAGGAG AGTGTTGAAG GGGCAGAGAA AGGGATCCAG TTCCTTTCTG 300 TCCCGCATCC TAGTCCCTGA GAAGCAAAGA ARAATGTGTG GCTTCTTTTG CTTTGCTTTT 350 GTTGTCATCC CACACATCTC CAGGGGAMCT GGGCTCTTGA TCTTGGSCTC TTCCCCTTTA 420 ACTGTTAAGT GGGAGCARGT AAGGGGGTAC AGTAGGGCTG GCCTGGAGTT AGAGGCTTGG 480 ATGCCTTAGC TCCTCTGTCT GCACTCCAGA ACTGCCTGAC TTCATTTCGT ATGTTGTCCT 540 TTGTTTTGAC AATTGATCCA TGTCCCAGTC CGTCTCTTCT TCCTTCTTGA TACTTACACT 600 GCTTCTTTCT GTTGGTTTCC AGTGTTTAAC ACTGTATACA ACAGTGACGA CAAOGTGTTT 660 GTGGGGGCCC CCACGGGCAG CGGGAAGACT ATTTGTGCAG AGTTTGCCAT CCTGCGAATG 720 CTGCTGCAGA GCTCGGAGGG GCGCTGTGYS TOCWTCACCM CCATGGAGGC CCTGGCCAGA 780 RCAGGTATGA CGTGGCGCTG TGTCATGTGA ATTTCCCAAG AAGCATTTCA TCTGTGATTC 840 CGTATGAAGG CTTTCTAAGC CCTGAAATTT GCAGGGTCAT TTCCTCAGTT TGTGTATTAA 900 AGAAAAGCTG CCCCAGCCAA GCGTGGTGGC TCACGCCTGT AATCCCAGCA CTTTGGGAQG 960 CCX3AGGCGGG CAGATCTCCG GAGATCAGGA GTTOGAGACC AGCCTGGCCA ACATGGTGRA 1020 ACCCTGTCTC TACTAAAAWT ACAGAAATTA GCTGGGNGTG GTGGTGTGCG CCTGTAATCC 1080 CAGCTACTTG GAAGGCTGAG GCAGGAGAAT CGCTTGAACC CGGGAGGCGG AGGTTGCAGT 1140 GAGCCAAGTT CGCACCACTG CACTCCAGCC TGGGCAACAA GAGCGAGACT TCATCTCAAA 1200 AAAAAAAAAA AAAAACTCGA GGGGGGGCCC GGTACCCAAT TCGCCCTATA GTGATCGTAT 1260 TACA 1264 (2) INFORMAÇÃO PARA SEQ ID N°: 33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 997 pares de bases 224 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 33: ATTGGAAGTT GTTTTGCAAC CTGGGCTTTT ATACAGAAGA ATACGAATCA CAGGTGTGTG 60 agcatctact taattaattt gcttacagcc gatttcctgc ttactctggc ATTACCAGTG 120 AAAATTGTTG TTGACTTGGG TGTGGCACCT TGGAAGCTGA AGATATTCCA CTGCCAAGTA 180 ACAGCCTGCC TCATCTATAT CAATATGTAT TTATCAATTA TCTTCTTAGC ATTTGTCAGC 240 ATTGACCGCT GTCTTCAGCT GACACACAGC TGCAAGATCT ACCGAATACA AGAACCCGGA 300 TTTGCCAAAA TGATATCAAC CGTTGTGTGG CTAATGGTCC TTCTTATAAT GGTGCCAAAT 360 ATGATGATTC CCATCAAAGA CATCAAGGAA AAGTCAAATG TGGGTTGTAT GGAGTTTAAA 420 AAGGAATTTG GAAGAAATTG GCATTTGCTG ACAAATTTCA TATGTGTAGC ΑΑΤΑΤΤΤΓΤΑ 480 AATTTCTCAG CCATCATTTT AATATCCAAT TGCCTTGTAA TTCGACAGCT CTACAGAAAC 540 AAAGATAATG AAAATTACCC AAATGTGAAA AAGGCTCTCA TCAACATACT TTTAGTGACC 600 ACGGGCTACA TCATATGCTT TGTTCCTTAC CACATTGTCC GAATCCCGTA TACCCTCAGC 660 CAGACAGAAG TCATAACTGA TTGCTCAACC AGGATTTCAC TCTTCAAAGC CAAAGAGGCT 720 ACACTGCTCC TGGCTGTGTC GAACCTGTGC TTTGATCCTA TCCTGTACTA TCACCTCTCA 780 AAAGCATTCC GCTCAAAGGT CACTGAGACT TTTGCCTCMC CTAAAGAGAC CAAGGTYAGA 840 AAGAAAAATT AAGANGTGGA AATAATGGCT AAAAGACAGG wmTTGTGG TACCAATTCT 900 GGGCTTTATG GGACCNTAAA GTTATTATAG CTTGGAAGGT AAAAAAAAAA AAAGGGNGGG 960 CGCTCTAGAG GTTCCCCGAG GQGCCAGCTT AGGGTGC 997 (2) INFORMAÇÃO PARA SEQ ID N°: 34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1914 pares de bases (B) TIPO: ácido nucleico 225 (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 34: GTGTGAGAGG CCTCTCTGGA AGTTGTCCCG GGTGTTCGCC GCTGGAGCCC GGGTCGAGAG 60 GACGAGGTGC CGCTGCCTGG AGAATCCTCC GCTGCCGTCG GCTCCCGGAG CCCAGCCCTT 120 TCCTAACCCA ACCCAACCTA GCCCAGTCCC AGCCGCCAGC GCCTGTCCCT GTCACGGACC 180 CCAGCGTTAC CATGCATCCT GCCGTCTTCC TATCCTTACC CGACCTCAGA TGCTCCCTTC 240 TGCTCCTGGT AACTTOGGTT TTTACTCCTG TAACAACTGA AATAACAAGT CTTGATACAG 300 agaatataga tgaaatttta aacaatgctg ATGTTGCTTT AGTAAATTTT TATGCTGACT 360 GGTGTCGTTT CAGTCAGATG TTGCATCCAA TTTTTGAGGA AGCTTCCGAT GTCATTAAGG 420 AAGAATTTCC AAATGAAAAT CAAGTAGTGT TTGCCAGAGT TGATTGTGAT CAGCACTCTG 480 ACATAGCCCA GAGATACAGG ATAAGCAAAT ACCCAACCCT CAAATTGTTT CGTAATGGGA 540 TGATGATGAA GAGAGAATAC AGGGGTCAGC GATCAGTGAA AGCATTGGCA GATTACATCA 600 ggcaacaaaa AAGTGACCCC attcaagaaa TTCGGGACTT AGCAGAAATC ACCACTCTTG 660 atcgcagcaa aagaaatatc attggatatt TTGAGCAAAA GGACTCGGAC AACTATAGAG 720 TTTTrGAACG AGTAGCGAAT ATTTTGCATG ATGACTGTGC CTTTCTTTCT GCATTTGGGG 780 ATGTTTCAAA ACCGGAAAGA TATAGTGGCG ACAACATAAT CTACAAACCA CCAGGGCATT 840 CTGCTCCGGA TATGGTGTAC TTGGGAGCTA TGACAAATTT TGATGTGACT TACAATTGGA 900 TTCAAGATAA ATGTGTTCCT CTTGTCCGAG AAATAACATT TGAAAATGGA GAGGAATTGA 960 CAGAAGAAGG ACTGCCTTTT CTCATACTCT TTCACATGAA AGAAGATACA GAAAGTTTAG 1020 AAATATTCCA GAATGAAGTA GCTCGGCAAT TAATAAGTGA AAAAGGTACA ATAMCTTTT 1080 TACATGCCGA TTGTGACAAA TTTAGACATC CTCTTCTGCA CATACAGAAA ACTCCAGCAG 1140 ATTGTCCTGT AATCGCTATT GACAGCTTTA GGCATATGTA TGTGTTTGGA GACTTCAAAG 1200 ATGTATTAAT TCCTGGAAAA CTCAAGCAAT TCGTATTTGA CTTACATTCT GGAAAACTGC 1260 ACAGAGAATT CCATCATGGA CCTGACCCAA CTGATACAGC CCCAGGAGAG CAAGCCCAAG 1320 226 ATGTAGCAAG CAGTCCACCT GAGAGCTCCT TCCAGAAACT AGCACCCAGT GAATATAGGT 1380 ATACTCTATT GAGGGATCGA GATGAGCTTT AAAAACTTGA AAAACAGTTT GTAAGCCTTT 1440 CAACAGCAGC ATCAACCTAC GTGGTGGAAA TAGTAAACCT ATATTTTCAT AATTCTATGT 1500 GTATTTTTAT TTTGAATAAA CAGAAAGAAA TTTTGGGTTT TTAAOTTTT TCTCCCCGAC 1560 TCAAAATGCA TTGTCATTTA ATATAGTAGC CTCTTAAAAA AAAAAAAAAC CTGCTAGGAT 1620 TTAAAAATAA AAATCAGAGG CCTATCTCCA CTTTAAATCT GTCCTGTAAA AGTXTTATAA 1680 ATCAAATGAA AGGTGACATT GCCAGAAACT TACCATTAAC TTGCACTACT AGGGTAGGGA 1740 GGACTTAGGG ATGTTTCCTG TGfTOGTATGT GCTTTTCTTT CTTTCATATG ATCAATTCTG 1800 TTGGTATTTT CAGTATCTCA TTTCTCAAAG CTAAAGAGAT ATACATTCTG GATACTTOGG 1860 AGGGGAATAA ATTAAAGTTT TCACACTGNA AAAAAAAAAA AAAAAAAAAC TCGA 1914 (2) INFORMAÇÃO PARA SEQ ID N°: 35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1020 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 35: CCOTTNNTTT TTTTTTTTTG CAAGACAAAA TATACTTTAT TGTGACAGCA AATGCACATA 60 GTGCTGTAGG TAAGGCATGC TACTAGGAAT CTGCATATAA TCAAAAGCCA GTATGGAAAT 120 GAATGGAAAT GAATGCTGTT GTTCTCAGAT TGAGTCCATG GTGGAGAAAG GATAGTTTGT 180 GTCCACTTAT TTCAAATGCA GTATCATACC TACTTAATCA GTTACCTATG CTTCTAACCA 240 ACAGCCCAGT GGCAAATAGG AGGAACTTAA CTGTACTCAG AAGTCACTPT TAATATCAAC 300 GACAGAAATA TTTCACTAAT TCAACTGAGG CAAATTTCCT TTCTAGACAA AGGACCTAGA 360 AATTGAGCAT GCAAAACATC CATCCATTCA TTCATTCAAA TAATTAGCCA ATTTTACCGT 420 CATTTAATTC CACCAGAAGC AAATACTAGA ATATCTAGAA GTAGTTTGGG TAAAGAAACA 480 227 540
TTTACATTTT AATATTGTGT AATGTCATAA ATTTGGGGCT AAAATAACAC CAGGTCAAAT TTGATCCCTT tgtatgtgag ggtacaaagt ACAGTTTTCG TTTCAACAGC TGAACITCTG AGAGAAGAGC TGAAAAAAAT GCTAAATAAG AGATCTAGGC CTTTSATGGA AACTATTAGG CTCTACAGAC TTGTCAAAAA ATCAATGCAA AACTGAGGGG GAAAGGCTGA AATGCTTTGT AAAGCAGTAT TTTTAGACAA GTTGCTTCAT TTCCCCCTTT TCTAAAACAG ATGCAGATTA AATGTTTTTT TGCATGAATG CACATTGACA TTCTGTTCAA CTGTTTTCTA AATGCAACAC TGCGGGTTTC AACAGTATGC TTTCATTTAA ACAAAGAATA TTATATGCAT GGTCAATTTA GTTTAAGAGA TGAAAAAAAA CTTTACTACT ATGAAAATTG CTTATCAAAT ACTCTCCTCT TXTATAAGGT GTXTTTARGC AACACAGGAC CGGTNGAACC GANCAAATTT ATAATTATAC (2) INFORMAÇÃO PARA SEQ ID N°: 36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 781 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 36:
AACTCCTGAC CTCAAGTGCT CCACCTGCGT TGGCTTCCCA AAGTGCTGGG ATACAGGAGT HAGCCACTGC GCCTGGCTGA TCCCAGCACT TTTMAAATGA TGCCGCTCAA AGCCGTGACT TGGCCTACTT TGAACAGCAA ACTTGTTGCT GCTGTTGTCA ACCTGAAGGC CTCTCAAATG CCAGCTTCAA GCAGGGTGTG AATTGGCCAG TGTCAGATCT CAGGAGTCCT GTGTTGAGAG TGTGGCTTTC AGCTGCGGGG AGCTGCACTT GGTGGGGAAA GCCAGGCAGG TCACCCTCAC AGCCAGATAA TGTGGAGGTC AGAACCCAAG GAAGGGAGTG AGACCTCCAC TCCCAGTGGG ggacctggcc acccatcctt GGGGACCTGA GAAAGCGTAC TTCACCTTGG GGTGAAGGCT 600 660 720 780 840 900 960 1020 60 120 180 240 300 360 228 420 GGGTGGGGCC AGAGGGACCA GTGCCCTCCT CAGTGCTTAG GGGCAGAGCC ACCTGCAGCA 480 ATGGTATCTG CATATTAGCC CCTCTCCACC TTCTTTCTCC CGCTGAATCA TTTCCCTCAA 540 AGCCCAAGAG CTGTCACTGC TTCTTTCTCC CTGGGAAGAA TGCGTGGACT CTGCCTQGTG 600 ATAGACTGAA GCCAGAACAG TGCCACACCC TCGCCTTAAT TCCTTGCTAG GTGTTCTCAG 660 ATTTATGAGA CTTCTTAGTC AAATATGAGG GAGGTTGGAT GTGGTGGCTT GTGCCTGTAA 720 TCCCAGCATT TTGGGAAGCC GAGGTGGGAG GATCCCTTGA AGCCAQGAGT TTGAGACAAG 780 C 781 (2) INFORMAÇÃO PARA SEQ ID N°: 37: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 966 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 37: GGCACGAGGA AGCAGCTGGG GGCTGATCAG GGGGAGCACG CAGCCCTCCG ATTGCAGGGC 60 TGCCTATTTG AGTGGCAGCT CCTCTTGAAA CAATGCAGAA CAAGCCCAGG GCCCCACAGA 120 AAAGGGCACT GCCCTTCCCA GAACTTGAGC TCCGGGACTA CGCATCTGTT CTCACCAGAT 180 ACAGCTTGGG GCTGAGGAAC AAAGAGCCTT CCCTGGGCCA CAGGTGGGGG ACCCAGAAGC 240 TGGGCAGGAG CCCCTGTTCT GAAGGGTCCC AGGGCCACAC CACAGATGCT GCTGACGTGC 300 AGAACCACTC TAAAGAAGAA CAGAGAGACG CAGGAGCACA GAGGARGTGC GGCCAGGGGA 360 GGCACACCTG GGCGTACAGG NGAGGGGCGC AGGACACTTC GAGGCTGACA GGAGACCCAC 420 GTGGTGGGGA AAGGAGCCCC CCAAAGTGTC AGAGCATGAA GCAGCAGGAA GGAGCTCCCT 480 CGGGCCACTG CTGGGATCAG TGGTGCCATG GAGCAAGCGA GGTTGTTTGG CCTGAAAGCC 540 GGAAGCGTGC CCAAATCTTT SCATCACCAT GTAGGCAGTC ACCTCGCTCC TCAGCACTCG 600 229 GGGCAGGA.CA GAAGCTTGCT GTCTGCTCAC CAGACATCCT GTGCTGCCCT ACAGACACCT 660 TGCTCGCCAG CCATCCCCAC TCACTTCTGA CCGGGACCCA ATTCTCTGGC CAAACCCAGG 720 CTCTAGCACC gtcttggtgt gcttgagaaa catctagttt aagtcaaaat CCAATGTCTT 780 TTTAATATAT AGACTATATG TACCTATGGA CTAGAGGTGA ATATATATAC ATCATATCAA 840 ATTCAAGTGA CCCAGTATTT CGGGAGAACC CACTATGTCC CCAGCCTGCA TGGGAAGCTG 900 GGGA1TCTGG CATGAACTGC ACCTTATCTT CCTCGAGGGG GGGCCGGTAC CAATTGCCNA 960 TAGTGG 966 (2) INFORMAÇÃO PARA SEQ ID N°: 38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 416 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 38: GAATTCGGCA CGAGGTAATA GGAGCCCTCG TACCTCTTGT GTTCCTTACA AACATTCTCA 60 TCAGTAGCTC TACGCGTTGA CTGGGTGGTT TCARATGGCT GGTATACACA GGGCTTTCTT 120 GGTGTTCTGT CTCTGGGGCT TARCTTTGTG TGTGGTTGGA GGGCCCTGGT GAGATTGGAA 180 GTACCAGAGA GTGCTGTGTC AGGGGCAGAG GGGCCTGTCG CTGGAGCTGG AGGGTGCCTG 240 CCTTTGTGTC TGACTCARTC TCCTGTCTGC CTTGCCCCCT CAGGGTCTCG CCAGCCCAGC 300 CTCTGTQGGA ATCTAAAAGG ARTGGATGTG GACGTKTGAC CAAGCACATC TCAGCTTTTA 360 ATACCTGGGC TATTTATAGA CCTTTGGGGG GAATNGCTTG TGGAACAACA AGGGTT 416 230 (2) INFORMAÇÃO PARA SEQ ID N°: 39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1114 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 39: TGTGTATTTG GOGGGACTGA AGQGTACGTG GGGCGAAACA AAACCGGCCA TGGCAGCAGC 60 GGAGGAGGAG GACGGGGGCC CCGAAGCCAA AATCGCGAGC GGGGCGGGGC GGGCGCGACC 120 TTCGAATGTA ATATATGTTT GGAGACTGCT CGGGAAGCTG TGGTCAjGTGT GTGTGGCCAC 180 CTGTACTGTT GGCCATGTCT TCATCAGTCG CTGGAGACAC GGCCAGAACG GCAAGAGTGT 240 CCAGTATGTA AAGCTGGGAT CAGCAGAGAG AAGGTTGTCC CGCTTTATGG GCGAGGGAGC 300 CAGAAGCCCC AQGATCCCAG ATTAAAAACT CCACCCCGCC CCCAGGGCCA GAGACCAGCT 360 CCGGAGAGCA GAGGGGGATT CCAGCCATTT GGTGATACCG GGGGCTTCCA CTTCTCATTT 420 GGTGTTGGTG CTTTTCCCTT TGGCTTTTTC ACCACCGTCT TCAATCCCCA TGAGCCTTTC 480 CGCCGGGGTA CAGGTGTGGA TCTGGGACAG GGTCACCCAG CCTCCAGCTG GCAGGATTCC 540 CTCTTCCTCT TTCTCGCCAT CTTCTTCTTT TTTTGGCTGC TCAGTATTTG AGCTATGTCT 600 GCTTCCTGCC CACCTCCAGC CAGAGAAGAA TCACTATTGA GGGTCCCTGC TGACCCTTCC 660 GTACTCCTGG ACCCCCTTGA CCCCTCTATT TCTGfTTGGCT AAGGCCAGCC CTGGACATTG 720 TCCAGGAAGG CCTGGGGAGG AGGAGTGAAG TCTGTGCATA GATGGGAGAG CCTTCTGCTC 780 AGAGGCTCAC TCAGTAACGT TGTTTAATTC TCTGCCCTGG GGAAGGAGGA TGGATTGAGA 840 GAATGTCTTT CTCCTCTCCT AAGTCTTTGC TTTCCCTGAT TTCTTGATTT GATCTTCAAA 900 GGTGGGCAAA GTTCCCTCTG ACTCTTCCCC CACTCCCCAT CTTACTGATT TAATTTAATT 960 TTTCACTCCC CAGAGTCTAA TATGGATTCT GACTCTTAAG TGCTTCOGCC CCCTCACTAC 1020 CTCCITTAAT ACAAATTCAA TAAAAAAGGT GAAATATAAA ΑΑΑΑΑΑΑΑΑΆ AAAAAACYCG 1080 GGGGGGGCCC CGGTCCCCAT TCCCTTTGGG GGGT 1114 231 (2) INFORMAÇÃO PARA SEQ ID N°: 40: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 602 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 40: GGGTCGACCC ACGCGTCCGT CCCAGGCCAC AAGACATTTC CTGCTCGGAA CCTTGTTTAC 60 TAATTGTCTC TGTGGCACAT TTTGTTTCCC GTGCCTIGGG TGTCAAGTTG CAGCTGATAT 120 GAATGAATGC TGTCTGTGTG GAACAAGCGT CGCAATGAGG ACTCTCTACA GGACCCGATA 180 TGGCATCCCT GGATCTATTT GTGATGACTA TATGGCAACT CTTTGCTGTC CTCATTGTAC 240 TCTXTGCCAA ATCAAGAGAG ATATCAACAG AAGGAGAGCC ATGCGTACTT TCTAAAAACT 300 GATGGTGAAA AGCTCTTACC GAAOCAACAA AATTCAGCAG ACACCTCTTC AGCTTGAGTT 360 CTTCACCATC TTTTGCAACT GAAATATGAT GGATATGCTT AAGTACAACT GATGGCATGA 420 AAAAAATCAA ATTTTTGATT TATTATAAAT GAATGTTGTC CCTGAACTTA GCTAAATGGT 480 GCAACTTAGT TTCTCCTTGC TTTCATATTA TCGAATTTCC TGGCTTATAA ACTTTTTAAA 540 TTACATTTGA AATATAAACC AAATGAAATA TTTTACTGAA AAAAAAAAAA AAAAAANCCC 600 CA 602 (2) INFORMAÇÃO PARA SEQ ID N°: 41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 970 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla 232 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 41: GGCAGAGCTT AGGAGAACAG CTCCCTTTGG ATCCCTNTCA AAGGTGATAC CATTGGCTCC 60 CAGCTTAGAG TAAGAAGCTC TGAGAAGTTG AATGAAGGGT GAGATAGAGA TGCTGAACCC 120 ATTCTTSCAG CTTCTTCTAG TGTTGTTATT TCCAGAATGG CCAACACCCC TACATTGATA 180 CATAAACACA TTCCAAQGCC TTGTGTAATA CAAAGTTCAC CGTCCTCCTG GAATAGGAGC 240 CCTGGGTTCT AGTTCTCACT CTGCCACTGG GGGAAAATCC AATTAAAGTC TGGTTTAGTC 300 AGCTTGGGTC ACCATAGACT GGGTGGCTTA AACAGCAGAC ATTTATTTCT GGTAGTTTCT 360 GGAGGCTACA AATCTAAGAG CAAGGTGCCA GCATGGTCAC ATTCTGGTGA GGGSCCTCTT 420 CCTGGCTTGT AGACGGCTGC YTTCTCACCG TGTGCTCACA TAGCCTTTOG TGTGTGTGTG 480 TGTGTGTGTG TGCGTKOGTG CAAGCTTCCK GATGTCTCTT CTTAGAAGGA CACCAACCCC 540 ATCATGAGAG CCCTACTCTC ATGACTTAGC CTAACCCTAA TTACCCTCCA AAGGCCCCAT 600 CTCCAAATGC CATCACATTG GAGGGTAGAG CTTCAACATA GGGATTTTGG GGGACACAAA 660 CATTCAGTCC ATAACAAAGG CTGTAGTCCT TARTTTCCTT GTCTGTGAAA TGAGAGTGTT 720 GAGATTCTTT CTAGCCTTTA TCATTTATAA TTCTGTGAGA TGTAGATTTG CATTATTTTC 780 GAGTTCGAGT TATATGAAAT GTTTCCCTCT ACATTTTCTT GGGCAACTGA GAACTGAATA 840 GGGCTAGGTT TAAATAGAGT TAGGCAGTTA GGCTTATTCT ΤΤΤΑΤΓΤΑΑΤ AAGCATTTTT 900 GGAGCATCTA CQGTGTTCCA GGAACTGAAC TGTTGTAAAC ATTGGAGCTG TAACAGAGAA 960 CAAAAGAGAC 970 (2) INFORMAÇÃO PARA SEQ ID N°: 42: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1002 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 233 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 42: GAATTCGGCA CGAGCCGAGG TCGGCAGCAC AGAGCTCTGG AGATGAAGAC OCTGTTCCTG 60 GGTGTCACGC TCGGMCTGGC CGCTGCCCTC TCCTTMACCC TGGRGGAGGA GGATATCACA 120 GGGACCTGGT ACGTGAAQGC CATGGTGGTC GATAAGACTT TCCGGAGACA GGAGGCCCAG 180 AAGGTGTCCC CAGTGAAGGT GACAGCCCTG GGCGGTGGGA AGTTGGAAGC CACGTTCACC 240 TTCATGAGGG AGGATCGGTG CATCCAGAAG AAAATCCTGR TGCGGAAGAC GGAGGAGCCT 300 GGCAAATACA GCGCCTGTGA GCCCCTCCCC CAYTCCCACC CCCACCYTCC CCCACCGCCA 360 ACCCCAGTGC ACCAGCCTCC ACAGGTAGAG AGTGCCCAGG CTGCCCT1TT GCCAGGGCCC 420 CAGCTCTGCC CACCTCCAAG GAGGGGCTGG CCTCTCCTTC CTGGGGGGCT GGTGGCCCTG 480 ACATCAGACA CCGGGTGTGA CAGGCTTGTC CGCAGTCGAG atggaccaga TCACGCCTGC 540 CCTCTGGGAG GCCCTAGCCA TTGACACATT GAGGAAGCTG AGGATTGGGA CAAGGAGGCC 600 AAGGATTAGA TGGGGGCAGG AAGCTCATGT ACCTGCAGGA GCTGCCCAGG AGGGACCAYT 660 ACATCTTTTA CTGCAAAGAC CAGCACCATG GGGGCSTGCT CCACATGGGA AAGCTTGTGG 720 GTAGGAATTC TGATACCAAC CGGGAGGCCC TGGAAGAATT TAAGAAATTG GTGCAGCGCA 780 AGGGACTCTC GGAGGAGGAC ATTTTCACGC CCCTGCAGAC GGGAAGCTGC GTTCCCGAAC 840 ACTAGGCAGC CCCCGGGTCT GCACCTCCAG AGCCCACCCT ACCACCAGAC ACAGAGCCCG 900 GACCACCTGG ACCTACCCTC CAGCCATGAC CCTTCCCTGC TCCCACCCAC CTGACTCCAA 960 ATAAAGTCCT TCTCCCCCAA AAAAAAAAAA AAAAAAACTC GA 1002 (2) INFORMAÇÃO PARA SEQ ID N°: 43: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2581 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 234 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 43: TGCAAAACCA CTGGACACTG GACAAGTACG GGATCCTGGS CGACGCACGC CTCTTCTTTG 60 GGCCCCAGCA CCGGSCCGTC ATCCTTCGGT TGTCCAACCG CCGCGCACTG CGCCTCGGTG 120 CCAGCTTCTC CCAGCCCCTC TTCCAGGCTG TGGSTGCCAT CTGCCGCCTC CTCAGCATCC 1B0 GGCACCCCGA GGAGCTGTCC CTGCTCOGGG CTCCTGAGAA GAAGGACAAG AAGAAGAAAG 240 AGAAGGAGCC AGAGGAAGAG CTCTATGACT TGAGCAAGCT TGTCTTGGCT GGGGGCGTGG 300 CACCTGCACT gttccggggg ATGCCAGCTC ACTTCTCGGA CAGCGCCCAG ACTGAGGCCT 360 GCTACCACAT GCTGAGCCGG CCCCAGCCGC CACCCGACCC CCTCCTGCTC CAGCGTCTGC 420 CACGGCCCAG CTCCCTGTCA GACAAGACCC AGCTCCACAG CAGGTGGCTG GACTCGTCGC 480 ggtgtctcat GCAGCAGGGC ATCAAGGCCG GGGACGCACT CTGGCTGOGC rrCAAGTACT 540 ACAGCTTCTT CGATTTGGAT CCCAAGACAG ACCCCGTGCG GCTGACACAG CTGTATGAGC 600 AGGCCCGGTG GGACCTGCTG CTGGAGGAGA TTGACTGCAC CGAGGAGGAG ATGATGGTGT 660 TTGCCGCCCT GCAGTACCAC ATCAACAAGC TCTCCCAGAG CGGGGAGGTG GGGGAGCCQG 720 CTGGCACAGA CCCAGGGCTG GACGACCTGG ATGTGGCCCT GAGCAACCTG GAGGTGAAGC 780 TGGAGGGGTC GGCGCCCACA GATGTGOTGG ACAGCCTCAC CACCATCCCA GAGCTCAAGG 840 ACCATCTCCG AATCTTTCGG CCCCGGAAGC TGACCCTGAA GGGCTACCGC CAACACTGGG 900 TGGTQTTCAA GGAGACCACA CTGTCCTACT ACAAGAGCCA GGACGAGGCC CCTGGGGACC 960 CCATTCAGCA GCTCAACCTC AAGGGCTGTG AGGTGGTTCC CGATGTTAAC GTCTCCGGCC 1020 AGAAGTTCTG CATTAAACTC CTAGTGCCCT CCCCTGAGGC ATGAGTGAGA TCTACCTGCG 1080 GTGCCAQGAT GAGCAGCAGT ATGCCCGCTG GATGGCTGC3C TGCCGCCTGG CCTCCAAAGG 1140 CCGCACCATG GCCGACAGCA GCTACACCAG CGAGGTGCAG GCCATCCTGG CYTTCCTCAG 1200 CCTGCAGCGC ACGGGCAGTG GGGGCCCGGG CAACCACCCC CACGGCCCTG ATGCCTCTGC 1260 CGAGGGCCTC AACCCCTACG GCCTCGTTGC CCCCCGTTTC CAGCGAAAGT TCAAGGCCAA 1320 GCAGCTCACC CCAOGGATCC TGGAAGCCCA CCAGAATGTG GCCCAGTTGT CGCTGGCAGA 1380 GGCCCAGCTG CGCTTCATCC AGGCCTQGCA GTCOCTGCCC GACTTCGGCA TCTCCTATGT 1440 CATGGTCAGG TTCAAGGGCA GCAGGAAAGA CGAGATCCTG GGCATCGCCA ACAACCGACT 1500 235 GATCCGCATC GACTTGGCCG TGGGCGACGT GGTCAAGACC TGGOGTTTCA GCAACATGCG 1560 CCAGTGGAAT GTCAACTGGG ACATCCGGCA NGTGGCCATC GAGTTTGATG AACACATCAA 1620 TGTGGCCTTC AGCTGCGTGT CTGCCAGCTG CCGAATTGTA CACGAGTATA TCGGGGGCTA 1680 CATTTTCCTG TCGACGCGGG AGNGGGCCCG TGGGGAGGAG CTGGATGAAG ACCTCTTCCT 1740 GCAGCTCACC GGGGGCCATG AGGCCTTCTG AGGGCTGTCT GATTGCCCCT GCCCTGCTCA 1800 CCACCCTGTC ACAGCCACTC CCAAGCCCAC ACCCACAGGG GCTCAOTGCC CCACACCCGC 1860 TCCAGGCAGG CACCCAGCTG GGCATTTCAC CTGCTGTCAC TGACTTTGTG CAGGCCAAGG 1920 ACCTGGCAGG GCCAGACGCT GTACCATCAC CCAGGCCAGG GATGGGGGTG GGGGTCCCTG 1980 AGCTCATGTG GTGCCCCCTT TCCITGTCTG AGTGGCTGAG GCTGATACCC CTGACCTATC 2040 TGCAGTCCCC CAGCACACAA GGAAGACCAG ATGTAGCTAC AGGATGATGA AACATGGTTT 2100 CAAACGAGTT CTm.TPC.TT ΑΟΤΓΓΓΓΑΑΑ ATTTCTTTTT TATAAATTAA TATTTTATTG 2160 TTGGATCCTC CTCCTnCTC TGGAGCTGTG CTTGGGGCTA CTCTGACACT CTGTCTCTTC 2220 ATCACCAGCC AAGGAAAGGG GCTTTCCTGA TAAAGACAAG AGTTGGTTAG AGAAAGGGAC 2280 ACCTAAGTCA GTCTAGQGTT GGAAGCTAGG AGAGAGGTGA GGGCAGAAGG GCACAGCTTT 2340 CAGGAACAAG GAATAGGGGC TGGGGTKGTK GTTCTCACGG GTAGGCGGTA CCTGCAGGGC 2400 CTCCTTGAAG TACTTGGGAA GGAGGAAGCC ATCAGTATTC CCTGGAGTCA GAATCACCCC 2460 ATTGGCAGAG CGGAAGAAGG GTATTCCATC TGCTGACAGA GCCAGAGATG TGACTCATGC 2520 CCTCCCCGAA GGCAAAGTCA GCTCCTGCTT TGTCCAGACT CACCTGCCAG AGCCAGGGGT 2580 C 2581 (2) INFORMAÇÃO PARA SEQ ID N°: 44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1764 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear 236 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 44: GAATTCGGCA CGAGGATGAT ATTCCTACTA TTCCTCACCC CACTCTGGCT GCAAAAAGGA 60 AGTGCAGGGA AAATGAGTGG GGAGTTCCTG TATGCCAGTC TGTTTCAATG GAACTATTCT 120 TGGAGGAATA AAAAAGTATG CTAGATTATA TTGGTACGAT AGGCATTTTC TTACAITGCA 180 TATAGTCTGC TTTGGCTTTT ACCTGTTGAG GGGAAGAATG AGGAGAGGAT AAAAATCATT 240 GTATCCCCTA GAGAAGGAAT ATCAAAATCC ATTTAATAM AAAACTCATA CTAAGAATAA 300 AATTGCATAG TGTTTTATTC TCCTTTGTTC ATAATTAAAC ACAAGATATT TTAAATTGTC 360 AAATCAGTTT CTTTATGAAA AAATATGACC TGTATGCCTT TATTCTCTCC TTTCCTTCTT 420 CCCACCCGTC GCTTCTTTTC TTCTCTTCCT TTTTTTCTTT CCTTGTCCTC TGACTAAATG 480 AAGAACAAAC ATTTGATAAA AGCCACTGCC AATTCATGAT AAAAATTCAC AGCAAAGTTG 540 GTACAGAAAA GAACTTTCTC TGCGTGTTAA AGGGTGCCTC TCCCATGCTC TCAGCAAATA 600 TTTAATGATG AAATCTTATT AATAATCACT GTAGAACCAA GAATTAAACT AGTATACCCA 660 CTGTCTTGGC TTGTAATCAA CAATATACAG GTGGTTCTAG CCAGTGCAAT AAGACAAGAG 720 AAACAAAAAT GTTATAAGGC CTGGAAAAGA TGAAACAAAC TGTTATTCAC AAAATACTGT 780 CTATACAGAA TGCTCAGTGT CTTTTTTTCT TTTCTTTTTT TTAAACTTTA GTGAGATACC 840 CTTCTGCCCT ATCTTAAAAT CACGTGGTGG GGGGTGGTGT CTGCACTTGA AACAGGACAC 900 TTGGTTCCTG GGTTTAGCAT TGACCTTGCC AGCTTGGTyT GGCAGCTGAG TTGTTGGACT 960 aggaagcgtc cytgcaggtt gtgktctgkt acctctctgt aaagcctgaa agcatcctac 1020 SATTOCATTT GCTAGKTCTC AGTAGAGCTA TTTAACAAGA ATCTGGAAAC ATTTIYCCTG 1080 AGGGCTCTCT TTAGACAGCA GTAAAATGTA GCTGGAGACA TATTGAGTAA ATGGAAAAGA 1140 AAAATCTAAT GAGGCCAGGA ATTTTTTTAA TCTTCTATTC TCACAGAAGG CCTCAAGGAG 1200 AACACCATAA TTCATATTTT ACTCAKGTGG GTTAGGCATA AAGCCTCCCC CATAGATCCA 1260 ATAACCTGTA RGTGTYCTGG TTTTGAAATT GCACCTGCTT ACATKGCTGG ATCOTAGCAC 1320 TAAWTCACAC RGCAACGGCT TCTGGTTCAA TKGTTCATTA CTTGGGAATG TCAGATTGCC 1380 AGAGAGCAGC CTGATGTTTA CATCCAATCG GCAATGCCTT AGGAAATCAG TTTTAATTAC 1440 AATCTCACGT AGCAGCACTG CACTCAACCT TCAGAGAGGC TGGGATTTGT GTTGAACCTA 1500 CATCTTATAG CTGTGCAGAA AATGCCTGTC CGACTGGGTC ATGCAAAATG GACAGCAAAG 1560 TCAGCAGAAC CTTAGAAAAG ATGACACAGC AAGTGGAACA CAGCTGGATC ATCCCCCGTC 1620 237 CTGTCAAGCG TQCAGTGCTC TCTGGCCCCT TTTTAAAACA AGGGAACCCA GTTQGCGTTT 1680 GCCTTTCAGC TTCCCCATTC TGATATAAAA ATCTGTGACC CAGCAGCTTT AACCATAAAA 1740 AAAAAAAAAA AAAAAAAAAC TCGA 1764 (2) INFORMAÇÃO PARA SEQ ID N°: 45: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 796 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 45: ACCTTCTTCC ATGTTTAGTC CCTTGGGCTC TGCTACCCTC CTGCTGGAGG TGAGAGCATC 60 CTGTGTGCAA CCAGAGATGC CCTCTGGCTT TCAGACCTGC CTGCTTTTCA CCCTCAGCCC 120 TTTCTCACTC AGCAAAATTG TGGGGGTCCC TAGTCAGCAG CTCCCTGGGC AGCTCTCTGA 180 GCAAGGTCGT CTCTGTGGTC ATGAAGGAGA GCCGGCTAGG ACAGTGCCGG AAACTCAGCT 240 GCCTCTCCCC TTCAACTCAG CTGGCCCCCC GCACCTGAAG TGCACAGGAG CCGGGAAGAG 300 AGTCTGGAGC CCACCCOGGA GGGCAGCACA GGAGGTGTCT YTGCAGCTGG TGTCCTGCMA 360 CCCVTCCAGG CACMACACGT CCCGGGCATT YTCYTTAGCC ACAGACAGAA CAGCCAGTGC 420 CAGAOTCTGC TGTCGYTTCC CCITTAAGCA CACTCATTCA CCACACCCGA GGAGGCCAGA 480 GOWCAOGGA GCATGGGCTG TCGTTCCCCT TTAAGCACAC TCATTCACCA CACCCGAGGA 540 GGCCAGAAGT GCAGGGAGCA TCGGCTGGGT GCACCTCCGC AGGAGAGAAG OCTGAGCCAC 600 CGCCGTCCCG GGAGCCCGGC TCCCAGGCCT CTCGTTTTCC CCTACCTCCC TAAGACTTTT 660 CTGTCACTCT CTGGCCATTG AAAGGCTTCT GTTCCTTAAA GTGCTGTTAC ACTCTCCITP 720 CCCAGGATGC AGCAAGCCAA AACAGTACCA CTGCACGTCA GCCTGGGTGA CAGAGTGAGA 780 CCCTATCTTA AAAAAA 796 238 (2) INFORMAÇÃO PARA SEQ ID N°: 46: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1705 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 46: TGGCCATGGA AGCGCTAGAA GGTTTAGATT TTGAAACAGC AAAGAAGGAT TTCCTTGGAT 60 CTGGAGACCC CAAAGAAACA AAGATGCTAA TCACCAAACA GGCTGACTGG GCCAGAAATA 120 TCAAGGAGCC CAAAGCCGCC GTGGAGATGT ACATCTCAGC AGGAGAGCAC GTCAAGGCCA 180 TCGAGATCTG TGGTGACCAT GGCTGGGTTG ACATGTTGAT CGACATCGCC CGCAAAC7QG 240 ACAAGGCTGA GCGCGAGCCC CTGCTGCTGT GCGCTACCTA CCTCAAGAAG CTGGACAGCC 300 CTGGCTATGC TGCTGAGACC TACCTGAAGA TGGOTGACCT CAACTCCCTG GTGCAGCTGC 360 AGTGGAGACC CAGCGCTGGG ATGAGGCCTT TGCTTTGGGT GAGAAGCATC CTGAGTTTAA 420 GGATGACATC TACATGCCGT ATGCTCAGTG GCTAGCAGAG AACGATCGCT TTGAGGAAGC 480 CCAGMAGCG TTCCACAAGG CTGGGCGACA GAGAGAAGCG GTCCAGGTGC TGGAGCAGCT 540 CACAAACAAT GCCGTO3CGG AGAGCAGGTT TAATGATGCT GCCTATTATT ACTGGATGCT 600 GTCCATGCAG TGCCTCGATA TAGCTCAAGA TCCTGCCCAG AAGGACACAA TGCTTGGCAA 660 GTTCTACCAC TTCCAGCGTT TGGCAGAGCT GTACCATGGT TACCATGCCA TCCATCGCCA 720 CACGGAAGAT CCGTTCAGTG TCCATCGTCC TCAAACTCTT TTCAACATCT CCAGGTTCCT 780 GCTGCACAGC CTGCCCAAGG ACACCCCCTC GGGCATCTCT AAAGTGAAAA TACTCTTCAC 840 CTTGGCCAAG CAGAGCAAGG CCCTCGGTGC CTACAGGCTG GCCCGGCACG CCTATGACAA 900 GCTGCGTGGC CTGTACATCC CTGCCAGATT CCAAAAGTCC ATTGAGCTGG GTACCCTGAC 960 CATCCGCGCC AAGCCCTTCC ACGACAGTGA GGAGTTGGTG CCCTTGTGCT ACCGCTGCTC 1020 CACCAACAAC CCGCTGCTCA ACAACCTGGG CAACGTCTGC ATCAACTGCC GCCAGCCCTT 1080 239 CATCTTCTCC GCCTCTTCCT ACGACGTGCT ACACCTGGTT GAGTTCTACC TGGAGGAAGG 1140 GATCACTGAT GAAGAAGCCA TCTCCCTCAT CGACCTGGAG GTGCTGAGAC CCAAGCGGGA 1200 TGACAGACAG CTAGAGATTT GCAAACAACA GCTCCCAGAT TCTTGCGGCT AGTGGGAGAC 1260 CAAGGGACTC CATCGGAGAT NAGGACCCGT TCACAGCTAA GCTRAGCTTT GAGCAAGGTG 1320 GCTCARAGTT CGTGCCAGTG GTGGTGAGCC GGCTGGTGCT GCGCTCCATG AGCCGCCGGG 1380 ATGTCCTCAT CAAGCGATGG CCCCCACCCC TGAGGTGGCA ATACTTCCGC TCACTGCTGC 1440 CTGACGCCTC CATTACCATG TGCCCCTCCT GCTTCCAGAT GTTCCATTCT GAGGACTATG 1500 AGTTGCTGGT GCTTCAGCAT GGCTGCTGCC CCTACTGCCG CAGGTGCAAG GATGACCCTG 1560 GCCCATGACC AGCATCCTGG GGACGGCCTG CACCCTCTGC CCGCCTTGGG GTCTGCTGGG 1620 CTGTGAAGGA GAATAAAGAG TTAAACTGTC AAAAAAAAAA ΑΑΆΑΑΑΑΑΑΑ AAAAAAAAAA 1680 AAAAAAAAAA AAAAAAAAAA AAANA 1705 (2) INFORMAÇÃO PARA SEQ ID N°: 47: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 981 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: dupla (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 47: TCGGCAGCAC AGAGCTCTGG AGATGAAGAC CCTGTTCCTG GGTGTCACQC TCGGCCTGGC 60 5CTGCCCTGT CCTTCACCCT GGRGGAGGAG GATATCACAG GGACCTGGTA CGTGAAGGCC 120 ATGGTGGTCG ATAAGACTTT CCGGAGACAG GAGGCCCAGA AGGTGTCCCC AGTGAAGGTG 180 ACAGCCCTGG GCGGTGGGAA GTTGGAAGCC ACGTTCACCT TCATGAGGGA GGATCGGTGC 240 ATCCAGAAGA AAATCCTGRT GCGGAAGACG GAGGAGCCTG GCAAATACAG CGCCTGTGAG 300 CCCCTCCCCC AYTCCCACCC CCACCYTCCC CCACCGCCAA CCCCAGTGCA CCAGCCTCCA 360 240 CAGGTAGAGA GTGCCCAGGC TGCCCTTTTG CCAGGGCCCC AGCTCTGCCC ACCTCCAAGG 420 AGGGGCTGGC CTCTCCTTCC TGGGGGGCTG GTGGCCCTGA CATCAGACAC CGGGTGTGAC 480 AGGCTTGTCC GCAGTCGAGA TGGACCAGAT CACGCCTGCC CTCTGGGAGG CCCTAGCCAT 540 TGACACATTG AGGAAGCTGA GGATTGGGAC AAGGAGGCCA AGGATTAGAT GGGGGCAGGA 600 AGCTCATGTA CCTGCAGGAG CTGCCCAGGA GGGACCAYTA CATCTTTTAC TGCAAAGACC 660 AGCACCATGG GGGCSTGCTC CACATGGGAA AGCTTGTGGG TAGGAATTCT GATACCAACC 720 GOGAGGCTCT GGAAGAATTT AAGAAATTGG TGCAGCGCAA GGGACTCTCG GAGGAGGACA 780 TTTTCACGCC CCTGCAGACG GGAAGCTGCR TTCCCGAACA CTAGGCAGCC CCCGGGTCTG 840 CACCTCCAGA GCCCACCCTA CCACCAGACA CAGAGCCCGG ACCACCTGGA CCTACCCTCC 900 AGCCATGACC CTTCCCTGCT CCCACCCACC TGACTCCAAA TAAAGTCCTT CTCCCCCAAA 960 ΑΑΑΑΑΑΛΑΑΑ AAAAAACTCG a 981 (2) INFORMAÇÃO PARA SEQ ID N°: 48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 146 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 48:
Met His Tyr Gin Met Ser Vai Thr Leu Lys Tyr Glu Ile Lys Lys Leu 15 10 15
Ile Tyr Vai His Leu vai Ile Trp Leu Leu Leu vai Ala Lys MeC Ser 20 25 30
Vai Gly His Leu Arg Leu Leu Ser His Asp Gin Vai Ala Met Pro Tyr 35 40 45
Gin Trp Glu Tyr Pro Tyr Leu Leu Ser Ile Leu Pro Ser Leu Leu Gly 50 55 60 241
Leu Leu Ser Phe Pro Arg Asn Asn Ile Ser Tyr Leu Vai Leu Ser Met 65 70 75 80
Ile Ser Met Gly Leu Phe Ser Ile Ala Pro Leu Ile Tyr Gly Ser Met 85 90 95
Glu Met Phe Pro Ala Ala Gin Pro Ser Thr Ala Met Ala Arg Pro Thr 100 105 110
Vai Ser Ser Leu Vai Phe Leu Pro Phe Pro Ser Cys Thr Trp Cys Trp 115 120 125
Cys Trp Gin Cys Lys Cys Met Pro Gly Ser Cys Thr Thr Ala Arg Ser 130 135 140
Ser Xaa 145 (2) INFORMAÇÃO PARA SEQ ID N°: 49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 312 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 49:
Met Asn Ser Vai Vai Ser Leu Leu Leu Ile Leu Glu Pro Asp Lys Gin 1 5 10 15 Glu Ala Leu Ile Glu Ser Leu Cys Glu Lys Leu Vai Lys Phe Arg Glu 20 25 30 Gly Glu Arg Pro Ser Leu Arg Leu Gin Leu Leu Ser Asn Leu Phe His 35 40 45 Gly Met Asp Lys Asn Thr Pro Vai Arg Tyr Thr Vai Tyr Cys Ser Leu 50 55 60 Ile Lys Vai Ala Ala Ser Cys Gly Ala Ile Gin Tyr Ile Pro Thr Glu 65 70 75 80 Leu Asp Gin Vai Arg Lys Trp Ile Ser Asp Trp Asn Leu Thr Thr Glu 85 90 95 242
Lys Lys His Thr Leu Leu Arg Leu Leu Tyr Glu Ala Leu Vai Asp Cys 100 105 110
Lys Lys Ser Asp Ala Ala Ser Lys Vai Met Vai Glu Leu Leu Gly Ser 115 120 125
Tyr Thr Glu Asp Asn Ala Ser Gin Ala Arg Vai Asp Ala His Arg Cys 130 135 140
Xle Vai Arg Ala Leu Lys Asp Pro Asn Ala Phe Leu Phe Asp His Leu 145 150 155 160
Leu Thr Leu Lys Pro Vai Lys Phe Leu Glu Gly Glu Leu Ile His Asp 165 170 175
Leu Leu Thr Xle Phe Vai Ser Ala Lys Leu Ala Ser Tyr Vai Lys Phe 180 185 190
Tyr Gin Asn Asn Lys Asp Phe Ile Asp Ser Leu Gly Leu Leu His Glu 195 200 205
Gin Asn Met Ala Lys Met Arg Leu Leu Thr Phe Met Gly Met Ala Vai 210 215 220
Glu Asn Lys Glu Ile Ser Phe Asp Thr Met Gin Gin Glu Leu Gin Ile 225 230 235 240
Gly Ala Asp Asp Vai Glu Ala Phe Vai Ile Asp Ala Vai Arg Thr Lys 245 250 255
Met Vai Tyr cys Lys Ile Asp Gin Thr Gin Arg Lys Vai vai Vai Ser 260 265 270
His Ser Thr His Arg Thr Phe Gly Lys Gin Gin Trp Gin Gin Leu Tyr 275 280 285
Asp Thr Leu Asn Ala Trp Lys Gin Asn Leu Asn Lys Vai Lys Asn Ser 290 295 300
Leu Leu Ser Leu Ser Asp Thr Xaa 305 310 (2) INFORMAÇÃO PARA SEQ ID N°: 50: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 47 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 243 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 50:
Gly Gly Cys Pro Arg Arg Arg Leu Vai Leu Tyr Cys Leu Phe Gly Ser 1 5 10 15 Ala Gly Gly Gly Arg Ile His Ser Glu Ala Trp Phe Pro Lys Ala Trp 20 25 30 Pro Glu Ala GlU Lys Trp Leu Phe Ala Glu Leu Leu Arg Gly Xaa 35 40 45 (2) INFORMAÇÃO PARA SEQ ID N°: 51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 467 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 51:
Met Leu Ser Arg Pro Gin Pro Pro Pro Asp Pro Leu Leu Leu Gin Arg 1 5 10 15 Leu Pro Arg Pro Ser ser Leu Ser Asp Lys Thr Gin Leu His Ser Arg 20 25 30 Trp Leu Asp Ser Ser Arg Cys Leu Met Gin Gin Gly Ile Lys Ala Gly 35 40 45 Asp Ala Leu Trp Leu Arg Phe Lys Tyr Tyr Ser Phe Phe Asp Leu Asp 50 55 60 Pro Lys Thr Asp Pro Vai Arg Leu Thr Gin Leu Tyr Glu Gin Ala Arg 65 70 75 80 Trp Asp Leu Leu Leu Glu Glu lie Asp Cys Thr Glu Glu Glu Met Met 85 90 95 Vai Phe Ala Ala Leu Gin Tyr His Ile Asn Lys Leu Ser Gin Ser Gly 100 105 110 244
Glu Vai Gly Glu Pro Ala Gly 115 Vai Ala Leu Ser Asn Leu Glu 130 135 Asp Vai Leu Asp Ser Leu Thr 145 150 Arg Ile Phe Arg Pro Arg Lys 165 Trp Vai Vai Phe Lys Glu Thr 180 Glu Ala Pro Gly Asp Pro Ile 195 Vai Vai Pro Asp Vai Asn Vai 210 215 Leu Vai Pro Ser Pro Glu Gly 225 230 Asp Glu Gin Gin Tyr Ala Arg 245 Lys Gly Arg Thr Met Ala Asp 260 Ile Leu Ala Phe Leu Ser Leu 275 Asn His Pro His Gly Pro Asp 290 295 Gly Leu Vai Ala Pro Arg Phe 305 310 Thr Pro Arg Ile Leu Glu Ala 325 Ala Glu Ala Gin Leu Arg Phe 340 Phe Gly Ile Ser Tyr Vai Met 355
Pro Gly Leu Asp Asp Leu Asp 125 Leu Glu Gly Ser Ala Pro Thr 140 Pro Glu Leu Lys Asp His Leu 155 160 Leu Lys Gly Tyr Arg Gin His 170 175 Ser Tyr Tyr Lys Ser Gin Asp 190 Leu Asn Leu Lys Gly Cys Glu 205 Gin Lys Phe Cys Ile Lys Leu 220 Glu Ile Tyr Leu Arg Cys Gin 235 240 Ala Gly Cys Arg Leu Ala Ser 250 255 Tyr Thr Ser Glu Vai Gin Ala 270 Thr Gly Ser Gly Gly Pro Gly 285 Ala Glu Gly Leu Asn Pro Tyr 300 Lys Phe Lys Ala Lys Gin Leu 315 320 Asn Vai Ala Gin Leu Ser Leu 330 335 Ala Trp Gin Ser Leu Pro Asp 350 Phe Lys Gly Ser Arg Lys Asp 365
Glu Ile Leu Gly Ile Ala Asn Asn Arg Leu Ile Arg Ile Asp Leu Ala 370 375 380 vai Gly Asp Vai Vai Lys Thr Trp Arg Phe Ser Asn Met Arg Gin Trp 385 390 395 400 Asn Vai Asn Trp Asp Ile Arg Gin Vai Ala Ile Glu Phe Asp Glu His 405 410 415 Ile Asn Vai Ala Phe Ser Cys Vai Ser Ala Ser Cys Arg Ile Vai His 420 425 430 Glu Tyr Ile Gly Gly Tyr Ile Phe Leu Ser Thr Arg Glu Arg Ala Arg 435 440 445 Gly Glu Glu Leu Asp Glu Asp Leu Phe Leu Gin Leu Thr Gly Gly His 450 455 460 Glu Ala Phe 465 (2) INFORMAÇÃO PARA SEQ ID N°: 52: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 83 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 52:
Met Arg Pro Gly Arg Gly Ala Gly Thr Pro Gly Arg Pro Gly Arg Gly 1 5 10 15 Arg Gly Leu Ala Ala Thr Cys Ser Leu Ser Ser Pro Ser His Leu Leu 20 25 30 Pro Thr Leu Leu His Thr Phe Ser Phe Ser Leu Pro Pro Pro Ser Pro 35 40 45 Ala Ala Pro Arg Gin Pro Ser Pro Pro Ala Leu Leu Leu Pro Gly Pro 50 55 60 246
Gin Lys Pro Arg Pro Gly Asp Pro Thr Tyr Thr Gly Ala Leu Thr Asp 65 70 75 80
Trp Ser Xaa (2) INFORMAÇÃO PARA SEQ ID N°: 53: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 63 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 53:
Met Phe Leu Vai Phe Phe Leu Ser Phe Phe Ser His Ser Ile Ser Ala 15 10 15
Leu Thr Leu Vai Cys Ser Gin Gly Gly Lys Ala Asp Met Asn Leu Leu 20 25 30
Ser Trp Asp Phe Arg Pro His Trp Leu Glu Gly Ile Arg Phe Leu Leu 35 40 45
Gly Trp Gly Gin Ala Leu Met Ala Gly Leu Phe Pro Trp Leu Xaa 50 55 60 (2) INFORMAÇÃO PARA SEQ ID N°: 54: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 124 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 247 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 54:
Met Arg Gly Ser Trp His Arg Ser Pro Leu Pro Ala Vai Vai Leu Pro 15 10 15
Ser Vai Leu Gin Thr Ala Leu Ser Pro Leu Ala Leu Cys Gin Ala Trp 20 25 30
Arg Arg Ala Vai Pro His Gly Vai Pro Ser Gin Arg Leu Arg Asn Gin 35 40 45
Glu Ala Ser Leu Vai Pro Lys Gly Vai Pro Arg Ala Trp Tyr Pro Gly 50 55 60
Pro Leu Gin Asn Gly Leu Trp Thr His Leu Glu Lys Gly Glu Leu Leu 55 70 75 80
Gly Leu Lys Pro Thr Pro Gly Gly Leu Leu Leu Leu Arg Ser Phe Trp 85 90 95
Asp Pro His Pro Ser Arg Pro Phe Leu Cys Thr Leu Leu Pro Pro Pro 100 105 110
Leu Xaa Ile Phe Pro Pro Leu Arg Cys Ser Ala Xaa 115 120 (2) INFORMAÇÃO PARA SEQ ID N°: 55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 180 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 55:
Met Thr Ser Ala Gly Pro Vai Xaa Leu Phe Leu Leu Vai Ser Ile Ser 15 10 15
Thr Ser Vai Ile Leu Met Gin His Leu Leu Xaa Ala Ser Tyr Cys Asp 20 25 30 248
Leu Leu His Lys Ala Ala Ala His Leu Gly Cys Trp Gin Lys Vai Asp 35 40 45
Pro Ala Leu Cys Ser Asn Vai Leu Gin His Pro Trp Thr Glu Glu Cys 50 55 60
Met Trp Pro Gin Gly Vai Leu Vai Lys His Ser Lys Asn Vai Tyr Lys 65 70 75 80
Ala Vai Gly Xaa Xaa Xaa Vai Ala Zle Pro Ser Asp Vai Ser His Phe 85 90 95
Arg phe Xaa Phe Phe Phe Ser Lys Pro Leu Arg He Leu Asn Ile Leu 100 105 110
Leu Leu Leu Glu Gly Ala Vai Ile Vai Tyr Gin Leu Tyr Ser Leu Met 115 120 125
Ser Ser Glu Lys Trp His Gin Thr Ile Ser Leu Ala Leu Ile Leu Phe 130 135 140
Ser Asn Tyr Tyr Ala Phe Phe Lys Leu Leu Arg Asp Arg Leu Vai Leu 145 150 155 160
Gly Lys Ala Tyr Ser Tyr Ser Ala Ser Pro Gin Arg Asp Leu Asp His 165 170 175
Arg Phe Ser Xaa 180 (2) INFORMAÇÃO PARA SEQ ID N°: 56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 287 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 56:
Met Pro Leu Phe Lys Leu Tyr Met Vai Met Ser Ala Cys Phe Leu Ala 15 10 15 249
Ala Gly Ile Phe Trp Vai Ser Ile Leu Cys Arg Asn Thr Tyr Ser Vai 20 25 30
Phe Lys Ile His Trp Leu Met Ala Ala Leu Ala Phe Thr Lys Ser Ile 35 40 45
Ser Leu Leu Phe His Ser Ile Asn Tyr Tyr Phe Ile Asn Ser Gin Gly 50 55 60 pro Pro His Arg Arg Pro Cys Arg His Vai Leu His Arg Thr Pro Ala 65 70 75 80
Glu Gly Arg Pro Pro Leu His His His Arg Pro Asp Trp Leu Arg Leu 85 90 95
Gly Phe Ile Lys Tyr Vai Leu Ser Asp Lys Glu Lys Lys Vai Phe Gly 100 105 110
Ile Vai Ile Pro Met Gin Vai Leu Ala Asn Vai Ala Tyr Ile Ile Ile 115 120 125
Glu Ser Arg Glu Glu Gly Ala Thr Asn Tyr Vai Leu Trp Lys Glu Ile 130 135 140
Leu Phe Leu Vai Asp Leu Ile Cys Cys Gly Ala Ile Leu Phe Pro Vai 145 150 155 160
Vai Trp Ser Ile Arg His Leu Gin Asp Ala Ser Gly Thr Asp Gly Lys 165 170 175
Vai Ala Vai Asn Leu Ala Lys Leu Lys Leu Phe Arg His Tyr Tyr Vai 180 185 190
Met Vai Ile Cys Tyr Vai Tyr Phe Thr Arg Ile Ile Ala Ile Leu Leu 195 200 205
Gin Vai Ala Vai Pro Phe Gin Trp Gin Trp Leu Tyr Xaa Leu Leu Vai 210 215 220
Glu Gly Ser Thr Leu Ala Phe Phe Vai Leu Thr Gly Tyr Lys Phe Gin 225 230 235 240
Pro Thr Gly Asn Asn Pro Tyr Leu Gin Leu Pro Gin Glu Asp Glu Glu 245 250 255
Asp Vai Gin Met Glu Gin Vai Met Thr Asp Ser Gly Phe Arg Glu Gly 260 265 270
Leu Ser Lys Vai Asn Lys Thr Ala Ser Gly Arg Glu Leu Leu Xaa 275 280 285 250 (2) INFORMAÇÃO PARA SEQ ID N°: 57: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 34 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 57:
Met Pro Met Vai Phe Leu Leu Leu Phe Asn Leu Met Ser Trp Leu Ile 15 10 15
Arg Asn Ala Arg vai Ile Leu Arg Ser Leu Asn Leu Lys Arg Asp Gin 20 25 30
Vai xaa (2) INFORMAÇÃO PARA SEQ ID N°: 58: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 58:
Met Lys Ile Vai Vai Leu Leu Pro Leu Phe Leu Leu Ala Thr Phe Pro 15 10 15
Arg Lys Leu Gin Thr Cys Leu Xaa 20 251 (2) INFORMAÇÃO PARA SEQ ID N°: 59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 47 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 59:
Met Ser Gly Gly Glu Gly Ala Ala Leu Pro Ile Leu Leu Leu Leu Leu
Ala Leu Arg Gly Thr Phe His Gly Ala Arg Pro Gly Gly Gly Ala Ser 20 2S 30
Gly He Trp Cys Leu Leu Leu Pro Glu Gin Glu Pro Pro Vai Xaa 35 40 45 (2) INFORMAÇÃO PARA SEQ ID N°: 60: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 114 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 60:
Met Ala Arg Gly Ser Leu Arg Arg Leu Leu Arg Leu Leu Vai Leu Gly 1 5 10 15 Leu Trp Leu Ala Leu Leu Arg Ser Vai Ala Gly Glu Gin Ala Pro Gly 20 25 30 Thr Ala Pro Cys Ser Arg Gly Ser Ser Trp Ser Ala Asp Leu Asp Lys 35 40 45 252
Cys Met Asp Cys Ala ser Cys Arg Ala Arg pro His Ser Asp Phe Cys 50 55 60
Leu Gly Cys Ala Ala Ala Pro Pro Ala Pro Phe Arg Leu Leu Trp Pro 65 70 75 80 lie Leu Gly Gly Ala Leu Ser Leu Thr Phe Vai Leu Gly Leu Leu Ser 85 90 95
Gly Phe Leu Vai Trp Arg Arg Cys Arg Arg Glu Arg Ser Ser Pro Pro 100 105 110
Pro Xaa (2) INFORMAÇÃO PARA SEQ ID N°: 61: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 61:
Met Val Cys ile Leu Vai Leu Thr Leu Vai Ser Tyr Ser Ser Leu Vai 15 10 15
Asn Ser Pro Leu Pro Phe Val His Leu Xaa Val Gly Ile Ser Ala Xaa 20 25 30 (2) INFORMAÇÃO PARA SEQ ID N°: 62: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 81 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 253 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 62:
Met Thr Gly Gly Phe Leu Ser Cys Ile Leu Gly Leu Vai Leu Pro Leu 1 5 10 15 Ala Tyr Xaa Ser Ser Leu Thr Trp Cys Trp Trp Arg Trp Gly Leu Pro 20 25 30 Xaa Pro Ala Gly Pro Pro Arg Cys Thr Pro Gly Cys Asn Ala Ser Gly 35 40 45 Ala Gly Arg Gly Pro Ser Pro Gly Pro Pro Gly Gly Glu Leu His Thr 50 55 60 Pro Ala Ser Arg Asp Pro Gly Pro Gly Ala Glu Trp Arg Gly Thr Ser 65 70 75 80
Xaa (2) INFORMAÇÃO PARA SEQ ID N°: 63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 104 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 63:
Met Ala Ala Pro Vai Asp Leu Glu Leu Lys Lys Ala Phe Thr Glu Leu 1 5 10 15 Gin Ala Lys Vai Ile Asp Thr Gin Gin Lys Vai Lys Leu Ala Asp Ile 20 25 30 Gin Xle Glu Gin Leu Asn Arg Thr Lys Lys His Ala His Leu Thr Asp 35 40 45 Thr Glu Ile Met Thr Leu Vai Asp Glu Thr Asn Met Tyr Glu Gly Vai 50 55 60 Gly Arg Met Phe Ile Leu Gin Ser Lys Glu Ala Ile His Ser Gin Leu 65 70 75 80 254
Leu Glu Lys Gin Lys Ile Ala Glu Glu Lys Ile Lys Glu Leu Glu Gin 85 90 95
Lys Lys Ser Tyr Leu Glu Arg Arg 100 (2) INFORMAÇÃO PARA SEQ ID N°: 64: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 146 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 64:
Met Pro Ser Gly Phe Gin Thr Cys Leu Leu Phe Thr Leu Ser Pro Phe 15 10 15
Ser Leu Ser Lys Ile Vai Gly Vai Pro Ser Gin Gin Leu Pro Gly Gin 20 25 30
Leu Ser Glu Gin Gly Gly Leu Cys Gly His Glu Gly Glu Pro Ala Arg 35 40 45
Thr Vai Pro Glu Thr Gin Leu Pro Leu Pro Phe Asn Ser Ala Gly Pro 50 55 60
Pro His Leu Lys cys Thr Gly Ala Gly Lys Arg Vai Trp Ser Pro Pro 65 70 75 80
Arg Arg Ala Ala Gin Glu Vai Ser Leu Gin Leu Vai Ser Cys His Pro 85 90 95
Cys Arg Gin His Thr Ser Arg Ala Phe Ser Leu Ala Thr Asp Arg Thr 100 105 110
Ala Ser Ala Arg Vai Cys Cys Arg Ser Pro Leu Ser Thr Leu Ile His 115 120 125
His Thr Arg Gly Gly Gin Arg Cys Arg Glu His Gly Leu Ser Leu Pro 130 135 140
Leu Xaa 145 255 (2) INFORMAÇÃO PARA SEQ ID N° : 65: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 65:
Met Ala Ile Leu Met Leu Leu Ala Gly Ser Pro Cys Thr Leu Ser Phe 15 10 15
Ser Thr Asp Thr Gly Ser Ser Ala Pro Gly Pro Lys Ile Pro Xaa 20 25 30 (2) INFORMAÇÃO PARA SEQ ID N°: 66: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 260 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 66:
Met Aãp Pro Gin Gly Gin Thr Leu Leu Leu Phe Leu Phe Vai Asp Phe 1 5 10 15 His Ser Ala Phe Pro Vai Gin Gin Met Glu Ile Trp Gly Vai Tyr Thr 20 25 30 Leu Leu Thr Thr His Leu Asn Ala Ile Leu Vai Glu Ser His Ser Vai 35 40 45 Vai Gin Gly Ser Ile Gin Phe Thr Vai Asp Lys Vai Leu Glu Gin His 50 55 60 256
His Gin Ala Ala Lys Ala Gin Gin Lys Leu Gin Ala Ser Leu Ser Vai 65 70 75 80
Ala Vai Asn Ser Ile Met Ser Ile Leu Thr Gly Ser Thr Arg Ser Ser 85 90 95
Phe Arg Lys Met Cys Leu Gin Thr Leu Gin Ala Ala Asp Thr Gin Glu 100 105 110
Phe Arg Thr Lys Leu His Lys Vai Phe Arg Glu Ile Thr Gin His Gin 115 120 125
Phe Leu His His Cys Ser Cys Glu Vai Lys Gin Leu Thr Leu Glu Lys 130 135 140
Lys Asp Ser Ala Gin Gly Thr Glu Asp Ala Pro Asp Asn Ser Ser Leu 145 150 155 160
Glu Leu Leu Ala Asp Thr Ser Gly Gin Ala Glu Asn Lys Arg Leu Lys 165 170 175
Arg Gly Ser Pro Arg ile Glu Glu Met Arg Ala Leu Arg Ser Ala Arg 180 185 190
Ala Pro Ser Pro Ser Glu Ala Ala Pro Arg Arg Pro Glu Ala Thr Ala 195 200 205
Ala Pro Leu Thr Pro Arg Gly Arg Glu His Arg Glu Ala His Gly Arg 210 215 220
Ala Leu Ala Pro Gly Arg Ala Ser Leu Gly Ser Arg Leu Glu Asp Vai 225 230 235 240
Leu Trp Leu Gin Glu Vai Ser Asn Leu Ser Glu Trp Leu Ser Pro Ser 245 250 255
Pro Gly Pro Xaa 260 (2) INFORMAÇÃO PARA SEQ ID N°: 67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 257 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 67:
Met Ala Ala Ala Cys Gly Pro Gly Ala Ala Gly Thr Ala Cys Ser Ser 15 10 15
Ala Cys Ile Cys Phe Cys Xaa 20 (2) INFORMAÇÃO PARA SEQ ID N°: 68: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 27 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 68:
Met His Ala Leu Ile Leu Gin Phe Ile Phe Ser Leu Cys Met Tyr Ile 15 10 15
Ser Leu Phe Ser Ala Ala Arg Phe Leu Phe Xaa 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 69: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 258 (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID N°: 69:
Leu Leu Leu Leu Cys Phe Cys Cys His Pro Thr His Leu Gin Gly Xaa 15 10 15
Trp Ala Leu Asp Leu Gly Leu Phe Pro Phe Asn Cys Xaa 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 70: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 216 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 70:
Met : Tyr Leu Ser Ile Ile Phe Leu Ala Phe Vai Ser Ile Asp Arg Cys 1 5 10 15 Leu Gin Leu Thr His Ser Cys Lys Ile Tyr Arg Ile Gin Glu Pro Gly 20 25 30 Phe Ala Lys Met Ile Ser Thr Vai Vai Trp Leu Met Vai Leu Leu Ile 35 40 45 Met Vai Pro Asn Met Met Ile Pro Ile Lys Asp Ile Lys Glu Lys Ser 50 55 60 Asn Vai Gly Cys Met Glu Phe Lys Lys Glu Phe Gly Arg Asn Trp His 65 70 75 80 Leu Leu Thr Asn Phe Ile Cys Vai Ala Ile Phe Leu Asn Phe Ser Ala 85 90 95 Ile Ile Leu Ile Ser Asn Cys Leu Vai Ile Arg Gin Leu Tyr Arg Asn 100 105 110 Lys Asp Asn Glu Asn Tyr Pro Asn Vai Lys Lys Ala Leu Ile Asn Ile 115 120 125 259
Leu Leu Vai Thr Thr Gly Tyr Ile Ile Cys Phe Val Pro Tyr His Ile 130 135 140 Vai Arg Ile Pro Tyr Thr Leu Ser Gin Thr Glu Val Ile Thr Asp Cys 145 150 155 160 Ser Thr Arg Ile Ser Leu Phe Lys Ala Lys Glu Ala Thr Leu Leu Leu 165 170 175 Ala Vai Ser Asn Leu Cys Phe Asp Pro Ile Leu Tyr Tyr His Leu Ser 180 185 190 Lys Ala Phe Arg Ser Lys Val Thr Glu Thr Phe Ala Ser Pro Lys Glu 195 200 205 Thr Lys Vai Arg Lys Lys Asn Xaa 210 215 (2) INFORMAÇÃO PARA SEQ ID N°: 71: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 407 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 71:
Met His Pro Ala Val Phe Leu Ser Leu Pro Asp Leu Arg Cys Ser Leu 1 5 10 15 Leu Leu Leu Val Thr Trp Val Phe Thr Pro Val Thr Thr Glu Ile Thr 20 25 30 Ser Leu Asp Thr Glu Asn Ile Asp Glu Ile Leu Asn Asn Ala ASp Val 35 40 45 Ala Leu Val Asn Phe Tyr Ala Asp Trp Cys Arg Phe Ser Gin Met Leu 50 55 60 His Pro Ile Phe Glu Glu Ala Ser Asp Val Ile Lys Glu Glu Phe Pro 65 70 75 80 260
Asn Glu Asn Gin Vai Vai Phe Ala Arg Vai Asp Cys Asp Gin His Ser 85 90 95
Asp Ile Ala Gin Arg Tyr Arg lie Ser Lys Tyr Pro Thr Leu Lys Leu 100 105 110
Phe Arg Asn Gly Met Met Met Lys Arg Glu Tyr Arg Gly Gin Arg Ser 115 120 125
Vai Lys Ala Leu Ala Asp Tyr Ile Arg Gin Gin Lys Ser Asp Pro Ile 130 135 140
Gin Glu Ile Arg Asp Leu Ala Glu Ile Thr Thr Leu Asp Arg Ser Lys 145 150 155 160
Arg Asn Ile Ile Gly Tyr Phe Glu Gin Lys Asp Ser Asp Asn Tyr Arg 165 170 175
Vai Phe Glu Arg Vai Ala Asn ile Leu His Asp Asp Cys Ala Phe Leu 180 185 190
Ser Ala Phe Gly Asp Vai Ser Lys Pro Glu Arg Tyr Ser Gly Asp Asn 195 200 205
Ile Ile Tyr Lys Pro Pro Gly His Ser Ala Pro Asp Met Vai Tyr Leu 210 215 220
Gly Ala Met Thr Asn Phe Asp Vai Thr Tyr Asn Trp lie Gin Asp Lys 225 230 235 240
Cys Vai Pro Leu Vai Arg Glu Ile Thr Phe Glu Asn Gly Glu Glu Leu 245 250 255
Thr Glu Glu Gly Leu Pro Phe Leu Ile Leu Phe His Met Lys Glu Asp 260 265 270
Thr Glu Ser Leu Glu Ile Phe Gin Asn Glu Vai Ala Arg Gin Leu Ile 275 280 285
Ser Glu Lys Gly Thr Ile Asn Phe Leu His Ala Asp Cys Asp Lys Phe 290 295 300
Arg His Pro Leu Leu His Ile Gin Lys Thr Pro Ala Asp Cys Pro Vai 305 310 315 320
Ile Ala ile Asp Ser Phe Arg His Met Tyr Vai Phe Gly Asp Phe Lys 325 330 335
Asp Vai Leu Ile Pro Gly Lys Leu Lys Gin Phe Vai Phe Asp Leu His 340 345 350
Ser Gly Lys Leu His Arg Glu Phe His His Gly Pro Asp Pro Thr Asp 355 360 365
Thr Ala Pro Gly Glu Gin Ala Gin Asp Vai Ala Ser Ser Pro Pro Glu 370 375 380
Ser Ser Phe Gin Lys Leu Ala Pro Ser Glu Tyr Arg Tyr Thr Leu Leu 385 390 395 400 261
Arg Asp Arg Asp Glu Leu Xaa 405 (2) INFORMAÇÃO PARA SEQ ID N°: 72: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 9 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 72:
Tyr Leu Ile Ser Tyr Leu Cys Phe Xaa 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 73: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 34 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 73:
Met Pro Leu Lys Ala Vai Thr Trp Pro Thr Leu Asn Ser Lys Leu Vai 15 10 15
Ala Ala Vai Vai Asn Leu Lys Ala Ser Gin Met Pro Ala Ser Ser Arg 20 25 30
Vai Xaa 262 (2) INFORMAÇÃO PARA SEQ ID N°: 74: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 57 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 74:
Gin Ser Pro Arg Ser Ser Ala Leu Gly Ala Gly Gin Lys Leu Ala Vai 15 10 15
Cys Ser Pro Asp Ile Leu Cys Cys Pro Thr Asp Thr Leu Leu Ala Ser 20 25 30
His Pro His Ser Leu Leu Thr Gly Thr Gin Phe Ser Gly Gin Thr Gin 35 40 45
Ala Leu Ala Pro Ser Trp Cys Ala Xaa 50 55 (2) INFORMAÇÃO PARA SEQ ID N°: 75: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 75:
Met Ala Gly Ile His Arg Ala Phe Leu Vai Phe Cys Leu Trp Gly Leu 15 10 15
Xaa Leu Cys Vai Vai Gly Gly Pro Trp Xaa 20 25 263 (2) INFORMAÇÃO PARA SEQ ID N°: 76: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 76:
Met Ser Phe Ser Ser Pro Lys Ser Leu Leu Ser Leu Ile Ser Xaa 15 10 15 (2) INFORMAÇÃO PARA SEQ ID N°: 77: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 77:
Met Thr Ile Trp Gin Leu Phe Ala Vai Leu Ile vai Leu Phe Ala Lys 15 10 15 ser Arg Glu lie Ser Thr Glu Gly Glu Pro Cys Vai Leu Ser Lys Asn 20 25 30
Xaa (2) INFORMAÇÃO PARA SEQ ID N°: 78: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 264 (A) COMPRIMENTO: 23 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 78:
Met Leu Asn Pro Phe Xaa Gin Leu Leu Leu Vai Leu Leu Phe Pro Glu 15 10 15
Trp Pro Thr Pro Leu His Xaa 20 (2) INFORMAÇÃO PARA SEQ ID N°: 79: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 173 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 79:
Met Lys Thr Leu Phe Leu Gly Vai Thr Leu Gly Leu Ala Ala Ala Leu 1 5 10 15 Ser Xaa Thr Leu Xaa Glu Glu Asp Ile Thr Gly Thr Trp Tyr Vai Lys 20 25 30 Ala Met Vai Vai Asp Lys Thr Phe Arg Arg Gin Glu Ala Gin Lys Vai 35 40 45 Ser Pro Vai Lys Vai Thr Ala Leu Gly Gly Gly Lys Leu Glu Ala Thr 50 55 60 Phe Thr Phe Met Arg Glu Asp Arg Cys Ile Gin Lys Lys Ile Leu Xaa 65 70 75 80 Arg Lys Thr Glu Glu Pro Gly Lys Tyr Ser Ala Cys Glu Pro Leu Pro 85 90 95 265 Hís Ser His Pro His Xaa Pro Pro Pro Pro Thr Pro Vai His Gin Pro 100 105 110
Pro Gin Vai Glu Ser Ala Gin Ala Ala Leu Leu Pro Gly Pro Gin Leu 115 120 125
Cys Pro Pro Pro Arg Arg Gly Trp Pro Leu Leu Pro Gly Gly Leu Vai 130 135 140
Ala Leu Thr Ser Asp Thr Gly Cys Asp Arg Leu Vai Arg Ser Arg Asp 145 150 155 160
Gly Pro Asp His Ala Cys Pro Leu Gly Gly Pro Ser His 165 170 (2) INFORMAÇÃO PARA SEQ ID N°: 80: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 208 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 80:
Met Ala Asp Ser Ser Tyr Thr Ser Glu Vai Gin Ala : Ile Leu Ala Phe 1 5 10 15 Leu ser Leu Gin Arg Thr Gly Ser Gly Gly Pro Gly i Asn 1 His Pro His 20 25 30 Gly Pro Asp Ala Ser Ala Glu Gly Leu Asn Pro Tyr Gly Leu Vai Ala 35 40 45 Pro Arg Phe Gin Arg Lys Phe Lys Ala Lys Gin Leu Thr Pro Arg Ile 50 55 60 Leu Glu Ala His Gin Asn Vai Ala Gin Leu Ser Leu Ala Glu Ala Gin 65 70 75 80 Leu Arg Phe lie Gin Ala Trp Gin Ser Leu Pro Asp Phe Gly Zle Ser 85 90 95 Tyr Vai Met Vai Arg Phe Lys Gly Ser Arg Lys Asp Glu Ile Leu Gly 100 105 110 266
Ile Ala Asn Asn Arg Leu Ile Arg Ile Asp Leu Ala Vai Gly Asp Vai 115 120 125
Vai Lys Thr Trp Arg Phe Ser Asn Met Arg Gin Trp Asn Vai Asn Trp 130 135 140
Asp Ile Arg Xaa Vai Ala Ile Glu Phe Asp Glu His Ile Asn Vai Ala 145 150 155 160
Phe Ser Cys Vai Ser Ala 165
Ser Cys Arg
Ile Vai His Glu Tyr Ile Gly 170 175
Gly Tyr Ile Phe Leu Ser Thr Arg Glu Xaa Ala Arg Gly Glu Glu Leu 180 185 190
Asp Glu Asp Leu Phe Leu Gin Leu Thr Gly Gly His Glu Ala Phe Xaa 195 200 205 (2) INFORMAÇÃO PARA SEQ ID N°: 81: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 43 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: BI:
Met ile Phe Leu Leu Phe Leu Thr Pro Leu Trp Leu Gin Lys Gly Ser 15 10 15
Ala Gly Lys Met Ser Gly Glu Phe Leu Tyr Ala Ser Leu Phe Gin Trp 20 25 30
Asn Tyr Phe Trp Arg Asn Lys Lys Vai Cys Xaa 35 40 267 (2) INFORMAÇÃO PARA SEQ ID N°: 82: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 146 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 82:
Met Pro Ser Gly Phe Gin Thr Cys Leu Leu Phe Thr Leu Ser Pro Phe 15 10 15
Ser Leu Ser Lys Ile Vai Gly Vai Pro Ser Gin Gin Leu Pro Gly Gin 20 25 30
Leu Ser Glu Gin Gly Gly Leu Cys Gly His Glu Gly Glu Pro Ala Arg 35 40 45
Thr Vai Pro Glu Thr Gin Leu Pro Leu Pro Phe Asn Ser Ala Gly Pro 50 55 60
Pro His Leu Lys Cys Thr Gly Ala Gly Lys Arg Vai Trp Ser Pro Pro 65 70 75 80
Arg Arg Ala Ala Gin Glu Vai Ser Leu Gin Leu Vai Ser Cys Xaa Pro 85 90 95
Cys Arg Gin Xaa Thr Ser Arg Ala Phe Ser Leu Ala Thr Asp Arg Thr 100 105 110
Ala Ser Ala Arg Vai Cys Cys Arg Phe Pro Phe Lys His Thr His Ser 115 120 125
Pro His Pro Arg Arg Pro Glu Vai Gin Gly Ala Trp Ala Vai Vai Pro 130 135 140
Leu Xaa 145 268 (2) INFORMAÇÃO PARA SEQ ID N°: 83: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 25 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 83:
Met Pro Trp Arg Arg Ala Gly Leu Met Mec Leu Pro Ile Ile Thr Gly 15 10 15
Cys Cys Pro Cys Ser Ala Ser Ile Xaa 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 84: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 269 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 84:
Met Lys Thr Leu Phe Leu Gly Vai Thr Leu Gly Leu Ala Leu Pro Cys 15 10 15
Pro Ser Pro Trp Xaa Arg Arg Ile Ser Gin Gly Pro Gly Thr Xaa 20 25 30 (2) INFORMAÇÃO PARA SEQ ID N°: 85: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 374 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 85: 270
Met Ser vai Pro Ala Phe Ile Asp Ile Ser Glu Glu Asp Gin Ala Ala 15 10 15
Glu Leu Arg Ala Tyr Leu Lys ser Lys Gly Ala Glu lie Ser Glu Glu 20 25 30
Asn Ser Glu Gly Gly Leu His Vai Asp Leu Ala Gin Ile Ile Glu Ala 35 40 45
Cys Asp Vai cys Leu Lys Glu Asp Asp Lys Asp vai Glu Ser vai Met 50 55 60
Asn ser vai vai Ser Leu Leu Leu lie Leu Glu Pro Asp Lys Gin Glu 65 70 75 80
Ala Leu ile Glu Ser Leu cys Glu Lys Leu vai Lys Phe Arg Glu Gly 85 90 95
Glu Arg Pro Ser Leu Arg Leu Gin Leu Leu Ser Asn Leu Phe His Gly 100 105 110
Met Asp Lys Asn Thr Pro Vai Arg Tyr Thr Vai Tyr Cys Ser Leu Ile 115 120 125
Lys Vai Ala Ala Ser Cys Gly Ala Ile Gin Tyr Ile Pro Thr Glu Leu 130 135 140
Asp Gin Vai Arg Lys Trp Ile Ser Asp Trp Asn Leu Thr Thr Glu Lys 145 150 155 160
Lys His Thr Leu Leu Arg Leu Leu Tyr Glu Ala Leu Vai Asp Cys Lys 165 170 175
Lys Ser Asp Ala Ala Ser Lys Vai Met Vai Glu Leu Leu Gly Ser Tyr 180 185 190
Thr Glu Asp Asn Ala Ser Gin Ala Arg Vai Asp Ala His Arg Cys ile 195 200 205
Vai Arg Ala Leu Lys Asp Pro Asn Ala Phe Leu Phe Asp His Leu Leu 210 215 220
Thr Leu Lys Pro Vai Lys Phe Leu Glu Gly Glu Leu Ile His Asp Leu 225 230 235 240
Leu Thr Ile Phe Vai Ser Ala Lys Leu Ala Ser Tyr Vai Lys Phe Tyr 245 250 255
Gin Asn Asn Lys Asp Phe Ile Asp Ser Leu Gly Leu Leu His Glu Gin 260 265 270
Asn Met Ala Lys Met Arg Leu Leu Thr Phe Met Gly Met Ala Vai Glu 275 280 285 271
Asn Lys Glu Ile Ser Phe Asp Thr Met Gin Gin Glu Leu Gin Ile Gly 290 295 300
Ala Asp Asp Vai Glu Ala Phe Vai Ile Asp Ala Vai Arg Thr Lys Met 305 310 315 320
Vai Tyr Cys Lys Ile Asp Gin Thr Gin Arg Lys Vai Vai Vai Ser His 325 330 335
Ser Thr His Arg Thr Phe Gly Lys Gin Gin Trp Gin Gin Leu Tyr Asp 340 345 350
Thr Leu Asn Ala Trp Lys Gin Asn Leu Asn Lys Vai Lys Asn Ser Leu 355 360 365
Leu Ser Leu ser Asp Thr 370 (2) INFORMAÇÃO PARA SEQ ID N°: 86: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 86:
Met Ser Vai Pro Ala Phe Ile Asp Ile Ser Glu Glu Asp 15 10 (2) INFORMAÇÃO PARA SEQ ID N°: 87: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 272 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 87:
Gin Ala Ala Glu Leu Arg Ala Tyr Leu Lys Ser Lys Gly Ala Glu 15 10 15 (2) INFORMAÇÃO PARA SEQ ID N°: 88: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (x) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 88: ile Ser Glu Glu Asn Ser Glu Gly Gly Leu His Vai Asp Leu Ala Gin 15 10 15
Ile (2) INFORMAÇÃO PARA SEQ ID N°: 89: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 89:
Ile Glu Ala Cys Asp Vai Cys Leu Lys Glu Asp Asp Lys Asp Vai Glu 15 10 15
Ser Vai 273 (2) INFORMAÇÃO PARA SEQ ID N°: 90: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 16 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 90:
Vai Ala Arg Pro Ser Ser Leu Phe Arg Ser Ala Trp Ser Cys Glu Trp 15 10 15 (2) INFORMAÇÃO PARA SEQ ID N°: 91: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 12 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 91:
Leu Arg Leu Gin Leu Leu Ser Asn Leu Phe His Gly 15 10 (2) INFORMAÇÃO PARA SEQ ID N°: 92: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: aminoácido 274 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 92:
Lys Asp Vai Glu Ser Vai Met Asn Ser Vai Vai Ser Leu Leu Leu Ile 15 10 15
Leu (2) INFORMAÇÃO PARA SEQ ID N°: 93: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 93:
Asp Ala Ala Ser Lys Vai Met Vai Glu Leu Leu Gly Ser Tyr Thr Glu 15 10 15
Asp Asn Ala Ser Gin Ala Arg Vai Asp Ala 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 94: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 10 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 275 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 94:
Vai Glu Ala Phe Vai Ile Asp Ala Vai Arg 15 10 (2) INFORMAÇÃO PARA SEQ ID N°: 95: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 95:
Met Ser Glu Ile Tyr Leu Arg Cys Gin Asp Glu Gin Gin Tyr Ala Arg 15 10 15
Trp Met Ala Gly Cys Arg Leu Ala Ser Lys Gly Arg Thr Met Ala Asp 20 25 30
Ser Ser Tyr 35 (2) INFORMAÇÃO PARA SEQ ID N°: 96: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 45 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 276 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 96:
Leu Vai Ala Pro Arg Phe Gin Arg Lys Phe Lys Ala Lys Gin Leu Thr 15 10 15
Pro Arg Ile Leu Glu Ala His Gin Asn Vai Ala Gin Leu Ser Leu Ala 20 25 30
Glu Ala Gin Leu Arg Phe Ile Gin Ala Trp Gin Ser Leu 35 40 45 (2) INFORMAÇÃO PARA SEQ ID N°: 97: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 97:
Vai Gly Asp Vai Vai Lys Thr Trp Arg Phe Ser Asn Met Arg Gin Trp 15 10 15
Asn Vai Asn Trp Asp Ile Arg 20 (2) INFORMAÇÃO PARA SEQ ID N°: 98: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 277 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 98:
Glu Glu Ile Asp Cys Thr Glu Glu Glu Met Met Vai Phe Ala Ala Leu 15 10 15
Gin Tyr His Ile Asn Lys Leu Ser Gin Ser 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 99: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 99:
Glu Glu Ile Asp Cys Thr Glu Glu Glu Met Met vai Phe Ala Ala Leu 15 10 15
Gin Tyr His Ile Asn Lys Leu Ser Gin Ser 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 100: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 26 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 278 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 100:
Lys Glu Leu Ser Phe Ala Arg Ile Lys Ala Vai Glu Cys Vai Glu Ser 15 10 15
Thr Gly Arg His Ile Tyr Phe Thr Leu Vai 20 25 (2) INFORMAÇÃO PARA SEQ ID N°: 101: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 101:
Gly Trp Asn Ala Gin Ile Thr Leu Gly Leu Vai Lys Phe Lys Asn Gin 15 10 15
Gin (2) INFORMAÇÃO PARA SEQ ID N°: 102: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 16 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 279 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 102:
Leu Vai Leu Gly Leu Ser Xaa Leu Asn Asn Ser Tyr Asn Phe Ser Phe 15 10 15 (2) INFORMAÇÃO PARA SEQ ID N°: 103: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 103:
His Vai Vai Ile Gly Ser Gin Ala Glu Glu Gly Gin Tyr Ser Leu Asn 15 10 15
Phe (2) INFORMAÇÃO PARA SEQ ID N°: 104: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 104:
His Asn Cys Asn Asn Ser Vai Pro Gly Lys Glu His Pro Phe Asp Ile 15 10 15
Thr Vai Met 280 (2) INFORMAÇÃO PARA SEQ ID N°: 105: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 105:
Phe Ile Lys Tyr Vai Leu Ser Asp Lys Glu Lys Lys Vai Phe Gly Ile 15 10 IS
Vai (2) INFORMAÇÃO PARA SEQ ID N°: 106: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 106:
Ile Pro Met Gin Vai Leu Ala Asn Vai Ala Tyr Ile Ile 15 10 (2) INFORMAÇÃO PARA SEQ ID N°: 107: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 281 (A) COMPRIMENTO: 13 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 107
Ile Pro Met Gin Vai Leu Ala Asn Vai Ala Tyr Ile Ile 1 5 10 (2) INFORMAÇÃO PARA SEQ ID N°: 108: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 15 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 108
Asp Gly Lys Vai Ala Vai Asn Leu Ala Lys Leu Lys Leu Phe Arg 15 10 15 (2) INFORMAÇÃO PARA SEQ ID N°: 109: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 13 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 282 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 109:
Ile Arg Glu Lys Asn Pro Asp Gly Phe Leu Ser Ala Ala 15 10 (2) INFORMAÇÃO PARA SEQ ID N°: 110: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 9 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 110:
Met Met Phe Gly Gly Tyr Glu Thr Ile 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 111: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 111:
Tyr Arg Asp Glu Ser Ser Ser Glu Leu Ser Vai Asp Ser Glu Vai Glu 15 10 15
Phe Gin Leu Tyr Ser Gin Ile His 20 283 (2) INFORMAÇÃO PARA SEQ ID N°: 112: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 136 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 112:
Tyr Ala Gin Asp Leu Asp Asp Vai Ile Arg Glu Glu Glu His Glu Glu 1 5 10 15 Lys Asn Ser Gly Asn Ser Glu Ser Ser Ser Ser Lys Pro Asn Gin Lys 20 25 30 Lys Leu Ile Vai Leu Ser Asp Ser Glu Vai Ile Gin Leu Ser Asp Gly 35 40 45 Ser Glu Vai Ile Thr Leu Ser Asp Glu Asp Ser Ile Tyr Arg Cys Lys 50 55 60 Gly Lys Asn Vai Arg Vai Gin Ala Gin Glu Asn Ala His Gly Leu Ser 65 70 75 80 Ser Ser Leu Gin Ser Asn Glu Leu Vai Asp Lys Lys Cys Lys Ser Asp 85 90 95 Ile Glu Lys Pro Lys Ser Glu Glu Arg Ser Gly Vai Ile Arg Glu Vai 100 105 110 Met Ile Ile Glu Vai Ser Ser Ser Glu Glu Glu Glu Ser Thr Ile Ser 115 120 125 Glu Gly Asp Asn Vai Glu Ser Trp 130 135 (2) INFORMAÇÃO PARA SEQ ID N°: 113: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 37 aminoácidos (B) TIPO: aminoácido 284 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 113:
Met Leu Leu Gly Cys Glu Vai Asp Asp Lys Asp Asp Asp Ile Leu Leu 15 10 15
Asn Leu Vai Gly Cys Glu Asn Ser Vai Thr Glu Gly Glu Asp Gly Ile 20 25 30
Asn Trp Ser Ile Ser 35 (2) INFORMAÇÃO PARA SEQ ID N°: 114: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 18 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 114:
Asp Lys Asp Ile Glu Ala Gin Ile Ala Asn Asn Arg Thr Pro Gly Arg 15 10 15
Trp Thr (2) INFORMAÇÃO PARA SEQ ID N°: 115: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 31 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear 285 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 115:
Gin Ar? Tyr Tyr Ser Ala Asn Lys Asn Ile Ile cys Arg Asn Cys Asp 15 10 15
Lys Arg Gly His Leu Ser Lys Asn Cys Pro Leu Pro Arg Lys Vai 20 25 30 (2) INFORMAÇÃO PARA SEQ ID N°: 116: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 179 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 116:
Arg Arg Cys Phe Leu Cys Ser Arg Arg Gly His Leu Leu Tyr Ser Cys 1 5 10 15 Pro Ala Pro Leu Cys Glu Tyr Cys Pro Vai Pro Lys Met Leu Asp His 20 25 30 Ser Cys Leu Phe Arg His Ser Trp Asp Lys Gin Cys Asp Arg Cys His 35 40 45 Met Leu Gly His Tyr Thr Asp Ala Cys Thr Glu Ile Trp Arg Gin Tyr 50 55 60 His Leu Thr Thr Lys Pro Gly Pro Pro Lys Lys Pro Lys Thr Pro Ser 65 70 75 80 Arg Pro Ser Ala Leu Ala Tyr Cys Tyr His Cys Ala Gin Lys Gly His 85 90 95 286
Tyr Gly His Glu Cys Pro Glu Arg Glu Vai Tyr Asp Pro Ser Pro Vai 100 105 HO
Ser Pro Phe Ile cys Tyr Tyr Xaa Asp Lys Tyr Glu Ile Gin Glu Arg 115 120 125
Glu Lys Arg Leu Lys Gin Lys Ile Lys Vai Xaa Lys Lys Asn Gly Vai 130 135 140
Ile Pro Glu Pro Ser Lys Leu Pro Tyr Ile Lys Ala Ala Asn Glu Asn 145 150 155 160
Pro His His Asp Ile Arg Lys Gly Arg Ala Ser Trp Lys Ser Asn Arg 165 170 175
Trp Pro Gin (2) INFORMAÇÃO PARA SEQ ID N°: 117: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 117:
Leu Ser Ile Ile Phe Leu Ala Phe Vai Ser Ile Asp Arg Cys Leu Gin 15 10 15
Leu (2) INFORMAÇÃO PARA SEQ ID N°: 118: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 67 aminoácidos (B) TIPO: aminoácido 287 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 118:
Gly Ser Cys Phe Ala Thr Trp Ala Phe Ile Gin Lys Asn Thr Asn His 15 10 15
Arg Cys Vai Ser Ile Tyr Leu Ile Asn Leu Leu Thr Ala Asp Phe Leu 20 25 30
Leu Thr Leu Ala Leu Pro Vai Lys Ile Vai Vai Asp Leu Gly Vai Ala 35 40 45
Pro Trp Lys Leu Lys Ile Phe His Cys Gin Vai Thr Ala Cys Leu Ile 50 55 €0
Tyr Ile Asn 65 (2) INFORMAÇÃO PARA SEQ ID N°: 119: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 60 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 119:
Ala Pro Leu Glu Thr Met Gin Asn Lys Pro Arg Ala Pro Gin Lys Arg 1 5 10 15 Ala Leu Pro Phe Pro Glu Leu Glu Leu Arg Asp Tyr Ala Ser Vai Leu 20 25 30 Thr Arg Tyr Ser Leu Gly Leu Arg Asn Lys Glu Pro Ser Leu Gly His 35 40 45 Arg Trp Gly Thr Gin Lys Leu Gly Arg Ser Pro Cys 50 55 60 288 (2) INFORMAÇÃO PARA SEQ ID N°: 120: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 166 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 120:
Asn Arg Glu Arg Gly Gly Ala Gly Ala Thr Phe Glu Cys Asn Ile Cys 15 10 15
Leu Glu Thr Ala Arg Glu Ala Vai Vai Ser Vai Cys Gly His Leu Tyr 20 25 30
Cys Trp Pro Cys Leu His Gin Trp Leu Glu Thr Arg Pro Glu Arg Gin 35 40 45
Glu Cys Pro Vai cys Lys Ala Gly Ile Ser Arg Glu Lys Vai Vai Pro 50 55 50
Leu Tyr Gly Arg Gly Ser Gin Lys Pro Gin Asp Pro Arg Leu Lys Thr 65 70 75 80
Pro Pro Arg Pro Gin Gly Gin Arg Pro Ala Pro Glu Ser Arg Gly Gly 85 90 95
Phe Gin Pro Phe Gly Asp Thr Gly Gly Phe His Phe Ser Phe Gly Vai 100 105 110
Gly Ala Phe Pro Phe Gly Phe Phe Thr Thr Vai Phe Asn Ala His Glu 115 120 125
Pro Phe Arg Arg Gly Thr Gly Vai Asp Leu Gly Gin Gly His Pro Ala 130 135 140
Ser Ser Trp Gin Asp Ser Leu Phe Leu Phe Leu Ala Ile Phe Phe Phe 145 150 155 160
Phe Trp Leu Leu Ser lie 165
Lisboa, 21 de Dezembro de 2010 289

Claims (18)

  1. REIVINDICAÇÕES 1. Polinucleótido seleccionado do grupo consistindo de: (a) um polinucleótido tendo a sequência nucleotidica integral da SEQ ID N°: 23; (b) um polinucleótido tendo a sequência nucleotidica integral daquela sequência de ADNc incluída no Depósito ATCC N° 209075, que é hibridável sob condições restringentes a SEQ ID N°: 23; (c) um fragmento polinucleotídico que compreende 150 nucleótidos contíguos da SEQ ID N°: 23; (d) um fragmento polinucleotídico que compreende 150 nucleótidos da sequência de ADNc incluída no Depósito ATCC N° 209075 que é hibridável sob condições restringentes a SEQ ID N°: 23; (e) um polinucleótido codificando um fragmento polipeptídico, em que o referido fragmento polipeptídico compreende 40 ou 50 resíduos de aminoácidos contíguos de comprimento da SEQ ID N°: 60; (f) um polinucleótido codificando um fragmento polipeptídico codificado pela sequência de ADNc incluída no Depósito ATCC N° 209075, que é hibridável sob condições restringentes a SEQ ID N°: 23, em que o referido fragmento polipeptídico compreende 40 ou 50 resíduos de aminoácidos contíguos da SEQ ID N°: 60; (g) um polinucleótido codificando um fragmento polipeptídico da SEQ ID N°: 60, ou um seu fragmento polipeptídico, codificado pela sequência de ADNc incluída no Depósito ATCC N° 209075, em que o referido fragmento 1 polipeptídico compreende 40 ou 50 resíduos de aminoácidos contíguos de comprimento e tem actividade biológica; (h) um polinucleótido codificando um polipéptido de comprimento completo da SEQ ID N°: 60 ou sendo codificado pela sequência de ADNc incluída no Depósito ATCC N° 209075, que é hibridável sob condições restringentes a SEQ ID N°: 23; (i) um polinucleótido que é, pelo menos, 95% idêntico a, pelo menos, 150 nucleótidos contíguos de um polinucleótido como definido em qualquer uma de (a) a (h) ; e (j) um polinucleótido codificando um polipéptido tendo uma sequência de aminoácidos, pelo menos, 95% idêntica à sequência de aminoácidos de um polipéptido codificado por um polinucleótido de qualquer uma de (a) a (i); ou a cadeia complementar de polinucleótido (a) a (j).
  2. 2. Polinucleótido da reivindicação 1 que é ADN ou ARN.
  3. 3. Gene correspondendo à sequência de ADNc da SEQ ID N°: 23 ou codificando o polipéptido tendo a sequência de aminoácidos da SEQ ID N°: 60 .
  4. 4. Vector compreendendo o polinucleótido da reivindicação 1 ou 2.
  5. 5. Método de preparação de uma célula hospedeira recombinante, compreendendo a introdução do polinucleótido da reivindicação 1 ou 2, ou do vector da reivindicação 4. 2
  6. 6. Célula hospedeira recombinante, contendo o polinucleótido da reivindicação 1 ou 2, ou o vector da reivindicação 4 ou produzida pelo método da reivindicação 5.
  7. 7. Célula hospedeira recombinante da reivindicação 6 que expressa um polipéptido codificado pelo polinucleótido da reivindicação 1 ou 2.
  8. 8. Método de preparação de um polipéptido codificado pelo polinucleótido da reivindicação 1 ou 2, compreendendo; (a) cultivar a célula hospedeira recombinante da reivindicação 7 sob condições, o referido polipéptido seja expresso; e (b) recuperar o referido polipéptido.
  9. 9. Polipéptido codificado pelo polinucleótido da reivindicação 1 ou 2 ou obtenível pelo método da reivindicação 8.
  10. 10. Anticorpo que se liga especificamente ao polipéptido da reivindicação 9.
  11. 11. Antagonista compreendendo um polinucleótido anti-sentido em relação ao polinucleótido da reivindicação 1 ou 2, capaz de se ligar ao referido polinucleótido e bloquear a tradução no polipéptido codificado.
  12. 12. Método para identificação de antagonistas ou agonistas do polipéptido da reivindicação 9, compreendendo: (a) produzir células que expressam o polipéptido da reivindicação 9; 3 (b) colocar em contacto o polipéptido produzido na etapa (a) com uma amostra de teste potencialmente contendo um antagonista ou agonista; e (c) identificar um antagonista ou agonista, através da observação da ligação e inibição ou estimulação de actividade do referido polipéptido.
  13. 13. Método de diagnóstico in vitro de um estado patológico, ou uma susceptibilidade a um estado patológico, num indivíduo, compreendendo: (a) determinar a presença ou ausência de uma mutação no polinucleótido da reivindicação 1 ou 2, ou no gene da reivindicação 3; e (b) diagnosticar um estado patológico, ou uma susceptibilidade a um estado patológico, com base na presença ou ausência da referida mutação.
  14. 14. Método de diagnóstico in vitro de um estado patológico, ou uma susceptibilidade a um estado patológico, num indivíduo, compreendendo: (a) determinar a presença ou quantidade de expressão do polipéptido da reivindicação 9 numa amostra biológica; e (b) diagnosticar um estado patológico, ou uma susceptibilidade a um estado patológico, com base na presença ou quantidade de expressão do polipétido.
  15. 15. Método para identificação de um parceiro de ligação ao polipéptido da reivindicação 9, compreendendo: 4 (a) colocar em contacto o polipéptido da reivindicação 9 com um parceiro de ligação; e (b) determinar se o parceiro de ligação influencia uma actividade do polipéptido.
  16. 16. Composição farmacêutica compreendendo o polinucleótido da reivindicação 1 ou 2, o polipéptido da reivindicação 9, um ADN codificando e capaz de expressar o referido polipéptido ín vivo, o anticorpo da reivindicação 10 ou o antagonista da reivindicação 11 e, opcionalmente, um veiculo farmaceuticamente aceitável.
  17. 17. Composição de diagnóstico compreendendo o polinucleótido da reivindicação 1 ou 2, ou o anticorpo da reivindicação 10.
  18. 18. Método para a produção de uma composição farmacêutica, compreendendo as etapas do método da reivindicação 12 e (d) formular o composto identificado na etapa (c) numa forma farmaceuticamente aceitável. Lisboa, 21 de Dezembro de 2010 5
PT98926105T 1997-05-30 1998-05-28 32 proteínas humanas segregadas PT1015477E (pt)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US4403997P 1997-05-30 1997-05-30
US4809397P 1997-05-30 1997-05-30
US4810197P 1997-05-30 1997-05-30
US5093597P 1997-05-30 1997-05-30
US4819097P 1997-05-30 1997-05-30
US4835697P 1997-05-30 1997-05-30
US5625097P 1997-08-29 1997-08-29
US5629397P 1997-08-29 1997-08-29
US5629697P 1997-08-29 1997-08-29

Publications (1)

Publication Number Publication Date
PT1015477E true PT1015477E (pt) 2010-12-28

Family

ID=27578175

Family Applications (1)

Application Number Title Priority Date Filing Date
PT98926105T PT1015477E (pt) 1997-05-30 1998-05-28 32 proteínas humanas segregadas

Country Status (11)

Country Link
US (4) US6531447B1 (pt)
EP (2) EP2332975A1 (pt)
JP (1) JP2002512521A (pt)
AT (1) ATE487737T1 (pt)
AU (1) AU7801998A (pt)
CA (1) CA2291221A1 (pt)
CY (1) CY1111950T1 (pt)
DE (1) DE69841994D1 (pt)
DK (1) DK1015477T3 (pt)
PT (1) PT1015477E (pt)
WO (1) WO1998054206A1 (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7129061B1 (en) * 1996-08-07 2006-10-31 Biogen Idec Ma Inc. Tumor necrosis factor related ligand
EP0837128A3 (en) * 1996-10-21 1999-04-28 Smithkline Beecham Corporation Human G-protein coupled receptor, HLYAZ61
AU6854098A (en) * 1997-04-18 1998-11-13 Chugai Research Institute For Molecular Medicine, Inc. Transcriptional regulator
ATE487737T1 (de) 1997-05-30 2010-11-15 Human Genome Sciences Inc 32 humane sekretierte proteine
US7001992B2 (en) 1997-05-30 2006-02-21 Human Genome Sciences, Inc. Antibodies to secreted protein HEMCM42
WO2000011942A1 (en) * 1998-09-01 2000-03-09 Gene Logic, Inc. IDENTIFICATION OF A cDNA ASSOCIATED WITH ISCHEMIA IN HUMAN HEART TISSUE
CA2361293A1 (en) * 1999-02-10 2000-08-17 Human Genome Sciences, Inc. 33 human secreted proteins
US6372490B1 (en) 1999-02-23 2002-04-16 Curagen Corporation Nucleic acid encoding the MDM interacting protein
FR2797447B1 (fr) * 1999-08-12 2004-04-02 Univ Clermont Auvergne "odorant-binding" proteines humaines fixant des ligands hydrophobes:polypeptides et polynucleotides codant lesdits polypeptides et leurs applications
AU1438201A (en) * 1999-10-29 2001-05-14 Human Genome Sciences, Inc. 25 human secreted proteins
CA2387136A1 (en) * 1999-10-29 2001-05-10 Human Genome Sciences, Inc. 26 human secreted proteins
AU782067B2 (en) 1999-12-20 2005-06-30 Immunex Corporation TWEAK receptor
US6727225B2 (en) 1999-12-20 2004-04-27 Immunex Corporation TWEAK receptor
EP1174502A1 (en) * 2000-07-18 2002-01-23 Schering Corporation Type 2 dendritic cell precursor derived coding nucleic acids and related compositions and methods
EP1501369B1 (en) 2002-04-26 2015-06-24 Genentech, Inc. Non-affinity purification of proteins
US7482430B2 (en) 2003-07-24 2009-01-27 Amgen Inc. Compositions and methods relating to multimeric and oligomeric soluble fragments of the TWEAK receptor
AU2006214179A1 (en) 2005-02-17 2006-08-24 Biogen Idec Ma Inc. Treating neurological disorders
EP1885388B1 (en) 2005-05-10 2013-09-11 Biogen Idec MA Inc. Treating and evaluating inflammatory disorders
EP1876448A1 (en) * 2005-09-30 2008-01-09 DIGILAB BioVisioN GmbH Method and analytical reagents for identifying therapeutics using biomarkers responsive to thiazolidinediones.
EP2562182B1 (en) * 2007-07-27 2015-10-07 Immatics Biotechnologies GmbH Novel immunogenic epitopes for immunotherapy
ES2411907T3 (es) 2007-08-03 2013-07-09 Facet Biotech Corporation Uso terapéutico de anticuerpos antirreceptor TWEAK
GB0809592D0 (en) * 2008-05-27 2008-07-02 Imp Innovations Ltd Biomaterials

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US912292A (en) * 1907-05-03 1909-02-16 Morris E Curtis Machine for making tubes.
US912293A (en) * 1908-02-03 1909-02-16 Nat Regulator Company Temperature-regulating device.
US3773919A (en) 1969-10-23 1973-11-20 Du Pont Polylactide-drug mixtures
US4263428A (en) 1978-03-24 1981-04-21 The Regents Of The University Of California Bis-anthracycline nucleic acid function inhibitors and improved method for administering the same
DE3169595D1 (en) 1980-11-10 1985-05-02 Gersonde Klaus Method of preparing lipid vesicles by ultrasonic treatment, the use of this method and apparatus for its application
IE52535B1 (en) 1981-02-16 1987-12-09 Ici Plc Continuous release pharmaceutical compositions
US4485045A (en) 1981-07-06 1984-11-27 Research Corporation Synthetic phosphatidyl cholines useful in forming liposomes
JPS58118008A (ja) 1982-01-06 1983-07-13 Nec Corp デ−タ処理装置
EP0088046B1 (de) 1982-02-17 1987-12-09 Ciba-Geigy Ag Lipide in wässriger Phase
EP0102324A3 (de) 1982-07-29 1984-11-07 Ciba-Geigy Ag Lipide und Tenside in wässriger Phase
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4544545A (en) 1983-06-20 1985-10-01 Trustees University Of Massachusetts Liposomes containing modified cholesterol for organ targeting
HUT35524A (en) 1983-08-02 1985-07-29 Hoechst Ag Process for preparing pharmaceutical compositions containing regulatory /regulative/ peptides providing for the retarded release of the active substance
EP0350973B1 (de) 1983-09-26 1997-11-05 Udo Dr. Ehrenfeld Mittel und Erzeugnis für die Diagnose und Therapie von Tumoren sowie zur Behandlung von Schwächen der zelligen und humoralen Immunabwehr
DE3474511D1 (en) 1983-11-01 1988-11-17 Terumo Corp Pharmaceutical composition containing urokinase
JPS6147500A (ja) 1984-08-15 1986-03-07 Res Dev Corp Of Japan キメラモノクロ−ナル抗体及びその製造法
EP0173494A3 (en) 1984-08-27 1987-11-25 The Board Of Trustees Of The Leland Stanford Junior University Chimeric receptors by dna splicing and expression
GB8422238D0 (en) 1984-09-03 1984-10-10 Neuberger M S Chimeric proteins
US4631211A (en) 1985-03-25 1986-12-23 Scripps Clinic & Research Foundation Means for sequential solid phase organic synthesis and methods using the same
EP0232262A4 (en) 1985-08-15 1989-09-19 Stauffer Chemical Co MICROORGANISM PRODUCING TRYPTOPHANE.
EP0247091B1 (en) 1985-11-01 1993-09-29 Xoma Corporation Modular assembly of antibody genes, antibodies prepared thereby and use
US5128256A (en) 1987-01-12 1992-07-07 Stratagene DNA cloning vectors with in vivo excisable plasmids
EP0394827A1 (en) 1989-04-26 1990-10-31 F. Hoffmann-La Roche Ag Chimaeric CD4-immunoglobulin polypeptides
DK0835939T3 (da) 1990-06-28 2006-03-13 Sanofi Aventis Deutschland Fusionsproteiner med andele af immunglobulin, deres fremstilling og anvendelse
IL111125A0 (en) * 1994-05-11 1994-12-29 Yeda Res & Dev Soluble oligomeric tnf/ngf super family ligand receptors and their use
CA2220123A1 (en) 1995-05-05 1996-11-07 Human Genome Sciences, Inc. Human chemokine beta-8, chemokine beta-1 and macrophage inflammatory protein-4
FR2741075B1 (fr) * 1995-11-15 1998-01-30 Rech De Pathologie Appliquee S Conjugues peptidiques, leur utilisation a titre de medicament et compositions les contenant
EP0977887A2 (en) 1997-02-12 2000-02-09 Abbott Laboratories Member of the tnf family useful for treatment and diagnosis of disease
ATE487737T1 (de) 1997-05-30 2010-11-15 Human Genome Sciences Inc 32 humane sekretierte proteine
AU7549498A (en) * 1997-06-03 1998-12-21 Protegene Inc. Human proteins having transmembrane domains and dnas encoding these prot eins
US6051385A (en) * 1997-10-22 2000-04-18 The Regents Of The University Of Michigan Compositions and methods for identifying and testing therapeutics against HSV infection
AU4409099A (en) 1998-05-29 1999-12-13 Incyte Pharmaceuticals, Inc. Human transmembrane proteins
AU782067B2 (en) * 1999-12-20 2005-06-30 Immunex Corporation TWEAK receptor

Also Published As

Publication number Publication date
AU7801998A (en) 1998-12-30
EP1015477A4 (en) 2004-05-26
US20060147982A1 (en) 2006-07-06
CA2291221A1 (en) 1998-12-03
US6531447B1 (en) 2003-03-11
DE69841994D1 (de) 2010-12-23
EP1015477B1 (en) 2010-11-10
EP2332975A1 (en) 2011-06-15
US20030195346A1 (en) 2003-10-16
CY1111950T1 (el) 2015-11-04
WO1998054206A1 (en) 1998-12-03
US20070248593A1 (en) 2007-10-25
EP1015477A1 (en) 2000-07-05
ATE487737T1 (de) 2010-11-15
JP2002512521A (ja) 2002-04-23
DK1015477T3 (da) 2011-02-07

Similar Documents

Publication Publication Date Title
US6531447B1 (en) Secreted protein HEMCM42
US7906634B2 (en) HEMCM42 nucleic acids
CA2283678A1 (en) 28 human secreted proteins
JP2009131263A (ja) 50個のヒト分泌タンパク質
US20030045459A1 (en) 67 Human secreted proteins
CA2323776C (en) Cytokine receptor common gamma chain like
WO1998045712A2 (en) 20 human secreted proteins
US20040002066A1 (en) 36 human secreted proteins
US20030069405A1 (en) 70 human secreted proteins
US6878687B1 (en) Protein HMAAD57
US6433139B1 (en) Secreted protein HPEAD48
US6806351B2 (en) Secreted protein HBJFE12
US20040197345A1 (en) Prostate derived Ets factor
US6410709B1 (en) Cornichon-like protein
US20030144492A1 (en) 101 human secreted proteins
US20030176681A1 (en) 148 human secreted proteins
US20020026037A1 (en) Vascular endothelial growth factor 3 antibodies
CA2319097A1 (en) Dendritic enriched secreted lymphocyte activation molecule
US20040063128A1 (en) 20 Human secreted proteins
US20030166906A1 (en) 50 human secreted proteins
EP1394252A2 (en) 70 human secreted proteins
EP1445316A1 (en) Novel secreted protein