PT1071710E - Sequência genómica da proteína activadora da 5- lipoxigenase ( flap), seus marcadores polimórficos e métodos para a detecção de asma - Google Patents

Sequência genómica da proteína activadora da 5- lipoxigenase ( flap), seus marcadores polimórficos e métodos para a detecção de asma Download PDF

Info

Publication number
PT1071710E
PT1071710E PT99913538T PT99913538T PT1071710E PT 1071710 E PT1071710 E PT 1071710E PT 99913538 T PT99913538 T PT 99913538T PT 99913538 T PT99913538 T PT 99913538T PT 1071710 E PT1071710 E PT 1071710E
Authority
PT
Portugal
Prior art keywords
quot
flap
sequence
biallelic marker
biallelic
Prior art date
Application number
PT99913538T
Other languages
English (en)
Inventor
Marta Blumenfeld
Ilya Chumakov
Lydie Bougueleret
Original Assignee
Serono Genetics Inst Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27374096&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT1071710(E) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Serono Genetics Inst Sa filed Critical Serono Genetics Inst Sa
Publication of PT1071710E publication Critical patent/PT1071710E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Description

1
DESCRIÇÃO
“SEQUÊNCIA GENÓMICA DA PROTEÍNA ACTIVADORA DA 5-LIPOXIGENASE (FLAP), SEUS MARCADORES POLIMÓRFICOS E MÉTODOS PARA A DETECÇÃO DE ASMA"
ÁREA DA INVENÇÃO A invenção diz respeito a marcadores bialélicos de um gene FLAP e à associação estabelecida entre estes marcadores e doenças envolvendo a via dos leucotrienos, como asma. A invenção proporciona meios para determinar a predisposição de indivíduos a doenças envolvendo a via dos leucotrienos, tais como asma.
CONTEXTO DA INVENÇÃO A progressão de doenças inflamatórias nas quais a síntese de leucotrienos desempenha um papel activo, como asma e artrite, constitui um problema de saúde importante nas sociedades ocidentais.
Por exemplo, a predominância de asma em países ocidentais tem aumentado constantemente durante o último século, afectando cerca de 10% da população. Em 1994 afectou mais de 14 milhões de pessoas só nos Estados Unidos (incluindo 4,8 milhões (6,9%) com idades inferiores a 18 anos), ao passo que apenas 8 milhões de pessoas sofreram dessa doença em 1982. Reivindica mais de 5000 vidas por ano (incluindo 342 mortes entre pessoas com idades inferiores a 25 anos em 1993) . A asma afecta uma em sete crianças na Grã-Bretanha, e nos Estados Unidos é responsável por um terço das consultas de emergência pediátrica. É a doença crónica mais frequente na infância. A asma brônquica é uma síndroma multifactorial, ao invés de uma única doença, definida como obstrução das vias aéreas e caracterizada por alterações inflamatórias das 2 vias aéreas e hiper-sensibilidade brônquica. Os estímulos que causam os ataques de asma incluem alergénios (em indivíduos sensibilizados), exercício (em que um estímulo pode ser o ar frio), infecções respiratórias e poluentes atmosféricos, como dióxido de enxofre. 0 sujeito asmático tem ataques intermitentes de dispneia (dificuldade em respirar), respiração ruidosa e tosse, que podem causar risco de vida ou serem mesmo fatais. A manifestação da asma envolve provavelmente factores genéticos e ambientais; na maior parte dos sujeitos, o ataque asmático consiste em duas fases que ilustram a patofisiologia do estado: - uma fase imediata, consistindo maioritariamente em broncoespasmos devidos a espasmos do músculo liso brônquico; as células envolvidas são mastócitos que libertam histamina, mas também eosinófilos, macrófagos e plaquetas que libertam leucotrienos, prostaglandinas e factor activador das plaquetas; estes espasmogénios, adicionados a quimiotaxinas e quimioquinas, atraem leucócitos para a área, montando o cenário para a fase retardada; - uma última fase, consistindo num tipo especial de inflamação compreendendo vasodilatação, edema, secreção de muco e broncoespasmo; é causada por mediadores inflamatórios libertados por células T e eosinófilos libertadores de citoquinas activadas e, possivelmente, neuropéptidos libertados por reflexos de axónios; estes mediadores causam danos e perda do epitélio brônquico. 0 factor de predisposição mais forte que pode ser identificado para desenvolver asma é atopia, a predisposição para o desenvolvimento de uma resposta mediada por IgE a aeroalergénios comuns. Quando a IgE se liga aos receptores da IgE nas células, o sistema é 3 iniciado, de modo que uma nova exposição subsequente ao alerqénio relevante irá causar um ataque asmático. A maioria dos casos de asma (95%) está associada a atopia.
Para além do seu papel acima mencionado na asma, os leucotrienos estão mais geralmente envolvidos em reacções de defesa do hospedeiro e desempenham um papel importante na hiper-sensibilidade imediata, bem como em doenças inflamatórias diferentes de asma, como doença inflamatória do intestino, psoriase e artrite. A via dos leucotrienos
Os leucotrienos são produtos das vias da Lipoxigenase. As lipoxigenases são enzimas solúveis localizadas no citosol e encontram-se no pulmão, plaquetas, mastócitos e glóbulos brancos. A principal enzima deste grupo é a 5-Lipoxigenase, que é a primeira enzima na biossintese dos leucotrienos. 0 primeiro passo da biossintese dos leucotrienos é a libertação de ácido araquidónico a partir de fosfolípidos membranares por estimulação celular (por exemplo, por complexos imunológicos e ionóforos de cálcio). Em seguida, o ácido araquidónico é convertido em leucotrienos A4 por uma 5-Lipoxigenase (5-LO), que se desloca para a membrana celular onde se associa a uma proteína denominada "proteína activadora da cinco-Lipoxigenase" (FLAP), que é necessária para a síntese de leucotrienos em células intactas. A 5-LO também tem actividade de leucotrieno A4 hidrolase. 0 leucotrieno A4 (LTA4), um intermediário epóxido instável, é seguidamente hidrolisado em leucotrieno B4 (actividade de LTA4-hidrolase) ou conjugado com glutationa originando leucotrieno C4 (actividade de LTC4-sintase) e seus metabolitos, leucotrieno D4 e leucotrieno E4. 0 LTB4 é produzido maioritariamente por neutrófilos, ao passo que os 4 cisteinil-leucotrienos (LTC4, LTD4 e LTE4) são maioritariamente produzidos por eosinófilos, mastócitos, basófilos e macrófagos. 0 LTB4 é um agente quimiotáctico poderoso para neutrófilos e macrófagos. Nos neutrófilos causa regulação positiva de moléculas de adesão membranar e aumenta a produção de produtos de oxigénio tóxicos e a libertação de enzimas granulares. Em macrófagos e linfócitos estimula a proliferação e libertação de citoquinas. Assim, o LTB4 é um mediador importante em todos os tipos de inflamações.
Os cisteinil-leucotrienos actuam nos sistemas respiratório e cardiovascular. No sistema respiratório são espasmogénios potentes que causam uma contracção do músculo bronquiolar e um aumento da secreção de muco. No sistema cardiovascular causam vasodilatação na maior parte dos vasos, mas também actuam como vasoconstritores coronários. Os cisteinil-leucotrienos são particularmente importantes em asma. FLAP (proteína activadora da 5-lipoxigenase) A FLAP é um polipéptido ligado a membranas de 18 kD que se liga especificamente ao ácido araquidónico e activa a 5-LO ao actuar como proteína de transferência do ácido araquidónico. 0 gene FLAP abrange mais de 31 kb e consiste em cinco exões pequenos e quatro exões grandes. (ver GenBank 182657, Kennedy et al. 1991, incorporado aqui por referência, Genbank M60470 quanto ao exão 1, Genbank M63259 quanto ao exão 2, Genbank M63260 quanto ao exão 3, Genbank M63261 quanto ao exão 4 e Genbank M6322 quanto ao exão 5). 0 envelope nuclear é o sítio intracelular onde a 5-LO e a FLAP actuam metabolizando o ácido araquidónico, e a activação por ionóforos de neutrófilos e monócitos resulta no deslocamento da 5-LO de uma localização não sedentária 5 para o envelope nuclear. Os inibidores da função da FLAP evitam o deslocamento da 5-LO do citosol para a membrana e inibem a activação da 5-LO. Assim, são candidatos interessantes a fármacos anti-inflamatórios. De facto, os antagonistas da FLAP conseguem atenuar respostas broncoconstritoras induzidas por alergénios, o que suporta um papel importante dos cisteinil-leucotrienos na mediação destas respostas asmáticas.
Farmacogenómica
Para determinar as origens de variações individuais na susceptibilidade a doenças ou resposta a fármacos, a farmacogenómica utiliza as tecnologias genómicas para identificar polimorfismos em genes que fazem parte de vias biológicas envolvidas em susceptibilidade, etiologia e desenvolvimento de doenças, ou, mais especificamente, nas vias de resposta a fármacos responsáveis pela eficácia, tolerância ou toxicidade de um fármaco, incluindo, mas não se limitando às cascatas do metabolismo de fármacos. A este respeito, os fenómenos inflamatórios envolvidos em numerosas doenças são muito relevantes para a farmacogenómica porque estão no centro de muitas doenças graves amplamente disseminadas e porque a abordagem selectiva de vias inflamatórias para conceber novos fármacos eficazes inclui numerosos riscos de potenciação de efeitos secundários graves. A via dos leucotrienos é particularmente interessante, uma vez que os seus produtos são moléculas inflamatórias poderosas. A grande maioria das doenças comuns, como cancro, hipertensão e diabetes, é poligénica (envolvendo vários genes). Adicionalmente, estas doenças são moduladas por factores ambientais, tais como poluentes, agentes químicos e dieta. É por este motivo que muitas doenças são 6 denominadas multifactoriais: resultam de uma combinação sinergética de factores genéticos e ambientais.
Por exemplo, para além do impacto evidente de factores ambientais no desenvolvimento de asma, padrões de formação de agregados e análises de segregação em famílias asmáticas sugeriram uma componente genética da asma. No entanto, a ausência de um fenótipo da asma definido e específico demonstra ser um grande obstáculo à detecção fiável de genes associados à asma. A asma é habitualmente diagnosticada por exames clínicos e realização de testes biológicos. A hiper-sensibilidade brônquica inespecífica que acompanha a asma é medida pela variação do fluxo de ar desencadeado num paciente pela administração de um broncoconstritor, como histamina ou metacolina. A atopia é detectada por testes cutâneos de picada, que medem títulos de IgE no soro. Também se utilizam habitualmente questionários de sintomas comuns para detectar sintomas característicos mas não únicos de asma (como respiração ruidosa e falta de ar nocturnas).
No entanto, não há nenhum teste sanguíneo directo fisiológico ou biológico para detectar o estado asmático. Apesar dos avanços na compreensão da patofisiologia da asma e seu desenvolvimento, evidências sugerem que a predominância do estado asmático e a gravidade dos ataques de asma são subestimadas. Em resultado, o tratamento adequado da asma é muitas vezes retardado, desse modo permitindo que o processo de inflamação se estabeleça melhor. Assim, é necessário um teste de diagnóstico de asma eficiente e fiável. A eficácia e toxicidade de fármacos também podem ser consideradas características multifactoriais que envolvem componentes genéticos, de modo muito semelhante às doenças 7 complexas. A este respeito, há três categorias principais de genes gue se pode esperar, teoricamente, estarem associadas à resposta a fármacos, nomeadamente genes ligados à doença em questão, genes relacionados com o modo de acção do fármaco e genes envolvidos no metabolismo do fármaco. 0 objectivo principal da farmacogenómica no estudo da asma consiste em olhar para genes que estão relacionados com a resposta a fármacos. Em primeiro lugar, pode fornecer ferramentas para aperfeiçoar a concepção do desenvolvimento de fármacos, ao reduzir a incidência de acontecimentos adversos em estudos de tolerância a fármacos, ao definir melhor sub-populações de pacientes respondedores e não respondedores em estudos de eficácia e, combinando os resultados obtidos, permitir suplementarmente uma melhor utilização de fármacos individualizada com base no prognóstico de eficácia/tolerância. A farmacogenómica também pode fornecer ferramentas para identificar novos alvos para a concepção de fármacos e para optimizar a utilização de fármacos já existentes, de modo a aumentar a sua taxa de resposta e/ou excluir não respondedores de tratamentos particulares, ou diminuir efeitos secundários indesejáveis e/ou excluir do tratamento correspondente pacientes com risco significativo de sofrerem efeitos secundários indesejáveis.
Para esta segunda aplicação da farmacogenómica, a via dos leucotrienos também é útil, pois estão a ser desenvolvidos muitos agentes anti-asmáticos e anti-inflamatórios que actuam pela via dos leucotrienos, a maior parte dos quais exibe alguma incidência de efeitos secundários graves.
Por exemplo, há duas grandes categorias de fármacos anti-asma: broncodilatadores e agentes anti-inflamatórios. 8
Os broncodilatadores são eficazes na reversão dos broncoespasmos da fase imediata da doença. Fármacos utilizados como broncodilatadores incluem os agonistas dos P2-adrenoceptores (que dilatam os brônquios por acção directa sobre o músculo liso, por exemplo, salbutamol), as xantinas (por exemplo, teofilina) e os antagonistas de receptores muscarinicos (por exemplo, brometo de ipratrópio). Estes representam o tratamento sintomático de ataque a curto prazo.
Os agentes anti-inflamatórios são eficazes na inibição ou prevenção da produção de componentes inflamatórios em ambas as fases da asma. Incluem glucocorticóides, cromoglicato de sódio e antagonistas do receptor Hl da histamina. Estes agentes representam o presente tratamento a longo prazo do estado asmático.
Contudo, nenhum destes fármacos anti-asmáticos presentemente utilizados é completamente satisfatório, pois nenhum "cura" realmente todos os pacientes com a doença. Os glucocorticóides são os compostos activos mais interessantes a este respeito, mas têm efeitos secundários indesejados potencialmente graves (candidiase orofaringea, disfonia e osteoporose para glucocorticóides inalados, e perturbações do humor, apetite acrescido e perda do controlo da glucose em diabéticos para glucocorticóides sistémicos).
Em anos recentes, inibidores da biossintese de leucotrienos mais eficazes e selectivos (por exemplo, inibidores que se ligam à 5-LO e à FLAP) têm sido desenvolvidos e utilizados como novas terapias para asma brônquica e outras perturbações inflamatórias. Por exemplo, verificou-se que o Zileuton (Zyflo®), um inibidor da 5-LO comercializado pela Abbott Laboratories (Abbott Park, 9
Illinois) melhora a função das vias aéreas e reduz sintomas relacionados com a asma.
Infelizmente, efeitos secundários indesejáveis, como exacerbação aguda da asma, dispepsia e enzimas no fígado acrescidas, têm sido relatados em ensaios clínicos do Zileuton. Também há uma preocupação relativa a interacções de fármacos com medicamentos eliminados hepaticamente.
Assim, para além de ser necessário desenvolver um teste de diagnóstico de asma eficiente e fiável, também é necessário desenvolver estratégias terapêuticas mais eficazes e melhor dirigidas actuando na via dos leucotrienos, com efeitos secundários reduzidos e baixa toxicidade para o utilizador. Um modo de consegui-lo num curto prazo relativo seria pela utilização de resultados da farmacogenómica, para definir melhor a utilização de fármacos existentes ou de candidatos a fármacos de modo a aumentar a razão benefício/risco em sub-populações-alvo de pacientes.
RESUMO DA INVENÇÃO A presente invenção advém do isolamento e caracterização de sequências de ácidos nucleicos compreendendo um nucleótido num marcador bialélico relacionado com o FLAP. Um objectivo suplementar da invenção consiste em vectores recombinantes compreendendo qualquer uma das sequências de ácidos nucleicos da presente invenção, bem como em células-hospedeiro compreendendo essas sequências de ácidos nucleicos ou vectores recombinantes. A invenção também abrange a variante 127-Ile da proteína FLAP e uma composição de anticorpos capazes de se ligarem selectivamente a essa variante. A invenção também é dirigida à utilização de sequências genómicas do FLAP para determinar a identidade do 10 nucleótido nestes marcadores bialélicos relacionados com o FLAP e a um método para identificar uma associação estatisticamente significativa entre alelos específicos do gene FLAP e doenças envolvendo a via dos leucotrienos, como asma.
Mais particularmente, a presente invenção advém da identificação de associações genéticas entre alelos de marcadores bialélicos do gene FLAP e asma, como confirmado e caracterizado num painel de sujeitos humanos. São proporcionados métodos e fornecidos produtos para a detecção molecular de uma susceptibilidade genética em humanos a doenças envolvendo a via dos leucotrienos, como asma.
DESCRIÇÃO BREVE DAS FIGURAS A Figura 1 é um diagrama do gene FLAP com uma indicação da posição relativa dos marcadores bialélicos da presente invenção. A Figura 2 mostra os resultados de um estudo de associação entre os marcadores bialélicos do FLAP e asma com 290 indivíduos asmáticos e 280 controlos caucasianos dos Estados Unidos. A Figura 2 é um gráfico gue demonstra a associação entre alguns dos marcadores bialélicos da invenção e asma, mostrando-se no eixo y o valor absoluto do logaritmo (base 10) do valor p dos valores de qui-quadrado para cada marcador e no eixo x uma estimativa grosseira da posição de cada marcador relativamente aos elementos do gene FLAP. A Figura 3 é uma tabela que demonstra os resultados de uma análise de associação de haplótipos entre asma e haplótipos que consistem em marcadores bialélicos da invenção (297 casos versus 286 controlos caucasianos dos
Estados Unidos). 11 A Figura 4 é uma tabela que demonstra os resultados de uma análise de frequência de haplótipos incluindo a realização de testes de permutação com mais de 1000 iterações.
DESCRIÇÃO BREVE DAS SEQUÊNCIAS FORNECIDAS NA LISTAGEM DE SEQUÊNCIAS A ID SEQ N° 1 contém uma sequência genómica do FLAP compreendendo a região reguladora 5' (região não transcrita a montante), os exões e intrões e a região reguladora 3' (região não transcrita a jusante). A ID SEQ N° 2 contém um cDNA do FLAP humano completo com UTR's 5' e 3' . A ID SEQ N° 3 contém a proteína FLAP codificada pelo CDNA da ID SEQ N° 2.
As ID SEQ N°s 4 e 5 contêm o alelo 1 ou o alelo 2 do marcador bialélico A14 e sua sequência envolvente.
As ID SEQ N°s 6 e 7 contêm a sequência de "primers" de amplificação para o marcador bialélico A14. A ID SEQ N° 8 contém a sequência de um "primer" de microssequenciação do marcador bialélico A14.
As ID SEQ N°s 9 e 10 contêm o alelo 1 ou o alelo 2 do marcador bialélico AI9 e sua sequência envolvente.
As ID SEQ N°s 11 e 12 contêm a sequência de "primers" de amplificação para o marcador bialélico A19. A ID SEQ N° 13 contém a sequência de um "primer" de microssequenciação do marcador bialélico A19. A ID SEQ N° 14 contém um "primer" contendo a sequência PU 5' adicional descrita suplementarmente no Exemplo 2. A ID SEQ N° 15 contém um "primer" contendo a sequência RP 5' adicional descrita suplementarmente no Exemplo 2. 12
DESCRIÇÃO PORMENORIZADA DA INVENÇÃO A 5-LO está associada à FLAP para a síntese de leucotrienos. De facto, parece poder obter-se regulação da produção de leucotrienos através da acção quer de inibidores da 5-LO directos quer de inibidores indirectos da biossíntese dos leucotrienos, que se ligam à FLAP. A presente invenção diz respeito à identificação e caracterização de marcadores bialélicos num gene que codifica a FLAP, bem como à identificação de polimorfismos significativos associados a doenças envolvendo a via dos leucotrienos. Preferivelmente, os polimorfismos estão associados à asma.
Os polimorfismos identificados são utilizados na concepção de ensaios para a detecção fiável de susceptibilidade genética a doenças envolvendo a via dos leucotrienos. Também podem ser utilizados na concepção de protocolos de rastreio de fármacos para fornecer uma avaliação rigorosa e eficiente do potencial terapêutico e de efeitos secundários de medicamentos novos ou já existentes. I. Definições
Antes de descrever a invenção em mais pormenor, apresentam-se as definições seguintes para ilustrar e definir o significado e âmbito dos termos utilizados para descrever aqui a invenção. 0 termo "gene FLAP", quando utilizado aqui, abrange sequências genómicas, de mRNA e cDNA que codificam a proteína FLAP. No caso de uma sequência genómica, o gene FLAP também inclui regiões reguladoras nativas que controlam a expressão da sequência codificadora do gene FLAP. 13
Tal como são aqui utilizados de forma intermutável, os termos "oligonucleótidos" e "polinucleótidos" incluem sequências de RNA, DNA ou híbridas de RNA/DNA com mais de um nucleótido em forma de cadeia simples ou hélice dupla. 0 termo "nucleotídico", tal como é aqui utilizado, é um adjectivo que descreve moléculas compreendendo sequências de RNA, DNA ou híbridas de RNA/DNA de qualquer comprimento em forma de filamentação simples ou hélice dupla. 0 termo "nucleótido" é aqui utilizado como substantivo para se referir a nucleótidos individuais ou variedades de nucleótidos, significando uma molécula, ou unidade individual numa molécula de ácido nucleico maior, compreendendo uma purina ou pirimidina, uma fracção de açúcar ribose ou desoxirribose e um grupo fosfato, ou sistema de ligação fosfodiéster no caso de nucleótidos num oligonucleótido ou polinucleótido. Apesar do termo "nucleótido" também ser aqui utilizado de modo a abranger "nucleótidos modificados" que compreendem pelo menos uma modificação entre (a) um grupo de ligação alternativo, (b) uma forma análoga de purina, (c) uma forma análoga de pirimidina ou (d) um açúcar análogo; quanto a exemplos de grupos de ligação, purinas, pirimidinas e açúcares análogos ver, por exemplo, a publicação PCT N° WO 95/04064. No entanto, os polinucleótidos da invenção são preferivelmente compreendidos por mais de 50% de nucleótidos desoxirribose convencionais, muito preferivelmente mais de 90% de nucleótidos desoxirribose convencionais. As sequências polinucleotídicas da invenção podem ser preparadas por qualquer método conhecido, incluindo método sintético, recombinante, geração ex vivo, ou uma combinação destes, bem como utilizando quaisquer métodos de purificação conhecidos na área. 14 0 termo "purificado" é aqui utilizado para descrever um polinucleótido ou vector polinucleotidico da invenção que foi separado de outros compostos, incluindo, mas não se limitando a outros ácidos nucleicos, hidratos de carbono, lipidos e proteínas (como as enzimas utilizadas na síntese do polinucleótido) , ou a separação entre polinucleótidos covalentemente fechados e polinucleótidos lineares. Um polinucleótido é substancialmente puro quando pelo menos cerca de 50, preferivelmente 60 até 75% de uma amostra exibe uma única sequência e conformação polinucleotídicas (linear versus covalentemente fechada). Um polinucleótido substancialmente puro compreende tipicamente cerca de 50, preferivelmente 60 até 90% peso/peso de uma amostra de ácido nucleico, mais habitualmente cerca de 95%, e preferivelmente tem um grau de pureza superior a cerca de 99%. O grau de pureza ou a homogeneidade de um polinucleótido pode ser indicado por alguns meios bem conhecidos na área, tais como electroforese de uma amostra em gel de agarose ou poliacrilamida, seguida de visualização de uma única banda polinucleotídica por coloração do gel. Para certas finalidades pode fornecer-se maior resolução utilizando HPLC, ou outros meios bem conhecidos na área.
Tal como é aqui utilizado, o termo "isolado" requer que o material seja removido do seu ambiente original (por exemplo, o ambiente natural se for de ocorrência natural). Por exemplo, um polinucleótido ou polipéptido de ocorrência natural presente num animal vivo não está isolado, mas o mesmo polinucleótido ou DNA ou polipéptido separado de alguns ou de todos os materiais coexistentes no sistema natural está isolado. Esse polinucleótido pode fazer parte de um vector e/ou esse polinucleótido ou polipéptido pode fazer parte de uma composição e ainda assim estar isolado, 15 pois o vector ou composição nao faz parte do seu ambiente natural. 0 termo "polipéptido" refere-se a um polímero de aminoácidos sem interessar a extensão do polímero; assim, péptidos, oligopéptidos e proteínas estão incluídos na definição de polipéptido. Este termo também não especifica nem exclui modificações pós-expressão de polipéptidos; por exemplo, polipéptidos que incluem a ligação covalente de grupos glicosilo, grupos acetilo, grupos fosfato, grupos lipídicos e afins são expressamente abrangidos pelo termo polipéptido. Também estão incluídos na definição polipéptidos que contêm um ou mais análogos de um aminoácido (incluindo, por exemplo, aminoácidos de ocorrência não natural, aminoácidos que só ocorrem naturalmente num sistema biológico não relacionado, aminoácidos modificados de sistemas de mamíferos, etc.), polipéptidos com sistemas de ligação substituídos, bem como outras modificações conhecidas na área, de ocorrência natural e de ocorrência não natural. 0 termo "purificado" é aqui utilizado para descrever um polipéptido da invenção que foi separado de outros compostos, incluindo, mas não se limitando a ácidos nucleicos, lípidos, hidratos de carbono e outras proteínas. Um polipéptido é substancialmente puro quando pelo menos cerca de 50%, preferivelmente 60 até 75% de uma amostra exibe uma única sequência polipeptídica. Um polipéptido substancialmente puro compreende tipicamente cerca de 50%, preferivelmente 60 até 90% peso/peso de uma amostra proteica, mais habitualmente cerca de 95%, e preferivelmente tem um grau de pureza superior a cerca de 99%. O grau de pureza ou a homogeneidade do polipéptido é indicado por alguns meios bem conhecidos na área, tais como electrof orese de uma amostra em gel de agarose ou 16 poliacrilamida, seguida de visualização de uma única banda polipeptidica por coloração do gel. Para certas finalidades pode fornecer-se maior resolução utilizando HPLC, ou outros meios bem conhecidos na área. 0 termo "polipéptido recombinante" é aqui utilizado para se referir a polipéptidos que foram artificialmente concebidos e que compreendem pelo menos duas sequências polipeptidicas que não se encontram como sequências polipeptídicas contíguas nos seus ambientes naturais iniciais, ou para se referir a polipéptidos que foram expressos a partir de um polinucleótido recombinante.
Tal como é aqui utilizado, o termo "anticorpo" refere-se a um polipéptido ou grupo de polipéptidos que são compreendidos por pelo menos um domínio de ligação, em que o domínio de ligação de um anticorpo é formado a partir do dobramento de domínios variáveis de uma molécula de anticorpo, para formar espaços de ligação tridimensionais com uma configuração da superfície interna e distribuição de carga complementares às características de um determinante antigénico de um antigene, o que permite uma reacção imunológica com o antigene. Anticorpos incluem proteínas recombinantes compreendendo os domínios de ligação, bem como fragmentos, incluindo fragmentos Fab, Fab', F(ab)2 e F(ab')2·
Tal como é aqui utilizado, um "determinante antigénico" é a porção de uma molécula de antigene, neste caso um polipéptido FLAP, que determina a especificidade da reacção antigene-anticorpo. Um "epítopo" refere-se a um determinante antigénico de um polipéptido. Um epítopo pode compreender apenas 3 aminoácidos numa conformação espacial que é única do epítopo. Em geral, um epítopo consiste em pelo menos 6 aminoácidos e mais habitualmente pelo menos 8-10 desses aminoácidos. Métodos para determinar os 17 aminoácidos que perfazem um epítopo incluem cristalografia de raios X, ressonância magnética nuclear bidimensional e mapeamento de epítopos, por exemplo, o método Pepscan descrito por H. Mario Geysen et al. 1984; Publicação PCT N° WO 84/03564, e Publicação PCT N° WO 84/03506.
Ao longo da presente especificação, a expressão "sequência de nucleótidos" pode ser empregue para designar indiferenciadamente um polinucleótido ou um ácido nucleico. Mais precisamente, a expressão "sequência de nucleótidos" abrange o próprio material nucleico e, assim, não se restringe à informação da sequência (isto é, a sucessão de letras escolhidas entre as quatro letras de base) que caracteriza bioquimicamente uma molécula especifica de DNA ou RNA. O termo "a montante" é aqui utilizado para se referir a uma localização dirigida para a extremidade 5' do polinucleótido a partir de um ponto de referência especifico.
Os termos "emparelhamento de bases" e "emparelhamento de bases de Watson & Crick" são aqui utilizados de forma intermutável para se referirem a nucleótidos que estão ligados entre si por ligações de hidrogénio em virtude das suas identidades de sequências, de um modo semelhante ao encontrado em DNA de hélice dupla com resíduos timina ou uracilo ligados a resíduos adenina por duas ligações de hidrogénio e resíduos citosina e guanina ligados por três ligações de hidrogénio (ver Stryer, L., 1995).
Os termos "complementar" ou "respectivo complemento" são aqui utilizados para se referirem às sequências de polinucleótidos que são capazes de formar emparelhamento de bases de Watson & Crick com outro polinucleótido especificado ao longo da totalidade da região complementar. Este termo aplica-se a pares de polinucleótidos com base 18 apenas nas suas sequências, e não em qualquer conjunto particular de condições nas quais os dois polinucleótidos se ligariam na realidade. 0 termo " a 1 e 1 o " é aqui utilizado para se referir a variantes de uma sequência de nucleótidos. Os organismos diplóides podem ser homozigóticos ou heterozigóticos para uma forma alélica.
Um "promotor" refere-se a uma sequência de DNA reconhecida pela maquinaria sintética da célula necessária para iniciar a transcrição especifica de um gene.
Uma sequência "operativamente ligada" a uma sequência reguladora, como um promotor, significa que esse elemento regulador está na localização e orientação correctas relativamente ao ácido nucleico para controlar a iniciação por RNA polimerase e expressão do ácido nucleico de interesse. Tal como é aqui utilizado, o termo "operativamente ligado" refere-se a um sistema de ligação de elementos polinucleotidicos numa relação funcional. Por exemplo, um promotor ou intensificador está operativamente ligado a uma sequência codificadora se afectar a transcrição da sequência codificadora. Mais precisamente, diz-se que duas moléculas de DNA (como um polinucleótido contendo uma região promotora e um polinucleótido que codifica um polipéptido ou polinucleótido desejado) estão "operativamente ligadas" se a natureza do sistema de ligação entre os dois polinucleótidos não (1) resultar na introdução de uma mutação de deslocamento do quadro de leitura nem (2) interferir com a capacidade do polinucleótido contendo o promotor para dirigir a transcrição do polinucleótido codificador. 0 termo "primer" designa uma sequência oligonucleotidica especifica que é complementar a uma sequência de nucleótidos alvo e que é utilizada para 19 hibridizar para a sequência de nucleótidos alvo. Um "primer" serve de ponto de iniciação para a polimerização de nucleótidos catalisada por DNA polimerase, RNA polimerase ou transcriptase reversa. 0 termo "sonda" designa um segmento de ácido nucleico definido (ou segmento análogo de nucleótidos, por exemplo, polinucleótido como aqui definido abaixo) que pode ser utilizado para identificar uma sequência polinucleotídica específica presente em amostras, cujo segmento de ácido nucleico compreende uma sequência de nucleótidos complementar à sequência polinucleotídica específica a ser identificada. 0 termo "taxa de heterozigosidade" é aqui utilizado para se referir à incidência de indivíduos numa população que são heterozigóticos num alelo particular. Num sistema bialélico, a taxa de heterozigosidade é, em média, igual a 2Pa(l-Pa), em que Pa é a frequência do alelo menos comum. Para ser útil em estudos genéticos, um marcador genético deve ter um nível adequado de heterozigosidade para permitir uma probabilidade razoável de uma pessoa seleccionada aleatoriamente ser heterozigótica. 0 termo "genótipo", tal como é aqui utilizado, refere-se à identidade dos alelos presentes num indivíduo ou numa amostra. No contexto da presente invenção, um genótipo refere-se preferivelmente à descrição dos alelos do marcador bialélico presentes num indivíduo ou numa amostra. 0 termo "genotipagem" de uma amostra ou de um indivíduo quanto a um marcador bialélico consiste em determinar o alelo específico ou o nucleótido específico presente num indivíduo num marcador bialélico. 0 termo "mutação", tal como é aqui utilizado, refere-se a uma diferença na sequência de DNA entre diferentes genomas ou indivíduos que tem uma frequência inferior a 1%. 20 O termo "haplótipo" refere-se a uma combinação de alelos presente num indivíduo ou numa amostra. No contexto da presente invenção, um haplótipo refere-se preferivelmente a uma combinação de alelos de um marcador bialélico encontrada num dado indivíduo e que pode estar associada a um fenótipo. 0 termo "polimorfismo", tal como é aqui utilizado, refere-se à ocorrência de duas ou mais sequências genómicas ou alelos alternativos entre diferentes genomas ou indivíduos. "Polimórfico" refere-se ao estado em que duas ou mais variantes de uma sequência genómica específica podem ser encontradas numa população. Um "sítio polimórfico" é o locus onde ocorre a variação. Um polimorfismo de um único nucleótido é a alteração de um único par de bases. Tipicamente, um polimorfismo de um único nucleótido é a substituição de um nucleótido por outro nucleótido no sítio polimórfico. A deleção de um único nucleótido ou inserção de um único nucleótido também dá origem a polimorfismos de um único nucleótido. No contexto da presente invenção, "polimorfismo de um único nucleótido" refere-se preferivelmente à substituição de um único nucleótido. Tipicamente entre diferentes genomas ou entre diferentes indivíduos, o sítio polimórfico pode estar ocupado por dois nucleótidos diferentes. "Marcadores bialélicos" consistem num polimorfismo de uma única base. Em consequência, cada marcador bialélico corresponde a duas formas de uma sequência polinucleotídica incluída num gene, as quais, quando comparadas entre si, apresentam uma modificação nucleotídica numa posição. Habitualmente, a modificação nucleotídica envolve a substituição de um nucleótido por outro (por exemplo, C em vez de T) . Tipicamente, a frequência do alelo menos comum dos marcadores bialélicos da presente invenção foi validada 21 como sendo superior a 1%, preferivelmente a frequência é superior a 10%, mais preferivelmente a frequência é pelo menos 20% (isto é, taxa de heterozigosidade de pelo menos 0,32), ainda mais preferivelmente a frequência é pelo menos 30% (isto é, taxa de heterozigosidade de pelo menos 0,42). Um marcador bialélico em que a frequência do alelo menos comum é 30% ou superior é denominado "marcador bialélico de alta qualidade".
Tal como utilizada aqui, a terminologia "definir um marcador bialélico" significa que uma sequência inclui uma base polimórfica de um marcador bialélico. As sequências que definem um marcador bialélico podem ter qualquer comprimento consistente com a sua utilização pretendida, desde que contenham uma base polimórfica de um marcador bialélico. A sequência tem entre 1 e 500 nucleótidos de comprimento, preferivelmente entre 5, 10, 15, 20, 25 ou 40 e 200 nucleótidos e mais preferivelmente entre 30 e 50 nucleótidos de comprimento. Preferivelmente, as sequências que definem um marcador bialélico incluem uma base polimórfica seleccionada do grupo que consiste nos marcadores bialélicos AI até A28. Em algumas especificações, as sequências que definem um marcador bialélico compreendem uma das sequências seleccionadas do grupo que consiste em PI até P28. Do mesmo modo, o termo "marcador" ou "marcador bialélico" requer que a sequência tenha comprimento suficiente para praticamente (embora não seja necessário fazê-lo de modo inequívoco) identificar o alelo polimórfico, o que habitualmente implica um comprimento de pelo menos 4, 5, 6, 10, 15, 20, 25 ou 40 nucleótidos. A invenção também diz respeito a marcadores bialélicos relacionados com o FLAP. Os termos "marcador bialélico relacionado com o FLAP" e "marcador bialélico do gene FLAP" 22 são aqui utilizados de forma intermutável para se referirem a todos os marcadores bialélicos em desequilíbrio de ligação com o gene FLAP. 0 termo marcador bialélico relacionado com o FLAP inclui, mas não se limita aos marcadores bialélicos génicos e não génicos descritos na Figura 1. 0 termo "não génico" é aqui utilizado para descrever marcadores bialélicos relacionados com o FLAP, bem como polinucleótidos e "primers", que ocorrem fora das posições nucleotídicas mostradas na sequência genómica do FLAP humano da ID SEQ N° 1. 0 termo "génico" é aqui utilizado para descrever marcadores bialélicos relacionados com o FLAP bem como polinucleótidos e "primers" que ocorrem nas posições nucleotídicas mostradas na sequência genómica do FLAP humano da ID SEQ N° 1. A localização de nucleótidos num polinucleótido relativamente ao centro do polinucleótido é descrita aqui do modo seguinte. Quando um polinucleótido tem um número ímpar de nucleótidos, o nucleótido situado a distância igual das extremidades 3' e 5' do polinucleótido é considerado como estando "no centro" do polinucleótido, e qualquer nucleótido imediatamente adjacente ao nucleótido situado no centro, ou o próprio nucleótido situado no centro, é considerado como estando "a 1 nucleótido do centro". Com um número ímpar de nucleótidos num polinucleótido, qualquer uma das cinco posições de nucleótidos no meio do polinucleótido é considerada como estando a 2 nucleótidos do centro, e assim por diante. Quando um polinucleótido tem um número par de nucleótidos, há uma ligação, e não um nucleótido, no centro do polinucleótido. Assim, qualquer um dos dois nucleótidos centrais é considerado como estando "a 1 nucleótido do centro", e qualquer um dos quatro nucleótidos no meio do 23 polinucleótido é considerado como estando "a 2 nucleótidos do centro", e assim por diante. Para polimorfismos que envolvem a substituição, inserção ou deleção de 1 ou mais nucleótidos, o polimorfismo, alelo ou marcador bialélico está "no centro" de um polinucleótido se a diferença entre a distância dos polinucleótidos substituídos, inseridos ou deletados do polimorfismo e a extremidade 3' do polinucleótido, e a distância dos polinucleótidos substituídos, inseridos ou deletados do polimorfismo e a extremidade 5' do polinucleótido for zero ou um nucleótido. Se esta diferença for 0 até 3, então o polimorfismo é considerado como estando "a 1 nucleótido do centro". Se a diferença for 0 até 5, o polimorfismo é considerado como estando "a 2 nucleótidos do centro". Se a diferença for 0 até 7, o polimorfismo é considerado como estando "a 3 nucleótidos do centro", e assim por diante.
Os termos "característica" e "fenótipo" são aqui utilizados de forma intermutável e referem-se a qualquer propriedade de um organismo que é visível, detectável ou mensurável de qualquer outra forma, tais como sintomas ou susceptibilidade a uma doença, por exemplo. Tipicamente, os termos "característica" ou "fenótipo" são aqui utilizados para se referirem a sintomas ou susceptibilidade a uma doença envolvendo a via dos leucotrienos, ou para se referirem à resposta de um indivíduo a um agente que actua na via dos leucotrienos, ou para se referirem a sintomas ou susceptibilidade a efeitos secundários de um agente que actua na via dos leucotrienos. eczema 0 termo "doença envolvendo a via dos leucotrienos" refere-se a um estado ligado a perturbações da expressão, produção ou resposta celular a leucotrienos. As doenças envolvendo a via dos leucotrienos incluem, mas não se limitam a angina, choque endotóxico, psoríase, 24 atópico, artrite reumatóide, doença inflamatória do intestino, osteoartrite, tendinite, bursite, colite ulcerativa, asma brônquica alérgica, rinite alérgica, conjuntivite alérgica, glomerulonefrite, dores de cabeça de enxaquecas e mais particularmente asma. 0 termo "resposta a um agente que actua na via dos leucotrienos" refere-se à eficácia de um fármaco, incluindo, mas não se limitando à capacidade para metabolizar um composto, à capacidade para converter um pró-fármaco num fármaco activo, à farmacocinética (absorção, distribuição, eliminação) e à farmacodinâmica (relacionada com receptores) de um fármaco num indivíduo. No contexto da presente invenção, uma "resposta positiva" a um medicamento pode ser definida como compreendendo uma redução dos sintomas relacionados com a doença ou estado a ser tratado. No contexto da presente invenção, uma "resposta negativa" a um medicamento pode ser definida como compreendendo quer a ausência de uma resposta positiva ao medicamento que não conduz a uma redução dos sintomas quer a um efeito secundário observado após a administração do medicamento. 0 termo "efeitos secundários a um agente que actua na via dos leucotrienos" refere-se a efeitos adversos da terapia resultantes de extensões da acção farmacológica principal do fármaco ou a reacções idiossincráticas adversas resultantes de uma interacção do fármaco com factores únicos do hospedeiro. Os efeitos secundários relacionados com o tratamento com agentes que actuam na via dos leucotrienos são, preferivelmente, uma exacerbação aguda de uma doença inflamatória como asma, infecção e dores de cabeça, e mais preferivelmente um aumento dos níveis de transaminases no fígado. 25 0 termo "agentes que actuam na via dos leucotrienos" refere-se preferivelmente a um fármaco ou a um composto que modula a actividade ou concentração de qualquer enzima ou molécula reguladora envolvida na via dos leucotrienos numa célula ou animal. Preferivelmente, estes agentes podem ser seleccionados do grupo seguinte: inibidores da FLAP, como BAYx 1005, MK-886 e MK-0591; inibidores da 5-Lipoxigenase, como Zileuton, BAY-G576, RS-43 179, Wy-47 288, vitamina A e BW A4C; antagonistas de receptores do Leucotrieno LTD4, como zafirlukast, ICI 204 219, MK-571, MK-679, ONO-RS-411, SK&F 104 353 e Wy-48 252; antagonistas de receptores do Leucotrieno B4; inibidores da Leucotrieno C4 sintase, e inibidores da Leucotrieno A4 hidrolase. "Agentes que actuam na via dos leucotrienos" refere-se suplementarmente a fármacos anti-inflamatórios não esteróides (NSAIDs), antagonistas de receptores de leucotrienos e análogos de leucotrienos. "Agentes que actuam na via dos leucotrienos" também se refere a compostos que modulam a formação e acção de leucotrienos.
Alguns dos compostos citados acima são descritos nas patentes US 4 873 259, 4 970 215, 5 310 744, 5 225 421 e 5 081 138, ou em EP 0 419 049. O termo "indivíduo", tal como é aqui utilizado, refere-se a vertebrados, particularmente membros da espécie dos mamíferos, e inclui, mas não se limita a animais domésticos, animais de desporto, animais de laboratório, primatas e humanos. Preferivelmente, um indivíduo é um humano.
Variantes e fragmentos
Polinucleótidos A invenção também revela variantes e fragmentos dos polinucleótidos descritos aqui, particularmente de um gene 26 FLAP contendo um ou mais marcadores bialélicos descritos na invenção.
Variantes de polinucleótidos, tal como o termo é aqui utilizado, são polinucleótidos que diferem de um polinucleótido de referência. Uma variante de um polinucleótido pode ser uma variante de ocorrência natural, como uma variante alélica de ocorrência natural, ou pode ser uma variante que não se sabe se ocorre naturalmente. Essas variantes do polinucleótido de ocorrência não natural podem ser preparadas por técnicas de mutagénese, incluindo as aplicadas a polinucleótidos, células ou organismos. Em geral, as diferenças são limitadas de modo que as sequências de nucleótidos da referência e da variante sejam globalmente semelhantes de forma íntima e, em muitas regiões, idênticas.
Alterações de nucleótidos de uma variante podem ser silenciosas, o que significa que não alteram os aminoácidos codificados pelo polinucleótido.
No entanto, alterações de nucleótidos também podem resultar em substituições, adições, deleções, fusões e truncamentos de aminoácidos no polipéptido codificado pela sequência de referência. As substituições, deleções ou adições podem envolver um ou mais nucleótidos. As variantes podem ser alteradas em regiões codificadoras ou não codificadoras ou em ambas. Alterações nas regiões codificadoras podem produzir substituições conservativas ou não conservativas, deleções ou adições de aminoácidos.
No contexto da presente invenção, especificações particularmente preferidas são aquelas em que os polinucleótidos codificam polipéptidos que retêm substancialmente a mesma função ou actividade biológica da proteína FLAP madura. 27
Um fragmento polinucleotídico é um polinucleótido com uma sequência que é inteiramente igual a parte, mas não à totalidade, de uma dada sequência de nucleótidos, preferivelmente a sequência de nucleótidos de um gene FLAP, e respectivas variantes. 0 fragmento pode ser uma porção de um exão ou de um intrão de um gene FLAP. Também pode ser uma porção das sequências reguladoras do gene FLAP. Preferivelmente, esses fragmentos compreendem a base polimórfica de pelo menos um dos marcadores bialélicos AI até A28, respectivo complemento ou um marcador bialélico em desequilíbrio de ligação com um ou mais dos marcadores bialélicos AI até A28.
Esses fragmentos podem ser "autónomos", isto é, não fazerem parte nem estarem fundidos a outros polinucleótidos, ou podem estar compreendidos num único polinucleótido maior do qual fazem parte ou formam uma região. No entanto, vários fragmentos podem estar compreendidos num único polinucleótido maior.
Como exemplos representativos de fragmentos polinucleotídicos podem mencionar-se aqueles que têm desde cerca de 4, 6, 8, 15, 20, 25, 40, 10 até 20, 10 até 30, 30 até 55, 50 até 100, 75 até 100 ou 100 até 200 nucleótidos de comprimento. São preferidos aqueles fragmentos com cerca de 47 nucleótidos de comprimento, tais como os de PI até P28, e contendo pelo menos um dos marcadores bialélicos de um gene FLAP que são descritos aqui. Obviamente, entender-se-á que os polinucleótidos PI até P28 podem ser menores ou maiores, não obstante ser preferido que contenham pelo menos a base polimórfica do marcador bialélico que pode estar localizada numa extremidade do fragmento. 28
Polipéptidos A invenção também revela variantes, fragmentos, análogos e derivados dos polipéptidos descritos aqui, incluindo proteínas FLAP mutadas. A variante pode ser 1) tal que um ou mais dos resíduos de aminoácidos são substituídos por um resíduo de aminoácidos conservado ou não conservado (preferivelmente um resíduo de aminoácido conservado), e esse resíduo de aminoácido substituído pode ou não ser codificado pelo código genético, ou 2) tal que um ou mais dos resíduos de aminoácidos incluem um grupo substituinte, ou 3) tal que a FLAP mutada é fundida a outro composto, tal como um composto para aumentar o tempo de semi-vida do polipéptido (por exemplo, polietilenoglicol) , ou 4) tal que os aminoácidos adicionais são fundidos à FLAP mutada, tal como uma sequência líder ou secretora ou uma sequência que é empregue para a purificação da FLAP mutada ou de uma sequência pré-proteína. Considera-se que essas variantes pertencem ao âmbito dos experimentados na área.
Um fragmento polipeptídico é um polipéptido com uma sequência que é inteiramente igual a parte, mas não à totalidade, de uma dada sequência polipeptídica, preferivelmente um polipéptido codificado por um gene FLAP e respectivas variantes. Fragmentos preferidos incluem os da região activa da proteína FLAP que desempenham um papel na biossíntese de leucotrienos e aquelas regiões que possuem propriedades antigénicas e que podem ser utilizadas para dirigir anticorpos contra a proteína FLAP.
Esses fragmentos podem ser "autónomos", isto é, não fazerem parte nem estarem fundidos a outros polipéptidos, ou podem estar compreendidos num único polipéptido maior do qual fazem parte ou formam uma região. No entanto, vários 29 fragmentos podem estar compreendidos num único polipéptido maior.
Como exemplos representativos de fragmentos polipeptidicos da invenção podem mencionar-se aqueles que têm desde cerca de 5, 6, 7, 8, 9 ou 10 até 15, 10 até 20, 15 até 40 ou 30 até 55 aminoácidos de comprimento. São preferidos aqueles fragmentos contendo pelo menos uma mutação de aminoácidos na proteína FLAP.
Condições de hibridização restrita A título exemplificativo e não limitativo, procedimentos que utilizam condições de restrição elevada são os seguintes: A pré-hibridização de filtros contendo DNA é efectuada durante 8 horas até durante a noite a 65°C em tampão composto por 6X SSC, Tris-HCl 50 mM (pH 7,5), EDTA 1 mM, PVP 0,02%, Ficoll 0,02%, BSA 0,02% e 500 μρ/ιηΐ de DNA de esperma de salmão desnaturado. Os filtros são hibridizados durante 48 horas a 65°C, a temperatura de hibridização preferida, em mistura de pré-hibridização contendo 100 μρ/ιηΐ de DNA de esperma de salmão desnaturado r 22 e 5-2 0 X 10 cpm de sonda etiquetada com P. Alternativamente, o passo de hibridização pode ser realizado a 65°C na presença de tampão SSC, em que 1 X SSC corresponde a NaCl 0,15 M e citrato de Na 0,05 M. Subsequentemente, as lavagens dos filtros podem ser feitas a 3 7°C durante 1 hora numa solução contendo 2 x SSC, PVP 0,01%, Ficoll 0,01% e BSA 0,01%, seguida de uma lavagem em 0,1 X SSC a 50°C durante 45 minutos. Alternativamente, as lavagens dos filtros podem ser efectuadas numa solução contendo 2 x SSC e SDS 0,1%, ou 0,5 x SSC e SDS 0,1%, ou 0,1 x SSC e SDS 0,1% a 68°C durante intervalos de 15 minutos. Após os passos de lavagem, as sondas hibridizadas podem ser detectadas por autorradiografia. Outras condições 30 de restrição elevada que podem ser utilizadas são bem conhecidas na área e estão citadas em Sambrook et al., 1989, e Ausubel et al., 1989, sendo aqui incorporadas na sua totalidade. Estas condições de hibridização são adequadas para uma molécula de ácido nucleico com cerca de 20 nucleótidos de comprimento. Escusado será dizer que as condições de hibridização descritas acima devem ser adaptadas de acordo com o comprimento do ácido nucleico desejado, sequindo técnicas bem conhecidas do experimentado na área. As condições de hibridização adequadas podem, por exemplo, ser adaptadas de acordo com os ensinamentos revelados no livro de Hames e Hiqqins (1985) ou em Sambrook et al. (1989) .
Identidade Entre Ácidos Nucleicos ou Polipéptidos
Os termos "percentagem de identidade de sequências" e "homologia percentual" são aqui utilizados de forma intermutável, referindo-se a comparações entre polinucleótidos e polipéptidos, sendo determinadas comparando duas sequências optimamente alinhadas numa janela de comparação, em que a porção da sequência polinucleotidica ou polipeptidica na janela de comparação pode compreender adições ou deleções (isto é, hiatos) em comparação com a sequência de referência (que não compreende adições nem deleções) para o alinhamento óptimo das duas sequências. A percentagem é calculada determinando o número de posições onde ocorre a base de ácido nucleico ou resíduo de aminoácido idênticos em ambas as sequências para se obter o número de posições correspondentes, dividindo o número de posições correspondentes pelo número total de posições da janela de comparação e multiplicando o resultado por 100, obtendo-se a percentagem de identidade de sequências. Avalia-se a homologia utilizando qualquer um 31 de uma variedade de algoritmos e programas de comparação de sequências conhecidos na área. Esses algoritmos e programas incluem, mas não se limitam, de modo nenhum, a TBLASTN, BLASTP, FASTA, TFASTA e CLUSTALW (Pearson e Lipman, 1988; Altschul et al.r 1990; Thompson et al.r 1994; Higgins et ai., 1996; Altschul et al.f 1990; Altschul et ai., 1993). Numa especificação particularmente preferida, as homologias de sequências de proteínas e ácidos nucleicos são avaliadas utilizando a Ferramenta Básica de Busca de Alinhamentos Locais ("Basic Local Alignment Search Tool") ("BLAST") que é bem conhecida na área (ver, por exemplo, Karlin e Altschul, 1990; Altschul et ai., 1990; Altschul et ai., 1993; Altschul et ai., 1997). Em particular, utilizam-se cinco programas BLAST específicos para efectuar a seguinte tarefa: (1) BLASTP e BLAST3 comparam uma sequência de pesquisa de aminoácidos contra uma base de dados de sequências de proteínas; (2) BLASTN compara uma sequência de pesquisa de nucleótidos contra uma base de dados de sequências de nucleótidos; (3) BLASTX compara os produtos da tradução conceptual em seis fases de uma sequência de nucleótidos de pesquisa (ambos os filamentos) contra uma base de dados de sequências de proteínas; (4) TBLASTN compara uma sequência proteica de pesquisa contra uma base de dados de sequências de nucleótidos traduzidas em todas as seis fases de leitura (ambos os filamentos), e (5) TBLASTX compara as traduções em seis fases de uma sequência de nucleótidos de pesquisa contra as traduções em seis fases de uma base de dados de sequências de nucleótidos. 32 0 programa BLAST identifica sequências homólogas por identificação de segmentos semelhantes, que são aqui referidos como "pares de segmentos de alta pontuação", entre uma sequência de pesquisa de aminoácidos ou ácido nucleico e uma sequência de teste, que é preferivelmente obtida de uma base de dados de sequências de proteínas ou ácidos nucleicos. Os pares de segmentos de alta pontuação são preferivelmente identificados (isto é, alinhados) através de uma matriz de pontuação, muitas das quais são conhecidas na área. Preferivelmente, a matriz de pontuação utilizada é a matriz BLOSUM62 (Gonnet et al., 1992; Henikoff e Henikoff, 1993). Menos preferivelmente, também podem ser utilizadas as matrizes PAM ou PAM250 (ver, por exemplo, Schwartz e Dayhoff, editores, 1978). Os programas BLAST avaliam a significância estatística de todos os pares de segmentos de alta pontuação identificados e selecciona preferivelmente aqueles segmentos que satisfazem um limite de significância especificado pelo utilizador, tal como uma homologia percentual especificada pelo utilizador. Preferivelmente, a significância estatística de um par de segmentos de alta pontuação é avaliada utilizando a fórmula de significância estatística de Karlin (ver, por exemplo, Karlin e Altschul, 1990).
II. Sequências Genómicas do FLAP
Apesar do gene FLAP ser muito relevante para a investigação farmacêutica, ainda são escassos os conhecimentos respeitantes à extensão e natureza de variações de sequências neste gene e seus elementos reguladores. O cDNA e parte da sequência genómica do FLAP humano foram clonados e sequenciados (Kennedy et al., 1991; Dixon et al., 1988). Mas a sequência genómica completa do 33 FLAP, incluindo os seus elementos reguladores, ainda não foi descrita. A presente invenção revela a sequência genómica do gene FLAP da ID SEQ N° 1, ou respectiva variante ou a sequência complementar àquela. Este polinucleótido com a sequência de nucleótidos da ID SEQ N° 1, ou respectiva variante ou a sequência complementar àquela, pode ser purificado, isolado ou recombinante. As sequências genómicas do FLAP compreendem exões e intrões. Os ácidos nucleicos derivados dos polinucleótidos intrónicos do FLAP podem ser utilizados como "primers" ou sondas oligonucleotidicos para detectar a presença de uma cópia do gene FLAP numa amostra de teste ou, alternativamente, para amplificar uma sequência de nucleótidos alvo nas sequências FLAP. 0 ácido nucleico genómico do FLAP compreende 5 exões. 0 Exão 1 começa no nucleótido na posição 7709 e termina no nucleótido na posição 7852 da sequência de nucleótidos da ID SEQ N° 1; o Exão 2 começa no nucleótido na posição 16236 e termina no nucleótido na posição 16335 da sequência de nucleótidos da ID SEQ N° 1; o Exão 3 começa no nucleótido na posição 24227 e termina no nucleótido na posição 24297 da sequência de nucleótidos da ID SEQ N° 1; o Exão 4 começa no nucleótido na posição 28133 e termina no nucleótido na posição 28214 da sequência de nucleótidos da ID SEQ N° 1; o Exão 5 começa no nucleótido na posição 36128 e termina no nucleótido na posição 36605 da sequência de nucleótidos da ID SEQ N° 1. A invenção refere-se a polinucleótidos isolados, purificados ou recombinantes compreendendo uma extensão contígua de pelo menos 25, 30, 35, 40, 50, 60, 70, 80, 90, 100, 150, 200, 500 ou 1000 nucleótidos da ID SEQ N° 1, às respectivas sequências complementares ou a marcadores bialélicos em desequilíbrio de ligação com aqueles, em que 34 essa extensão contígua compreende um nucleótido seleccionado do grupo que consiste num A na posição 7445, um A na posição 7870, um T na posição 16288, um A na posição 16383, um T na posição 24361, um G na posição 28336, um T na posição 28368, um A na posição 36183 e um G na posição 36509 da ID SEQ N° 1.
Regiões Reguladoras do Gene FLAP A sequência genómica do gene FLAP contém sequências reguladoras na região de flanqueamento 5' não codificadora e na região de flanqueamento 3' não codificadora que faz fronteira com a região transcrita do FLAP contendo os 5 exões deste gene. As sequências reguladoras 5' do gene FLAP compreendem as sequências polinucleotídicas localizadas entre o nucleótido na posição 1 e o nucleótido na posição 7708 da sequência de nucleótidos da ID SEQ N° 1, mais preferivelmente entre as posições 1 e 7007 da ID SEQ N° 1. As sequências reguladoras 3' do gene FLAP compreendem as sequências polinucleotídicas localizadas entre o nucleótido na posição 36606 e o nucleótido na posição 43069 da sequência de nucleótidos da ID SEQ N° 1.
Polinucleótidos contendo os elementos reguladores localizados na extremidade 5' e na extremidade 3' da região codificadora do FLAP podem ser vantajosamente utilizados para controlar a actividade de transcrição e tradução de um polinucleótido heterólogo de interesse, cujo polinucleótido é heterólogo no que se refere à região reguladora do FLAP.
Esse polinucleótido pode ser incluído num vector de expressão recombinante de modo a expressar o polipéptido desejado ou o ácido nucleico desejado numa célula hospedeiro ou num organismo hospedeiro. 35
III. Sequências de cDNA do FLAP A presente invenção revela um cDNA do FLAP da ID SEQ N° 2. 0 cDNA da ID SEQ N° 2 também inclui uma região 5'-UTR e uma região 3'-UTR. A região 5'-UTR começa no nucleótido na posição 1 e termina no nucleótido na posição 74 da ID SEQ N° 2. A região 3'-UTR começa no nucleótido na posição 561 e termina no nucleótido na posição 875 da ID SEQ N° 2. 0 sítio de poliadenilação começa no nucleótido na posição 851 e termina no nucleótido na posição 856 da ID SEQ N° 2.
Outro objectivo da invenção é um polinucleótido purificado, isolado ou recombinante compreendendo uma extensão contígua de pelo menos 25, 30, 35, 40, 50, 60, 70, 80, 90, 100, 150, 200, 500 ou 1000 nucleótidos da ID SEQ N° 2, respectiva sequência complementar ou marcadores bialélicos em desequilíbrio de ligação com aquele, cuja extensão contígua compreende um A na posição 453 (A20) ou um G na posição 779 (A21) da ID SEQ N° 2. A maior parte dos polimorfismos bialélicos representa substituições de nucleótidos silenciosas, mas o marcador bialélico A20 está associado a alterações de aminoácidos de valina para isoleucina na posição 127 do correspondente polipéptido FLAP. O polinucleótido revelado acima que contém a sequência codificadora do gene FLAP da invenção pode ser expresso numa célula hospedeiro desejada ou num organismo hospedeiro desejado quando este polinucleótido é colocado sob o controlo de sinais de expressão adequados. Os sinais de expressão podem ser os sinais de expressão contidos nas regiões reguladoras do gene FLAP da invenção ou podem ser sequências nucleicas reguladoras exógenas. Esse polinucleótido, quando colocado sob os sinais de expressão adequados, também pode ser inserido num vector para a sua expressão. 36
Regiões codificadoras A fase de leitura aberta do FLAP está contida no mRNA correspondente da ID SEQ N° 2. Mais precisamente, a sequência codificadora (CDS) do FLAP efectiva abrange desde o nucleótido na posição 75 (primeiro nucleótido do codão ATG) até ao nucleótido na posição 560 (nucleótido final do codão TGA) da sequência polinucleotídica da ID SEQ N° 2. A presente invenção também especifica polinucleótidos isolados, purificados e recombinantes que codificam polipéptidos compreendendo uma extensão contígua de pelo menos 6 aminoácidos, preferivelmente pelo menos 8 ou 10 aminoácidos, mais preferivelmente pelo menos 12, 15, 20, 25, 30, 40, 50 ou 100 aminoácidos da ID SEQ N° 3, cuja extensão contígua inclui um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3. O polinucleótido revelado acima que contém a sequência codificadora do gene FLAP pode ser expresso numa célula hospedeiro desejada ou num organismo hospedeiro desejado quando este polinucleótido é colocado sob o controlo de sinais de expressão adequados. Os sinais de expressão podem ser os sinais de expressão contidos nas regiões reguladoras do gene FLAP da invenção ou, em contraste, os sinais podem ser sequências nucleicas reguladoras exógenas. Esse polinucleótido, quando colocado sob os sinais de expressão adequados, também pode ser inserido num vector para a sua expressão e/ou amplificação. IV. Construções Polinucleotídicas
Os termos "construção polinucleotídica" e "polinucleótido recombinante" são aqui utilizados de forma intermutável, referindo-se a polinucleótidos lineares ou circulares, purificados ou isolados que foram concebidos artificialmente e que compreendem pelo menos duas 37 sequências de nucleótidos que nao são sequências de nucleótidos contíguas nos seus ambientes naturais iniciais.
Construção de DNA que Permite Dirigir a Expressão Temporal e Espacial do Gene FLAP em Células-Hospedeiro Recombinantes e em Animais Transgénicos
Para estudar as consequências fisiológicas e fenotípicas de uma ausência de síntese da proteína FLAP, ao nível celular e ao nível de um organismo multicelular, a invenção também revela construções de DNA e vectores recombinantes que permitem uma expressão condicional de um alelo específico da sequência genómica ou cDNA do FLAP e também de uma cópia desta sequência genómica ou cDNA que alberga substituições, deleções ou adições de uma ou mais bases relativamente à sequência de nucleótidos do FLAP das ID SEQ N°s 1 e 2, ou respectivo fragmento, em que estas substituições, deleções ou adições de bases estão localizadas num exão, num intrão ou numa sequência reguladora, mas preferivelmente na sequência reguladora 5' ou num exão da sequência genómica do FLAP ou no cDNA do FLAP da ID SEQ N° 2. Numa especificação preferida, a sequência do FLAP compreende um marcador bialélico da presente invenção, preferivelmente um dos marcadores bialélicos AI até A28. A presente invenção especifica vectores recombinantes compreendendo qualquer um dos polinucleótidos da presente invenção. É descrita uma primeira construção de DNA que se baseia no operão tet de resistência à tetraciclina do transposão de E. coli TnllO para controlar a expressão do gene FLAP, como descrito por Gossen et al. (1992, 1995) e Furth et al. (1994). Essa construção de DNA contém sete sequências operadoras tet do TnlO (tetop) que estão fundidas a um 38 promotor mínimo ou a uma sequência reguladora 5' do gene FLAP, cujo promotor mínimo ou cuja sequência reguladora do FLAP está operativamente ligado a um polinucleótido de interesse que codifica para um oligonucleótido sentido ou anti-sentido ou para um polipéptido, incluindo um polipéptido FLAP ou respectivo fragmento peptídico. Esta construção de DNA é funcional na forma de um sistema de expressão condicional para a sequência de nucleótidos de interesse quando a mesma célula também compreende uma sequência de nucleótidos que codifica para o repressor de tipo selvagem (tTA) ou mutante (rTA) fundido ao domínio de activação da proteína virai VP16 do vírus herpes simplex, colocada sob o controlo de um promotor, como o intensificador/promotor HCMVIE1 ou a MMTV-LTR. De facto, uma construção de DNA preferida compreende o polinucleótido contendo as sequências operadoras tet e o polinucleótido contendo uma sequência que codifica para o repressor tTA ou rTA.
Numa forma de realização específica, a construção de DNA de expressão condicional contém a sequência que codifica o repressor da tetraciclina mutante rTA, a expressão do polinucleótido de interesse é silenciosa na ausência de tetraciclina e induzida na sua presença.
Construções de DNA que Permitem Recombinação Homóloga: Vectores de Substituição É descrita uma segunda construção de DNA que irá compreender, da extremidade 5' para a extremidade 3': (a) uma primeira sequência de nucleótidos que está compreendida na sequência genómica do FLAP; (b) uma sequência de nucleótidos compreendendo um marcador de selecção positiva, como o marcador de resistência à neomicina (neo) , e (c) uma segunda sequência de nucleótidos que está compreendida na 39 sequência genómica do FLAP e está localizada no genoma a jusante da primeira sequência de nucleótidos do FLAP (a).
Numa especificação preferida, esta construção de DNA também compreende um marcador de selecção negativa localizado a montante da sequência de nucleótidos (a) ou a jusante da sequência de nucleótidos (c). Preferivelmente, o marcador de selecção negativa consiste no gene da timidina quinase (tk) (Thomas et al., 1986), no gene da higromicina beta (Te Riele et al., 1990), no gene hprt (Van der Lugt et al., 1991; Reid et al., 1990) ou no gene do fragmento da toxina da Difteria A (Dt-A) (Nada et al., 1993; Yagi et al., 1990). Preferivelmente, o marcador de selecção positiva está localizado numa sequência de exão do FLAP de modo a interromper a sequência que codifica uma proteína FLAP. Estes vectores de substituição são descritos, por exemplo, por Thomas et al. (1986; 1987), Mansour et al. (1988) e Koller et al. (1992). A primeira e segunda sequências de nucleótidos (a) e (c) podem estar indiferentemente localizadas numa sequência reguladora do FLAP, numa sequência intrónica, numa sequência de exão ou numa sequência contendo sequências reguladoras e/ou intrónicas e/ou de exão. O tamanho das sequências de nucleótidos (a) e (c) varia desde 1 até 50 kb, preferivelmente desde 1 até 10 kb, mais preferivelmente desde 2 até 6 kb e ainda mais preferivelmente desde 2 até 4 kb.
Construções de DNA que Permitem Recombinação Homóloga: Sistema Cre-LoxP
Estas novas construções de DNA utilizam o sistema de recombinação específico para sítios do fago PI. O fago PI possui uma recombinase denominada Cre que interage especificamente com um sítio loxP de 34 pares de bases. O 40 sítio loxP é composto por duas sequências palindrómicas de 13 pares de bases separadas por uma sequência conservada de 8 pares de bases (Hoess et al., 1986). A recombinação pela enzima Cre entre dois sítios loxP com uma orientação idêntica conduz à deleção do fragmento de DNA. O sistema Cre-IoxP utilizado em conjunção com uma técnica de recombinação homóloga foi primeiramente descrito por Gu et al. (1993, 1994) . Em resumo, uma sequência de nucleótidos de interesse a ser inserida numa localização alvo do genoma alberga pelo menos dois sítios loxP com a mesma orientação e localizados nas extremidades respectivas de uma sequência de nucleótidos a ser excisada do genoma recombinante. O acontecimento de excisão requer a presença da enzima recombinase (Cre) no núcleo da célula hospedeiro recombinante. A enzima recombinase pode ser trazida na altura desejada (a) quer incubando as células-hospedeiro recombinantes num meio de cultura contendo esta enzima, injectando a enzima Cre directamente na célula desejada, como descrito por Araki et al. (1995), ou por lipofecção da enzima nas células, como descrito por Baubonis et al. (1993); (b) transfectando a célula hospedeiro com um vector compreendendo a sequência codificadora de Cre operativamente ligada a um promotor funcional na célula hospedeiro recombinante, cujo promotor é opcionalmente indutível, cujo vector é introduzido na célula hospedeiro recombinante, como descrito por Gu et al. (1993) e Sauer et al. (1988); (c) introduzindo no genoma da célula hospedeiro um polinucleótido compreendendo a sequência codificadora de Cre operativamente ligado a um promotor funcional na célula hospedeiro recombinante, cujo promotor é opcionalmente indutível e cujo polinucleótido é inserido no genoma da célula hospedeiro quer por um acontecimento de inserção 41 aleatória quer por um acontecimento de recombinação homóloga, como descrito por Gu et al. (1994).
Numa forma de realização especifica, o vector contendo a sequência a ser inserida no gene FLAP por recombinação homóloga é construído de modo que marcadores seleccionáveis são flanqueados por sítios loxP com a mesma orientação, é possível, por tratamento com a enzima Cre, eliminar os marcadores seleccionáveis deixando as sequências FLAP de interesse que foram inseridas por um acontecimento de recombinação homóloga. Mais uma vez são necessários dois marcadores seleccionáveis: um marcador de selecção positiva para seleccionar o acontecimento recombinante e um marcador de selecção negativa para seleccionar o acontecimento de recombinação homóloga. Vectores e métodos que utilizam o sistema Cre-loxP são descritos por Zou et al. (1994).
Assim, é descrita uma terceira construção de DNA que compreende, da extremidade 5' para a extremidade 3': (a) uma primeira sequência de nucleótidos que está compreendida na sequência genómica do FLAP; (b) uma sequência de nucleótidos compreendendo um polinucleótido que codifica um marcador de selecção positiva, cuja sequência de nucleótidos compreende adicionalmente duas sequências que definem um sítio reconhecido por uma recombinase, como um sítio loxP, em que os dois sítios estão colocados na mesma orientação, e (c) uma segunda sequência de nucleótidos que está compreendida na sequência genómica do FLAP e que está localizada no genoma a jusante da primeira sequência de nucleótidos do FLAP (a).
As sequências que definem um sítio reconhecido por uma recombinase, como um sítio loxP, estão preferivelmente localizadas na sequência de nucleótidos (b) em localizações adequadas que fazem fronteira com a sequência de nucleótidos para a qual se procura a excisão condicional. 42
Numa forma de realização específica, dois sítios loxP estão localizados de cada lado da sequência do marcador de selecção positiva, de modo a permitir a sua excisão numa altura desejada após a ocorrência do acontecimento de recombinação homóloga.
Numa especificação preferida de um método que utiliza a terceira construção de DNA descrita acima, a excisão do fragmento polinucleotídico que faz fronteira com os dois sítios reconhecidos por uma recombinase, preferivelmente dois sítios loxP, é feita numa altura desejada devido à presença, no genoma da célula hospedeiro recombinante, de uma sequência que codifica a enzima Cre operativamente ligada a uma sequência promotora, preferivelmente um promotor indutível, mais preferivelmente uma sequência promotora específica para tecidos e ainda mais preferivelmente uma sequência promotora que é indutível e específica para tecidos, como descrito por Gu et al. (1994). A presença da enzima Cre no genoma da célula hospedeiro recombinante pode resultar do cruzamento de dois animais transgénicos, em que o primeiro animal transgénico tem a sequência de interesse derivada do FLAP contendo os sítios loxP como descrito acima e o segundo animal transgénico tem a sequência codificadora de Cre operativamente ligada a uma sequência promotora adequada, como descrito por Gu et al. (1994).
Também pode obter-se controlo no espaço e no tempo da expressão da enzima Cre com um vector à base de adenovírus que contém o gene Cre, permitindo assim a infecção de células, ou infecção in vivo de órgãos, para a distribuição da enzima Cre, como descrito por Anton e Graham (1995) e Kanegae et al. (1995). 43
As construções de DNA descritas acima podem ser utilizadas para introduzir uma sequência de nucleótidos desejada da invenção, preferivelmente uma sequência genómica do FLAP ou uma sequência de cDNA do FLAP, e ainda mais preferivelmente uma cópia alterada de uma sequência genómica ou de cDNA do FLAP, numa localização pré-determinada do genoma alvo, conduzindo à geração de uma cópia alterada de um gene alvo (recombinação homóloga "knock-out") ou à substituição de uma cópia do gene alvo por outra cópia suficientemente homóloga para permitir a ocorrência de um acontecimento de recombinação homóloga (recombinação homóloga "knock-in"). Numa forma de realização especifica, as construções de DNA descritas acima podem ser utilizadas para introduzir uma sequência genómica do FLAP ou uma sequência de cDNA do FLAP compreendendo pelo menos um marcador bialélico descrito na invenção, preferivelmente pelo menos um marcador bialélico seleccionado do grupo que consiste em AI até A28 e respectivos complementos.
Construções de DNA Anti-Ssntido Nuclear São descritas outras composições contendo um vector compreendendo um fragmento oligonucleotidico da sequência nucleica ID SEQ N° 2 compreendendo um marcador bialélico, preferivelmente um fragmento incluindo o codão de inicio do gene FLAP, como ferramenta anti-sentido que inibe a expressão do gene FLAP correspondente. Métodos preferidos utilizando polinucleótidos anti-sentido são os procedimentos descritos por Sczakiel et al. (1995) ou os descritos na Candidatura PCT N° WO 95/24223.
Preferivelmente, as ferramentas anti-sentido são escolhidas entre os polinucleótidos (15-200 pares de bases de comprimento) que são complementares à extremidade 5' do 44 mRNA do FLAP. Numa especificação, utiliza-se uma combinação de diferentes polinucleótidos anti-sentido complementares a diferentes partes do gene alvo desejado.
Polinucleótidos anti-sentido preferidos são complementares a uma sequência dos mRNAs do FLAP que contém o codão de iniciação da tradução ATG ou um sítio de processamento. Outros polinucleótidos anti-sentido preferidos são complementares ao sitio de processamento do mRNA do FLAP.
Preferivelmente, as sequências anti-sentido têm um sinal de poliadenilação 3' que foi substituído por uma sequência de ribozima de auto-clivagem, de modo que são produzidos transcritos de RNA polimerase II sem poli(A) nas suas extremidades 3', em que estes polinucleótidos anti-sentido são incapazes de serem exportados do núcleo, como descrito por Liu et al. (1994). Numa especificação preferida, estes polinucleótidos anti-sentido do FLAP também compreendem, na cassete de ribozima, uma estrutura de histona "stem-loop", para estabilizar transcritos clivados contra a degradação exonucleolítica 3'-5', tal como a estrutura descrita por Eckner et al. (1991).
V. Marcadores Bialélicos do Gene FLAP A invenção também descreve marcadores bialélicos relacionados com o FLAP, preferivelmente um marcador bialélico associado a uma doença envolvendo a via dos leucotrienos, muito preferivelmente asma. 0 termo marcador bialélico relacionado com o FLAP inclui os marcadores bialélicos designados Al até A28. A invenção também descreve conjuntos destes marcadores bialélicos.
Identificaram-se 28 marcadores bialélicos na sequência genómica do FLAP. Estes marcadores bialélicos são revelados na Tabela 2 do Exemplo 3. A sua localização na sequência 45 genómica e cDNA do FLAP está indicada na Tabela 2 e também na forma de um polimorfismo de uma única base nas caracteristicas da ID SEQ N° 1. A Tabela 2 também revela a posição na ID SEQ N° 1 de polinucleótidos com 47 nucleótidos de comprimento, designados PI até P28, que compreendem um marcador bialélico do gene FLAP e definem esse marcador bialélico. Os pares de "primers" que permitem a amplificação de um ácido nucleico contendo a base polimórfica de um marcador bialélico do FLAP estão listados na Tabela 1 do Exemplo 2. Três marcadores bialélicos, nomeadamente A13, A20 e A21, estão localizados em regiões exónicas. Dois deles não modificam a sequência de aminoácidos da proteína FLAP. No entanto, o marcador bialélico A20 altera uma valina por uma isoleucina na proteína FLAP. A invenção também revela uma sequência de nucleótidos purificada e/ou isolada compreendendo uma base polimórfica de um marcador bialélico localizado na sequência do gene FLAP, preferivelmente de um marcador bialélico seleccionado do grupo que consiste em AI até A28 e respectivos complementos. A invenção também revela uma sequência de nucleótidos definindo um marcador bialélico que inclui a base polimórfica de um dos polinucleótidos Pl até P13, P15 e P17 até P28, ou respectivos complementos. VI. Sondas e "Primers" Oligonucleotídicos
Os polinucleótidos derivados do gene FLAP são descritos como sendo úteis para detectar a presença de pelo menos uma cópia de uma sequência de nucleótidos da ID SEQ N° 1 ou 2, ou respectivo fragmento ou variante, numa amostra de teste.
Sondas e "primers" particularmente preferidos compreendem uma extensão contígua de pelo menos 12, 15, 18, 46 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100, 150, 200, 500 ou 1000 nucleótidos da ID SEQ N° 1 ou respectiva sequência complementar, cuja extensão contígua compreende pelo menos 1, 2, 3, 5 ou 10 das seguintes posições de nucleótidos da ID SEQ N° 1: 1-7007, 8117-15994, 16550-24058, 24598-27872, 28413-35976 e 36927-43069. Outros ácidos nucleicos preferidos da invenção incluem polinucleótidos isolados, purificados ou recombinantes compreendendo uma extensão contígua de pelo menos 12, 15, 18, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100, 150, 200, 500 ou 1000 nucleótidos da ID SEQ N° 1 ou respectiva sequência complementar, cuja extensão contígua compreende um C na posição 16348 da ID SEQ N° 1. Outros ácidos nucleicos preferidos da invenção incluem polinucleótidos isolados, purificados ou recombinantes compreendendo uma extensão contígua de pelo menos 26, 30, 35, 40, 50, 60, 70, 80, 90, 100, 150, 200, 500 ou 1000 nucleótidos da ID SEQ N° 1 ou respectiva sequência complementar, cuja extensão contígua compreende as seguintes posições de nucleótidos da ID SEQ N° 1: 7612-7637, 24060-24061, 24067-24068, 27903-27905 e 28327-28329.
Sondas e "primers" preferidos adicionais compreendem uma extensão contígua de pelo menos 12, 15, 18, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100 , 150, 200 , 500 ou 1000 nucleótidos da ID SEQ N° 1 ou respectiva sequência complementar, cuja extensão contígua compreende um nucleótido seleccionado do grupo que consiste num A na posição 7445, um A na posição 7870, um T na posição 16288, um A na posição 16383, um T na posição 24361, um G na posição 28336, um T na posição 28368, um A na posição 36183 e um G na posição 36509 da ID SEQ N° 1.
Assim, a invenção também revela sondas ou "primers" de ácidos nucleicos que hibridizam especificamente, nas condições de hibridização restrita definidas acima, com um 47 ácido nucleico seleccionado do grupo que consiste nas sequências de nucleótidos 1-7007, 8117-15994, 16550-24058, 24598-27872, 28413-35976 e 36927-43069 da ID SEQ N° 1 ou respectiva variante ou sequência complementar àquela.
Sondas e "primers" particularmente preferidos compreendem uma extensão contígua de pelo menos 12, 15, 18, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100, 150, 200, 500 ou 1000 nucleótidos da ID SEQ N° 2 ou respectiva sequência complementar, cuja expansão contígua compreende um T na posição 197 (A13), um A na posição 453 (A20) ou um G na posição 779 (A21) da ID SEQ N° 2. A presente invenção também descreve oligonucleótidos e grupos de oligonucleótidos para a detecção de alelos associados a um metabolismo modificado dos leucotrienos, preferivelmente alelos associados a um polimorfismo do gene FLAP, e mais preferivelmente alelos de um gene FLAP associado a uma doença envolvendo a via dos leucotrienos, por exemplo, asma. Estes oligonucleótidos podem hibridizar com um gene FLAP, preferivelmente com um gene FLAP polimórfico e mais preferivelmente com uma região de um gene FLAP compreendendo o sítio polimórfico cujos alelos específicos estão associados a uma doença envolvendo a via dos leucotrienos, como asma. Os oligonucleótidos são úteis como "primers" para utilização em vários processos, como amplificação e microssequenciação de DNA, ou como sondas para o reconhecimento de DNA em análises de hibridização. Em algumas especificações, os oligonucleótidos contêm a base polimórfica de uma sequência seleccionada do grupo que consiste em PI até P28 e respectiva sequência complementar. Noutras especificações, os oligonucleótidos têm um terminal 3' imediatamente adjacente a uma base polimórfica no gene FLAP, tal como uma base polimórfica em um dos PI até P28 e respectiva sequência complementar. Noutras especificações, 48 0 oligonucleótido é capaz de distinguir entre diferentes alelos de um marcador bialélico no gene FLAP, cujo marcador bialélico é seleccionado do grupo que consiste em AI até A28 e respectivos complementos. Por exemplo, o oligonucleótido pode ser capaz de hibridizar especificamente para um alelo de um marcador bialélico, incluindo um dos marcadores bialélicos AI até A28 e respectivos complementos. Noutra especificação, os oligonucleótidos compreendem uma das sequências BI até B17, Cl até Cl 7, Dl até D28, EI até E28 e PI até P28, e respectiva sequência complementar. A invenção revela polinucleótidos isolados, purificados e recombinantes consistindo, ou consistindo essencialmente numa extensão contígua de 8 até 50 nucleótidos da ID SEQ N° 1 ou 2 e respectivo complemento, cuja extensão inclui nessa sequência um marcador bialélico relacionado com o FLAP; opcionalmente, em que esse marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste em AI até A28 e respectivos complementos; opcionalmente, em que essa extensão contígua tem 18 até 47 nucleótidos de comprimento e esse marcador bialélico está a 6, 5, 4, 3, 2 ou 1 nucleótidos do centro do polinucleótido; opcionalmente, em que esse polinucleótido consiste na referida extensão contígua e essa extensão contígua tem 25 nucleótidos de comprimento e esse marcador bialélico está no centro desse polinucleótido; opcionalmente, em que a extremidade 3' dessa extensão contígua está presente na extremidade 3' desse polinucleótido, e, opcionalmente, em que a extremidade 3' dessa extensão contígua está localizada na extremidade 3' desse polinucleótido e esse marcador bialélico está presente na extremidade 3' desse polinucleótido. 49
Noutra especificação, a invenção revela polinucleótidos isolados, purificados e recombinantes consistindo, ou consistindo essencialmente numa extensão contígua de 8 até 50 nucleótidos da ID SEQ N° 1 ou 2 ou respectivo complemento, em que a extremidade 3' dessa extensão contígua está localizada na extremidade 3' desse polinucleótido. Numa especificação, a extremidade 3' desse polinucleótido está localizada num marcador bialélico do FLAP nessa sequência ou pelo menos a 2, 4, 6, 8, 10, 12, 15, 18, 20, 25, 50, 100, 250, 500 ou 1000 nucleótidos a montante de um marcador bialélico do FLAP nessa sequência, ou em qualquer outra localização que seja apropriada para a sua utilização pretendida na sequenciação, amplificação ou na localização de novas sequências ou marcadores. Numa especificação particular, a extremidade 3' desse polinucleótido está localizada até 20 nucleótidos a montante de um marcador bialélico relacionado com o FLAP nessa sequência; opcionalmente, em que esse marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, em que a extremidade 3' desse polinucleótido está localizada 1 nucleótido a montante desse marcador bialélico relacionado com o FLAP nessa sequência, e, opcionalmente, em que esse polinucleótido consiste essencialmente numa sequência seleccionada entre as sequências seguintes: Dl até D28 e EI até E28. Numa especificação suplementar são descritos polinucleótidos isolados, purificados ou recombinantes consistindo, ou consistindo essencialmente numa sequência seleccionada entre as sequências seguintes: BI até B17 e Cl até Cl7. A estes "primers" pode adicionar-se, em qualquer uma das suas extremidades, outro polinucleótido útil para 50 sequenciação. Preferivelmente, "primers" PU contêm a sequência PU 5' adicional da ID SEQ N° 14 e "primers" RP contêm a sequência RP 5' da ID SEQ N° 15.
Numa especificação adicional, a invenção abrange polinucleótidos compreendendo uma extensão contigua de pelo menos 12 nucleótidos da ID SEQ N° 1, respectivas sequências complementares ou marcadores bialélicos em desequilíbrio de ligação com aqueles, para utilização particularmente em ensaios de hibridização, ensaios de sequenciação, ensaios de microssequenciação e ensaios de amplificação específica, para determinar a identidade do nucleótido num marcador bialélico relacionado com o FLAP, cujo marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste nos marcadores bialélicos nas posições 3950, 4243, 4312, 4490, 4670, 4687, 4968, 5140, 5213, 5364, 5594, 6370, 6693, 6763, 7445, 7870, 16288, 16347, 16383, 16440, 24361, 28336, 28368, 36183, 36509, 38681, 42440 e 42445 da ID SEQ N° 1. Um polinucleótido preferido pode ser utilizado num ensaio de hibridização para determinar a identidade do nucleótido num marcador bialélico do gene FLAP. Outro polinucleótido preferido pode ser utilizado num ensaio de sequenciação ou microssequenciação para determinar a identidade do nucleótido num marcador bialélico do gene FLAP. Um terceiro polinucleótido preferido pode ser utilizado num ensaio de detecção de emparelhamentos defeituosos à base de enzima para determinar a identidade do nucleótido num marcador bialélico do gene FLAP. Um quarto polinucleótido preferido pode ser utilizado na amplificação de um segmento de polinucleótidos compreendendo um marcador bialélico do gene FLAP. Opcionalmente, essa amplificação pode ser efectuada por PCR ou LCR. Opcionalmente, esse polinucleótido pode estar ligado a um suporte sólido, série ou série 51 endereçável. Opcionalmente, esse polinucleótido pode estar etiquetado. "Primers" e sondas são sintetizados para serem "substancialmente" complementares a um filamento do gene FLAP a ser amplificado. Não é necessário que a sequência do "primer" reflicta a sequência exacta do modelo de DNA. Podem ser acomodados emparelhamentos defeituosos muito pequenos diminuindo a restrição das condições de hibridização. Entre os vários métodos disponíveis para conceber "primers" úteis, o "software" computacional OSP pode ser utilizado pelo experimentado (ver Hillier & Green, 1991) . A formação de híbridos estáveis depende da temperatura de fusão (Tf) do DNA. A Tf depende do comprimento do "primer" ou sonda, da força iónica da solução e do teor G+C. Quanto maior for o teor G+C do "primer" ou sonda, maior é a temperatura de fusão, uma vez que os pares G:C são mantidos por três ligações de H, ao passo que os pares A:T têm apenas duas. 0 teor GC dos "primers" e sondas da invenção varia habitualmente entre 10 e 75%, preferivelmente entre 35 e 60% e mais preferivelmente entre 40 e 55%.
Preferivelmente, o comprimento do "primer" e sonda pode variar desde 10 até 100 nucleótidos, preferivelmente desde 10 até 50, 10 até 30 ou mais preferivelmente 10 até 25 nucleótidos. Aos "primers" e sondas mais curtos tende a faltar especificidade para uma sequência-alvo de ácido nucleico e geralmente requerem temperaturas inferiores para formarem complexos híbridos suficientemente estáveis com o modelo. "Primers" e sondas mais longos têm produção dispendiosa e por vezes auto-hibridizam, formando estruturas em grampo. O comprimento apropriado de "primers" e sondas num conjunto particular de condições de ensaio 52 pode ser determinado empiricamente pelo experimentado na área.
As sondas são úteis para algumas finalidades. Podem ser utilizadas em hibridização "Southern" para DNA genómico ou hibridização "Northern" para mRNA. As sondas também podem ser utilizadas para detectar produtos de amplificação de PCR. Também podem ser utilizadas para detectar emparelhamentos defeituosos no gene ou mRNA do FLAP utilizando outras técnicas. Em geral, as sondas são complementares às seguências codificadoras do gene FLAP, apesar de também serem contempladas sondas para intrões e sequências reguladoras. "Primers" e sondas podem ser preparados por qualquer método adequado, incluindo, por exemplo, clonagem e restrição de sequências apropriadas e síntese química directa por um método tal como o método fosfodiéster de Narang et al. (1979), o método fosfodiéster de Brown et al. (1979), o método de dietilfosforamidite de Beaucage et al. (1981) e o método de suporte sólido descrito em EP 0 707 592 .
As sondas de detecção são geralmente sequências de ácidos nucleicos ou análogos de ácidos nucleicos sem carga, tais como, por exemplo, ácidos nucleicos de péptidos que são revelados na Candidatura de Patente Internacional WO 92/20702; análogos morfolino que são descritos nas Patentes U.S. Numeradas 5 185 444, 5 034 506 e 5 142 047, e afins. Dependendo do tipo de etiqueta contida na sonda, a sonda é empregue para capturar ou detectar o produto de amplificação gerado pela reacção de amplificação. A sonda não está envolvida na amplificação da sequência alvo e, em consequência, pode ser necessário torná-la "não extensível" no sentido em que dNTPs adicionais não possam ser adicionados à sonda. Análogos daquelas, por si próprios, 53 habitualmente são não extensíveis, e sondas de ácidos nucleicos podem ser tornadas não extensíveis modificando a extremidade 3' da sonda de modo que o grupo hidroxilo deixe de ser capaz de participar no alongamento. Por exemplo, a extremidade 3' da sonda pode ser funcionalizada com a etiqueta de captura ou detecção para assim consumir, ou bloquear de qualquer outra forma, o grupo hidroxilo. Alternativamente, o grupo 3' hidroxilo pode ser simplesmente clivado, substituído ou modificado. A Candidatura de Patente U.S. N° de Série 07/049 061, registada em 29 de Abril de 1993, descreve modificações que podem ser utilizadas para tornar uma sonda não extensível.
As sondas são preferivelmente etiquetadas directamente, tal como com isótopos, moléculas repórter ou etiquetas fluorescentes, ou etiquetadas indirectamente, tal como com biotina, à qual se pode ligar mais tarde um complexo de estreptavidina. Técnicas de etiquetagem de sondas são bem conhecidas do técnico experimentado. Ao avaliar a presença da sonda, pode detectar-se a presença ou ausência da sequência de DNA alvo numa dada amostra. As mesmas etiquetas podem ser utilizadas com "primers". Por exemplo, etiquetas úteis incluem substâncias radioactivas (32P, 35S, 3H, 1251), corantes fluorescentes (5-bromodesoxiuridina, fluoresceína, acetilaminofluoreno, digoxigenina). Preferivelmente, os polinucleótidos são etiquetados nas suas extremidades 3' e 5'. Exemplos de etiquetagem não radioactiva de fragmentos de ácidos nucleicos são descritos na patente francesa N° FR-7810975 ou por Urdea et al. (1988) ou Sanchez-Pescador et al. (1988). Adicionalmente, as sondas de acordo com a presente invenção podem ter características estruturais que permitam a amplificação do sinal, em que essas características estruturais são, por exemplo, sondas de DNA ramificado, como as descritas por 54
Urdea et al. em 1991 ou na patente europeia N° EP 0 225 807 (Chiron) .
Qualquer um dos "primers" e sondas pode ser convenientemente imobilizado num suporte sólido. Suportes sólidos são conhecidos dos experimentados na área e incluem as paredes de cavidades de um tabuleiro reaccional, tubos de teste, esférulas de poliestireno, esférulas magnéticas, tiras de nitrocelulose, membranas, microparticulas, como partículas de látex, glóbulos vermelhos de ovelha (ou outro animal), eritrócitos Duracyte e outros. A "fase sólida" não é crítica e pode ser seleccionada pelo experimentado na área. Assim, todos entre partículas de látex, microparticulas, esférulas magnéticas ou não magnéticas, membranas, tubos de plástico, paredes de cavidades de microtítulo, placas de vidro ou silício, glóbulos vermelhos de ovelha (ou de outro animal adequado) e eritrócitos Duracyte são exemplos adequados. Métodos adequados para imobilizar ácidos nucleicos em fases sólidas incluem interacções iónicas, hidrófobas, covalentes e afins. Uma "fase sólida", tal como é aqui utilizado, refere-se a qualquer material que é insolúvel, ou que pode ser tornado insolúvel por uma reacção subsequente. A fase sólida pode ser escolhida pela sua capacidade intrínseca para atrair e imobilizar o reagente de captura.
Alternativamente, a fase sólida pode reter um receptor adicional com a capacidade para atrair e imobilizar o reagente de captura. 0 receptor adicional pode incluir uma substância carregada que tem carga oposta relativamente ao próprio reagente de captura ou a uma substância carregada conjugada ao reagente de captura.
Ainda como outra alternativa, a molécula receptora pode ser qualquer membro de ligação específica que está 55 imobilizado (fixado) na fase sólida e que tem a capacidade para imobilizar o reagente de captura por uma reacção de ligação específica. A molécula receptora permite a ligação indirecta do reagente de captura a um material em fase sólida antes da realização do ensaio ou durante a realização do ensaio. Assim, a fase sólida pode ser um plástico, plástico derivatizado, metal magnético ou não magnético, superfície de vidro ou de silício de um tubo de teste, cavidade de microtítulo, folha, esférula, micropartícula, placa, glóbulos vermelhos de ovelha (ou de outro animal adequado), eritrócitos Duracyte e outras configurações conhecidas dos habitualmente experimentados na área.
Os polinucleótidos da invenção podem estar fixados ou imobilizados num suporte sólido individualmente ou em grupos de pelo menos 2, 5, 8, 10, 12, 15, 20 ou 25 polinucleótidos distintos da invenção num único suporte sólido. Adicionalmente, polinucleótidos diferentes dos da invenção podem estar fixados no mesmo suporte sólido de um ou mais polinucleótidos da invenção.
A invenção também descreve um método para detectar a presença de um ácido nucleico compreendendo uma sequência de nucleótidos seleccionada de um grupo que consiste nas ID SEQ N°s 1 e 2, respectivo fragmento ou variante ou sequência complementar àquela numa amostra, cujo método compreende os passos seguintes: a) fazer entrar em contacto uma sonda de ácido nucleico ou uma pluralidade de sondas de ácidos nucleicos que pode hibridizar com uma sequência de nucleótidos incluída num ácido nucleico seleccionado do grupo que consiste nas sequências de nucleótidos das ID SEQ N°s 1 e 2, respectivo 56 fragmento ou variante ou sequência complementar àquela, e a amostra a ser avaliada. b) detectar o complexo hibrido formado entre a sonda e um ácido nucleico presente na amostra. A invenção descreve suplementarmente um estojo para detectar a presença de um ácido nucleico compreendendo uma sequência de nucleótidos seleccionada de um grupo que consiste nas ID SEQ N°s 1 e 2, respectivo fragmento ou variante ou sequência complementar àquela numa amostra, cujo estojo compreende: a) uma sonda de ácido nucleico ou uma pluralidade de sondas de ácidos nucleicos que pode hibridizar com uma sequência de nucleótidos incluída num ácido nucleico seleccionado do grupo que consiste nas sequências de nucleótidos das ID SEQ N°s 1 e 2, respectivo fragmento ou variante ou sequência complementar àquela; b) opcionalmente, os reagentes necessários para efectuar a reacção de hibridização.
Numa primeira especificação preferida do método e estojo de detecção, a sonda de ácido nucleico ou a pluralidade de sondas de ácidos nucleicos é etiquetada com uma molécula detectável. Numa segunda especificação preferida do método e estojo de detecção, a sonda de ácido nucleico ou a pluralidade de sondas de ácidos nucleicos foi imobilizada num substrato. Numa terceira especificação preferida do método e estojo de detecção, a sonda de ácido nucleico ou a pluralidade de sondas de ácidos nucleicos compreende quer uma sequência seleccionada do grupo que consiste nas sequências de nucleótidos: BI até B17, Cl até C17, Dl até D28, EI até E28, PI até P28, quer um marcador bialélico seleccionado do grupo que consiste em AI até A28 57 ou respectivos complementos ou os marcadores bialélicos em desequilíbrio de ligação com aquele. Séries de Oligonucleótidos
Um substrato compreendendo uma pluralidade de "primers" ou sondas oligonucleotídicos pode ser utilizado para detectar ou amplificar sequências-alvo no gene FLAP e também pode ser utilizado para detectar mutações nas sequências codificadoras ou não codificadoras do gene FLAP.
Qualquer polinucleótido fornecido aqui pode ser fixado em áreas com sobreposição ou em localizações aleatórias do suporte sólido. Alternativamente, os polinucleótidos da invenção podem ser fixados numa série ordenada, em que cada polinucleótido é fixado numa região distinta do suporte sólido que não se sobrepõe ao sítio de fixação de qualquer outro polinucleótido. Preferivelmente, essa série ordenada de polinucleótidos é designada "endereçável" quando as localizações distintas são registadas e podem ser acedidas como parte de um procedimento de ensaio. Séries de polinucleótidos endereçáveis compreendem tipicamente uma pluralidade de diferentes sondas oligonucleotídicas que são acopladas a uma superfície de um substrato em diferentes localizações conhecidas. 0 conhecimento da localização precisa de cada localização dos polinucleótidos torna estas séries "endereçáveis" particularmente úteis em ensaios de hibridização. Com os polinucleótidos da invenção pode empregar-se qualquer tecnologia de séries endereçáveis conhecida na área. Uma especificação particular destas séries de polinucleótidos é conhecida como Genechips™ e foi genericamente descrita na Patente US 5 143 854, publicações PCT WO 90/15070 e 92/10092. Estas séries podem ser geralmente produzidas utilizando métodos de síntese mecânica ou métodos de síntese com luz dirigida, que 58 incorporam uma combinação de métodos fotolitográficos e síntese de oligonucleótidos em fase sólida (Fodor et al., 1991). A imobilização de séries de oligonucleótidos em suportes sólidos foi possibilitada pelo desenvolvimento de uma tecnologia geralmente identificada como "Síntese de Polímeros Imobilizados em Muito Larga Escala" ("Very Large Scale Immobilized Polymer Synthesis") (VLSIPS™) na qual, tipicamente, sondas são imobilizadas numa série de alta densidade numa superfície sólida de uma placa. Exemplos de tecnologias VLSIPS™ são fornecidos nas patentes US 5 143 854 e 5 412 087 e nas Publicações PCT WO 90/15070, WO 92/10092 e WO 95/11995, que descrevem métodos para formar séries de oligonucleótidos por técnicas tais como técnicas de síntese com luz dirigida. Na concepção de estratégias destinadas a fornecer séries de nucleótidos imobilizados em suportes sólidos, desenvolveram-se estratégias de apresentação suplementares para ordenar e exibir as séries de oligonucleótidos nas placas, numa tentativa para maximizar padrões de hibridização e informações de sequências. Exemplos dessas estratégias de apresentação são revelados nas Publicações PCT WO 94/12305, WO 94/11530, WO 97/29212 e WO 97/31256.
Noutra especificação das séries de oligonucleótidos, uma matriz de sondas oligonucleotídicas pode ser vantajosamente utilizada para detectar mutações que ocorrem no gene FLAP. Para esta finalidade particular, as sondas são especificamente concebidas para terem uma sequência de nucleótidos que permite a sua hibridização para os genes com mutações conhecidas (quer por deleção, inserção ou substituição de um ou vários nucleótidos). Por mutações conhecidas pretende-se significar mutações no gene FLAP que foram identificadas, por exemplo, de acordo com a técnica utilizada por Huang et al. (1996) ou Samson et al. (1996) . 59
Outra técnica utilizada para detectar mutações no gene FLAP é a utilização de uma série de DNA de alta densidade. Cada sonda oligonucleotidica que constitui um elemento unitário da série de DNA de alta densidade é concebida de modo a corresponder a uma subsequência especifica do DNA genómico ou cDNA do FLAP. Assim, uma série que consiste em oligonucleótidos complementares a subsequências da sequência genética alvo é utilizada para determinar a identidade da sequência alvo com a sequência genética selvagem, medir a sua quantidade e detectar diferenças entre a sequência alvo e a sequência genética selvagem de referência do gene FLAP. Nessa concepção, denominada série de mosaicos 4L, é implementado um conjunto de quatro sondas (A, C, G, T), preferivelmente oligómeros de 15 nucleótidos. Em cada conjunto de quatro sondas, o complemento perfeito irá hibridizar mais fortemente do que sondas com emparelhamentos defeituosos. Consequentemente, um ácido nucleico alvo de comprimento L é submetido a varrimento quanto a mutações com uma série de mosaicos contendo 4L sondas, em que a totalidade do conjunto de sondas contém todas as mutações possíveis da sequência de referência selvagem conhecida. Os sinais de hibridização da série de mosaicos do conjunto de sondas de 15-meros são perturbados por uma alteração de uma única base na sequência alvo. Em consequência, há uma perda caracteristica de sinal ou uma "pegada" para as sondas que flanqueiam uma posição de mutação. Esta técnica foi descrita por Chee et al. em 1996. A invenção descreve uma série de moléculas de ácido nucleico compreendendo pelo menos um polinucleótido descrito acima como sondas e "primers". Preferivelmente, descreve-se uma série de ácido nucleico compreendendo pelo menos dois polinucleótidos descritos acima como sondas e "primers". 60
Também é descrito um objectivo suplementar que consiste numa série de sequências de ácido nucleico compreendendo pelo menos uma das sequências seleccionadas do grupo que consiste em PI até P28, BI até B17, Cl até C17, Dl até D28 e EI até E28 ou as sequências complementares a estas ou respectivo fragmento de pelo menos 8, 10, 12, 15, 18, 20, 25, 30 ou 40 nucleótidos consecutivos, ou pelo menos uma sequência compreendendo um marcador bialélico seleccionado do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. VII. Identificação de Marcadores Bialélicos Há dois métodos preferidos para gerar os marcadores bialélicos descritos na presente invenção. Num primeiro método, amostras de DNA de indivíduos não relacionados são reunidas, após o que o DNA genómico de interesse é amplificado e sequenciado. As sequências de nucleótidos obtidas desse modo são seguidamente analisadas, para identificar polimorfismos significativos.
Uma das grandes vantagens deste método reside no facto da reunião das amostras de DNA reduzir substancialmente o número de reacções de amplificação e reacções de sequenciação de DNA que devem ser efectuadas. Além disso, este método é suficientemente sensível para que um marcador bialélico por ele obtido exiba habitualmente um grau suficiente de informação para conduzir estudos de associação.
Num segundo método para gerar marcadores bialélicos, as amostras de DNA não são reunidas e, em consequência, são amplificadas e sequenciadas individualmente. Seguidamente, as sequências de nucleótidos resultantes obtidas são também analisadas, para identificar polimorfismos significativos. 61
Será facilmente apreciado que, quando se utiliza este segundo método, deve ser conduzido um número substancialmente maior de reacções de amplificação e reacções de sequenciação de DNA. Além disso, um marcador bialélico obtido utilizando este método pode exibir um grau inferior de informação para se conduzirem estudos de associação, por exemplo, se a frequência do seu alelo menos frequente puder ser inferior a cerca de 10%. Será suplementarmente apreciado que incluir esses marcadores bialélicos menos informativos em estudos de associação para identificar associações genéticas potenciais com uma caracteristica poderá permitir, nalguns casos, a identificação directa de mutações causais, que podem, dependendo da sua penetração, ser mutações raras. Este método é habitualmente preferido quando é necessário identificar marcadores bialélicos para efectuar estudos de associação em genes candidatos. O seguinte é uma descrição dos vários parâmetros de um método preferido utilizado pelos inventores para gerar os marcadores da presente invenção.
1. Extracção de DNA
As amostras de DNA genómico a partir das quais são gerados os marcadores bialélicos são preferivelmente obtidas de indivíduos não relacionados correspondentes a uma população heterogénea de contexto étnico conhecido. O número de indivíduos de onde se obtêm amostras de DNA pode variar substancialmente, preferivelmente desde cerca de 10 até cerca de 1000, preferivelmente desde cerca de 50 até cerca de 200 indivíduos. É habitualmente preferido recolher amostras de DNA de pelo menos cerca de 100 indivíduos de modo a ter uma diversidade polimórfica suficiente numa dada população para identificar tantos 62 marcadores quanto possível e para gerar resultados estatisticamente significativos.
Quanto à fonte do DNA genómico a ser sujeito a análise, pode contemplar-se qualquer amostra de teste sem qualquer limitação particular. Estas amostras de teste incluem amostras biológicas que podem ser testadas pelos métodos da presente invenção descritos aqui, e incluem fluidos corporais humanos e animais, como sangue completo, soro, plasma, fluido cerebrospinal, urina, fluidos linfáticos e várias secreções externas dos tractos respiratório, intestinal e genitourinário, lágrimas, saliva, leite, glóbulos brancos, mielomas e afins; fluidos biológicos, tais como sobrenadantes de culturas de células; espécimes de tecidos fixados, incluindo tecido tumoral e não tumoral e tecidos de nodos linfáticos; aspirados da medula óssea e espécimes de células fixados. A fonte preferida de DNA genómico utilizada no contexto da presente invenção é sangue venoso periférico de cada dador.
As técnicas de extracção de DNA são bem conhecidas do técnico experimentado. Fornecem-se no Exemplo 1 pormenores de uma especificação preferida.
Depois de se ter extraído DNA genómico de cada indivíduo da população determinada, é preferido que uma fracção de cada amostra de DNA seja separada, após o que se constitui uma reunião de DNA reunindo quantidades equivalentes das fracções separadas numa única fracção. Todavia, o experimentado na área pode escolher amplificar as sequências reunidas ou as não reunidas.
2. Amplificação de DNA A identificação de marcadores bialélicos numa amostra de DNA genómico pode ser facilitada utilizando métodos de 63 amplificação de DNA. Para o passo de amplificação, as amostras de DNA podem estar reunidas ou não reunidas. Técnicas de amplificação de DNA são bem conhecidas dos experimentados na área. Técnicas de amplificação que podem ser utilizadas no contexto da presente invenção incluem, mas não se limitam à reacção em cadeia de ligase (LCR) , descrita em EP-A-320 308, WO 9320227 e EP-A-439 182, reacção em cadeia de polimerase (PCR, RT-PCR) e técnicas como a amplificação baseada na sequência do ácido nucleico (NASBA) descrita em Guatelli J.C. et al. (1990) e em Compton J. (1991), amplificação Q-beta, como descrita na Candidatura de Patente Europeia N° 4544610, amplificação por deslocamento de filamento, como descrita em Walker et al. (1996) e EP A 684 315, e amplificação mediada pelo alvo, como descrita na Publicação PCT WO 9322461. A LCR e LCR de Hiato são técnicas de amplificação exponencial, dependendo ambas de DNA ligase para reunirem "primers" adjacentes hibridizados para uma molécula de DNA. Na Reacção em Cadeia de Ligase (LCR), utilizam-se pares de sondas que incluem duas sondas primárias (primeira e segunda) e duas secundárias (terceira e quarta), todas as quais são empregues em excesso molar relativamente ao alvo. A primeira sonda hibridiza para um primeiro segmento do filamento alvo e a segunda sonda hibridiza para um segundo segmento do filamento alvo, em que o primeiro e segundo segmentos são contíguos de modo que as sondas primárias confinam entre si numa relação 5' fosfato-3' hidroxilo, e de modo que uma ligase pode covalentemente fundir ou ligar as duas sondas num produto fundido. Adicionalmente, uma terceira sonda (secundária) pode hibridizar para uma porção da primeira sonda e uma quarta sonda (secundária) pode hibridizar para uma porção da segunda sonda de um modo que confina de forma semelhante. Obviamente, se o alvo tiver 64 inicialmente filamentação dupla, as sondas secundárias também irão hibridizar para o complemento alvo em primeiro lugar. Depois do filamento ligado das sondas primárias ser separado do filamento alvo, irá hibridizar com a terceira e quarta sondas, que podem ser ligados para formar um produto ligado complementar e secundário. É importante perceber que os produtos ligados são funcionalmente equivalentes ao alvo ou ao seu complemento. Por ciclos repetidos de hibridização e ligação obtém-se a amplificação da sequência alvo. Também foi descrito um método de LCR multiplex (WO 9320227). A LCR de Hiato (GLCR) é uma versão da LCR em que as sondas não são adjacentes, estando separadas por 2 até 3 bases.
Para a amplificação de mRNAs, pertence ao âmbito da presente invenção transcrever de forma reversa mRNA em cDNA, seguida de reacção em cadeia de polimerase (RT-PCR), ou então utilizar uma única enzima para ambos os passos, como descrito na Patente U.S. N° 5 322 770, ou utilizar LCR de Hiato Assimétrico (RT-AGLCR), como descrito por Marshall et al. (1994) . A AGLCR é uma modificação da GLCR que permite a amplificação de RNA. de PCR são A tecnologia de PCR é a técnica de amplificação preferida utilizada na presente invenção. Uma variedade de técnicas de PCR é familiar aos experimentados na área. Quanto a um artigo de revisão da tecnologia PCR ver White (1997) e a publicação intitulada "PCR Methods and Applications" (1991, Cold Spring Harbor Laboratory Press). Em cada um destes procedimentos de PCR, "primers" de PCR de cada lado das sequências de ácido nucleico a serem amplificadas são adicionados a uma amostra de ácido nucleico preparada adequadamente juntamente com dNTPs e uma polimerase estável termicamente, como Taq polimerase, Pfu polimerase ou Vent polimerase. O ácido nucleico presente na amostra é desnaturado e os "primers 65 especificamente hibridizados para sequências de ácido nucleico complementar presentes na amostra. Os "primers" hibridizados são estendidos. Em seguida inicia-se outro ciclo de desnaturação, hibridização e extensão. Os ciclos são repetidos múltiplas vezes para produzir um fragmento amplificado contendo a sequência de ácido nucleico entre os sítios dos "primers". A PCR foi suplementarmente descrita em várias patentes, incluindo as Patentes US 4 683 195, 4 683 202 e 4 965 188. A tecnologia de PCR é a técnica de amplificação preferida utilizada para identificar novos marcadores bialélicos. Fornece-se no Exemplo 2 um exemplo tipico de uma reacção de PCR adequada para os propósitos da presente invenção. É descrito um método para a amplificação do gene FLAP humano, particularmente da sequência genómica da ID SEQ N° 1 ou da sequência de cDNA da ID SEQ N° 2, ou respectivo fragmento ou variante, presente numa amostra de teste, preferivelmente utilizando a tecnologia de PCR. Este método compreende os passos de fazer com que uma amostra de teste que se suspeita conter a sequência codificadora do FLAP alvo, ou respectiva porção, entre em contacto com reagentes de uma reacção de amplificação compreendendo um par de "primers" de amplificação e eventualmente, nalguns casos, uma sonda de detecção que pode hibridizar com uma região interna de sequências de produtos de amplificação, para confirmar que ocorreu a reacção de amplificação desejada. A presente invenção também revela um método para a amplificação de uma sequência do gene FLAP humano, particularmente de uma porção das sequências genómicas da ID SEQ N° 1 ou da sequência de cDNA da ID SEQ N° 2, ou respectiva variante, numa amostra de teste, cujo método compreende os passos seguintes: 66 a) fazer com que uma amostra de teste que se suspeita conter a sequência do qene FLAP alvo compreendida numa sequência de nucleótidos seleccionada de um grupo que consiste nas ID SEQ N°s 1 e 2, ou respectivos fragmentos ou variantes, entre em contacto com reagentes de uma reacção de amplificação compreendendo um par de "primers" de amplificação como descrito acima e localizados de cada lado da região polinucleotidica a ser amplificada, e b) opcionalmente, detectar os produtos de amplificação. A invenção também descreve um estojo para a amplificação de uma sequência do gene FLAP humano, particularmente de uma porção da sequência genómica da ID SEQ N° 1 ou da sequência de cDNA da ID SEQ N° 2, ou respectiva variante, numa amostra de teste, cujo estojo compreende: a) um par de "primers" oligonucleotidicos localizados de cada lado da região do FLAP a ser amplificada; b) opcionalmente, os reagentes necessários para efectuar a reacção de amplificação.
Numa especificação do método e estojo de amplificação acima, o produto de amplificação é detectado por hibridização com uma sonda etiquetada tendo uma sequência que é complementar à região amplificada. Noutra especificação do método e estojo de amplificação acima, os "primers" compreendem uma sequência que é seleccionada do grupo que consiste nas sequências de nucleótidos de BI até B17, Cl até C17, Dl até D28 e EI até E28. Numa especificação preferida do método e estojo de amplificação acima, o produto de amplificação compreende uma base 67 polimórfica de um marcador bialélico da presente invenção, mais particularmente uma base polimórfica de um marcador bialélico seleccionado do grupo de AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. Os "primers" são mais particularmente caracterizados por terem complementaridade suficiente com qualquer sequência de um filamento da sequência genómica próxima da região a ser amplificada, por exemplo, com uma sequência não codificadora adjacente a exões a amplificar.
Numa primeira especificação, identificam-se marcadores bialélicos utilizando informação da sequência genómica gerada pelos inventores. Utilizam-se fragmentos de DNA genómico sequenciado para conceber "primers" para a amplificação de fragmentos de 500 pares de bases. Estes fragmentos de 500 pares de bases são amplificados a partir de DNA genómico e são rastreados quanto a marcadores bialélicos. Os "primers" podem ser concebidos utilizando o "software" OSP (Hillier L. e Green P., 1991). Todos os "primers" podem conter, a montante das bases alvo específicas, uma cauda oligonucleotídica comum que serve de "primer" de sequenciação. Os experimentados na área estão familiarizados com extensões de "primers" que podem ser utilizadas para estas finalidades. "Primers" preferidos úteis para a amplificação de sequências genómicas que codificam os genes candidatos centram-se em promotores, exões e sítios de processamento dos genes. Um marcador bialélico apresenta uma probabilidade mais elevada de ser uma mutação causal eventual se estiver localizado nestas regiões funcionais do gene. "Primers" de amplificação preferidos da invenção incluem as sequências de nucleótidos BI até B17 e as 68 sequências de nucleótidos Cl até Cl 7 reveladas no Exemplo 2. 3. Sequenciação de DNA qenómico amplificado e identificação de polimorfismos
Os produtos de amplificação gerados como descrito acima com os "primers" são seguidamente sequenciados utilizando métodos conhecidos e disponíveis para o técnico experimentado. Preferivelmente, o DNA amplificado é sujeito a reacções de sequenciação com terminação didesoxi automáticas utilizando um protocolo de sequenciação de ciclos corante-"primer".
Após análise de imagens em gel e extracção da sequência de DNA, os dados da sequência são processados automaticamente com "software" para avaliar a qualidade da sequência.
Os dados da sequência obtidos como descrito acima são sujeitos a controlo de qualidade e passos de validação com base na forma do pico, resolução inter-picos, número de picos não fiáveis numa extensão particular da sequência e nível de ruído. Os dados da sequência considerados não fiáveis são deitados fora.
Após esta primeira análise da qualidade da sequência, detectam-se polimorfismos entre sequências de fragmentos amplificados individuais ou reunidos. A busca de polimorfismos baseia-se na presença de picos sobrepostos no padrão de electroforese. Estes picos, que apresentam duas cores distintas, correspondem a dois nucleótidos diferentes na mesma posição da sequência. Para que os picos sejam considerados significativos, a altura dos picos tem que satisfazer condições de razão entre os picos e condições de razão entre um dado pico e os picos em redor da mesma cor. 69
No entanto, uma vez que a presença de dois picos pode ser um artefacto devido ao ruído de fundo, utilizam-se dois controlos para excluir estes artefactos: os dois filamentos de DNA são sequenciados e comparam-se os picos. 0 polimorfismo tem de ser detectado em ambos os filamentos para ser validado. - comparam-se todos os padrões de electroforese de sequenciação do mesmo produto de amplificação fornecido a partir de reuniões e/ou indivíduos distintos. A homogeneidade e a razão entre a altura de picos homozigóticos e heterozigóticos são controladas através destes DNAs distintos. 0 limite de detecção para a frequência de polimorfismos bialélicos detectados por sequenciação de reuniões de 100 indivíduos é cerca de 0,1 para o alelo menor, como verificado por sequenciação de reuniões de frequências alélicas conhecidas. Contudo, mais de 90% dos polimorfismos bialélicos detectados pelo método de reunião tem uma frequência do alelo menor superior a 0,25. Em consequência, os marcadores bialélicos seleccionados por este método têm uma frequência de pelo menos 0,1 para o alelo menor e inferior a 0,9 para o alelo maior, preferivelmente pelo menos 0,2 para o alelo menor e inferior a 0,8 para o alelo maior, mais preferivelmente pelo menos 0,3 para o alelo menor e inferior a 0,7 para o alelo maior, e assim uma taxa de heterozigosidade superior a 0,18, preferivelmente superior a 0,32, mais preferivelmente superior a 0,42.
Noutra especificação, os marcadores bialélicos são detectados por sequenciação de amostras de DNA individuais, em que a frequência do alelo menor desse marcador bialélico pode ser inferior a 0,1. 70 4. Validação dos marcadores bialélicos
Os polimorfismos são avaliados quanto à sua utilidade como marcadores genéticos validando que ambos os alelos estão presentes numa população. A validação dos marcadores bialélicos é conseguida através de genotipagem de um grupo de indivíduos por um método da invenção e demonstrando que ambos os alelos estão presentes. A microssequenciação é um método preferido de genotipagem de alelos. A validação pelo passo de genotipagem pode ser efectuada em amostras individuais derivadas de cada indivíduo do grupo ou por genotipagem de uma amostra reunida derivada de mais do que um indivíduo. O grupo pode ser tão pequeno quanto um indivíduo se esse indivíduo for heterozigótico para o alelo em questão. Preferivelmente, o grupo contém pelo menos três indivíduos, mais preferivelmente o grupo contém cinco ou seis indivíduos, de modo que será mais provável que um único teste de validação resulte na validação de mais dos marcadores bialélicos que estão a ser testados. No entanto, deve notar-se que, quando o teste de validação é efectuado num grupo pequeno, pode dar origem a um resultado negativo falso se, devido a erro de amostragem, nenhum dos indivíduos testados tiver um dos dois alelos. Assim, o processo de validação é menos útil para demonstrar que um resultado inicial particular é um artefacto do que para demonstrar que existe um marcador bialélico bona fide numa posição particular de uma sequência. 5. Avaliação da frequência dos marcadores bialélicos
Os marcadores bialélicos validados são suplementarmente avaliados quanto à sua utilidade como marcadores genéticos determinando a frequência do alelo menos comum no sítio do marcador bialélico. Quanto maior for a frequência do alelo menos comum maior será a utilidade do marcador bialélico em 71 estudos de associação. Procede-se à determinação do alelo menos comum através de genotipagem de um grupo de indivíduos por um método da invenção e demonstrando que ambos os alelos estão presentes. Esta determinação da frequência por um passo de genotipagem pode ser feita em amostras individuais derivadas de cada indivíduo no grupo ou por genotipagem de uma amostra reunida derivada de mais do que um indivíduo. 0 grupo deve ser suficientemente grande para que seja representativo da população na globalidade. Preferivelmente o grupo contém pelo menos 20 indivíduos, mais preferivelmente o grupo contém pelo menos 50 indivíduos, ainda mais preferivelmente o grupo contém pelo menos 100 indivíduos. Obviamente, quanto maior for o grupo maior será a precisão da determinação da frequência, devido a erros de amostragem reduzidos. Quanto a uma indicação da frequência para o alelo menos comum de um marcador bialélico particular da invenção, ver a Tabela 2. Um marcador bialélico em que a frequência do alelo menos comum é 30% ou superior é denominado um "marcador bialélico de alta qualidade". A invenção também se refere a métodos de estimativa da frequência de um alelo de um marcador bialélico relacionado com o FLAP numa população de controlo ou positiva para asma, compreendendo: a) genotipagem de indivíduos dessa população quanto ao referido marcador bialélico de acordo com o método da presente invenção; b) determinação da representação proporcional desse marcador bialélico nessa população. Adicionalmente, descrevem-se métodos para estimar a frequência de um alelo numa população, que abrangem métodos com qualquer limitação suplementar descrita nesta revelação, ou os que se seguem, especificados isoladamente ou em qualquer combinação. Esse marcador bialélico relacionado com o FLAP pode ser 72 seleccionado do grupo que consiste em Al até A28, e respectivos complementos. Opcionalmente, esse marcador bialélico relacionado com o FLAP pode ser seleccionado do grupo que consiste em Al até A13, A15 e A17 até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em Al até AIO e A22 até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles; opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em All até A13, A15, Al7 até A21, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles; opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em A14 ou A16, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Opcionalmente, a determinação da representação proporcional de um nucleótido num marcador bialélico relacionado com o FLAP pode ser efectuada determinando a identidade dos nucleótidos para ambas as cópias desse marcador bialélico presente no genoma de cada indivíduo dessa população e calculando a representação proporcional desse nucleótido nesse marcador bialélico relacionado com o FLAP para a população. Opcionalmente, a determinação da representação proporcional pode ser conseguida conduzindo um método de genotipagem da invenção numa amostra biológica reunida derivada de um número representativo de indivíduos, ou de cada indivíduo, dessa população e calculando a quantidade proporcional desse nucleótido em comparação com o total. 73 VIII. Métodos de Genotipagem de Um Indivíduo Quanto a Marcadores Bialélicos São revelados métodos de genotipagem de uma amostra biológica guanto a um ou mais marcadores bialélicos como descritos na presente invenção, todos os guais podem ser conduzidos in vitro. Esses métodos de genotipagem compreendem determinar a identidade de um nucleótido no sítio de um marcador bialélico do FLAP por gualguer método conhecido na área. Estes métodos são aplicáveis à genotipagem de populações de caso-controlo em estudos de associação, bem como de indivíduos no contexto da detecção de alelos de marcadores bialélicos gue se sabe estarem associados a uma dada caracterí stica, em cujo caso se determinam ambas as cópias do marcador bialélico presente no genoma do indivíduo de modo gue o indivíduo possa ser classificado como homozigótico ou heterozigótico para um alelo particular.
Estes métodos de genotipagem podem ser realizados em amostras de ácido nucleico derivadas de um único indivíduo ou em amostras de DNA reunidas. A identificação de marcadores bialélicos previamente descrita permite a concepção de oligonucleótidos apropriados, que podem ser utilizados como sondas e "primers", para amplificar um gene FLAP contendo o sítio polimórfico de interesse e para a detecção desses polimorfismos. A genotipagem pode ser efectuada utilizando métodos semelhantes aos descritos acima para a identificação dos marcadores bialélicos, ou utilizando outros métodos de genotipagem, como os suplementarmente descritos abaixo. Em especificações preferidas, a comparação de sequências de fragmentos genómicos amplificados de diferentes indivíduos é utilizada para identificar novos marcadores bialélicos, 74 ao passo que a microssequenciação é utilizada para a genotipagem de marcadores bialélicos conhecidos em aplicações de diagnóstico e de estudos de associação. A invenção também diz respeito a um método de genotipagem compreendendo determinar a identidade de um nucleótido num marcador bialélico relacionado com o FLAP da ID SEQ N° 1, respectivas sequências complementares ou marcadores bialélicos em desequilíbrio de ligação com aquele, numa amostra biológica, em que esse marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste nos marcadores bialélicos nas posições 3950, 4243, 4312, 4490, 4670, 4687, 4968, 5140, 5213, 5364, 5594, 6370, 6693, 6763, 7445, 7870, 16288, 16347, 16383, 16440, 24361, 28336, 28368, 36183, 36509, 38681, 42440 e 42445 da ID SEQ N° 1. Opcionalmente, a amostra biológica é derivada de um único sujeito. Numa especificação preferida, determina-se a identidade dos nucleótidos nesse marcador bialélico para ambas as cópias desse marcador bialélico presente no genoma desse indivíduo. Opcionalmente, esse método é efectuado in vitro. Numa especificação também preferida, a amostra biológica é derivada de múltiplos sujeitos. Numa especificação preferida suplementar, o método de genotipagem descrito acima compreende suplementarmente amplificar uma porção dessa sequência compreendendo o marcador bialélico antes desse passo de determinação. Numa especificação preferida suplementar, essa amplificação é efectuada por PCR, opcionalmente por LCR, ou replicação de um vector recombinante compreendendo uma origem da replicação e essa porção numa célula hospedeiro. Numa especificação preferida suplementar, o passo de determinação do método de genotipagem acima pode ser efectuado quer por um ensaio de hibridização, um ensaio de sequenciação, um ensaio de detecção de emparelhamentos 75 defeituosos à base de enzima e por um ensaio de microssequenciação. Adicionalmente, os métodos de genotipagem descritos na invenção abrangem métodos com qualquer limitação suplementar descrita nesta revelação, ou os seguintes, especificados isoladamente ou em qualquer combinação. Esse marcador bialélico é seleccionado do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, esse marcador bialélico é seleccionado do grupo que consiste em Al até A13, AI5 e Al7 até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, esse marcador bialélico é seleccionado do grupo que consiste em Al até AIO e A22 até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, esse marcador bialélico é seleccionado do grupo que consiste em All até A13, A15, A17 até A21, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, esse marcador bialélico é A14 ou A16, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele.
Fonte de DNA para genotipagem
Como ácido nucleico de partida pode utilizar-se qualquer fonte de ácidos nucleicos, em forma purificada ou não purificada, desde que contenha, ou se suspeite que contém a sequência de ácido nucleico específica desejada. 0 DNA ou RN A pode ser extraído de células, tecidos, fluidos corporais e afins, como descrito acima. Se bem que ácidos nucleicos para utilização nos métodos de genotipagem da 76 invenção possam ser derivados de qualquer fonte de mamífero, entende-se geralmente que os sujeitos e indivíduos de teste de onde são recolhidas amostras de ácidos nucleicos são humanos.
Amplificação de fragmentos de DNA compreendendo marcadores bialélicos
Descrevem-se métodos e polinucleótidos para amplificar um segmento de nucleótidos compreendendo um ou mais marcadores bialélicos da presente invenção. Será apreciado que a amplificação de fragmentos de DNA compreendendo marcadores bialélicos pode ser utilizada em vários métodos e para vários fins, não se restringindo à genotipagem. Ainda assim, muitos métodos de genotipagem, se bem que não todos, requerem a amplificação prévia da região do DNA contendo o marcador bialélico de interesse. Esses métodos aumentam especificamente a concentração ou número total de sequências que abrangem o marcador bialélico ou que incluem esse sítio e sequências localizadas de forma distai ou próxima relativamente àquele. Ensaios de diagnóstico também podem basear-se na amplificação de segmentos de DNA contendo um marcador bialélico da presente invenção. A amplificação de DNA pode ser conseguida por qualquer método conhecido na área. Técnicas de amplificação estão descritas acima na secção intitulada "Identificação de marcadores bialélicos" VII. (2).
Alguns destes métodos de amplificação são particularmente adequados para a detecção de polimorfismos de um único nucleótido e permitem a amplificação simultânea de uma sequência alvo e a identificação do nucleótido polimórfico, como é suplementarmente descrito abaixo. A identificação de marcadores bialélicos como descrito acima permite conceber oligonucleótidos apropriados, que 77 podem ser utilizados como "primers" para amplificar fragmentos de DNA compreendendo os marcadores bialélicos descritos na presente invenção. A amplificação pode ser feita utilizando os "primers" inicialmente utilizados para descobrir novos marcadores bialélicos que são aqui descritos, ou qualquer conjunto de "primers" que permita a amplificação de um fragmento de DNA compreendendo um marcador bialélico da presente invenção. A presente invenção descreve "primers" para amplificar um fragmento de DNA contendo um ou mais marcadores bialélicos como descritos na presente invenção. Em algumas especificações, o par de "primers" é adaptado para amplificar uma sequência contendo a base polimórfica de uma das sequências de PI até P28, opcionalmente PI até P13, P15, P17 até P28, e respectiva sequência complementare. "Primers" de amplificação preferidos estão listados no Exemplo 2. Será apreciado que os "primers" listados são meramente exemplificativos e que qualquer outro conjunto de "primers" que produza produtos de amplificação contendo um ou mais marcadores bialélicos da presente invenção. 0 espaçamento dos "primers" determina o comprimento do segmento a ser amplificado. Neste contexto, a dimensão de segmentos amplificados contendo marcadores bialélicos pode variar desde pelo menos cerca de 25 pares de bases até 35 milhares de pares de bases. Fragmentos de amplificação entre 25-3000 pares de bases são típicos, fragmentos entre 50-1000 pares de bases são preferidos e fragmentos entre 100-600 pares de bases são altamente preferidos. Numa especificação preferida da invenção, os pares de "primers" para amplificação e sequenciação são suficientemente complementares a uma região de um gene FLAP localizada a menos de 500 pares de bases, preferivelmente a menos de 100 pares de bases e mais preferivelmente a menos de 50 pares 78 de bases de um sítio polimórfico correspondente a um dos marcadores descritos na presente invenção. Os "primers" de amplificação podem ser etiquetados ou imobilizados num suporte sólido, como descrito em "Sondas e "primers" oligonucleotídicos". Métodos de Genotipagem de Amostras de DNA Quanto a Marcadores Bialélicos
Pode utilizar-se qualquer método conhecido na área para identificar o nucleótido presente no sítio de um marcador bialélico. Uma vez que o alelo do marcador bialélico a ser detectado foi identificado e especificado na presente invenção, a detecção será simples para o habitualmente experimentado na área empregando qualquer uma de algumas técnicas. Muitos métodos de genotipagem requerem a amplificação prévia da região de DNA que contém o marcador bialélico de interesse. Se bem que a amplificação do alvo ou sinal seja presentemente e muitas vezes preferida, os presentes métodos de genotipagem também abrangem métodos de detecção ultra-sensível que não requerem amplificação. Métodos bem conhecidos dos experimentados na área que podem ser utilizados para detectar polimorfismos bialélicos incluem métodos tais como análises convencionais de coloração em pontos, análise de polimorfismos conformacionais de filamentação simples (SSCP), descrita por Orita et al. (1989), electroforese em gel com gradiente desnaturante (DGGE), análise heteroduplex, detecção por clivagem de emparelhamentos defeituosos e outras técnicas convencionais, descritas em Sheffield et al. (1991), White et al. (1992), Grompe et al. (1989 e 1993). Outro método para determinar a identidade do nucleótido presente num sítio polimórfico particular emprega um derivado 79 nucleotídico resistente a exonucleases especializado, como descrito na patente US 4 656 127. Métodos preferidos envolvem determinar directamente a identidade do nucleótido presente no sitio de um marcador bialélico por um ensaio de sequenciação, um ensaio de detecção de emparelhamentos defeituosos à base de enzima ou um ensaio de hibridização. 0 seguinte é uma descrição de alguns métodos preferidos. Um método altamente preferido é a técnica de microssequenciação. 0 termo "sequenciação" é aqui utilizado para se referir à extensão por polimerases de complexos "primer"/modelo em hélice dupla e inclui sequenciação tradicional e microssequenciação. 1) Ensaios de Sequenciação
Os produtos de amplificação gerados acima com os "primers" da invenção podem ser sequenciados utilizando métodos conhecidos e disponíveis para o técnico experimentado. Preferivelmente, o DNA amplificado é sujeito a reacções de sequenciação com terminação didesoxi automáticas utilizando um protocolo de sequenciação com ciclos corante-"primer". Uma análise da sequência pode permitir a identificação da base presente no sítio polimórfico. 2) Ensaios de Microssequenciação
As análises de polimorfismos em reuniões ou indivíduos seleccionados de uma dada população podem ser efectuadas conduzindo reacções de microssequenciação em regiões candidatas contidas em fragmentos amplificados, obtidos por PCR efectuada em amostras de DNA ou RNA recolhidas destes indivíduos.
Para fazê-lo, amostras de DNA são sujeitas a amplificação por PCR das regiões candidatas em condições semelhantes às descritas acima. Seguidamente, estes produtos de amplificação genómica são sujeitos a reacções 80 de microssequenciação automáticas utilizando ddNTPs (fluorescência especifica para cada ddNTP) e "primers" de microssequenciação oligonucleotidicos apropriados que podem hibridizar imediatamente a montante da base polimórfica de interesse. Depois de especificamente estendido na extremidade 3' por uma DNA polimerase utilizando um análogo didesoxinucleotídico fluorescente complementar (realização de ciclos térmicos), o "primer" é precipitado para remover os ddNTPs fluorescentes não incorporados. Os produtos da reacção onde foram incorporados ddNTPs fluorescentes são então analisados por electroforese em máquinas de sequenciação ABI 377 para determinar a identidade da base incorporada, desse modo identificando o marcador polimórfico presente na amostra.
Fornece-se no exemplo 4 um exemplo de um procedimento típico de microssequenciação que pode ser utilizado neste contexto. Deve entender-se que certos parâmetros deste procedimento, como o método de electroforese ou a etiquetagem de ddNTPs, podem ser modificados pelo experimentado sem modificar substancialmente o seu resultado. 0 "primer" estendido também pode ser analisado por Espectrometria de Massa MALDI-TOF. A base presente no sítio polimórfico é identificada pela massa adicionada ao "primer" de microssequenciação (ver Haff e Smirnov, 1997) .
Como alternativa suplementar ao processo descrito acima, desenvolveram-se várias reacções de microssequenciação em fase sólida. O protocolo básico de microssequenciação é igual ao descrito previamente, com a excepção dos "primers" de microssequenciação oligonucleotidicos ou os produtos amplificados por PCR do fragmento de DNA de interesse serem imobilizados. Por exemplo, pode conduzir-se a imobilização via uma interacção 81 entre DNA biotinilado e cavidades de microtitulação revestidas com estreptavidina, ou partículas de poliestireno revestidas com avidina.
Nessas reacções de microssequenciação em fase sólida, os ddNTPs incorporados podem ser radioetiquetados (ver Syvânen, 1994, aqui incorporado por referência) ou liqados a fluoresceína (ver Livak & Hainer, 1994, aqui incorporado por referência). A detecção de ddNTPs radioetiquetados pode ser consequida por técnicas à base de cintilação. A detecção de ddNTPs liqados a fluoresceína pode basear-se na ligação de anticorpo anti-fluoresceína conjugado com fosfatase alcalina, seguida de incubação com um substrato cromogénico (como fosfato de p-nitrofenilo).
Outros pares possíveis repórter-detecção incluem: ddNTP ligado a dinitrofenilo (DNP) e conjugado de anti-DNP com fosfatase alcalina (ver Harju et al., 1993), e ddNTP biotinilado e estreptavidina conjugada com peroxidase de rábano bravo com o-fenilenodiamina como substrato (ver WO 92/15712) .
Um estojo de diagnóstico à base de ddNTP ligado a fluoresceína com anticorpo anti-fluoresceína conjugado com fosfatase alcalina é comercializado com o nome PRONTO pela GamidaGen Ltd.
Ainda como outro procedimento de microssequenciação alternativo, Nyren et al. (1993) apresentaram um conceito de sequenciação de DNA em fase sólida que se baseia na detecção da actividade de DNA polimerase por um ensaio de detecção enzimático luminométrico de pirofosfato inorgânico (ELIDA). Os produtos amplificados por PCR são biotinilados e imobilizados em esférulas. 0 "primer" de microssequenciação é hibridizado e quatro alíquotas desta mistura são separadamente incubadas com DNA polimerase e um dos quatro ddNTPs diferentes. Após a reacção, os fragmentos 82 resultantes são lavados e utilizados como substratos numa reacção de extensão de "primers" com os quatro dNTPs presentes. A progressão das reacções de polimerização dirigidas a DNA é monitorizada por ELIDA. A incorporação de um ddNTP na primeira reacção previne a formação de pirofosfato durante a reacção do dNTP subsequente. Em contraste, a ausência de incorporação de ddNTP na primeira reacção dá origem a libertação extensa de pirofosfato durante a reacção do dNTP, e isto conduz à geração de luz ao longo das reacções de ELIDA. A partir dos resultados de ELIDA deduz-se facilmente a primeira base a seguir ao "primer".
Pastinen et al. (1997) descrevem um método para a detecção por multiplex de polimorfismos de um único nucleótido no qual o principio de minissequenciação em fase sólida é aplicado a um formato em série de oligonucleótidos. Descrevem-se suplementarmente abaixo séries de alta densidade de sondas de DNA ligadas a um suporte sólido (placas de DNA). A presente invenção descreve polinucleótidos e métodos de genotipagem de um ou mais marcadores bialélicos revelados na presente invenção efectuando um ensaio de microssequenciação. Preferivelmente, os marcadores bialélicos são seleccionados do grupo que consiste em Al até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. "Primers" de microssequenciação preferidos incluem as sequências de nucleótidos: Dl até D28 e EI até E28. Será apreciado que os "primers" de microssequenciação listados no Exemplo 4 são meramente exemplificativos e que pode utilizar-se qualquer "primer" com uma extremidade 3' imediatamente adjacente ao nucleótido polimórfico. De modo semelhante, será apreciado que a análise de 83 microssequenciação pode ser efectuada para qualquer marcador bialélico ou qualquer combinação de marcadores bialélicos descritos na presente invenção. Um aspecto é um suporte sólido que inclui um ou mais "primers" de microssequenciação listados no Exemplo 4, ou respectivos fragmentos contendo pelo menos 8, 12, 15, 20, 25, 30, 40 ou 50 nucleótidos consecutivos e com um terminal 3' imediatamente a montante do marcador bialélico correspondente, para determinar a identidade de um nucleótido no sitio de um marcador bialélico. 3) Ensaios de detecção de emparelhamentos defeituosos à base de polimerases e ligases
Num aspecto, a presente invenção revela polinucleótidos e métodos para determinar o alelo de um ou mais marcadores bialélicos descritos na presente invenção numa amostra biológica por ensaios de amplificação específicos para alelos. Métodos, "primers" e vários parâmetros para amplificar fragmentos de DNA compreendendo marcadores bialélicos da presente invenção estão suplementarmente descritos acima em "Amplificação de Fragmentos de DNA Compreendendo Marcadores Bialélicos". "Primers" de Amplificação Especifica para Alelos A distinção entre os dois alelos de um marcador bialélico também pode ser conseguida por amplificaçao específica para alelos, uma estratégia selectiva pela qual um dos alelos é amplificado sem ocorrer amplificação do outro alelo. Para a amplificação específica para alelos, pelo menos um membro do par de "primers" é suficientemente complementar a uma região de um gene FLAP compreendendo a base polimórfica de um marcador bialélico da presente invenção, para hibridizar com ela. Esses "primers" são 84 capazes de distinguir entre os dois alelos de um marcador bialélico.
Isto pode ser conseguido colocando a base polimórfica na extremidade 3' de um dos "primers" de amplificação. Esses "primers" específicos para alelos tendem a iniciar selectivamente uma reacção de amplificação ou sequenciação, desde que sejam utilizados com uma amostra de ácido nucleico que contenha um dos dois alelos presentes num marcador bialélico, porque a extensão forma, a partir da extremidade 3' do "primer", um emparelhamento defeituoso nesta posição ou perto dela, que tem um efeito inibidor sobre a amplificação. Em consequência, em condições de amplificação apropriadas, estes "primers" só dirigem a amplificação nos seus alelos complementares. A determinação da localização precisa do emparelhamento defeituoso e das condições de ensaio correspondentes pertencem ao âmbito do habitualmente experimentado na área. Métodos à Base de Ligação/Amplificação 0 "Ensaio de Ligação de Oligonucleótidos" (OLA) utiliza dois oligonucleótidos que são concebidos para serem capazes de hibridizar para sequências confinantes de um filamento simples de uma molécula alvo. Um dos oligonucleótidos é biotinilado e o outro é etiquetado de forma detectável. Se a sequência complementar precisa estiver presente numa molécula alvo, os oligonucleótidos irão hibridizar de modo que os seus terminais confinem e para criar um substrato de ligação que pode ser capturado e detectado. 0 OLA é capaz de detectar polimorfismos de um único nucleótido e pode ser vantajosamente combinado com PCR, como descrito por Nickerson et al. (1990). Neste método utiliza-se a PCR para obter a amplificação exponencial do DNA alvo, que depois é detectado utilizando OLA. 85
Outros métodos de amplificação particularmente adequados para a detecção de polimorfismos de um único nucleótido incluem LCR (reacção em cadeia de ligase), LCR de Hiato (GLCR), que estão descritos acima em "Identificação de Marcadores Bialélicos" (2). A LCR utiliza dois pares de sondas para amplificar exponencialmente um alvo específico. As sequências de cada par de oligonucleótidos são seleccionadas de modo a permitir que o par hibridize para sequências confinantes do mesmo filamento do alvo. Essa hibridização forma um substrato para uma ligase dependente do modelo. De acordo com a presente invenção, a LCR pode ser efectuada com oligonucleótidos tendo as sequências próxima e distai do mesmo filamento do sítio de um marcador bialélico. Numa especificação, qualquer um dos oligonucleótidos será concebido de modo a incluir o sítio do marcador bialélico. Nessa especificação, as condições reaccionais são seleccionadas de modo que os oligonucleótidos possam ser ligados em conjunto apenas se a molécula alvo tiver ou não tiver o nucleótido específico que é complementar ao marcador bialélico no oligonucleótido. Numa especificação alternativa, os oligonucleótidos não incluirão o marcador bialélico, de modo que, quando hibridizarem para a molécula alvo, será criado um "hiato", como descrito em WO 90/01069. Em seguida, este hiato é preenchido com dNTPs complementares (tal como mediado por DNA polimerase) ou por um par adicional de oligonucleótidos. Assim e no final de cada ciclo, cada filamento simples tem um complemento capaz de servir como alvo durante o ciclo seguinte, obtendo-se amplificação exponencial específica para alelos da sequência desejada. A Análise de "Bits" Genéticos Mediada por Ligase/ Polimerase™ é outro método para determinar a identidade de 86 um nucleótido num sítio pré-seleccionado numa molécula de ácido nucleico (WO 95/21271). Este método envolve a incorporação de um nucleósido trifosfato que é complementar ao nucleótido presente no sítio pré-seleccionado no terminal de uma molécula de "primer" e sua ligação subsequente a um segundo oligonucleótido. Monitoriza-se a reacção detectando uma etiqueta específica ligada à fase sólida da reacção ou por detecção em solução. 4) Métodos de Ensaio de Hibridização A invenção também descreve um grupo de sondas caracterizadas por compreenderem preferivelmente entre 10 e 50 nucleótidos e por serem suficientemente complementares a uma sequência polimórfica definida por um marcador bialélico localizado na sequência genómica de um gene FLAP para hibridizarem para aquele e, preferivelmente, suficientemente específicas para serem capazes de distinguir a sequência alvo quanto a uma variação de apenas um nucleótido. O comprimento destas sondas pode variar desde 10, 15, 20 ou 30 até 100 nucleótidos, preferivelmente desde 10 até 50, mais preferivelmente desde 40 até 50 nucleótidos. Uma sonda particularmente preferida tem 25 nucleótidos de comprimento. Outra sonda preferida tem 47 nucleótidos de comprimento. Inclui um nucleótido central complementar a um sítio polimórfico do gene FLAP, preferivelmente um sítio polimórfico correspondente a um dos marcadores bialélicos da presente invenção, e uma sequência de 23 nucleótidos que se estende de cada lado do nucleótido central e substancialmente complementar às sequências de nucleótidos do gene FLAP que se estendem de cada lado do sítio polimórfico. Opcionalmente, os marcadores bialélicos descritos na presente invenção compreendem as bases polimórficas presentes nas sequências de PI até P28 e 87 respectivas sequências complementares. Opcionalmente, os marcadores bialélicos compreendem as bases polimórficas presentes nas sequências de PI até P13, P15 e P17 até P28, e respectivas sequências complementares.
Os polimorfismos podem ser analisados e a frequência dos alelos correspondentes pode ser quantificada por reacções de hibridização em sequências amplificadas que codificam o FLAP. A reacção de amplificação pode ser efectuada como previamente descrito. As sondas de hibridização que podem ser convenientemente utilizadas nessas reacções incluem preferivelmente as sondas definidas acima como sendo suficientemente complementares a um sitio polimórfico definido por um dos marcadores bialélicos localizado na sequência genómica de um gene FLAP para hibridizarem para aquele, e suficientemente especificas para conseguirem distinguir entre o alelo alvo e um alelo que difere apenas numa base. 0 DNA alvo compreendendo um marcador bialélico pode ser amplificado antes da reacção de hibridização. Determina-se a presença de um alelo especifico na amostra detectando a presença ou a ausência de hélices duplas híbridas estáveis formadas entre a sonda e o DNA alvo. A detecção de hélices duplas híbridas pode ser efectuada por alguns métodos. São bem conhecidos vários formatos de ensaios de detecção que utilizam etiquetas detectáveis ligadas ao alvo ou à sonda, para permitir a detecção das hélices duplas híbridas. Tipicamente, hélices duplas de hibridização são separadas de ácidos nucleicos não hibridizados, detectando-se seguidamente as etiquetas ligadas às hélices duplas. Os experimentados na área reconhecem que se podem empregar passos de lavagem para eliminar por lavagem DNA alvo ou sonda em excesso, bem como conjugado não ligado. Suplementarmente, formatos de ensaios heterogéneos comuns 88 são adequados para detectar os híbridos utilizando as etiquetas presentes nos "primers" e sondas.
Dois ensaios recentemente desenvolvidos permitem a distinção de alelos à base de hibridização sem serem necessárias separações ou lavagens (ver Landergren U. et al., 1998). 0 ensaio TaqMan aproveita a actividade de 5' nuclease da Taq DNA polimerase para digerir uma sonda de DNA hibridizada especificamente para o produto de amplificação que se acumula. As sondas TaqMan são etiquetadas com um par de corantes dador-receptor que interage via transferência de energia de fluorescência. A clivagem da sonda TaqMan pela polimerase que avança durante a amplificação dissocia o corante dador do corante receptor de inibição, aumentando grandemente a fluorescência do dador. Todos os reagentes necessários para detectar duas variantes alélicas podem ser reunidos no início da reacção, e os resultados são monitorizados em tempo real (ver Livak et al., 1995) . Num procedimento alternativo à base de hibridização homogénea, utilizam-se faróis moleculares ("molecular beacons") para distinções entre alelos. Os faróis moleculares são sondas oligonucleotídicas em forma de grampo que acusam a presença de ácidos nucleicos específicos em soluções homogéneas. Quando se ligam aos seus alvos sofrem uma reorganização conformacional que restabelece a fluorescência de um fluoróforo inibido internamente (Tyagi et al., 1998) . 5)_Hibridização para_Séries_Endereçáveis_de
Oliqonucleótidos
Obtém-se acesso eficiente a informações de polimorfismos através de uma estrutura básica compreendendo séries de alta densidade de sondas oligonucleotídicas fixadas a um suporte sólido (a placa) em posições seleccionadas. Cada placa de DNA pode conter milhares até 89 milhões de sondas de DNA sintéticas individuais dispostas num padrão em grelha e miniaturizadas para o tamanho de uma moeda de cêntimo. Estas placas de DNA são pormenorizadas em ""primers" e sondas oligonucleotídicos", secção "Série de oligonucleótidos". A tecnologia de placas já foi aplicada com êxito em numerosos casos. Por exemplo, procedeu-se ao rastreio de mutações no gene BRCA1, em estirpes mutantes de S. cerevisiae e no gene de proteases do virus HIV-1 (ver Hacia et al., 1996; Shoemaker et al., 1996; Kozal et al., 1996).
Pelo menos três empresas propõem placas capazes de detectar polimorfismos bialélicos: Affymetrix (GeneChip), Hyseq (HyChip e HyGnostics) e Protogene Laboratories.
Uma das limitações encontradas quando se utiliza a tecnologia de placas de DNA é que a hibridização de ácidos nucleicos com as sondas fixadas na placa em séries não é simplesmente uma reacção em fase de solução. Um aperfeiçoamento possível consiste em utilizar almofadas de gel de poliacrilamida isoladas entre si por regiões hidrófobas, em que as sondas de DNA estão covalentemente ligadas a uma matriz de acrilamida.
Para a detecção de polimorfismos, sondas que contêm pelo menos uma porção de um dos marcadores bialélicos, tais como os marcadores bialélicos de PI até P28, e respectivas sequências complementares, são sintetizadas in situ ou por síntese convencional e são imobilizadas numa placa apropriada utilizando métodos conhecidos do técnico experimentado. A superfície sólida da placa é frequentemente feita de silício ou vidro, mas pode ser uma membrana polimérica. Assim e nalgumas especificações, as placas podem compreender uma série de sequências de ácidos nucleicos, ou respectivos fragmentos, com pelo menos 15 nucleótidos de comprimento, preferivelmente pelo menos 20 90 nucleótidos de comprimento e mais preferivelmente pelo menos 25 nucleótidos de comprimento. Noutras especificações, a placa pode compreender uma série incluindo pelo menos uma das sequências seleccionadas do grupo que consiste em PI até P28, Dl até D28 e EI até E28, ou respectivas sequências complementares, ou respectivo fragmento com pelo menos 15 nucleótidos consecutivos. A amostra de ácido nucleico que inclui a região candidata a ser analisada é isolada, amplificada e etiquetada com um grupo repórter. Este grupo repórter pode ser um grupo fluorescente, como ficoeritrina. O ácido nucleico etiquetado é seguidamente incubado com as sondas imobilizadas na placa utilizando uma estação fluídica. Por exemplo, Manz et al. (1993) descrevem o fabrico de dispositivos fluidicos e, particularmente, de dispositivos microcapilares em substratos de silício e vidro.
Depois de completada a reacção, a placa é inserida num dispositivo de varrimento e detectam-se padrões de hibridização. Recolhem-se os dados de hibridização na forma de um sinal emitido pelos grupos repórter já incorporados no ácido nucleico, que está agora ligado às sondas fixadas na placa. As sondas que emparelham perfeitamente com uma sequência da amostra de ácido nucleico produzem geralmente sinais mais fortes do que aquelas que têm emparelhamentos defeituosos. Uma vez que são conhecidas a sequência e posição de cada sonda imobilizada na placa, pode determinar-se a identidade do ácido nucleico hibridizado para uma dada sonda.
Para análises de polimorfismos de um único nucleótido, geralmente concebem-se conjuntos de quatro sondas oligonucleotídicas (uma para cada tipo de base) , preferivelmente conjuntos de duas sondas oligonucleotídicas (uma para cada tipo de base do marcador bialélico) que 91 abrangem cada posição de uma porção da região candidata encontrada na amostra de ácido nucleico, diferindo apenas na identidade da base polimórfica. A intensidade relativa da hibridização para cada série de sondas numa localização particular permite identificar a base correspondente à base polimórfica da sonda. Uma vez que a detecção de polimorfismos bialélicos envolve identificar emparelhamentos defeituosos de uma única base na amostra de ácido nucleico, são necessárias restrições de hibridização maiores (a menor concentração de sal e temperatura mais elevada durante períodos de tempo mais curtos). A utilização de controlo de campo eléctrico directo melhora a determinação de mutações de uma única base (Nanogen). Um campo positivo aumenta a velocidade de transporte de ácidos nucleicos com carga negativa e resulta num aumento de 10 vezes das velocidades de hibridização. Utilizando esta técnica, emparelhamentos defeituosos de um único par de bases são detectados em menos de 15 segundos (ver Sosnowski et ai., 1997). 5) Sistemas Integrados
Outra técnica que pode ser utilizada para analisar polimorfismos inclui sistemas integrados de múltiplos componentes, que procedem à miniaturização e compartimentalização de processos, como PCR e reacções de electroforese capilar, num único dispositivo funcional. Um exemplo dessa técnica é revelado na patente US 5 589 136, que descreve a integração de amplificação por PCR e electroforese capilar em placas.
Os sistemas integrados podem ser considerados principalmente quando se utilizam sistemas microfluidicos. Estes sistemas compreendem um padrão de microcanais concebidos numa lâmina de vidro, silício, quartzo ou plástico incluída numa microplaca. Os movimentos das 92 amostras são controlados por forças eléctricas, electro-osmóticas ou hidrostáticas aplicadas em diferentes áreas da microplaca, para criar válvulas e bombas microscópicas funcionais sem quaisquer partes móveis. A variação da voltagem controla o fluxo liquido em intersecções entre os canais fabricados à escala microscópica e altera a taxa do fluxo líquido para bombeamento através de diferentes secções da microplaca.
Para a genotipagem de marcadores bialélicos, o sistema microfluídico pode integrar amplificação, microssequenciação, electroforese capilar e um método de detecção de ácido nucleico, tal como detecção de fluorescência induzida por laser. Num primeiro passo, as amostras de DNA são amplificadas, preferivelmente por PCR. Em seguida, os produtos de amplificação são sujeitos a reacções de microssequenciação automáticas utilizando ddNTPs (fluorescência específica para cada ddNTP) e os "primers" de microssequenciação oligonucleotídicos apropriados, que hibridizam imediatamente a montante da base polimórfica alvo. Depois de completada a extensão na extremidade 3', os "primers" são separados dos ddNTPs fluorescentes não incorporados por electroforese capilar. 0 meio de separação utilizado em electroforese capilar pode ser, por exemplo, poliacrilamida, polietilenoglicol ou dextrano. Os ddNTPs incorporados nos produtos de extensão dos "primers" de um único nucleótido são identificados por detecção de fluorescência. Esta microplaca pode ser utilizada para processar pelo menos 96 até 384 amostras em paralelo. Pode utilizar a habitual detecção dos ddNTPs por fluorescência induzida por laser de quatro cores. 93 IX. Estudos de Associação A identificação de genes associados a uma caracteristica particular, como susceptibilidade a asma ou resposta individual a fármacos anti-asmáticos, pode ser efectuada utilizando duas estratégias principais presentemente utilizadas para o mapeamento genético: análise de ligação e estudos de associação. A análise de ligação envolve o estudo de famílias com múltiplos indivíduos afectados e presentemente é útil na detecção de características hereditárias mono- ou oligogénicas. Inversamente, os estudos de associação examinam a frequência de alelos marcadores em indivíduos positivos para a caracteristica (T+) não relacionados em comparação com indivíduos de controlo, que são seleccionados aleatoriamente ou então, preferivelmente, controlos negativos para a caracteristica (T-), sendo geralmente empregues na detecção de hereditariedade poligénica.
Os estudos de associação como método de mapeamento de características genéticas baseiam-se no fenómeno de desequilíbrio de ligação. Se dois loci genéticos se situarem no mesmo cromossoma, então conjuntos de alelos destes loci no mesmo segmento cromossómico (denominados haplótipos) tendem a ser transmitidos em bloco de geração para geração. Quando não são desagregados por recombinação, os haplótipos podem ser seguidos não só através de linhagens, mas também através de populações. 0 fenómeno resultante ao nível das populações é que a ocorrência de pares de alelos específicos em diferentes loci no mesmo cromossoma não é aleatória, e o desvio da aleatoriedade é denominado desequilíbrio de ligação (LD).
Se um alelo específico num dado gene estiver directamente envolvido em causar uma caracteristica particular T, a sua frequência estará estatisticamente 94 aumentada numa população T+ em comparação com a frequência numa população T-. Em consequência da existência do desequilíbrio de ligação, a frequência de todos os outros alelos presentes no haplótipo que contém o alelo causador da característica (TCA) também estará aumentada em indivíduos T+, em comparação com indivíduos T-. Em consequência, a associação entre a característica e qualquer alelo em desequilíbrio de ligação com o alelo causador da característica será suficiente para sugerir a presença de um gene relacionado com a característica nessa região do alelo particular. 0 desequilíbrio de ligação permite analisar as frequências relativas em populações T+ e T- de um número limitado de polimorfismos genéticos (especificamente marcadores bialélicos), em alternativa a rastrear todos os possíveis polimorfismos funcionais, de modo a descobrir alelos causadores de características.
Podem empregar-se duas abordagens alternativas para efectuar estudos de associação: um estudo de associação em todo o genoma e um estudo de associação num gene candidato. 0 estudo de associação em todo o genoma baseia-se no rastreio de marcadores genéticos espaçados uniformemente e abrangendo todo o genoma. A abordagem do gene candidato baseia-se no estudo de marcadores genéticos especificamente localizados em genes potencialmente envolvidos numa via biológica relacionada com a característica de interesse. A análise do gene candidato fornece claramente uma abordagem de atalho à identificação de genes e polimorfismos genéticos relacionados com uma característica particular quando está disponível alguma informação sobre a biologia da característica. A estratégia geral para efectuar estudos de associação utilizando marcadores bialélicos derivados de um gene candidato consiste em submeter a varrimento dois grupos de 95 indivíduos (indivíduos característica + e de controlo característica -, caracterizados por um fenótipo bem definido como descrito abaixo) para medir e comparar estatisticamente as frequências de alelos desses marcadores bialélicos em ambos os grupos.
Se for identificada uma associação estatisticamente significativa com uma característica para pelo menos um ou mais dos marcadores bialélicos analisados, pode presumir-se que: ou o alelo associado é directamente responsável por causar a característica (o alelo associado é o TCA) ou o alelo associado está em desequilíbrio de ligação com o TCA. As características específicas do alelo associado relativamente à função do gene candidato habitualmente fornecem mais informações quanto à relação entre o alelo associado e a característica (causal ou em desequilíbrio de ligação). Se as evidências indicarem que, muito provavelmente, o alelo associado no gene candidato não é o TCA mas está em desequilíbrio de ligação com o verdadeiro TCA, então o TCA pode ser encontrado por sequenciação da vizinhança do marcador associado.
Outro objectivo da presente invenção consiste em proporcionar um método para identificar e caracterizar uma associação entre alelos para um ou vários marcadores bialélicos da sequência do gene FLAP e uma característica. 0 método para detectar uma associação entre um genótipo e um fenótipo compreende os passos seguintes: a) determinar a frequência de pelo menos um marcador bialélico relacionado com o FLAP numa população positiva para asma de acordo com um método da invenção; b) determinar a frequência de pelo menos um marcador bialélico relacionado com o FLAP numa população de controlo de acordo com um método da invenção, e c) determinar se existe uma associação estatisticamente significativa entre esse genótipo e esse fenótipo. Esses 96 marcadores bialélicos são seleccionados do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Opcionalmente, a característica é uma doença, preferivelmente uma doença envolvendo a via dos leucotrienos, uma resposta benéfica ao tratamento com agentes que actuam na via dos leucotrienos ou efeitos secundários relacionados com o tratamento com agentes que actuam na via dos leucotrienos. Opcionalmente, esses passos de genotipagem a) e b) podem ser efectuados numa amostra biológica reunida derivada de cada uma dessas populações. Numa especificação preferida, esses passos de genotipagem a) e b) são efectuados separadamente em amostras biológicas derivadas de cada indivíduo nessa população ou respectiva sub-amostra. Numa especificação preferida, esses indivíduos de controlo são controlos negativos para a característica ou aleatórios. A invenção também abrange métodos para estimar a frequência de um haplótipo para um conjunto de marcadores bialélicos numa população de controlo ou positiva para asma, que compreende os passos seguintes: a) genotipagem de pelo menos um marcador bialélico relacionado com o FLAP de acordo com um método da invenção para cada indivíduo nessa população; b) genotipagem de um segundo marcador bialélico por determinação da identidade dos nucleótidos nesse segundo marcador bialélico para ambas as cópias desse segundo marcador bialélico presente no genoma de cada indivíduo nessa população, e c) aplicação de um método de determinação de haplótipos às identidades dos nucleótidos determinados nos passos a) e b) , para obter uma estimativa dessa frequência. Adicionalmente, descrevem-se métodos para estimar a frequência de um haplótipo da invenção, que abrangem métodos com qualquer limitação suplementar 97 descrita nesta revelação, particularmente em "Métodos estatísticos", ou os seguintes, especificados isoladamente ou em qualquer combinação. Esses marcadores bialélicos são seleccionados do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Numa especificação preferida, esse método de determinação de haplótipos é efectuado por amplificação por PCR assimétrica, amplificação por PCR dupla de alelos específicos, o algoritmo de Clark ou um algoritmo de maximização da expectativa. A presente invenção também descreve um método para identificar e caracterizar uma associação entre um haplótipo compreendendo alelos para vários marcadores bialélicos da sequência genómica do gene FLAP e uma característica. 0 método compreende os passos seguintes: a) genotipagem de um grupo de marcadores bialélicos de acordo com a invenção em indivíduos positivos para a característica e de controlo, e b) estabelecimento de uma associação estatisticamente significativa entre um haplótipo e a característica. A invenção diz respeito a um método para identificar e caracterizar uma associação entre um haplótipo compreendendo alelos para vários marcadores bialélicos da sequência genómica do gene FLAP e uma característica de asma, que compreende os passos seguintes: a) estimar a frequência de pelo menos um haplótipo numa população positiva para a característica de acordo com um método da invenção; b) estimar a frequência desse haplótipo numa população de controlo de acordo com um método da invenção, e c) determinar se existe uma associação estatisticamente significativa entre esse haplótipo e essa característica de asma. Adicionalmente, os métodos para detectar uma associação entre um haplótipo e um fenótipo da 98 invenção revelam métodos com qualquer limitação suplementar descrita nesta revelação, ou os seguintes. Esses marcadores bialélicos são seleccionados do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Opcionalmente, a característica é uma doença, preferivelmente uma doença envolvendo a via dos leucotrienos, uma resposta benéfica ao tratamento com agentes que actuam na via dos leucotrienos ou efeitos secundários relacionados com o tratamento com agentes que actuam na via dos leucotrienos. Opcionalmente, esses indivíduos de controlo são controlos negativos para a característica ou aleatórios. Opcionalmente, esse método compreende os passos adicionais de determinar o fenótipo nessa população positiva para a característica e nessa população de controlo antes do passo c).
Se a característica for uma resposta benéfica ou, inversamente, um efeito secundário ao tratamento com um agente que actua na via dos leucotrienos, descreve-se um método a que se fez referência acima compreendendo suplementarmente alguns ou todos os passos seguintes: a) seleccionar uma população ou coorte de sujeitos diagnosticados como sofrendo de uma doença especificada envolvendo a via dos leucotrienos; b) administrar a esse coorte de sujeitos um agente especificado que actua na via dos leucotrienos; c) monitorizar o resultado da administração do fármaco e identificar aqueles indivíduos que são positivos para a característica ou negativos para a característica relativamente ao tratamento; d) recolher desse coorte amostras biológicas contendo DNA e testar este DNA quanto à presença de um alelo específico ou de um conjunto de alelos para marcadores bialélicos do gene FLAP; e) analisar a distribuição de alelos para marcadores 99 bialélicos entre indivíduos positivos para a característica e negativos para a característica, e f) efectuar uma análise estatística para determinar se há uma associação estatisticamente significativa entre a presença ou ausência de alelos de marcadores bialélicos do gene FLAP e a característica relacionada com o tratamento. Opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. 0 passo de testar e detectar a presença de DNA compreendendo alelos específicos de um marcador bialélico ou de um grupo de marcadores bialélicos pode ser efectuado como descrito na presente invenção. A invenção também abrange métodos para determinar se um indivíduo está em risco de desenvolver asma, compreendendo os passos seguintes: a) genotipagem de pelo menos um marcador bialélico relacionado com o FLAP de acordo com um método da presente invenção, e b) correlação do resultado do passo a) com um risco de desenvolver asma, em que esse marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste em AI até A28; opcionalmente, em que esse marcador bialélico relacionado com o FLAP é seleccionado da lista seguinte de marcadores bialélicos: A2, AI4, A16, A18, A19, A22 e A23; opcionalmente, em que esse marcador bialélico relacionado com o FLAP é o marcador bialélico A19.
Numa especificação preferida, a presente invenção abrange os métodos acima de acordo com a invenção em que esse marcador bialélico relacionado com o FLAP é seleccionado da lista seguinte dos marcadores bialélicos nas posições 4670, 16347, 16440, 28336, 28368, 38681 e 42445 da ID SEQ N° 1, em que a posição 28368 é a mais preferida. 100 1) Recolha de Amostras de DNA de Indivíduos Positivos para a Característica (Característica +) e de Controlo (Critérios de Inclusão)
Estudos de associação à base de populações não dizem respeito à hereditariedade familiar, mas comparam a predominância de um marcador genético particular, ou de um conjunto de marcadores, em populações de caso-controlo. São estudos de caso-controlo baseados na comparação de indivíduos-caso (afectados ou positivos para a característica) não relacionados e indivíduos de controlo (não afectados ou negativos para a característica ou aleatórios) não relacionados. Preferivelmente, o grupo de controlo é composto por indivíduos não afectados ou negativos para a característica. Suplementarmente, o grupo de controlo corresponde etnicamente à população-caso. Além disso, o grupo de controlo corresponde preferivelmente à população-caso para o principal factor de confusão conhecido para a característica em estudo (por exemplo, de idades correspondentes para uma característica dependente da idade). Idealmente, os indivíduos das duas amostras são emparelhados de modo a esperar-se diferirem apenas quanto ao seu estado de doença. No que se segue, "população positiva para a característica", "população-caso" e "população afectada" são utilizados de forma intermutável.
Para efectuar estudos de associação eficientes e significativos como os descritos aqui, a característica em estudo deve ter, preferivelmente, uma distribuição bimodal na população em estudo, apresentando dois fenótipos claros que não se sobrepõem, característica + e característica -.
Ainda assim, mesmo na ausência dessa distribuição bimodal (como pode ser realmente o caso de características genéticas mais complexas), qualquer característica genética pode ainda ser analisada pelo método de associação proposto 101 aqui seleccionando cuidadosamente os indivíduos a serem incluídos nos grupo fenotípicos característica + e característica 0 procedimento de selecção envolve seleccionar indivíduos em extremidades opostas dos espectros de fenótipos não bimodais da característica em estudo, de modo a incluir nestas populações característica + e característica - indivíduos que representem claramente fenótipos extremos e preferivelmente sem sobreposição. A definição dos critérios de inclusão para as populações característica + e característica - é um aspecto importante da presente invenção.
Exemplos típicos de critérios de inclusão incluem uma doença envolvendo a via dos leucotrienos, como asma, ou a avaliação dos níveis de transaminases no fígado após tratamento com um fármaco anti-asma, como Zileuton. Do ponto de vista estatístico, se for considerado que, numa dada população, os níveis de transaminases no fígado seguem uma curva de distribuição padrão, indivíduos com fenótipos extremos de acordo com os critérios de inclusão óptimos correspondem, respectivamente, aos que exibem os níveis mais baixos de transaminases no fígado e aos que exibem os níveis mais elevados de transaminases no fígado. A selecção desses fenótipos drasticamente diferentes mas relativamente uniformes permite comparações eficientes em estudos de associação e a possível detecção de diferenças acentuadas ao nível genético, desde que as dimensões das amostras das populações em estudo sejam suficientemente significativas.
Em geral, populações característica + e característica a serem incluídas em estudos de associação como os descritos na presente candidatura consistem em populações de indivíduos fenotipicamente homogéneas, cada uma 102 representando 100% da característica correspondente se a distribuição da caracteristica for bimodal.
Se a distribuição da caracteristica não for bimodal, as populações caracteristica + e caracteristica - consistem em populações de indivíduos fenotipicamente uniformes representando entre 1 e 98%, preferivelmente entre 1 e 80%, mais preferivelmente entre 1 e 50% e ainda mais preferivelmente entre 4 e 35% da população total em estudo, sendo seleccionadas entre indivíduos que exibem os fenótipos extremos do grupo. Quanto mais clara for a diferença entre os dois fenótipos da caracteristica, maior será a probabilidade de observar uma associação com marcadores bialélicos.
Um primeiro grupo contendo entre 50 e 300 indivíduos caracteristica +, preferivelmente cerca de 100 indivíduos, é recrutado de acordo com critérios de inclusão clínicos baseados em Io) estarem afectados por doença(s) envolvendo a via dos leucotrienos, preferivelmente asma, ou 2o) evidências de efeitos secundários observados após administração de um agente que actua na via dos leucotrienos, preferivelmente níveis aumentados de transaminases no fígado após a administração de Zileuton, ou 3o) evidências de respostas particulares ao tratamento com agentes que actuam na via dos leucotrienos.
Em cada caso, é incluído nesses estudos um número semelhante de indivíduos negativos para a caracteristica. São verificados quanto à ausência dos critérios clínicos definidos acima. Tanto os indivíduos caracteristica + como os caracteristica - devem ser casos não relacionados.
No contexto da presente invenção efectuou-se um estudo de associação. A caracteristica considerada foi asma. A recolha de amostras de DNA de indivíduos caracteristica + e caracteristica - é descrita no Exemplo 5. 103 2) Genotipagem de Indivíduos Característica + e Característica -
Podem determinar-se as frequências alélicas dos marcadores bialélicos em cada uma das populações descritas acima utilizando um dos métodos descritos acima na secção "Métodos de Genotipagem de Amostras de DNA Quanto a Marcadores Bialélicos". As análises são preferivelmente efectuadas em fragmentos amplificados obtidos por PCR genómica efectuada nas amostras de DNA de cada indivíduo em condições semelhantes às descritas acima para a geração de marcadores bialélicos.
Numa especificação preferida, as amostras de DNA amplificado são sujeitas a reacções de microssequenciação automáticas utilizando ddNTPs fluorescentes (fluorescência específica para cada ddNTP) e os "primers" de microssequenciação oligonucleotídicos apropriados que hibridizam imediatamente a montante da base polimórfica. A genotipagem é suplementarmente descrita no Exemplo 5. 3) Estudos de Associação de Um Único Marcador e Análise de Frequência de Haplótipos
Os métodos para determinar a significância estatística de uma correlação entre um fenótipo e um genótipo, neste caso um alelo num marcador bialélico ou um haplótipo constituído por esses alelos, podem ser efectuados por qualquer teste estatístico conhecido na área e sendo necessário qualquer limite aceite de significância estatística. A aplicação de métodos particulares e limites de significância pertencem ao âmbito do habitualmente experimentado na área.
Procede-se à realização de testes quanto à associação determinando a frequência de um alelo de um marcador bialélico em populações de caso e controlo e comparando 104 estas frequências com um teste estatístico, para determinar se a diferença das frequências é estatisticamente significativa, o que indica uma correlação entre a característica e o alelo do marcador bialélico em estudo. De modo semelhante, efectua-se uma análise de haplótipos estimando as frequências de todos os haplótipos possíveis para um dado conjunto de marcadores bialélicos em populações de caso e controlo e comparando estas frequências com um teste estatístico, para determinar se a sua correlação entre o haplótipo e o fenótipo (característica) em estudo é estatisticamente significativa. Pode utilizar-se qualquer ferramenta estatística útil para testar quanto a uma associação estatisticamente significativa entre um genótipo e um fenótipo. Preferivelmente, o teste estatístico empregue é um teste de qui-quadrado com um grau de liberdade. Calcula-se um valor P (o valor P é a probabilidade de ocorrer, por acaso, uma estatística tão grande ou maior do que a observada).
Em especificações preferidas de significância para fins de diagnóstico, quer como base positiva para outros testes de diagnóstico quer como ponto de partida preliminar para terapia preventiva precoce, o valor p relacionado com uma associação de marcadores bialélicos é preferivelmente cerca de 1 x IO”2 ou inferior, mais preferivelmente cerca de 1 x 10”4 ou inferior, para análise de um único marcador bialélico, e cerca de 1 x 10”3 ou inferior, ainda mais preferivelmente 1 x 10”6 ou inferior e ainda mais preferivelmente cerca de 1 x 10”8 ou inferior, para uma análise de haplótipos envolvendo dois ou mais marcadores. Crê-se que estes valores são aplicáveis a quaisquer estudos de associação envolvendo um único ou combinações de múltiplos marcadores. 105 O experimentado pode utilizar a gama de valores apresentada acima como ponto de partida para efectuar estudos de associação com marcadores bialélicos. Ao fazê-lo, associações significativas entre os marcadores bialélicos da presente invenção e uma doença envolvendo a via dos leucotrienos podem ser reveladas e utilizadas para fins de diagnóstico e de rastreio de fármacos.
Para abordar o problema de positivos falsos, pode efectuar-se uma análise semelhante com as mesmas populações de caso-controlo em regiões genómicas aleatórias. Comparam-se os resultados em regiões aleatórias e na região candidata como descrito na Candidatura de Patente Provisória US co-pendente intitulada "Methods, Software And Apparati for Identifying Genomic Regions Harboring A Gene Associated With A Detectable Trait", Número de Série U.S. 60/107 986, registada em 10 de Novembro de 1998.
Associação de um único marcador
Os estudos de associação são habitualmente efectuados em dois passos sucessivos. Numa primeira fase determinam-se as frequências de um número reduzido de marcadores bialélicos, habitualmente entre 2 e 10 marcadores, nas populações característica + e caracteristica -. Numa segunda fase da análise determina-se suplementarmente de forma mais precisa a posição dos loci genéticos responsáveis por essa caracteristica utilizando um conjunto de marcadores de densidade mais elevada. No entanto, se o gene candidato em estudo tiver um comprimento relativamente pequeno, como é o caso do gene FLAP, crê-se que uma única fase seja suficiente para estabelecer associações significativas.
Numa especificação preferida em que se encontrou uma correlação entre um conjunto de marcadores bialélicos do gene FLAP e uma doença envolvendo a via dos leucotrienos, 106 mais particularmente asma, os resultados do primeiro passo do estudo de associação, dos quais se fornecem mais pormenores no exemplo 7, parecem indicar que a asma está mais fortemente associada ao marcador bialélico A19 (10-35/390, alelo T). Fornecem-se no Exemplo 7 pormenores suplementares respeitantes a estas associações.
Também podem conduzir-se estudos de associação semelhantes com outros marcadores bialélicos, preferivelmente com marcadores bialélicos em desequilíbrio de liqação com os marcadores associados a asma, incluindo os marcadores bialélicos AI até A28. O técnico experimentado pode conduzir rotineiramente estudos de associação semelhantes utilizando os marcadores bialélicos definidos acima com diferentes populações característica + e característica -. Outros exemplos suplementares de possíveis estudos de associação utilizando marcadores bialélicos do gene FLAP, incluindo os marcadores bialélicos AI até A28, envolvem estudos nas populações seguintes: uma população característica + que sofre de uma doença envolvendo a via dos leucotrienos e uma população saudável não afectada, ou - uma população característica + tratada com agentes que actuam na via dos leucotrienos que sofre de efeitos secundários resultantes do tratamento e uma população característica - tratada com os mesmos agentes sem quaisquer efeitos secundários, ou - uma população característica + tratada com agentes que actuam na via dos leucotrienos exibindo uma resposta benéfica e uma população característica - tratada com os mesmos agentes sem qualquer resposta benéfica. 107
Análise de frequência de haplótipos
Uma análise de haplótipos é interessante por aumentar a significância estatística de uma análise envolvendo marcadores individuais. De facto, ao combinar a informação de um conjunto de marcadores bialélicos, aumenta o valor dos resultados obtidos por análises de associação, permitindo eliminar dados positivos e/ou negativos falsos gue possam resultar dos estudos de um único marcador.
Numa primeira fase de uma análise de frequência de haplótipos determina-se a frequência dos possíveis haplótipos com base em várias combinações dos marcadores bialélicos identificados da invenção, sendo comparada para populações distintas de indivíduos característica + e característica -. 0 número de indivíduos característica + que deve ser submetido a esta análise para se obterem resultados estatisticamente significativos varia habitualmente entre 30 e 300, em que um número preferido de indivíduos varia entre 50 e 150. Aplicam-se as mesmas considerações ao número de controlos não afectados utilizados no estudo.
Os resultados desta primeira análise fornecem frequências de haplótipos para os indivíduos característica + e característica - testados e o valor p estimado para cada haplótipo avaliado.
Na associação dos marcadores bialélicos do gene FLAP com a asma, verificou-se que vários haplótipos também eram significativos (ver Figura 3). Por exemplo, os haplótipos preferidos compreendem o alelo T do marcador bialélico AI9 (10-35/390). O haplótipo mais preferido (HAP 1 da Figura 3) compreende o alelo A do marcador A14 (10-33/234) e o alelo T do marcador AI9 (10-35/390). Este haplótipo é considerado altamente significativo de uma associação com asma. Os 108 outros haplótipos significativos estão pormenorizados no Exemplo 8.
Para confirmar a significância estatística da primeira fase da análise de haplótipos descrita acima, pode ser adequado efectuar outras análises em que dados de genotipagem de indivíduos caso-controlo são reunidos e aleatorizados relativamente ao fenótipo da característica. Cada dado da genotipagem individual é aleatoriamente atribuído a dois grupos, que contêm o mesmo número de indivíduos das populações de caso-controlo utilizadas para compilar os dados obtidos na primeira fase. Uma segunda fase da análise de haplótipos é preferivelmente conduzida nestes grupos artificiais, preferivelmente para os marcadores incluídos no haplótipo da primeira fase da análise exibindo o coeficiente de risco relativo mais elevado. Esta experiência é iterada preferivelmente pelo menos entre 100 e 10000 vezes. As iterações repetidas permitem determinar a probabilidade de obter, por acaso, o haplótipo testado.
Para a associação entre asma e os três haplótipos considerados, uma análise de haplótipos aleatorizada foi iterada 1000 vezes ou 10000 vezes; os resultados estão apresentados na Figura 4. Estes resultados demonstram que em 1000 iterações nenhum e em 10 000 iterações apenas 1 dos haplótipos obtidos tinha um valor p comparável ao obtido para o haplótipo HAP1. Estes resultados validam claramente a significância estatística da associação entre este haplótipo e asma. A utilização do método descrito acima e a avaliação das associações para alelos de um único marcador ou para haplótipos permite fazer uma estimativa do risco que um transportador correspondente tem de desenvolver uma dada característica e, particularmente no contexto da presente 109 invenção, uma doença, preferivelmente uma doença envolvendo a via dos leucotrienos, mais preferivelmente asma. Os limites de significância de riscos relativos devem ser adaptados à população de amostra de referência utilizada. A avaliação dos factores de risco é pormenorizada em "Métodos estatísticos".
Obviamente, será entendido pelos técnicos experimentados no tratamento de doenças envolvendo a via dos leucotrienos listada acima, e em particular de asma, que não se pretende que a presente invenção forneça uma identificação absoluta de indivíduos que podem estar em risco de desenvolver uma doença particular envolvendo a via dos leucotrienos ou que irão ou não responder, ou exibir efeitos secundários, ao tratamento com agentes que actuam na via dos leucotrienos; ao invés, irá indicar um certo grau ou probabilidade de desenvolver uma doença ou de se observar, num dado indivíduo, uma resposta ou um efeito secundário ao tratamento com esses agentes.
Todavia, esta informação é extremamente valiosa, pois pode, em certas circunstâncias, ser utilizada para iniciar tratamentos preventivos ou para permitir a um indivíduo com um haplótipo significativo antever sinais de aviso, tais como pequenos sintomas. Em doenças como asma, em que os ataques podem ser extremamente violentos e por vezes fatais se não forem tratadas a tempo, o conhecimento de uma predisposição potencial, mesmo que esta predisposição não seja absoluta, poderá contribuir de um modo muito significativo para a eficácia do tratamento. De modo semelhante, uma predisposição diagnosticada a um efeito secundário potencial pode dirigir imediatamente o médico para um tratamento em que esses efeitos secundários não tenham sido observados durante ensaios clínicos. 110 X. Métodos Estatísticos
Em geral, pode utilizar-se qualquer método conhecido na área para testar se uma característica e um genótipo exibem uma correlação estatisticamente significativa. 1) Métodos para Estimar Frequências de Haplótipos numa População A fase gamética de haplótipos é desconhecida quando indivíduos diplóides são heterozigóticos em mais do que um locus. Utilizando informação genealógica de famílias, por vezes a fase gamética pode ser inferida (Perlin et al., 1994). Quando não está disponível nenhuma informação genealógica, podem utilizar-se diferentes estratégias. Uma possibilidade é que os diplóides heterozigóticos em múltiplos sítios possam ser eliminados da análise, mantendo apenas os indivíduos homozigóticos e os heterozigóticos num único sítio, mas esta abordagem poderá conduzir a um possível desequilíbrio da composição da amostra e a subestimar haplótipos de baixa frequência. Outra possibilidade é que cromossomas isolados possam ser estudados independentemente, por exemplo, por amplificação por PCR assimétrica (ver Newton et al., 1989; Wu et al., 1989) ou por isolamento de um único cromossoma por diluição limitante seguida de amplificação por PCR (ver Ruano et al., 1990). Suplementarmente, uma amostra pode ser
submetida a haplotipagem quanto a marcadores bialélicos suficientemente próximos por amplificação por PCR dupla de alelos específicos (Sarkar, G. e Sommer S. S., 1991). Estas abordagens não são inteiramente satisfatórias, quer devido à sua complexidade técnica, ao custo adicional que implicam, à sua falta de generalização a larga escala ou a possíveis desequilíbrios que introduzem. Para ultrapassar estas dificuldades pode utilizar-se um algoritmo para inferir a fase de genótipos de DNA amplificado por PCR 111 introduzido por Clark, A.G. (1990). Em resumo, o principio consiste em preencher uma lista preliminar de haplótipos presentes na amostra examinando indivíduos inequívocos, isto é, os homozigóticos completos e os heterozigóticos de um único sítio. Em seguida, outros indivíduos da mesma amostra são rastreados quanto à possível ocorrência de haplótipos previamente reconhecidos. Para cada identificação positiva, o haplótipo complementar é adicionado à lista de haplótipos reconhecidos até a informação de fase para todos os indivíduos estar resolvida ou ser identificada como não resolvida. Este método atribui um único haplótipo a cada indivíduo multi-heterozigótico, ao passo que vários haplótipos são possíveis quando há mais do que um sítio heterozigótico. Alternativamente, podem utilizar-se métodos que fazem uma estimativa das frequências de haplótipos numa população sem atribuir haplótipos a cada indivíduo. Preferivelmente utiliza-se um método baseado num algoritmo de maximização da expectativa (EM) (Dempster et al., 1977), que conduz a estimativas de máxima verosimilhança de frequências de haplótipos presumindo as proporções de Hardy-Weinberg (emparelhamento aleatório) (ver Excoffier L. e Slatkin M., 1995). O algoritmo de EM é uma abordagem à estimativa de máxima verosimilhança iterativa generalizada que é útil quando os dados são ambíguos e/ou incompletos. Utiliza-se o algoritmo de EM para resolver heterozigóticos em haplótipos. O algoritmo de EM pode ser aplicado, por exemplo, utilizando o programa EM-HAPLO (Hawley Μ. E. et al., 1994) ou o programa Arlequin (Schneider et al., 1997). Pode utilizar-se qualquer outro método conhecido na área para determinar ou estimar a frequência de um haplótipo numa população (ver Lange K., 1997; Weir, B.S., 1996). O algoritmo EM é brevemente descrito abaixo. 112
Uma amostra de N indivíduos não relacionados é submetida a tipagem quanto a K marcadores. Os dados observados são os fenótipos de K-locus de fase desconhecida que podem ser classificados em F fenótipos diferentes. Suponhamos que temos H haplótipos possíveis subjacentes (no caso de K marcadores bialélicos, H = 2K) .
Para o fenótipo j suponhamos que são possíveis Cj genótipos. Assim, temos a equação seguinte: c. <·.
Fj Σ. prfffeilótipoi)» Equação 1 em que Pj é a probabilidade do fenótipo j, hk e h2 são os dois haplótipos que constituem o genótipo i. No equilíbrio de Hardy-Weinberg, pr(hk,h]_) torna-se: pr{hk , hl) s jpt&k ) A* « A;, pr{> « 2pr{hk ).pr(hf ) se hk Φ kt. Equação ί
Os passos sucessivos do algoritmo E-M podem ser descritos do modo seguinte.
Começando com valores iniciais das frequências dos haplótipos, designadas Pi{0), P2(0>,... pH{0), estes valores iniciais servem para estimar as frequências dos genótipos (Passo de expectativa) e depois estimar outro conjunto de frequências dos haplótipos (Passo de maximização), designadas Pi{1), p2{1), . . . Ph(1>; estes dois passos são iterados até as alterações nos conjuntos de frequências dos haplótipos serem muito pequenas.
Um critério de terminação pode ser o seguinte: a diferença máxima entre frequências de haplótipos entre duas iterações é inferior a 1CT7. Estes valores podem ser ajustados de acordo com a precisão desejada das estimativas. 113
Numa dada iteração s, o Passo de expectativa consiste em calcular as frequências dos genótipos pela equação seguinte: pr (genótipoi) (s> = pr (fenótipOj) .pr (genótipoil fenótipoj) (s)
Ui n
Equação 3 em que o genótipo i ocorre no fenótipo j, e em que hk e h2 constituem o genótipo i. Cada probabilidade é derivada de acordo com a equação 1 e a equação 2 descritas acima.
Em seguida, o Passo de maximização simplesmente estima outro conjunto de frequências dos haplótipos, dadas as frequências dos genótipos. Esta abordagem também é conhecida como método de contagem de genes (Smith, 1957).
Pt “ L .^(jgenótipqi f L β -1 f - s
EqMijãn 4 em que ô±t é uma variável indicadora que conta o número de vezes do haplótipo t no genótipo i. Tomas os valores 0, 1 ou 2 .
Para assegurar que a estimativa finalmente obtida é a estimativa de máxima verosimilhança são necessários vários valores de partida. Comparam-se as estimativas obtidas e, se forem diferentes, mantêm-se as estimativas que conduzem à melhor verosimilhança. 2) Métodos para Calcular o Desequilíbrio de Ligação Entre Marcadores
Podem utilizar-se alguns métodos para calcular o desequilíbrio de ligação entre quaisquer duas posições genéticas; na prática, mede-se o desequilíbrio de ligação 114 aplicando um teste de associação estatística aos dados de haplótipos recolhidos de uma população. 0 desequilíbrio de ligação entre qualquer par de marcadores bialélicos compreendendo pelo menos um dos marcadores bialélicos da presente invenção (Mi, Mj), com os alelos (a±/h±) no marcador M± e alelos (aj/bj) no marcador Mj, pode ser calculado para cada combinação de alelos (a±,aj; ai,bj,· bi,aj e b±,bj), de acordo com a fórmula de Piazza: 4,»r ^84 - V (94 + 03) (04 +92)* em que: Θ4 = — = frequência de genótipos sem o alelo ai em Mi e sem o alelo aj em Mj 03 = -+ = frequência de genótipos sem o alelo ai em Mi e com o alelo aj em Mj 02 = +- = frequência de genótipos com o alelo a± em Mi e sem o alelo aj em Mj 0 desequilíbrio de ligação (LD) entre pares de marcadores bialélicos (M±, Mj) também pode ser calculado para cada combinação de alelos (ai,aj,· a±,bj; b±,aj e b±,bj) de acordo com a estimativa de máxima verosimilhança (MLE) para delta (o coeficiente de desequilíbrio genotípico composto), como descrito por Weir (Weir B. S., 1996). A MLE para o desequilíbrio de ligação composto é:
Dsi*r (2fti + fij + «V2>*N - pr(a.)) em que ηι=Σ fenótipo (ai/ai, aj/aj), η2=Σ fenótipo aj/bj), η3 = Σ fenótipo (ai/bi, aj/aj), η4 = Σ fenótipo (ai/bi, aj/bj) e N é o número de indivíduos na amostra.
Esta fórmula permite estimar o desequilíbrio de ligação entre alelos só quando estão disponíveis dados de genótipos e não de haplótipos. 115
Outro modo de calcular o desequilíbrio de ligação entre marcadores é o seguinte. Para um par de marcadores bialélicos, Mi(a±/b±) e Mj(ãj/bj), que cumprem a condição de equilíbrio de Hardy-Weinberg, é possível estimar as frequências dos quatro haplótipos possíveis numa dada população de acordo com a abordagem descrita acima. A estimativa do desequilíbrio gamético entre a± e ãj é simplesmente: 88 M haplótipc^. s }} ... py{itt },pr(a j )v em que pr (a±) é a probabilidade do alelo a± e pr(ãj) é a probabilidade do alelo ãj e em que pr (haplótipo (a±, a-j)) é estimado como na Equação 3 acima.
Para um par de marcadores bialélicos é necessária apenas uma medida de desequilíbrio para descrever a associação entre M± e Mj.
Em seguida calcula-se um valor normalizado do obtido acima, do modo seguinte: f ρφ$ *'|»r(l>í). pr(b$ com ® 1 «*** ίρΦί)* ρΦ()' pr<bj.)> com 0 experimentado apreciará facilmente que se podem utilizar outros métodos de cálculo do desequilíbrio de ligação. 0 desequilíbrio de ligação entre um conjunto de marcadores bialélicos com uma taxa de heterozigosidade adequada pode ser determinado por genotipagem de entre 50 e 1000 indivíduos não relacionados, preferivelmente entre 75 e 200, mais preferivelmente cerca de 100. 3) Avaliação de Factores de Risco
Mede-se a associação entre um factor de risco (em epidemiologia genética, o factor de risco é a presença ou a ausência de um certo alelo ou haplótipo em loci do marcador) e uma doença pela razão de probabilidade (OR) e 116 pelo risco relativo (RR) . Se P(R+) for a probabilidade de desenvolver a doença para indivíduos com R e P(R“) for a probabilidade para indivíduos sem o factor de risco, então o risco relativo é simplesmente a razão das duas probabilidades, isto é: RR = P (R+) /P (R-) .
Em estudos de caso-controlo, não podem obter-se medidas directas do risco relativo devido à concepção da amostragem. No entanto, a razão de probabilidade permite obter uma boa aproximação do risco relativo para doenças de baixa incidência, podendo ser calculada do modo seguinte: OR = (F+/(1-F+) )/(F-/(1-F-) ) . F+ é a frequência da exposição ao factor de risco em casos e F“ é a frequência da exposição ao factor de risco em controlos. F+ e F~ são calculadas utilizando as frequências alélicas ou de haplótipos do estudo e dependem suplementarmente do modelo genético subjacente (dominante, recessivo, aditivo...). É possível estimar suplementarmente o risco atribuível (AR), que descreve a proporção de indivíduos numa população exibindo uma característica devido a um dado factor de risco. Esta medida é importante na quantificação do papel de um factor específico na etiologia de uma doença e em termos do impacto na saúde pública de um factor de risco. A relevância desta medida para a saúde pública reside em estimar a proporção de casos de doença na população que poderia ser prevenida se a exposição de interesse estivesse ausente. 0 AR determina-se do modo seguinte:
AR-P* P4) /{PE AR é o risco atribuível a um alelo de um marcador bialélico ou a um haplótipo de um marcador bialélico. PE é a frequência da exposição a um alelo ou haplótipo na população em geral, e RR é o risco relativo, que é 117 aproximadamente a razão de probabilidade quando a caracteristica em estudo tem uma incidência relativamente baixa na população em geral. XI. Identificação de Marcadores Bialélicos em Desequilíbrio de Ligação com os Marcadores Bialélicos Descritos na Presente Invenção
Depois de um primeiro marcador bialélico ter sido identificado numa região genómica de interesse, o habitualmente experimentado na área, utilizando os ensinamentos da presente invenção, pode facilmente identificar marcadores bialélicos adicionais em desequilíbrio de ligação com este primeiro marcador. Como mencionado antes, qualquer marcador em desequilíbrio de ligação com um primeiro marcador associado a uma caracteristica estará associado à característica. Em consequência, depois de ter sido demonstrado existir uma associação entre um dado marcador bialélico e uma característica, a descoberta de marcadores bialélicos adicionais associados a esta característica é de grande interesse para aumentar a densidade de marcadores bialélicos nesta região particular. 0 gene ou mutação causal será encontrado na vizinhança do marcador ou conjunto de marcadores exibindo a maior correlação com a característica. A invenção também revela um método para identificar e caracterizar um marcador bialélico em desequilíbrio de ligação com um marcador bialélico de um gene FLAP, preferivelmente um marcador bialélico de um gene FLAP do qual um alelo está associado a uma característica. Numa especificação, o marcador bialélico em desequilíbrio de ligação com um marcador bialélico do gene FLAP situa-se na região genómica que alberga o gene FLAP mas fora do próprio 118 gene FLAP. Noutra especificação, o marcador bialélico em desequilíbrio de ligação com um marcador bialélico do gene FLAP está, ele próprio, localizado no gene FLAP. 0 método compreende os passos seguintes: a) amplificar um fragmento genómico compreendendo um primeiro marcador bialélico a partir de uma pluralidade de indivíduos; b) identificar segundos marcadores bialélicos na região genómica que alberga o primeiro marcador bialélico; c) conduzir uma análise de desequilíbrio de ligação entre o referido primeiro marcador bialélico e segundos marcadores bialélicos, e d) seleccionar os referidos segundos marcadores bialélicos em desequilíbrio de ligação com o referido primeiro marcador.
Numa especificação, o passo de sequenciar e identificar segundos marcadores bialélicos compreende sequenciar segundos marcadores bialélicos no gene FLAP. Numa especificação suplementar, o passo de sequenciar e identificar segundos marcadores bialélicos compreende sequenciar segundos marcadores bialélicos na região amplificada do gene FLAP.
Depois de identificadas, as sequências em desequilíbrio de ligação com um marcador bialélico do gene FLAP podem ser utilizadas em qualquer um dos métodos descritos aqui, incluindo métodos para determinar uma associação entre um marcador bialélico e uma característica, métodos para identificar indivíduos com uma predisposição para uma característica, métodos de tratamento de doenças, métodos para identificar indivíduos que provavelmente responderão de forma positiva ou negativa ao tratamento com fármacos e métodos para utilizar fármacos. Em particular, marcadores bialélicos em desequilíbrio de ligação com um marcador bialélico situado no gene FLAP podem ser utilizados para identificar indivíduos com predisposição para asma ou para 119 respostas positivas ou negativas ao tratamento com fármacos anti-asma, como Zileuton. Métodos para identificar marcadores bialélicos e para conduzir uma análise de desequilibrio de ligação são descritos aqui em "Métodos estatisticos" e podem ser conduzidos pelo técnico experimentado sem experimentação indevida. Assim, a presente invenção também revela marcadores bialélicos em desequilibrio de ligação com os marcadores bialélicos especificos AI até A28 e que se espera apresentarem caracteristicas semelhantes em termos da sua associação respectiva a uma dada caracteristica.
XII. Identificação de Mutações Causadoras de Caracteristicas no Gene FLAP
As mutações no gene FLAP que são responsáveis por um fenótipo detectável podem ser identificadas comparando as sequências dos genes FLAP de individuos positivos para a caracteristica e negativos para a caracteristica. Preferivelmente, individuos caracteristica + a serem sequenciados têm o haplótipo que se verifica estar associado à caracteristica, e individuos caracteristica - a serem sequenciados não têm o haplótipo associado à caracteristica. 0 fenótipo detectável pode compreender uma variedade de manifestações de função alterada da FLAP, incluindo uma doença envolvendo a via dos leucotrienos, uma resposta a um agente que actua na via dos leucotrienos ou efeitos secundários ligados a um tratamento com este agente. As mutações podem compreender mutações pontuais, deleções ou inserções no gene FLAP. As mutações podem situar-se na sequência codificadora para a proteina FLAP ou em regiões reguladoras do gene FLAP. 0 método utilizado para detectar essas mutações compreende geralmente os passos seguintes: a) amplificação 120 de uma região do gene FLAP compreendendo um marcador bialélico ou um grupo de marcadores bialélicos associados à caracteristica a partir de amostras de DNA de pacientes positivos para a caracteristica e de controlos negativos para a caracteristica; b) sequenciação da região amplificada; c) comparação de sequências de DNA de pacientes positivos para a caracteristica e controlos negativos para a caracteristica, e d) determinação de mutações especificas de pacientes positivos para a caracteristica.
Constroem-se "primers" oligonucleotidicos como descrito previamente para amplificar as sequências de cada um dos exões, intrões ou da região promotora do gene FLAP.
Utiliza-se cada par de "primers" para amplificar o exão ou região promotora de onde é derivado. A amplificação é efectuada em amostras de DNA genómico de pacientes positivos para a caracteristica e de controlos negativos para a caracteristica, preferivelmente utilizando as condições de PCR descritas nos exemplos. Em seguida, os produtos de amplificação das PCRs genómicas são sujeitos a sequenciação, preferivelmente por reacções de sequenciação com terminação didesoxi automáticas, e são submetidos a electroforese, preferivelmente em sequenciadores ABI 377. Após análise de imagens em gel e extracção de sequências de DNA, os dados de sequências ABI são automaticamente analisados para detectar a presença de variações de sequências entre indivíduos positivos para a caracteristica e negativos para a caracteristica. As sequências são verificadas determinando as sequências de ambos os filamentos do DNA de cada indivíduo.
Em seguida, verificam-se os polimorfismos candidatos suspeitos de serem responsáveis pelo fenótipo detectável, como uma doença, uma resposta benéfica a um agente que 121 actua na via dos leucotrienos ou efeitos secundários ligados a um tratamento com este agente, por rastreio de uma população maior de indivíduos positivos para a característica e negativos para a característica utilizando técnicas de análise de polimorfismos, como as técnicas descritas acima. Os polimorfismos que exibem uma correlação estatisticamente significativa com o fenótipo detectável são considerados responsáveis pelo fenótipo detectável. A maior parte dos polimorfismos bialélicos do gene FLAP observados no contexto da presente invenção não parecem modificar drasticamente a sequência de aminoácidos da proteína FLAP. Também não parecem estar localizados em sequências de processamento. No entanto, podem estar associados a alterações da expressão básica do FLAP em um ou mais tecidos. Esses polimorfismos podem eventualmente modificar a velocidade da transcrição do DNA do FLAP, estabilidade do mRNA do FLAP ou a velocidade da tradução do mRNA do FLAP.
Os polimorfismos bialélicos também podem estar associados a alterações da modulação da expressão do FLAP através de modificadores da expressão. Pretende-se que o termo "modificador da expressão" abranja agentes químicos que modulam a acção da FLAP por modulação da expressão do gene FLAP.
Os níveis de expressão básica do FLAP em diferentes tecidos podem ser determinados por análises de amostras de tecidos de indivíduos submetidos a tipagem quanto à presença ou ausência de um polimorfismo específico. Pode utilizar-se qualquer método conveniente, como ELISA, RIA para a quantificação proteica, e como coloração "Northern" ou outras análises de hibridização, e RT-PCR quantitativa para a quantificação de mRNA. A expressão específica para tecidos pode então ser correlacionada com o genótipo. Mais 122 pormenores de alguns destes métodos são fornecidos abaixo na secção "Rastreio de agentes".
Suplementarmente, a associação forte observada pela primeira vez entre o gene FLAP e asma confirma a necessidade de localizar e estudar qualquer mutação do gene FLAP, pois essa mutação é susceptível de ter incidência no metabolismo dos leucotrienos e, assim, nas escolhas terapêuticas feitas quando se consideram várias alternativas de tratamento para um indivíduo com um estado particular envolvendo a via dos leucotrienos. Há numerosas possibilidades para mutações causais no gene FLAP. Uma das mutações causais pode ser uma alteração de aminoácidos na proteína FLAP que pode conduzir a alterações na especificidade para o substrato e/ou actividade da FLAP. Métodos para analisar interacções proteína-proteína ou proteína-ligando são pormenorizados abaixo na secção "Rastreio de agentes".
Outra possível mutação causal do gene FLAP é uma modificação na sua região reguladora e, particularmente, na sequência do seu promotor nativo. Este tipo de mutação pode ser estudado através da determinação dos níveis de expressão básica por ensaios de expressão quanto à sequência promotora particular. Os ensaios podem ser efectuados com a sequência codificadora da FLAP ou com uma sequência marcadora detectável. Para determinar a especificidade para tecidos, o ensaio é efectuado em células de diferentes fontes. Alguns métodos são descritos em mais pormenor abaixo na secção "Rastreio de agentes".
Sempre que for aqui utilizado, pretende-se que o termo "níveis de expressão básica" designe níveis de expressão do FLAP normalmente observados em indivíduos que não têm o alelo associado de marcadores bialélicos da presente invenção. 123
Noutra especificação, o alelo do FLAP mutante que causa um fenótipo detectável pode ser isolado obtendo uma amostra de ácido nucleico, tal como uma biblioteca genómica ou uma biblioteca de cDNA, de um indivíduo que expressa o fenótipo detectável. A amostra de ácido nucleico pode entrar em contacto com uma ou mais sondas situadas na região do gene FLAP onde o marcador bialélico ou grupo de marcadores bialélicos associado, ou com "primers" que podem ser submetidos a tipagem de PCR específicos para a amplificação deste marcador bialélico ou grupo de marcadores bialélicos. A mutação pode ser identificada conduzindo reacções de sequenciação nos ácidos nucleicos que hibridizam com as sondas definidas aqui ou que exibem amplificação por PCR. A região do gene FLAP contendo a mutação responsável pelo fenótipo detectável pode ser utilizada em técnicas de diagnóstico, como as descritas abaixo. Por exemplo, podem utilizar-se oligonucleótidos de microssequenciação, ou oligonucleótidos contendo a mutação responsável pelo fenótipo detectável para amplificação, ou diagnósticos à base de hibridização, como os descritos aqui, para detectar indivíduos que sofrem do fenótipo detectável ou indivíduos em risco de desenvolver o fenótipo detectável numa altura subsequente. Adicionalmente, o alelo do FLAP responsável pelo fenótipo detectável pode ser utilizado em terapia genética. 0 alelo do FLAP responsável pelo fenótipo detectável também pode ser clonado num vector de expressão para expressar a proteína FLAP mutante, como descrito aqui. XIII. Marcadores Bialélicos em Métodos de Diagnóstico Genético
Os marcadores bialélicos revelados na invenção também podem ser utilizados para desenvolver testes de diagnóstico capazes de identificar indivíduos que expressam uma 124 característica detectável em resultado de um genótipo específico, ou indivíduos cujo genótipo os coloca em risco de desenvolver uma característica detectável numa altura subsequente. A característica analisada utilizando os presentes diagnósticos pode ser qualquer característica detectável, incluindo uma doença envolvendo a via dos leucotrienos, uma resposta benéfica ao tratamento com agentes que actuam na via dos leucotrienos ou efeitos secundários relacionados com o tratamento com agentes que actuam na via dos leucotrienos.
As técnicas de diagnóstico podem empregar uma variedade de metodologias para determinar se um sujeito de teste tem um padrão de marcadores bialélicos associado a um risco acrescido de desenvolver uma característica detectável, ou se o indivíduo sofre de uma característica detectável em resultado de uma mutação particular, incluindo métodos que permitem a análise de cromossomas individuais para haplotipagem, como estudos de famílias, análise de DNA de esperma isolado ou híbridos somáticos. A presente invenção revela métodos de diagnóstico para determinar se um indivíduo está em risco de desenvolver uma doença ou sofre de uma doença resultante de uma mutação ou de um polimorfismo no gene FLAP. A presente invenção também revela métodos para determinar se é provável que um indivíduo responda positivamente a um agente que actua na via dos leucotrienos, ou se um indivíduo está em risco de desenvolver um efeito secundário adverso a um agente que actua na via dos leucotrienos.
Estes métodos envolvem obter uma amostra de ácido nucleico do indivíduo e determinar se a amostra de ácido nucleico contém pelo menos um alelo ou pelo menos um haplótipo de um marcador bialélico, indicador de risco de desenvolver a característica ou indicador do indivíduo 125 expressar a característica em resultado de possuir um polimorfismo ou mutação particular no FLAP (alelo causador da característica).
Preferivelmente, nesses métodos de diagnóstico obtém-se uma amostra de ácido nucleico do indivíduo, e esta amostra é submetida a genotipagem utilizando métodos descritos acima em VIII. Os diagnósticos podem basear-se num único marcador bialélico ou num grupo de marcadores bialélicos.
Em cada um destes métodos obtém-se uma amostra de ácido nucleico do sujeito de teste e determina-se o padrão de marcador bialélico de um ou mais dos marcadores bialélicos AI até A2 8, respectivos complementos ou de um marcador bialélico em desequilíbrio de ligação com aqueles.
Numa especificação, conduz-se uma amplificação por PCR na amostra de ácido nucleico, para amplificar regiões onde foram identificados polimorfismos associados a um fenótipo detectável. Os produtos de amplificação são sequenciados para determinar se o indivíduo possui um ou mais polimorfismos do FLAP associados a um fenótipo detectável. Os "primers" utilizados para gerar produtos de amplificação podem compreender os "primers" BI até B17 e Cl até C17. Alternativamente, a amostra de ácido nucleico é sujeita a reacções de microssequenciação como descrito acima para determinar se o indivíduo possui um ou mais polimorfismos do FLAP associados a um fenótipo detectável, resultante de uma mutação ou de um polimorfismo no gene FLAP. Os "primers" utilizados nas reacções de microssequenciação podem incluir os "primers" Dl até D28 e EI até E28. Noutra especificação, a amostra de ácido nucleico entra em contacto com uma ou mais sondas oligonucleotídicas específicas para alelos que hibridizam especificamente para um ou mais alelos do FLAP associados a um fenótipo detectável. As sondas utilizadas no ensaio de hibridização 126 podem incluir as sondas PI até P28, respectiva sequência complementar ou respectivo fragmento compreendendo a base polimórfica. Noutra especificação, a amostra de ácido nucleico entra em contacto com um segundo oligonucleótido do FLAP capaz de produzir um produto de amplificação quando utilizado com o oligonucleótido específico para alelos numa reacção de amplificação. A presença de um produto de amplificação na reacção de amplificação indica que o indivíduo possui um ou mais alelos do FLAP associados a um fenótipo detectável.
Numa especificação preferida, determina-se a identidade do nucleótido presente em pelo menos um marcador bialélico seleccionado do grupo que consiste em A2, A14, A16, A18, A19, A22 e A23, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles, e a característica detectável é asma. Noutra especificação preferida, determina-se a identidade do nucleótido presente em pelo menos um dos sítios polimórficos seleccionados do grupo que consiste em A14 e Al 9, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Numa especificação mais preferida, determina-se a identidade do nucleótido presente no sitio polimórfico A19, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. Descrevem-se suplementarmente na presente invenção estojos de diagnóstico compreendendo polinucleótidos da presente invenção.
Estes métodos de diagnóstico são extremamente valiosos pois podem, em certas circunstâncias, ser utilizados para iniciar tratamentos preventivos ou para permitir a um indivíduo com um haplótipo significativo antever sinais de aviso, tais como pequenos sintomas. Em doenças em que os 127 ataques podem ser extremamente violentos e por vezes fatais se não forem tratadas a tempo, como asma, o conhecimento de uma predisposição potencial, mesmo que esta predisposição não seja absoluta, poderá contribuir de um modo muito importante para a eficácia do tratamento. A presente invenção também revela estojos de diagnóstico compreendendo um ou mais polinucleótidos da invenção, com uma porção ou todos os reagentes necessários e instruções para a genotipagem de um sujeito de teste por determinação da identidade de um nucleótido num marcador bialélico relacionado com o FLAP. Os polinucleótidos de um estojo podem estar opcionalmente ligados a um suporte sólido, ou podem fazer parte de uma série ou série endereçável de polinucleótidos. 0 estojo pode proporcionar a determinação da identidade do nucleótido na posição de um marcador por qualquer método conhecido na área, incluindo, mas não se limitando a um método de ensaio de sequenciação, um método de ensaio de microssequenciação, um método de ensaio de hibridização ou um ensaio de detecção de emparelhamentos defeituosos à base de polimerases e/ou ligases. Os estojos de diagnóstico podem ser produzidos para efectuarem qualquer um dos métodos de genotipagem descritos na presente candidatura utilizando métodos de fabrico e formulação habitualmente utilizados na área. Preferivelmente, esse estojo pode proporcionar a determinação do alelo de um marcador bialélico seleccionado entre marcadores bialélicos relacionados com o FLAP. Opcionalmente, esse estojo pode incluir instruções para pontuar os resultados da determinação relativamente ao risco dos sujeitos de teste de contraírem uma doença envolvendo a via dos leucotrienos, uma resposta benéfica ao tratamento com agentes que actuam na via dos leucotrienos 128 ou efeitos secundários relacionados com o tratamento com agentes que actuam na via dos leucotrienos. XIV. Tratamento de Doenças Envolvendo a Via dos
Leucotrienos A invenção também revela um método para determinar se é provável que um sujeito responda positivamente ao tratamento com um medicamento, preferivelmente um medicamento que actua directamente ou indirectamente na via dos leucotrienos. 0 método compreende identificar uma primeira população de indivíduos que responde positivamente a esse medicamento e uma segunda população de indivíduos que responde negativamente a esse medicamento. Na primeira população identificam-se um ou mais marcadores bialélicos que estão associados a uma resposta positiva a esse medicamento, ou na segunda população identificam-se um ou mais marcadores bialélicos que estão associados a uma resposta negativa a esse medicamento. Os marcadores bialélicos podem ser identificados utilizando as técnicas descritas aqui.
Em seguida obtém-se a amostra de DNA do sujeito testado. Analisa-se a amostra de DNA para determinar se compreende um ou mais alelos de marcadores bialélicos associados a uma resposta positiva a um medicamento, ou um ou mais alelos de marcadores bialélicos associados a uma resposta negativa ao tratamento com o medicamento. Em algumas especificações, analisa-se a amostra de DNA para identificar sujeitos cujo DNA compreende um ou mais alelos de marcadores bialélicos associados a uma resposta positiva ao medicamento e cujo DNA não tem um ou mais alelos de marcadores bialélicos associados a uma resposta negativa ao tratamento com o medicamento. 129
Noutras especificações, o medicamento é administrado ao sujeito num ensaio clinico se a amostra de DNA contiver um ou mais alelos de marcadores bialélicos associados a uma resposta positiva ao medicamento e/ou se a amostra de DNA não tiver um ou mais alelos de marcadores bialélicos associados a uma resposta negativa ao tratamento com o medicamento. Em especificações preferidas, o medicamento é um fármaco anti-asma, como Zileuton. Noutras especificações, a resposta negativa compreende um ou mais efeitos secundários, como níveis aumentados de transaminases no fígado. Ao utilizar os métodos descritos na presente invenção, pode conduzir-se a avaliação da eficácia do fármaco numa população de indivíduos que provavelmente responderá de modo favorável ao medicamento. A invenção também revela um método para a realização de testes clínicos de um medicamento, preferivelmente um medicamento que actua directamente ou indirectamente na via dos leucotrienos. 0 método compreende os passos seguintes: a) administrar um medicamento, preferivelmente um medicamento capaz de actuar directamente ou indirectamente na via dos leucotrienos, a uma população heterogénea de indivíduos; b) identificar uma primeira população de indivíduos que responde positivamente a esse medicamento e uma segunda população de indivíduos que responde negativamente a esse medicamento; c) identificar marcadores bialélicos nessa primeira população que estão associados a uma resposta positiva a esse medicamento e/ou marcadores bialélicos nessa segunda população que estão associados a uma resposta negativa a esse medicamento; d) seleccionar indivíduos cujo DNA compreende um ou mais alelos de marcadores bialélicos associados a uma resposta positiva a esse medicamento e/ou cujo DNA não tem um ou mais alelos de marcadores bialélicos associados a uma resposta negativa a 130 esse medicamento, e d) administrar esse medicamento a esses indivíduos.
Considera-se que esses métodos são extremamente úteis para aumentar a razão benefício/risco resultante da administração de medicamentos que podem causar efeitos secundários indesejáveis e/ou serem ineficazes numa porção da população de pacientes à qual é normalmente administrado.
Depois de um indivíduo ter sido diagnosticado como sofrendo de uma doença envolvendo a via dos leucotrienos, como asma, efectuam-se testes de selecção para determinar se o DNA deste indivíduo compreende alelos de um marcador bialélico ou de um grupo de marcadores bialélicos associados a uma resposta positiva ao tratamento ou a uma resposta negativa ao tratamento, o que pode incluir efeitos secundários ou ausência de sensibilidade. A selecção do paciente a ser tratado utilizando o método da presente invenção pode ser feita pelos métodos de detecção descritos acima. Os indivíduos a serem seleccionados são preferivelmente aqueles cujo DNA não compreende alelos de um marcador bialélico ou de um grupo de marcadores bialélicos associados a uma resposta negativa ao tratamento.
Depois de determinadas as predisposições genéticas do paciente, o médico pode seleccionar o tratamento apropriado para o qual não foi relatado, ou foi relatado apenas marginalmente, o efeito secundário particular observado para o paciente, e preferivelmente de uma associação alélica que não envolve o mesmo marcador ou marcadores bialélicos encontrados no DNA do paciente. Podem escolher-se vários fármacos úteis no tratamento de doenças envolvendo a via dos leucotrienos. Compostos que actuam na via dos leucotrienos são descritos, por exemplo, nas 131 patentes US 4 873 259, 4 970 215, 5 310 744, 5 225 421 e 5 081 138, ou em EP 0 419 049. XV. Proteínas FLAP e Fragmentos Polipeptídicos O termo "polipéptidos da FLAP" é aqui utilizado para abranger todas as proteínas e polipéptidos descritos na presente invenção. Também são descritos polipéptidos codificados pelos polinucleótidos da invenção, bem como polipéptidos de fusão compreendendo esses polipéptidos. A invenção revela proteínas FLAP de humanos, incluindo proteínas FLAP isoladas ou purificadas consistindo, consistindo essencialmente ou compreendendo a sequência da ID SEQ N° 3 e compreendendo uma isoleucina na posição 127 da ID SEQ N° 3. Deve notar-se que as proteínas FLAP da invenção se baseiam na variante de ocorrência natural da sequência de aminoácidos da FLAP humana, em que o resíduo valina da posição de aminoácido 127 da ID SEQ N° 3 foi substituído por um resíduo isoleucina. Esta proteína variante e respectivos fragmentos que contêm a posição de aminoácido 127 da ID SEQ N° 3 são colectivamente referidos aqui como "variantes 127-Ile" ou "polipéptidos da FLAP 127-Ile" . A presente invenção especifica polipéptidos isolados, purificados e recombinantes compreendendo uma extensão contígua de pelo menos 6 aminoácidos, preferivelmente pelo menos 8 até 10 aminoácidos, mais preferivelmente pelo menos 12, 15, 20, 25, 30, 40, 50 ou 100 aminoácidos da ID SEQ N° 3, em que essa extensão contígua inclui um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3. Noutras especificações preferidas, a extensão contígua de aminoácidos compreende o sítio de uma mutação ou mutação funcional, incluindo uma deleção, adição, troca ou truncamento dos aminoácidos da sequência da proteína FLAP. 132
As proteínas FLAP são preferivelmente isoladas de amostras de tecidos humanos ou de mamífero ou são expressas a partir de genes humanos ou de mamífero. Os polipéptidos FLAP da invenção podem ser preparados utilizando métodos de expressão de rotina conhecidos na área. 0 polinucleótido que codifica o polipéptido desejado é ligado num vector de expressão adequado para qualquer hospedeiro conveniente. Na formação dos polipéptidos recombinantes utilizam-se sistemas de hospedeiros eucariotas e procariotas, e um resumo de alguns dos sistemas mais comuns. Em seguida, o polipéptido é isolado de células submetidas a lise ou do meio de cultura e é purificado na extensão necessária para a sua utilização pretendida. A purificação é feita por qualquer técnica conhecida na área, por exemplo, extracção diferencial, fraccionamento em sal, cromatografia, centrifugação e afins. Ver, por exemplo, "Methods in Enzymology" quanto a uma variedade de métodos para purificar proteínas.
Adicionalmente, fragmentos proteicos mais curtos são produzidos por síntese química. Alternativamente, as proteínas da invenção são extraídas de células ou tecidos de humanos ou animais não humanos. Métodos para purificar proteínas são conhecidos na área e incluem a utilização de detergentes ou agentes caotrópicos para desagregar partículas, seguido de extracção diferencial e separação dos polipéptidos por cromatografia de permuta iónica, cromatografia de afinidade, sedimentação de acordo com a densidade e electroforese em gel.
Utiliza-se qualquer cDNA do FLAP, incluindo a ID SEQ N° 2, para expressar proteínas e polipéptidos FLAP. 0 cDNA do FLAP preferido compreende o alelo A do marcador bialélico A21. 0 ácido nucleico que codifica a proteína ou polipéptido FLAP a ser expresso é operativamente ligado a 133 um promotor num vector de expressão utilizando tecnologia de clonagem convencional. A inserção de FLAP no vector de expressão pode compreender a sequência codificadora completa para a proteína FLAP ou respectiva porção. Por exemplo, a inserção derivada do FLAP pode codificar um polipéptido compreendendo pelo menos 10 aminoácidos consecutivos da proteína FLAP da ID SEQ N° 3, cujos aminoácidos consecutivos compreendem um resíduo isoleucina na posição de aminoácido 127. O vector de expressão é qualquer um dos sistemas de expressão de mamífero, levedura, insecto ou bacteriano conhecidos na área. Vectores e sistemas de expressão comercialmente disponíveis são disponibilizados por uma variedade de fornecedores, incluindo a Genetics Institute (Cambridge, MA), Stratagene (La Jolla, Califórnia), Promega (Madison, Wisconsin) e Invitrogen (San Diego, Califórnia). Se desejado, para aumentar a expressão e facilitar o dobramento apropriado da proteína, o contexto de codões e o emparelhamento de codões da sequência são optimizados para o organismo de expressão particular onde é introduzido o vector de expressão, como explicado por Hatfield et al., Patente U.S. N° 5 082 767.
Numa especificação, a sequência codificadora completa do cDNA do FLAP, através do sinal poli A do cDNA, é operativamente ligada a um promotor no vector de expressão. Alternativamente, se o ácido nucleico que codifica uma porção da proteína FLAP não tiver uma metionina para servir de sítio de iniciação, pode introduzir-se uma metionina de iniciação a seguir ao primeiro codão do ácido nucleico utilizando técnicas convencionais. De modo semelhante, se a inserção do cDNA do FLAP não tiver um sinal poli A, esta sequência pode ser adicionada à construção, por exemplo, removendo por processamento o sinal Poli A de pSG5 134 (Stratagene), utilizando as enzimas endonucleases de restrição Bgll e Sall, e incorporando-o no vector de expressão de mamífero pXTl (Stratagene). 0 vector pXTl contém as LTRs e uma porção do gene gag do Vírus da Leucemia Murina de Moloney. A posição das LTRs na construção permite uma transfecção estável e eficiente. 0 vector inclui o promotor da Timidina Quinase de Herpes Simplex e o gene da neomicina seleccionável. 0 ácido nucleico que codifica a proteína FLAP ou respectiva porção é obtido por PCR de um vector bacteriano contendo o cDNA do FLAP da ID SEQ N° 3, utilizando "primers" oligonucleotídicos complementares ao cDNA do FLAP ou respectiva porção e contendo sequências de endonucleases de restrição para Pst I incorporadas no "primer" 5' e BglII na extremidade 5' do "primer" 3' do cDNA correspondente, tendo o cuidado de assegurar que a sequência que codifica a proteína FLAP ou respectiva porção esteja apropriadamente posicionada relativamente ao sinal poli A. 0 fragmento purificado obtido da reacção de PCR resultante é digerido com PstI, é submetido a ligação de extremidades planas com uma exonuclease, digerido com Bgl II, purificado e ligado ao pXTl, agora contendo um sinal poli A e digerido com BglII. 0 produto ligado é transfectado em células NIH 3T3 de ratinho utilizando Lipofectina (Life Technologies, Inc., Grand Island, Nova Iorque) em condições esboçadas na especificação do produto. Seleccionam-se transfectantes positivos depois das células transfectadas crescerem em 600 ug/ml de G418 (Sigma, St. Louis, Missouri).
Alternativamente, os ácidos nucleicos que codificam a proteína FLAP ou respectiva porção são clonados em pED6dpc2 (Genetics Institute, Cambridge, MA). A construção de pED6dpc2 resultante é transfectada numa célula hospedeiro 135 adequada, como células COS 1. As células resistentes ao metotrexato são seleccionadas e expandidas.
Os procedimentos acima também podem ser utilizados para expressar uma proteína FLAP mutante responsável por um fenótipo detectável, ou respectiva porção. A proteína expressa é purificada utilizando técnicas de purificação convencionais, tais como precipitação com sulfato de amónio ou separação cromatográfica baseada na dimensão ou carga. A proteína codificada pela inserção de ácido nucleico também pode ser purificada utilizando técnicas comuns de imunocromatografia. Nesses procedimentos, uma solução contendo a proteína FLAP expressa ou respectiva porção, como um extracto celular, é aplicada numa coluna contendo anticorpos contra a proteína FLAP ou respectiva porção fixados na matriz de cromatografia. Permite-se que a proteína expressa se ligue à coluna de imunocromatografia. Em seguida, a coluna é lavada para remover proteínas ligadas de forma inespecífica. A proteína expressa ligada especificamente é depois libertada da coluna e recuperada utilizando técnicas comuns.
Para confirmar a expressão da proteína FLAP ou respectiva porção, as proteínas expressas a partir de células-hospedeiro contendo um vector de expressão contendo uma inserção que codifica a proteína FLAP ou respectiva porção podem ser comparadas com as proteínas expressas em células-hospedeiro contendo o vector de expressão sem uma inserção. A presença de uma banda em amostras de células contendo o vector de expressão com uma inserção que está ausente em amostras de células contendo o vector de expressão sem uma inserção indica que a proteína FLAP ou respectiva porção está a ser expressa. Em geral, a banda terá a mobilidade esperada para a proteína FLAP ou 136 respectiva porção. No entanto, a banda pode ter uma mobilidade diferente da esperada em resultado de modificações tais como glicosilação, ubiquitinação ou clivagem enzimática.
Descrevem-se abaixo anticorpos capazes de reconhecer especificamente a proteína FLAP expressa ou respectiva porção.
Se não for possível a produção de anticorpos, o ácido nucleico que codifica a proteína FLAP ou respectiva porção é incorporado em vectores de expressão concebidos para serem utilizados em esquemas de purificação empregando polipéptidos quiméricos. Nessas estratégias, o ácido nucleico que codifica a proteína FLAP ou respectiva porção é inserido na estrutura com o gene que codifica a outra metade da quimera. A outra metade da quimera é β-globina ou uma sequência que codifica polipéptidos que se ligam a níquel. Seguidamente utiliza-se uma matriz de cromatografia tendo ligados anticorpos para β-globina ou níquel com a finalidade de purificar a proteína quimérica. Sítios de clivagem por proteases são introduzidos entre o gene da β-globina ou o polipéptido que se liga a níquel e a proteína FLAP ou respectiva porção. Assim, os dois polipéptidos da quimera estão separados um do outro por digestão por proteases.
Um vector de expressão útil para gerar sistemas quiméricos de β-globina é o pSG5 (Stratagene), que codifica β-globina de coelho. 0 intrão II do gene da β-globina de coelho facilita o processamento do transcrito expresso, e o sinal de poliadenilação incorporado na construção aumenta o nível de expressão. Estas técnicas são bem conhecidas dos experimentados na área da biologia molecular. Métodos comuns estão publicados em textos de métodos, tais como 137
Davis et al. (1986), e muitos dos métodos são disponibilizados pela Stratagene, Life Technologies, Inc., ou Promega. 0 polipéptido pode ser adicionalmente produzido a partir da construção utilizando sistemas de tradução in vitro, tais como o Estojo de Tradução In vitro Express™ (Stratagene).
Anticorpos que se Ligam a Polipéptidos FLAP da Invenção
Qualquer polipéptido ou proteína completa FLAP pode ser utilizado para gerar anticorpos capazes de se ligarem especificamente à proteína FLAP expressa ou respectivo fragmento, como descrito. As composições de anticorpos são capazes de se ligarem especificamente à variante 127-Ile da proteína FLAP. Para que uma composição de anticorpos se ligue especificamente à variante 127-Ile da FLAP deve demonstrar uma afinidade de ligação pelo menos 5%, 10%, 15%, 20%, 25%, 50% ou 100% maior para a variante 127-Ile completa da FLAP relativamente à variante 127-Val completa da FLAP num ensaio ELISA, RIA ou outro ensaio de ligação à base de anticorpos. A invenção compreende uma composição de anticorpos isolados ou purificados capazes de se ligarem selectivamente a um fragmento contendo um epítopo de um polipéptido compreendendo uma extensão contígua de pelo menos 6 aminoácidos, preferivelmente pelo menos 8 até 10 aminoácidos, mais preferivelmente pelo menos 12, 15, 20, 25, 30, 40, 50 ou 100 aminoácidos da ID SEQ N° 3, cujo epítopo compreende um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3, cuja composição de anticorpos é opcionalmente policlonal ou monoclonal. A presente invenção também revela a utilização de polipéptidos compreendendo uma extensão contígua de pelo menos 6 aminoácidos, preferivelmente pelo menos 8 até 10 138 aminoácidos, mais preferivelmente pelo menos 12, 15, 20, 25, 50 ou 100 aminoácidos de um polipéptido FLAP no fabrico de anticorpos, cuja extensão contígua compreende um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3. Numa especificação preferida, esses polipéptidos são úteis no fabrico de anticorpos para detectar a presença e ausência da variante 127-Ile.
Para preparar anticorpos são particularmente úteis animais não humanos ou mamíferos, de tipo selvagem ou transgénicos, que expressam uma espécie diferente da FLAP para a qual se deseja a ligação de anticorpos, e animais que não expressam o FLAP (isto é, um animal "knock out" para o FLAP como descrito aqui). Animais "knock out" para o FLAP reconhecerão a totalidade ou a maior parte das regiões expostas da FLAP como antigenes estranhos e, em consequência, produzirão anticorpos com uma série mais ampla de epítopos para a FLAP. Além disso, polipéptidos mais pequenos apenas com 10 até 30 aminoácidos podem ser úteis na obtenção de ligação específica para a variante 127-Ile. Adicionalmente, o sistema imunológico humoral de animais que produzem uma espécie da FLAP que se assemelha à sequência antigénica reconhecerão preferencialmente as diferenças entre a espécie da FLAP nativa do animal e a sequência antigénica, e produzirão anticorpos para estes sítios únicos na sequência antigénica. Essa técnica será particularmente útil para obter anticorpos que se ligam especificamente à variante 127-Ile. 139 XVI. Vectores Recombinantes, Células-Hospedeiro e Animais Transgénicos
Vectores Recombinantes 0 termo "vector" é aqui utilizado para designar uma molécula de DNA ou RNA circular ou linear, de filamentação dupla ou filamentação simples e que compreende pelo menos um polinucleótido de interesse que se pretende transferir para uma célula hospedeiro ou para um organismo hospedeiro unicelular ou multicelular. A presente invenção abrange vectores recombinantes que compreendem um polinucleótido de acordo com a presente invenção. A invenção revela um vector recombinante compreendendo quer um polinucleótido regulador compreendido no ácido nucleico da ID SEQ N° 1 quer um polinucleótido compreendendo a sequência codificadora do FLAP quer ambos.
Em geral, um vector recombinante pode compreender qualquer um dos polinucleótidos descritos aqui, incluindo sequências reguladoras e sequências codificadoras, bem como qualquer "primer" ou sonda do FLAP como definido acima.
Numa primeira especificação preferida, utiliza-se um vector recombinante para amplificar o polinucleótido inserido derivado de uma sequência genómica do FLAP da ID SEQ N° 1 ou de um cDNA do FLAP, por exemplo, o cDNA da ID SEQ N° 2, numa célula hospedeiro adequada, em que este polinucleótido é amplificado sempre que o vector recombinante se replica.
Uma segunda especificação preferida dos vectores recombinantes consiste em vectores de expressão compreendendo quer um polinucleótido regulador quer um ácido nucleico codificador da invenção quer ambos. Em certas especificações, empregam-se vectores de expressão para expressar o polipéptido FLAP que depois pode ser 140 purificado e, por exemplo, utilizado em ensaios de rastreio de ligandos ou como imunogene, para induzir anticorpos específicos dirigidos contra a proteína FLAP. Noutras especificações, os vectores de expressão são utilizados para construir animais transgénicos e também para terapia genética. A expressão requer que os vectores tenham sinais apropriados, cujos sinais incluem vários elementos reguladores, como intensificadores/promotores de fontes virais e de mamífero, que conduzem a expressão dos genes de interesse em células-hospedeiro. Marcadores de selecção de fármacos dominantes para estabelecer clones celulares permanentes e estáveis que expressam os produtos são geralmente incluídos nos vectores de expressão da invenção, pois são elementos que ligam a expressão dos marcadores de selecção de fármacos à expressão do polipéptido.
Mais particularmente, a presente invenção revela vectores de expressão incluindo ácidos nucleicos que codificam uma proteína FLAP, preferivelmente a proteína FLAP da sequência de aminoácidos da ID SEQ N° 3, mais preferivelmente a proteína FLAP da sequência de aminoácidos da ID SEQ N° 3 tendo um resíduo isoleucina na posição 127, ou respectivas variantes ou fragmentos, sob o controlo de uma sequência reguladora seleccionada entre os polinucleótidos reguladores do FLAP, ou alternativamente sob o controlo de uma sequência reguladora exógena.
Consequentemente, vectores de expressão preferidos são seleccionados do grupo que consiste em: (a) a sequência reguladora do FLAP aí compreendida conduz a expressão de um polinucleótido codificador operativamente ligado àquela; (b) a sequência codificadora do FLAP está operativamente ligada a sequências de regulação que permitem a sua expressão numa célula hospedeiro e/ou organismo hospedeiro adequados. 141
Também são descritos vectores recombinantes compreendendo um ácido nucleico contendo um marcador bialélico relacionado com o FLAP. Numa especificação preferida, esse marcador bialélico é seleccionado do grupo que consiste em AI até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. Opcionalmente, esse marcador bialélico é seleccionado do grupo que consiste em AI até A13, A15, A17 até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele.
Alguns dos elementos que podem ser encontrados nos vectores da presente invenção são descritos em mais pormenor nas secções seguintes. 1. Características gerais dos vectores de expressão da
Um vector recombinante compreende, mas não se limita a um YAC (Cromossoma Artificial de Levedura), um BAC (Cromossoma Artificial Bacteriano), um fago, um fagemídeo, um cosmídeo, um plasmídeo ou mesmo uma molécula de DNA linear que pode consistir num DNA cromossómico, não cromossómico, semi-sintético e sintético. Esse vector recombinante pode compreender uma unidade de transcrição compreendendo uma reunião de: (1) um elemento ou elementos genéticos com um papel regulador na expressão genética, por exemplo, promotores ou intensificadores. Os intensificadores são elementos cis-activos de DNA, habitualmente com comprimento desde cerca de 10 até 300 pares de bases, que actuam no promotor para aumentar a transcrição. (2) uma sequência estrutural ou codificadora que é transcrita em mRNA e eventualmente traduzida num 142 polipéptido, cuja sequência estrutural ou codificadora está operativamente ligada aos elementos reguladores descritos em (1), e (3) sequências de iniciação e terminação da transcrição apropriadas. Unidades estruturais destinadas a serem utilizadas em sistemas de expressão de levedura ou eucarióticos incluem preferivelmente uma sequência líder, que permite a secreção extracelular da proteína traduzida por uma célula hospedeiro. Alternativamente, quando uma proteína recombinante é expressa sem uma sequência líder ou de transporte, pode incluir um resíduo N-terminal. Este resíduo pode ou não ser subsequentemente clivado da proteína recombinante expressa para fornecer um produto final.
Em geral, vectores de expressão recombinantes incluirão origens da replicação, marcadores seleccionáveis que permitem a transformação da célula hospedeiro e um promotor derivado de um gene altamente expresso para dirigir a transcrição de uma sequência estrutural a jusante. A sequência estrutural heteróloga é reunida, em fase apropriada, com sequências de iniciação e terminação da tradução e, preferivelmente, uma sequência líder capaz de dirigir a secreção da proteína traduzida para o espaço periplasmático ou para o meio extracelular. Numa forma de realização específica em que o vector é adaptado para transfectar e expressar sequências desejadas em células-hospedeiro de mamífero, vectores preferidos compreenderão uma origem da replicação no hospedeiro desejado, um promotor e intensificador adequados e também quaisquer necessários sítios de ligação de ribossomas, sítio de poliadenilação, sítios dadores e receptores de processamento, sequências de terminação da transcrição e sequências não transcritas flanqueadoras em 5'. Sequências 143 de DNA derivadas do genoma virai do SV40, por exemplo, origem, promotor inicial, intensificador sitios de processamento e poliadenilação do SV40, podem ser utilizadas para fornecer os necessários elementos genéticos não transcritos. A expressão in vivo de um polipéptido FLAP da ID SEQ N° 3 ou respectivos fragmentos ou variantes pode ser útil para corrigir um defeito genético relacionado com a expressão do gene nativo num organismo hospedeiro ou para a produção de uma proteína FLAP biologicamente inactiva.
Consequentemente, a presente invenção também revela vectores de expressão recombinantes maioritariamente concebidos para a produção in vivo do polipéptido FLAP da ID SEQ N° 3, ou respectivos fragmentos ou variantes, pela introdução do material genético apropriado no organismo do paciente a ser tratado. Este material genético pode ser introduzido in vitro numa célula que foi previamente extraída do organismo, em que a célula modificada é subsequentemente reintroduzida nesse organismo, directamente in vivo no tecido apropriado. 2. Elementos Reguladores
Promotores
As regiões promotoras adequadas utilizadas nos vectores de expressão são escolhidas tomando em consideração a célula hospedeiro onde o gene heterólogo deve ser expresso. Crê-se não ser importante o promotor particular empregue para controlar a expressão de uma sequência de ácido nucleico de interesse, desde que seja capaz de dirigir a expressão do ácido nucleico na célula alvo. Assim, quando se aborda selectivamente uma célula humana, é preferível posicionar a região codificadora do ácido nucleico de forma adjacente e sob o controlo de um promotor que seja capaz de 144 ser expresso numa célula humana, tal como, por exemplo, um promotor humano ou virai.
Um promotor adequado pode ser heterólogo relativamente ao ácido nucleico para o qual controla a expressão, ou alternativamente pode ser endógeno ao polinucleótido nativo contendo a sequência codificadora a ser expressa. Adicionalmente, o promotor é geralmente heterólogo relativamente a sequências do vector recombinante onde foi inserida a construção promotor/sequência codificadora.
Regiões promotoras podem ser seleccionadas entre qualquer gene desejado utilizando, por exemplo, vectores CAT (cloranfenicol transferase) e mais preferivelmente vectores pKK232-8 e pCM7.
Promotores bacterianos preferidos são os promotores LacI, LacZ, de RNA polimerase do bacteriófago T3 ou T7, os promotores gpt, lambda PR, PL e trp (EP 0036776), o promotor da poliedrina ou o promotor da proteína plO de baculovirus (Estojo Novagen) (Smith et al., 1983; 0'Reilly et al., 1992), o promotor lambda PR ou também o promotor trc.
Promotores eucarióticos incluem inicial imediato de CMV, timidina quinase de HSV, inicial e tardio de SV40, LTRs de retrovirus e metalotioneina-L de ratinho. A selecção de um vector e promotor convenientes pertence ao nível do habitualmente experimentado na área. A escolha de um promotor pertence ao âmbito do experimentado na área da engenharia genética. Por exemplo, pode referir-se o livro de Sambrook et al. (1989) ou também os procedimentos descritos por Fuller et al. (1996).
Outros elementos reguladores
Quando se emprega uma inserção de cDNA, deseja-se tipicamente incluir um sinal de poliadenilação para efectuar a poliadenilação apropriada do transcrito 145 genético. Crê-se que a natureza do sinal de poliadenilação não é crucial para a prática com êxito da invenção, podendo empregar-se qualquer uma dessas sequências, tal como os sinais de poliadenilação da hormona de crescimento humano e do SV40. Também é contemplado um terminador como elemento da cassete de expressão. Estes elementos podem servir para intensificar níveis de mensagens e para minimizar a leitura da cassete para outras sequências. 0 vector contendo a sequência de DNA apropriada como descrito acima, mais preferivelmente um polinucleótido regulador do gene FLAP, um polinucleótido que codifica o polipéptido FLAP seleccionado do grupo que consiste na ID SEQ N° 1, ou respectivo fragmento ou variante, e ID SEQ N° 2. ou ambos, pode ser utilizado para transformar um hospedeiro apropriado com a finalidade de permitir a expressão do polipéptido ou polinucleótido desejado. 3. Marcadores Seleccionáveis
Esses marcadores conferem à célula uma alteração identificável, permitindo a identificação fácil de células contendo a construção de expressão. Os genes de marcadores seleccionáveis para a selecção de células-hospedeiro transformadas são preferivelmente di-hidrofolato redutase ou resistência à neomicina para culturas de células eucarióticas, TRP1 para S. cerevisiae, ou resistência à tetraciclina, rifampicina ou ampicilina em E. coli, ou levana sacarase para micobactérias, em que este último marcador é um marcador de selecção negativa. 4. Vectores Preferidos
Vectores bacterianos
Como exemplo representativo mas não limitativo, vectores de expressão úteis para utilização bacteriana 146 podem compreender um marcador seleccionável e uma origem da replicação bacteriana derivada de plasmídeos comercialmente disponíveis compreendendo elementos genéticos de pBR322 (ATCC 37017). Esses vectores comerciais incluem, por exemplo, pKK223-3 (Pharmacia, Uppsala, Suécia) e GEMI (Promega Biotec, Madison, WI, E.U.A.).
Os experimentados na área conhecem grandes números de outros vectores adequados e comercialmente disponíveis, como os seguintes vectores bacterianos: pQE70, pQE60, pQE-9 (Qiagen), pbs, pDIO, phagescript, psiX174, pbluescript SK, pbsks, ρΝΗδΑ, ρΝΗΙβΑ, pNH18A, pNH46A (Stratagene); ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 (Pharmacia); pWLNEO, pSV2CAT, pOG44, pXTl, pSG (Stratagene); pSVK3, pBPV, pMSG, pSVL (Pharmacia); pQE-30 (QIAexpress).
Vectores de bacteriófagos O vector de bacteriófago P 1 pode conter grandes inserções, variando desde cerca de 80 até cerca de 100 kb. A construção de vectores de bacteriófagos Pl, como pl58 ou pl58/neo8, é notavelmente descrita por Sternberg (1992, 1994). Os clones de Pl recombinantes compreendendo sequências de nucleótidos do FLAP podem ser concebidos para inserir polinucleótidos grandes com mais de 40 kb (Linton et ai., 1993) . Para gerar DNA de Pl para experiências transgénicas, um protocolo preferido é o protocolo descrito por McCormick et ai. (1994).
Vectores de baculovírus
Um vector adequado para a expressão do polipéptido FLAP da ID SEQ N° 6 ou respectivos fragmentos ou variantes é um vector de baculovírus que pode ser propagado em células de insecto e em linhas de células de insecto. Um sistema hospedeiro-vector adequado específico é o vector de transferência de baculovírus pVL1392/1393 (Pharmingen), que 147 é utilizado para transfectar a linha celular SF9 (ATCC N° CRL 1711) derivada de Spodoptera frugiperda.
Outros vectores adequados para a expressão do polipéptido FLAP da ID SEQ N° 6 ou respectivos fragmentos ou variantes num sistema de expressão de baculovírus incluem os descritos por Chai et al. (1993), Vlasak et al. (1983) e Lenhard et al. (1996).
Vectores virais
Numa forma de realização específica, o vector é derivado de um adenovírus. Vectores de adenovírus preferidos de acordo com a invenção são os descritos por Feldman e Steg (1996) ou Ohno et al. (1994). Outro adenovírus recombinante preferido de acordo com esta forma de realização específica da presente invenção é 0 adenovírus humano de tipo 2 ou 5 (Ad 2 ou Ad 5) 1 ou um adenovírus de origem animal (candidatura de patente francesa N° FR-93 05954). Vectores de retrovírus e vectores de vírus adeno- associados são geralmente entendidos como os sistemas de distribuição de genes recombinantes de escolha para a transferência de polinucleótidos exógenos in vivo, particularmente para mamíferos, incluindo humanos. Estes vectores distribuem eficientemente genes em células, e os ácidos nucleicos transferidos são integrados de forma estável no DNA cromossómico do hospedeiro.
Retrovírus particularmente preferidos para a preparação ou construção de veículos retrovirais de distribuição de genes in vitro ou in vitro da presente invenção incluem retrovírus seleccionados do grupo que consiste no Vírus Indutor de Focos de Células de Marta, Vírus do Sarcoma Murino, vírus da reticuloendoteliose e vírus do Sarcoma de Rous. Vírus da Leucemia Murina particularmente preferidos incluem os vírus 4070A e 1504A, Abelson (ATCC N° VR-999), 148
Friend (ATCC N° VR-245), Gross (ATCC N° VR-590), Rauscher (ATCC N° VR-998) e Vírus da Leucemia Murina de Moloney (ATCC N° VR-190; Candidatura PCX N° WO 94/24298). Vírus do Sarcoma de Rous particularmente preferidos incluem título elevado de Bryan (ATCC N°s VR-334, VR-657, VR-726, VR-659 e VR-728). Outros vectores retrovirais preferidos são os descritos em Roth et al. (1996), Candidatura PCT N° WO 93/25234, Candidatura PCT N° WO 94/06920, Roux et al., 1989, Julan et al., 1992, e Neda et al., 1991.
Ainda outro sistema de vectores virais que é descrito na invenção consiste no vírus adeno-associado (AAV). O vírus adeno-associado é um vírus defeituoso de ocorrência natural que requer outro vírus, como um adenovírus ou um vírus herpes, como vírus auxiliador para replicação eficiente e ciclo de vida produtivo (Muzyczka et al., 1992). Também é um dos poucos vírus que pode inteqrar o seu DNA em células que não se dividem e exibe uma frequência elevada de integração estável (Flotte et al., 1992;
Samulski et al., 1989; McLaughlin et al., 1989) . Uma característica vantajosa do AAV deriva da sua eficácia reduzida para proceder à transdução de células primárias relativamente a células transformadas.
Vectores BAC O sistema de clonagem do cromossoma artificial bacteriano (BAC) (Shizuya et al., 1992) foi desenvolvido para manter de forma estável grandes fragmentos de DNA genómico (100-300 kb) em E. coli. Um vector BAC preferido consiste no vector pBeloBACll que foi descrito por Kim et al. (1996). As bibliotecas de BAC são preparadas com este vector utilizando DNA genómico de dimensão seleccionada que foi parcialmente digerido utilizando enzimas que permitem a ligação em qualquer um dos sítios Bam Hl ou HindIII no vector. Flanqueando estes sítios de clonagem estão sítios 149 de iniciação da transcrição de RNA polimerase de T7 e SP6, que podem ser utilizados para gerar sondas terminais por transcrição de RNA ou métodos de PCR. Após a construção de uma biblioteca de BAC em E. coli, o DNA de BAC é purificado da célula hospedeiro na forma de um circulo super-enrolado. A conversão destas moléculas circulares numa forma linear precede a determinação do tamanho e a introdução dos BACs em células receptoras. 0 sitio de clonagem é flanqueado por dois sítios Not I, permitindo que segmentos clonados sejam excisados do vector por digestão com Not I. Alternativamente, a inserção de DNA contida no vector pBeloBACll pode ser linearizada tratando o vector BAC com a enzima comercialmente disponível lambda terminase, que conduz à clivagem no sítio cosN único, mas este método de clivagem resulta num clone de BAC completo contendo o DNA de inserção e as sequências BAC. 5. Distribuição dos Vectores Recombinantes
Para efectuar a expressão dos polinucleótidos e construções polinucleotídicas da invenção, estas construções devem ser distribuídas numa célula. Esta distribuição pode ser conseguida in vitro, tal como em procedimentos laboratoriais para transformar linhas celulares, ou in vivo ou ex vivo, tal como no tratamento de certos estados de doenças.
Um mecanismo é a infecção virai, em que a construção de expressão é encapsulada numa partícula virai infecciosa.
Também são contemplados pela presente invenção vários métodos não virais para a transferência de polinucleótidos em células de mamífero cultivadas, e incluem, sem se limitarem a precipitação com fosfato de cálcio (Graham et al., 1973; Chen et al., 1987), DEAE-dextrano (Gopal, 1985), electroporação (Tur-Kaspa et al., 1986; Potter et al., 150 1984), microinjecção directa (Harland et al., 1985), lipossomas carregados com DNA (Nicolau et al., 1982; Fraley et al., 1979) e transfecção mediada por receptores (Wu e Wu, 1987; 1988). Algumas destas técnicas podem ser adaptadas com êxito para utilização in vivo ou ex vivo.
Depois do polinucleótido de expressão ter sido distribuído na célula, pode ser integrado de forma estável no genoma da célula receptora. Esta integração pode dar-se na localização e orientação do cognato via recombinação homóloga (substituição de genes) ou pode ser integrado numa localização aleatória e inespecífica (aumento de genes). Ainda noutras especificações, o ácido nucleico pode ser mantido de modo estável na célula na forma de um segmento de DNA separado e epissomal. Esses segmentos de ácido nucleico ou "epissomas" codificam sequências suficientes para permitir a manutenção e replicação independentes ou em sincronia com o ciclo da célula hospedeiro.
Uma forma de realização específica de um método para distribuir uma proteína ou péptido no interior de uma célula de um vertebrado in vivo compreende o passo de introduzir uma preparação compreendendo um transportador fisiologicamente aceitável e um polinucleótido nu que codifica operativamente para o polipéptido de interesse no espaço intersticial de um tecido compreendendo a célula, de modo que o polinucleótido nu é recolhido no interior da célula e exerce um efeito fisiológico. Isto é particularmente aplicável para transferência in vitro, mas também pode ser aplicado in vivo.
Composições para utilização in vitro e in vivo compreendendo um polinucleótido "nu" são descritas na candidatura PCT N° WO 90/11092 (Vical Inc.) e também na candidatura PCT N° WO 95/11307 (Institut Pasteur, INSERM, 151
Université dOttawa), bem como nos artigos de Tacson et al. (1996) e de Huygen et al. (1996).
Ainda noutra especificação, a transferência de um polinucleótido nu da invenção, incluindo uma construção polinucleotidica da invenção, em células pode ser seguida de um bombardeamento de particulas (biolistica) , cujas partículas são micro-projécteis revestidos com DNA acelerados para uma velocidade elevada, permitindo-lhes atravessar membranas celulares e entrar em células sem as matar, tal como descrito por Klein et al. (1987).
Numa especificação suplementar, o polinucleótido pode ser encerrado num lipossoma (Ghosh e Bacchawat, 1991; Wong et al., 1980; Nicolau et ai., 1987).
Numa forma de realização específica, é revelada uma composição para a produção in vivo da proteína ou polipéptido FLAP descritos aqui. Compreende um polinucleótido nu que codifica operativamente para este polipéptido, em solução num transportador fisiologicamente aceitável, e adequado para introdução num tecido, fazendo com que as células do tecido expressem essa proteína ou polipéptido. A quantidade de vector a ser injectada no organismo hospedeiro desejado varia de acordo com o sítio da injecção. Como dose indicadora, serão injectados entre 0,1 e 100 μg do vector no corpo de um animal, preferivelmente no corpo de um mamífero, por exemplo, no corpo de um ratinho.
Noutra especificação do vector, pode ser introduzido in vitro numa célula hospedeiro, preferivelmente numa célula hospedeiro previamente recolhida do animal a ser tratado e mais preferivelmente uma célula somática, como uma célula muscular. Num passo subsequente, a célula que foi transformada com o vector que codifica para o polipéptido 152 FLAP desejado, ou respectivo fragmento desejado, é reintroduzida no corpo do animal, para distribuir a proteína recombinante no corpo localmente ou sistemicamente. Células-Hospedeiro
Outro objectivo consiste numa célula hospedeiro que foi transformada ou transfectada com um dos polinucleótidos aqui descritos. Estão incluídas células-hospedeiro que estão transformadas (células procarióticas) ou que estão transfectadas (células eucarióticas) com um vector recombinante, tal como um dos descritos acima. A presente invenção refere-se a uma célula hospedeiro compreendendo um vector recombinante de acordo com a presente invenção.
Outra célula hospedeiro recombinante compreende um polinucleótido contendo um marcador bialélico seleccionado do grupo que consiste em AI até A28, e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. Opcionalmente, esse marcador bialélico é seleccionado do grupo que consiste em AI até A13, A15, AI7 até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. Células-hospedeiro preferidas utilizadas como receptores para os vectores de expressão são as seguintes: a) Células-hospedeiro procarióticas: estirpes de Escherichia coli (estirpe I.E.DH5-a), Bacillus subtilis, Salmonella typhimurium, e estirpes de espécies tais como Pseudomonas, Streptomyces e Staphylococcus. b) Células-hospedeiro eucarióticas: células HeLa (ATCC N° CCL2; N° CCL2. 1; N° CCL2. 2), células Cv 1 (ATCC N° CCL70), células COS (ATCC N° CRL1650; N° CRL1651), células 153
Sf-9 (ATCC N° CRL1711), células C127 (ATCC N° CRL-1804), 3T3 (ATCC N° CRL-6361), CHO (ATCC N° CCL-61), de rim humano 293 (ATCC N° 45504; N° CRL-1573) e BHK (ECACC N° 84100501; N° 84111301). c) Outras células-hospedeiro de mamífero. A expressão do gene FLAP em células de mamífero, e tipicamente humanas, pode ser tornada defeituosa, ou alternativamente pode ser seguida da inserção de uma sequência genómica ou de cDNA do FLAP, com a substituição do correspondente do gene FLAP no genoma de uma célula animal por um polinucleótido FLAP. Estas alterações genéticas podem ser geradas por acontecimentos de recombinação homóloga, utilizando construções específicas de DNA que foram previamente descritas.
Um tipo de células-hospedeiro que pode ser utilizado consiste em zigotos de mamífero, tais como zigotos murinos. Por exemplo, zigotos murinos podem ser submetidos a microinjecção com uma molécula de DNA purificada de interesse, por exemplo, uma molécula de DNA purificada que foi previamente ajustada para uma gama de concentrações desde 1 ng/ml - para inserções de BAC - 3 ng/μΐ - para inserções de bacteriófago PI - em Tris-HCl 10 mM, pH 7,4, EDTA 250 μΜ contendo NaCl 100 mM, espermina 30 μΜ e espermidina 70 μΜ. Quando o DNA a ser submetido a microinjecção é grande, podem utilizar-se poliaminas e elevadas concentrações de sal para evitar a desagregação mecânica deste DNA, como descrito por Schedl et al. (1993b).
Qualquer um dos polinucleótidos da invenção, incluindo as construções de DNA descritas aqui, pode ser introduzido numa linha de células estaminais embrionárias (ES), preferivelmente uma linha de células ES de ratinho. As 154 linhas de células ES derivam de células pluripotentes e indeterminadas da massa celular interna de blastócitos pré-implantação. As linhas de células ES preferidas são as seguintes: ES-E14TG2a (ATCC n° CRL-1821), ES-D3 (ATCC n° CRL1934 e n° CRL-11632), YS001 (ATCC n° CRL-11776), 36. 5 (ATCC n° CRL-11116). Para manter células ES num estado indeterminado, são cultivadas na presença de células de suporte inibidas quanto ao crescimento, que fornecem os sinais apropriados para conservarem este fenótipo embrionário e servem como matriz para a aderência de células ES. Células de suporte preferidas consistem em fibroblastos embrionários primários que são estabelecidos a partir de tecido de embriões no dia 13 até ao dia 14 de virtualmente qualquer estirpe de ratinho, que são mantidos em cultura, como descrito por Abbondanzo et al. (1993), e cujo crescimento é inibido por irradiação, como descrito por Robertson (1987), ou pela presença de uma concentração inibidora de LIF, como descrito por Pease e Williams (1990).
As construções nas células-hospedeiro podem ser utilizadas de modo convencional para produzirem o produto genético codificado pela sequência recombinante.
Após a transformação de um hospedeiro adequado e crescimento do hospedeiro numa densidade celular apropriada, o promotor seleccionado é induzido por meios apropriados, como mudança de temperatura ou indução química, e as células são cultivadas durante um período adicional.
As células são tipicamente recolhidas por centrifugação, desagregadas por meios físicos ou químicos, e o extracto em bruto resultante é retido para purificação suplementar. 155 Células microbianas empregues na expressão de proteínas podem ser desagregadas por qualquer método conveniente, incluindo realização de ciclos de congelamento-descongelamento, sonicação, desagregação mecânica ou utilização de agentes de lise celular. Esses métodos são bem conhecidos do técnico experimentado.
Animais Transgénicos
Os termos "animais transgénicos" ou "animais hospedeiros" utilizados aqui designam animais cujo genoma foi manipulado geneticamente e artificialmente de modo a incluir um dos ácidos nucleicos de acordo com a invenção. Animais preferidos são mamíferos não humanos e incluem os pertencentes a um género seleccionado entre Mus (por exemplo, ratinhos), Rattus (por exemplo, ratos) e Oryctogalus (por exemplo, coelhos), cujo genoma foi alterado artificialmente e geneticamente pela inserção de um ácido nucleico descrito na invenção. Numa especificação, a invenção revela mamíferos e animais hospedeiros não humanos compreendendo um vector recombinante descrito na invenção ou um gene FLAP desagregado por recombinação homóloga com um vector "knock out".
Todos os animais transgénicos incluem, numa pluralidade das suas células, uma sequência de DNA recombinante ou sintética clonada, mais especificamente um dos ácidos nucleicos purificados ou isolados compreendendo uma sequência codificadora do FLAP, um polinucleótido regulador do FLAP ou uma sequência de DNA que codifica um polinucleótido anti-sentido, como descrito na presente especificação.
Em geral, um animal transgénico compreende qualquer um dos polinucleótidos, vectores recombinantes e células-hospedeiro descritos na presente invenção. 156
Outros animais transgénicos contêm, nas suas células somáticas e/ou nas suas células da linha germinativa, um polinucleótido compreendendo um marcador bialélico seleccionado do grupo que consiste em AI até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele. Opcionalmente, esse marcador bialélico é seleccionado do grupo que consiste em Al até A13, A15, A17 até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele.
Numa primeira especificação preferida, estes animais transgénicos podem ser bons modelos experimentais para estudar as diversas patologias relacionadas com a diferenciação celular, em particular no que se refere aos animais transgénicos em cujo genoma foi inserida uma ou várias cópias de um polinucleótido que codifica uma proteína FLAP nativa, ou alternativamente uma proteína FLAP mutante.
Numa segunda especificação preferida, estes animais transgénicos podem expressar um polipéptido desejado de interesse sob o controlo dos polinucleótidos reguladores do gene FLAP, conduzindo a bons rendimentos da síntese desta proteína de interesse e, eventualmente, uma expressão específica para tecidos desta proteína de interesse. A concepção dos animais transgénicos, incluindo animais "knock out", pode ser feita de acordo com as técnicas convencionais bem conhecidas do experimentado na área. Quanto a mais pormenores respeitantes à produção de animais transgénicos, e especificamente de ratinhos transgénicos, podem referir-se as Patentes US N°s 4 873 191, publicada em 10 de Outubro de 1989, 5 464 764, publicada em 7 de Novembro de 1995, 5 789 215, publicada em 4 de Agosto de 157 1998; Capecchi, M.R. (1989a); Capecchi, M.R. (1989b), e Tsuzuki, T. e Rancourt, D.E. (1998). A presente invenção abrange vectores "knock out" compreendendo os polinucleótidos novos da invenção, bem como células-hospedeiro de mamífero e mamíferos hospedeiros não humanos compreendendo um gene FLAP desagregado por recombinação homóloga com esse vector "knock out".
Os animais transgénicos da presente invenção são produzidos pela aplicação de procedimentos resultantes num animal com um genoma que incorporou material genético exógeno. 0 procedimento envolve obter o material genético, ou respectiva porção, que codifica quer uma sequência codificadora do FLAP, um polinucleótido regulador do FLAP ou uma sequência de DNA que codifica um polinucleótido anti-sentido do FLAP, como descrito na presente especificação.
Um polinucleótido recombinante descrito na invenção é inserido numa linha de células embrionárias ou estaminais ES. A inserção é preferivelmente feita utilizando electroporação, como descrito por Thomas et al. (1987). As células sujeitas a electroporação são rastreadas (por exemplo, por selecção via marcadores seleccionáveis, por PCR ou por análise de coloração "Southern") para se encontrarem células positivas que integraram no seu genoma o polinucleótido exógeno recombinante, preferivelmente via um acontecimento de recombinação homóloga. Um procedimento de selecção positiva-negativa ilustrativo que pode ser utilizado é descrito por Mansour et al. (1988).
Em seguida, as células positivas são isoladas, clonadas e injectadas em blastócitos com 3,5 dias de idade de ratinhos, como descrito por Bradley (1987). Os blastócitos são então inseridos num animal hospedeiro fêmea e desenvolvem-se completamente. 158
Alternativamente, as células ES positivas entram em contacto com embriões aos 2,5 dias de idade, fase de 8-16 células (mórulas), como descrito por Wood et al. (1993) ou por Nagy et al. (1993), em que as células ES são interiorizadas para colonizarem extensamente os blastócitos, incluindo as células que darão origem à linha germinativa.
Testa-se a progenitura da fêmea hospedeiro para determinar quais os animais que são transgénicos, por exemplo, que incluem a sequência de DNA exógeno inserida, e quais os de tipo selvagem.
Linhas Celulares Recombinantes Derivadas dos Animais Transgénicos
Um objectivo suplementar revela células-hospedeiro recombinantes obtidas de um animal transgénico descrito aqui. Numa especificação, a invenção abrange células derivadas de mamíferos e animais hospedeiros não humanos compreendendo um vector recombinante da invenção ou um gene FLAP desagregado por recombinação homóloga com um vector "knock out".
Linhas celulares recombinantes podem ser estabelecidas in vitro a partir de células obtidas de qualquer tecido de um animal transgénico de acordo com a invenção, por exemplo, por transfecção de culturas de células primárias com vectores que expressam onc-genes, como o antigene T grande do SV40, como descrito por Chou (1989) e Shay et al. (1991) . XVII. Rastreio de Agentes que Actuam na Via dos Leucotrienos
Numa especificação suplementar, a presente invenção também revela um método para rastrear novos agentes, ou substâncias candidatas, que actuam na via dos leucotrienos 159 e que podem ser adequados para o tratamento de um paciente cujo DNA compreende um alelo do gene FLAP associado a uma doença envolvendo a via dos leucotrienos, mais particularmente asma.
Numa especificação preferida descreve-se um método para rastrear substâncias candidatas quanto à sua capacidade para alterar a biossintese de leucotrienos, preferivelmente para identificar substâncias candidatas activas sem efeitos secundários indesejados, como niveis aumentados de transaminases no figado. 0 método compreende os passos seguintes: a) fornecer uma linha celular, um órgão ou um mamífero que expressa a 5-LO e quer um gene FLAP compreendendo alelos para um ou mais marcadores bialélicos relacionados com o FLAP, preferivelmente associados a uma via dos leucotrienos modificada, mais preferivelmente a uma doença envolvendo a via dos leucotrienos, como asma, quer um gene FLAP mutado compreendendo a mutação causadora da característica determinada utilizando o método acima notado; b) obter uma substância candidata, e c) testar a capacidade da substância candidata para modificar a biossintese de leucotrienos, e particularmente para interagir com a 5-LO e/ou com a FLAP produzida pela linha celular ou pelo mamífero transgénico e/ou para modificar a interacção entre a 5-LO e FLAP e/ou para modular os níveis de expressão da FLAP.
Numa especificação do método acima, o método compreende fornecer uma linha celular, um órgão ou um mamífero que expressa a 5-LO, um gene da FLAP compreendendo alelos para um ou mais marcadores bialélicos relacionados com o FLAP, preferivelmente associados a uma via dos leucotrienos modificada, mais preferivelmente a uma doença envolvendo a via dos leucotrienos, como asma, e um gene FLAP mutado compreendendo a mutação causadora da característica 160 determinada utilizando o método acima notado. Esses marcadores bialélicos podem ser seleccionados do grupo que consiste em AI até A28 e respectivos complementos. Opcionalmente, esse marcador bialélico pode ser seleccionado do grupo que consiste em AI até A13, A15 e AI7 até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele; opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em AI até AIO e A22 até A28 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles; opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em All até A13, A15, AI7 até A21 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles; opcionalmente, esses marcadores bialélicos são seleccionados do grupo que consiste em A14 ou A16 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Numa especificação preferida, esses marcadores bialélicos são seleccionados do grupo que consiste em A2, A14, A16, A18, A19, A22 e A23 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Noutra especificação preferida, esses marcadores bialélicos são seleccionados do grupo que consiste em AI4 e AI 9 e respectivos complementos, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aqueles. Numa especificação mais preferida, esses marcadores bialélicos compreendem o marcador bialélico A19 e respectivo complemento, ou opcionalmente os marcadores bialélicos em desequilíbrio de ligação com aquele.
Uma substância candidata é uma substância que pode interagir ou modular, por ligação ou outras interacções 161 intramoleculares, a 5-LO ou a FLAP. Essas substâncias podem ser potencialmente interessantes para pacientes que não respondem a fármacos existentes. 0 rastreio pode ser efectuado utilizando métodos in vitro ou métodos in vivo.
Os métodos in vitro podem ser postos em prática de numerosas maneiras, tais como em células transformadas que expressam os alelos considerados do gene FLAP por activação da 5-lipoxigenase e medição da síntese de leucotrienos, ou em FLAP codificada pela variante alélica considerada do FLAP por ensaios de ligação da FLAP.
Os ensaios de rastreio da presente invenção envolvem geralmente determinar a capacidade de uma substância candidata para afectar a actividade da 5-LO ou FLAP, como o rastreio de substâncias candidatas para identificar aquelas que inibem ou modificam de qualquer outra forma a função da 5-LO ou FLAP na via dos leucotrienos.
Um método de rastreio de fármacos utiliza células-hospedeiro eucarióticas, que são transformadas de modo estável com polinucleótidos recombinantes que expressam a 5-LO e os alelos considerados do gene da FLAP. Essas células, em forma viável ou fixada, podem ser utilizadas para ensaios de ligação comuns. É possível medir, por exemplo, a formação de produtos da via dos leucotrienos, como a síntese de LTB4, ou examinar a extensão em que o agente que está a ser testado interfere com a formação desses produtos.
Tipicamente, este método inclui preparar células transformadas que expressam a 5-LO e diferentes formas da FLAP codificadas por sequências de DNA contendo alelos particulares de um ou mais dos marcadores bialélicos e/ou mutações descritos acima. A isto segue-se o teste das células que expressam a 5-LO e FLAP com uma substância candidata, para determinar a capacidade da substância para 162 afectar a função da via dos leucotrienos, com a finalidade de identificar aquelas que afectam a actividade enzimática da 5-LO ou a actividade da FLAP, e que, desse modo, podem ser adequadas para utilização em humanos.
Fornecem-se abaixo exemplos típicos desses ensaios de rastreio de fármacos. Deve entender-se que os parâmetros apresentados nestes exemplos podem ser modificados pelo técnico experimentado sem experimentação indevida.
Rastreio de inibidores da 5-LO
Os efeitos de fármacos podem ser avaliados verificando os produtos da 5-LO gerados por células que expressam o gene da 5-LO e o alelo considerado do gene FLAP. Células eucarióticas previamente transformadas com vectores apropriados, como descritos previamente, e que expressam a 5-LO e o alelo do gene FLAP em estudo são recolhidas por centrifugação (300 g, 5 minutos e temperatura ambiente) e lavadas com um tampão apropriado. Seguidamente as células são novamente suspensas em tampão, pré-aquecido a 37°C, preferivelmente numa densidade celular de 5 x 106 células/ml. Alíquotas da suspensão de células são incubadas com o fármaco considerado preferivelmente durante 5 minutos a 37°C. A reacção é iniciada pela adição do ionóforo de cálcio A23187 e ácido araquidónico. Após incubação a 37°C, a reacção é terminada por adição de metanol contendo prostaglandina B2 como padrão interno para a análise de HPLC. Os produtos de reacção da 5-LO são extraídos em clorofórmio, são secos numa corrente de azoto e novamente suspensos em solvente de HPLC. As amostras são analisadas por HPLC de fase reversa utilizando preferivelmente um sistema solvente isocrático de metanol/água/ácido acético (75:25:0,01). A eluição é monitorizada preferivelmente a 270 e 234 nm. Os produtos da 5-LO são quantificados por comparação de áreas de picos com as de curvas padrão de 163 padrões autênticos, e são corrigidos quanto a diferenças muito pequenas da eficiência da extracção, determinadas utilizando o padrão interno prostaglandina B2 . Este método é descrito em mais pormenor em Dixon et al. (1990) e Abramovitz et al. (1993).
Rastreio de inibidores da FLAP A proteína FLAP, ou respectivas porções, descrita acima pode ser utilizada em procedimentos de rastreio de fármacos para identificar moléculas que são agonistas, antagonistas ou inibidores da actividade da FLAP. A proteína FLAP, ou respectiva porção, utilizada nessas análises pode estar livre em solução ou ligada a um suporte sólido. Alternativamente, a proteína FLAP, ou respectivas porções, pode ser expressa numa superfície celular. A célula pode expressar naturalmente a proteína FLAP, ou respectiva porção, ou então, alternativamente, a célula pode expressar a proteína FLAP, ou respectiva porção, a partir de um vector de expressão como os descritos acima.
Num método de rastreio de fármacos, células-hospedeiro eucarióticas ou procarióticas que são transformadas de forma estável com polinucleótidos recombinantes de modo a expressar a proteína FLAP, ou respectiva porção, são utilizadas em ensaios convencionais de ligação competitiva ou ensaios comuns de ligação directa. Por exemplo, pode medir-se em ensaios de ligação directa a formação de um complexo entre a proteína FLAP, ou respectiva porção, e o agente a ser testado. Alternativamente, pode medir-se a capacidade de um agente de teste para prevenir a formação de um complexo entre a proteína FLAP, ou respectiva porção, e um ligando conhecido.
Por exemplo, um ensaio de ligação inibidora da FLAP pode basear-se na observação de que o MK-886, um inibidor da biossíntese de leucotrienos de indolo, se liga com 164 afinidade e especificidade elevadas à FLAP. A ligação do fármaco considerado à FLAP pode ser avaliada por experiências de competição com um análogo radioetiquetado do MK-886, 125I-L-691-831. Uma suspensão de células que expressam o alelo considerado da FLAP, contendo preferivelmente 2 107 células, é centrifugada a 500 x g durante 10 minutos. As células transformadas em grânulo são então novamente suspensas em tampão de lise. Esta suspensão é sonicada em gelo por três impulsos de 20 segundos. A lise das células é verificada visualmente. A ligação é iniciada por adição de amostras da lise de células a cavidades contendo 125I-L-691-831 e o fármaco considerado ou nada (controlo) . A placa é incubada durante 20 minutos à temperatura ambiente. Em seguida, as amostras são filtradas e lavadas. Determina-se num contador o 125I-L-691-831 ligado. Define-se a ligação especifica de fármaco como a diferença entre a ligação na ausência e na presença do fármaco considerado. Este ensaio de ligação da FLAP é descrito em mais pormenor em Charleson et al. (1992) .
Alternativamente, podem utilizar-se as técnicas de rastreio de alto rendimento reveladas na candidatura PCT publicada WO 84/03564. Nessas técnicas, grandes números de pequenos péptidos a serem testados quanto à actividade de ligação da FLAP são sintetizados numa superfície e fixados nela. Os péptidos de teste entram em contacto com a proteína FLAP ou respectiva porção, seguido de um passo de lavagem. A quantidade da proteína FLAP, ou respectiva porção, que se liga ao composto de teste é quantificada utilizando técnicas convencionais.
Em alguns métodos, a proteína FLAP, ou respectiva porção, pode ser fixada numa superfície e entrar em contacto com um composto de teste. Após um passo de 165 lavagem, mede-se a quantidade de composto de teste que se liga à proteína FLAP ou respectiva porção.
Rastreio de inibidores da interacção entre a 5-LO e a FLAP
Os efeitos de fármacos podem ser avaliados verificando a interacção entre a 5-LO e proteínas FLAP. A interacção entre a 5-LO e proteína FLAP pode ser avaliada utilizando sistemas de dois híbridos, como o Sistema de Dois Híbridos Matchmaker 2 (N° Catálogo K1604-1, Clontech). Como descrito no manual anexo ao Sistema de Dois Híbridos Matchmaker 2 (N° Catálogo K1604-1, Clontech), ácidos nucleicos que codificam a proteína FLAP ou respectiva porção são inseridos num vector de expressão de modo a ficarem na estrutura com DNA que codifica o domínio de ligação de DNA do activador da transcrição de levedura GAL4. 0 cDNA da 5-LO, ou respectiva porção, é inserido num segundo vector de expressão de modo a ficar na estrutura com DNA que codifica o domínio de activação da GAL4. Os dois plasmídeos de expressão são transformados em levedura e a levedura é plaqueada em meio de selecção, que selecciona quanto à expressão de marcadores seleccionáveis em cada um dos vectores de expressão, bem como a expressão dependente da GAL4 do gene HIS3. Os transformantes capazes de crescer em meio sem histidina são rastreados quanto à expressão de lacZ dependente de GAL4. As células que são positivas na selecção de histidina e no ensaio de lacZ contêm interacções entre as proteínas FLAP e 5-LO.
Noutro método podem construir-se colunas de afinidade contendo a proteína FLAP ou respectiva porção. Em algumas versões deste método, a coluna de afinidade contém proteínas quiméricas nas quais a proteína FLAP, ou respectiva porção, está fundida a glutationa S-transferase. 166
Aplica-se a proteína 5-LO na coluna de afinidade. A proteína 5-LO retida na coluna de afinidade pode ser medida e pode permitir avaliar a interacção entre as proteínas FLAP e 5-LO. A associação entre as proteínas 5-LO e FLAP também pode ser avaliada utilizando um Biossensor Óptico, como descrito em Edwards et Leatherbarrow (1997). A principal vantagem do método consiste em permitir a determinação da taxa de associação. Tipicamente, uma molécula FLAP é ligada à superfície do sensor (através de uma matriz de carboximetildextrano) e uma amostra de moléculas 5-LO é colocada em contacto com as moléculas FLAP. A ligação de uma molécula 5-LO à molécula FLAP provoca uma alteração do índice de refracção e/ou espessura. Esta alteração é detectada pelo Biossensor desde que ocorra no campo evanescente (que se estende por algumas centenas de nanómetros desde a superfície do sensor). Deste modo pode medir-se facilmente o efeito de um fármaco candidato na associação entre as proteínas FLAP e 5-LO.
Rastreio de modificadores da expressão 0 rastreio de modificadores da expressão é importante, pois pode ser utilizado para detectar modificadores específicos para um alelo ou um grupo de alelos do gene FLAP. Pode determinar-se a alteração da expressão do FLAP em resposta a um modificador administrando ou combinando o modificador candidato com um sistema de expressão, como um animal, ou célula, e num ensaio de transcrição in vitro.
Também pode determinar-se o efeito do modificador sobre a transcrição do FLAP e/ou níveis de mRNA de estado estacionário. Tal como com os níveis de expressão básica, as interacções específicas para tecidos têm interesse. Estabelecem-se correlações entre a capacidade de um modificador da expressão para afectar a actividade da FLAP 167 e a presença dos polimorfismos abordados selectivamente. Pode rastrear-se um painel de modificadores diferentes para determinar o efeito em algumas condições diferentes.
Podem analisar-se os niveis e padrões de expressão do FLAP por hibridização em solução com sondas longas, como descrito na Candidatura de Patente Internacional N° WO 97/05277. Em resumo, o cDNA do FLAP ou o DNA genómico do FLAP descrito acima, ou respectivos fragmentos, é inserido num sitio de clonagem imediatamente a jusante de um promotor de RNA polimerase de bacteriófago (T3, T7 ou SP6), para produzir RNA anti-sentido. Preferivelmente, a inserção de FLAP compreende pelo menos 100 ou mais nucleótidos consecutivos da sequência de DNA genómico ou das sequências de cDNA, particularmente as compreendendo pelo menos um dos marcadores bialélicos da presente invenção ou os que codificam FLAP mutada. O plasmideo é linearizado e transcrito na presença de ribonucleótidos compreendendo ribonucleótidos modificados (isto é, biotina-UTP e DIG-UTP) . Um excesso deste RNA duplamente etiquetado é hibridizado em solução com mRNA isolado de células ou tecidos de interesse. As hibridizações são feitas em condições de restrição comuns (40-50°C durante 16 horas num tampão de formamida 80%, NaCl 0,4 M, pH 7-8) . A sonda não hibridizada é removida por digestão com ribonucleases especificas para RNA de filamentação simples (isto é, RNases CL3, Tl, Phy M, U2 ou A) . A presença da modificação biotina-UTP permite a captura do híbrido numa placa de microtitulação revestida com estreptavidina. A presença da modificação DIG permite que o híbrido seja detectado e quantificado por ELISA utilizando um anticorpo anti-DIG acoplado a fosfatase alcalina. A análise quantitativa da expressão do gene FLAP também pode ser efectuada utilizando séries. Tal como é aqui 168 utilizado, o termo série significa uma disposição unidimensional, bidimensional ou multidimensional de uma pluralidade de ácidos nucleicos de comprimento suficiente para permitir a detecção especifica da expressão de mRNAs capazes de hibridizar para aqueles. Por exemplo, as séries podem conter uma pluralidade de ácidos nucleicos derivados de genes cujos níveis de expressão se quer avaliar. As séries podem incluir o DNA genómico do FLAP, as sequências de cDNA do FLAP ou as sequências complementares a estas ou respectivos fragmentos, particularmente as compreendendo pelo menos um dos marcadores bialélicos descritos na presente invenção ou as que codificam a FLAP mutada. Preferivelmente, os fragmentos têm pelo menos 15 nucleótidos de comprimento. Noutras especificações, os fragmentos têm pelo menos 25 nucleótidos de comprimento. Em algumas especificações, os fragmentos têm pelo menos 50 nucleótidos de comprimento. Mais preferivelmente, os fragmentos têm pelo menos 100 nucleótidos de comprimento. Noutra especificação preferida, os fragmentos têm mais de 100 nucleótidos de comprimento. Em algumas especificações, os fragmentos podem ter mais de 500 nucleótidos de comprimento.
Por exemplo, pode efectuar-se uma análise quantitativa da expressão do gene FLAP com uma microssérie de DNA complementar, como descrito por Schena et al. (1995 e 1996). Os cDNAs do FLAP completo ou respectivos fragmentos são amplificados por PCR e dispostos em série a partir de uma placa de microtítulo de 96 cavidades para lamelas de microscópio sililadas utilizando robótica de alta velocidade. As séries impressas são incubadas numa câmara húmida, para permitir re-hidratação dos elementos da série, e são enxaguadas, uma vez em SDS 0,2% durante 1 minuto, duas vezes em água durante 1 minuto e uma vez durante 5 169 minutos em solução de boro-hidreto de sódio. As séries são submersas em água durante 2 minutos a 95°C, são transferidas para SDS 0,2% durante 1 minuto, enxaguadas duas vezes com água, secas ao ar e armazenadas no escuro a 25 °C. O mRNA celular ou tecidual é isolado ou obtido comercialmente, e as sondas são preparadas por uma única ronda de transcrição reversa. As sondas são hibridizadas para microsséries de 1 cm2 numa lamela de cobertura de vidro de 14 x 14 mm durante 6-12 horas a 60°C. As séries são lavadas durante 5 minutos a 25°C em tampão de lavagem de baixa restrição (1 x SSC/SDS 0,2%), depois durante 10 minutos à temperatura ambiente em tampão de lavagem de restrição elevada (0,1 x SSC/SDS 0,2%). As séries são submetidas a varrimento em 0,1 x SSC utilizando um dispositivo de varrimento de fluorescência induzida por laser equipado com um conjunto comum de filtração. Obtêm-se medições rigorosas da expressão diferencial tomando a média das razões de duas hibridizações independentes. A análise quantitativa da expressão do gene FLAP também pode ser efectuada com cDNAs do FLAP completo, ou respectivos fragmentos, em séries de DNA complementar, como descrito por Pietu et al. (1996). O cDNA do FLAP completo, ou respectivos fragmentos, é amplificado por PCR e disposto em manchas em membranas. Em seguida, mRNAs originários de vários tecidos ou células são etiquetados com nucleótidos radioactivos. Após hibridização e lavagem em condições controladas, os mRNAs hibridizados são detectados por fosfo-imagiologia ou autorradiografia. As experiências são efectuadas em duplicado e depois procede-se a uma análise quantitativa dos mRNAs expressos diferencialmente.
Alternativamente, a análise de expressão utilizando o DNA genómico do FLAP, o cDNA do FLAP, ou respectivos 170 fragmentos, pode ser feita com séries de nucleótidos de alta densidade, como descrito por Lockhart et ai. (1996) e Sosnowsky et ai. (1997). Os oligonucleótidos com 15-50 nucleótidos das sequências do DNA genómico do FLAP, das sequências de cDNA do FLAP, particularmente as compreendendo pelo menos um dos marcadores bialélicos da presente invenção, ou as que codificam a FLAP mutada, ou as respectivas sequências complementares, são sintetizados directamente na placa (Lockhart et ai., 1996) ou sintetizados e depois colocados na placa (Sosnowsky et ai., 1997). Preferivelmente, os oligonucleótidos têm cerca de 20 nucleótidos de comprimento.
As sondas de cDNA do FLAP etiquetadas com um composto apropriado, como biotina, digoxigenina ou corante fluorescente, são sintetizadas a partir da população de mRNA apropriada e depois são fragmentadas aleatoriamente para uma dimensão média de 50 até 100 nucleótidos. Essas sondas são seguidamente hibridizadas para a placa. Após lavagem, como descrito em Lockhart et al., supra, e aplicação de diferentes campos eléctricos (Sosnowsky et ai., 1997), os corantes ou compostos de etiquetagem são detectados e quantificados. Realizam-se hibridizações em duplicado. A análise comparativa da intensidade do sinal originário de sondas de cDNA no mesmo oligonucleótido alvo em diferentes amostras de cDNA indica uma expressão diferencial de mRNA do FLAP.
Rastreio utilizando animais transgénicos Métodos in vivo podem utilizar animais transgénicos para o rastreio de fármacos. Podem utilizar-se ácidos nucleicos incluindo pelo menos um dos polimorfismos bialélicos de interesse para gerar animais não humanos geneticamente modificados ou para gerar modificações de genes específicas para sítios em linhas celulares. 171
Pretende-se que o termo "transgénico" abranja animais geneticamente modificados com uma deleção, ou outro "knock-out" da actividade do gene FLAP, tendo um gene FLAP exógeno que é transmitido de forma estável nas células-hospedeiro ou tendo um promotor do FLAP exógeno operativamente ligado a um gene repórter. Os animais transgénicos podem ser produzidos por recombinação homóloga em que o locus do FLAP está alterado. Alternativamente, uma construção de ácido nucleico é integrada aleatoriamente no genoma. Vectores para integração estável incluem, por exemplo, plasmideos, retrovirus e outros virus de animais e YACs. São interessantes mamíferos transgénicos, por exemplo, vacas, porcos, cabras, cavalos e particularmente roedores, como ratos e ratinhos. Os animais transgénicos permitem estudar a eficácia e toxicidade do fármaco candidato.
Ao longo desta candidatura, várias publicações, patentes e candidaturas de patentes publicadas são citadas na presente revelação para descrever de forma mais completa a técnica corrente à qual pertence esta invenção. EXEMPLOS Exemplo 1
Detecção de marcadores bialélicos do FLAP: extracção de DNA
Os dadores não estavam relacionados e eram saudáveis. Apresentaram uma diversidade suficiente para serem representativos de uma população heterogénea francesa. Extraiu-se o DNA de 100 indivíduos, tendo sido testado para a detecção dos marcadores bialélicos.
Recolheram-se de cada dador 30 ml de sangue venoso periférico na presença de EDTA. Recolheram-se as células (grânulo) após centrifugação durante 10 minutos a 2000 rpm. Os glóbulos vermelhos foram submetidos a lise com uma 172 solução de lise (volume final de 50 ml: Tris 10 mM pH 7,6, MgCl2 5 mM, NaCl 10 mM) . Centrifugou-se a solução (10 minutos, 2000 rpm) tantas vezes quanto o necessário para eliminar os glóbulos vermelhos residuais presentes no sobrenadante, após nova suspensão do grânulo na solução de lise. 0 grânulo de glóbulos brancos foi submetido a lise durante a noite a 42°C com 3,7 ml de solução de lise, composta por: - 3 ml de TE 10-2 (Tris-HCl 10 mM, EDTA 2 mM)/NaCl 0,4 M; - 200 μΐ de SDS 10%, e - 500 μΐ de proteinase K (2 mg de proteinase K em TE 10-2/NaCl 0,4 M).
Para a extracção de proteínas adicionou-se 1 ml de NaCl saturado (6 M) (1/3,5 v/v) . Após agitação vigorosa, centrifugou-se a solução durante 20 minutos a 10000 rpm.
Para a precipitação de DNA, adicionaram-se ao sobrenadante anterior 2 até 3 volumes de etanol a 100% e centrifugou-se a solução durante 30 minutos a 2000 rpm. A solução de DNA foi enxaguada três vezes com etanol a 70%, para eliminar sais, e foi centrifugada durante 20 minutos a 2000 rpm. O grânulo foi seco a 37°C e foi novamente suspenso em 1 ml de TE 10-1 ou 1 ml de água. Avaliou-se a concentração de DNA medindo a OD a 260 nm (1 unidade de OD = 50 μg/ml de DNA).
Para determinar a presença de proteínas na solução de DNA determinou-se a razão OD 260 / OD 280. Apenas preparações de DNA com uma razão OD 260 / OD 280 entre 1,8 e 2 foram utilizadas nos exemplos subsequentes descritos abaixo. 173
Constituiu-se a reunião misturando quantidades equivalentes de DNA de cada indivíduo.
Exemplo 2
Detecção dos marcadores bialélicos: amplificação de DNA genómico por PCR A amplificação de sequências genómicas específicas das amostras de DNA do exemplo 1 foi efectuada na reunião de DNA obtida previamente. Adicionalmente, amplificaram-se de modo semelhante 50 amostras individuais.
Os ensaios de PCR foram realizados utilizando o protocolo seguinte:
Volume final 25 μΐ 2 ng/μΐ 2 mM 200 μΜ 2, 9 ng/μΐ 0,05 unidades/μΐ 0,1 M pH 8,3 KC1 0,5 M)
DNA
MgCi2 dNTP (cada) "primer" (cada)
Ampli Taq Gold DNA polimerase tampão de PCR (lOx = Tris-HCl lx
Cada par de primeiros "primers" foi concebido utilizando a informação da sequência do gene FLAP (GenBank 182657, Kennedy et al., 1991, incorporado aqui por referência) e o "software" OSP (Hillier & Green, 1991). Estes primeiros "primers" tinham cerca de 20 nucleótidos de comprimento e as suas sequências respectivas são reveladas na Tabela 1. 174
Tabela 1
Produto de anplificaçáo Gama de posições do produto de anplificaçáo na ID SEQ N° 1 PU Gama de posições do "prirrer" de anplificaçáo na ID SEQ N° 1 RP Gama de posições ccrplerrentares do "prirrer" de anplificaçáo na ID SEQ N° 1 10-517 3851 4189 BI 5 3851 3869 C15 4171 4189 10-518 4120 4390 B16 4120 4138 C16 4372 4390 10-253 4373 4792 BI 4373 4391 Cl 4773 4792 10-499 4814 5043 B2 4814 4833 C2 5026 5043 10-500 4956 5422 B3 4956 4972 C3 5405 5422 10-522 5524 5996 BI 7 5524 5542 Cl 7 5978 5996 10-503 6218 6672 B4 6218 6235 C4 6652 6672 10-504 6522 6790 B5 6522 6539 C5 6772 6790 10-204 7120 7574 B6 7120 7137 C6 7557 7574 10-32 7513 7933 B 7 7513 7531 C7 7914 7933 10-33 16114 16533 B8 16114 16132 C8 16515 16533 10-34 24072 24425 B9 24072 24089 C9 24408 24425 10-35 27978 28401 BI 0 27978 27995 CIO 28384 28401 10-36 36020 36465 BI 1 36020 36039 Cll 36446 3 6 465 10-498 36318 36669 B12 36318 36337 C12 36652 36669 12-629 38441 38840 B13 38441 38460 C13 38820 38840 12-628 42233 42749 BI 4 42233 42253 C14 42731 42749
Preferivelmente, os "primers" continham uma cauda oligonucleotidica comum a montante das bases específicas abordadas selectivamente para amplificação, o que foi útil para a sequenciação.
Os "primers" PU continham a seguinte sequência PU 5' adicional: TGTAAAACGACGGCCAGT (ID SEQ N° 14); OS "primers" RP contêm a seguinte sequência RP 5' : CAGGAAACAGCTATGACC (ID SEQ N° 15). A síntese destes "primers" foi feita seguindo o método de fosforamidite num sintetizador GENSET UFPS 24.1. A amplificação de DNA foi feita num aparato de aplicação de ciclos térmicos Genius II. Após aquecimento a 94°C durante 10 minutos, efectuaram-se 40 ciclos. Cada ciclo compreendeu: 30 segundos a 94°C, 55°C durante 1 minuto e 30 segundos a 72°C. Para o alongamento final, 7 minutos a 72°C terminam a amplificação. Determinaram-se as 175 quantidades dos produtos de amplificação obtidos em placas de microtitulo de 96 cavidades, utilizando um fluorómetro e Picogreen como agente de intercalação (Molecular Probes).
Exemplo 3
Detecção dos marcadores bialélicos: Sequenciação de DNA genómico amplificado e identificação de polimorfismos A sequenciação do DNA amplificado obtido no exemplo 2 foi feita em sequenciadores ABI 377. Determinaram-se as sequências dos produtos de amplificação utilizando reacções de sequenciação com terminação didesoxi automáticas com um protocolo de sequenciação com ciclo de terminação com corante. Os produtos das reacções de sequenciação foram processados em géis de sequenciação, tendo-se determinado as sequências.
Os dados das sequências foram suplementarmente avaliados quanto a polimorfismos detectando a presença de marcadores bialélicos entre os fragmentos amplificados reunidos. A pesquisa de polimorfismos baseou-se na presença de picos sobrepostos no padrão de electroforese, resultante de diferentes bases ocorrendo na mesma posição.
Analisaram-se 17 fragmentos de amplificação. Nestes segmentos detectaram-se 28 marcadores bialélicos. A localização dos marcadores bialélicos foi a apresentada na Tabela 2. 176
Tabela 2
Produto de amplificação BM Norre do Marcador Freq. do al2 Localização no gene FIAP Polimor fismo Posição de m na ID SEQ Posição de 47-meros na ID SEQ N° 1 Nome de 47- meros all al2 N° 1 N° 2 10-517 M5 10-517-100 51 reguladora G c 3950 3927 3973 P25 10-518 M6 10-518-125 5' reguladora G T 4243 4220 4266 P26 10-518 M7 10-518-194 51 reguladora A G 4312 4289 4335 P27 10-253 Ai 10-253-118 51 reguladora A G 4490 4467 4513 PI 10-253 A2 10-253-298 4,57 51 reguladora G C 4670 4647 4693 P2 10-253 A3 10-253-315 51 reguladora C T 4687 4664 4710 P3 10-499 A4 10-499-155 51 reguladora A G 4968 4945 4991 P4 10-500 A5 10-500-185 51 reguladora C T 5140 5117 5163 P5 10-500 Ao 10-500-258 51 reguladora G T 5213 5190 5236 P6 10-500 A7 10-500-410 51 reguladora A G 5364 5341 5387 P7 10-522 M8 10-522-71 51 reguladora A G 5594 5571 5617 P28 10-503 A8 10-503-159 51 reguladora G T 6370 6347 6393 P8 10-504 A9 10-504-172 51 reguladora A T 6693 6670 6716 P9 10-504 M0 10-504-243 51 reguladora A C 6763 6740 6786 P10 10-204 All 10-204-326 6,63 51 reguladora A G 7445 7422 7468 Pll 10-32 M2 10-32-357 33,45 Intrão 1 A C 7870 7847 7893 PI 2 10-33 M3 10-33-175 2,3 Exão 2 C T 16288 197 16265 16311 PI 3 10-33 A14 10-33-234 43,98 Intrão 2 A C 16347 16324 16370 PI 4 10-33 A15 10-33-270 Intrão 2 A G 16383 16360 16406 PI 5 10-33 M6 10-33-327 24,26 Intrão 2 C T 16440 16417 16463 PI 6 10-34 A17 10-34-290 Intrão 3 G T 24361 24338 24384 PI 7 10-35 M8 10-35-358 31,25 Intrão 4 G C 28336 28313 28359 PI 8 10-35 M9 10-35-390 22,98 Intrão 4 C T 28368 28345 28391 PI 9 10-36 M0 10-36-164 Intrão 5 V127-el A G 36183 453 36160 36206 P20 10-498 Ml 10-498-192 Exão 5 A G 36509 779 36486 36532 P21 12-629 M2 12-629-241 28,3 31 reguladora G C 38681 38658 38704 P22 12-628 M4 12-628-311 31 reguladora T C 42440 42417 42463 P24 12-628 M3 12-628-306 10,27 31 reguladora G A 42445 42422 42468 P23 BM refere-se a "marcador bialélico". All e al2 referem-se, respectivamente, ao alelo 1 e alelo 2 do marcador bialélico. "Freq. do al2" refere-se à frequência do alelo 2, em percentagem, na população de controlo caucasiana dos E.U.A., exceptuando o marcador bialélico 10-204/326 para o qual a população consiste nos controlos caucasianos 177 franceses. As frequências corresponderam a uma população de dadores de sangue aleatórios de origem caucasiana francesa.
Os polimorfismos AI 4 (10-33-234) e A16 (10-33-327) foram observados em Kennedy et al., 1991. No entanto, as suas frequências na população eram desconhecidas; em consequência, não podem ser considerados marcadores bialélicos validados até se terem obtido os resultados dos presentes inventores.
Exemplo 4
Validação dos polimorfismos por microssequenciação
Confirmaram-se suplementarmente os marcadores bialélicos identificados no exemplo 3 e determinaram-se as suas sequências respectivas por microssequenciação. Efectuou-se a microssequenciação para cada amostra de DNA individual descrita no Exemplo 1. A amplificação de DNA genómico de indivíduos foi feita por PCR como descrito acima para a detecção dos marcadores bialélicos com o mesmo conjunto de "primers" de PCR (Tabela D ·
Os "primers" preferidos utilizados na microssequenciação tinham cerca de 19 nucleótidos de comprimento e hibridizaram imediatamente a montante da base polimórfica considerada. As suas sequências são reveladas na Tabela 3 abaixo. 178
Tabela 3
Norre do Ndrcador Marcador Bialélico MLs. 1 Gama de posições do "primar" de rricrossequenciação rris 1 na ID SEQ N° 1 Mis. 2 Garra de posições complementares do "primar" de rricrossequenciação rris. 2 na ID SEQ N° 1 10-517-100 A25 D25 3930 3949 E25 3951 3970 10-518-125 A26 D26 4223 4242 E26 4244 4263 10-518-194 A2 7 D27 4292 4311 E27 4313 4332 10-253-118 AI Dl 4470 4489 EI 4491 4510 10-253-298 A2 D2 4650 4669 E2 4671 4690 10-253-315 A3 D3 466 7 4686 E3 4688 4707 10-499-155 A4 D4 4948 4967 E 4 4969 4988 10-500-185 A5 D5 5120 5139 E5 5141 5160 10-500-258 A6 D6 5193 5212 E6 5214 5233 10-500-410 A7 D7 5344 5363 E 7 5365 5384 10-522-71 A2 8 D28 5574 5593 E28 5595 5614 10-503-159 A8 D8 6350 6369 E8 6371 6390 10-504-172 A9 D9 6673 6692 E9 6694 6713 10-504-243 A10 Dl 0 6743 6762 E10 6764 6783 10-204-326 AI 1 Dl 1 7425 7444 Eli 7446 7465 10-32-357 A12 D12 7850 7869 E12 7871 7890 10-33-175 A13 D13 16268 16287 E13 16289 16308 10-33-234 AI 4 Dl 4 16327 16346 E14 16348 16367 10-33-270 A15 D15 16363 16382 E15 16384 16403 10-33-327 AI 6 D16 16420 16439 E16 16441 16460 10-34-290 AI 7 Dl 7 24341 24360 EI 7 24362 24381 10-35-358 AI 8 D18 28316 28335 E18 28337 28356 10-35-390 AI 9 Dl 9 28348 28367 E19 28369 28388 10-36-164 A2 0 D20 36163 36182 E20 36184 36203 10-498-192 A21 D21 36489 36508 E21 36510 36529 12-629-241 A22 D22 38661 38680 E22 38682 38701 12-628-311 A2 4 D24 42420 42439 E24 42441 42460 12-628-306 A23 D23 42425 42444 E23 42446 42465
Mis 1 e Mis 2 referem-se, respectivamente, a "primers" de microssequenciação que hibridizaram com o filamento não codificador do gene FLAP ou com o filamento codificador do gene FLAP. A reacção de microssequenciação foi conduzida do modo seguinte:
Adicionaram-se 5 μΐ de produtos de PCR a 5 μΐ de mistura de purificação 2U SAP (Fosfato alcalino de camarão) 179 (Amersham E70092X), 2U Exonuclease I (Amersham E70073Z), 1 μΐ de tampão SAP (Tris-HCl 200 mM pH 8, MgCl2 100 mM) numa placa de microtítulo. A mistura reaccional foi incubada durante 30 minutos a 37°C e depois foi desnaturada durante 10 minutos a 94°C. Seguidamente adicionaram-se a cada cavidade 20 μΐ de mistura de reacção de microssequenciação contendo: 10 pmol de oligonucleótido de microssequenciação (19meros, GENSET, síntese em bruto, 5 OD) , 1 U Termosequenase (Amersham E79000G), 1,25 μΐ de tampão Termosequenase (Tris HC1 260 mM pH 9,5, MgCl2 65 mM) e os dois ddNTPs fluorescentes apropriados complementares aos nucleótidos no sítio polimórfico correspondente a ambas as bases polimórficas (TAMRA-ddTTP 11,25 nM; ROX-ddCTP 16,25 nM; REG-ddATP 1,675 nM; RHO-ddGTP 1,25 nM; Perkin Elmer, Conjunto de Terminação com Corante 401095) . Após 4 minutos a 94°C, aplicaram-se 20 ciclos de PCR de 15 segundos a 55°C, 5 segundos a 72°C e 10 segundos a 94°C, num aparato de aplicação de ciclos térmicos Tetrad PTC-225 (MJ Research). A placa de microtítulo foi centrifugada durante 10 segundos a 1500 rpm. Os terminadores de corante não incorporados foram removidos por precipitação com 19 μΐ de MgCl2 2 mM e 55 μΐ de etanol a 100%. Após 15 minutos de incubação à temperatura ambiente, a placa de microtítulo foi centrifugada a 3300 rpm durante 15 minutos a 4°C. Depois de deitar fora os sobrenadantes, a placa de microtítulo foi evaporada até à secura sob pressão reduzida (Speed Vac); as amostras foram novamente suspensas em 2,5 μΐ de tampao de carga formamida EDTA e foram aquecidas durante 2 minutos a 95°C. Aplicaram-se 0,8 μΐ da reacção de microssequenciação num gel de sequenciação de poliacrilamida a 10% (19:1). Os dados foram recolhidos num 180 sequenciador de DNA ABI PRISM 377 e foram processados utilizando o "software" GENESCAN (Perkin Elmer).
Exemplo 5
Estudo de associação entre asma e os marcadores bialélicos do gene FLAP: recolha de amostras de DNA de indivíduos afectados e não afectados A caracteristica de doença seguida neste estudo de associação foi asma, uma doença que envolve a via dos leucotrienos. A população asmática correspondeu a 297 indivíduos que fizeram parte de um estudo clínico para avaliar o fármaco anti-asma Zileuton. Mais de 90% destes 297 indivíduos asmáticos tinha antecedentes étnicos caucasianos. A população de controlo correspondeu a indivíduos não afectados. Neste estudo de associação utiliza-se como população de controlo uma população caucasiana francesa (190 indivíduos) ou população caucasiana dos E.U.A. (286 indivíduos). A população de controlo preferida é a população caucasiana dos E.U.A., uma vez que a população asmática compreende essencialmente indivíduos dos E.U.A.
Exemplo 6
Estudo de associação entre asma e os marcadores bialélicos do gene FLAP: Genotipagem de indivíduos afectados e de controlo A estratégia geral para realizar os estudos de associação consistiu em submeter individualmente a varrimento as amostras de DNA de todos os indivíduos em cada uma das populações descritas acima, para estabelecer as frequências de alelos dos marcadores bialélicos descritos acima em cada uma destas populações. 181
Determinaram-se as frequências alélicas dos marcadores bialélicos descritos acima em cada população efectuando reacções de microssequenciação em fraqmentos amplificados obtidos por PCR genómica efectuada nas amostras de DNA de cada indivíduo. A PCR genómica e microssequenciação foram efectuadas como pormenorizado acima nos exemplos 2 e 4, utilizando os "primers" descritos de PCR e microssequenciação.
Exemplo 7
Estudo de associação entre asma e os marcadores bialélicos do gene FLAP A) Estudos de associação para o gene da asma com a população de controlo caucasiana francesa
Este estudo de associação utiliza 293 indivíduos asmáticos e 185 controlos caucasianos franceses.
Como mostrado na Figura 2 (A) , os marcadores 10-32/357 e 10-35/390 apresentaram uma associação forte com asma, em que esta associação foi altamente significativa (valor p = l,95xl0~3 para o marcador 10-32/357 e l,75xl0“3 para o marcador 10-35-390). Em consequência, os dois marcadores 10-32/357 e 10-35/390 podem ser utilizados em diagnóstico com um teste à base de cada marcador. Dois outros marcadores exibiram associação moderada quando testados independentemente, nomeadamente 33/234 e 35/358. B) Estudos de associação para o gene da asma com a população de controlo caucasiana dos E.U.A.
Este estudo de associação utiliza 297 indivíduos asmáticos e 286 controlos caucasianos dos E.U.A.
Como mostrado na Figura 2 (B), o marcador bialélico 10-35/390 apresentou uma associação forte com asma, em que esta associação foi altamente significativa (valor p = 2,29xl0“3). Os dois marcadores 10-32/357 e 10-33/234 182 exibiram associação fraca quando testados independentemente. 0 marcador bialélico 10-35/390 está localizado na sequência genómica do FLAP. Em consequência, os resultados dos estudos de associação mostram que um polimorfismo do gene FLAP parece estar relacionado com asma. Em consequência, o marcador bialélico 10-35/390 pode ser utilizado em diagnóstico com um teste à base deste marcador ou de uma combinação de marcadores bialélicos compreendendo este marcador.
Exemplo 8
Estudos de associação: Análise da frequência de haplótipos
Um modo de aumentar o poder estatístico de marcadores individuais consiste em realizar uma análise de associação de haplótipos.
Efectuou-se uma análise de haplótipos quanto à associação de marcadores do FLAP e asma estimando as frequências de todos os haplótipos possíveis compreendendo marcadores bialélicos seleccionados do grupo que consiste em 10-253/298, 10-32/357, 10-33/175, 10-33/234, 10-33/327, 10-35/358, 10-35/390, 12-628/306 e 12-629/241 nas populações asmática e de controlo caucasiana dos E.U.A. descritas no Exemplo 7, e comparando estas frequências com um teste estatístico de qui-quadrado (um grau de liberdade). Efectuaram-se estimativas de haplótipos aplicando o algoritmo de Maximização da Expectativa (EM) (Excoffier L. & Slatkin M., 1995), utilizando o programa EM-HAPLO (Hawley M.E., Pakstis A.J. & Kidd K.K., 1994).
Os haplótipos mais significativos obtidos estão apresentados na Figura 3.
Os haplótipos de dois marcadores preferidos, descritos na figura 3 como HAP1 até HAP 7, compreendem o marcador 10- 183 33/234 (alelo A) ou o marcador 10-35/390 (alelo T). O haplótipo de dois marcadores mais preferido HAP1 (A em 10-33/234 e T em 10-35/390) apresentou um valor p de 8,2xl0~4 e uma razão de probabilidade de 1,61. As frequências estimadas do haplótipo foram 28,3% nos casos e 19,7% nos controlos dos E.U.A. Dois outros haplótipos de dois marcadores HAP2 (A em 10-33/234 e G em 12-629/241) e HAP3 (T em 10-33/327 e T em 10-33/390) apresentaram, respectivamente, um valor p de l,6xl0-3 e l,8xl0~3, uma razão de probabilidade de 1,65 e 1,53 e frequências de haplótipos de 0,305 e 0,307 para a população asmática e de 0,210 e 0,224 para a população de controlo dos E.U.A.
Haplótipos preferidos de três marcadores compreendem o marcador 10-33/234 (alelo A) e o marcador 10-35/390 (alelo T): HAP37, HAP38, HAP39 e HAP41. O haplótipo de três marcadores mais preferido HAP37 (A em 10-33/234, T em 10-33/390 e C em 12-628/306) apresentou um valor p de 8,6xl0-4 e uma razão de probabilidade de 1,76. As frequências estimadas do haplótipo foram 26,5% nos casos e 17,1% nos controlos dos E.U.A. Outro haplótipo de três marcadores HAP40 (A em 10-33/234, C em 12-628/306 e G em 12-629/241) também é significativo.
Haplótipos de quatro marcadores (HAP121 até HAP125), haplótipos de cinco marcadores (HAP 247 e 248) e um haplótipo de seis marcadores (HAP373) exibiram valores p significativos. Todos compreendem o marcador 10-33/234 (alelo A) e o marcador 10-35/390 (alelo T) , com a excepção do haplótipo HAP124 que não compreende o marcador 10-35/390. Os outros marcadores são escolhidos do grupo que consiste em 10-235/298 (alelo C) , 10-35/358 (alelo G) , 12-628/306 (alelo C) e 12-629/241 (alelo G) . O haplótipo mais preferido compreendendo A em 10-33/234 e T em 10-35/390 (HAP1 na figura 3) também é significativo 184 numa análise de frequência de haplótipos com população asmática e controlos caucasianos franceses. De facto, este haplótipo apresentou um valor p de 2,7xlCT3 e uma razão de probabilidade de 1,67. As frequências estimadas do haplótipo foram 28,3% nos casos e 19,2% nos controlos franceses (ver Figura 4). 0 haplótipo HAP1 é o haplótipo mais preferido da invenção. Pode ser utilizado no diagnóstico de asma. Além disso, a maior parte dos haplótipos significativos associados a asma compreendem o marcador bialélico 10-35/390 (alelo A), que também pode ser utilizado em diagnóstico. A significância estatística dos resultados obtidos para a análise de haplótipos foi avaliada por um teste de permutação fenotípica iterada 1000 ou 10 000 vezes num computador. Para esta simulação computacional, os dados dos indivíduos asmáticos e de controlo foram reunidos e atribuídos aleatoriamente a dois grupos, que continham o mesmo número de indivíduos das populações de caso-controlo utilizadas para produzir os dados resumidos na figura 3. Depois efectuou-se uma análise de haplótipos nestes grupos artificiais para os 2 marcadores incluídos no haplótipo HAP1, que exibiu a associação mais forte com asma. Esta experiência foi iterada 1000 e 10 000 vezes, os resultados estão apresentados na figura 4. Estes resultados demonstram que em 1000 iterações não houve nenhum e em 10 000 iterações apenas 1 dos haplótipos obtidos tinha um valor p comparável ao obtido para o haplótipo HAP1. Estes resultados validam claramente a significância estatística da associação entre este haplótipo e asma. 185
Exemplo 9
Preparação de Composições de Anticorpos para a Variante 127-Ile da FLAP A proteína ou polipéptido substancialmente puro é isolado de células transfectadas ou transformadas contendo um vector de expressão que codifica a proteína FLAP, ou respectiva porção. Ajusta-se a concentração da proteína na preparação final, por exemplo, por concentração num dispositivo de filtração Amicon, até ao nivel de alguns microgramas/ml. Em seguida, um anticorpo monoclonal ou policlonal para a proteína pode ser preparado do modo seguinte. A. Produção de Anticorpo Monoclonal por Fusão de Hibridomas
Um anticorpo monoclonal para epítopos presentes na proteína FLAP, ou respectiva porção, pode ser preparado a partir de hibridomas murinos de acordo com o método clássico de Kohler, G. e Milstein, C. (1975) ou respectivos métodos derivados. Ver também Harlow, E., e D. Lane, 1988.
Em resumo, um ratinho é repetidamente inoculado com alguns microgramas da proteína FLAP, ou respectiva porção, durante um período de algumas semanas. Em seguida, o ratinho é sacrificado e as células produtoras de anticorpos do baço são isoladas. As células do baço são fundidas, utilizando polietilenoglicol, a células de mieloma de ratinho, e o excesso de células não fundidas é destruído por crescimento do sistema em meio selectivo compreendendo aminopterina (meio HAT). As células fundidas com êxito são diluídas, colocando-se alíquotas da diluição em cavidades de uma placa de microtítulo, onde se continua o crescimento da cultura. Identificam-se clones produtores de anticorpos por detecção de anticorpos no fluido sobrenadante das cavidades utilizando procedimentos de imunoensaio, como ELISA, tal como originalmente descrito por Engvall, E. 186 (1980), e respectivos métodos derivados. Os clones positivos seleccionados podem ser expandidos e o seu produto de anticorpo monoclonal é recolhido para utilização. Procedimentos pormenorizados para a produção de anticorpos monoclonais são descritos em Davis, L. et al. "Basic Methods in Molecular Biology" Elsevier, Nova Iorque, Secção 21-2. B. Produção de Anticorpo Policlonal por Imunização
Pode preparar-se anti-soro policlonal contendo anticorpos para epítopos heterogéneos na proteína FLAP, ou respectiva porção, por imunização de um animal não humano adequado com a proteína FLAP, ou respectiva porção, que pode não estar modificada ou estar modificada para aumentar a imunogenicidade. Selecciona-se um animal não humano adequado que é, preferivelmente, um mamífero não humano, habitualmente um ratinho, rato, coelho, cabra ou cavalo. Alternativamente, uma preparação em bruto que foi enriquecida quanto à concentração da FLAP pode ser utilizada para gerar anticorpos. Essas proteínas, fragmentos ou preparações são introduzidos no mamífero não humano na presença de um adjuvante apropriado (por exemplo, hidróxido de alumínio, RIBI, etc.) que é conhecido na área. Adicionalmente, a proteína, fragmento ou preparação pode ser pré-tratado com um agente que irá aumentar a antigenicidade; esses agentes são conhecidos na área e incluem, por exemplo, albumina de soro bovino metilada (mBSA), albumina de soro bovino (BSA), antigene de superfície da Hepatite B e hemocianina de lapa californiana (KLH) . O soro do animal imunizado é recolhido, tratado e testado de acordo com procedimentos conhecidos. Se o soro contiver anticorpos policlonais para epítopos indesejados, os anticorpos policlonais podem ser purificados por cromatografia de imunoafinidade. 187 A produção eficaz de anticorpos policlonais é afectada por muitos factores relacionados com o antigene e a espécie do hospedeiro. A resposta dos animais hospedeiros também varia quanto ao sitio das inoculações e dose, em que doses inadequadas ou excessivas de antigene resultam em anti-soros de títulos baixos. Doses baixas (nível dos ng) de antigene administrado em múltiplos sítios intradérmicos parece ser o método mais fiável. Técnicas de produção e processamento de anti-soros policlonais são conhecidas na área; ver, por exemplo, Mayer e Walker (1987). Um protocolo de imunização eficaz para coelhos pode ser encontrado em Vaitukaitis, J. et al. (1971).
Podem administrar-se injecções de reforço em intervalos regulares e pode recolher-se o anti-soro quando o seu título de anticorpos começa a diminuir, como determinado semi-quantitativamente, por exemplo, por imunodifusão dupla em agar contra concentrações conhecidas do antigene. Ver, por exemplo, Ouchterlony, 0. et al. (1973). A concentração de patamar do anticorpo situa-se habitualmente na gama de 0,1 até 0,2 mg/ml de soro (cerca de 12 μΜ). Determina-se a afinidade dos anti-soros para o antigene preparando curvas de ligação competitiva, como descrito, por exemplo, por Fisher, D. (1980) . Preparações de anticorpos produzidas de acordo com o protocolo monoclonal ou policlonal são úteis em imunoensaios quantitativos que determinam concentrações de substâncias contendo antigenes em amostras biológicas; também são utilizadas semi-quantitativamente ou qualitativamente para identificar a presença de antigenes numa amostra biológica. Os anticorpos também podem ser utilizados em composições terapêuticas para matar células que expressam a proteína ou reduzir os níveis da proteína no corpo. 188
Se bem que a especificação preferida da invenção tenha sido ilustrada e descrita, será apreciado que o experimentado na área pode fazer aí várias alterações sem sair do espírito e âmbito da invenção.
REFERENCIAS
Abbondanzo S.J. et al., 1993, "Methods in Enzymology" Academic Press, Nova Iorque, páginas 803-823 / Abramovitz M.,Wong E, Cox ME, Richardson CD, Li C, & Vickers PJ, Eur J Biochem 1993;215(1);105-111 / Altschul et al., 1990, J.
Mol. Biol. 215(3): 403-410 / Altschul et al., 1993, Nature Genetics 3:266-272 / Altschul et al., 1997, Nuc. Acids Res. 25:3389-3402 / Anton M. et al., 1995, J. Virol., 69 : 4600-4606 /Araki K et al. (1995) Proc. Natl. Acad. Sei. USA. 92 (1) :160-4. / Ausubel et al. (1989) "Current Protocols in Molecular Biology" Green Publishing Associates e Wiley Interscience, N.I. / Baubonis W. (1993) Nucleic Acids Res. 21(9):2025-9 / Beaucage et al., Tetrahedron Lett 1981, 22: 1859-1862 / Bradley A., 1987, "Production and analysis of chimaeric mice" Em: E.J. Robertson (Editor) "Teratocarcinomas and embryonic stem cells: A practical approach" IRL Press, Oxford, página 113 / Brown EL,
Belagaje R, Ryan MJ, Khorana HG, Methods Enzymol 1979;68:109-151 / Brutlag et al. Comp. App. Biosci. 6:237-245, 1990 / Capecchi, M.R. (1989a) Science, 244:1288-1292 / Capecchi, M.R. (1989b) Trends Genet., 5:70-76 / Chai H. et al. Chai H. et al. (1993) Biotechnol. Appl. Biochem. 18:259-273. / Charleson S, Prasit P, Leger S, Gillard JW, Vickers PJ, Mancini JA, Charleson P, Guay J, Ford-Hutchinson AW, Evans JF, Mol Pharmacol 1992;41(5)873-879 / Chee et al. (1996) Science. 274:610-614 / Chen et al. (1987) Mol. Cell Biol 1:2745-2752. / Chou J.Y., 1989, Mol. Endocrinol. , 3: 1511-1514. / Clark A.G. (1990) Mol. Biol. 189
Evol. 7:111-122. / Compton J. (1991) Nature 350(6313):91-92. / Davis L.G., M.D. Dibner e J.F. Battey, "Basic Methods in Molecular Biology", editores, Elsevier Press, N.I., 1986 / Dempster et al., (1977) J. R. Stat. Soc. 39B:l-38. / Dixon et al., 1988, PIVAS 85, páginas 416-420 / Dixon RA, Diehl RE, Opas E, Rands E, Vickers PJ, Evans JF, Gillard JW, & Miller DK, Nature 1990:343(6255):282-284 / Eckner R. et al. (1991) EMBO J. 10:3513-3522. / Edwards e Leatherbarrow, Analytical Biochemistry, 246, 1-6 (1997) / Engvall, E., Meth. Enzymol. 70:419 (1980) / Excoffier L. e Slatkin M (1995) Mol. Biol. Evol. 12(5):921-927. / Feldman e Steg, 1996, Medecine/Sciences, synthese, 12:47-55 / Fisher, D., Capítulo 42 em: "Manual of Clinicai Immunology" 2a Edição (Rose e Friedman, Editores) Amer. Soc. For Microbiol., Washington, D.C. (1980) / Flotte et al. (1992) Am. J. Respir. Cell Mol. Biol. 7:349-356. / Fodor et al. (1991) Science 251:767-777. / Fraley et al. (1979) Proc. Natl. acad. Sei. USA. 76:3348-3352. / Fuller S. A. et al. (1996) "Immunology in Current Protocols in Molecular Biology" Ausubel et al. Editores, John Wiley & Sons, Inc., E.U.A. / Furth P.A. et al (1994) Proc. Natl. Acad. Sei USA 91:9302-9306. / Geysen H. Mario et al. 1984. Proc. Natl. Acad. Sei. U.S.A. 81:3998-4002 / Ghosh e Bacchawat, 1991, "Targeting of liposomes to hepatocytes" EM: "Liver Diseases, Targeted diagnosis and therapy using specific receptors and ligands" Wu et al. Editores, Mareei Dekeker, Nova Iorque, páginas 87-104 / Gonnet et al., 1992, Science 256:1443-1445 / Gopal (1985) Mol. Cell. Biol., 5:1188-1190. / Gossen M. et al. (1992) Proc. Natl. Acad. Sei. USA. 89:5547-5551. / Gossen M et al. (1995) Science. 268:1766-1769. / Graham et al. (1973) Virology 52:456-457. / Grompe, M. (1993) Nature Genetics 5:111-117. / Grompe, M et al. (1989) Proc. Natl. Acad. Sei. U.S.A. 86:5855-5892. / Gu H. 190 et al. (1993) Cell 73:1155-1164. / Gu H. et al. (1994) Science 265:103-106. / Guatelli J C et al. Proc. Natl.
Acad. Sei. USA. 35:273-286. / Hacia JG, Brody LC, Chee MS, Fodor SP, Collins FS, Nat Genet 1996; 14 (4): 441-447 / Haff L. A. e Smirnov I. P. (1997) Genome Research, 7:378-388. / Hames B.D. e Higgins S.J. (1985) "Nucleic Acid Hybridization: A Practical Approach" Hames e Higgins
Editores, IRL Press, Oxford / Harju L., Weber T, Alexandrova L, Lukin M, Ranki M, Jalanko A, Clin. Chem. 1993; 39(11 Parte 1): 2282-2287 / Harland et al. (1985) J. Cell Biol. 101: 1094-1095 / Harlow, E., e D. Lane, 1988, "Antibodies A Laboratory Manual" Cold Spring Harbor Laboratory, páginas 53-242 / Hawley M.E. et al. (1994) Am. J. Phys. Anthropol. 18:104. / Henikoff e Henikoff, 1993; Proteins 17:49-61 / Higgins et ai., 1996, Methods Enzymol. 266:383-402 / Hillier L. e Green P. Methods Appl. 1991, 1:124-8. / Hoess et ai. (1986) Nucleic Acids Res. 14:2287-2300. / Huang L. et al. (1996) Câncer Res 56(5):1137-1141. / Huygen et al. (1996) Nature Medicine. 2(8):893-898. /
Julan et al. (1992) J. Gen. Virol 73:3251-3255. / Kanegae Y et al., Nucl. Acids Res. 23:3816-3821. / Karlin e Atschul, 1990, Proc. Natl. Acad. Sei USA 87:2267-2268 / Kennedy BP, Diehl RE, Boie Y, Adam M, Dixon RA, J Biol Chem 1991;266 (13) : 8511-8516 / Kim U-J et al. (1996) Genomics 34:213-218. / Klein et al. (1987) Nature 327:70-73. /
Kohler, G. e Milstein, C., Nature 256:495 (1975) / Koller et al. (1992) Anu. Rev. Immunol. 10:705-730. / Kozal MJ,
Shah N, Shen N, Yang R, Fucini R, Merigan TC, Richman DD, Morris D, Hubbell E. Chee M, Gingeras TR, Nat Med 1996,-2(7):753-759 / Landegren U. et al. (1998) Genome
Research, 8:769-776. / Lange K. (1997) "Mathematical and
Statistical Methods for Genetic Analysis" Springer, Nova Iorque / Lenhard T. et al. (1996) Gene. 169:187-190. / 191
Linton M.F. et al. (1993) J. Clin. Invest. 92:3029-3037. / Liu Z. et al. (1994) Proc. Natl. Acad. Sei. USA 91:4528-4262. / Livak KJ, Hainer JW, Hum Mutat 1994;3(4):379-385 / Livak et al., Nature Genetics, 9 :341-342, 1995 / Lockhart et al. Nature Biotechnology 14:1675-1680, 1996 / Mansour S.L. et al. (1988) Nature 336:348-352. / Manz et al. Adv ia Chromatogr 1993 ; 33 :1-66 / Marshall R. L. et al. (1994) PCR Methods and Applications 4:80:84. / McCormick et al. (1994) Genet. Anal. Tech. Appl. 11:158-164. / McLaughlin B.A. et al. (19969 Am. J. Hum. Genet. 59:561-569. / Muzyczka et al. (1992) Curr. Topics in Micro and Immunol. 158:97-129. / Nada S. et al. (1993) Cell 73:1125-1135. / Nagy A. et al.. 1993, Proc. NAt1. Acad. Sei. USA, 90: 8424-8428. / Narang SA, Hsiung HM, BrousseauR, Methods Enzymol 19 79; 68:90-98 / Neda et al. (1991) J". Biol. Chem. 266 :14143-14146. / Newton et al. (1989) Nucleic Acids Res. 17:2503-2516. / Nickerson D.A. et al. (1990) Proc. Natl. Acad. Sei. U.S.A. 87:8923-8927. / Nicolau C. et al., 1987, Methods Enzymol., 149:157-76. / Nicolau et al. (1982) Biochem. Biophys. Acta. 721:185-190. / Nyren P, Pettersson B, Uhlen M, Annual Biochem 1993,-208 (1) : 171-175 / 0'Reilly et al. (1992) "Baculovirus Expression Vectors: A Laboartory Manual" W. H. Freeman and Co., Nova Iorque / Ohno et al. (1994) Science. 265:781-784. / Orita et al. (1989) Proc. Natl. Acad. Sei U.S.A. 86 : 2776-2770 . / Ouchterlony, O. et al., Capítulo 19 em: "Handbook of Experimental Immunology" D. Wier (editor) Blackwell (1973) / Pastinen et al., Genome Research 1997; 7:606-614 / Pearson e Lipman, 1988, Proc. Natl. Acad. Sei. USA 85(8):2444-2448 / Pease S. ans William R.S. 1990, Exp. Cell. Res., 190: 209-211. / Perlin et al. (1994) Am J. Hum. Genet. 55:777-787. / Pietu et al. Genome Research 6:492-503, 1996 / Potter et al. (1984) Proc. Natl. Acad. Sei. U.S.A. 81(22):7161-7165. / Reid L.H. et al. 192 (1990) Proc. Natl. Acad. Sei. U.S.A. 87:4299-4303. / Robertson E., 1987, "Embryo-derived stem cell lines" Em: E.J. Robertson Editor "Teratocarcinomas and embrionic stem cells: a practical approach" IRL Press, Oxford, página 71 / Roth J.A. et al. (1996) Nature Medicine 2(9):985-991. / Roux et al. (1989) Proc. Natl. Acad. Sei. U.S.A. 86:9079-9083. / Ruano et al. (1990) Proc. Natl. Acad. Sei. U.S.A. 87:6296-6300. / Sambrook, J., Fritsch, E.F., e T. Maniatis (1989) "Molecular Cloning: A Laboratory Manual" 2a edição, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova Iorque / Samson M, et al. (1996) Nature, 3 82 (6593):722-725. / Samulski et al. (1989) J. Virol 63:3822-3828. / Sanchez-Pescador R. (1988) J. Clin. Microbiol. 26(10):1934-1938. / Sarkar, G. e Sommer S.S. (1991) Biotechniques / Sauer B. et al. (1988) Proc. Natl. Acad. Sei. U.S.A. 85:5166-5170 . / Schedl A. et al., 1993a, Nature, 362: 258-261. / Schedl et al. 1993ab, Nucleic Acids Res., 21:4783-4787. / Schena et al. Proc. Natl. Acad. Sei. U.S.A. 93:10614-10619, 1996 / Schena et al. Science 270:467-470, 1995 / Schneider et al. (1997) "Arlequin: A Software For Population Genetics Data Analysis" Universidade de Genebra / Schwartz e Dayhoff, editores, 1978, "Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure" Washington: National Biomedical Research Foundation / ... / Sczatiel G et al. (1995) / Trends Microbiol. 3(6):213-217. / Shay J. W. et al. 1991, Biochem. Biophys. Acta, 1072: 1-7. / Sheffield, V.C. et al. (1991) Proc. Natl. Acad. Sei. U.S.A. 49:699-706. / Shizuya et al. (1992). Proc. Natl. Acad. Sei. U.S.A. 89:8794-8797. / Shoemaker DD, Lashkari DA, Morris D, Mittmann M, Davis RW, Nat Genet 1996; 14 (4):450-456 / Smith. (1957) Ann. Hum. Genet. 21:254-276. / Smith et al. (1983) Mol. Cell. Biol. 3:2156-2165. / Sosnowski RG, Tu E, Butler WF, 0'Connell JP, Proc. Natl. 193
Acad. Sei. USA 1997; 94(4):1119-1123 / Sternberg N.L. (1992) Trends Genet. 8:1-16. / Sternberg N.L. (1994) Mamm. Ge n orne. 5:397-404. / Stryer, L., Biochemistry, 4o Edição, 1995 / Syvanen AC, Clin Chim Acta 1994; 226 (2 ) : 225-236 / Tacson et ai. (1996) Nature Medicine 2(8):888-892. / Te Riele et al. (1990) Nature. 348:649-651. / Thomas K.R. et al. (1986) Cell. 44:419-428. / Thomas K.R. et al. (1987) Cell. 51:503-512. / Thompson et al., 1994, Nucleinc Acids Res. 22(2):4673-4680 / Tsuzuki, T. e Rancourt, D.E. (1998) Nucleic Acids Res., 26(4):988-993 / Tur-Kaspa et ai. (1986) Mol. Cell. Biol. 6:716-718. / Tyagi et al. (1998) Nature Biotechnology. 16:49-53. / Urdea M.S. (1988) Nucleic Acids Research. 11:4937-4957. / Urdea M.S. et al. (1991) Nucleic Acids Symp. Ser. 24:197-200. / Vaitukaitis J. et al. J. Clin. Endocrinol. Metab. 33:988-991 (1971) / Van der Lugt et ai. (1991) Gene. 105:263-267. / Vlasak R. et al. (1983) Eur. J. Biochem. 135:123-126. / Wabiko et al. (1986) DNA.5(4) :305-314 . / Walker et al. (1996) Clin. Chem. 42:9-13. / Weir, B.S. (1996) "Genetic data Analysis II: Methods for Discrete population genetic Data" Sinauer Assoe. Inc.,
Sunderland, MA, E.U.A. / White, M.B. et al. Genomics. 12 :301-306. / White, M.B. et al.
Genomics. 12:301-306. / Wong e tal. (1980) Gene. 10:87-94 / Wood S.A. et al. 1993, Proc. Natl. Acad. Sei. USA, 90:4582-4585. / Wu e Wu (1987) J. Biol. Chem. 262:4429-4432. / Wu e Wu (1988) Biochemistry, 27: 887-892 . / Wu et al. (1989) Proc. Natl. Acad. Sei. U.S.A. 86:2757. / Yagi T. et al. (1990) Proc. Natl. Acad. Sei. U.S.A. 87:9918-9922. / Zou Y. R. et al. (1994) Curr. Biol. 4: 1099-1103. 194
<110> Genset SA da 5-Métodos <120> Sequência Genómica da Proteína Activadora
Lipoxigenase (FLAP), Seus Marcadores Polimórficos e
Para a Detecção de Asma <130> FLAP <1S0> 60/061,893 <151> X998-04-1S <150> 60/091,314 <151> 1998-06-30 <150> 60/123,406 <151> 1999-03-08 <160> 15 <170> Patenfc.pm <210> 1 <211> 43069
<212> DNA <213> homo sapiens <220> <221> característica misturada <222> 1..7708 <223> região 5' reguladora potencial <220> <221> característica misturada <222> 36604..43069 <223> região 3' reguladora potencial <220> <221> exão <222> 7709..7852 <223> exão 1 <220> <221> exão 195
<222> 16236..16335 <223> exão 2 <220> <221> exão <222> 24227. . 24297 <223> exão 3 <220> <221> exão <222> 28133. . 28214 <223> exão 4 <220> <221> exão <222> 36128 . .36605 <223> exão 5 <220> <221> característica misturada <222> 7783..7785 <223> ATG <220> <221> característica misturada <222> 36288 . .36290 <223> terminação: TAA <220> <221> sinal poliA <222> 36581..36586 <223> AATAAA <220> 196 <221> característica misturada <222> 7008..8116 <223> homologia com sequência em ref. de genbank: M60470 <220> <221> caracteristica misturada <222> 15995. . 16549 <223> homologia com sequência em ref. de genbank: M63259 <220> <221> caracteristica misturada <222> 24059..24597 <223> homologia com sequência em ref. de genbank: M63260 <220> <221> caracteristica misturada <222> 27873. .28412 <223> homologia com sequência em ref. de genbank: M63261 <220> <221> caracteristica misturada <222> 35977. .36926 <223> homologia com sequência em ref. de genbank: M63262 <220> <221> caracteristica misturada <222> 7613 <223> deleção de nucleótido divergente de um A em ref.: M6 0 4 7 0 <220> 197 <221> característica misturada <222> 16347 <223> nucleótido divergente G em ref.: M63259 <220> <221> caracteristica misturada <222> 16348 <223> nucleótido divergente A em ref.: M63259 <220> <221> caracteristica misturada <222> 24060 <223> deleção de nucleótido divergente de um G em ref M6 32 6 0 <220> <221> caracteristica misturada <222> 24067 <223> deleção de nucleótido divergente de um G em ref M6 3 2 6 0 <220> <221> caracteristica misturada <222> 27903 <223> deleção de nucleótido divergente de um C em ref M63261 <220> <221> caracteristica misturada <222> 28327 <223> deleção de nucleótido divergente de um G em ref M63261 <220> 198 <221> característica misturada <222> 3851..4189 <223> 10-517 <220> <221> característica misturada <222> 4120..4390 <223> 10-518 <220> <221> característica misturada <222> 4373..4792 <223> 10-253 <220> <221> característica misturada <222> 4814..5043 <223> 10-499 <220> <221> característica misturada <222> 4956..5422 <223> 10-500 <220> <221> característica misturada <222> 5524..5996 <223> 10-522 <220> <221> característica misturada 199 <222> 6218..6672 <223> 10-503 <220> <221> característica misturada <222> 6522..6790 <223> 10-504 <220> <221> característica misturada <222> 7120..7574 <223> 10-204 <220> <221> característica misturada <222> 7513..7933 <223> 10-32 <220> <221> característica misturada <222> 16114..16533 <223> 10-33 <220> <221> característica misturada <222> 24072. .24425 <223> 10-34 <220> <221> característica misturada <222> 27978. .28401 <223> 10-35 <220> 200 <221> característica misturada <222> 36020..36465 <223> 10-36 <220> <221> característica misturada <222> 36318 . .36669 <223> 10-498 <220> <221> característica misturada <222> 38441. .38840 <223> 12-629 <220> <221> característica misturada <222> 42233..42749 <223> complemento 12-628 <220> <221> alelo <222> 3950 <223> 10-517-100: base polimórfica G ou C <220> <221> alelo <222> 4243 <223> 10-518-125: base polimórfica G ou T <220> <221> alelo <222> 4312 201 <223> 10-518-194: base polimórfica A ou G <220> <221> alelo <222> 4490 <223> 10-253-118: base polimórfica A ou G <220> <221> alelo <222> 4670 <223> 10-253-298: base polimórfica G ou C <220> <221> alelo <222> 4687 <223> 10-253-315: base polimórfica C ou T <220> <221> alelo <222> 4968 <223> 10-499-155: base polimórfica A ou G <220> <221> alelo <222> 5140 <223> 10-500-185: base polimórfica C ou T <220> <221> alelo <222> 5213 <223> 10-500-258: base polimórfica G ou T <220> 202 <221> alelo <222> 5364 <223> 10-500-410: base polimórfica A ou G <220> <221> alelo <222> 5594 <223> 10-522-71: base polimórfica A ou G <220> <221> alelo <222> 6370 <223> 10-503-159: base polimórfica G ou T <220> <221> alelo <222> 6693 <223> 10-504-172: base polimórfica A ou T <2 2 0> <221> alelo <222> 6763 <223> 10-504-243: base polimórfica A ou C <220> <221> alelo <222> 7445 <223> 10-204-326: base polimórfica A ou G <220> <221> alelo <222> 7870
<223> 10-32-357: base polimórfica A ou C <220> 203 <221> alelo <222> 16288 <223> 10-33-175: <220> <221> alelo <222> 16347 <223> 10-33-234: <220> <221> alelo <222> 16383 <223> 10-33-270: <220> <221> alelo <222> 16440 <223> 10-33-327: <220> <221> alelo <222> 3950 <223> 10-517-100 <220> <221> alelo <222> 24361 <223> 10-34-290: <220> <221> alelo base polimórfica C ou Τ
base polimórfica A ou C
base polimórfica A ou G
base polimórfica C ou T
base polimórfica G ou C
base polimórfica G ou T <222> 28336 204
<223> 10-35-358: base polimórfica G ou C <220> <221> alelo <222> 28368 <223> 10-35-390: base polimórfica C ou T <220> <221> alelo <222> 36183 <223> 10-36-164: base polimórfica A ou G <2 2 0> <221> alelo <222> 36509 <223> 10-498-192: base polimórfica A ou G <220> <221> alelo <222> 38681 <223> 12-629-241: base polimórfica G ou C <220> <221> alelo <222> 42440 <223> 12-628-311: base polimórfica T ou C <220> <221> alelo <222> 42445 <223> 12-628-306: base polimórfica G ou A <220> 205 <221> ligaçao misturada <222> 3930..3949 <223> 10-517-100.misl potencial <220> <221> ligação misturada <222> 3951..3970 <223> complemento de 10-517-100.mis2 potencial <220> <221> ligação misturada <222> 4223..4242 <223> 10-518-125.misl potencial <220> <221> ligação misturada <222> 4244..4263 <223> complemento de 10-518-125.mis2 potencial <220> <221> ligação misturada <222> 4292..4311 <223> 10-518-194.misl potencial <220> <221> ligação misturada <222> 4313..4332 <223> complemento de 10-518-194.mis2 potencial <220> <221> ligação misturada <222> 4470..4489 <223> 10-253-118.misl potencial 206 <220> <221> ligaçao misturada <222> 4491..4510 <223> complemento de 10-253-118.mis2 potencial <220> <221> ligação misturada <222> 4650..4669 <223> 10-253-298.misl <220> <221> ligação misturada <222> 4671..4690 <223> complemento de 10-253-298.mis2 potencial <220> <221> ligação misturada <222> 4667..4686 <223> 10-253-315.misl potencial <220> <221> ligação misturada <222> 4688..4707 <223> complemento de 10-253-315.mis2 potencial <220> <221> ligação misturada <222> 4948..4967 <223> 10-499-155.misl potencial <220> <221> ligação misturada <222> 4969..4988 207 <223> complemento de 10-499-155.mis2 potencial <220> <221> ligação misturada <222> 5120..5139 <223> 10-500-185.misl potencial <220> <221> ligação misturada <222> 5141..5160 <223> complemento de 10-500-185.mis2 potencial <220> <221> ligação misturada <222> 5193..5212 <223> 10-500-258.misl potencial <220> <221> ligação misturada <222> 5214..5233 <223> complemento de 10-500-258.mis2 potencial <220> <221> ligação misturada <222> 5344..5363 <223> 10-500-410.misl potencial <220> <221> ligação misturada <222> 5365..5384 <223> complemento de 10-500-410.mis2 potencial <220> 208 <221> ligaçao misturada <222> 5574..5593 <223> 10-522-71.misl potencial <220> <221> ligação misturada <222> 5595..5614 <223> complemento de 10-522-71.mis2 potencial <220> <221> ligação misturada <222> 6350..6369 <223> 10-503-159.misl potencial <220> <221> ligação misturada <222> 6371..6390 <223> complemento de 10-503-159.mis2 potencial <220> <221> ligação misturada <222> 6673..6692 <223> 10-504-172.misl potencial <220> <221> ligação misturada <222> 6694 . .6713 <223> complemento de 10-504-172.mis2 potencial <220> <221> ligação misturada <222> 6743..6762 <223> 10-504-243.misl potencial 209 <220> <221> ligaçao misturada <222> 6764..6783 <223> complemento de 10-504-243.mis2 potencial <220> <221> ligação misturada <222> 7425..7444 <223> 10-204-326.misl potencial <220> <221> ligação misturada <222> 7446..7465 <223> complemento de 10-204-326.mis2 <220> <221> ligação misturada <222> 7850..7869 <223> 10-32-357.misl <220> <221> ligação misturada <222> 7871..7890 <223> complemento de 10-32-357.mis2 potencial <220> <221> ligação misturada <222> 16268..16287 <223> 10-33-175.misl <220> <221> ligação misturada <222> 16289..16308 210 <223> complemento de 10-33-175.mis2 potencial <220> <221> ligação misturada <222> 16327. . 16346 <223> 10-33-234.misl <220> <221> ligação misturada <222> 16348..16367 <223> complemento de 10-33-234.mis2 potencial <220> <221> ligação misturada <222> 16363..16382 <223> 10-33-270.misl <220> <221> ligação misturada <222> 16384 . . 16403 <223> complemento de 10-33-270.mis2 potencial <220> <221> ligação misturada <222> 16420..16439 <223> 10-33-327.misl <220> <221> ligação misturada <222> 16441 . . 16460 <223> complemento de 10-33-327.mis2 potencial <220> 211 <221> ligaçao misturada <222> 24341. . 24360 <223> 10-34-290.misl <220> <221> ligação misturada <222> 24362..24381 <223> complemento de 10-34-290.mis2 potencial <220> <221> ligação misturada <222> 28316. .28335 <223> 10-35-358.misl potencial <220> <221> ligação misturada <222> 28337..28356 <223> complemento de 10-35-358.mis2 <220> <221> ligação misturada <222> 28348..28367 <223> 10-35-390.misl potencial <220> <221> ligação misturada <222> 28369..28388 <223> complemento de 10-35-390.mis2 potencial <220> <221> ligação misturada <222> 36163 . .36182 <223> 10-36-164.misl potencial 212 <220> <221> ligaçao misturada <222> 36184..36203 <223> complemento de 10-36-164.mis2 <220> <221> ligação misturada <222> 36489..36508 <223> 10-498-192.misl potencial <220> <221> ligação misturada <222> 36510 . .36529 <223> complemento de 10-498-192.mis2 potencial <220> <221> ligação misturada <222> 38661..38680 <223> 12-629-241.misl <220> <221> ligação misturada <222> 38682..38701 <223> complemento de 12-629-241.mis2 potencial <220> <221> ligação misturada <222> 42420..42439 <223> 12-628-311.misl potencial <220> <221> ligação misturada <222> 42441..42460 213 <223> complemento de 12-628-311.misl potencial <220> <221> ligação misturada <222> 42425..42444 <223> 12-628-306.mis2 potencial <220> <221> ligação misturada <222> 42446..42465 <223> complemento de 12-628-306.misl <220> <221> ligação misturada <222> 3927..3973 <223> 10-517-100. sonda potencial <220> <221> ligação misturada <222> 4220..4266 <223> 10-518-125. sonda potencial <220> <221> ligação misturada <222> 4289..4335 <223> 10-518-194. sonda potencial <220> <221> ligação misturada <222> 4467..4513 <223> <220> 10-253-118. sonda potencial 214 <221> ligação misturada <222> 4647..4693 <223> 10-253-298. sonda potencial <220> <221> ligação misturada <222> 4664..4710 <223> 10-253-315. sonda potencial <220> <221> ligação misturada <222> 4945..4991 <223> 10-499-155. sonda potencial <220> <221> ligação misturada <222> 5117..5163 <223> 10-500-185. sonda potencial <220> <221> ligação misturada <222> 5190. .5236 <223> 10-500-258. sonda potencial <220> <221> ligação misturada <222> 5341..5387 <223> 10-500-410. sonda potencial <220> <221> ligação misturada <222> 5571..5617 <223> 10-522-71. sonda potencial 215 <220> <221> ligaçao misturada <222> 6347..6393 <223> 10-503-159. sonda potencial <220> <221> ligação misturada <222> 6670..6716 <223> 10-504-172. sonda potencial <220> <221> ligação misturada <222> 6740..6786 <223> 10-504-243. sonda potencial <220> <221> ligação misturada <222> 7422..7468 <223> 10-204-326. sonda potencial <220> <221> ligação misturada <222> 7847..7893 <223> 10-32-357. sonda potencial <220> <221> ligação misturada <222> 16265..16311 <223> 10-33-175. sonda potencial <220> <221> ligação misturada <222> 16324. . 16370 216 <223> 10-33-234. sonda potencial <220> <221> ligação misturada <222> 16360..16406 <223> 10-33-270. sonda potencial <220> <221> ligação misturada <222> 16417..16463 <223> 10-33-327. sonda potencial <220> <221> ligação misturada <222> 24338. .24384 <223> 10-34-290. sonda potencial <220> <221> ligação misturada <222> 28313. .28359 <223> 10-35-358. sonda potencial <220> <221> ligação misturada <222> 28345..28391 <223> 10-35-390. sonda potencial <220> <221> ligação misturada <222> 36160..36206 <223> 10-36-164. sonda potencial <220> 217 <221> ligaçao misturada <222> 36486..36532 <223> 10-498-192. sonda potencial <220> <221> ligação misturada <222> 38658..38704 <223> 12-629-241. sonda potencial <220> <221> ligação misturada <222> 42417. . 42463 <223> 12-628-311. sonda potencial <220> <221> ligação misturada <222> 42422..42468 <223> 12-628-306. sonda potencial <220> <221> ligação de "primer" <222> 3851..3869 <223> "primer" de amplificação a montante 10-517 <220> <221> ligação de "primer" <222> 4171..4189 10-517, <223> "primer" de amplificação a jusante complemento <220> <221> ligação de "primer" <222> 4120..4138 218 <223> "primer" de amplificaçao a montante 10-518 <220> <221> ligação de "primer" <222> 4372..4390 <223> "primer" de amplificação a jusante 10-518, complemento <220> <221> ligaçao de "primer" <222> 4373 . .4391 <223> "primer" de amplificação a montante 10-253 <220> <221> ligação de "primer" <222> 4773..4792 <223> "primer" de amplificação a jusante 10-253, complemento <220> <221> ligação de "primer" <222> 4814..4833 <223> "primer" de amplificação a montante 10-499 <220> <221> ligação de "primer" <222> 5026..5043 <223> "primer" de amplificação a jusante 10-499, complemento <220> <221> ligaçao de "primer" <222> 4956..4972 219 <223> "primer" de amplificaçao a montante 10-500 <220> <221> ligação de "primer" <222> 5405..5422 <223> "primer" de amplificação a jusante complemento 10-500, <220> <221> ligaçao de "primer" <222> 5524..5542 <223> "primer" de amplificaçao a montante 10-522 <220> <221> ligação de "primer" <222> 5978..5996 <223> "primer" de amplificação a jusante complemento 10-522, <220> <221> ligação de "primer" <222> 6218..6235 <223> "primer" de amplificação a montante 10-503 <220> <221> ligação de "primer" <222> 6652 . . 6672 <223> "primer" de amplificação a jusante 10-503, complemento <220> <221> ligação de "primer <222> 6522..6539 220 <223> "primer" de amplificaçao a montante 10-504 <220> <221> ligaçao de "primer" <222> 6772..6790 <223> "primer" de amplificação a jusante complemento <220> <221> ligaçao de "primer" <222> 7120 . . 7137 <223> "primer" de amplificaçao a montante 10-204 <220> <221> ligação de "primer" <222> 7557..7574 <223> "primer" de amplificação a jusante complemento <220> <221> ligação de "primer" <222> 7513..7531 <223> "primer" de amplificação a montante 10-32 <220> <221> ligação de "primer" <222> 7914..7933 <223> "primer" de amplificação a jusante 10-32, complemento <220> <221> ligação de "primer" <222> 16114..16132 <223> "primer" de amplificação a montante 10-33 <220> 221 <221> ligação de "primer" <222> 16515..16533 <223> "primer" de amplificação a jusante 10-33, <220> <221> ligação de "primer" <222> 24072. .24089 <223> "primer" de amplificação a montante 10-34 <220> <221> ligação de "primer" <222> 24408. .24425 <223> "primer" de amplificação a jusante 10-34, <220> <221> ligação de "primer" <222> 27978. .27995 <223> "primer" de amplificação a montante 10-35 <220> <221> ligação de "primer" <222> 28384. .28401 <223> "primer" de amplificação a jusante 10-35, <220> <221> ligação de "primer" <222> 36020..36039 <223> "primer" de amplificação a montante 10-36 <220> primer complemento complemento complemento <221> ligação de " <222> 36446 . .36465 222 <223> "primer" de amplificaçao a jusante 10-36, complemento <220> <221> ligação de "primer" <222> 36318..36337 <223> "primer" de amplificação a montante 10-498 <220> <221> ligaçao de "primer" <222> 36652..36669 <223> "primer" de amplificação a jusante 10-498, complemento <220> <221> ligação de "primer" <222> 38441. .38460 <223> "primer" de amplificação a montante 10-629 <220> <221> ligaçao de "primer" <222> 38820..38840 <223> "primer" de amplificação a jusante 12-629, complemento <220> <221> ligação de "primer" <222> 42233. . 42253 <223> "primer" de amplificação a montante 12-628 <220> <221> ligação de "primer" <222> 42731..42749 223 <223> "primer" de amplificaçao a montante 12-628, complemento <400» i gtgtcagcfcc agtettgcgg gtofctgggfct gtcctfcgcfct cccacacttc atgecicfcç& so ttccetccçg acagtctgcc ctfctagattt oagg&tteag eaceagecae agaaacagca 120
acctcacfcgfc fcaagggtcga atfcgtatctc cecaaaaggt aggttgaggc cctaccegce ISO aggaettcag aatgfcaaccfc easttgggaa tagcatcatt gcaaatataa ttaattaaga 240 tgagggeasa cfcggetcagg atgggçtccc aattcaafcas aaccaatgtc cttctacgac 300 agccscagga agacagaaac gçcaagggag aaeaccatat gcEgajggag gcagsggcag 360 ccgecagcea aggafctataa ecagaagtça ggaaaaagca agaaggaaçç ctcocosagfc 420 gatfctcaeag ggagcatagc eetgctgsca ccttgafefett ggaettttat tççççaaaac 480 tgtaaaacaa tacacttctg tfcgtttO&ag ecacfccagtfc fcgtgetactst tgttatggea 540 actccagaaa aca&aaatac actcagactg tttaateàae exceataasc geaiaaggte soo tâaKcccsaí: aataaatece ttaaaaatgc ccgegtatat gtatttaaa* atataaaata sso tcttctagtg gctctgcatc cctggtcaat ccctgacfcg* tacagaat&t gtatettcafc 720 ttstaatgat gaaatacctg aatgaaatct etaggasata fcggtaagtgt atgtttagrcfc 780 tttaagsáâc tgccaaçtfcg ggggaattgc fctgaggeeag gagtteaaac agccfcgggfca 840 acagtgatac ccfigtotgfca caa&ataa&a aatateagc* gcgtgtggtg gtgtgtgfcct 900 gtagtcceag efcactcagga ggetgaggtg ggagaEteae ççgagceeag atctttgsag 8S0 ttatagcgag ctaEgateae gccaetgcae tctageetgg gtgacagsgt gagaaagctg 1020 gt-ctccaaa* aacaaacaaa caaaaaagaa acogtcaaac tcttcccaac atgttgccat 1080 fctttacafc&fc accattttac sçtctsaçca gcaaegattg atagttccag ttgctccata 1140 «cctegctga ccafctceaat agafegfcattg fcgfctatccca ttgtagttes «atttgtatt 1200 tccceagtga fctaatgafcgc fctaa&atct- ttcatgeacc tattggctac acgtaea&ct 1260 cctttageaa aasatatgtt gttattEgaa gageggaagt fcfcfcaeatstt: gatgaagtet 1120 aatuattga tttttfcfc.fctfc cttagatggc tcafegctcst tgtgttâscr.: aa&aaaaatt 1280 tgccttçttc *t§gi;c?acaa agactttcte ctatgttttc tttcgg&agc sttaeatstt 1440
csgtttttat gtctafcgttt aagaeccatt tetagttaca afcfcfcgcgtga ttttttggaa 1SOO gggt«aaggt tcattfetctt ttccafeaaga acftacagtt gttct*gc*c ccttgttaaa 1580 aagactttcc tttceecatt gaactactfct gtcaaaaatc aactgagcat· ataEgggeat 1620 catgaattct aafccctgfcfca gaactgaaftg tteceaaggc aggcrcatgc··: cabgactgac 1660 ctccttfccct tggafctgcct acaaaacaga saaagctaag tccggagcaa agaaalccat 1740 gtetaacctg tatttfctttt tttltttttt tctagatggg gtctcgctct gtcacccagg 1800 ctggagtgca gtggcgtgat cccagctctc tgcaatctct gcctectggg tseaagtgat 1860 tetcetgoet cagcctcccg aggggctggg attgtaggcg tgcaccacta tgcccafcçfca 1920 attcttgtati ttfetagfcaga gatagggttt tgcçattçtg gccaga^çgt ct.fegaacfccc 1980 tgaectcagg tgatetgcct gcctcgg-ccfc cccacagttt tg&g&tEata ggeatgagec 2040 accgtgoccg gecEtaacct tEgttttctE aeacaacaea ctaegtgatg tctt-ccacat 2100 gcatgggtca tttgctccat ttacgtacaa atgcataagc aacacaetgt gtggtgitgag 2160 ctcgtgatgg gaaaaggaag aggttetgcg gacactacac tggcttcotg «tatctgtct 2220 gtgtgaatgg ccatggactt tgtct««fcas ttgtfccgcfcí agcgcagata egafccagctt 2280 acaacctaag atcctagaga aagagggtca satetgfca** gcactctgag cacgtgtgaa 2340 gttcaateaa tageatatga ggttacagca aafetcactat cEtegt-ttcfe teagetatag 2400 aafcggcatga ggattcatct. caasccagtt caaç&ctgst cagaaceatg agctagctgt 2460 tcatggaagg aaagcccsacc tgattgfcggc cagggaagga gaaacaaeac çtçaaceagg 2S20 ttgatttggt ccçcacagac aecattggca tgtgacatct ggaacagacc atgcctggtc 2580 tcegttcgta tcacttacca ttcagctcaa tattggtctg aatattcttt agactgacog 2840 aaaogaaaag g&actgttgt gt&accafecc aoaaetecag cetgtagacc tgggctgtat 2700 ctctatgccc tgccfeggcac agaccccacc tcctgctcct tctcccteac caceagtcaa 2760 tccttgtcçt aatgaawagg gagggcaacc ctgaatgggg agtggaggga agagatgtca 282« tgagafeggca acgtgeaece tgaagtgagg ««gaaggcta tgtgaatgçt gtaggotgac 288« agccgggcat agtfgcoccg ttgecatggc gatggaggea tgttgatgcg aagtgtctgc 2940 acagceccta ggatttttaa csgcagctgg gcagagcetc ggcgtcectg aattgttgcc 3000 cccctgagtc accgcttggc cccagctgcc ctgatcccfcg ttgscaaatg gtfcgtecttc 3060 acagtcaaac tactaacagt accctaatEa atgaatgtgc taaçttattcfc tgcctactcc 3120 224 cagcatactt gtetaaetaa cctgtcacac acagatcsgt gcagcatatg eataattasg 3180 gagagcgctg ggagcagggg âtgggtggga gaggggtggg ctcgcagcce tgtcgctgtg 3240 ggafcsttíjct tgçaaagfcta cctctgecaa cggteagatg tegtggggat atgttatttc 3300 ccgtgaagtg tafcatgtctt cetfctctttc •cfcfcfcctaaga atctctctte agggetgagg 3360 ggecattgct cagtgctfcta geetgtgsgg ggstfcgeeag gcaeaaatgc agaaggaeca 3420 gggagcccag gttctgaaga cgactccggt agcagcacgt agggcgatca aaaccecaga 3480 ctttaaagcc agaccggcct gggcctgaac cctcgtcccg ctccttgcta tgtgggtcst 3548 tgccttgacc acattttttt fttttfctttfca agacaggafcc tccctctett gcccaggctg 3600 taatgcagtg etgcgaecaç agctcactga agcetccatt tccacagcct caagcgatcc 3660
tcctgcctea gceccgagta gctgggacC-a «aggcctgsg ccaeeacg&e cagesaattt 3?2S act.tttgc.ag agttgggggt ettgctatgtt tgcccaggct gttetecaac tcctggactc 3?80 aagccatccc ctagcctcgg ccttccaaag tgctgggact ataggegtga gceacggcge 3840 caggcccttg accaoatttt taacccctct gaaccccagc tteactttct gggcaatggg 39õ0 aggggggtaa tttgçcçctc agagggttgc «çtgaggggc aaatgfegagg ctctgggcac 39«ô aatgcccagt aoagactagg tccccacgac acagccgctc ageggctccg gactesggge 4020 tgetetggac tgcggccagg cggtcttetg egggaatccg ggcaggcagg gegggctgeg 4080 ctcccctccc cggctctccc ggtgcccctfc gtctttttgt tctgí-ctcag çagcteteta 4140 ttaagatgaa tggeatttcc aaaggcttca cctctgataa gcgctcctct geagctgcag 4200 ccaçaatctt aatgtgcgcg ctgtaaccta atggccgtct cggetattaa sacgctctfcc 4260 tcgggtgaag tggactccct ccatccccgg gcctctgcac gtgctctgcg caetggctgg 4320 gggtgatttce a&ggagctca gagcggggfcg ceeggcacct ctcgccaggc gcctfefccgae 4380 cttctaaagc gcgaacggct ggaccctcct cccaegtgtg gggccççaga aggtgtgggg 444« ecceagaagg tgcggggtcc ctgcgttcca cgg&gceegg aaggtttcca gtg&tggtgg 4500 gggctgacca cgttggtcce cgtgggtgct gttttcabgt gccggeagat tgggatgagt 4560 ttaaaagaca g&agogcgta ggatagagaa acctctttaa aaactggaaa ttttaatctg 4620 gggattataa ctattggaca gtcaagtgca agagtgaata «actccteac tccctcctcc 468« çaatttttat ttgcgggatt agtcagtccc cçt«tgç<?aç atgacaattg tgagaactac 4?40 cagggtcttc attctectgc catcfcggttg acetctccaa gaatggacac ccgggcagcc 4800 tgggccaacg aggetgttct aagagtttag atgagagaag tcagtetttg acaggtgatg 4860 gaagctgtaa aatgtaaaao tocacagttg gtgaagatgt otceaggaaa eaggtctgca 4920 gagagaatac gtttgacatg ctaagagaag ctgagagaga gcgagaggag agattggaag 4980 aaagacagag acagaggfcag agagaaggpa aag&gagaga gaaagggaca gaagagagag 5040 aaaatagagg gggccgggeg cggtggctca çg«?ecgtaat et.esgcaetí: tgggaggccg 5100 aggcgggcag atcacgaggt <;aggagatcg agaccatccc ggctaacacg gtgaaaccce: 5160 cgtetetact aaaaaatata aaaaaaatta gccaggcgtg gtggtgggtg cctgtagtcc· S220 cagccaccga ggaggstgag acaggagaat ggegtgsacc cgggaggcag sgcttgcagt 5280 gagctgagat cgcgccactg cactccagcc tgggcaacag agcaagactc çgtctcaaaa 5340 aaaaaaaaaa aaaagagagg aagggcggga gagagagaga gagaaagccc tccagcteca S400 aggcctaaoç acatctctgt ccctttcaao ttcagctgtc agatttttag actccttgag 54«0 tgaataaatt ct-ccfctttfeg cttaaaetag tttgagçtaa gttcctattg cttgcaactg S520 gaatactttg taagaggact ggccfctcatt tstgatgcafc fcgtcactaag atgtaagtgt 5580 tiagaagaget aaegítttac ggggttcaaa ctccttggst accaaaacct aaacatcccc; 5640 tgaaacttac caaactgcag gtaçgaatt-g gatcççaçta aggtgaatat acaaaccttg 5200 caagtgctga, gccotaacca atcttgtaat aactctgtgg tagctaattt tatgtcaaat 5760 aaaaaatgcc caggta.«ctg gcs*.â4tgtt tttttctggg «gtgttaggg 583« agggfcgfctfce fcgaaegagat cagcactgga atcagcggac taagtaaaga attcccaccc 5880 tcaccaatac ggtgggtgtc atcaatccac tg&gggcctg aacagaacaa aaagcgggca 5940 gaagggcaaa ttoceicttc ttcttgagct gggccatcca tcttctcctg oeottggaeâ 6000 ctggageccc ctgttctcca gcttttggat tcagactggg tcttgcacca ttgecctcca 6060 ,tcttctcctg cecttggaca çtggagcccc ttgfctctcca geccttggat teagaetggg 6120 tçttgcacca ttgccctcct fegatgctcag gcctccgaat gcagactggt ctccaccagc 6180 agcttttctg agtctccagc ttgcagatgg caaaccatga aacttteatgg cgtccatgag 6240 catgtgaaçe aattfcotact ataaatctgc aautatata catgaggaga ctcatttata 6300 taetggttca gtttctctgg agagccttgg ctaatataaa gtccatactc tacaaagtgc 8360 eetaggtact cagggagtac ccaagtgtgt. cetgaccagc ccgacageec tggctgctgg «420 225 ctfccçcçgç* «*ç«*ctctg cacgcfcgccs. toatcagccs «fcefccfcctca gçtgaaccg* «48o gggcafctgaa gcgggcctct ggcactgtac cfcasgaggga gcaatatctfc cccctacacfc 6S46 gaeetcttcc gtgccgagaE gcagccctcc cfcgetgcsae tagttacagt ggeeeatgts 4600 ccctítcaaa gtgaagfcfctt gataaaagca ectcttaaec aatgc<s«aab agctaagoct 6660 gggacaaag* ttgeaggtftt ctfcgcatttE. ccatgtaacc ccagagggat tgccatacac 6726 actgatcftg* gctgcagaat accaggcagc cacctcaccs acccagcagg tççactctta 6786 tacstfccfcç* gaaag«acag ccacfccçact ett«ttc*g& sgaaaagaat ttcsaggaag 6840 gogstfccfcgc gattgcctca gaaaagtcag ttccctttgg gaatfcfcecct tagggatcat 6900 ctgtaacttcc acttctgcct tttacctgaa ttccttggse tggtttgaat: tctttggttt 6960 aaettatgaa tfccoctfefcafc tacttfctctc tgaagaaabg gagafcatcag ctgfeccctce 7626 ccactgccafc btscoccttc cfctcafctcaa accccatgfcg gctgctaett accgcgtgtt 7680 aagtgttcac cttttttctt ggaattcaaa aaaâgaagga cagcatctgg ggcacagatc 7140 tcetggcgtç rcatacactt tttcaaagci; tcattt&aca «tgtgtgeg c-gtgtgtgfeg 7200 i;gtgt.gfcgag aeagtcfcfegc tçtgtÇgçc-e: aggçbggagfc gçagtggcafc astcaçtggc 7^S« tçactgtagc ctcaaagtcc fcgggcccaag cgatcttece aecccageca cceaaaatgc 7120 tggggctaea ggEttatgee acsetgecfcg aeccgaaagc sttgggctta esttcestse 7380 ttcctccctg ctgaagtoag agatgatggc agcttccaga stctctggcg cctgtgctgg 7440 gctcgtgccg gtcacggtct; fcgggtccagg actcatcctg gagactctca gggaagtcsc ?soo ccatgaeaag gaaacgtagg agagtgtget ggefcfctgcgt· gtrtoctetgç caagecetgc 7S66 ttctcctggt gggacacaet gaaccacage cagggcatxt tggtggctag ttaaaaaaaa ?S2ô aaaaaaaaaa aaaaa&ggaa gaagaaggca ctgtgtsatt gçgosgggga tctfccagaaa 7600 tfcgtaafcgafc gaaagagtgc aagctcfccac fctccccttcc tgcacagggc agg&tgtgca 7740 getggaggea gageagtcct ctctggggag cctgaagcaa «cafcggatca agaaactgta 7809 ggeaatgtfcg tectgfctggc cat«gteace' cfccatcagcg sggtacagaa tggtaaggaa 7060 agcecttcac teagggaaga aeagaagggg agaotttcfct çgasggctgfc ttggaageca .7620 ggcEtaaaca attgtgtctg tgtgtgcgca tgcacaaaca cttctaectt atcttfcattt 7980 tetscttett attfcgaatgt atagggttgt gtgfcafcttet gtgeaaattt ggggtttitcc 8046 tcctctsagí: ctttcacEOt tgtgg&gatt «ccagteeca Etttfcagagc çagggçtgea 8100 acttgaaggc tttgctaâaa ccçtcascga agtgtcbatg a««agcattt taoctatta» §1.60 tfc&atgtggc caggc&aggg gtggaaggtg agaagactag aaagggaaca tgatatacac 8226 afcooactxag afcaetgggct ttcctaaeat ctgcagcgca atcgaagtta eeagfccatcfc 8286 gcagtctaaa aagaaagtga ttfctgggagg cgcgtagaaa aaaccafeett attattttttc 8346 ctctatatta cttttttctt tttttcKccfc gaagaaactt «tttttstgg tgataeettc 8400 tc-tttctcta gcacgtataa tsttggaagc attEttcata tgcagtgtat acttcagaaa 8460 gagagagaga gagaggaaaa tcgtocsigtí: cagcgfcttgo ateícoatta ttcctgctat 8S26 fcagttaaaaa caaeaa«a«a aacaaeaaac «agcaggafc*. ccEagatctg gaaaagggag 8S86 aattgcfcag agetgt«tc.c otaaagfctxfc gagttagggc «gectoagac caçtttca^a 8640 acsatctcca gtggetfctgfc gtçttatatt satçaagata gagaaaaaaa gagtaafctac 8700 oaagggcagc tgctgcagct tfcatggtgat tactgaacat tgaeatgctg tsaiegttttc 8766 ggaaetttga gt&tt&aa&e actttgggat attctatEtt cccccatctt gagtgtggac 8830 agatgcrsggO gatgfcagccc tctgggcaea. gagcaagccE. «íCCCcfccagc ctctgçaçca 8880 gaaaggçRc* g«o«c«.<f»ca ctccaagtat gfet.ttctaca agaacoacac tfcfegtggccc 8940 fcctgaccca» asaittttat actaaateac acacaacaaa gtsgtagctc agagagggaa 3000 caaatggctt afctfcaggeca ccattttctt gagecateat gâtttcacac agggctccct 0060 Oggeectgfca aattggcaag gattccafefca ttoaac«cgc ataoaSgtac agagaccctg 9120 coetggocca gacagtattc fcgggfcacagg cggatagagc aggaaacaaa acagctacag 9180 tgauggscag gtcagcctgc agcaatgccè gcagtctctg caaaggtagc tgtatgggtg 9340 ggcaggfeggc tagcactcas tcagctcEgg aa^atctcc cotetggcct ctoccctgac 9380 acccateaac aaaactga^ agcatcggcg gscaggggac c£tgw§«<;«c «-tccofegcct· 9360 gtgcagfctgg ggçtgaa««*ç agc«;a«gaag tttgagctca ctctctccag cfeçcctcoea 9420 attcagagct gaacbgtggg aagecbcaga gctates.f£t tcaaggacag gttctcctca 9480 cctctcotaa tggaggtgca ccagggaact ggcoctgctc tgcccagggç tbtcteetgg 9S40 acefctgccat catggtcíag caaaccctgt tcagattgag gtgagtggtg agattbc^aa 9660 ts«fcttttga sagafeaggat taagtçfetct tcfcgtgggac aaftgggagg tagaggtaag 9640 abtaaagatg gc«aaafegtc tgsgtcctga sagccacaat atggagatcfc agacfctctta 9720 eagaccacag ggcacagggg ecteactaae ag«gfctec«g gaagtgacga gçgígçbggg 9786 ggcbto-etgg· ttgaagsgac accagaatgg aogagctggg «getaattttfc ttgggctgga 9844 gtgtgatggc ctgcacafcca ctgcrctstgt ccctccattg tcâcagctge ecefctagga-g 9900 ccagctgagg eaatfetgtç® tcagagtgac tttgcaeagt ogocetgces; gtgttcagga 9966 226 aggfagtttc tgfcggtccct gggfgca«aa cattcaaata ttttaggcaa tcadaaagat tçtcaatgtfc gcsaccatag eetttettct tccfccatacc gattt-ccatg gtgrracçag tt <*caca.fcgc gcecatga-ct ttttctgtga ttgggcagâg atgttttagt catcaagatc eagatttgga asascagaac tatcaaaact tggttteeea tcggettttg ag&aaagaaa ggeteaaatc tgfccfctecca tettatgagt agcaggcaga catgatgcaa stttgggaag agctgagggg aggggçteag setcccgcag gaggetgtr.ç cageggectc tt.tcccccaa tgcaatcaca agggttfcgtg ttccacccca acacacaeae ctttgeeatc Eraacccggga teccccaaag caggaacctfc ecggctgctfc ettcctgaac tttcetafctg txgeatggat gc11agettt ateteatata aactgcc&fct gtagagaetg ttttgttccc cgçtttaftte tataagtgta tgcaagtgaa tcaccctgte acccaggctg tcccaggct« «agtgatcet gccaccacgc ceagetaatt aggttggcct ccaacteetg ggafctaoagg catgaaatca taagcaaagt gagteatgga. gggattaaaa cetaatcatc ccmttcatt catttaagea ctgeagccct atgcgtteta gtgcctgctc tttctgtgtt ttttgsagtc ccttgccact tafcaesg&ta ggtgéettet ttagaataat ctaegcatga taactctgtg gttaactaaa etteectgge ectcegttcc gttgctgaag gt«fctgca«a «ggafegcctc açaaeggttt ctggtttfegg et.tactgt.ta »ttg1ttctg tagestacsg gtagacaaag gcagctaact gttgaatgtt ggsctgaagç tgcgtgtttc caggataaag gaaggagcaa tgaaatacag agaggatgca gcctcagaga gagaggtaga tgeagãgãâg ctc ttaataa agtcatccct tfcgaaaccat agaagageec ac&caggaga tsacâcaact ccagatgtat gtceaagcct acctacctta cagagttcaa ccsssatgcc attetgaãca gcattgtaea eagtctgtgt gggtfcgggcfc ctgcactctc ctggeccaec tggtgcaatg ttcaaatfctg taacccfcfctc gagtttaaaa tacatgattc gagaatatag caaatgggst gget11 a t tg taagge tgge gtttggggct tagggcaagt gagcctccaa cttetfcefcge cacât&ctgt a&ttggagaa tgcccctgag ctacatttag cacatttgct ctggtcgtag gagaggeagc ctcctxe&ag agcatagtgc taaggaggga aeacactcat aagaaacctc tttgacaggc tctagaagca ccttÃCâgta acecccsaec actgcagtgt ttggaaaact tgaaagcttg cgttgtgtga atctttgese catttaatcc 9agS99<’cgc tgtaggc tga cccfcgcaccc aggacactgc taaagatata feaeattatta gagcgcagta gcgeaatctc c a tg 5: c fc.cag cct cc í.gagí: tttgtattfct tagtaaggac aeetcaagtc atectcctgc gcstagaaat acatactatt gaatttggtt gaaagtccca tgâcfetfeaga gagtagacac ctccctgctc aagaagttct ccesgeagtc ctggtgctgt tacagtgtca gctgsaatat gggtctcctc ttctcttcct gtacagggaa gctgttcctg gttaee ettt tgagaactat atcccaagat ctctttatgt cttcactgag cagtggagtg agatgatafca gttaaagtag gcagçcatet <:tcfcafcctgt gcagctagcc gagataagtg ga^attaea agággttggg cctccaagtt tagcttagaa aggtt.cgt 11 ttgttttgtí asasggagag aatatgatat acttgaagtc agtggcatgg aaaggaaggg gcteggttct tãcggcãcat cgtgctgctg cggtatcect gggggattag ctcgtaitagc tctcaatgga atttgttttt aactgtgagt ctctttgcaa ttctatttaa aaaaafeatgc aâaaaccctg tttcctgtta g-ttaaaaaaa ccca^acaa S3*93tAcag tcfcatscttt gagagççtfa tcttcctCtg cctttcaaac cagcttgatc cageagaatg t aagaaacct ggaecagaac cattggcca* tactatgaca «agcaagsag acaggagttg fcttaattaca cagacgcatt ctaggtacca geagettaga agtgattggg aagâââtgtg tgatggcaga ggaaggatgt f?99«g«sg caggcattag ttttggcgac attatggccc aatg-gagctg çtgttaçtag ae aagcaceg tattggaaga geateataga cttatgaagt acccccctcc accgcctcca escaaacttt caagcttgcc agaatggcge ttettgctgt tfcgoactcac ccactcatgt: cctttc-cttc actgtaccta ctggcacaaa «acaggtctt tcgttatttt tgagaeagtfc âgefcgactgc aacctctgcc agctafgact. acaagcat§t agggttccaç catgttggcc ctcgaccEcc caaagtgttg ãtttãttctfc gttttacaga aggfceaggag fccgfcgaagct ttg«teçatg catattgcct ttcttatgtt gagctgaaat tecctaaaat cacttagact ccccctcttc ggcctaacgt gtgttc&ttc taagaacacc agatccgggc afeeg*et e t g gtgtcattgc tgacteatac ttgttgagaa acttatttaa attgataacc tecacttgtg ctagcagc-gc ccacgta cgg gfcctttgfcct ctctcxcaca fcgtfctatggt ctttgcatgc .^agtgsgggg gcggtgagga ggaaqçagcg gtaaaeecfca taaaggatag ggaagatctg taaagattct ggaagtggga aeagggtcaa gatcatagtt ctgagtaagg «ggga&agaa. gttgtagaaa taacctcfcga ttctatgacc tccctcggat lôtsc 1014» 1020» 1033¾ 103 SC 10440 1OS0O i»S»0 10620 10660 1D04O 1C860 10 SC» '10920 10960 11 »4» 1110» mso 1122» 11.20» 1134» 1140» 1X4 «0 1X52« USB» 11640 11700 117S0 naao naao 21940 22000 X20S0 12120 22160 12240 123»» 32360 12420 124 80 1254» 1260» 12460 1272» 127 8» 2384» 1290» 1296» 13020 2 3080 3314» 13200 227 227 gecaaaattc gtggatgçtc aagbcçotga tataaaasgg catagfcafctfc gcatctaacc tacacacatc «tecatatcc fctifctfctttt tttttttttt tfctfcbtttxfc ctttttxggg *g*tgg*g£e tbgctxtgtc gecctggefcg gagcacagtg gctcgatctt ggcteaetgc aagctccgcc tcccgggttc atgccattet eccgcetcag cetaeaggtg cccgccacea tgcccagefca atttttettt tgtatttttt agtagagaça gggtçtcaee afcgtxagcc* ggafcggt«t<í gacacatcct ecatatacc-t ttaagtaaccc ctagat«a8« çcsagattac ttgtcttgfcc tfctttfettfct ttttftctttfc «gagatggag ttfecactcct gtça««cagg cfcggagggca atggtgeaat eteagtfccas tge*acct«c geetcctggg ttcaageaafe «Ctectgtct fíágcctcctg gtagctagga caaetggcta atfettfegtat ttttagtiaga cettgaactc ctgacctcag gtgatetoee aggcatgagc cactgtgtgt ggcctaaacc atg t asa csg 1.1g:t Eatac t g t a ΐ c gt t m tgttcagtçç agacaaatgg fctttcfcgfctt gtggttggct gacteeagga atgeagaaee gaggeaggga ataccatctt gggttecaga ctggtaaaaa cagafcctttt gaafcggscag ctggcggctc acgcefcgtaa tcccag-cact tcaggagttc gagaccagce tggccascac aaattagccg ggcgtgatga cgcatgcctg aagaabcgçç bgaaccetgg aggtggaggt ecagecfcggg caacagagtg agaetcegta cftgatgaaat ectgeaggga gctteaegge gccccgcagâ. gectgaagte ccggccgea-c gttgcagcgt tcfctacctacs «gagtgggaa aagctctgtg acgga ataca tggcaagtg-c tccctttacg taagagaacc ctacagasac gçgfctatttg tgtagaaaag aaaaacatga ccccttfcaat gtccfctttga ggaggataat ggatccetga caabcaeaeg tatcccttte aa&agaaggg gagagggggc agagagacex «tctatagbe aaacceteeia gactgtgtet eaceccagcc aattccfc&tc ttateceect cacacta&ag acagggtggc tttctgatga ttccttgttg ctctcagacg gaactaagtt tcaeagtcac cstgecaggc cccaggggca gctcagttat. ttctttct.es fctgaggctca çççcttaeea tgetettett tcgcccatag atttcgctta afcgtggatga tctgtctecí ctcaaaccae ggctctttgfc ttfcgttcttg atggtcatag ataeatgtca ttgsaagaat gt-ggttstac caaateoeat tecetcccca attcsgaaec aeagacagtt ctttsçccfcg gagcggeccc tcfccectceg tçtgcttgge tagatgfccat tccctcaagg aatccttctg tgaccctgaa agcaccatgt acttââíctc atgtctgctt tccttgtttg tctattcctt gtgccttget cafcgactgfcg tfccctascac tgagtacgtt tctgccaaat gacagtfcgst gtcaaggagg catttaacat- tetagtaaaa acaafcgascc ágábgcáàsc cfct&teeett egaaageagg acccagaabg ggaggagott ggçctaeact gceaagtgag tcetaaeçet gggggcctcc ttctaggagt gatgaccac-c ttctgagcge eagggaggtg aggaaggteg tttatcatct tagtgsgtge tagtgtcaaa gtggagggag gtgtgatcte cgcagcfcsca aagtcgaect atcbectgtg gggttagace tfcacaggccc· c&çcccacce «ccececeaa gatggggtgt caceacgttg gcc&ggcfcgg egttteagte tcccaaagtg abgggatcat *c««ataatA «etgatagaa tgtaaatgct aagacagtaa caagaasaaa aatctgtaca ttctcctttt btttttaata tttbfcggsca cgcagatata gaaggttgaç tatgcgttca aagaamatga teagcattíb ctgtcatacfc gbgbattaaa ccctgtggag «fc^ctgggc ttgggaggçt gaggeaggtg gatcacgagg ggtgaaacce caactctact aaaaacacaa tagtcccagc tactcgggag gctgaggcsg tgcagtgagc cgagatcacg ccastgcact bcbaaaaaaa aaaaacaaaa acctgtggag gacagcaaga ggagaaacac atccccatat ctccccccag eagcaggctg actçtggaaa cagtactacc cattgcacag agtgggtgca ccaccacatt gce&gggatg aggtgggcec actcaaagtg ggcacattcc tacagaagga aaggcítçta ttcctataca caataaagca a&gaaattga bgaaaaggaa ccçtgtggtc ttcaetcttâ aaaaaggagt aaaggaataa ccac«gcc«c cc«ccacccc ccatcatcca eetsggecibe tetgacacee ecaccgccac «tcctggatc tgattetgct aagttcctgc caa«attcct cfcgctfcaaac ctgfccagta* «tgaacttct tcacacggct ctcagcaagg aabcteaatg gecatcttct cgaagaccfcg cgaccccacc ttctt-gcatg cctcaaacgg ctsagcacac cgtaecaett eaabttatgt cctcfcgesgt ccfccaccaga g<*abcag«t« gatgcaagct aaatgtctgg çatgtggcaa gattcatcac ctccctcttfc ggccttgtct gtgccctcca tcccccctcc ttggctgaac aacctccgca featcctgttc tcttagctta tsstfcfcetae fctgttcfetca gabtttafcct tgacçcaaca tggaatbaag btgcctcctb atcteggeat gaeceacttt gctgtgtgga tagactgtaa gatcccagaa agtgggggcc caaacacagt gttcagtaga gageagctgc ggaggacafcc tagggttgct cggaggtcaa çaaggaagta «caggctcct gaacabgccc ggcaggatcc tttgcccata aagtggagça *çagaggac«2 ggaacaefctg cetttgagcg gaegttgcta aeaagsgggg gsatgggcag cttaatacca catgtctgtc tgagccaags gacttsacca gagaggcttt gbggacac-cc acaaagggag tggggatatg gggçacatbg gaaagatccg aaagagtcac ttggtts^âg: agggttgcta ctgtgaacac cagccatgac
13260 13 320 O I SO 1.3440 13500 13560 13620 13-6 ê© 13 74© 13&00 138S0 13920 13930 1104 0 14100 14160 14220 14230 14 340 144 00 14 4 60 14 S 2 0 14 5S0 14640 14700 14760 14830 14 880 14940 15000 ISOé© 1S120 18188 15240 15300 15360 15428 15430 15540 15 SOO 1566© 15720 15700 15840 15000 15960 160.2© 1608© IS 140 15200 16360 16328 16380 16440 1S5Ô0 .16560 10620 IMãO 228 ccaccagtca ccticagaag aceccttget eccctgcggg gggetccttg agcaactaga ecctctctca tfcetfcttett aagatgggfcg caaectactc ettctttatg cagagtgtat attacggacs aggggcetgt tggccttcag fetccafceeca agt eatggte aeccaagaaa aagattcaca etgeagggtfc tceeettcag gggtaecgtt gaacaggcc « a t a t cac& ct % a ttt1t«at tgt11cagfcg ccgcagfcttt tcattggetg acgcattagt acggfcagtca eeettteags cagcccctga tctetcteca tgcteeeaeg agggctattc eageagtetg ttctatttta acatccaggc aaggtgtgãt ttaagscatt gctgfccagcc tctfcfcgcaec ceacaigcaa g&ggtgcaaa gacgaaatcc aaagaaagca ceaggtgact geattctcse tttggagaag ttatggtgca tggeaatgaa gaagaaatgg agtgaacagc tctgtttgta cctecaaatt geagaagtgc tteggaagtt ecacagtcgfc aaagtgettg ttgctgettg acccatgggt cfcgtseaete agatageeat ggaaaggtag aactgtctgg acaetgctge acatetgtgt gcetgtetgg afegciggaaa agecagaggc gggttgtgtg ttattctsgg ccacaggcag gacatgctga tggaagtctg gaggtgaeac acaagaac&g aaagaafcggg tga&taaaaa ggfcegtttga gggatgeaa* tcegaatgaa ttcaaggctc agccagtgge cacagaggaa ggcctcatgc ggagc&actt tga&gttece «atgtattea gaatgccaag ggagceectg ggeefcgecge ggtttcctgt gaattaaact «aotgataca ctctctcttc aggcgtaggc atgaggggat ctccgetece teageteega eaggttgatt gccfcggeeec gtaçtcaçag tgctgççaça fcgctctgggC tccactcccfc acctcaagga aatectttgc cttccacgta ttaattctca teaaaaccat ttggaggaga atctgcagag aaagatacfca. gaaggtgtct ttgatgaggc ttccfcactafc gctafcatoag tggtcacatt gtgttectat atttcacoat afcctg gttag agcaggccag gctgtgtagt agaagccatg gtgc11agac ectttggttg gtggctatgç tgcggggsgc· cagagafctaa ggcateecc* ccgtgtgggt aaeeeeeatg agagggaagg gaactaagca ggcagggtgg ggt-tctgt,ta caaagaccac gfctgtaaaaa gggccaaaga «gccggsctg tttgcetgtg agsaagtcgt cecagcagca cgaeagcctt caactcacee eactgcattt tctaacacgg gacattagca ggtgcttfcec aaaeacctga gcggctecta tgttacteaa atgeeeetet aggcatgctg gggactafcgg tagagageta agggaggagc agagateett ccaaaggggg aatggtgcaa actcaggaca tggeaccatg ggagggaggg ggcttaaagg gatetegact agtça11ct« «tcate13gg tggagggggc atctcctcca aategetggg ecsctctcga ctgceetetg tgggcatttt gtgggccacc tagatctecc tctcccaage s cttctf tec taaactgatt ata-gagaggt gaatcaattt aagatgttta gtacagaaat tatgteaett gagtcccgcc teggacacat aaggtcaaaa ettetcccea εtcggaaaga aaaacttctg ggaetcctca gctcaaccaa aagttaagtt tccaafcfctge fcfccfcgecacg tgcecccggg ctgggctcge tagttgecag tgtgtcactt gggaaggtcg aaagtrgtaag aggagagtgg gctgcagccc agctctcaaa agaaggatga gggaggggag agagetttet gtaagaeaaa ttcctccctg ggccagcaae tcaatgcagc aggcagctac cceggaaacc actgggaatg gettctccag gggcacccaa gagcactgaâ aaagfttgca agatgaccca taatettget atctgaaaag taagacatga çagtagtatg tgcatatagt tfcatatgcaa atfctttggeê cacggggtgt gggaccataa acagcatgaa ggataaatga taçtggcgga taaaacacaa cegetgactg ataeagatag· taeaetagcc agtgtggctc atcggetcag acccatctee eatgagggea gagctgagcc ggaetctgtt cacgtgtata ttttaéttct acactctgtt gcctaggctg gagtgcagfeg tcccaggete aagttattct cetgetteag gcccccatgc etgaetaatfc cetgtafcttt tggtcttgaa ctectgaeet caggttatcc tacaggtgtg agccaecsgtg ççtggcctgt-attcceagcc aatgagcafcg gçtagagcag atccttgtta getgacctaa gatccctctt. aggagaaggg tctetggaga ggtgtaattt aacaggcgtt acaggggata acaagttctt tattctgatt cttggfcfcttc taagagggga geeeaetttt tgcagagtgt atcaaaacat teectgeatc tcttatceet tggtgtceat cttattcctt tttgagafcgg agctteaete tgaggetgca ggaagaaaag aacaegeatt agctttcctc atttttaata tacacatgga atatacttgt tataaggttg estgctcsââ acgtttaggg accatggcta teaaggaaaa ttaaaaagac agatgcatgt atttttagca -ctcaagattc tggggcagct getgaacagâ «ettggcett aattaatggg ctgteectcc agggtttgag «ccfcaaaagg aattggaect aattásattca tecttttgaa agacagagtc geacgatett ggctcactgc aacctcggce eetcctgagfc agetg^gate ataggcacat tsgtagagac ggggtttcac catgtcaggc aceegcettg gcecctcaaa gtgttggaat tcacatgtae aasacacage teaatgtcct cettggtcaa agttcggt.£t ttggagaaaa tgtgagtgta agtaagcaca «^ttgcagag tctaaatgga tcacaagttc atggactttt tatagacaga ettcfcgagga egtttaaggg atgtattatt eaactacags cacccceaec gtttttggaa taecaccetc atgtcgcttc tctagactca cittetttct gttttttatt tgtcaccagg ctggagtgca gtggtgcaat ÍS74 0 XS800 ιββδο 16S20 16980 17040 17100 17160 17220 17280 17.140 17400 17460 1732 0 175 80 17640 rme mso 1782® 1788® 17940 1SOOO 1ÔÒOO 18120 181S0 18240 18300 18360 18420 18480 18S4Q 18 600 .18660 18720: 16780: 18840 18900 18 960 10020 19060 19140 10200 19280 19320 19380 19440 19500 19560 10620 19680 19740 19800 19860 19920 19960 20040 20100 20160 229 «ttggctgaç «geaaecfcet gccttccggg cttaagcaae tfcfctgegest cagcetccte •agtagcfcggg attaeagcac gca«-cac«at g«.ç«ggççaa tttttgtatc tttageagag acaigggtttc actatgctgg ecagcctggt cteaaactcc ttaecfccagg tgatctgccc gcctcggect cccagagtgc tcagsttaca gaegtgagec acfcggtgcct ggcctagacfc cactttcaag tggeatagac ttgtaaaafcfc atttaaeggs gaeaggtcta caatgatect gtcaattags, axegacacta ttatt&ataa actgttatt» attaíattta çttacttcaa Atxaatxeaa «çfcaafctaac. ggaaeactea agagtttcta tgfcfcfcfcattc ceagaggtgg agaaaaacga asgggaatat ageaacgaat tctttfccfccc staaaaacat gaatagtgca gcacatcaag tbgaacatac caoagcaaac tgtcgcaaga tetgcçgagt agetcctact tagaestcaa ggaatgagac teaaaatggg ttcaccagct ctgctttgca. gaaaaaatag cgcaaaattt ctcaaaagaa aatccagaat aataataact tgtcaa&agg aaagacatct ccactggggg ttaagaagga agaca£tgg* acaatgatag e«accac«ta ttgaatgctc actgtgagcc aggtggcact txaccfctgfct tcattcteac aacagtctag ggaagtaatt aefcaatgt«t ccatccacct cttgtagafcg agcaaattfa ggctcactga ggctaggaaa tgcacccaca ctcacafcage ccataagagg cagccatggc attgggceca gaeeaegcga acttcaaaga ctacaegagc agccacsggg cagctgtcat ggctaaagcc actcgaattc agcccagcag caacceccbc tçcaggaggg gcacataagc ttgcagcttt gggcagaagc tgcacttgaa gtcctggatg gcgagaggga ctggcttgag coagagccag gaacaagg«t ctgagaatat t«tggaaacc cacaggagga acccatstçc ttecagctgg gagaattcea ttcaaetcca ggccgaccafc gttfctatfcag gaacgaaggt gacttgaact aatagtcagg aatggttgsa tacggaceca asgtcaaatc actaggcagt tcacattttc aafcgagcaaa teeetttagac aattaagaae ttttstsctt ttgeataaec cagacaaaafc cgetacttaa eaaeaaacca aagaccegaa acatgagaaa gagaaggaag eaggggaaat cttcggeact aataagtttt taaacaataa gageaccaga tattttaccc catcagacae ãgaafefttat tcgaataaec aaaaaaggaa tçcfctcccct aagfctecug aactggaaaa fcgaatcatac tttctcagcc etgaggctgc aattctgsgc ctcbagtaaç atafcaagaat agatgfcgatg çcagtgççca gfcagctgesg eaattgttac ttggggacct gttt«tt€âc taageacfcbc accceagtga ta&attfcgta ggggcctcct goccfcfcfcgg* getcctâeeg egtccattag atcagtggaa atfcctgggat tcagageact tcgcaa^fcc agcaggggtc tgctctttct gteetgttcír tggetttegg ttgtgcctgg atteeagggt aggfcttctca tcbgçtacct fccatagacct ctccagaaa* ggatcttttg aecatcagag gaccacgaag attccatcgg tgaggcgcag ataacctgat ctctctgggt tcfccfcgcagg gcacagafcga agggctggcc astcceaagt fcetsagtggt accactgagg eatgagaccc taatggfcstg catgagcagt tbgaaaattg eatctttgtt tttacctaca taateacafcg aaacccgtgg ttetcaaaeg tcagcaggca tcagcatcac atggaggget fcgttaaaaca gatctctggg ccccaaeaea gagttcbaaa ttcfcgaaggc cegaggtggg tgtgaacatt tgeafctccca acatgfctctc gatgctgctg cegcctctgg tcccgagagc atgcctggag aactgccacc tccgaccatg gacegtgaga atteaeatgg acctcagaat basaaccagt ctctcagttt taeagabaag gaaaccaaat ccagagagat tgttttgcca acggtgaaca gctggctaaa gtcaggatgg agacattaat ççtagtcaag tgaccttt-cc ttctgtatiica tttccceecc Re«b«atgce teteaagçct agseacacfcg fctttt«*tgg atgggcataç btattgeect gatetgg*«« gcagactEct caggaggaca ccfcafcgattt aattbagtat agttgaagag ttaacagaca «ggctttgga gacagactga ttatggbgtg aaecccggct ttgcsactce ctagctggab gacectgagc aagttactca gctbctbcaa gççtgagttc cttattggaa acatgagagc aattgfegata ggçagaataa tggccccctc accaatcafcg cccacatccfc aat««tagga acctglsgââfc afcgttatgtt ««abggcaag gggaaatte* ggcagetage cagt&ggect taaaabaaag agatcatcct ggatgatccg ggtaggaccfc gatgtaae«a caagggtctfc fcetaaegbgg aagaaggagg cacaagagta gacgccagag tcattcaaaa caagaaagac ttgatgggcc atcç«tgace etcaggttgg aaggaggttc tgagtcaagg aatacaggtg acçtctagaa gocggagaag gcaaggaaat ggtctctccc çtagaagttc cagaaggatt gcagcccfcgc taatâtcttg açtttatagc ççtfetgagafc teatetsgga tfctctgacafe cctgaaeeab agtaaaaggg tgttttfctgc ttfcfctfcgaga cagagtcttg çtctgttgec tgggcbggag tgçsgtggtg bgatetttgge begctg«aa« etecgcçtcc caggtt-caag tgattctcct, gççcçagcct. cctgagtagc tgggatttaca ggtgettgcc aeeaeacctg gctaccsttt gtgtttstag tagagacagg gtttcaccafc. gttggccagg cfcggccsfcga actcccgacc ttgtgacctg cctgcctcag cctcccaaat tgcbg^att «eaaggegtg 229 20320 20280 20340 20400 204€0 20020 20590 20640 20700 20700 2 082S 20880 20S40 21000 210 iO 21120 S 2180 31240 21300 22250 23430 214 BO 31540 21600 3X660 21720 21700 21840 21900 21960 22020 22000 22X40 22200 222S0 22220 22380 22440 22500 22560 22620 3 2680 22740 23800 22060 22830 228» 2304.0 23100 23160 23S20 23280 23340 23400 23460 23520 230 stgerttaâg ccactcagct fctatcat.gtg aactcaeagg csçggtagagr tgagaactct tetcagtaag ctasgtttct tttgaagafcc accctfcctfcfc gatagaaaag tfctecttagt cstcctctgt cfcgcssttgct eaggaaceet gccagaggaa sacagagtta atggattatg gcágtfcggcfc gccccatefet c.s: cafcgcacg atggtgatt* taacfccggtc tctgatcgtt atgçgsaccc csctfctccfcc actcagactt cccfcctgfcfcc gcaggmtt tgttgaaagg gaggtgsgõg ccctcgggag gtgataatgc astgctaafcg agggtggttt aaggcfcaaat ggeattataa atgagagtgç fc g c fc *& taa g « «.« c cag fcg t fcggatgec&c ateeecggec agtfcggaaag acaaatcaac ttttggfcece ctfctcgggge ggçcagcttc tgtggccctg acfcgt fcts&g aefc.ç.§çfcgtfc cccfcfcattac ctfctcaggat tcagctggtg «agaac&eaf cttttcacaa agaccefcett c fcetgtgcca agccccgtgc c&ccfcggcgg tgaggeacâg acaatgacaa gggfegggaag gaggtgaggc ggcagcagaa gsaggcfcgfcc agtaãgctca eatgtetcgc attacfctfaa tfc1fcfcafcgfcc fctagatgatg tacaafcggga gt.te.gaaggt gcKttgtcat: fcgccagcaga aggaaUaag tagactgtâg tgeaaatccc fceacttfcata gaacatcaga attctagggg gcaggaggca cccaecfctcc ctctgtcagc tcafcgfcfcçaa gcagaatcac tcagatggta fcgacagctfct gfcgatfctfcta «cccagcect ttgggaggçç ectgaecaac atggagaaac gtgcatgecc gcaafcgceag gaggcggagg ttgcggtgsa tgaaacteeg tefcca.aaa.ag ttttettate tgecggafcaa tgggttttgg ggagtggcfcg ctccaggc&g ttactcagct gtctagsfcag fcagcatfcect gcttggcac* fcateagattg caaaaatagc atttcafcatg afcaatgeagg èggtggfcgat ecfcfceactgg cctgaefctafc fcgccssggcaç tâtgscággc ctcaggacct. tgtggcctaa tgcggccact cgttacsgca aatatggtga gtcaaaaaga ecagggagfcg aggaetgtge gagcáccagç ttfctttgagt gcfccagcccg gctt-gcsgsc tgggctcttc tccccgaeta caccctccaa ctçcaagaag tacatca&ga aaceaagtct aacatgtgtt tgecfcfcacac afctgggtaga cgtaagtgga ccaactxcaa cttteaggtA fctfceteefcfcg ttcgtttatfc gctgtgctcc ggtctgcggg attCCCCttc tataaagtgc act t fcgextg acc te t ggcfc gccgtgttfce aggeatgcfce ettgctccct ggtggccsgc gtgascsaga ateettaage çtgagggacc sattttggga ggtggcectc cttcaggcat fcccceacagt tstcagcagc ttccagagtt gacxtaacat cacgcctggc actgtgcçç-g gagggcaeag gcag&aaggc gcetcecege. «tcgt&aagt actttgactc agggagataa gcagaatgag tgcetgggtc áCtttattca tttacataat ctagatafcac agsgstaaat gecagctggc aagafcggacc cgccatatgg gaagagaace accaCttaag ggaçsacaçg ccatttattt tsctattttct aaaccaagtc aaactatgct cttgatctag afcgaatgcgg gtrtcgtsgc cctggaaata caaaagcafcç agtaaccttg aactfcttttfc agcagaaagg gagcagaagc tcaagtccca s cggra t«tgt ae««t s etgg ítgea eaggg gcatgagtgt ttgggtcccç a&tgaaagaa taacataagg aaaaaetttg gãgaatãgc« tgggccaggc gaggcaggca gg cca«tcga cctgtctcta ctaaaaafcac ctacCcggqa ggctgaggea ccaagatagc aecattgcac agagágaa.ág ctgaagfctCa caatagtafc & ccggaaggca attggaggca aacçcaagga tttccaagcc tcagcccsct atggtgagtg aaâtaat&tg agccafcgtaa aactgccaat attççaccta aeatctgaag aaagttt. tga aafee agaaag tfcteafcteat fctgac&aata tcagagatga tstaggaaaa gcctaaâttt tetcgfcctgt gcaagagga* actcatacag gaggaagggt gçaaaacâtc ccagestáca gtgatcaccc tgaetfctgfct gtcttfcaaca ccggçctgat 11gcggatct cccccatgcc agCgtggcca çgçaggggca ccgccaggaa cccttacgca tc&ccgcagg eattgtttgt fctcccaggtg attacgaatg ggatfetaegfc attttcagac cacattgcac ccgcagccag aactgtgtag getac111g c agccaaggta atçtcaagga ggttcaaagg cccatctgtg aagcccfcgga tgeacccgtg eagagcgcgt cgagagccgc egcgccgaca sgtgtfcagct cagasacaaa ccgctgtc&c ctggctcctc gttteçaetg agççacgggc ccacaggctt gactcgagca tgagtggaâa ceagteatae gtggeagatc ggcatgaact cacgctcagt cççatgatga agatagagtg gatbtkatgt agtaacttgg gtacagcfcac tttegaetta aaattctgga asafcsfcacat tgaagagcta aaagagtagc ttctagaggt acag&agtca gtgaatgaag aagctcagtg acagagagca çggcactcct fcctgtgctga ctcctgagtc asafcaggâaa Ctfcact&gga gttatggfccc acttgctgta gçfcagataaa tgtatttcct gtcaaaaca* g t.tgataafc c gfc ca fc t tc 1.1 aaacccaaag asaattctag· gaggaac««g cggcfctgaac tgccagcagc ccacfctccet egccafcfcfcte caseeatâat aaatggacca. gtaagtt.gga cccaaggcaa «ccgtgattg a ca g tggc t: c atg cc t gca a àgttgggagfc tcgasaacag aaaattagce. gggcgtggcg ggagaatcac ttãããectgg cccsgcccgg gcaacaagag cagfctt.cfc.crt. tttgctttga 9§«gga«fcfcg fcggaa«gaaa cactcactgc tggtgtgtga tsttgtaaaa csggaccatg tataaagcsc ctgacacagt atctggctat ttstgascta égsaataaat getattattf accfcggctfcc aaattccacg tcattttgaa cacccctatg «gacagatgt cctcatccgt· caaatggtga cagtaacaea ns$Q 22&4C· 23700 217 tH 2 7.82 0 23Ê&0 23 34 Q 23000 24060 24120 241S& 2424 0 24.300 24300 24420 244 30 24540 24508 24000 24220 2473 D 34840 24000 249S0 2502» 3 5000 25140 2S200 25200 2S32S 25360 25440 25500 2 5 560 2 5020: 25880 25740 25600 25SO0 2S §20 2S980 2004 Q 26100 26160 26220 262B0 2634 0 26400 36400 26520 365Í0 26640 26700 26760 36820 26680 26640 27000 37000 231 ctcettatca gagagctggg cggcaggtga aaagtafctce etctagatao çactagttcc agagtt attg gggtgetgct ccttçççaaa aagctagaat gaatctcctc cccaaaagge cagagggaas gtccttctefc tgetgtgggg aggeteággg gtttggggtt taagosetac tggttgacca cctgaaccea gfctgaaagga ctcaggttag gtcttttggg ctecctgage cactaacGct atcaatagçt ttttaagaa* gtt.fcafcgaa.fc gaceçgeagg etesgggtfcg gtcgctacca gtattaggaa agtgtgtgtg tettctgcta catg&«tg§ tggctacga* gcgctfcgccg gsçtgatgta gagagaacgc agaggtsggt ccgageagga aaagtgacaa ccccttgggt gggagoggga gaaggctctg aaaatacagc gcatggtgct ggctctcaaa cacaccctge açfcegçgccc cesaggcctc çtgagagtga tgcsccttgt gataagttgt bgggaaaata agatgcagta taatcccagc actttgggag cageceggcc aacafcgffcga gçatggtggt gggcgcctgt gaac ccagga ggcagaggtt aacaaaagca aaaeteeatc fegtgaaactg actagcatca saagesgtac agtaccttcc fcgctaatsct tacagaegaa caattcetaa. tgcacfcagfca cccaggtgct gaccccâgcc t et 11 Saca a t ag çacccC t cagt sg Kgat aáãggcag tg aas.acct.gag age cfcgtgaa agefcggaaaa agaafcgaetg ttcctctcta gtggcattct t ct tascas c a çsgceeta a catgccttet cccaegt gat taagsgggte ttctesfeesg ceeogggatg fcgcctcagtc tacagetget fcbaattccga catgtcet:t:t taaçcttaas ggeaaa&ac* aaesiatagga ggaçctcâtt gaastataaa ggtgataaga agaagatcçt aggatfcggag astcaagfctc etesãtggcg gaagtgttta agefct&gtta actçeeagec cfctggcagEC tcççaasaag gcagagggaa tctccttccc tsgaatgcag agggaatctc tttaaatggt agctgttagt gtgasgggfcg ta ç1111aag ccíxfcgcece ettteacgag cgtttccaca tetggaaafca atgatagats tgesaafcace câcastãgãà gaagagttgt ga.tga.geta* agaa.aaa.acg fctgtgttggg etgfcstteaâ gacaagtetg ttgtaaaeaa ggttcfccagg εtteetetag gattttgtga ecaatgttga actgacacag gtgtcttçat cfetgtítgtg aggcaâaagt a&etgggact actaaagaas ttcaaaacag tatttgaeta aggctgacta ggacetefcga ^ssgg^gac t tgcccagt11 gggtgcfctca gtgctgtttg tgeagagtct ggcgstggaa a* fcg fctt eafc fcgfcε fcgfccta cctgaggaae aeaK«11te* agatgcagae atgaeagcag gctgaggtgg gtggatcacc asscccgtct ct*CE**a*a aatcecagct actccatagg gcagfegagcc gagattgegc teaaaaaa»* aaaaaaaaaa ecattgc*tt gttttatagat tgacatctgg actaggaaat «tgtcggcgt tagagtatgc tggtttcagg cgccaggaac ttccacacca fetttccttcc etetagtggc Eaatgggetc acatcctagg gaggtcagcg getcaaggac ttgaeggggt ttefctteagc agateefttec tatttafccct ctaaaaccac atgatattct teattetett tacctcgtta agagtggggg cctggcSccc tatgcagccc acfcgctcctc tettcafcefcg gaccatctgc agaacatgae ggcetcacta actgatttct gacugsur.ca caagaaacct tggcccgcet tettgtgtsc gccagcccca taacccgcca cçsaaacgcs sggagcactg âãttgctttt afcatctgtag ce**geettc aggactxcat «tagaatgea gagggaâtct aa**ggct«g «segeagagg cttcccaaaa ggctagaatg Ecaagsaagg tt*a*c*ttg agasccagtt tcagagccgg ctg*e*g«c t ta fc g casgcc gaaatgtggg tactagttat ttggaaaccs ggsgtgtcca çttgggccac acatagaata ttgcaaaaaa aateteatat agccatcetg ggccacgtcc teeeatgatg ccggcataag ccettgggct cttttcctga ttgcctaatt gggctaacag tsctcesctt agttcctgcfc ac 11cg tcgg ttacctagga tgtggagcga ttcctgattt gàttcacggc tèegtãgcãt ttettctctc ectgagcttt tcttattaag eaattececc ctgcacgtgc cttgcagccc cgaeatttts ggtctgggtt gagaaatçag sscçsaaget gggsccagaa gaààgastgt ggtgeagegg «teaegceta tgaggtcagg agtttgagae mtatacaaaa çattagccag etgaggctgg agaatcgctt cactgcsctc «agcctgggc aaaagattca gacacga-gac gttgeeagac agaaagceec ctaga tt t. ta gt a a aa taca cgtcagttcc ttagagattg acgctctgtg aggctgctgc ttgtgttcac agccgctctg tatgattaga tagcatcctt ggtgsaagcg ctatatctgg tagaccgtga gcegggctgc ctgtgecatc tetttettea aattccattá tctctcctat ttgccctgga aaacctctat tggaatgtet agcaatgaaa tatcttacec ectgtaaagfc tcaccact i:g c tt gsgatee aaaatttgtc cacctaecca âtcsgggaat gaacagaggfe ttaaaatagt agatttectc ctccctggtc tccctcttta tctgcgcggg tCcfcagacce 37120 275 m 27243 27303 27360 27420 27480 27540 27600 27660 27720 27780 27840 27500 27560 20020 28000 28140 38200 28260 28320 28380 2 8440 28500 2SS60 38620 28680 28740 2S8ÓS 28060 28020 28080 2 5040 23500 33560 33320 25280 23340 23400 23460 23S20 39560 3 9640 29700 29760 29820 298 8Q 29940 30300 30060 20520 30180 232 232 cefctetcebc ecctctggce gtggtaggea sgagaceaaa ectggccfccg gaatcetcct tgageagcsg ccafcaagtag aagfc*ataga «ççaaaatac ggççtgatac agatgeaagc attttcaacc etgccgtcta gaagctactt ctceceagge etctcfctctg ttccfcgggct çgcccttiggg acwcgcttta gttefctgacc atccttcccc cggsatttct ctctsgaacc fcgetecages ctgtcegefct aggaagttea acattccAta atgtatgccc cagtctgagc aggatttfcgc agcfccscttt btaafcgeeefc tteatcctac tsfcetctgae cccttccces accéâgcsgfc gàaggafcgaa tcfcfcggttts tcfectfcttcc ectteccttc ecttccctcc cacagfccbtg ctctgtcace caaactggag ctccacctcb teccaggste aagtgattct acaggtgtge accaccaeac ccagctaett ctafcgttggc caggctggtc tcgaectgct «eaaagcact gggageatag geasaageea ttsccçattc atttasgcta ttacetggge caacfcgacfce fctggfccttts atfcacctacc tc«tat«?cc& fcggagtectg tcctctgfctg agt t c tc age tcaa tgg ç gg gt-ggge a a tg gtfcfcccccac ccctcctees ectgagttgc teagtagata ttfcgctaecfc getctgtgcc agtgaacatg acggagtctt cgtccccaag cacattgcaa gacc&aatat atccaaetfca *g«aagaaga cfcg#itcet c gttgte ftfcfc t gtgggcccct eçaagtgtgg agtaeggtgt ttctsttgga aggecgggga gcatagatgg cc«aeca«ac a&cagtãtta ga&fccatctg çççcatccea gacttatgaa fc*agaatefc« cagatgatte tgcatfcctca gataac&cat ttgggaateg etgaaggctg tccactcctc aatattcgea gaggtectta tfctattggag gtecteacag agetcacaat tcttattttc tccetaaafet ctgaaaagaa cagactttta cctacctcgt afctttgtcea cattaagaac ctggeggggg gccacagag» gctgagctgg ctgccagest- câgíetccca aagtgctggg ggcggaacte agggefccfcgg atgcsbggge cctagaageg gçtagcaccb ugagatggg atgtaágttt tatgexgecs. gtggagggca ggtetecga.a gtctgaagge atcctttgcc acacaggeag gtctgaacbc ctgtgttgcc atgcaaccbe fcettttctgt btgcctagat gatggctrgta sgaattaaag gaagtcatgg aataasttaa fctetgaeett ceteacteat tgaaagatta gtgagtcttc tgfcggttggt gtccfcecbtg ctcaagggefc áatgaeeetg ccxccccgcc eacagsattt caggbtetec tatctgecca c«atg«fecac ctgccacage aaaggtgcag cbaatgatge gcccggcctg ggageaggag gctgsgcçgt Eatcttccae caccctagfcc CEÃtgetgçg agggccâcat aattgaagag caeeaetatt tcatcaggag fcatctegagfc gbaaaacagc ttcgcaaaec gtggccccat tcgtgtgata aafcccgagoc fctatcbgaac cctccattct ctggctaaaa tttecaatte ccetaccagc setagcaggg «aeaaegcae tgcagcctígg egggctcaaa ggetsgaagc ccaagatcaa ag&gtgggca ggee^ataga gtgceacctt «xacetgbgt ttactga«ga accatggtgc tcfcttcttcc taacacagac acfegctfcaac acaaccactc tactagaaga *acg«cta*g cctaatctag e*S*««89CÇ ttatggetaa asgcaaggag gctgagafcct tcttcagttg ggcccatcec atgtcãcact tggac-tctgc agacacceaa tcâceaaccg aggaggaatt gctegatgag ccagatggtc çgttgcccct ttccagaagt gtgtcabcct tgatccâgtg ggtegggaag ttcttccttc aggcctcagg ctgcccxgcg ctagaagtftt etggesctta t-tttcagccç ateetgttEa gtteaeetgt agcagtcact gfettcttfctc tcttefctttfí ttttfetcfcct ct.fccseat.ca cetcatctca cctcaectta cgcagtggcc tgatcctggc tcactgcaac tataectcag cctctitgagt agctgagact st ttg bat11 11a§eagaga tagggtsεag gaactcaagc aatctgccat ccccggccfcc cecatgatge ecagcctgaa tcttggtscç csgaactcaa tggeaeetgg caccaactgg fctccctagsa ggsactgggb tgctccccct gggçtcccac tgaçccbcbb ggcaatatga actgccaacfc cttgaggcca afcgaacccag tcacteactc cteastcact eaacattgat aggtaccagg tcagttgctg saggagfcaac gagacccaag gcgtctccta gagccagggg ccaaaabaat catagaccta gctctcaaaa cfecctcctca gcatcaatgt tttagagtct eaetteâcca gagtfccgagg agaaaeatsc atatcaagge tgctgfcttct aaaagcgaaa fcggtgectat baaagabaca gatscctggg tgceagagga agcctgagaa tctgcattct ecfcttaggKg attctcacac acactggags ttttctgaga aatgattcat teattteaga atttgtgggt ggçcagagga gaaacatctt tfctagaggtc aceaggcfcta aaatgacact aaacaagaag ggactgtaat gtttbctgtfc ctggggtggg aagtggagga gggggggtga ggtggbcbçg aactcctga* ctcaagcaat attaçaggea tgagcc*c«<? ««gatgcctg gcccccatet cccacact.sc ggcgcctcat aattfttttag caggatgcfct ttgtgttttc cagctgc-ttc aaaaâtaata accasatect ctgcagtgcô aageacggg» tbctggecbc fccttgetggc fcejtgggaeet gaggcaaatc ggsãáatâgg tttacaAfcâc gcccecatag gtgtãeaatâ cctggccccg aaagatgcfct tfeaggattat gcaccaactt ctagaaaeaa abaaaaaaaa aatagaaaca tgaaagagab gfcgtgcgctg tccaggcccc caaggtcttc gcagctttgc tgagcctggg tcaggttcgg tgcggcccea fcfctccaaact tcagagactt gggtcacatb ccccgagccc tgcagacaag acoctgçgca cagcctggga agagt&aaag gccctgagac «ttggaaaa* atcctac«tg gcgçtgceat ctcatbbttc sctbcggtfcc acttctfecct gcfctctgtaa sgagcatatg accacgatat ttgaefctttc acaatttaab aacabccctc aettggacte etetatetta çactctgtac tcatcfcgctg gegetgecât-Ccacagaafcfc taécetctca eagtcceaga gggtcggct: t ctcctg«age ctctetccct cttcacatc» teacctcact gagcaegfcct 3(5240 30300 3 0360 30420 304 00 30340 30S0O 30S-SO .3 ΟΤ20 30? se 30H0 30900 3006 0 33020 ssoao 31140 31200 31260 31Ϊ20 31330 31440 3 1300 31360 31620 31680 amo 31600 31860 31920 3:1980 32040 32180 32160 32220 32280 3234 0 32400 32460 32520 32588 32640 32?08 32760 32820 32830 32940 33000 33060 33120 333.80 33240 33300 3.3360 334 20 334.80 33540 33600 1306« 33720 33780 3364!) 33900 33960 233 gegtccaaat ctecccttcfc gagttçattt taccttaatt gaggaactga gagtaaagat acaccctctt ttgggatgtt acgascafcga ctgfcgaacag ggtgteagct agesgtgcet eagattcfcga fcteattaggt agtgtggggg ctgatgctgc satsatggct gagtgaetct ggtggetcac gecSgtààtc teaggagttc gagaccagec aaattagcea ggtgtggtgg gaq&aícgct fcgaaçççggg ccagétgggc aatagagctt attafcgagtí. stafetatcag aaaeetgfcgg afcge«**«tg gaagttaget gttgggccga accttcccag fatcctcact tcaccfcctcâ gatgggecag agâãâseâggg tggectetge aggafcfctsgt gcecfcggaga gtggtttàeg cctataatcc esggagtte» agaeeagccc agttagctgg gsgtggtggc agaai.câctt aagceçagaa csgcttggge fc*e«g#gtga caaeaaaaac caageetete gtgcccãggt ctcstgaatg gsgeeeeeag sfcgcegaagc tcaettctaa caesgteetg ggtçttaatg gçcccaatgc caggccratca aggagctctg eagagcsetc geggtaatgg gt fccaâtgac t ag: t* a e.age ggagcâctgt tgagfcecagg tttttgtgtg tgsgaaattg cttccagçac ecctggcfcae GcgcSgctgg catattcaac acataaagac gstctecace a.atatggggt tggtgtsete agageafetet gctcttctct egagttaaco ttgcttttcc fcgaccgc.ggc cceâaafcttg Ectctgaaga. tgfcttegtgâ tctaagctga tagttgaggg caaaegacta gtstgotttc aggtgtggtg getçataect ttgaggtcag gâattaagae tacaaaaatt agceaggfcaS: ggcaggagaa ttgctfcgmac gcactccagc ttgggcaaca gctectggas aaaítacttg fcgaafctaggt tggçafccttc ttaaasggtt cxgtaâttec ececaaafcac. tggeaaaeca ctgtatttaa tgaagtatgt caatatgggç etcttcccaa tcaacatgtg «eccaetggt cactcagttc ttggcagaaa ««gcacagcc acagagaagc c&getctfcat gscagt âa t a ggtgggt ctg fgaaggatgc g&agcecccc tafcaagaccc cagtcatact atctctttaa ataccctgtç tcaacatatg aatfcttggaa cat t ttcecc ct taaggagc gaaaaesggg agagaatgaa ttebgatgfcg agtgggeeee tecagaggga cctgagãtst tggcceacgg aceafcacttt c&gâcteetg ctgtagaaaa ccagcacttc gggaggecga tggccaaeat ggtgaaâcâc caggcgcctg fcaateeeagc aggcagaggt tgcagtgatc gscteagtct caaaaaaaaa cata cggggfc geet11 caaa c«gctetctg atfcatggcag gctggcfccas ettgfctgtge aacaatcetç ctg«gtcatt ccatggsggc agtcagagga ã tgcca1t«g gsggteacat gaaggataga gcgtatcaaa cagcactccg ggaggçcgsg ggctââeatg acgaaacctc gtgcgcctgt agttgcagct gactgaggtt geagtgagçc gacectatet caaaaacaaa cctccactca aaaatgca ag cagacâtgaa ttattçcagv acettteagâ tcccaccggt cattacacac gtgtctgtcg tcagtgagga fcgcccaatgg gsgttaagga astcatgaga gctttgaggt ctaggcfectc tg«^a.cactç ctacccfctca gagctataat ttaaacccca gtgtcattcg cacfcgcatet atatttggga aaegeaccat tattacctca tcttcttttt accatcfcccc ctctacttct atctaatcaa «acccacaag agatggctgt aaatctattg gggaacaaaa tgatgtcatg ctattcecafc gcattttgtt ecaggtt tgc gt 11 cctt aa gctttgtfcãâ tggettttgg ctcaaacfcaa «tgataatat gtaatcccag cactttggga cagcctggcc aatatggtga gctggtggât gcttataatc ccgggagg&a gaggttgeag gagtgagact ccatctcaaa aagatcttfct atgacatcca atataetsge: atcgtgççca ctgtgggaac ctaagataaç acgaataaac gaatgaatga gtgttgagcc st1.1eceaca ãggccctase acetaatgcc gagtgcaaac actcagacca a tagtg&cag tgatccag ce tgga agatgg eggggtgt a g aggggagcca ctcatcagga tgttacçccc caggtgagta ecagctctcc tccagttgcc ggatg aggat çcacc«stat tccaaataca gtcccattct gggacctaat tcagcccaca tagtcaggat gtçt tatct c gcfcggecaag gaacagggcfc aeagggagc t «gt t aaaa tg cccattcctg acaagtttcc gagt«gcaag gagetegata attatgagtt ggctgggcgt ggtgggcaga tcacctgagg ca tc tc tace âã.â aa t aeaa tactcaggag gctgaggeag tgagae egtg ccactgcact a.saagaaaag aaaaagaa.aa ttgataaaat ttctaatatt gãâãcggeac ttggcagtáC ggteetgatt gcctaaagat tggactttcc caãcctgtta gggctctgca gagggagggc ctcactgggg ga&gcagt: 1.1 ãcatgtctcc gctaggcatg gtgagtggat tgcctgagct a t ctccacta asa t aç aa a a acttgggagg cfegaggcatg gagattgcac cactgcaetc ga aacaaaca acaacaataa ggcctgtctc ccattgctgg cagcctcagg agaacâqaat tCtstcggct catttaaact ttatgggcsg ctgcsgagag «easc&gase ctgccatett geacagaggg gcgggtacag ttege««ggg tttgaaacaa aatgaagtaa atgggaaaat «atatetaas aggggtaaca acagttttct ítttccttct setevtcctg fcfccctcatgt cggaagtgac í: ttgaaaa ct eactcectaa etctctgctg tcateataafc teagetettg gccatctggg ccteacagcc tcagctccgc cccttgaaca cgtttettca efcfcaccecgt aataaaatge agagscatgt gggatctatc tctataccca fcaaaaataea catcctggcc ggccgaggca ggcggafccae aagcctgtct gtactaaaaa ccagctactt gggaggfctga tgàgccààgá tcatgccàct etaaasãaãa taeaeacetg tcectcttsa cacagccatg: gcactfcccat gttatacagt gcgaggaccg tcacacgtgc gtttatgaat çgctaaçtgg gtgtggaeag atttgtecca atcacactgg ggatEtgatt «agcaccatc fccagtaaatg actgtcatga caggcgccac «çaagattce aggatcccca ttgaactcte aategagctg tcatgacagt cacaatccta tg cEtgggc a geagagatga 14a 20 Ί4&βο 14140 342.GÕ 14360 34330 J43S0 3444S 34500 34560 34620 346S0 34740 3 4 80C 34860 34920 34360 2 S040 isioa 2SÍ60 35220 15285 33340 15400 3S460 3S520 35580 35640 33700 157S0 35820 3 5880 35940 16000 36060 16120 363 80 16240 36100 26360 3642 0 36480 36540 35600 36S60 36720 36760 26840 36.900 36960 37020 37080 3 7'14 0 37200 17250 37320 17350 374 40 17500 375S0 17620 33680 37740 234 tggaatgtgg agtctggçgfc aggcaagagg atctetcsât gtctgàeggí- ccaggctgs* gcvccttegc afctgactgct sgfcgcfceS&e eateeaagcfc cattgcagg» tggaagtggc teaggfcgstc astsatcetg tfccggtfcfctt eaaaaattat tgtgataçtt taetatgfcgt cateaccteg attatcattt 111 tgasa t a gaeagfceeat gaacttactc ctattgaaçt agttUãeâa etgggãtgát ctaggttafca atatgcccag ecaagctgac tgtggggctt aggçaccsçt: çggggeetgg cagccttcat aafctatgaag fcaattgasga cagestfcgtg ccaceatcag ttçtssgact afcaatagtgc caaactcstg tagcacaata taagfcgctca ttcctgcata gcaaattctt acagc 1t.1:tç tgggtcagsg tctcagctga «gcfceaggafc stceagtfcgg aagactaaag ggtttctcca caacatggcc actttcttta agtgaacttt ags gagcst t aagtcaacfeg caccgtata* eataaettag acggaagggg attctgcaga gtcactgagfc caaaagaagc t:gt.gtgs.gtg agfcgaafcfcca eccaccçççt ggeagacaga acccaggctg gagtgcagtg «caggttcaa gtaatfccttg ccàcgç ç fcgg ç t aa fcttttg tggtcttgaa çtçctgacct fcacagaegtg agccaocatt gaacagatga agetgagaca aggattattc âtactgagafc fctaeaattafc ccctacccta çfcataacaaa scáccataac fcagsggctgg aaafcecaaga ttecagttta Eagaeagtge âàgetccttg ggettfcttfct aataaggtca ctatcttagt tttattttae tttaaaaagt ggaggceosa aeagtaggâfc gtgsgácccc: atetaoecea gtgcgcttgt agtccsggcc sgatâftgatt gageescfcge aaaaaaaaaa aãtetttacg catetgeafce tggtgacagc fcggcacgtgs ag&tatcaeg ggctcfcfettt âacÃâccagc gggaggg ça í. t aate t a fc fcg aecccaçctc caaeacfcgçc aa&cfct&caa actatcgcag atçaettcet aasggcetta aatttfcgggg «gacaecàac ggtcactcag gccçeaaatâ gttsâtcatc cccaagctcectçaeeafccc ceactgcεat ggtctgaggc çtgaatecafc tcaagggaga gggcctgaat geccetcctg g<?tfcgcaetg tcaggatagt tgcttctgct gggcfc11 fc c fc 11tett c 1fcg cceeaggect tctcafcgcet attggcctgg castgaggag ttstattgat acacatattt gtggattgtg eaafcgatgaâ etatgtgttg «gaacafcttc tttgtfcagcfc ac&gteaeec gtgtatttgt acccatteac ccfcgggsaáá. ctááágtaáa tggaecctgg ggaeatctta ccagaaggtg gggagaggaa ggecagagtg eatgtctaag aggagtcte» ggtgeacage fcaatgctcaa astecetgtc «ctccctaag cctcaatttt gggttgtgag gaataacgag ataaaagcca ttattsttat gcaaatgtag ggactcaaaa gtcttactag gc&gtaatca tctcttceaa gctcactggt cetacagtct tcagtctcta atctatgsct fctaaggcca* agacccttts ttaaaggcct atfcagagatc tcaattacat tgaâãggagt gaaattgcaá age 9 « 999 - <? aeggggggg t cgaatggtfef tgatgctgag tacgtatg*c cacetgggaa gaasfcstett ttteettttg gcttgatctc tgcecactgg tgcctcaact ccaagtagct tst111tsgt agagacgagg caagtgatse gcccacctca aaccatttfct ctacctccfcg tacaagtgma a εcet««ctc tatccetggt tgcaaagaga tgctttcctc atctgtcttc tgggggcfett fegaacaacaa tçaagtttfit ggcagattsrg ctfc&ecqcta ccgccttaca tgtttettte tttetetets çcat.tttgtg ttgctasaag ggcoaggcat ggaggcttae tgtttgagge caggagttca fcctetactaa aattttaaaa «cfc&gagagg cfcgaggeggg actcsaaccc gggtaacggg tggctcacta ttctgggtgg ctcatgtcgc ctccagccat tgttgagggc agaagcgaga actggggâaa ctaatagagt atgagssgacc cgcctccatg acactaggga ttaacttttca gcactaatac cactcacgag cctcttaatc tcatcacatt sttcaggcca tageateate aaggaaectfc cetccattcc atcagccccá! cctttaaegg Ccctgtcacc tgggcccacc gtgectcatg tatgatgctc gagccttgct ttccaggcct çcagaectca tccagcagga ctgagtgctc tctaaagagc ctgataggga aggcatgggagggcttggtt tggaaggtgg111tcetggg atqtggtcct gtaggfcafetfc gtggggtgca gtcagggcat ttagggtctt aagttctcag ttccegctat aacccgg-ctg tcagacattg caaãctctct ttgggctttc tcagacaccc gacgtgtgag gctttcagag gtcatgctgt atgatgcaat ggcccatcag gcãttaaggg gsggggagag ttet gatgsg ggaeagcfctc ttcagagtgc «tgetgtatc gcatgt.gtta caçtgggata gtââãgcaãt tgaaaaggtt tfcfcatfcaeac tagttttcaa caatataaat ttattafeetg gagggcaacc aaagctgcga tgttggcaga atesagttct gaagcctttt etetggcacs t«Sfsgaãcà tga ttageat atetgattag gecaggceca ctgcaaagte eetssatgtt étággttctg cctgeactcç ta 11 fctggga t: t:cfc gc ctac gttEftgggc ageagcagtg gaaaggagge tgtggtttcc sgâ.cagggtc tggctctgt.t ctcaetgcag cctctgsetc gggattacag aeacacactg ttfctgccatg ttggccaggc gee tee eaaa gfcgc tgggat tgggaaaggg eacagtgaaa ctçteeafcfct agaetaaaat ts atecgtgc aactggg111 etegtagtca gcecaggctg aaettftacftt ctcacagttc gt gt ç ta at g aggt c c tgc t eagtggaagg agaggacgag tetetefctttt fctcttttttfcfc gaacatctga ggttgagtaa cctftaacec taatcettta agaccagcct aggcaagata aactagctgt gçgttgtaaa tggagfctcaa ggctgcagtg geaagaeett gtcfectattc etggaaagtt caagattggg gggggaâgac geaggagage gagsgagggg agagatgcea gagagctcac cgacrcetga âcccaaacac etecaaçgat acc.tgagatt tagagggggg agetecacct teacgaeeta gaggafctega tttsaacctg tcaataaetg teeeattggt tttccgçeçt ccçacccaca ccaacccaec fccfcgccacat atcetecete ct^gacagtc 37300 3?Ô60 3 7 §20 37S30 33340 38100 3 SISO 33320 2 mm 33340 38400 384SS 38S20 3SS30 38640 38700 38780 38620 38S8Q 33940 39000 38080 3S323 38380 39240 3 8360 393SO 38420 39480 38540 39600 38666 39720 39786 3914 0 39800 39960 40020 40080 40140 40200: 4S26U 40320 40380 4044 0 40500 40SS0 40620 40680 40746 40808 40860 40920 40980 43040 41100 41160 41320 41.2 80 41340 41400 41460 43520 235 «ccafcagcca ccse tgfcea.gr atttatfctta tttfctttafct fcfctsitfcfcttg sgacaggttc 41580 çtgçtctgtç. gççcagactg gagtgccatg gcatgatcac ascfccactgs ggcctccafcc 41640 &eetg;ggctc ââgéáattcçt c«cafcclxag eefceceaagt afcí-SSfgact Aei:fgcá.ec3 417§ά oeataccfcgg ctaafctfctfcfc gttgttgtttg- fcttaa&tfcfcfc astacagafcg aagcctcact. 41760 «tgttgccca ggctgqfcctt gaacfccctgg gcteaagfcga tectccggcc tfcggcetcec 41820 aaagtgctgg gattaeaggc stg&gtxaec gtgcccagcc eatcagatgt taatgeeaca 41880 cgcacteget t&aaatcccc cagata«fctc tcgctgctct tggaataatt cceecacace 41840 ttggegfcggç catgcaggct etgtgccaec ggatatgtec ctgccccctc tcççaactcc 42000 tCctttcgcfc tgctcgfctca etcagtfceca gccacatfcgç cctgggaget gefceccaecs 42060 tggggetttcc taatgeactg gtctetctea fcgsagtgggg e«tctccetc efctfcfcactca 42120 gtgfcctccca geaeecacct ectccagagç ctfccceegac caccacaect ««acctaggc 42180 cettcctcet ccacgctecc fccctccaccç çggcctccfca çccaçgtgtc *ettcttta& 42240 actogctgcc acctgaaatt agatcattta tttacccctfc tatttgttca gtttgccttg 42300 tccgttagaa cataagetçç c&aagggeag gagcttfcgcc tatattgtfcs ggccgggcat 43360 aeaatgagca efccaaaaaaa tatfcfcgatga gtgtatgaaa gaacagaetg ggttatgtaa 42420 efegfegeetac fcfcãoetatafc gaccatgtgg tggggtttat ggtgggtgtg gtggtgatgg 42480 ctatagggct ataagcaaat Ufggacâgg gagtcfcaaga aatgttctta aatfcttagta 42S40 agcaaageat cçtctacaga acctgtetfca aaacafcgaaa gttcettagt gctaceeeca 42600 gaggtatgat tfcggtaggfcç a&ggataggg ccfcggaaatt cacaccctcg ttaagafcgtt 42660 cttcatcçgg ggtfctgfctga ccacctttec agaagacttt tgctctgtag «tgtaetaec 42720 caafcgcagta gfctcgtagtc agtgtggctc etgagccctfc gaagtgtagç tcssçtgaac 42780 tgagacgtge cgtaaatgt-a aattgcacac cggagfcfcfcga agâgttaata .caaagaaaaa 42840 ggaatgcaaa acatctcafct aataafegc&t tacaefcgafct aeafcatcgas «tggtaatct 42800 tgtagatata gtgcgttaaa taaaatatac tgttaggctt asttfccaegE c£t«atacRfc 42860 fcfcaatgfcggc tactagaaaa atttaaataa cacatxcage teacattata ctççtattga 43020 acagagctga cctataagtt ccatggaaga tggcaagtct eegcagctg 43068 <210> 2 «2 LI» 875
<212> DNA <213> homo sapiens <220 >
<221> 5 "VER <:222> 1, »74 <220>
<221> característica misturada <222> 75..77 <223> ATG <220> <221> característica misturada <222> 558..560
<223> terminação: TAA <220> 236 <221> sinal poliA <222> 851. . 856 <223> ΑΑΤΑΑΑ <220» <221 > 3 ÍUTE <222> .561..875
<220> <221> característica misturada <222> 74..584 <223> homologia com sequência em ref. de embl: X52195 <220> <221> característica misturada <222> 354 <223> nucleótido divergente C em ref. de embl: X52195 <220> <221> característica misturada <222> 555 <223> nucleótido divergente T em ref. de embl: X52195 <220> <221> alelo <222> 197 <223> 10-33-175: base polimórfica C ou T <220> <221> alelo <222> 453 <223> 10-36-164: base polimórfica A ou G <220> 237 <221> alelo <222> 779 <220> 237 <223> 10-498-192: base polimórfica A ou G c4Cs0> 5 acetcecctt «çtgtacagg gcaggttgtg «s&gctggagg cagagcagtc ctxtefcgggg fiô agcotgaâgc «aac atg gst asa gsa acfc gts ggc «at gtt gtc etg ttg 110 «et Asp Gin Clu Thr Val Gly Asn. Val Val Leu Leu 1 5 10 gct sfcc gte acc cte ate age gtg gte câg aat gga ttç XX t gee eat 15 B Ala. n« vai Thr Leu I Xe Ser Val Val Gin Aso Gly Phe Phe Ala Mie lã 28 35 aaa gtg gag cac gaa 393 ac« cag aat 999 agg age ttc ca g agg 29S hys m Ôlv Pis Cie Ser Arçj Thr Glft asn Gly Arg Ser Phe Gin Arg 30 ;35 4.» »cc gga acâ ctt gee ttt gag gtc fc&c act gee ase çag aac tgt 254 Thr Oly Thr Leu Ala Phe giu Arg Val Tyr Thr Ala Asn Gin Asn Cys 15 50 Sã 60 gt-A gsfc gcg tae ccc aet tcc cte gct Stg cte t.gg tet gcg ggg cta 302 Vai Aep Ala Tyr Pro Thr Ww Leu Ala val L«u Trp· Ser Ala Gly Leu «5 70 75 ctt tgc age çaa «te est qct seg ttt get gga ctig. atg tae ttg ttt 350 Cys Ser Gin Vai Pro Ala Ala PM Ala Gly Leu Stet Tyr Lea Phe 89 85 30 gtg agg s:iá aag fcâc ttt gtc <19t taç cta gga gag aga acg eag age 393 Vai tos Gm Lys tyt Phe vai Gly Tyr Leu Gly G1u Arg Thr Gin Ser S5 ICô 105 acc eet gge fcac ata ttt ggg aaa ege StC ata ctc ttc ctg ttc ctc 44S Thr Pr« Gly Tvr Il€ Phe Gly Lys Arg lie lie Leu Phe Leu Phe Leu 110 115 120 atg tce gfct gefe ggc ata ttc aac tat tac etc ate ttc ttt ttc §ga 494 Met Ser Vai Ala Gly lie Phe Asa Tyr Tyr Leu 11ê Phe Phe Phe Gly 125 138 115 14 Õ â§t gae ttt gaa âác tse ata aag a cg ate vtc scc acc ate tee ect 542 Ser Asp Phe Oltt Asn Tyr Ile Lys Thr Ue Ser Thr Thr lie Ser Pr o 145 ise 155 cta cfct etc att ccc taa etctetgetg ââtatggggt tggtgtcete S90 Leu Leu Leu He Pr o * 160 «50 no no ruj 875 âtctaateaa tacctacaag agatggctgt aaatcfcattg gggaaeaaaa tgatgtcetg ctafcfceecat geatcfccgtE ccaggtttgt gtttcettaa tcatçataat teagetettg geeiâ te tggg c tt-ca cago & tcagctecgc cecttgaac* tgtttcfcfcta cttatcctgfc aataaaatgc «gagacatgt âgagcattct g-ctottcttt tgagttaacc ttgctfctcçe tgaccgfcggc cccaaat1 tg tctecgaaga tgttttgtga teta a <210> 3
<211> 161 <212 > FRT <213> Homo sapiens <220> 238 <221> VARIANTE <222> 127 <223> 10-36-164: aminoácido polimórfico Vai ou Ile <4ό8> a «et Asp Gin Glu Thr Val Gly Val Val Leu Leu ÍU>ãl Ile Val Thr 1 5 10 15 Leu Ile Ser Vâi Vai 61 o Asm Gly Lhõ Phe Ala Bis Ly s Val Gl.a H.i8 20 25 jtO Olu $«r Arg Thr Cln ÃS» 6iy Arg Ser Phs Sln Arg Thr Siy Thr Leu 25 46 43 Alá Phé Gla Arg Val Tyr Thr Asa Gin Asrs Cys Val Aap Ale Tyr 50 55 SO ÍTO Xht Aiõ Val Lesi ftp Ser Ala Gly 15 Leu Leu Cys Ser Gin vai ? ro Ala Phs Oly LSU «et Tyc Leu Ffee Val Arg Gin Lys S3 95 Τγτ· Phê vai Tyr Leu Gly 81u A?g Thr Gin Thr Aro Gly Tyr 100 1.05 na Ile Phe Gly Lys Arg lis Ile LÊ Pha Leu Fhe Leu «et Ser Val Ala 115 130 123 Giy U« Pha Aan Tyr Tyr xis Vós Fhe Phe Gly Ser Asp Phe Glu ISO 13 S 5.4 § Asn Tyr Ile Lys Tbr Ilè Ser Thr Thr lie Ser Pre h&Kk Leu Leu Ile
14$ 150 15S ISO
Pro <210 > 4 «2ll> 46 <212* mh <213> Homo sapiens <40Q> 4 ctacactgcc aagfcgagtcc taaacctgafc gttgctaata agtggg 46
<21Ô> 5 <211> 46 <212> DBA <213> Homo sapiens <4 00> 5 ctacactgcc aagtgagtcc caacçetgat gttgctaata agtggg 46
<210* S <2ii> ig <212> DNA <213> Homo sapiens <400> 6 ggacatttag ggttgcttg 3.9 <210> 7 <211-- 19
<212:. DWA <213> Homo sapiens <40ϋ> i tgttttgaea ctagcactc < 210 > 8 <211? 19
<212> DBA <213> Homo sapiens <400 > 8 actgCCâagt gagtcctaa <210? 9 <311? 48 <212 > Wh <213> Homo sapiens <400> 9 ctgactagga eetctgattc ttctcfcccct gagcfcttgaa ggctctga
<210> 10 <211> 48 <212> DMA <213> Homo sapiens <400? 10 ctgaecagga cetccgattc tfcctttccct gagctttgaa ggctctga
<210? 11 <211? 18 <212? DKA <213> Homo sapiens <400 > 11 gâággttctc aggfcttçe
<210? <2X1? < 2 ! 2 > <213> Homo sapiens <400? 12 agctgtatct tcagagcc
<210? 13 <211? 19 <212? DSA <213> Homo sapiens «40ϋ> 13 taggacctct gattctccc <210? 14: <211> 18 <212> DMA <213> Homo sapiens 240 <220> <221> ligaçao misturada <222> 1..18 <223> oligonucleótido de sequenciação "Primer"PU <400> 14 tgtaaaacga eggecagt 18
<210» 15 <211» 18 <2l2» DKA <213> Homo sapiens <220> <221> ligação misturada <222> 1..18 <223> oligonucleótido de sequenciação "Primer"RP <400» 15 câgga&acag ctatgacc 18
Lisboa, 20 de Novembro de 2006

Claims (33)

1 REIVINDICAÇÕES 1. Método de genotipagem compreendendo determinar a identidade de um nucleótido num marcador bialélico relacionado com o FLAP da ID SEQ N° 1, respectivo complemento ou marcadores bialélicos em desequilíbrio de ligação com aquele, numa amostra biológica, em que esse marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste nos marcadores bialélicos nas posições 3950, 4243, 4312, 4490, 4670, 4687, 4968, 5140, 5213, 5364, 5594, 6370, 6693, 6763, 7445, 7870, 16288, 16347, 16383, 16440, 24361, 28336, 28368, 36183, 36509, 38681, 42440 e 42445 da ID SEQ N° 1.
2. Método de acordo com a Reivindicação 1, em que essa amostra biológica é derivada de um único sujeito.
3. Método de acordo com a Reivindicação 2, em que a identidade dos nucleótidos nesse marcador bialélico é determinada para ambas as cópias desse marcador bialélico presente no genoma desse indivíduo.
4. Método de acordo com a Reivindicação 1, em que essa amostra biológica é derivada de múltiplos sujeitos.
5. Método de acordo com a Reivindicação 1, compreendendo suplementarmente amplificar uma porção dessa sequência compreendendo o marcador bialélico antes do referido passo de determinação.
6. Método de acordo com a Reivindicação 5, em que essa amplificação é efectuada por PCR.
7. Método de acordo com qualquer uma das Reivindicações 1 até 6, em que essa determinação é efectuada por um ensaio seleccionado do grupo que consiste num ensaio de hibridização, um ensaio de sequenciação, um ensaio de 2 microssequenciação e um ensaio de detecção de emparelhamentos defeituosos à base de enzima.
8. Método para estimar a frequência de um alelo de um marcador bialélico relacionado com o FLAP numa população de controlo ou positiva para asma, compreendendo: a) genotipagem de indivíduos dessa população quanto ao referido marcador bialélico de acordo com qualquer uma das Reivindicações 1 até 7, e b) determinar a representação proporcional desse marcador bialélico nessa população.
9. Método para detectar uma associação entre um genótipo e um fenótipo, compreendendo os passos seguintes: a) determinar a frequência de pelo menos um marcador bialélico relacionado com o FLAP numa população positiva para asma de acordo com o método da Reivindicação 8; b) determinar a frequência de pelo menos um marcador bialélico relacionado com o FLAP numa população de controlo de acordo com o método da Reivindicação 8, e c) determinar se existe uma associação estatisticamente significativa entre esse genótipo e esse fenótipo.
10. Método para estimar a frequência de um haplótipo para um conjunto de marcadores bialélicos numa população de controlo ou positiva para asma, compreendendo: a) genotipagem de pelo menos um marcador bialélico relacionado com o FLAP de acordo com a Reivindicação 3 para cada indivíduo nessa população; b) genotipagem de um segundo marcador bialélico por determinação da identidade dos nucleótidos nesse segundo marcador bialélico para ambas as cópias desse segundo marcador bialélico presente no genoma de cada indivíduo da referida população, e 3 g) aplicação de um método de determinação de haplótipos às identidades dos nucleótidos determinados nos passos a) e b), para obter uma estimativa dessa frequência.
11. Método de acordo com a Reivindicação 10, cujo método de determinação de haplótipos é seleccionado do grupo que consiste em amplificação por PCR assimétrica, amplificação por PCR dupla de alelos específicos, o algoritmo de Clark ou um algoritmo de maximização da expectativa.
12. Método para detectar uma associação entre um haplótipo e uma característica de asma, compreendendo os passos seguintes: a) estimar a frequência de pelo menos um haplótipo numa população positiva para asma de acordo com o método da Reivindicação 10; b) estimar a frequência desse haplótipo numa população de controlo de acordo com o método da Reivindicação 10, e c) determinar se existe uma associação estatisticamente significativa entre esse haplótipo e essa característica de asma.
13. Método de acordo com a Reivindicação 9, cujos passos de genotipagem a) e b) são efectuados numa única amostra biológica reunida derivada de cada uma das referidas populações.
14. Método de acordo com a Reivindicação 9, cujos passos de genotipagem a) e b) são efectuados separadamente em amostras biológicas derivadas de cada indivíduo das referidas populações.
15. Método de acordo com qualquer uma das Reivindicações 9 ou 12, em que essa população de controlo é uma população negativa para asma. 4
16. Método de acordo com qualquer uma das Reivindicações 9 ou 12, em que essa população de controlo é uma população aleatória.
17. Método para determinar se um indivíduo está em risco de desenvolver asma, compreendendo: a) genotipagem de pelo menos um marcador bialélico relacionado com o FLAP de acordo com qualquer uma das Reivindicações 1 até 7, e b) correlação do resultado do passo a) com um risco de desenvolver asma.
18. Método de acordo com as Reivindicações 1 até 17, cujo marcador bialélico relacionado com o FLAP é seleccionado da seguinte lista de marcadores bialélicos nas posições 4670, 16347, 16440, 28336, 28368, 38681 e 42445 da ID SEQ N° 1.
19. Método de acordo com a Reivindicação 18, cujo marcador bialélico relacionado com o FLAP é o marcador bialélico na posição 28368 da ID SEQ N° 1.
20. Utilização de um polinucleótido compreendendo uma extensão contígua de pelo menos 12 nucleótidos da ID SEQ N° 1, respectiva sequência complementar ou marcadores bialélicos em desequilíbrio de ligação com aquela, para determinar a identidade do nucleótido num marcador bialélico relacionado com o FLAP, em que esse marcador bialélico relacionado com o FLAP é seleccionado do grupo que consiste nos marcadores bialélicos nas posições 3950, 4243, 4312, 4490, 4670, 4687, 4968, 5140, 5213, 5364, 5594, 6370, 6693, 6763, 7445, 7870, 16288, 16347, 16383, 16440, 24361, 28336, 28368, 36183, 36509, 38681, 42440 e 42445 da ID SEQ N° 1.
21. Utilização de acordo com a Reivindicação 20 num ensaio de microssequenciação, em que a extremidade 3' dessa 5 extensão contígua está localizada na extremidade 3' desse polinucleótido e em que a extremidade 3' desse polinucleótido está localizada 1 nucleótido a montante desse marcador bialélico relacionado com o FLAP nessa sequência.
22. Utilização de acordo com a Reivindicação 20 num ensaio de hibridização, em que essa extensão inclui esse marcador bialélico relacionado com o FLAP.
23. Utilização de acordo com a Reivindicação 20 num ensaio de amplificação específica, em que a extremidade 3' dessa extensão contígua está localizada na extremidade 3' desse polinucleótido e em que esse marcador bialélico relacionado com o FLAP está presente na extremidade 3' desse polinucleótido.
24. Utilização de acordo com a Reivindicação 20 num ensaio de sequenciação, em que a extremidade 3' dessa extensão contígua está localizada na extremidade 3' desse polinucleótido.
25. Utilização de acordo com as Reivindicações 20 até 24, cujo marcador bialélico relacionado com o FLAP é um marcador bialélico seleccionado do grupo que consiste nos marcadores bialélicos nas posições 4670, 16347, 16440, 28336, 28368, 38681 e 42445 da ID SEQ N° 1.
26. Utilização de acordo com a Reivindicação 25, cujo marcador bialélico relacionado com o FLAP é o marcador bialélico na posição 28368 da ID SEQ N° 1.
27. Polinucleótido isolado, purificado ou recombinante compreendendo uma extensão contígua de pelo menos 25 nucleótidos da ID SEQ N° 1, respectiva sequência complementar ou marcadores bialélicos em desequilíbrio de ligação com aquela, cuja extensão contígua compreende: 6 - um nucleótido seleccionado do grupo que consiste num A na posição 7445, um A na posição 7870, um A na posição 16383, um T na posição 24361, um G na posição 28336, um T na posição 28368, um A na posição 36183 e um G na posição 36509 da ID SEQ N° 1.
28. Polinucleótido isolado, purificado ou recombinante compreendendo uma extensão contígua de pelo menos 25 nucleótidos da ID SEQ N° 2, respectiva sequência complementar ou marcadores bialélicos em desequilíbrio de ligação com aquela, cuja extensão contígua compreende um A na posição 453 ou um G na posição 779 da ID SEQ N° 2.
29. Polinucleótido isolado, purificado ou recombinante que codifica um polipéptido compreendendo uma extensão contígua de pelo menos 6 aminoácidos da ID SEQ N° 3, em que essa extensão contígua inclui um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3.
30. Vector recombinante compreendendo um polinucleótido de acordo com qualquer uma das Reivindicações 27 até 29.
31. Célula hospedeiro compreendendo um vector recombinante de acordo com a Reivindicação 30.
32. Polipéptido isolado, purificado ou recombinante compreendendo uma extensão contígua de pelo menos 6 aminoácidos da ID SEQ N° 3, em que essa extensão contígua inclui um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3.
33. Composição de anticorpos isolados ou purificados capazes de se ligarem selectivamente a um fragmento contendo um epítopo de um polipéptido de acordo com a Reivindicação 32, em que esse epítopo compreende um resíduo isoleucina na posição de aminoácido 127 da ID SEQ N° 3. Lisboa, 20 de Novembro de 2006
PT99913538T 1998-04-15 1999-04-15 Sequência genómica da proteína activadora da 5- lipoxigenase ( flap), seus marcadores polimórficos e métodos para a detecção de asma PT1071710E (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8189398P 1998-04-15 1998-04-15
US9131498P 1998-06-30 1998-06-30
US12340699P 1999-03-08 1999-03-08

Publications (1)

Publication Number Publication Date
PT1071710E true PT1071710E (pt) 2007-01-31

Family

ID=27374096

Family Applications (1)

Application Number Title Priority Date Filing Date
PT99913538T PT1071710E (pt) 1998-04-15 1999-04-15 Sequência genómica da proteína activadora da 5- lipoxigenase ( flap), seus marcadores polimórficos e métodos para a detecção de asma

Country Status (11)

Country Link
US (4) US6531279B1 (pt)
EP (1) EP1071710B2 (pt)
JP (1) JP4472173B2 (pt)
AT (1) ATE342918T1 (pt)
AU (1) AU768721B2 (pt)
CA (1) CA2321226C (pt)
DE (1) DE69933661T3 (pt)
DK (1) DK1071710T4 (pt)
ES (1) ES2272061T5 (pt)
PT (1) PT1071710E (pt)
WO (1) WO1999052942A2 (pt)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1071710T4 (da) * 1998-04-15 2011-12-12 Merck Serono Biodevelopment Genomisk sekvens for 5-lipoxygenase-aktiveringsproteinet (FLAP), polymorfe markører deri og fremgangsmåder til påvisning af astma
US6537751B1 (en) * 1998-04-21 2003-03-25 Genset S.A. Biallelic markers for use in constructing a high density disequilibrium map of the human genome
US6986987B1 (en) * 1998-07-24 2006-01-17 The Uab Research Foundation Genetic polymorphism in the receptor for IgA
CA2362586A1 (en) * 1999-02-12 2000-08-17 Genset S.A. Biallelic markers derived from genomic regions carrying genes involved in arachidonic acid metabolism
EP1236803A4 (en) * 1999-11-30 2003-05-02 Asahi Breweries Ltd METHOD FOR EVALUATING THE FLAKE OUT PROPERTIES OF LOW BREWER'S YEAST
US20020077775A1 (en) * 2000-05-25 2002-06-20 Schork Nicholas J. Methods of DNA marker-based genetic analysis using estimated haplotype frequencies and uses thereof
US7205146B1 (en) * 2000-06-14 2007-04-17 Oscient Pharmaceuticals Corporation Nucleotide and amino acid sequences relating to respiratory diseases and obesity
CN1329012A (zh) * 2000-06-21 2002-01-02 上海博德基因开发有限公司 一种新的多肽——烟酰胺腺嘌呤脱氧二核苷酸依赖性白三烯b412-羟基脱氢酶36和编码这种多肽的多核甘酸
BR0113759A (pt) * 2000-09-08 2005-05-10 Univ Iowa State Res Found Inc Alelos prkag3 e uso dos mesmos como marcadores genéticos para traços de qualidade de carne e de reprodução
DE60126307T2 (de) * 2000-10-31 2007-12-27 Michel Alphonse Julien Georges Marker-unterstützte auswahl von rindvieh für verbesserte milchproduktion unter verwendung des diacylglycerin-acyltransferase-gens dgat1
EP1352970B1 (en) * 2000-12-12 2010-06-02 Nagoya Industrial Science Research Institute Method of estimating the risk of expression of adverse drug reaction caused by the administration of a compound, which is either metabloized per se by ugt1a1 or whose intermediate is metabolized by the enzyme
FI114483B (fi) * 2001-02-20 2004-10-29 Jurilab Ltd Oy Menetelmä kohonneen verenpaineen riskin osoittamiseksi ja sen käytöt
US7271240B2 (en) 2001-03-14 2007-09-18 Agensys, Inc. 125P5C8: a tissue specific protein highly expressed in various cancers
AU785425B2 (en) 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
US7115726B2 (en) * 2001-03-30 2006-10-03 Perlegen Sciences, Inc. Haplotype structures of chromosome 21
DE60213783D1 (de) * 2001-04-19 2006-09-21 Hubit Genomix Inc Verfahren zur abschätzung des diplotyps aus dem genotyp eines individuums
US7335469B2 (en) * 2001-10-01 2008-02-26 Mt. Sinai School Of Medicine Of New York University Methods for diagnosing Noonan syndrome
TWI329105B (en) * 2002-02-01 2010-08-21 Rigel Pharmaceuticals Inc 2,4-pyrimidinediamine compounds and their uses
US7585956B2 (en) * 2002-03-04 2009-09-08 The Texas A & M University System Quantitative trait loci and somatostatin
US7579147B2 (en) * 2002-05-07 2009-08-25 Wake Forest University Health Sciences Mutations in the macrophage scavenger receptor 1 gene alter risk of prostate cancer, asthma, and cardiovascular disease
WO2004016733A2 (en) * 2002-08-16 2004-02-26 Agensys, Inc. Nucleic acid and corresponding protein entitled 251p5g2 useful in treatment and detection of cancer
DE60321356D1 (de) * 2002-08-30 2008-07-10 Oncotherapy Science Inc Verfahren zur diagnostik von eierstock endometriose
US20060019269A1 (en) * 2002-10-17 2006-01-26 Decode Genetics, Inc. Susceptibility gene for myocardial infarction, stroke, and PAOD, methods of treatment
CA2502357A1 (en) * 2002-10-17 2004-04-29 Decode Genetics Ehf. Susceptibility gene for myocardial infarction; methods of treatment
US7507531B2 (en) * 2002-10-17 2009-03-24 Decode Genetics Chf. Use of 5-lipoxygenase activating protein (FLAP) gene to assess susceptibility for myocardial infarction
US7851486B2 (en) * 2002-10-17 2010-12-14 Decode Genetics Ehf. Susceptibility gene for myocardial infarction, stroke, and PAOD; methods of treatment
AU2003290527A1 (en) * 2002-10-17 2004-05-04 Decode Genetics Ehf. Susceptibility gene for myocardial infarction
US20080293750A1 (en) * 2002-10-17 2008-11-27 Anna Helgadottir Susceptibility Gene for Myocardial Infarction, Stroke, Paod and Methods of Treatment
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
US7803538B2 (en) * 2003-06-20 2010-09-28 Aventis Pharma Sa Method for detecting Alzheimer's disease
CN1849318B (zh) * 2003-07-30 2011-10-12 里格尔药品股份有限公司 用2,4-嘧啶二胺化合物预防和治疗自体免疫疾病的方法
WO2005027719A2 (en) 2003-09-12 2005-03-31 Perlegen Sciences, Inc. Methods and systems for identifying predisposition to the placebo effect
CA2539276A1 (en) * 2003-09-17 2005-03-31 Decode Genetics Ehf. Methods of preventing or treating recurrence of myocardial infarction
US20100216863A1 (en) * 2004-01-30 2010-08-26 Decode Genetics Ehf. Susceptibility Gene for Myocardial Infarction, Stroke, and PAOD; Methods of Treatment
US8158362B2 (en) * 2005-03-30 2012-04-17 Decode Genetics Ehf. Methods of diagnosing susceptibility to myocardial infarction and screening for an LTA4H haplotype
JP2007315752A (ja) * 2004-08-16 2007-12-06 Ajinomoto Co Inc 肝線維化ステージの判定方法
WO2007053844A2 (en) * 2005-10-31 2007-05-10 Rigel Pharmaceuticals, Inc. Compositions and methods for treating inflammatory disorders
US8399666B2 (en) 2005-11-04 2013-03-19 Panmira Pharmaceuticals, Llc 5-lipoxygenase-activating protein (FLAP) inhibitors
US7977359B2 (en) 2005-11-04 2011-07-12 Amira Pharmaceuticals, Inc. 5-lipdxygenase-activating protein (FLAP) inhibitors
GB2431927B (en) 2005-11-04 2010-03-17 Amira Pharmaceuticals Inc 5-Lipoxygenase-activating protein (FLAP) inhibitors
US20080091730A1 (en) * 2006-09-29 2008-04-17 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US20080082583A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US10546652B2 (en) 2006-09-29 2020-01-28 Gearbox Llc Computational systems for biomedical data
US10095836B2 (en) * 2006-09-29 2018-10-09 Gearbox Llc Computational systems for biomedical data
US20080082359A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of State Of Delaware Computational systems for biomedical data
US20080082364A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US20080082584A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US20080082367A1 (en) * 2006-09-29 2008-04-03 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US20080082271A1 (en) * 2006-09-29 2008-04-03 Searete Llc Computational systems for biomedical data
US20080082306A1 (en) * 2006-09-29 2008-04-03 Searete Llc Computational systems for biomedical data
US20080109484A1 (en) * 2006-09-29 2008-05-08 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Computational systems for biomedical data
US8122073B2 (en) * 2006-09-29 2012-02-21 The Invention Science Fund I Computational systems for biomedical data
US10068303B2 (en) 2006-09-29 2018-09-04 Gearbox Llc Computational systems for biomedical data
US7853626B2 (en) 2006-09-29 2010-12-14 The Invention Science Fund I, Llc Computational systems for biomedical data
US10503872B2 (en) * 2006-09-29 2019-12-10 Gearbox Llc Computational systems for biomedical data
JP2010511632A (ja) 2006-11-30 2010-04-15 アミラ ファーマシューティカルス,インコーポレーテッド 5−リポキシゲナーゼ活性化タンパク質インヒビターおよび一酸化窒素モジュレーターを含んでいる組成物および治療法
TW200920369A (en) * 2007-10-26 2009-05-16 Amira Pharmaceuticals Inc 5-lipoxygenase activating protein (flap) inhibitor
WO2009057640A1 (ja) * 2007-10-29 2009-05-07 Riken Brca1 関連タンパク質(brap)遺伝子内一塩基多型を用いた炎症性疾患の判定方法
WO2010068311A1 (en) 2008-05-23 2010-06-17 Amira Pharmaceuticals, Inc. 5-lipoxygenase-activating protein inhibitor
US8546431B2 (en) 2008-10-01 2013-10-01 Panmira Pharmaceuticals, Llc 5-lipoxygenase-activating protein (FLAP) inhibitors
US8568980B2 (en) 2009-01-27 2013-10-29 Mount Sinai School Of Medicine Nucleic acids, methods and kits for the diagnosis of DYT6 primary torsion dystonia
WO2011150228A1 (en) * 2010-05-26 2011-12-01 The Children's Hospital Of Philadelphia Research Institute Compositions and methods for the diagnosis and treatment of primary insulin-like growth factor deficiency (pigfd) and idiopathic short stature (iss)
TW202344270A (zh) 2010-09-29 2023-11-16 美商艾澤西公司 與191p4d12蛋白結合之抗體藥物共軛物(adc)
EP2865756A1 (en) 2013-10-22 2015-04-29 Sylentis, S.A.U. siRNA and their use in methods and compositions for inhibiting the expression of the FLAP gene.
DK3102209T3 (da) 2014-02-04 2021-07-12 Bioscience Pharma Partners Llc Anvendelse af flap-hæmmere til at reducere neuroinflammationsmedieret læsion i centralnervesystemet
WO2017098915A1 (ja) * 2015-12-11 2017-06-15 国立大学法人高知大学 膵がん及び膵管内乳頭粘液性腫瘍のマーカー
KR102527520B1 (ko) * 2020-09-16 2023-05-03 순천대학교 산학협력단 직업성 천식 진단용 조성물 및 이를 이용한 직업성 천식 진단방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2032253C (en) 1989-12-15 2000-11-28 John W. Gillard 5-lipoxygenase activating protein
US5182367A (en) 1990-11-30 1993-01-26 Merck & Co., Inc. 5-lipoxygenase activating protein
US5578443A (en) * 1991-03-06 1996-11-26 Regents Of The University Of Minnesota DNA sequence-based HLA typing method
EP0714410A4 (en) * 1993-07-26 1997-08-20 K O Technology Inc GENE ALTERNATIVE ALLEH INHIBITORS USED AS A BASE FOR THERAPEUTIC AGENTS AGAINST CANCER
US5696076A (en) * 1994-06-22 1997-12-09 Human Genome Sciences, Inc. 5-lipoxygenase-activating protein II
EP0896633A2 (en) * 1996-05-06 1999-02-17 Brigham And Women's Hospital 5-lipoxygenase gene polymorphisms and their use in classifying patients
DK1071710T4 (da) * 1998-04-15 2011-12-12 Merck Serono Biodevelopment Genomisk sekvens for 5-lipoxygenase-aktiveringsproteinet (FLAP), polymorfe markører deri og fremgangsmåder til påvisning af astma

Also Published As

Publication number Publication date
DK1071710T3 (da) 2007-02-19
US20070003971A1 (en) 2007-01-04
JP2002511242A (ja) 2002-04-16
CA2321226A1 (en) 1999-10-21
ATE342918T1 (de) 2006-11-15
JP4472173B2 (ja) 2010-06-02
WO1999052942A3 (en) 2000-02-03
CA2321226C (en) 2011-06-07
US20090155806A1 (en) 2009-06-18
EP1071710B2 (en) 2011-11-02
US6531279B1 (en) 2003-03-11
DE69933661T2 (de) 2007-08-23
WO1999052942A2 (en) 1999-10-21
DK1071710T4 (da) 2011-12-12
ES2272061T5 (es) 2012-02-24
AU768721B2 (en) 2004-01-08
US7838241B2 (en) 2010-11-23
US7494777B2 (en) 2009-02-24
US7118869B2 (en) 2006-10-10
DE69933661D1 (de) 2006-11-30
ES2272061T3 (es) 2007-04-16
EP1071710B1 (en) 2006-10-18
US20050196752A1 (en) 2005-09-08
EP1071710A2 (en) 2001-01-31
AU3164499A (en) 1999-11-01
DE69933661T3 (de) 2012-01-26

Similar Documents

Publication Publication Date Title
PT1071710E (pt) Sequência genómica da proteína activadora da 5- lipoxigenase ( flap), seus marcadores polimórficos e métodos para a detecção de asma
EP0991770B1 (en) Prostate cancer gene
US20020165345A1 (en) Prostate cancer gene
US7427482B2 (en) Methods of assessing the risk for the development of sporadic prostate cancer
US20060166259A1 (en) APM1 biallelic markers and uses thereof
AU2567000A (en) Biallelic markers derived from genomic regions carrying genes involved in arachidonic acid metabolism
JP2002519027A (ja) 網膜芽腫結合タンパク質(rbp−7)をコードする核酸および前記核酸に関連する多型マーカー
EP1218537B1 (en) Biallelic markers related to genes involved in drug metabolism
US7189833B2 (en) Prostate cancer gene
EP1052292B1 (en) Prostate cancer gene
WO2001032868A1 (en) Apm1 biallelic markers and uses thereof