ES2376586T3 - Método de identificación de un �?cido nucleico que codifica una estructura tipo hemopexina que se une de forma espec�?fica a una molécula diana predeterminada. - Google Patents

Método de identificación de un �?cido nucleico que codifica una estructura tipo hemopexina que se une de forma espec�?fica a una molécula diana predeterminada. Download PDF

Info

Publication number
ES2376586T3
ES2376586T3 ES06700410T ES06700410T ES2376586T3 ES 2376586 T3 ES2376586 T3 ES 2376586T3 ES 06700410 T ES06700410 T ES 06700410T ES 06700410 T ES06700410 T ES 06700410T ES 2376586 T3 ES2376586 T3 ES 2376586T3
Authority
ES
Spain
Prior art keywords
sequence
dna
sequence identifier
polypeptide
prt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06700410T
Other languages
English (en)
Inventor
Martin Lanzendoerfer
Michael Schraeml
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Application granted granted Critical
Publication of ES2376586T3 publication Critical patent/ES2376586T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6489Metalloendopeptidases (3.4.24)
    • C12N9/6491Matrix metalloproteases [MMP's], e.g. interstitial collagenase (3.4.24.7); Stromelysins (3.4.24.17; 3.2.1.22); Matrilysin (3.4.24.23)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Toxicology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Método para identificar un ácido nucleico que codifica un polipéptido que se une específicamente a una molécula diana predeterminada de una biblioteca de ADN, caracterizado porque dicho método comprende las etapas de a) seleccionar la secuencia del identificador de secuencia nº:2 b) preparar una biblioteca de ADN de la secuencia seleccionada en la cual al menos está alterada una posición de aminoácido según la tabla V; c) cribar en la biblioteca de ADN preparada los polipéptidos que se unen específicamente a una molécula diana predeterminada; d) seleccionar el ácido nucleico que codifica uno de los elementos con capacidad de unión específica de la etapa c); e) repetir las etapas b) a d) entre dos y cinco veces; y f) aislar dicho ácido nucleico que codifica un polipéptido que se une específicamente a una molécula diana predeterminada.

Description

Método de identificación de un ácido nucleico que codifica una estructura tipo hemopexina que se une de forma específica a una molécula diana predeterminada
La presente invención se refiere a un método para la identificación de un ácido nucleico que codifica un polipéptido que posee propiedades de unión específica a una molécula diana predeterminada que no son inherentes de forma natural a dicho polipéptido. También se describe un proceso para la optimización de la especificidad de unión y un proceso de producción. La invención da a conocer además un método para la identificación y modificación de posiciones de aminoácido alterables dentro de un andamiaje polipeptídico.
Antecedentes técnológicos
En los últimos años, el número de solicitudes de patente y publicaciones relacionadas con reactivos de afinidad ha aumentado de forma constante. La mayoría de las mismas está en relación con anticuerpos, es decir inmunoglobulinas monoclonales o policlonales. Solamente una pequeña parte se refiere a alternativas posibles. Una de estas es la utilización de andamiajes de proteínas. Este concepto requiere una arquitectura proteica estable que tolere múltiples sustituciones o inserciones a nivel de su estructura primaria (Nygren, P-A., Skerra, A., J. Immun. Meth. 290 (2004) 3-28).
Los andamiajes de proteínas modificados pueden superar los problemas existentes y extender el área de aplicación de los reactivos de afinidad. Un problema entre muchos otros es la aplicación intracelular de anticuerpos. El obstáculo de esta tecnología de bloqueo de proteínas es que no todos los anticuerpos expresados dentro de las células funcionan bien. Este problema se denomina “problema del enlace disulfuro”. Para superar este problema deben realizarse experimentos que requieren mucho tiempo para optimizar un listado complejo de parámetros (Visintin, M., y otros, J. Immun. Meth. 290 (2004) 135-153).
En este sentido, las proteínas poseen diversas ventajas. Entre ellas están su bajo peso molecular, la facilidad de producción por microorganismos, la simplicidad para ser modificadas y una aplicabilidad amplia. En este contexto se han descrito diversos andamiajes de proteínas, por ejemplo las proteínas dedos de zinc para el reconocimiento del ADN (Segal, D.J., y otros, Biochem. 42 (2003) 2137-2148); aptámeros a base de tioredoxina modificados mediante la introducción de secuencias de polipéptidos variables en el bucle del centro activo (Klevenz, B., y otros Cell. Mol. Life Sci. 59 (2002) 1993-1998); la proteína A como andamiaje “aficuerpo” (Sandström K y otros, Prot. Eng. 16 (2003) 691-697; Andersson, M., y otros., J. Immun. Meth. 283 (2003) 225-234); moléculas ARNm-proteína del décimo dominio de fibronectina de tipo III (Xu, L., y otros, Chem. Biol. 9 (2002) 933-942) o moléculas de unión basadas en el inhibidor de la alfa-amilasa (McConnell, S.J., y Hoess, R.H., J. Mol. Biol. 250 (1995) 460-470).
Dos criterios caracterizan de forma substancial un andamiaje de proteínas aplicable. En primer lugar, la proteína debe pertenecer a una familia que posea un núcleo hidrofóbico bien definido. Es beneficioso que exista una relación estrecha entre los miembros de la familia (Skerra, A., J. Mol. Recognit. 13 (2000) 167-187). En segundo lugar, la proteína debe poseer un centro activo o lugar de unión accesible separado espacialmente y funcionalmente independiente. Éste no debe contribuir a la estabilidad intrínseca del núcleo (Predki, P.F., y otros, Nature Struct. Biol. 3 (1996) 54-58). De forma ideal, esta familia de proteínas está involucrada inherentemente en el reconocimiento de múltiples dianas no relacionadas entre sí.
Tal como se describe en Nygren, P-A., y Skerra, A., J. Immun. Meth. 290 (2004) 3-28 se han utilizado diversos andamiajes de proteínas para el desarrollo de proteínas de afinidad novedosas. Estos andamiajes pueden dividirse en tres grupos: (i) bucles de peptídicos únicos, (ii) interfaces de ingeniería y (iii) bucles hipervariables no contiguos.
Con los andamiajes del primer grupo o bien se diversifican aminoácidos individuales en un bucle expuesto o se insertan secuencias de polipéptidos pequeñas en dicho bucle expuesto (ver por ejemplo, Roberts, B.L., y otros, PNAS 89 (1992) 2429-2433 y Gene 121 (1992) 9-16; Röttgen P., y Collins, J., Gene 164 (1995) 243; Lu, Z., y otros, Bio/Technology 13 (1995) 366-372). Una desventaja de este enfoque es que es difícil lograr afinidad, si es que se consigue alguna, frente a una diana completamente nueva (Klevenz, B., y otros, Cell. Mol. Life Sci. 59 (2002) 19931998). Puede modificarse la afinidad de unión intrínseca frente a dianas naturales o dianas altamente relacionadas con éstas, pero difícilmente puede cambiarse la diana o la clase de dianas. Otra desventaja es que en el caso de la inserción de pequeños polipéptidos aleatorizados, debe conocerse la diana y estas secuencias deben generarse previamente sobre la base del conocimiento ya establecido.
Pertenecen a los andamiajes del segundo grupo, por ejemplo, el dominio de unión a inmunoglobulinas de la proteína A estafilocócica (por ejemplo Sandström K., y otros, Prot. Eng. 16 (2003) 691-697), el dominio de unión a celulosa Cterminal de la celobiohidrolasa I del hongo T. reesei (Smith, G.P., y otros, J. Mol. Biol. 277 (1998) 317-322) y las cristalinas gamma (Fiedler, U., y Rudolph, R., WO 01/04144).
La tercera clase está representada por las propias inmunoglobulinas y por el escasamente relacionado dominio de fibronectina tipo III, así como algunas clases de neurotoxinas.
Además de la idoneidad como andamiaje para la generación de características de unión específicas para moléculas diana predeterminadas, deben tenerse en cuenta las condiciones de aplicación. Entre otras cosas deben tenerse en cuenta especialmente la estabilidad, la selectividad, la solubilidad y la producción funcional del polipéptido de afinidad. Como ejemplo, ya mencionado anteriormente, el obstáculo de la tecnología de bloqueo de proteínas es que no todos los anticuerpos expresados como moléculas de afinidad dentro de las células se producen de forma funcional (“problema del enlace disulfuro”, Visintin, M., y otros, J. Immun. Meth. 290 (2004) 135-153).
Por lo tanto, el objetivo de la presente invención es superar estos inconvenientes dando a conocer un andamiaje de polipéptidos alternativo con propiedades de unión específicas frente a una molécula diana predeterminada que no son inherentes de forma natural a dicho polipéptido. Ello comprende la aleatorización de aminoácidos, la optimización de las características de unión y un método de producción del polipéptido optimizado con propiedades de unión específicas.
La patente WO 02/088171 da a conocer métodos para la identificación de dominios de unión con propiedades deseadas mediante el cribado combinatorio de bibliotecas.
Resumen de la invención
La molécula diana predeterminada comprende un miembro de uno de los grupos siguientes: proteínas hedgehog, proteínas morfogénicas óseas, factores de crecimiento, eritropoyetina, trombopoyetina, G-CSF, interleuquinas e interferones.
La presente invención da a conocer un método de identificación de un ácido nucleico que codifica un polipéptido que se une de forma específica a una molécula diana de una biblioteca de ADN, comprendiendo dicho método las etapas de
a) seleccionar la secuencia del identificador de secuencia nº 2;
b) preparar una biblioteca de ADN de la secuencia seleccionada en la cual se altera al menos una posición de
aminoácido según la tabla V;
c) realizar un cribado de la biblioteca de ADN preparada para detectar los polipéptidos codificados que se
unen de forma específica a una molécula diana predeterminada;
d) seleccionar el ácido nucleico que codifica un péptido con capacidad de unión específico identificado en la
etapa c);
e) repetir las etapas b) a d) entre dos y cinco veces; y
f) aislar dicha molécula de ácido nucleico que codifica un polipéptido que se une de forma específica a una
molécula diana predeterminada.
En otra realización, el método para la identificación de un ácido nucleico que codifica un polipéptido que se une de forma específica a una molécula diana de una biblioteca de ADN, comprende elementos de expresión lineales.
En otra realización, la biblioteca del polipéptido se expresa mediante técnicas de presentación (display) ribosomal.
En otra realización, la biblioteca del polipéptido se expresa mediante técnicas de presentación (display) en bacteriófagos.
Descripción detallada de la invención
La presente invención da conocer un método para la identificación de un ácido nucleico que codifica un polipéptido que se une de forma específica a una diana predeterminada a partir de una biblioteca de ADN, tal como se define en la reivindicación 1, y describe un método para la determinación de posiciones de aminoácido alterables en un polipéptido.
El polipéptido puede definirse por su secuencia de aminoácidos y por la secuencia de ADN derivada de la misma.
La utilización de técnicas de ADN recombinante permite la producción de numerosos derivados del polipéptido. Dichos derivados pueden, por ejemplo, modificarse en una o varias posiciones de aminoácidos mediante substitución, alteración o intercambio. La derivatización puede realizarse, por ejemplo, mediante mutagénesis de centros específicos. Dichas variaciones pueden ser realizadas sin dificultad por un experto en la técnica (Sambrook, J., y otros, Molecular Cloning: A laboratory manual (“Clonación molecular; Manual de laboratorio”) (1999) Cold Spring Harbor Laboratory Press, Nueva York, EE.UU.; Hames, B.D., y Higgins, S.G., Nucleic acid hybridization -a practical approach (“Hibridación de ácidos nucleicos – un enfoque práctico”) (1985) IRL Press, Oxford, Inglaterra).
Para la expresión en células huésped eucariotas o procariotas, el ácido nucleico, que codifica la secuencia de aminoácidos del polipéptido, se integra dentro de vectores de expresión adecuados, según métodos conocidos por los expertos en la técnica. Dicho vector de expresión contiene preferentemente un promotor inducible o regulable. A continuación, estos vectores recombinantes se introducen para ser expresados en células huésped adecuadas, tales como, por ejemplo, E. coli como célula huésped procariota o Saccharomyces cerevisiae, células de insecto o célula CHO como células huésped eucariotas, y las células huésped transformadas o transducidas se cultivan bajo condiciones que permiten la expresión del gen heterólogo.
El polipéptido puede aislarse y purificarse tras la producción recombinante mediante métodos conocidos por los expertos en la técnica, por ejemplo, mediante cromatografía de afinidad, utilizando técnicas de purificación de proteínas conocidas, incluyendo la inmunoprecipitación, la filtración en gel, la cromatografía de intercambio iónico, el cromatoenfoque, el enfoque isoeléctrico, la precipitación selectiva, la electroforesis y similares (ver, por ejemplo, Ausubel, I., y Frederick, M., Curr. Prot. Mol. Biol. (1992) John Wiley and Sons Nueva York; Sambrook, J., y otros, Molecular Cloning: A laboratory manual (“Clonación molecular; Manual de laboratorio”) (1999) Cold Spring Harbor Laboratory Press, Nueva York, EE.UU; Hames, B.D., y Higgins, S.G., Nucleic acid hybridization -a practical approach (“Hibridación de ácidos nucleicos – un enfoque práctico”) (1985).
En la presente invención se utilizan las siguientes abreviaturas y definiciones.
Un “polipéptido” es un polímero de aminoácidos unidos mediante enlaces peptídicos, ya sea producido de forma natural o sintética. Los polipéptidos de menos de aproximadamente 20 residuos de aminoácidos pueden denominarse como “péptidos”; los polipéptidos de más de aproximadamente 100 residuos de aminoácidos pueden denominarse “proteínas”.
El término “dominio tipo hemopexina” (PEX) significa un polipéptido que muestra homología en secuencia y estructura a la proteína sanguínea hemopexina. Este dominio posee una secuencia media de aproximadamente 200 aminoácidos y está formado por cuatro subdominios que se repiten.
La abreviatura “PEX2” significa el dominio C-terminal de la metaloproteinasa de matriz 2 humana, que comprende las posiciones de aminoácido 466 a 660 de la proteína completa.
El término “secuencia de consenso” significa una secuencia deducida, ya sea de nucleótidos o aminoácidos. Esta secuencia representa una serie de secuencias similares. Cada posición en la secuencia de consenso corresponde a la base o aminoácido más frecuente en dicha posición que se determina por la alineación de tres o más secuencias.
El término “alterar” significa un proceso en el cual se modifica una posición definida en una secuencia, ya sea de ácidos nucleicos o aminoácidos. Este proceso comprende la substitución de un aminoácido o ácido nucleico (nucleótido) por un aminoácido o ácido nucleico (nucleótido) diferente así como la deleción o la inserción.
La expresión “polipéptido que se une a una molécula” significa un polipéptido que posee la capacidad de unirse a una molécula diana. El término “se une de forma específica” significa una actividad de unión con una constante de afinidad superior a 10 E 7 (107) litros/mol.
La expresión “molécula diana predeterminada” significa una molécula que es un miembro de los grupos de proteínas siguientes, proteínas hedgehog, proteínas morfogénicas óseas, factores de crecimiento, eritropoyetina, trombopoyetina, G-CSF, interleuquinas e interferones, inmunoglobulinas, enzimas, inhibidores, activadores y proteínas de la superficie celular.
El término “vector de expresión” o “vector” significa una secuencia de ADN natural o artificial que comprende al menos una secuencia de ácidos nucleicos que codifica una secuencia de aminoácidos de un polipéptido, una secuencia promotor, una secuencia de finalizador, un marcador de selección y un origen de replicación.
El término “molécula de ácido nucleico” o “ácido nucleico” significa una molécula de polinucleótido que puede ser, por ejemplo, ADN, ARN o derivados de los mismos. Debido a la degeneración del código genético, secuencias de ácidos nucleicos diferentes codifican el mismo polipéptido. Estas variaciones también se incluyen.
El término “aminoácido” significa alanina (código de tres letras: ala, código de una letra: A), arginina (arg, R), asparagina (asn, N), ácido aspártico (asp, D), cisteína (cys, C), glutamina (gln, Q), ácido glutámico (glu, E), glicina (gli, G), histidina (his, H), isoleucina (ile, I), leucina (leu, L), lisina (lys, K), metionina (met, M), fenilalanina (phe, F), prolina (pro, P), serina (ser, S), treonina (thr, T) triptófano (trp, W), tirosina (tyr, Y) y valina (val, V).
El término “valor de diversidad de aminoácidos” significa el número de aminoácidos diferentes presentes en una posición específica de una secuencia de aminoácidos. Este valor se determina mediante la alineación de secuencias de un conjunto de secuencias de polipéptidos homólogos en estructura y/o función obtenidas del mismo y/o de diferentes organismos con respecto a una secuencia de consenso o referencia e identificando el número total de aminoácidos diferentes presentes en todas las secuencias alineadas en una posición específica.
El término “alineación” significa el proceso de alinear dos o más secuencias para conseguir los niveles máximos de identidad y conservación. Comprende la determinación de la homología de posiciones de secuencias moleculares, lo que supone la yuxtaposición de aminoácidos o nucleótidos de moléculas homólogas. Como resultado, las secuencias comparadas se presentan en forma que se muestran las regiones de mayor similitud estadística. Durante este proceso puede hallarse que algunas secuencias no contienen todas las posiciones de otras alineadas, es decir, es posible que haya secuencias que contengan una o más deleciones. Para conseguir los niveles máximos de identidad y conservación pueden introducirse huecos en estas secuencias. Los huecos se indican con guiones en la ilustración de la alineación.
Los términos “PCR de superposición-extensión-empalme” (OEL-PCR) y “elemento de expresión lineal” (LEE) significan un método para empalmar fragmentos de ADN y describen los fragmentos de ADN lineal utilizados en y obtenidos mediante este método (ver, por ejemplo, Ho, S.N., y otros, Gene 77 (1989) 51-59; Kain, K.C., y otros, Biotechniques 10 (1991) 366-374; Shuldiner, A.R., y otros, Anal. Biochem. 194 (1991) 9-15). Se segmenta un tránscrito de un gen en los módulos “módulo promotor”, “módulo gen” y “módulo finalizador”. El módulo promotor codifica la secuencia del promotor de la transcripción del fago T7, una secuencia de control de la traducción (RBS = sitio de unión ribosómico) y la secuencia del potenciador del fago T7 (g10 épsilon) (Lee, S.S., y Kang, C., Kor. Biochem. J. 24 (1991) 673-679). Estas secuencias reguladoras permiten una transcripción y traducción acopladas en un sistema de traducción rápido, por ejemplo RTS 100 E.coli HY System de Roche Applied Sciences, Mannheim, Alemania. El módulo finalizador codifica un códon de parada de la traducción y una secuencia de finalización palindrómica (T7T) del fago T7. Opcionalmente, estos módulos comprenden secuencias de ADN que codifican polipéptidos que pueden utilizarse en procedimientos subsiguientes de marcaje o purificación por afinidad. Los elementos de expresión lineal (Sykes, K.F., y Johnston, S.A., Nature Biotechnol. 17 (1999) 355-359) se unieron a estos módulos mediante una PCR de dos etapas. En una primera PCR estándar utilizando la ADN polimerasa de Pyrococcus woesii (PWO-PCR) se amplifica un marco de lectura abierto sin intrones, es decir un módulo gen, mediante oligonucleótidos cebadores que flanqueadores específicos de secuencia, lo cual introduce secuencias complementarias que se superponen a los módulos promotor y finalizador. El empalme mediante PCR de estos fragmentos de ADN requiere una energía de hibridación libre de las secuencias complementarias, que debe ser inferior a una delta G de -25 kcal/mol. Ello se consigue mediante extensiones de secuencia que poseen una longitud media de 25 bp. Los oligonucleótidos cebadores se diseñan de manera que se hibridan con el molde del gen a una temperatura entre 48ºC y 55ºC. Ello refuerza la utilización de oligonucleótidos con una longitud media de entre 45 bp y 55 bp. Tras 30 ciclos de PCR se transfiere la mezcla de PCR conteniendo aproximadamente 50 ng de ADN del módulo gen alargado a una segunda mezcla de PCR. Esta PCR se suministra con entre 50 y 100 ng de los módulos de ADN promotor y finalizador correspondientes y con cebadores terminales específicos de secuencia. En presencia de ADN polimerasa se alargan enzimáticamente los extremos 3’ de los fragmentos de ADN complementario hibridados (Barik, S., Meth. Mol. Biol. 192 (2002) 185-196) obteniéndose un tránscrito de ADN de longitud complete que comprende los tres módulos.
El término “microorganismo” se refiere a microorganismos procariotas y eucariotas. El “microorganismo” se selecciona preferentemente del grupo formado por cepas de E. coli, cepas de Bacillus subtilis, cepas de Klebsiella, cepas de Salmonella, cepas de Pseudomonas o cepas de Streptomyces y cepas de levaduras. Por ejemplo, las cepas de E. coli comprenden E.coli-K12, UT5600, HB101, XL1, X1776, W3110; las cepas de levaduras comprenden, por ejemplo, Saccharomyces, Pichia, Hansenula, Kluyveromyces y Schizosaccharomyces.
Dos criterios caracterizan substancialmente un andamiaje de proteínas aplicable. En primer lugar, la proteína debe pertenecer a una familia que muestre un núcleo hidrofóbico bien definido. Es beneficioso que exista una relación estrecha entre los miembros de la familia (Skerra, A., J. Mol. Recognit. 13 (2000) 167-187). En segundo lugar, la proteína debe poseer un centro activo o lugar de unión accesible separado espacialmente y funcionalmente independiente. Éste no debe contribuir a la estabilidad intrínseca del núcleo (Predki, P.F., y otros, Nature Struct. Biol. 3 (1996) 54-58). De forma ideal, esta familia de proteínas está involucrada inherentemente en el reconocimiento de diversas dianas no relacionadas entre sí.
El andamiaje de proteínas tipo hemopexina (PEX) cumple estos criterios. Este grupo estructural se halla presente en diversas proteínas y familias de proteínas diferentes, por ejemplo la hemopexina (Altruda, F. y otros, Nucleic Acids Res. 13 (1985) 3841-3859), la vitronectina (Jenne, D., y Stanley, K.K., Biochemistry 26 (1987) 6735-6742) o la albúmina 2 de la semilla de guisante (Jenne, D., Biochem. Biophys. Res. Commun. 176 (1991) 1000-1006).
El análisis de la estructura cristalina de las proteínas que contienen grupos tipo hemopexina muestra que este grupo adopta una topología de hélice beta de 4 láminas (Li, J., y otros, Structure 3 (1995) 541-549; Faber, H.R., y otros, Structure 3 (1995) 551-559). Cada una de las láminas está compuesta de cuatro hojas beta en orientación antiparalela. Conjuntamente forman una cavidad en el centro de la molécula. Las cuatro láminas están unidas entre sí a través de bucles desde la cuarta hebra beta más externa de la lámina precedente a la primera hebra beta más interna de la lámina siguiente. Un enlace disulfuro conecta los extremos terminales de la estructura, es decir la lámina 4 y la lámina 1.
El andamiaje PEX está involucrado en interacciones proteína-proteína y proteína-ligando diferentes pero bastante específicas. Por lo tanto, la estructura tipo hemopexina forma un marco versátil para el reconocimiento molecular (Bode, W., Structure 3 (1995) 527-530). Por ejemplo, se conocen sitios de unión para iones como el calcio, el sodio y el cloro (Libson, A.M., y otros, Nat. Struct. Biol. 2 (1995) 938-942; Gohlke, U., y otros, FEBS Lett. 378 (1996) 126130), así como para la interacción con la fibronectina, TIMP-1/2 (inactivador tisular de las metaloproteinasas de matriz humanas ½), integrinas y heparina (Wallon, U.M., y Overall, C.M., J. Biol. Chem. 272 (1997) 7473-7481; Willenbrock, F., y otros, Biochemistry 32 (1993) 4330-4337; Brooks, P.C., y otros, Cell 92 (1998) 391-400; Bode, W., Structure 3 (1995) 527-530).
5 El dominio de proteína tipo hemopexina ofrece una elevada homología estructural entre los miembros de su familia de proteínas. Se ha notificado, por ejemplo una elevada equivalencia estructural de los dominios hemopexina de, por ejemplo, las metaloproteinasas de matriz 1, 2 y 13 (Gomis-Ruth, F.X., y otros, J. Mol. Biol. 264 (1996) 556-566). Las interacciones predominantemente hidrofóbicas entre las hojas beta adyacentes y orientadas perpendicularmente
10 proporcionan la mayor parte de la estabilidad estructural necesaria (Gomis-Ruth, F.X., y otros, J. Mol. Biol. 264 (1996) 556-566; Fulop, V., y Jones, D.T., Curr. Opin. Struct. Biol. 9 (1999) 715-721.
Recientemente se han utilizado bases de datos de proteínas como SMART (Schultz, J., y otros, PNAS 95 (1998) 5857-5864; Letunic, I., y otros, Nuc. Acids Res. 30 (2002) 242-244) para comparar las secuencias homólogas y los
15 plegamientos proteicos para identificar posiciones de aminoácido no conservadas, y por lo tanto teóricamente alterables, es decir aleatorizables, en marcos de proteínas adecuados (Binz, H.K., y otros, J. Mol. Biol. 332 (2003) 489-503; Forrer, P., y otros, ChemBioChem 5 (2004) 183-189).
Para identificar posiciones de aminoácido potencialmente alterables, es decir aleatorizables, en el plegamiento PEX,
20 se realizó un enfoque similar utilizando la base de datos SMART. Se identificaron en el dominio PEX posiciones de aminoácido que son aleatorizables sin afectar la estructura, la conformación funcional y la estabilidad de las proteínas.
A partir de la base de datos SMART se alinearon 60 dominios PEX, enumerados en la tabla I siguiente, de diferentes 25 especies con la herramienta de bioinformática Pretty (GCG) utilizando la matriz de puntuación blosum 62 El dominio tipo hemopexina es solamente una pequeña parte de proteína de longitud completa. En la siguiente tabla se muestra un listado de la ubicación del dominio tipo hemopexina alineado en las proteínas de longitud completa.
Tabla I: Listado de las 60 proteínas que contienen el dominio PEX
Familia de proteínas
Código del plegamiento PEX en la base de datos PDB Número en la base de datos swissprot Identificador de secuencia del dominio de hemopexina tal como se utiliza en la presente invención (identificador de secuencia nº:)
Factor de ensamblado del peroxisoma
PEX2_mouse PEX2_rat P55098 P24392 03 04
matriz
MM01_Bovin P28053 06
metaloproteinasa 1
MM01_HORSE MM01_human MM01_PIG Q9XSZ5 P03956 P21692 07 08 09
Metaloproteinasa de matriz 2
MM02_chick (pollo) MM02_human MM02_rabbit Q90611 P08253 P50757 02 10 05
Metaloproteinasa de matriz 3
MM03_human MM03_MOUSE MM03_RABIT MM03_RAT P08254 P28862 P28863 P03957 11 12 13 14
Metaloproteinasa de matriz 8
MM08_human MM08_MOUSE MM08_RAT P22894 070138 088766 15 16 17
Metaloproteinasa de matriz 9
MM09_BOVIN MM09_CANFA (canis familiaris, perro) MM09_human MM09_MOUSE P52176 018733 P14780 P41245 18 19 20 21
Metaloproteinasa de matriz 10
MM10_human MM10_MOUSE P09238 055123 22 23
Metaloproteinasa de matriz 11
MM11_human MM11_MOUSE P24347 Q02853 24 25
Metaloproteinasa de matriz 12
MM12_human MM12_MOUSE MM12_RABIT MM12_RAT P39900 P34960 P79227 Q63341 26 27 28 29
Metaloproteinasa de matriz 13
MM13_BOVIN MM13_HORSE MM13_human MM13_RABIT 077656 018927 P45452 062806 30 31 32 33
Metaloproteinasa de matriz 14
MM14_human MM14_mouse MM14_PIG MM14_RABIT MM14_RAT P50281 P53690 Q9XT90 Q95220 Q10739 34 35 36 37 38
Metaloproteinasa de matriz 15
MM15_human MM15_MOUSE P51511 054732 39 40
Metaloproteinasa de matriz 16
MM16_human MM16_MOUSE MM16_RAT P51512 Q9WTR0 035548 41 42 43
Metaloproteinasa de matriz 17
MM17_human MM17_MOUSE Q9ULZ9 Q9R0S3 44 45
Metaloproteinasa de matriz 18
MM18_XENLA (Xenopus laevis, rana Africana de uñas) 013065 46
Metaloproteinasa de matriz 19
MM19_human MM19_MOUSE Q99542 Q9JHI0 47 48
Metaloproteinasa de matriz 20
MM20_BOVIN MM20_human MM20_MOUSE MM20_PIG 018767 060882 P57748 P79287 49 50 51 52
Metaloproteinasa de matriz 24
MM24_human MM24_MOUSE MM24_RAT Q9Y5R2 Q9R0S2 Q99PW6 53 54 55
Metaloproteinasa de matriz 25
MM25_human Q9NPA2 56
Metaloproteinasa de matriz 26
MM28_human Q9H239 57
vitronectina
VTNC_human VTNC_MOUSE VTNC_PIG VTNC_RABIT P04004 P29788 P48819 P22458 58 59 60 61
(Final de la tabla I)
Tabla II: Ubicación de los dominios tipo hemopexina en las proteínas de la tabla I
proteína
Total de aminoácidos de la secuencia Dominio tipo hemopexina
inicio
final
Identificador de secuencia nº: 02
663 469 663
Identificador de secuencia nº: 03
305 97 280
Identificador de secuencia nº: 04
305 97 280
Identificador de secuencia nº: 05
662 468 662
Identificador de secuencia nº: 06
469 275 469
Identificador de secuencia nº: 07
469 275 469
Identificador de secuencia nº: 08
469 275 469
Identificador de secuencia nº: 09
469 275 469
Identificador de secuencia nº: 10
660 466 660
Identificador de
477 287 477
secuencia nº: 11
Identificador de secuencia nº: 12
477 287 477
Identificador de secuencia nº: 13
478 288 478
Identificador de secuencia nº: 14
475 285 475
Identificador de secuencia nº: 15
467 276 467
Identificador de secuencia nº: 16
465 276 465
Identificador de secuencia nº: 17
466 277 466
Identificador de secuencia nº: 18
712 518 712
Identificador de secuencia nº: 19
704 510 704
Identificador de secuencia nº: 20
707 513 707
Identificador de secuencia nº: 21
730 531 730
Identificador de secuencia nº: 22
476 286 476
Identificador de secuencia nº: 23
476 286 476
Identificador de secuencia nº: 24
488 291 483
Identificador de secuencia nº: 25
492 295 487
Identificador de secuencia nº: 26
470 279 470
Identificador de secuencia nº: 27
462 272 462
Identificador de secuencia nº: 28
464 274 464
Identificador de secuencia nº: 29
465 275 465
Identificador de secuencia nº: 30
471 281 471
Identificador de secuencia nº: 31
472 282 472
Identificador de secuencia nº: 32
471 281 471
Identificador de secuencia nº: 33
471 281 471
Identificador de secuencia nº: 34
582 316 511
Identificador de secuencia nº: 35
582 316 511
Identificador de secuencia nº: 36
580 314 509
Identificador de secuencia nº: 37
582 316 511
Identificador de secuencia nº: 38
582 316 511
Identificador de secuencia nº: 39
669 367 562
Identificador de secuencia nº: 40
657 365 558
Identificador de secuencia nº: 41
607 340 535
Identificador de secuencia nº: 42
607 340 535
Identificador de
607 340 535
secuencia nº: 43
Identificador de secuencia nº: 44
606 332 529
Identificador de secuencia nº: 45
578 333 530
Identificador de secuencia nº: 46
467 277 467
Identificador de secuencia nº: 47
508 286 475
Identificador de secuencia nº: 48
527 286 474
Identificador de secuencia nº: 49
481 291 481
Identificador de secuencia nº: 50
483 293 483
Identificador de secuencia nº: 51
482 292 482
Identificador de secuencia nº: 52
483 293 483
Identificador de secuencia nº: 53
645 377 572
Identificador de secuencia nº: 54
618 350 545
Identificador de secuencia nº: 55
618 350 545
Identificador de secuencia nº: 56
562 314 511
Identificador de secuencia nº: 57
520 328 520
Identificador de secuencia nº: 58
478 288 478
Identificador de secuencia nº: 59
478 287 478
Identificador de secuencia nº: 60
459 265 459
Identificador de secuencia nº: 61
475 288 475
Mediante la alienación de los dominios tipo hemopexina enumerados más arriba se ha determinado una secuencia de consenso de 210 posiciones (identificador de secuencia nº 1, identificador de secuencia nº 88).
5 Para compilar un valor de diversidad de aminoácidos (“determinación de la variabilidad”; ver tabla III), se determinó el número de aminoácidos diferentes por posición. Los huecos en la secuencia se marcan con un guión (-) (ver tabla IV para el alineamiento de todas las secuencias). Para cada posición de la secuencia de consenso se da el número de aminoácidos diferentes (valor de diversidad de aminoácidos). El número máximo posible es 21 (20 aminoácidos diferentes + 1 hueco). Un valor de diversidad bajo indica una posición altamente conservada. Un valor de diversidad
10 elevado indica flexibilidad en dicha posición.
Tabla III: Valor de diversidad para cada posición de las 210 posiciones de la secuencia de consenso; para la secuencia de consenso sin huecos ver el identificador de secuencia n:1, para la secuencia de consenso con huecos
ver el identificador de secuencia n:88. (final de la tabla III) Tabla IV: Tabla de alineación para las secuencias identificador de secuencia nº:2 a identificador de secuencia nº:61 (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV) (continuación tabla IV)
Este método para la determinación del valor de diversidad es un método para todo uso y es aplicable de forma general y no se limita a una secuencia de aminoácidos, polipéptido, dominio o proteína específicos. Por lo tanto, el procedimiento puede aplicarse de forma similar a otras secuencias para determinar e identificar posiciones de
5 aminoácidos con una elevada variabilidad y que son accesibles para ser alteradas sin ejercer una gran influencia sobre la estabilidad y funcionalidad de la estructura.
Con el cálculo de la diversidad de aminoácidos, se han identificado posiciones de aminoácido con un valor de diversidad bajo, es decir, menor de 6. Este valor de diversidad bajo indica una alta conservación como, por ejemplo,
10 el residuo cisteína en la posición nº 4 (ver tabla III), que se halló conservado en 57 de las 60 secuencias analizadas (ver Tabla IV). El residuo cisteína en la posición nº 210 se halló conservado en todas las secuencias tipo hemopexina analizadas. Ello demuestra la excelente aplicabilidad de este enfoque, ya que estos dos residuos cisteína son de gran importancia en el andamiaje. Estos dos residuos forma el enlace disulfuro que es esencial para la formación de la estructura tipo hemopexina al unir la cuarta lámina con la primera lámina del polipéptido.
15 A partir del valor de diversidad de aminoácidos, tal como se compila y enumera en la tabla III pueden identificarse posiciones de aminoácido en la secuencia de consenso con una elevada diversidad/variabilidad. Dado que de la numeración de los aminoácidos de elevada diversidad identificados en la secuencia de consenso no puede obtenerse directamente la numeración de aminoácidos correspondiente en el polipéptido entero, la tabla V enumera
20 la numeración de aminoácido de los aminoácidos de elevada diversidad identificados, es decir aminoácidos alterables, de los polipéptidos de longitud completa de los identificadores de secuencia nº 2 a nº 61.
Tabla V: Listado de las posiciones de aminoácido alterables en cada una de las secuencias identificador de secuencia nº2 a identificador de secuencia nº61. La numeración de las posiciones de cada secuencia coincide con la numeración de aminoácidos de la proteína de longitud completa correspondiente.
También se han determinado las posiciones con un valor de diversidad elevado, es decir, igual o superior a 8, o incluso 10. Este análisis mostró que éstas están localizadas principalmente en las regiones bucle. Estas regiones muestran una variabilidad elevada, es decir flexibilidad, y como resultado reúnen espacialmente varios aminoácidos presentados a la superficie desde los bucles de conexión de las láminas. Los resultados también sugieren no utilizar la superficie interior del túnel para experimentos de aleatorización. Las tres hojas beta internas de cada lámina también son críticas, porque muestran una conservación elevada y contribuyen a la estabilidad del núcleo de la proteína. Por lo tanto, los aminoácidos presentados a disolventes, que no contribuyen a la estabilidad del núcleo hidrofóbico de la proteína, que muestran un valor de diversidad lo suficientemente elevado, y por lo tanto, un nivel de conservación bajo, son el foco de interés para un enfoque de mutagénesis.
Con este método es posible obtener, al mismo tiempo, un listado de posiciones de aminoácido variables, es decir alterables, en y para todas las proteínas que se han utilizado en el alineamiento. Para el dominio tipo hemopexina, tal como se ha ejemplificado anteriormente, se han utilizado los dominios tipo hemopexina de sesenta proteínas y, por lo tanto, se han identificado las posiciones de los aminoácidos alterables, es decir variables, de los sesenta dominios. Estas posiciones se enumeran en la tabla V (la numeración coincide con la del polipéptido/proteína de longitud completa).
En la tabla V se enumeran las posiciones de los aminoácidos variables de los sesenta dominios tipo hemopexina (identificador de secuencia nº:02 a identificador de secuencia nº:61). Las posiciones de los aminoácidos se numeran según la secuencia de longitud completa de la proteína que contiene el dominio tipo hemopexina. Por ejemplo, para el dominio tipo hemopexina del identificador de secuencia nº:02 son las posiciones de aminoácidos enumeradas después del sub-apartado identificador de secuencia nº:02 de la tabla V y son, por lo tanto, las posiciones 470, 471, 475, 476, 477, 484, 501, 502, 503, 504, 505, 506, 507, 510, 514, 515, 522, 529, 530, 531, 534, 541, 547, 549, 550, 553, 558, 559, 566, 567, 568, 569, 570, 577, 578, 579, 580, 589, 590, 597, 598, 600, 604, 608, 611, 612, 617, 618, 619, 620, 626, 627, 628, 629, 638, 639, 645, 646, 647, 648, 650, 652, 654, 655, 658, 663. Las posiciones de aminoácidos alterables del identificador de secuencia nº:3 al identificador de secuencia nº:61 se enumeran del mismo modo en la tabla V después del sub-apartado correspondiente.
Disponiendo de las posiciones de aminoácidos alterables de los identificadores de secuencia nº:01 a 61 cada una de estas secuencias puede tomarse como punto de partida para operaciones adicionales.
La producción en sistemas sin células y el análisis de variantes de proteínas generadas racionalmente mediante ingeniería pueden automatizarse, sin embargo, el tamaño de la biblioteca de constructos de proteínas diseñados racionalmente a procesar sigue siendo siempre limitado por el rendimiento técnico de cada sistema. Por lo tanto, el análisis de las propiedades de unión de una gran multitud de productos génicos requiere de esfuerzos adicionales.
Existen diversas técnicas para la expresión y cribado de una biblioteca de polipéptidos, tal como, por ejemplo, la presentación en fagos, ribosomas o bacterias (Smith, G.P., Science 228 (1985) 1315-1317; Hanes, J., y Pluckthun, A., PNAS 94 (1997) 4937-4942; Stahl, S., y Uhlen, M., TIBTECH 15 (1997) 185-192).
La presente invención se ejemplificará con la técnica de presentación en ribosomas (ver por ejemplo Hanes, J., y Pluckthun, A., PNAS 94 (1997) 4937-4942; Mattheakis, L.C., y otros, PNAS 91 (1994) 9022-9026; He, M., y Taussig, M.J., Nuc. Acids Res. 25 (1997) 5132-5134), aunque son aplicables otras técnicas.
La técnicas de evolución directa son adecuadas para complementar la capacidad técnica de una plataforma de producción de proteínas de alto rendimiento. Basada en una tecnología de síntesis de proteínas en sistemas sin células, la presentación en ribosomas es un método excelente para ser implementado en un proceso de producción y análisis de proteínas de alto rendimiento. El objetivo de la presentación en ribosomas es la generación de complejos ternarios, en los cuales el genotipo, caracterizado por su ARN mensajero (ARNm), se une físicamente a través del ribosoma al fenotipo que codifica, caracterizado por los polipéptidos expresados.
Con este propósito, se transcribe y traduce in vitro un molde de ADN lineal, que codifica una genoteca. Por debajo de la secuencia del gen se fusiona una secuencia espaciador, en la cual la característica predominante es la ausencia de un codón de finalización de la traducción. Este dominio espaciador facilita la presentación del polipéptido que se está traduciendo y plegando a la vez que se traduce, por lo que permanece unido al ribosoma. Estos complejos se someten a un procedimiento de cribado, en el cual se permite que el polipéptido expuesto en el ribosoma se una a una molécula ligando predeterminada. Se aísla el ARNm de complejos fuertemente unidos, se transcribe de forma inversa y se amplifica mediante PCR. El subclonado de los productos de la PCR en un sistema de vectores y la subsiguiente secuenciación del ADN revela información sobre el genotipo relacionado con el fenotipo del polipéptido unido. Mediante ciclos repetidos de mutagénesis y presentación en ribosomas pueden identificarse proteínas que se unen de bibliotecas de hasta 1.014 miembros (Mattheakis, L.C., y otros, PNAS 91 (1994) 9022-9026; Hanes, J., y Pluckthun, A., PNAS 94 (1997) 4937-4942; Lamla, T., y Erdmann, V.A., J. Mol. Biol. 329 (2003) 381-388).
En general, la presentación en ribosomas requiere el estancamiento del ribosoma mientras alcanza el extremo 3’ del ARNm sin disociación de las unidades del mismo. Una vez el ribosoma ha encontrado el extremo 3’ del ARNm el sitio de entrada (sitio A) del ARN de transferencia (ARNt) del ribosoma queda libre. En procariotas, esta situación da lugar a la activación del mecanismo de rescate del ribosoma, inducido por el ARNtm (ARN de transferencia mensajero; Abo, T., y otros EMBO J. 19 (2000) 3762-3769; Hayes, C.S., y Sauer, R.T., Mol. Cell. 12 (2003) 903-911; Keiler, K.C., y otros, Science 271 (1996) 990-993). Respecto a la selección de la presentación en ribosomas, este mecanismo disminuye la cantidad de complejos ternarios funcionales y el rendimiento de productos de la PCR disminuye significativamente (Hanes, J., y Pluckthun, A., PNAS 94 (1997) 4937-4942).
Este mecanismo de rescate de ribosomas inducido por el ARNtm puede obviarse, cuando se fuerza a que la maquinaria de traducción del ribosoma se estanque antes de que el ribosoma encuentre el extremo 3’ del ARNm. Gracias a la detención de la traducción inducida, el sitio A del ribosoma sigue ocupado. El espaciador de la presentación del constructo de presentación en ribosomas posee una secuencia, según se muestra en el identificador de secuencia nº:62. Con este espaciador, la traducción puede detenerse una vez que se ha traducido el polipéptido completo y antes de que se desencadene el mecanismo de rescate del ribosoma.
Esto se ha conseguido eliminando los codones de parada de la traducción (Mattheakis, L.C., y otros, PNAS 91 (1994) 9022-9026; Hanes, J., y Pluckthun, A., PNAS 94 (1997) 4937-4942) de la secuencia del espaciador del ADN del constructo de presentación en ribosomas. Como consecuencia, se genera un complejo de elevado peso molecular formado por el ARNm, el ribosoma y el polipéptido estancado durante la traducción.
Para la generación de bibliotecas existen diversas técnicas conocidas por los expertos. A continuación se expone un procedimiento a modo de ejemplo.
Se produjeron como base de una biblioteca de ADN Elementos de Expresión Lineal (LEE) de modo modular. Para proceder rápidamente a la PCR de superposición-extensión-empalme con los fragmentos de ADN aleatorizados, se produjo previamente una biblioteca de módulos de ADN. Para obtener un rendimiento suficiente de producto de la PCR, fue necesario utilizar cebadores oligonucleótidos purificados mediante HPLC y una ADN polimerasa con una actividad exonucleolítica 3’-5’, produciendo fragmentos de ADN de extremos romos (Garrity, P.A., y Wold, B.J., PNAS 89 (1992) 1021-1025).
A modo de ejemplo, se fusionaron en diferentes combinaciones de módulos de ADN los genes que codifican las proteínas PEX2 (dominio tipo hemopexina c-terminal de la metaloproteinasa de matriz 2 humana), TIMP2 (inhibidor tisular de la metaloproteinasa de matriz 2 humana), HDAC-I (histona deacetilasa I humana), BirA (holoenzima biotina ligasa de E. coli) y GFP (proteína fluorescente verde). Se determinó la concentración de productos de PCR mediante cuantificación densitométrica comparativa utilizando el LUMI Imager System (Roche Applied Sciences, Mannheim, Alemania). El rendimiento medio de producto de la PCR de los Elementos de Expresión Lineal obtenidos fue de aproximadamente 60 ng/!l ± 20 ng/!l (ng por !l de mezcla de PCR). Utilizando la ADN polimerasa de P. woesii (PWO) fue posible generar LEE de una longitud de hasta 2.000 bp.
En un ejemplo comparativo se generó una biblioteca pequeña en la cual se aleatorizaron 8 posiciones de aminoácido del polipéptido PEX2. Con este propósito se escogieron las posiciones siguientes y los aminoácidos correspondientes del listado del identificador de secuencia nº:10, tal como se enumeran en la tabla V: 528 (Gln), 529 (Glu), 550 (Arg), 576 (Lys), 577 (Asn), 578 (Lys), 594 (Val) y 596 (Lys). La biblioteca se generó mediante síntesis por PCR sin moldes, tal como se describe en el ejemplo 2. Se unieron un molde de presentación en ribosomas por ejemplo mediante los módulos T7P-g10epsilon-ATG (identificador de secuencia nº:74), un polipéptido de la biblioteca generada y un separador de la presentación en ribosomas (identificador de secuencia nº:62).
Un requisito previo para obtener un andamiaje de proteínas adecuado es que tenga capacidad para plegarse de forma estable en su conformación activa, incluso bajo condiciones en las que soporta la carga de múltiples aminoácidos sustituidos. Esta característica puede examinarse dirigiendo la biblioteca contra parejas de unión proteica conocidas. En un ejemplo, la biblioteca PEX2 se presentó para reconocer al ligando proteico inhibidor tisular de la metaloproteinasa 2 (TIMP2). Los polipéptidos aleatorizados de la biblioteca PEX-2 seguían siendo capaces de reconocer a su pareja de unión inherente TIMP2 en un enfoque de presentación en ribosomas. Ello indica que se mantuvo la estructura-función del andamiaje a pesar de que éste se mutó múltiples veces.
Para preparar y optimizar las propiedades de unión de un elemento capaz de unirse de forma específica basado en un andamiaje de polipéptido a una molécula diana predeterminada que no se une inherentemente al andamiaje, debe ejecutarse varias veces un ciclo que comprende cuatro etapas principales. Estas etapas son (i) alteración de al menos una posición de aminoácido según la tabla V, (ii) preparación del constructo de presentación, (iii) presentación y selección de una variante de unión específica y (iv) aislamiento y secuenciación de la variante seleccionada. Generalmente son necesarios entre dos y cinco ciclos para establecer características de unión nuevas en un andamiaje.
La molécula diana predeterminada no se limita a un grupo específico de polipéptidos. El polipéptido predeterminado puede pertenecer a uno de los grupos siguientes: proteínas hedgehog, proteínas morfogénicas óseas, factores de crecimiento, eritropoyetina, trombopoyetina, G-CSF, interleuquinas e interferones, así como a los grupos inmunoglobulinas, enzimas, inhibidores, activadores y proteínas de la superficie celular.
En un ejemplo se escogió IGF-I, que no se une a PEX2, como molécula diana predeterminada para la generación de un elemento capaz de unirse específicamente basado en el andamiaje PEX2. La molécula diana se presentó en placa en forma de ligando biotinilado. Tras un segundo ciclo de presentación en ribosomas con la biblioteca PEX2 se retuvo una señal de producto de PCR visible. Ello muestra que la biblioteca es adecuada para la selección de proteínas o polipéptidos que se unen específicamente a una molécula diana predeterminada que no es unida inherentemente por la proteína polipéptido.
Los ejemplos, referencias y listados de secuencias siguientes se aportan para ayudar a la comprensión de la presente invención, cuyo alcance verdadero queda establecido en las reivindicaciones adjuntas.
Ejemplos
Los ejemplos se basan en el identificador de secuencia nº: 10 (no reivindicado).
Ejemplo 1
PCR de superposición-extensión-empalme (OEL-PCR)
Se unieron modularmente los Elementos de expresión lineal mediante un protocolo de PCR en dos etapas, utilizando el principio de empalme de ADN con superposición. En una PWO-PCR estándar se amplifica un marco de lectura abierto sin intrones con cebadores puente terminales específicos de secuencia, lo que genera secuencias homólogas que se superponen a las secuencias de ADN que las flanquean. Se transfirieron dos !l de la primera mezcla de PCR que contenía aproximadamente 50 ng del fragmento génico que se ha extendido (módulo gen) a una segunda mezcla de PWO-PCR. La mezcla se suplementó con entre 50 ng y 100 ng de fragmentos de ADN producidos previamente (módulos promotor y finalizador) y los correspondientes cebadores terminales específicos de secuencia todos a una concentración de 1 !M. Típicamente, esta segunda etapa de PCR comprende 30 ciclos. Los parámetros físicos de los perfiles de PCR se ajustaron según los requisitos de los fragmentos de ADN a los que quería ligarse.
Ejemplo 2
Síntesis de la biblioteca de ADN PEX2
Los codones triplete PEX2 que codifican las coordenadas de los aminoácidos de los dominios tipo hemopexina 64, 65, 86, 112, 113, 114, 130 y 132 (equivalentes a 528 (Gln), 529 (Glu), 550 (Arg), 576 (Lys), 577 (Asn), 578 (Lys), 594 (Val) y 596 (Lys) en la metaloproteinasa de matriz 2) humana completa se aleatorizaron mediante grupos NNK. La secuencia natural humana del ADN PEX2 se dividió en tres secciones de secuencia. Una PWO-PCR estándar suplementada con 10 ng de vector-molde pIVEX2.1MCS PEX2 y los cebadores PEX2forw (identificador de secuencia nº63) y PEXR4 (identificador de secuencia nº64) ambos a una concentración de 1 !M amplificó el fragmento 1 bp -218 bp. El fragmento 402 bp – 605 bp se amplificó en una PWO-PCR estándar con 10 ng de vector-molde pIVEX2.1MCS PEX2 y los cebadores PEXF4 (identificador de secuencia nº65) y PEX2rev (identificador de secuencia nº66) ambos a una concentración de 1 !M. La secuencia 196 bp – 432 bp formó superposiciones con los fragmentos de ADN 1 bp – 218 bp y 402 bp-605 bp y se sintetizó mediante PCR sin moldes con los cebadores PEXF1 (identificador de secuencia nº67) y PEXR1 (identificador de secuencia nº68) ambos a una concentración de 1 !M y PEXR3 (identificador de secuencia nº:69), PEXR2 (identificador de secuencia nº:70) y PEXF2 (identificador de secuencia nº:71) todos a una concentración de 0,25 !M. El perfil de PCR fue el mismo para las tres PCRs: TIM (temperatura de fusión inicial): 1 minuto a 94 ºC, TM (temperatura de fusión): 20 segundos a 94ºC, TA (temperatura de hibridación): 30 segundos a 60ºC; TE (temperatura de alargamiento): 15 segundos a 72 ºC, 25 ciclos, TFE (temperatura de alargamiento final): 2 minutos a 72ºC. La secuencia PEX2 aleatorizada completa (588 bp) se obtuvo aplicando 70 ng de cada uno de los fragmentos de secuencia de ADN a una PWO-PCR estándar con los cebadores puente T7P_PEX2 (identificador de secuencia nº:72) y PEX2_RD (identificador de secuencia nº:73) ambos a una concentración de 1 !M El perfil de PCR fue: TIM: 1 minuto a 94 ºC, TM: 20 segundos a 94ºC, TA: 30 segundos a 60ºC; TE: 60 segundos a 72 ºC, 25 ciclos, TFE: 5 minutos a 72ºC. Los cebadores puente introdujeron superposiciones de ADN homólogo para el ensamblado de la genoteca PEX2 en un molde de presentación en ribosomas mediante OEL-PCR.
Ejemplo 3
Transcripción y traducción in vitro sin células
Según las instrucciones del fabricante, se transcribieron y tradujeron Elementos de Expresión Lineal en RTS 100 HY E.coli System. Se incubaron moldes de ADN lineal (100 ng – 500 ng) a 30ºC. Opcionalmente, se añadieron 6 !l de GroEsupplement (Roche).
Ejemplo 4
Biotinilación específica de sitio de proteínas de fusión
Se modificó el sistema RTS 100 E.coli HY System para realizar una biotinilación enzimática específica de sitio. Se unieron sesenta !l de mezcla RTS, según las instrucciones del fabricante. La mezcla se suplementó con 2 !l de solución stock de Inhibidor de Proteasas Completo sin EDTA, 2 !M de d-(+)-biotina, 50 ng del Elemento de Expresión Lineal T7P_BirA_T7T (1405 bp), que codifica la Biotina Ligasa de E. coli (BirA, EC 6.3.4.15) y entre 100 ng y 500 ng del molde lineal que codifica la proteína de fusión substrato. La proteína de fusión substrato se fusionó por el extremo N terminal o C terminal a la secuencia Péptido Aceptador de Biotina (BAP). En todos los experimentos se utilizó una variante de 15 elementos de la secuencia #85 identificada por Schatz (Schatz, P.J., Biotechnology (NY) 11 (1993) 1138-1143; Beckett, D. y otros, Protein Sci. 8 (1999) 921-929) (Avitag, Avidity Inc., Denver, Colo. EE.UU). La Biotina Ligasa se co-expresó a partir del molde lineal T7Pg10epsilon_birA_T7T.
Ejemplo 5
a) Protocolo de presentación en ribosomas
Se mantuvieron todos los tampones en hielo. Todos los dispositivos eran estériles y libres de ADNasa y ARNasa. La poyata de trabajo se limpió con Rnase-ZAP.
Tampón de lavado stock (Stock WB) 10x para presentación en ribosomas: TRIS (tris(hidroximetil)-aminometano) 0,5 M, pH 7,5 (4°C) ajustado con AcOH (ácido acético); NaCl 1,5 M; acetato magnésico 0,5 M, almacenamiento a -20°.
Tampón de elución (Stock EB) 10x para presentación en ribosomas: TRIS 0,5 M, pH 7,5 (4°C) ajustado con AcOH; NaCl 1,5 M; 200 mM EDTA, almacenamiento a -20°.
10 ml de tampón de lavado para presentación en ribosomas (WB): 1200 !l de Stock WB 10x pH 7,5, TWEEN 20 0,05% (50!l TWEEN 20 al 10 %), BSA 5 % (5 ml de BSA bloqueante al 10%), ARN-t 5 !g/ml, KCl 670 mM (0,5 g KCl) ajustar a 10ml con agua grado PCR.
10 ml de tampón de parada para presentación en ribosomas (SB): 1200 !l de Stock WB 10x pH 7,5, TWEEN 20 0,05% (50!l TWEEN 20 al 10 %), BSA 5 % (5 ml de BSA bloqueante al 10%), ARN-t 5 !g/ml, 670 KCl mM (0,5 g KCl), GSSG (glutatión oxidado) 4 mM, cAMP 25 !M(10!l de solución Stock), ajustar a 10ml con agua grado PCR.
2 ml de tampón de elución para presentación en ribosomas: 200!l de Stock EB 10x, BSA 0,25 % (50 !ldeBSA bloqueante al 10 %), 5.000 unidades A260 de ARN-r ribosomal 16S-23S, ARN-t 5 !g/ml, ajustar a 2ml con agua grado PCR.
Reactivo bloqueante: Tampón BSA al 5% (2,5 ml de BSA bloqueante al 10%), 50% de Tampón Conjugado Universal.
Tampón PBS 10x: NaH2PO4 0,1 M; KH2PO4 0,01 M (10x pH 7,0; 1x pH 7,4); NaCl 1,37 M; KCI 27 mM.
b) Preparación de los ectodominios erbB2 y erbB3
Los ectodominios de los receptores humanos erbB2 y erbB3 se obtuvieron de R&D Systems como receptores quimera. Los ectodominios de los receptores se fusionaron genéticamente a la proteína humana IgG1FC (fragmento Fc del anticuerpo IgG1 humano). Ambas moléculas mostraron una masa molecular de 96 kDa y contenían un péptido hexahistidina en su extremo C terminal. Como resultado de la glicosilación, el peso molecular de las proteínas aumentó entre 130 y 140 kDa. Las proteínas quiméricas se obtuvieron como proteínas liofilizadas y se volvieron a solubilizar en tampón PBS con BSA al 0,1%. Las proteínas se almacenaron a -80ºC hasta el momento de ser utilizadas.
c) Recubrimiento de las placas de microtitulación
Se lavó tres veces un volumen de reacción (RV) de una placa de microtitulación (MT) con Tampón Conjugado Universal. Se volvieron a disolver dos y medio (2,5) !g de ligando en 100 !l de Reactivo de Bloqueo. Los ligandos biotinilados se inmovilizaron alternativamente en los pocillos de placas MT recubiertas con Estreptavidina y Avidina. Las quimeras erbB2/FC-y erbB3/FC se inmovilizaron alternativamente en los pocillos de placas MT recubiertas con proteína A y proteína G. La solución de ligando se incubó durante 1 hora a temperatura ambiente en la placa MT con agitación a 500 rpm en una plataforma de agitación robótica Biorobot 8000. Para determinar la señal de fondo se recubrió un pocillo con 100 !l de reactivo de bloqueo sin ligando. Se lavaron los pocillos con 3 RV de Reactivo de Bloqueo. El Reactivo de Bloqueo (300 !l) se incubó en cada pocillo durante 1 hora a 4ºC y 200 rpm, Antes de aplicar la mezcla de parada de la traducción, se lavaron los pocillos con 3 RV de tampón WB helado.
d) Generación de moldes de presentación en ribosomas
Para el procedimiento de presentación en ribosomas estándar se alargó un único gen o una genoteca con cebadores puente específicos. Los fragmentos de ADN alargados se fusionaron mediante OEL-PCR a módulos T7Pg10epsilon (identificador de secuencia nº:74) y a un separador de presentación en ribosomas (identificador de secuencia nº:62) utilizando los cebadores terminales T7Pfor (identificador de secuencia nº:75) y R1A (identificador de secuencia nº:76) 5’-AAATCGAAAGGCCCAGTTTTTCG-3’. El perfil de PCR para el ensamblado PCR fue: TIM 1 minuto a 94 ºC, TM: 20 segundos a 94ºC, TA: 30 segundos a 60ºC; TE: 60 segundos por 1.000 bp a 72 ºC, 30 ciclos, TFE: 5 minutos a 72ºC.
Producción del elemento de expresión lineal (LEE) T7PAviTagFXa-PEX2-T7T: Se amplificó el gen PEX2 humano en una PWO-PCR estándar a partir de 10 ng del plásmido molde pDSPEX2 (Roche) utilizando el cebador puente según el identificador de secuencia nº:77 y el identificador de secuencia nº:78. El gen con superposición se fusionó mediante OEL-PCR a los módulos de ADN T7PAviTagFXa (identificador de secuencia nº::79) y T7T (identificador de secuencia nº::80) utilizando los cebadores T7Pfor (identificador de secuencia nº::82) y T7Trev (identificador de secuencia nº:81).
e) Preparación de la mezcla de traducción para la presentación en ribosomas.
Se preparó el sistema RTS E.coli 100 HY System, según las instrucciones del fabricante. Se suplementaron cien !l de mezcla con 40 unidades (1 !l) de Rnasin, 2 !M (2 !l) de oligonucleótido anti ssrA 5’-TTAAGCTGCTAAAGCGTAGTTTTCGTCGTTTGCGACTA-3’ (identificador de secuencia nº:85), 1 !l de solución stock de Inhibidor mini proteasa completo sin EDTA y 500 ng de molde de ADN para presentación en ribosomas en 20 !l de mezcla PWO-PCR. El molde de ADN para presentación en ribosomas se transcribió y tradujo en tubos de 1,5 ml a 30 ºC durante 40 minutos con agitación a 550 rpm. Los complejos formados con ARNm, ribosoma y el polipéptido presentado se estabilizaron deteniendo la reacción de forma inmediata con 500 !l de tampón SB helado. La mezcla se centrifugó a 15.000 rpm a 2 ºC durante 10 minutos. El sobrenadante se transfirió a tubos de reacción de 1,5 ml helados. Se transfirieron doscientos cincuenta !l de mezcla a placas MT recubiertas de ligando (señal) y otros 250 !l en pocillos no recubiertos de ligando (fondo). La mezcla se incubó durante 1 hora a 4 ºC y 300 rpm. Para eliminar la proteína de fondo y los complejos ternarios con una unión débil se lavaron los pocillos con tampón WB helado. Se eluyó el ARN de los complejos ternarios unidos con 100 ! de tampón EB helado durante 10 minutos a 4 ºC y 750 rpm.
f) Preparación de perlas magnéticas recubiertas de Proteína G.
Las perlas magnéticas recubiertas de Proteína G se utilizaron para vaciar las mezclas de traducción para presentación en ribosomas de derivados proteicos que reconocieran de forma no específica los elementos de unión a IgG1-FC. Se equilibraron 100 !l de suspensión de perlas magnéticas con tampón de parada SB lavando las perlas cinco veces con 500 !l de tampón SB. Se incubaron las perlas durante 1 hora a 4 ºC en 500 !l de tampón SB con 50 !g de proteína IgG1-FC. Las perlas se lavaron tres veces con tampón SB y se almacenaron en hielo en cien !l de tampón SB. Previamente a su utilización, las perlas se separaron magnéticamente y se almacenaron en hielo. Se añadió a las perlas mezcla de traducción para presentación en ribosomas detenida. La mezcla se incubó durante 30 minutos a 4 ºC a 750 rpm. Previamente a su utilización, las perlas se separaron magnéticamente de la mezcla.
g) Purificación del ARNm y eliminación del ADN remanente
Se purificó el ARN mensajero utilizando el kit High Pure RNA Isolation Kit (Roche Applied Science, Mannheim, Alemania). Se eliminó el molde de ADN remanente en el eluato con un protocolo modificado del kit Ambion DNA-free (Ambion Inc, EE.UU.). Se suplementaron cincuenta !l de eluato con 5,7 !l de tampón de ADNasa I y 1,3 !l solución de ADNasa I. Tras incubar la mezcla a 37 ºC durante 30 minutos se añadieron 6,5 !l de reactivo de inactivación de la ADNasa I. Esta mezcla pastosa se incubó en ensayo de digestión durante 3 minutos a temperatura ambiente seguida de 1 minuto de centrifugación a 11.000g. El sobrenadante se utilizó en la transcripción inversa.
h) Transcripción inversa y amplificación del ADNc.
Para la transcripción inversa se utilizó el kit C. therm. RT Polymerase Kit (Roche Applied Sciences Mannheim, Alemania). Se unieron veinte !l de: 4 !l tampón RT 5x, 1 !l de solución de DTT (ditiotreitol), 1,6 !l de dNTPs, 1 !l de solución de DMSO, 0.1 !M (1 !l) de RT 5’-CAGAGCCTGCACCAGCTCCAGAGCCAGC-3’ (identificador de secuencia nº:86), 40 unidades (1 !l) de Rnasin, 1,5 !l de polimerasa ARN de C. therm., 9 !l de eluato conteniendo ARNm. La transcripción se llevó a cabo durante 35 minutos a 70 ºC. Se realizó una amplificación adicional del ADN en 100 !l de PWO-PCR con 10 !l de tampón PWO-PCR 10x, con MgSO4, dNTPs 200 !M, 12 !l de mezcla de transcripción, 2,5 unidades de ADN polimerasa PWO y los cebadores RT 5’-CAGAGCCTGCACCAGCTCCAGAGCCAGC-3’ (identificador de secuencia nº:86) y F1 5’-GTTTAACTTTAAGAAGGAGATATACATATG-3’ (identificador de secuencia nº:87) ambos a una concentración de 1 !M. El perfil de PCR fue TIM: 1 minuto a 94 ºC, TM: 20 segundos a 94ºC, TA: 30 segundos a 60ºC; TE: 60 segundos a 72 ºC, 20 ciclos, TFE: 5 minutos a 72ºC. Se realizó una re-amplificación mediante PWO-PCR estándar. Se transfirieron dos µl de mezcla de PCR a una segunda PWO-PCR. Siempre que fue posible, se utilizaron cebadores puente específicos de gen. Los perfiles de PCR fueron acordes a los parámetros físicos de los moldes de genes y los oligonucleótidos cebadores. Se realizaron 25 ciclos de PCR. Las secuencias de los genes se alargaron con superposiciones de ADN para que se hibridaran con los módulos de ADN T7Pg10epsilon y el separador de presentación en ribosomas en una OEL-PCR adicional. Los moldes de ADN de presentación en ribosomas se reutilizaron a continuación en ciclos adicionales de presentación en ribosomas.
i) Subclonado de los genes tras la presentación en ribosomas
Los productos de PCR se subclonaron en sistemas vector mediante técnicas conocidas por los expertos en la técnica. Los miembros de la biblioteca PEX2 se subclonaron a través de los sitios NdeI/EcoRI dentro del vector pUC18 utilizando los cebadores NdeIPEX2for (identificador de secuencia nº:83) y EcoRI-PEX2rev (identificador de secuencia nº:84)
LISTADO DE SECUENCIAS
<110> F. Hoffmann-La Roche AG
<120> Estructura tipo hemopexina tal como un andamiaje polipéptico
<130> 22953
<150> EP 05000013.2
<151> 2005-01-03
<160> 88
<170> PatentIn version 3.2
<210> 1
<211> 195
<212> PRT
<213> Artificial
<220>
<223> secuencia de consenso
<400> 1
<210> 2
<211> 195
<212> PRT
<213> Gallus gallus
<400> 2
<210> 3
<211> 305
<212> PRT
<213> Mus musculus
<400> 3
<210> 4
<211> 305
<212> PRT
<213> Rattus norvegicus
<400> 4
<210> 5
<211> 195
<212> PRT
<213> Oryctolagus cuniculus
<400> 5
<210> 6
<211> 195
<212> PRT
<213> Bos taurus
<400> 6
<210> 7
<211> 195
<212> PRT
<213> Equus caballus
<400> 7
<210> 8 5 <211> 195
<212> PRT
<213> Homo sapiens
<400> 8 10
<210> 9 5 <211> 195
<212> PRT
<213> Sus scrofa
<400>
9 10
<212> PRT
<213> Homo sapiens
<400>
10 10
<210> 11
<211> 191
<212> PRT
<213> Homo sapiens
<400> 11
<210> 12
<211> 191
<212> PRT
<213> Mus musculus
<400> 12
<210> 13
<211> 191
<212> PRT
<213> Oryctolagus cuniculus
<400> 13
<210> 14
<211> 191
<212> PRT
<213> Rattus norvegicus
<400> 14
<210> 15
<211> 192
<212> PRT
<213> Homo sapiens
<400> 15
<210> 16
<211> 190
<212> PRT
<213> Mus musculus
<400> 16
<212> PRT
<213> Rattus norvegicus
<400>
17 10
<210> 18
<211> 195
<212> PRT
<213> Bos taurus
<400> 18
<210> 19
<211> 195
<212> PRT
<213> Canis familiaris
<400> 19
<210> 20
<211> 195
<212> PRT
<213> Homo sapiens
<400> 20
<210> 21
<211> 200
<212> PRT
<213> Mus musculus
<400> 21
<210> 22
<211> 191
<212> PRT
<213> Homo sapiens
<400> 22
<210> 23
<211> 191
<212> PRT
<213> Mus musculus
<400> 23
<212> PRT
<213> Homo sapiens
<400>
24 10
<212> PRT
<213> Mus musculus
<400>
25 10
<210> 26
<211> 192
<212> PRT
<213> Homo sapiens
<400> 26
<210> 27
<211> 191
<212> PRT
<213> Mus musculus
<400> 27
<210> 28
<211> 191
<212> PRT
<213> Oryctolagus cuniculus
<400> 28
10 <210> 29
<211> 191
<212> PRT
<213> Rattus norvegicus
<400> 29
5 <210> 30
<211> 191
<212> PRT
<213> Bos taurus
10 <400> 30
<210> 31
<211> 191
<212> PRT
<213> Equus caballus
<400> 31
<210> 32
<211> 191
<212> PRT
<213> Homo sapiens
<400> 32
<210> 33
<211> 191
<212> PRT
<213> Oryctolagus cuniculus
<400> 33
<210> 34
<211> 196
<212> PRT
<213> Homo sapiens
<400> 34
<210> 35
<211> 196
<212> PRT
<213> Mus musculus
<400> 35
<210> 36
<211> 196
<212> PRT
<213> Sus scrofa
<400> 36
<210> 37
<211> 196
<212> PRT
<213> Oryctolagus cuniculus
<400> 37
<210> 38
<211> 196
<212> PRT
<213> Rattus norvegicus
<400> 38 <210> 39
<211> 196
<212> PRT
<213> Homo sapiens
<400> 39
5
<210> 40 <211> 196 <212> PRT <213> Mus musculus
10
<400> 40
80
<210> 41
<211> 196
<212> PRT
<213> Homo sapiens
<400> 41 <210> 42
<211> 196
<212> PRT
<213> Mus musculus
<400> 42 <210> 43
<211> 196
<212> PRT
<213> Rattus norvegicus
<400> 43
<210> 44
<211> 198
<212> PRT 10 <213> Homo sapiens
<400> 44
5
<210> 45 <211> 198 <212> PRT <213> Mus musculus
10
<400> 45
85
<210> 46
<211> 191
<212> PRT
<213> Xenopus laevis
<400> 46
<210> 47
<211>
190 10 <212> PRT
<213> Homo sapiens
<400> 47
<210> 48
<211> 189
<212> PRT
<213> Mus musculus
<400> 48
<210> 49
<211> 191
<212> PRT
<213> Bos Taurus
<400> 49
<210> 50
<211> 191
<212> PRT
<213> Homo sapiens
<400> 50
<210> 51
<211> 191
<212> PRT
<213> Mus musculus
<400> 51
<210> 52
<211> 191
<212> PRT
<213> Sus scrofa
<400> 52
<210> 53
<211> 196
<212> PRT
<213> Homo sapiens
<400> 53
<210> 54
<211> 196
<212> PRT
<213> Mus musculus
<400> 54
<210> 55
<211> 196
<212> PRT
<213> Rattus norvegicus
<400> 55
<210> 56
<211> 198
<212> PRT
<213> Homo sapiens
<400> 56
<210> 57
<211> 193
<212> PRT
<213> Homo sapiens
<400> 57
<210> 58
<211> 191
<212> PRT
<213> Homo sapiens
<400> 58
<210> 59
<211> 192
<212> PRT
<213> Mus musculus
<400> 59
<210> 60
<211> 195
<212> PRT
<213> Sus scrofa
<400> 60
<210> 61
<211> 188
<212> PRT
<213> Oryctolagus cuniculus
<400> 61
<210> 62
<211>
345 5 <212> ADN
<213> Artificial
<220>
<223> Separador de visualización de ribosomas 10
<400> 62
<210> 63
<211> 22
<212> ADN
<213> Artificial
<220>
<223> PEX2forw
<400> 63 atgcctgaaa tctgcaaaca gg 22
<210> 64
<211> 54
<212> ADN
<213> Artificial
<220>
<223> PEXR4
<220>
<221> característica misc
<222> (25)..(26)
<223> n es a, c, g ó t
<220>
<221> característica misc
<222> (28)..(29)
<223> n es a, c, g, ó t
<400> 64 cctgcaaaga acacagcttt ctcmnnmnnt ggggcctcgt ataccgcatc aatc 54
<210> 65
<211> 42
<212> ADN
<213> Artificial
<220>
<223> PEXF4
<400> 65 ggaccctggc ttccccaagc tcatcgcaga tgcctggaat gc 42
<210> 66
<211> 19
<212> ADN
<213> Artificial
<220>
<223> PEX2rev <400> 66 ggagctcgct cgagtcagc 19
<210> 67
<211> 60
<212> ADN
<213> Artificial
<220>
<223> PEXF1
<400> 67 gagaaagctg tgttctttgc agggaatgaa tactggatct actcagcgag caccttggag 60
<210> 68
<211> 60
<212> ADN
<213> Artificial
<220>
<223> PEXR1
<220>
<221> característica misc
<222> (29)..(30)
<223> n is a, c, g, or t
<220>
<221> característica misc
<222> (35)..(36)
<223> n es a, c, g, ó t
<400> 68 gagcttgggg aagccagggt ccattttmnn cttmnnctcg ttgtacctcc agaacttgtc 60
<210> 69
<211> 57
<212> ADN
<213> Artificial
<220>
<223> PEXR3
<220>
<221> característica misc
<222> (37)..(38)
<223> n es a, c, g, ó t
<400> 69 ggcagtccga ggctagtcag tggtttggga taaccmnnct ccaaggtgct cgctgag 57
<210> 70
<211> 52
<212> ADN
<213> Artificial
<220>
<223> PEXR2
<220>
<221> característica misc
<222> (23)..(24)
<223> n es a, c, g, ó t
<220>
<221> misc_feature
<222> (26)..(27)
<223> n es a, c, g, ó t
<220>
<221> característica misc 5 <222> (29)..(30)
<223> n es a, c, g, ó t
<400> 70
gccagcgaag atgtatgtct tmnnmnnmnn gctccagtta aaggctgcat cc 52 10
<210> 71
<211> 60
<212> ADN
<213> Artificial 15
<220>
<223> PEXF2
<400> 71 20 ctgactagcc tcggactgcc ccctgatgtt caacgtgtgg atgcagcctt taactggagc 60
<210> 72
<211> 55
<212> ADN 25 <213> Artificial
<220>
<223> T7P_PEX2
30 <400> 72 gtttaacttt aagaaggaga tatacatatg cctgaaatct gcaaacagga tatcg 55
<210> 73
<211> 49 35 <212> ADN
<213> Artificial
<220>
<223> PEX2_RD 40
<400> 73 cctgcaccag ctccagagcc agcgcagcct agccagtcgg atttgatgc 49
<210> 74 45 <211> 186
<212> ADN
<213> Artificial
<220> 50 <223> T7Pg10epsilon
<400> 74
<210> 75
<211> 27
<212> ADN
<213> Artificial
<220>
<223> T7Pfor
5 <400> 75 ggtgatgtcg gcgatatagg cgccagc 27
<210> 76
<211> 23 10 <212> ADN
<213> Artificial
<220>
<223> R1A 15
<400> 76 aaatcgaaag gcccagtttt tcg 23
<210> 77 20 <211> 55
<212> ADN
<213> Artificial
<220> 25 <223> cebador puente
<400> 77 gtttaacttt aagaaggaga tatacatatg cctgaaatct gcaaacagga tatcg 55
30 <210> 78
<211> 50
<212> ADN
<213> Artificial
35 <220>
<223> cebador puente
<400> 78 40 gtcgttcaga ccacgaccct cgatgcagcc tagccagtcg gatttgatgc 50
<210> 79
<211> 243
<212> ADN 45 <213> Artificial
<220>
<223> T7PAviTagFXa
50 <400> 79
<210> 80
<211> 332 55 <212> ADN
<213> Artificial
<220>
<223> T7T
<400> 80
10 <210> 81
<211> 30
<212> ADN
<213> Artificial
15 <220>
<223> T7Trev
<400> 81
20 gcaaaaaacc cctcaagacc cgtttagagg 30
<210> 82
<211> 22
<212> ADN 25 <213> Artificial
<220>
<223> T7Pfor
30 <400> 82 ggtgatgtcg gcgatatagg cg 22
<210> 83
<211> 37 35 <212> ADN
<213> Artificial
<220>
<223> NdeI-PEX2for 40
<400> 83 ctgagagtgc accatatgcc tgaaatctgc aaacagg 37
<210> 84 45 <211> 33
<212> ADN
<213> Artificial
<220> 50 <223> EcoRI-PEX2rev
<400> 84 ccatgattac gaattcgcag cctagccagt cgg 33
55 <210> 85
<211> 38
<212> ADN
<213> Artificial
<220>
<223> anti ssrA-oligonucleótido
<400> 85 ttaagctgct aaagcgtagt tttcgtcgtt tgcgacta 38
<210> 86
<211> 28
<212> ADN
<213> Artificial
<220>
<223> cebador RT
<400> 86 cagagcctgc accagctcca gagccagc 28
<210> 87
<211> 30
<212> ADN
<213> Artificial
<220>
<223> cebador F1
<400> 87 gtttaacttt aagaaggaga tatacatatg 30
<210> 88
<211> 210
<212> PRT
<213> Artificial
<220>
<223> secuencia de consenso – Xaa indica un guión (-)
<220>
<221> característica misc
<222> (20)..(20)
<223> Xaa puede ser cualquier aminoácido natural
<220>
<221> característica misc
<222> (34)..(34)
<223> Xaa puede ser cualquier aminoácido natural
<220>
<221> característica misc
<222> (55)..(57)
<223> Xaa puede ser cualquier aminoácido natural
<220>
<221> misc_feature
<222> (97)..(97)
<223> Xaa puede ser cualquier aminoácido natural
<220>
<221> misc_feature
<222> (119)..(120)
<223> Xaa puede ser cualquier aminoácido natural
<220> <221> misc_feature
<222> (189)..(195)
<223> Xaa puede ser cualquier aminoácido natural
<400> 88

Claims (4)

  1. REIVINDICACIONES
    1. Método para identificar un ácido nucleico que codifica un polipéptido que se une específicamente a una molécula diana predeterminada de una biblioteca de ADN, caracterizado porque dicho método comprende las etapas de
    a) seleccionar la secuencia del identificador de secuencia nº:2 b) preparar una biblioteca de ADN de la secuencia seleccionada en la cual al menos está alterada una posición de aminoácido según la tabla V; c) cribar en la biblioteca de ADN preparada los polipéptidos que se unen específicamente a una molécula diana predeterminada; d) seleccionar el ácido nucleico que codifica uno de los elementos con capacidad de unión específica de
    la etapa c); e) repetir las etapas b) a d) entre dos y cinco veces; y f) aislar dicho ácido nucleico que codifica un polipéptido que se une específicamente a una molécula
    diana predeterminada.
  2. 2.
    Método, según la reivindicación 1, caracterizado porque la biblioteca de ADN comprende elementos de expresión lineal.
  3. 3.
    Método, según la reivindicación 1 o 2, caracterizado porque los miembros de la biblioteca del polipéptido se expresan mediante presentación en ribosomas.
  4. 4.
    Método, según la reivindicación 1 o 2, caracterizado porque los miembros de la biblioteca del polipéptido se expresan mediante presentación en bacteriófagos.
ES06700410T 2005-01-03 2006-01-02 Método de identificación de un �?cido nucleico que codifica una estructura tipo hemopexina que se une de forma espec�?fica a una molécula diana predeterminada. Active ES2376586T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP05000013 2005-01-03
EP05000013 2005-01-03
PCT/EP2006/000004 WO2006072563A2 (en) 2005-01-03 2006-01-02 Hemopexin-like structure as polypeptide-scaffold

Publications (1)

Publication Number Publication Date
ES2376586T3 true ES2376586T3 (es) 2012-03-15

Family

ID=34933192

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06700410T Active ES2376586T3 (es) 2005-01-03 2006-01-02 Método de identificación de un �?cido nucleico que codifica una estructura tipo hemopexina que se une de forma espec�?fica a una molécula diana predeterminada.

Country Status (9)

Country Link
US (1) US20090054252A1 (es)
EP (2) EP1836223B1 (es)
JP (2) JP2008526186A (es)
CN (1) CN101098887B (es)
AT (1) ATE534662T1 (es)
CA (1) CA2589060A1 (es)
ES (1) ES2376586T3 (es)
SG (1) SG171481A1 (es)
WO (1) WO2006072563A2 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE542830T1 (de) * 2006-12-04 2012-02-15 Pasteur Institut Als gerüst verwendeter ob-fold zur entwicklung neuer spezifischer bindemittel
AU2013200275B2 (en) * 2006-12-04 2014-08-14 Centre National De La Recherche Scientifique OB-fold used as scaffold for engineering new specific binders
WO2012048291A2 (en) * 2010-10-08 2012-04-12 Proteapex Therapeutics Llc Compositions and methods for inhibition of mmp:mmp-substrate interactions
RU2482856C2 (ru) 2011-08-05 2013-05-27 Общество С Ограниченной Ответственностью "Оксигон" Комплексное соединение 2-хлорпропионата цинка и 2-хлорпропионовой кислоты, фармацевтическая композиция для лечения заболеваний кожи, способ ее получения и способ лечения поражений кожи, ногтей и видимых слизистых
EP2922862B1 (en) * 2012-11-22 2019-01-02 Factor Therapeutics Limited Complex-formation-modulating agents and uses therefor

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0725838A4 (en) * 1993-10-26 1997-02-26 United Biomedical Inc STRUCTURED SYNTHETIC ANTIGAN BANKS AS DIAGNOSTICS, VACCINE AND THERAPEUTIC AGENTS
AU738782B2 (en) * 1996-05-31 2001-09-27 Scripps Research Institute, The Methods and compositions useful for inhibition of alphavbeta5 mediated angiogenesis
WO2000023564A2 (en) * 1998-10-16 2000-04-27 Xencor, Inc. Protein design automation for protein libraries
DE19932688B4 (de) 1999-07-13 2009-10-08 Scil Proteins Gmbh Design von Beta-Faltblatt-Proteinen des gamma-II-kristallins antikörperähnlichen
WO2001059066A2 (en) * 2000-02-10 2001-08-16 Xencor, Inc. Protein design automation for protein libraries
US20030082630A1 (en) * 2001-04-26 2003-05-01 Maxygen, Inc. Combinatorial libraries of monomer domains
US20030130827A1 (en) * 2001-08-10 2003-07-10 Joerg Bentzien Protein design automation for protein libraries

Also Published As

Publication number Publication date
EP1836223B1 (en) 2011-11-23
EP1836223A2 (en) 2007-09-26
EP2261243A2 (en) 2010-12-15
JP2012143235A (ja) 2012-08-02
ATE534662T1 (de) 2011-12-15
US20090054252A1 (en) 2009-02-26
WO2006072563A2 (en) 2006-07-13
CN101098887A (zh) 2008-01-02
EP2261243A3 (en) 2011-08-10
CN101098887B (zh) 2011-05-04
WO2006072563A3 (en) 2006-08-31
SG171481A1 (en) 2011-06-29
JP2008526186A (ja) 2008-07-24
CA2589060A1 (en) 2006-07-13

Similar Documents

Publication Publication Date Title
AU2010332932B2 (en) Modified ubiquitin proteins having a specific binding activity for the extradomain B of fibronectin
AU773236B2 (en) Selection of proteins using RNA-protein fusions
US10711268B2 (en) Method for producing peptide library, peptide library, and screening method
EP3044322A1 (en) Bimolecular protease-based biosensor
ES2376586T3 (es) Método de identificación de un �?cido nucleico que codifica una estructura tipo hemopexina que se une de forma espec�?fica a una molécula diana predeterminada.
Kroupova et al. Molecular architecture of the human tRNA ligase complex
JP2019525774A (ja) Rna結合ポリペプチドの標的を同定するための組成物および方法
JP4263598B2 (ja) チロシルtRNA合成酵素変異体
JP2005508194A (ja) 可溶性蛋白質ドメインの生成及び同定のための方法
US10370776B2 (en) Antibody like protein
WO2020219708A1 (en) Genetically encoded tyrosine sulfation of proteins in eukaryotes
US10870926B2 (en) Antibody like protein
JP6804467B2 (ja) 組換え型ヌクレオシド特異的リボヌクレアーゼ及びその生成法と使用法
Alena et al. Molecular architecture of the human tRNA ligase complex
WO2012161227A1 (ja) 核酸構築物、核酸-蛋白質複合体、及びその利用
KR20070035499A (ko) 폴리펩티드의 제조방법
Bir et al. MICHAEL SCHRÄML, DOROTHEE AMBROSIUS, JAN STRACKE, MARTIN LANZENDÖRFER2
Hadjivassiliou Mechanisms of pre-mRNA splicing in yeast
KR20040087358A (ko) 람다-파지의 시아이 유전자를 이용한 유비퀴틴 및 유비퀴틴-유사단백질 분해효소의 유전자 선별법