ES2668448T3 - ADN polimerasas con actividad mejorada - Google Patents

ADN polimerasas con actividad mejorada Download PDF

Info

Publication number
ES2668448T3
ES2668448T3 ES12809109.7T ES12809109T ES2668448T3 ES 2668448 T3 ES2668448 T3 ES 2668448T3 ES 12809109 T ES12809109 T ES 12809109T ES 2668448 T3 ES2668448 T3 ES 2668448T3
Authority
ES
Spain
Prior art keywords
amino acid
dna polymerase
seq
polymerase
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12809109.7T
Other languages
English (en)
Inventor
Keith Bauer
Thomas W. Myers
Shawn Suko
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Application granted granted Critical
Publication of ES2668448T3 publication Critical patent/ES2668448T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Una ADN polimerasa que tiene al menos un 80 % de identidad de secuencia con la SEQ ID NO: 1 y que tiene una eficacia de transcriptasa inversa incrementada en comparación con una ADN polimerasa de control, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es M y en la que el aminoácido correspondiente a la posición 709 de SEQ ID NO: 1 se selecciona del grupo que consiste en K, R, S, G y A, y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 616 de la SEQ ID NO: 1 es I y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es I.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCIÓN
ADN polimerasas con actividad mejorada Campo de la invención
La presente invención proporciona ADN polimerasas con actividades mejoradas, que incluyen un aumento de la eficacia de transcriptasa inversa, tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de la transcriptasa inversa (RT) y de la polimerasa, así como el uso de dichas polimerasas en diversas aplicaciones, incluyendo la extensión y amplificación de polinucleótidos de ácidos nucleicos.
Antecedentes de la invención
Las ADN polimerasas son responsables de la replicación y el mantenimiento del genoma, un papel que es fundamental para transmitir con precisión la información genética de generación a generación. Las ADN polimerasas funcionan en las células como las enzimas responsables de la síntesis del ADN. Polimerizan los desoxirribonucleósidos trifosfato en presencia de un activador de metal, tal como Mg2+, en un orden dictado por el molde de ADN o molde de polinucleótido que se copia. In vivo, las ADN polimerasas participan en un espectro de procesos de síntesis del ADN, incluyendo la replicación del ADN, reparación del ADN, recombinación y amplificación génica. Durante cada proceso de síntesis del ADN, el molde de ADN se copia una vez o, como máximo, unas pocas veces para producir réplicas idénticas. Por el contrario, in vitro, la replicación del ADN se puede repetir muchas veces, tal como, por ejemplo, durante la reacción en cadena de la polimerasa (véase, por ejemplo, la patente de EE. UU. n.° 4.683.202).
En los estudios iniciales con la reacción en cadena de la polimerasa (PCR), se añadió la ADN polimerasa al inicio de cada tanda de replicación del ADN (véase la patente de EE. UU. n.° 4.683.202, supra). Posteriormente, se determinó que se podían obtener ADN polimerasas termoestables a partir de bacterias que crecen a temperaturas elevadas y que únicamente se necesita añadir estas enzimas una vez (véase la patente de EE. UU. n.° 4.889.818 y la patente de EE. UU. n.° 4.965.188). A las temperaturas elevadas usadas durante la PCR, estas enzimas no se inactivan irreversiblemente. Como resultado, se pueden llevar a cabo ciclos repetitivos de reacciones en cadena de la polimerasa sin añadir nuevas enzimas al inicio de cada proceso de adición de síntesis. Las ADN polimerasas, particularmente las polimerasas termoestables, son la clave de un gran número de técnicas en estudios de ADN recombinante y en el diagnóstico médico de enfermedades. Para aplicaciones diagnósticas, en particular, una secuencia de ácidos nucleicos diana únicamente puede ser una pequeña porción del ADN o ARN en cuestión, de modo que puede ser difícil detectar la presencia de una secuencia de ácido nucleico diana sin amplificación.
El patrón de plegamiento global de las ADN polimerasas se asemeja a la mano derecha humana y contiene tres subdominios distintos de palma, dedos y pulgar (véase Beese et al., Science 260:352-355, 1993); Patel et al., Biochemistry 34:5351-5363, 1995). Mientras que la estructura de los subdominios de dedos y pulgar varían en gran medida entre polimerasas que difieren en tamaño y en funciones celulares, todos los subdominios catalíticos de la palma se pueden superponer. Por ejemplo, el motivo A, que interactúa con el dNTP de entrada y estabiliza el estado de transición durante la catálisis química, se puede superponer con una desviación media de aproximadamente un A entre las ADN polimerasas de la familia pol a de mamíferos y pol I de procariotas (Wang et al., Cell 89:1087-1099, 1997). El motivo A comienza estructuralmente en una cadena p antiparalela que contiene predominantemente residuos hidrófobos y continúa en una hélice a. La secuencia de aminoácidos primaria de los sitios activos de la ADN polimerasa está excepcionalmente conservada. Por ejemplo, en el caso del motivo A, se retiene la secuencia DYSQIELR (SEQ ID NO: 22) en polimerasas de organismos separados por muchos millones de años de evolución, incluyendo, por ejemplo, Thermus aquaticus, Chlamydia trachomatis y Escherichia coli.
Además de estar bien conservado, también se ha demostrado que el sitio activo de las ADN polimerasas es relativamente mutable, puede acomodar determinadas sustituciones de aminoácidos sin reducir significativamente la actividad de la ADN polimerasa (véase, por ejemplo, la patente de EE. UU. n.° 6.602.695). Dichas ADN polimerasas mutantes pueden ofrecer diversas ventajas selectivas, por ejemplo, en aplicaciones diagnósticas y de investigación que comprenden reacciones de síntesis de ácidos nucleicos.
Existen al menos dos etapas en el proceso enzimático de la polimerización del ADN; 1) la incorporación del nucleótido de entrada y 2) la extensión del nucleótido recién incorporado. En general, se considera la lealtad o "fidelidad" global de la ADN polimerasa como un conglomerado de estas dos actividades enzimáticas, pero las etapas son distintas. Una ADN polimerasa puede incorporar erróneamente el nucleótido de entrada, pero, si no se extiende eficazmente, la velocidad de extensión disminuirá de forma importante y la formación del producto global será mínima. De forma alternativa, es posible tener una ADN polimerasa que incorpore erróneamente el nucleótido de entrada y fácilmente extienda erróneamente el emparejamiento erróneo recién formado. En este caso, la velocidad de extensión global sería alta, pero la fidelidad global sería baja. Un ejemplo de este tipo de enzima sería la ADN polimerasa ES112 (ADN polimerasa E683R Z05, véase el documento US 7.179.590) cuando se usa Mn2+ como el activador de ion de metal divalente. La enzima tiene una eficacia muy alta porque, a diferencia de las ADN polimerasas típicas que tienden a vacilar/bloquearse al encontrar un emparejamiento erróneo, la ADN polimerasa ES112 extiende fácilmente el emparejamiento erróneo. El fenotipo mostrado en ES112 es más pronunciado durante la etapa de RT, supuestamente
5
10
15
20
25
30
35
40
45
50
55
60
65
a causa de los efectos estructurales del heterodúplex ARN/ADN frente al homodúplex ADN/ADN. Un segundo ejemplo sería si la ADN polimerasa fácilmente no incorpora erróneamente (puede ser incluso menos probable incorporar erróneamente), pero sí tiene capacidad incrementada para extender erróneamente un emparejamiento erróneo. En este caso, no se altera significativamente la fidelidad para el producto global. En general, este tipo de enzima es más favorable para las reacciones de extensión que las características de ES112 en Mn2+ porque se mejora la fidelidad del producto. Sin embargo, este atributo se puede utilizar para permitir la extensión errónea de un cebador oligonucleotídico emparejado erróneamente, tal como sucede cuando un cebador oligonucleotídico de una secuencia única se hibrida a una diana que tiene heterogeneidad de secuencia (por ejemplo, dianas víricas), pero la velocidad de incorporación errónea normal o más baja permite la finalización de la síntesis del ADN más allá del cebador oligonucleotídico original. Un ejemplo de este tipo de ADN polimerasa es la ADN polimerasa Z05 D580G (véase la publicación de patente de EE. UU. n.° 2009/0148891). Este tipo de actividad se denomina "tolerante al emparejamiento erróneo" a causa de que es más tolerante a los emparejamientos erróneos en el cebador oligonucleotídico. Mientras que los ejemplos anteriores han analizado las reacciones de tipo de extensión del cebador, la actividad puede ser más significativa en reacciones tales como RT-PCR y PCR en las que con frecuencia se produce nuevamente la extensión del cebador. Los datos sugieren que, aunque las enzimas, tales como Z05 D580G, son más "tolerantes" a los emparejamientos erróneos, también tienen capacidad potenciada para extender los cebadores oligonucleotídicos que contienen bases modificadas (por ejemplo, bases modificadas con t-butilbencilo) o en presencia de tintes de unión a ADN, tales como SYBR Green I (véase la publicación de patente de EE. UU. n.° 2009/028053).
La reacción en cadena de la polimerasa con transcripción inversa (RT-PCR) es una técnica usada en muchas aplicaciones para detectar y/o cuantificar dianas de ARN mediante amplificación. Para poder amplificar dianas de ARN mediante PCR, en primer lugar, es necesario transcribir de manera inversa el molde de ARN en ADNc. Típicamente, los ensayos por RT-PCR dependen de una transcriptasa inversa no termoestable (ADN polimerasa dependiente de ARN), derivada de un organismo mesófilo, para la etapa de síntesis ADNc inicial (RT). Se requiere una ADN polimerasa termoestable adicional para la amplificación del ADNc para tolerar las temperaturas elevadas requeridas para la desnaturalización del ácido nucleico en la PCR. Existen varios beneficios potenciales de usar ADN polimerasas termoactivas o termoestables generadas para realizar una transcripción inversa más eficaz para los ensayos por RT- PCR. La actividad transcriptasa inversa incrementada acoplada con la capacidad de usar temperaturas de incubación de transcripción inversa más altas, que permiten la relajación de la estructura secundaria del molde de ARN, puede dar como resultado una sensibilidad del ensayo y una eficacia de la síntesis del ADNc global más altas. Una temperatura de incubación más alta también podría incrementar la especificidad reduciendo el falso cebado en la etapa de transcripción inversa. Las enzimas con eficacia de transcripción inversa mejorada pueden simplificar el diseño del ensayo permitiendo una concentración enzimática y/o tiempos de incubación de RT reducidos. Cuando se usan dUTP y UNG, los productos de extensión no específicos que contienen dUMP que se forman durante las condiciones establecidas no restrictivas se degradan mediante UNG y no se pueden utilizar ni como cebadores ni como moldes. Cuando se usa una transcriptasa inversa no termoestable (ADN polimerasa dependiente de ARN) derivada de un organismo mesófilo, no es posible utilizar las metodologías de dUTP y UNG. (Myers, T.W. et al., Amplification of RNA: High Temperature Reverse Transcription and DNA Amplification with Thermus thermophilus DNA Polymerase, en PCR Strategies, Innis, M.A., Gelfand, D.H. y Sninsky, J.J., Eds., Academic Press, San Diego, CA, 58-68, (1995)). Sin embargo, el uso de una ADN polimerasa termoactiva o termoestable de la invención para la etapa de transcripción inversa posibilita que la reacción sea completamente compatible con la utilización del sistema de prevención de transferencia de dUTP/uracil-N-glucosilasa (UNG) (Longo et al., Use of Uracil DNA Glycosylase to Control Carry-over Contamination in Polymerase Chain Reactions. Gene 93:125-128 (1990). Además de proporcionar un control de la contaminación por transferencia, el uso de dUTP y UNG proporciona un "inicio en caliente" para reducir la amplificación no específica (Innis y Gelfand 1999).
Breve sumario de la invención
La invención se expone en las reivindicaciones adjuntas a esta descripción. En el presente documento se proporcionan ADN polimerasas que tienen actividades mejoradas, que incluyen aumento de la eficacia de transcriptasa inversa, y que pueden incluir mejora de la tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de RT y de polimerasa, en relación con una polimerasa de control no modificada correspondiente, y procedimientos de fabricación y uso de dichas ADN polimerasas. En particular, se proporciona una ADN polimerasa mejorada que tiene al menos un 80 % de identidad de secuencia con la SEQ ID NO: 1 y que tiene una eficacia de transcriptasa inversa incrementada en comparación con una ADN polimerasa de control, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es M y en la que el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 se selecciona del grupo que consiste en K, R, S, G y A, y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 616 de la SEQ ID NO: 1 es I y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es I. La ADN polimerasa mejorada puede tener la misma actividad polimerasa dependiente de ADN o sustancialmente similar en comparación con una ADN polimerasa de control. También se divulga una ADN polimerasa mejorada que comprende una secuencia de aminoácidos que es sustancialmente idéntica (por ejemplo, al menos aproximadamente un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica) a la SEQ ID NO: 1, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I. En determinados modos de realización, la ADN polimerasa comprende una secuencia de aminoácidos al menos un 90 % idéntica a la SEQ ID NO: 1. Se divulga además que el
5
10
15
20
25
30
35
40
45
50
55
60
65
aminoácido en la posición correspondiente a la posición 616 de SEQ ID NO: 1 de la polimerasa mejorada se selecciona de G, A, V, R, F, W, P, S, T, C, Y, N, Q, D, E, K, L, M o H.
También se divulga una ADN polimerasa mejorada que comprende una secuencia de aminoácidos que es sustancialmente idéntica (por ejemplo, al menos aproximadamente un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica) a la SEQ ID NO: 1, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 580 de la SEQ ID NO: 1 es cualquier aminoácido distinto de D o E. En algunos modos de realización, el aminoácido de la ADN polimerasa corresponde a la posición 580 de la SEQ ID NO: 1 es cualquier aminoácido distinto de D. En algunos modos de realización, el aminoácido de la ADN polimerasa correspondiente a la posición 580 de SEQ ID NO: 1 se selecciona del grupo que consiste en L, G, T, Q, A, S, N, R y K. En algunos modos de realización, el aminoácido de la ADN polimerasa correspondiente a la posición 580 de la sEq ID NO: 1 es G.
También se divulga una ADN polimerasa mejorada que comprende una secuencia de aminoácidos que es sustancialmente idéntica (por ejemplo, al menos aproximadamente un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica) a la SEQ ID NO: 1, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 709 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I. En el presente documento se divulga además que el aminoácido de la ADN polimerasa correspondiente a la posición 709 de la SEQ ID NO: 1 se selecciona del grupo que consiste en K, R, S, G y A y, en particular, que el aminoácido de la ADN polimerasa correspondiente a la posición 709 de la SEQ ID NO: 1 es K.
También se divulga una ADN polimerasa mejorada que comprende una secuencia de aminoácidos que es sustancialmente idéntica (por ejemplo, al menos aproximadamente un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica) a la SEQ ID NO: 1, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I, el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 es cualquier aminoácido distinto de D y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I. También se divulga una ADN polimerasa mejorada que comprende una secuencia de aminoácidos que es sustancialmente idéntica (por ejemplo, al menos aproximadamente un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica) a la SEQ ID NO: 1, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I, en la que el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 se selecciona del grupo que consiste en L, G, T, Q, A, S, N, R y K; y en la que el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 se selecciona del grupo que consiste en K, R, S, G y A. En el presente documento, el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 puede ser G y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 puede ser K. En algunos modos de realización, la ADN polimerasa mejorada comprende una secuencia de aminoácidos que tiene al menos un 80 %, 85 %, 90 % o 95 % de identidad de secuencia con la SEQ ID NO: 1, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es M, el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 es G y el aminoácido correspondiente a posición 709 de la SEQ ID NO: 1 es K. En algunos modos de realización, la ADN polimerasa tiene la misma actividad polimerasa dependiente de ADN o sustancialmente similar en comparación con la ADN polimerasa de control.
También se divulga una ADN polimerasa mejorada que tiene una eficacia de transcriptasa inversa incrementada, opcionalmente sin una disminución sustancial de la actividad polimerasa dependiente de ADN, en comparación con una ADN polimerasa de control, en la que el aminoácido de la ADN polimerasa corresponde a la posición 616 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es cualquier aminoácido distinto de I, y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 616 de la SEQ ID NO: 1 es I y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es I. En el presente documento, el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 puede ser M y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 pueden ser K. La ADN polimerasa mejorada puede comprender además una sustitución de aminoácido en el aminoácido correspondiente a posición 580 de la SEQ ID NO: 1. El aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 puede ser cualquier aminoácido distinto de I, el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 puede ser cualquier aminoácido distinto de I y el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 puede ser cualquier aminoácido distinto de D o E. También se divulga que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es M, el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es K y el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 es G.
Diversas ADN polimerasas son susceptibles de mutación de acuerdo con la presente invención. Son particularmente adecuadas las polimerasas termoestables, incluyendo polimerasas termoestables naturales de diversas especies de bacterias termófilas, así como polimerasas termoestables sintéticas derivadas de dichas enzimas naturales mediante sustitución, inserción o eliminación de aminoácidos u otra modificación. Las formas no modificadas ejemplares de polimerasa incluyen, por ejemplo, ADN polimerasa CS5, CS6 o Z05 o una ADN polimerasa funcional que tenga al menos un 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia de aminoácidos con la misma. En determinados modos de realización, la identidad de secuencia de aminoácidos es de al menos un 80 %, preferentemente de al menos un 90 % y más preferentemente de al menos un 95 %. Otras polimerasas no modificadas incluyen, por ejemplo, ADN polimerasas de
5
10
15
20
25
30
35
40
45
50
55
60
65
cualquiera de las siguientes especies de bacterias termófilas (o una ADN polimerasa funcional que tenga al menos un 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia de aminoácidos con dicha polimerasa): Thermotoga marítima; Thermus aquaticus, Thermus thermophilus; Thermus flavus; Thermus filiformis; Thermus sp. Sps17; Thermus sp. Z05; Thermotoga neopolitana; Thermosipho africanus; Thermus caldophilus, Deinococcus radiodurans, Bacillus stearothermophilus o Bacillus caldotenax. En determinados modos de realización, la identidad de secuencia de aminoácidos es de al menos un 80 %, preferentemente de al menos un 90 % y más preferentemente de al menos un 95 %. Las polimerasas adecuadas también incluyen las que tienen actividad transcriptasa inversa (RT) y/o la capacidad de incorporar nucleótidos no convencionales, tales como ribonucleótidos u otros nucleótidos modificados en 2'.
Mientras que las ADN polimerasas termoestables que poseen actividad de transcripción inversa eficaz son particularmente adecuadas para realizar RT-PCR, especialmente RT-PCR de enzima única, las ADN polimerasas termoactivas, pero no termoestables, que poseen actividad de transcripción inversa eficaz también son susceptibles de mutación de acuerdo con la presente invención. Por ejemplo, los atributos de incremento de la eficacia de transcriptasa inversa, tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de RT son útiles para la etapa de RT en una RT-PCR y esta etapa no es necesario realizarla a temperaturas que inactivarían una ADN polimerasa termoactiva, pero no termoestable. Tras la etapa de RT, para realizar la etapa de amplificación por PCR se podría añadir una ADN polimerasa termoestable o podría estar ya incluida en la mezcla de reacción. Por ejemplo, se puede combinar la ADN polimerasa mejorada descrita en el presente documento con una segunda ADN polimerasa termoestable antes de la etapa de Rt en un tampón adecuado para la extensión y amplificación de moldes ADN y ARN, como se describe en los ejemplos. Ejemplos de ADN polimerasas termoestables adecuadas se describen en la patente de EE. UU. n.° 4.889.818 y en las patentes de EE. UU. n.os 5.773.258 y 5.677.152. La segunda ADN polimerasa termoestable puede ser la ADN polimerasa AmpliTaq® (Deoxinucleósido trifosfato: ADN desoxinucleotidiltransferasa, E.C.2.7.7.7). La segunda ADN polimerasa termoestable puede ser una polimerasa termoestable inactivada reversiblemente, como se describe a continuación. La polimerasa termoestable inactivada reversiblemente puede ser la ADN polimerasa AmpliTaq Gold® (Roche Applied Science, Indianápolis, IN, EE. UU.). Esta segunda metodología se beneficiaría especialmente del uso de una ADN polimerasa termoestable modificada químicamente (u otra tecnología HotStart para inactivar la ADN polimerasa termoestable), de modo que no sea completamente activa durante la etapa de RT. Un ejemplo de una ADN polimerasa termoactiva, pero no termoestable, que posee actividad de transcripción inversa eficaz es la ADN polimerasa de Carboxydothermus hydrogenoformans (Chy); véanse, por ejemplo, las patentes de EE. UU. n.os 6.468.775 y 6.399.320.
La ADN polimerasa puede tener al menos un 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % de identidad de secuencia de aminoácidos con respecto a la SEQ ID NO: 1. La identidad de secuencia de aminoácidos es de al menos un 80 %, preferentemente de al menos un 90 % y más preferentemente de al menos un 95 %. La ADN polimerasa puede ser una ADN polimerasa de la Thermus sp. Z05 (Z05) (es decir, SEQ ID NO: 1), y el aminoácido en la posición 616 es cualquier aminoácido distinto de I. Por ejemplo, el aminoácido en la posición 616 se puede seleccionar de G, A, V, R, F, W, P, S, T, C, Y, N, Q, D, E, K, L, M o H. La ADN polimerasa puede ser una ADN polimerasa Z05, y el aminoácido en la posición 616 puede ser M. La ADN polimerasa puede ser una ADN polimerasa Z05 que comprende además una sustitución en la posición 580, y el aminoácido en la posición 580 puede ser cualquier aminoácido distinto de D o E. La ADN polimerasa puede ser una ADN polimerasa Z05, y el aminoácido en la posición 580 puede ser cualquier aminoácido distinto de D. La ADN polimerasa puede ser una ADN polimerasa Z05, y el aminoácido en la posición 580 se puede seleccionar del grupo que consiste en L, G, T, Q, A, S, N, R y K. La ADN polimerasa puede ser una ADN polimerasa Z05, y el aminoácido en la posición 580 puede ser G. La ADN polimerasa puede ser una ADN polimerasa Z05 que comprende además una sustitución en la posición 709, y el aminoácido en la posición 709 puede ser cualquier aminoácido distinto de I. La ADN polimerasa puede ser una ADN polimerasa Z05, y el aminoácido en la posición 709 se puede seleccionar del grupo que consiste en K, R, S, G y A. La ADN polimerasa puede ser una ADN polimerasa Z05, y el aminoácido en la posición 709 puede ser K.
La ADN polimerasa de control puede ser una polimerasa Z05, Z05 D580G o Z05 D580G 1709K.
Las polimerasas mutantes o mejoradas pueden incluir otras modificaciones no sustitutivas. Una de dichas modificaciones es una modificación covalente reversible térmicamente que inactiva la enzima, pero que se invierte para activar la enzima tras la incubación a una temperatura elevada, tal como una temperatura usada típicamente para la extensión de polinucleótidos. Los reactivos ejemplares para dichas modificaciones reversibles térmicamente se describen en las patentes de EE. UU. n.os 5.773.258 y 5.677.152.
La actividad transcriptasa inversa se puede determinar realizando amplificación por RT-PCR en tiempo real y detección de un transcrito del virus de la hepatitis C (VHC) generado a partir de las primeras 800 bases de la 5'NTR del genotipo Ib del VHC en pSP64 poli(A) (Promega). Dos o más mezclas de reacción pueden tener números valorados de copias del transcrito del virus de la hepatitis C (VHC) (por ejemplo, valoraciones 1:5, valoraciones 1:10, por ejemplo, 10 000 copias, 1000 copias, 100 copias, 10 copias, 1 copia, 0 copias en varias mezclas de reacción). La capacidad de transcriptasa inversa de una polimerasa de la invención se puede comparar con la capacidad de transcriptasa inversa de una polimerasa de referencia (por ejemplo, una polimerasa natural, no modificada o de control), durante una unidad
5
10
15
20
25
30
35
40
45
50
55
60
65
de tiempo preseleccionada, como se describe en el presente documento. Las polimerasas con capacidad de transcriptasa inversa mejorada amplificarán el transcrito con mayor eficacia o requerirán un número más bajo de ciclos de PCR para amplificar el transcrito (es decir, presentan un valor de Pc más bajo, como se calcula en el presente documento), en comparación con una polimerasa natural o no modificada. Además, las polimerasas con función de RT mejorada también tienen replicación mejorada de moldes de ARN largos (por ejemplo, al menos 500 o 1000 o 2000 o 5000 o más nucleótidos de longitud). La eficacia de transcriptasa inversa mejorada puede incluir un tiempo de transcripción inversa más corto en comparación con una polimerasa de control. Por lo tanto, las polimerasas con eficacia de transcriptasa inversa incrementada transcribirán de manera inversa un molde de ARN más rápidamente que una polimerasa de control o de referencia.
En otros diversos aspectos, la presente invención proporciona un ácido nucleico recombinante que codifica una ADN polimerasa mutante o mejorada de la invención, un vector que comprende el ácido nucleico recombinante y una célula huésped transformada con el vector. En determinados modos de realización, el vector es un vector de expresión. Las células huésped que comprenden dichos vectores de expresión son útiles en los procedimientos de la invención para producir la polimerasa mutante o mejorada cultivando las células huésped en condiciones adecuadas para la expresión del ácido nucleico recombinante. Las polimerasas de la invención pueden estar contenidas en kits y/o mezclas de reacción. Los aspectos de los ácidos nucleicos recombinantes, células huésped, vectores, vectores de expresión, mezclas de reacción y kits son como se describe anteriormente y en el presente documento.
En otro aspecto más se proporciona un procedimiento para llevar a cabo la extensión de polinucleótidos. El procedimiento incluye, en general, poner en contacto una ADN polimerasa que tenga incremento de la eficacia de transcriptasa inversa, tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de RT y de polimerasa de la invención con un cebador, un molde de polinucleótido y nucleósidos trifosfato en condiciones adecuadas para la extensión del cebador, produciendo de este modo un cebador extendido. Por ejemplo, el molde de polinucleótido puede ser un molde de ARN o ADN. En determinados modos de realización, la extensión de cebador comprende una etapa de transcripción inversa de menos de aproximadamente cinco minutos. En algunos modos de realización, las condiciones adecuadas para la extensión comprenden Mg2+. Los nucleótidos trifosfato pueden incluir nucleótidos no convencionales, tales como, por ejemplo, ribonucleótidos y/o nucleótidos marcados. Además, el cebador y/o el molde pueden incluir uno o más análogos de nucleótidos. En algunas variaciones, el procedimiento de extensión de polinucleótidos es un procedimiento para la amplificación de polinucleótidos que incluye poner en contacto la ADN polimerasa mutante o mejorada con un par de cebadores, el molde de polinucleótido y los nucleósidos trifosfato en condiciones adecuadas para la amplificación del polinucleótido. La reacción de extensión de polinucleótidos puede ser, por ejemplo, PCR, extensión isotérmica o secuenciación (por ejemplo, la reacción de secuenciación 454). En determinados modos de realización, el procedimiento de extensión del cebador comprende una reacción en cadena de la polimerasa (PCR). El molde de polinucleótido puede ser de cualquier tipo de muestra biológica.
Opcionalmente, la reacción de extensión del cebador comprende un inhibidor real o potencial de una polimerasa de referencia o no modificada. El inhibidor puede inhibir la velocidad de extensión de ácido nucleico y/o la eficacia de transcripción inversa de una polimerasa de referencia o no modificada (de control). El inhibidor puede ser hemoglobina, o un producto de degradación de la misma. Por ejemplo, el producto de degradación de hemoglobina puede ser un producto de descomposición de hemo, tal como hemina, hematoporfirina o bilirrubina. El inhibidor puede ser un quelante de hierro o un pigmento púrpura. El inhibidor puede ser heparina o melanina. El inhibidor puede ser un tinte intercalante. En el presente documento, el tinte intercalante puede ser [2-[N-bis-(3-dimetilaminopropil)-amino]-4-[2,3- dihidro-3-metil-(benzo-1,3-tiazol-2-il)-metiliden]-1-fenil-quinolinio]+. El tinte intercalante puede ser [2-[N-(3- dimetilaminopropil)-N-propilamino]-4-[2,3-dihidro-3-metil-(benzo-1,3-tiazol-2-il)-metiliden]-1-fenil-quinolinio]+. El tinte intercalante puede no ser [2-[N-(3-dimetilaminopropil)-N-propilamino]-4-[2,3-dihidro-3-metil-(benzo-1,3-tiazol-2-il)- metiliden]-1-fenil-quinolinio]+. Las condiciones adecuadas para la extensión pueden comprender Mg++. Las condiciones adecuadas para la extensión pueden comprender Mn++.
La presente invención también proporciona un kit útil en dicho procedimiento de extensión de polinucleótidos. El kit incluye al menos un recipiente que proporciona la ADN polimerasa mejorada de acuerdo con la invención. En determinados modos de realización, el kit incluye además uno o más recipientes adicionales que proporcionan uno o más reactivos adicionales. Por ejemplo, en variaciones específicas, el uno o más recipientes adicionales proporcionan nucleósidos trifosfato; un tampón adecuado para la extensión de polinucleótidos; y/o uno o más polinucleótidos de sonda o cebador, hibridables, en condiciones de extensión de polinucleótidos, a un molde de polinucleótido predeterminado. El molde de polinucleótido puede ser de cualquier tipo de muestra biológica.
Se proporcionan además mezclas de reacción que comprenden las polimerasas de la invención. Las mezclas de reacción también pueden contener un ácido nucleico molde (ADN y/o ARN), uno o más polinucleótidos de sonda o cebador, nucleósidos trifosfato (incluyendo, por ejemplo, desoxirribonucleósidos trifosfato, ribonucleósidos trifosfato, nucleósidos trifosfato marcados, nucleósidos trifosfato no convencionales), tampones, sales, marcadores (por ejemplo, fluoróforos). Las mezclas de reacción pueden comprender un quelante de hierro o un tinte púrpura. Las mezclas de reacción pueden comprender hemoglobina o un producto de degradación de hemoglobina. Por ejemplo, los productos de degradación de hemoglobina pueden incluir productos de descomposición de hemo, tales como hemina, hematina, hematoporfirina y bilirrubina. Las mezclas de reacción pueden comprender heparina o una sal de la misma.
5
10
15
20
25
30
35
40
45
50
55
60
65
Opcionalmente, la mezcla de reacción puede comprender un tinte intercalante (incluyendo, pero no limitado a los descritos anteriormente o en otra parte en el presente documento). La mezcla de reacción puede contener un ácido nucleico molde que se aísla de la sangre. El ácido nucleico molde puede ser ARN y la mezcla de reacción puede comprender heparina o una sal de la misma. La mezcla de reacción puede comprender además Mg2+.
La mezcla de reacción puede comprender además una segunda ADN polimerasa termoestable. La mezcla de reacción puede comprender dos o más polimerasas. Por ejemplo, la mezcla de reacción puede comprender una ADN polimerasa mejorada que tenga eficacia de transcripción inversa incrementada (por ejemplo, actividad incrementada de extensión de un molde de ARN) como se describe en el presente documento, y otra polimerasa que tenga actividad polimerasa dependiente de ADN. La mezcla de reacción puede comprender una combinación de una ADN polimerasa mejorada que tenga eficacia de transcripción inversa incrementada como se describe en el presente documento y una segunda polimerasa dependiente de ADN termoestable. La segunda polimerasa dependiente de ADN termoestable puede ser una polimerasa modificada reversiblemente como se describe anteriormente, de tal manera que la enzima sea inactiva a temperaturas adecuadas para la etapa de transcripción inversa, pero se active en condiciones adecuadas, por ejemplo, a temperaturas elevadas de aproximadamente 90 °C a 100 °C durante un periodo de tiempo de hasta aproximadamente 12 minutos. Las condiciones adecuadas para la activación de una polimerasa termoestable inactivada reversiblemente se proporcionan, por ejemplo, en una reacción de PCR de inicio en caliente, como se describe en los ejemplos. Ejemplos de segundas polimerasas dependientes de ADN termoestables adecuadas se describen en las patentes de EE. UU. n.os 5.773.258 y 5.677.152, supra.
Definiciones
A menos que se definan de otro modo, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que entiende comúnmente un experto en la técnica a la que pertenece esta invención. Aunque se puede usar esencialmente cualquier procedimiento y material similar a los descritos en el presente documento, en la práctica o pruebas de la presente invención, únicamente se describen procedimientos y materiales ejemplares. Para los propósitos de la presente invención, se definen a continuación los siguientes términos.
Los términos "un", "una" y "el/la" incluyen referentes al plural a menos que el contexto indique claramente lo contrario.
Un "aminoácido" se refiere a cualquier unidad monomérica que se puede incorporar en un péptido, polipéptido o proteína. Como se usa en el presente documento, el término "aminoácido" incluye los siguientes veinte aminoácidos alfa naturales o genéticamente codificados: alanina (Ala o A), arginina (Arg o R), asparagina (Asn o N), ácido aspártico (Asp o D), cisteína (Cys o C), glutamina (Gln o Q), ácido glutámico (Glu o E), glicina (Gly o G), histidina (His o H), isoleucina (Ile o I), leucina (Leu o L), lisina (Lys o K), metionina (Met o M), fenilalanina (Phe o F), prolina (Pro o P), serina (Ser o S), treonina (Thr o T), triptófano (Trp o W), tirosina (Tyr o Y) y valina (Val o V). En casos en los que los residuos "X" no están definidos, estos se deben definir como "cualquier aminoácido". Las estructuras de estos veinte aminoácidos naturales se muestran, por ejemplo, en Stryer et al., Biochemistrv. 5.a ed., Freeman and Company (2002). Los aminoácidos adicionales, tales como selenocisteína y pirrolisina, también se pueden codificar genéticamente (Stadtman (1996) "Selenocysteine," Annu Rev Biochem. 65:83-100 e Ibba et al. (2002) "Genetic code: introducing pyrrolysine", Curr Biol. 12(13):R464-R466). El término "aminoácido" también incluye aminoácidos no naturales, aminoácidos modificados (por ejemplo, con cadenas laterales y/o esqueletos modificados y análogos de aminoácidos (véase, por ejemplo, Zhang et al. (2004) "Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells," Proc. Natl. Acad. Sci. U.S.A. 101(24):8882-8887, Anderson et al. (2004) "An expanded genetic code with a functional quadruplet codon" Proc. Natl. Acad. Sci. U.S.A. 101(20):7566-7571, Ikeda et al. (2003) "Synthesis of a novel histidine analogue and its efficient incorporation into a protein in vivo," Protein Eng. Des. Sel. 16(9):699-706, Chin et al. (2003) "An Expanded Eukaryotic Genetic Code," Science 301(5635):964-967, James et al. (2001) "Kinetic characterization of ribonuclease S mutants containing photoisomerizable phenylazophenylalanine residues," Protein Eng. Des. Sel. 14(12):983-991, Kohrer et al. (2001) "Import of amber and ochre suppressor tRNAs into mammalian cells: A general approach to site-specific insertion of amino acid analogues into proteins," Proc. Natl. Acad. Sci. U.S.A. 98(25): 14310-14315, Bacher et al. (2001) "Selection and Characterization of Escherichia coli Variants Capable of Growth on an Otherwise Toxic Tryptophan Analogue," J. Bacteriol. 183(18):5414-5425, Hamano-Takaku et al. (2000) "A Mutant Escherichia coli Tyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine," J. Biol. Chem. 275(51):40324-40328, y Budisa et al. (2001) "Proteins with {beta}- (thienopyrrolyl)alanines as alternative chromophores and pharmaceutically active amino acids," Protein Sci. 10(7): 1281-1292).
Como ilustración adicional, un aminoácido es típicamente un ácido orgánico que incluye un grupo amino sustituido o no sustituido, un grupo carboxi sustituido o no sustituido y una o más cadenas laterales o grupos, o análogos de cualquiera de estos grupos. Las cadenas laterales ejemplares incluyen, por ejemplo, tiol, seleno, sulfonilo, alquilo, arilo, acilo, ceto, azido, hidroxilo, hidracina, ciano, halo, hidracida, alquenilo, alquinilo, éter, borato, boronato, fosfo, fosfono, fosfina, heterociclo, enona, imina, aldehído, éster, tioácido, hidroxilamina o cualquier combinación de estos grupos. Otros aminoácidos representativos incluyen, pero no están limitados a, aminoácidos que comprenden reticuladores fotoactivables, aminoácidos de unión a metal, aminoácidos con marcaje de espín, aminoácidos fluorescentes, aminoácidos que contienen metal, aminoácidos con grupos funcionales novedosos, aminoácidos que interactúan covalente o no covalentemente con otras moléculas, aminoácidos fotoenmascarados y/o
5
10
15
20
25
30
35
40
45
50
55
60
65
fotoisomerizables, aminoácidos radiactivos, aminoácidos que comprenden biotina o un análogo de biotina, aminoácidos glucosilados, aminoácidos modificados con otros hidratos de carbono, aminoácidos que comprenden polietilenglicol o poliéter, aminoácidos sustituidos con átomos pesados, aminoácidos químicamente escindibles y/o fotoescindibles, aminoácidos que contienen un azúcar unido por enlace a carbono, aminoácidos activos en oxidorreducción, aminoácidos que contienen aminotioácidos y aminoácidos que comprenden uno o más restos tóxicos.
El término "muestra biológica" abarca una variedad de tipos de muestras obtenidos de un organismo y que se pueden usar en un ensayo de supervisión o diagnóstico. El término abarca orina, sedimento de orina, sangre, saliva y otras muestras líquidas de origen biológico, muestras de tejidos sólidos, tales como una muestra de biopsia o cultivos tisulares o células derivadas de los mismos y la descendencia de los mismos. El término abarca muestras que se hayan manipulado de cualquier manera después de su adquisición, tal como mediante tratamiento con reactivos, solubilización, sedimentación o enriquecimiento para determinados componentes. El término abarca una muestra clínica y también incluye células en cultivo celular, sobrenadantes celulares, lisados celulares, suero, plasma, líquidos biológicos y muestras de tejidos.
El término ''mutante1', en el contexto de las ADN polimerasas de la presente invención, significa un polipéptido, típicamente recombinante, que comprende una o más sustituciones de aminoácidos en relación con una ADN polimerasa funcional correspondiente.
El término "forma no modificada", en el contexto de una polimerasa mutante, es un término usado en el presente documento para los propósitos de definir una ADN polimerasa mutante de la presente invención: el término "forma no modificada" se refiere a una ADN polimerasa funcional que tiene la secuencia de aminoácidos de la polimerasa mutante, excepto en una o más posiciones de aminoácidos especificadas que caracterizan la polimerasa mutante. Por lo tanto, la referencia a una ADN polimerasa mutante en términos de (a) su forma no modificada y (b) una o más sustituciones de aminoácidos especificadas significa que, con excepción de las sustituciones de aminoácidos especificadas, la polimerasa mutante tiene por lo demás una secuencia de aminoácidos idéntica a la forma no modificada en el motivo especificado. La "polimerasa no modificada" (y, por lo tanto, también la forma modificada que tiene incremento de la eficacia de transcriptasa inversa, tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de polimerasa y RT) puede contener mutaciones adicionales para proporcionar la funcionalidad deseada, por ejemplo, incorporación mejorada de didesoxirribonucleótidos, ribonucleótidos, análogos de ribonucleótidos, nucleótidos marcados con tinte, actividad 5'-nucleasa moduladora, actividad 3'-nucleasa moduladora (o corrección de errores) o similares. En consecuencia, al llevar a cabo la presente invención como se describe en el presente documento, se predetermina la forma no modificada de una ADN polimerasa. La forma no modificada de una ADN polimerasa puede ser, por ejemplo, una ADN polimerasa natural o una ADN polimerasa que ya se ha modificado intencionadamente. Una forma no modificada de la polimerasa es preferentemente una ADN polimerasa termoestable, tal como ADN polimerasas de diversas bacterias termófilas, así como variantes funcionales de las mismas que tienen identidad de secuencia sustancial con respecto a una polimerasa termoestable natural. Dichas variantes pueden incluir, por ejemplo, ADN polimerasas quiméricas, tales como, por ejemplo, las ADN polimerasas quiméricas descritas en las patentes de EE. UU. n.os 6.228.628 y 7.148.049. En determinados modos de realización, la forma no modificada de una polimerasa tiene actividad transcriptasa inversa (RT).
El término "polimerasa termoestable" se refiere a una enzima que es estable frente al calor, es resistente al calor y retiene suficiente actividad para efectuar reacciones de extensión de polinucleótidos posteriores y no se desnaturaliza (inactiva) irreversiblemente cuando se somete a temperaturas elevadas durante el tiempo necesario para efectuar la desnaturalización de los ácidos nucleicos bicatenarios. Las condiciones de calentamiento necesarias para la desnaturalización de ácidos nucleicos se conocen bien en la técnica y se ejemplifican, por ejemplo, en las patentes de EE. UU. n.os 4.683.202, 4.683.195 y 4.965.188. Como se usa en el presente documento, una polimerasa termoestable es adecuada para su uso en una reacción de ciclos de temperatura, tal como la reacción en cadena de la polimerasa ("PCR"). La desnaturalización irreversible para los propósitos del presente documento se refiere a la pérdida permanente y completa de actividad enzimática. Para una polimerasa termoestable, la actividad enzimática se refiere a la catálisis de la combinación de los nucleótidos de manera apropiada para formar productos de extensión de polinucleótidos que sean complementarios a una hebra de ácido nucleico molde. Las ADN polimerasas termoestables de bacterias termófilas incluyen, por ejemplo, ADN polimerasas de Thermotoga marítima, Thermus aquaticus, Thermus thermophilus, Thermus flavus, Thermus filiformis, especie sps17 de Thermus, especie Z05 de Thermus, Thermus caldophilus, Bacillus caldotenax, Thermotoga neopolitana y Thermosipho africanus.
El término "termoactiva" se refiere a una enzima que mantiene las propiedades catalíticas a las temperaturas usadas comúnmente para la transcripción inversa o etapas de hibridación/extensión en reacciones de RT-PCR y/o PCR (es decir, 45-80 °C). Las enzimas termoestables son las que no se inactivan o desnaturalizan irreversiblemente cuando se someten a las elevadas temperaturas necesarias para la desnaturalización de ácidos nucleicos. Las enzimas termoactivas pueden ser o no termoestables. Las ADN polimerasas termoactivas pueden ser dependientes de ADN o ARN de especies termófilas o de especies mesófilas incluyendo, pero no limitadas a, Escherichia coli, los virus de la leucemia murina de Moloney y los virus de la mieloblastosis aviar.
Como se usa en el presente documento, una proteína "quimérica" se refiere a una proteína cuya secuencia de aminoácidos representa un producto de fusión de subsecuencias de las secuencias de aminoácidos de al menos dos
5
10
15
20
25
30
35
40
45
50
55
60
65
proteínas distintas. Una proteína quimérica no se produce típicamente mediante manipulación directa de secuencias de aminoácidos, sino que, más bien, se expresa a partir de un gen "quimérico" que codifica la secuencia de aminoácidos quimérica. Por ejemplo, una forma no modificada de una ADN polimerasa mutante como se divulga en el presente documento es una proteína quimérica que consiste en una región de extremo amínico (extremo N) derivada de una ADN polimerasa de una especie Thermus y una región de extremo carboxílico (extremo C) derivada de ADN polimerasa de Tma. La región de extremo N se refiere a una región que se extiende desde el extremo N (posición de aminoácido 1) hacia un aminoácido interno. De manera similar, la región de extremo C se refiere a una región que se extiende desde un aminoácido interno hacia el extremo C.
El término "aptámero" se refiere a un ADN monocatenario que reconoce y se une a ADN polimerasa e inhibe eficazmente la actividad polimerasa como se describe en la patente de EE. UU. n.° 5.693.502. El uso de aptámero y dUTP/UNG en RT-PCR también se analiza, por ejemplo, en Smith, E.S. et al., (Amplification of RNA: High-temperature Reverse Transcription and ADN Amplification with a Magnesium-activated Thermostable ADN Polymerase, en PCR Primer: A Laboratory Manual, 2.a edición, Dieffenbach, C.W. y Dveksler, G.S., Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nueva York, 211-219, (2003)).
En el contexto de las ADN polimerasas mutantes, la "correspondencia" con otra secuencia (por ejemplo, regiones, fragmentos, posiciones de aminoácidos o nucleótidos, o similares) se basa en la convención de numeración de acuerdo con el número de posición de aminoácidos o nucleótidos y, a continuación, en la alineación de las secuencias de una manera que maximice el porcentaje de identidad de secuencia. Un aminoácido "correspondiente a la posición [X] de [secuencia específica]" se refiere a un aminoácido en un polipéptido de interés que se alinea con el aminoácido equivalente de una secuencia especificada. En general, como se describe en el presente documento, el aminoácido correspondiente a una posición de una polimerasa se puede determinar usando un algoritmo de alineación, tal como BLAST, como se describe a continuación. Puesto que no todas las posiciones en una "región correspondiente" dada necesitan ser idénticas, las posiciones de no emparejamiento de una región correspondiente se pueden considerar como "posiciones correspondientes". En consecuencia, como se usa en el presente documento, la referencia a una "posición de aminoácido correspondiente a la posición de aminoácido [X]" de una ADN polimerasa especificada se refiere a posiciones equivalentes, basadas en la alineación, en otras ADN polimerasas y familias y homólogos estructurales. En algunos modos de realización de la presente invención, la "correspondencia" de las posiciones de aminoácidos se determina con respecto a una región de la polimerasa que comprende uno o más motivos de la SEQ ID NO: 1. Cuando una secuencia de polipéptidos de polimerasa difiere de la SEQ ID NO: 1 (por ejemplo, por cambios en aminoácidos o adición o eliminación de aminoácidos), puede ser que una mutación particular asociada con la actividad mejorada como se analiza en el presente documento no esté en la misma posición que en la SEQ ID NO: 1. Esto se ilustra, por ejemplo, en la tabla 1.
"Recombinante", como se usa en el presente documento, se refiere a una secuencia de aminoácidos o una secuencia de nucleótidos que se ha modificado intencionadamente mediante procedimientos recombinantes. El término "ácido nucleico recombinante" en el presente documento significa un ácido nucleico, formado originalmente in vitro, en general, mediante la manipulación de un ácido nucleico por endonucleasas de restricción, en una forma que no se encuentra normalmente en la naturaleza. Por lo tanto, un ácido nucleico de ADN polimerasa mutante aislado, en una forma lineal, o un vector de expresión formado in vitro ligando moléculas de ADN que no están unidas normalmente se consideran ambos recombinantes para los propósitos de la presente invención. Se entiende que, una vez que se prepara un ácido nucleico recombinante y se reintroduce en una célula huésped, se replica de manera no recombinante, es decir, usando la maquinaria celular in vivo de la célula huésped en lugar de las manipulaciones in vitro; sin embargo, dichos ácidos nucleicos, una vez producidos de manera recombinante, aunque se replican de manera no recombinante posteriormente, todavía se consideran recombinantes para los propósitos de la invención. Una "proteína recombinante" es una proteína preparada usando técnicas recombinantes, es decir, a través de la expresión de un ácido nucleico recombinante como se representa anteriormente.
Un ácido nucleico está "enlazado de forma funcional" cuando está situado en una relación funcional con otra secuencia de ácido nucleico. Por ejemplo, un promotor o potenciador está enlazado de forma funcional a una secuencia codificante si afecta a la transcripción de la secuencia; o un sitio de unión a ribosoma está enlazado de forma funcional a una secuencia codificante si está ubicado para facilitar la traducción.
El término "célula huésped" se refiere tanto a organismos procariotas y eucariotas unicelulares (por ejemplo, bacterias, levaduras y actinomicetos) como a células sueltas de animales o plantas de orden superior cuando se cultivan en cultivo celular.
El término "vector" se refiere a una porción de ADN, típicamente bicatenario, que puede tener insertada en la misma una porción de ADN exógeno. El vector puede ser, por ejemplo, de origen plasmídico. Los vectores contienen secuencias de polinucleótidos de "replicón" que facilitan la replicación autónoma del vector en una célula huésped. El ADN exógeno se define como ADN heterógeno, que es ADN no encontrado de forma natural en la célula huésped, que, por ejemplo, replica la molécula del vector, codifica un marcador seleccionable o cribable, o codifica un transgén. El vector se usa para transportar el ADN exógeno o heterógeno a una célula huésped adecuada. Una vez en la célula huésped, el vector se puede replicar independientemente o coincidiendo con el ADN cromosómico del huésped y se pueden generar varias copias del vector y de su ADN insertado. Además, el vector también puede contener los
5
10
15
20
25
30
35
40
45
50
55
60
65
elementos necesarios que permiten la transcripción del ADN insertado en una molécula de ARNm o provocar de otro modo la replicación del ADN insertado en múltiples copias de ARN. Algunos vectores de expresión contienen adicionalmente elementos de secuencia adyacentes al ADN insertado que incrementan la semivida del ARNm expresado y/o permiten la traducción del ARNm en una molécula de proteína. Por lo tanto, se pueden sintetizar rápidamente muchas moléculas de ARNm y polipéptido codificadas por el ADN insertado.
El término "nucleótido", además de hacer referencia a los monómeros de desoxirribonucleótido o ribonucleótido naturales, en el presente documento se entenderá que se refiere a variantes estructurales relacionadas del mismo, incluyendo derivados y análogos, que son funcionalmente equivalentes con respecto al contexto particular en el que se usa el nucleótido (por ejemplo, hibridación a una base complementaria), a menos que el contexto indique claramente otra cosa.
El término "ácido nucleico" o "polinucleótido" se refiere a un polímero que se puede corresponder con un polímero de ácido nucleico de ribosa (ARN) o ácido nucleico de desoxirribosa (ADN), o un análogo del mismo. Esto incluye polímeros de nucleótidos tales como ARN y ADN, así como formas sintéticas, formas modificadas (por ejemplo, modificadas química o bioquímicamente) de los mismos y polímeros mixtos (por ejemplo, que incluyen tanto subunidades de ADN como de ARN). Las modificaciones ejemplares incluyen metilación, sustitución de uno o más de los nucleótidos naturales por un análogo, modificaciones internucleotídicas, tales como enlaces no cargados (por ejemplo, metilfosfonatos, fosfotriésteres, fosfoamidatos, carbamatos y similares), restos colgantes (por ejemplo, polipéptidos), intercalantes (por ejemplo, acridina, soraleno y similares), quelantes, alquilantes y enlaces modificados (por ejemplo, ácidos nucleicos anoméricos alfa y similares). También se incluyen moléculas sintéticas que imitan a los polinucleótidos en su capacidad para unirse a una secuencia designada por medio de enlaces de hidrógeno y otras interacciones químicas. Típicamente, los monómeros de nucleótidos están unidos a través de enlaces fosfodiéster, aunque las formas sintéticas de los ácidos nucleicos pueden comprender otros enlaces (por ejemplo, ácidos nucleicos peptídicos como se describe en Nielsen et al. (Science 254: 1497-1500, 1991). Por ejemplo, un ácido nucleico puede ser o puede incluir un cromosoma o segmento cromosómico, un vector (por ejemplo, un vector de expresión), un casete de expresión, un polímero de ARN o ADN no marcado, el producto de una reacción en cadena de la polimerasa (PCR), un oligonucleótido, una sonda y un cebador. Un ácido nucleico puede ser, por ejemplo, monocatenario, bicatenario o tricatenario y no está limitado a ninguna longitud particular. A menos que se indique de otro modo, una secuencia de ácido nucleico particular opcionalmente comprende o codifica secuencias complementarias, además de cualquier secuencia indicada explícitamente.
El término "oligonucleótido" se refiere a un ácido nucleico que incluye al menos dos unidades monoméricas de ácido nucleico (por ejemplo, nucleótidos). Un oligonucleótido incluye típicamente desde aproximadamente seis a aproximadamente 175 unidades monoméricas de ácido nucleico, más típicamente desde aproximadamente ocho a aproximadamente 100 unidades monoméricas de ácido nucleico, y todavía más típicamente desde aproximadamente 10 a aproximadamente 50 unidades monoméricas de ácido nucleico (por ejemplo, aproximadamente 15, aproximadamente 20, aproximadamente 25, aproximadamente 30, aproximadamente 35 o más unidades monoméricas de ácido nucleico). El tamaño exacto de un oligonucleótido depende de muchos factores, incluyendo el uso o función final del oligonucleótido. Los oligonucleótidos se preparan opcionalmente mediante cualquier procedimiento adecuado, incluyendo, pero no limitado a, aislamiento de una secuencia existente o natural, replicación o amplificación del ADN, transcripción inversa, clonación y digestión de restricción de secuencias apropiadas, o síntesis química directa mediante un procedimiento tal como el procedimiento de fosfotriéster de Narang et al. (Meth. Enzymol. 68:90-99, 1979); el procedimiento de fosfodiéster de Brown et al. (Meth. Enzymol. 68:109-151, 1979); el procedimiento de dietilfosforamidita de Beaucage et al. (Tetrahedron Lett. 22:1859-1862, 1981); el procedimiento de triéster de Matteucci et al. (J. Am. Chem. Soc. 103:3185-3191, 1981); procedimientos de síntesis automatizados; o el procedimiento en soporte sólido de la patente de EE. UU. n.° 4.458.066 u otros procedimientos conocidos por el experto en la técnica.
El término "cebador", como se usa en el presente documento, se refiere a un polinucleótido que puede actuar como un punto de iniciación de la síntesis de ácidos nucleicos dirigida por molde cuando se dispone en condiciones en las que se inicia la extensión de polinucleótidos (por ejemplo, en condiciones que comprenden la presencia de nucleósidos trifosfato requeridos (según dicta el molde que se copia) y una polimerasa en un tampón apropiado y a una temperatura o uno o más ciclos de temperatura adecuados (por ejemplo, como en una reacción en cadena de la polimerasa)). Como ilustración adicional, también se pueden usar los cebadores en una variedad de otros procedimientos de síntesis mediados por oligonucleótidos, incluyendo como iniciadores de la síntesis de ARN de novo y procedimientos relacionados con la transcripción in vitro (por ejemplo, amplificación basada en secuencias de ácidos nucleicos (NASBA), amplificación mediada por transcripción (TMA), etc.). Un cebador es típicamente un oligonucleótido monocatenario (por ejemplo, oligodesoxirribonucleótido). La longitud apropiada de un cebador depende del uso pretendido del cebador, pero típicamente varía desde 6 a 40 nucleótidos, más típicamente desde 15 a 35 nucleótidos. Las moléculas de cebador cortas requieren, en general, temperaturas más bajas para formar complejos híbridos suficientemente estables con el molde. Un cebador no necesita reflejar la secuencia exacta del molde, pero esta debe ser suficientemente complementaria para hibridarse con un molde y que se produzca la elongación del cebador. El término "par de cebadores" puede significar un conjunto de cebadores que incluye un cebador codificante 5' (a veces llamado "directo") que se hibrida con el complemento del extremo 5' de la secuencia de ácido nucleico que se va a amplificar y un cebador no codificante 3' (a veces llamado "inverso") que se hibrida con el extremo 3' de la secuencia
5
10
15
20
25
30
35
40
45
50
55
60
65
que se va a amplificar (por ejemplo, si la secuencia diana se expresa como ARN o es un ARN). Un cebador se puede marcar, si se desea, incorporando un marcador detectable mediante medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos o químicos. Por ejemplo, los marcadores útiles incluyen 32P, tintes fluorescentes, reactivos electrodensos, enzimas (usadas comúnmente en ensayos ELISA), biotina o haptenos y proteínas para los que hay antisueros o anticuerpos monoclonales disponibles.
El término "convencional" o "natural", cuando hace referencia a bases de ácidos nucleicos, nucleósidos trifosfato o nucleótidos, se refiere a los que se producen de forma natural en el polinucleótido que se describe (es decir, para el ADN estos son dATP, dGTP, dCTP y dTTP). Adicionalmente, con frecuencia se utilizan dITP y 7-desaza-dGTP en lugar de dGTP y se puede utilizar 7-desaza-dATP en lugar de dATP en reacciones de síntesis de ADN in vitro, tales como secuenciación. Colectivamente, estos se pueden denominar dNTP.
El término "no convencional" o "modificado", cuando se refiere a una base de ácido nucleico, nucleósido o nucleótido, incluye modificación, derivaciones o análogos de bases, nucleósidos o nucleótidos convencionales que se producen de forma natural en un polinucleótido particular. Determinados nucleótidos no convencionales están modificados en la posición 2' del azúcar ribosa en comparación con los dNTP convencionales. Por lo tanto, aunque para el ARN los nucleótidos naturales son ribonucleótidos (es decir, ATP, GTP, CTP, UTP, colectivamente rNTP), puesto que estos nucleótidos tienen un grupo hidroxilo en la posición 2' del azúcar que, en comparación, está ausente en los dNTP, como se usa en el presente documento, los ribonucleótidos son nucleótidos no convencionales como sustratos para las ADN polimerasas. Como se usa en el presente documento, los nucleótidos no convencionales incluyen, pero no están limitados a, compuestos usados como terminadores para la secuenciación de ácidos nucleicos. Los compuestos terminadores ejemplares incluyen, pero no están limitados a, los compuestos que tienen una estructura 2',3'-didesoxi y se denominan didesoxinucleósidos trifosfato. Los didesoxinucleósidos trifosfato ddATP, ddTTP, ddCTP y ddGTP se denominan colectivamente ddNTP. Ejemplos adicionales de compuestos terminadores incluyen análogos 2'-PO4 de ribonucleótidos (véanse, por ejemplo, las solicitudes de EE. UU. n.os 2005/0037991 y 2005/0037398). Otros nucleótidos no convencionales incluyen fosforotioato dNTP ([a-S]dNTP), 5'-[a-borano]-dNTP, [a]-metilfosfonato dNTP y ribonucleósidos trifosfato (rNTP). Las bases no convencionales se pueden marcar con isótopos radiactivos, tales como 32P, 33P o 35S; marcadores fluorescentes; marcadores quimioluminiscentes; marcadores bioluminiscentes; marcadores con hapteno tales como biotina; o marcadores enzimáticos tales como estreptavidina o avidina. Los marcadores fluorescentes pueden incluir tintes que están cargados negativamente, tales como tintes de la familia de la fluoresceína, o tintes que tienen carga neutra, tales como tintes de la familia de la rodamina, o tintes que están cargados positivamente, tales como tintes de la familia de la cianina. Los tintes de la familia de la fluoresceína incluyen, por ejemplo, FAM, HEX, TET, JOE, NAN y ZOE. Los tintes de la familia de la rodamina incluyen Texas Red, ROX, R110, r6g y TAMRA. Diversos tintes o nucleótidos marcados con FAM, HEX, TET, JOE, nAn, ZOE, ROX, R110, R6G, Texas Red y TAMRA los comercializa Perkin-Elmer (Boston, MA), Applied Biosystems (Foster City, CA) o Invitrogen/Molecular Probes (Eugene, OR). Los tintes de la familia de la cianina incluyen Cy2, Cy3, Cy5 y Cy7 y los comercializa GE Healthcare UK Limited (Amersham Place, Little Chalfont, Buckinghamshire, Inglaterra).
Como se usa en el presente documento, el "porcentaje de identidad de secuencia" se determina comparando dos secuencias alineadas óptimamente sobre una ventana de comparación, en la que la porción de la secuencia de la ventana de comparación puede comprender adiciones o eliminaciones (es decir, huecos) en comparación con la secuencia de referencia (que no comprende adiciones o eliminaciones) para la alineación óptima de las dos secuencias. El porcentaje se calcula determinando el número de posiciones en las que se produce el residuo de aminoácido o la base de ácido nucleico en ambas secuencias para producir el número de posiciones emparejadas, dividiendo el número de posiciones emparejadas por el número total de posiciones existentes en la ventana de comparación y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia.
Los términos "idéntico" o "identidad" en porcentaje en el contexto de dos o más ácidos nucleicos o secuencias de polipéptidos se refieren a dos o más secuencias o subsecuencias que son iguales. Las secuencias son "sustancialmente idénticas" entre sí si tienen un porcentaje especificado de nucleótidos o residuos de aminoácidos que son iguales (por ejemplo, al menos un 20 %, al menos un 25 %, al menos un 30 %, al menos un 35 %, al menos un 40 %, al menos un 45 %, al menos un 50 %, al menos un 55 %, al menos un 60 %, al menos un 65 %, al menos un 70 %, al menos un 75 %, al menos un 80 %, al menos un 85 %, al menos un 90 %, o al menos un 95 % de identidad con respecto a una región especificada), cuando se compara y alinea para obtener la correspondencia máxima en una ventana de comparación, o región designada medida usando uno de los siguientes algoritmos de comparación de secuencias o mediante alineación manual e inspección visual. Las secuencias son "sustancialmente idénticas" entre sí si son al menos un 20 %, al menos un 25 %, al menos un 30 %, al menos un 35 %, al menos un 40 %, al menos un 45 %, al menos un 50 % o al menos un 55 % idénticas. Estas definiciones también se refieren al complemento de una secuencia de prueba. Opcionalmente, la identidad existe en una región que es de al menos aproximadamente 50 nucleótidos de longitud, o más típicamente en una región que es de 100 a 500 o 1000 o más nucleótidos de longitud.
Los términos "similitud" o "similitud en porcentaje", en el contexto de dos o más secuencias de polipéptidos, se refieren a dos o más secuencias o subsecuencias que tienen un porcentaje especificado de residuos de aminoácidos que son iguales o bien similares como se define por una sustitución de aminoácidos conservadora (por ejemplo, un 60 % de similitud, opcionalmente un 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % similar en una región determinada) cuando se comparan y alinean para obtener la correspondencia máxima en una ventana de comparación o región designada
5
10
15
20
25
30
35
40
45
50
55
60
65
medida usando uno de los siguientes algoritmos de comparación de secuencias o mediante alineación manual e inspección visual. Las secuencias son "sustancialmente similares" entre sí si son al menos un 20 %, al menos un 25 %, al menos un 30 %, al menos un 35 %, al menos un 40 %, al menos un 45 %, al menos un 50 % o al menos un 55 % similares entre sí. Opcionalmente, esto existe de manera similar en una región que es de al menos aproximadamente 50 aminoácidos de longitud, o más típicamente en una región que es de al menos aproximadamente 100 a 500 o 1000 o más aminoácidos de longitud.
Para la comparación de secuencias, típicamente una secuencia actúa como una secuencia de referencia con la que se comparan las secuencias de prueba. Cuando se usa un algoritmo de comparación de secuencias, las secuencias de prueba y de referencia se introducen en un ordenador, se designan las coordenadas de subsecuencia, si es necesario, y se designan los parámetros del programa de algoritmo de secuencias. Comúnmente se usan parámetros de programa predeterminados o se pueden designar parámetros alternativos. A continuación, el algoritmo de comparación de secuencias calcula las similitudes o identidades de secuencia en porcentaje para las secuencias de prueba en relación con la secuencia de referencia, basándose en los parámetros del programa.
Una "ventana de comparación", como se usa en el presente documento, incluye la referencia a un segmento de uno cualquiera del número de posiciones contiguas seleccionado del grupo que consiste en desde 20 a 600, habitualmente desde aproximadamente 50 a aproximadamente 200, más habitualmente desde aproximadamente 100 a aproximadamente 150, en el que se puede comparar una secuencia con una secuencia de referencia del mismo número de posiciones contiguas después de que las dos secuencias se alineen óptimamente. Los procedimientos de alineación de secuencias para comparación se conocen bien en la técnica. La alineación óptima de secuencias para comparación se puede realizar, por ejemplo, mediante el algoritmo de homología local de Smith y Waterman (Adv. Appl. Math. 2:482, 1970), mediante el algoritmo de alineación de homología de Needleman y Wunsch (J. Mol. Biol. 48:443, 1970), mediante el procedimiento de búsqueda de similitud de Pearson y Lipman (Proc. Natl. Acad. Sci. USA 85:2444, 1988), mediante implementaciones informáticas de estos algoritmos (por ejemplo, GAP, BESTFIT, FASTA y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.) o mediante alineación manual e inspección visual (véase, por ejemplo, Ausubel et al., Current Protocols in Molecular Biology (suplemento de 1995)).
Ejemplos de un algoritmo que sea adecuado para determinar el porcentaje de identidad de secuencia y de similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul et al. (Nuc. Acids Res. 25:3389- 402, 1977) y Altschul et al. (J. Mol. Biol. 215:403-10, 1990), respectivamente. El programa informático para realizar análisis por BLAST está disponible públicamente a través del National Center for Biotechnology Information (
http://www.ncbi.nlm.nih.gov/). Este algoritmo implica en primer lugar identificar pares de secuencias de puntuación alta (HSP) identificando palabras cortas de longitud W en la secuencia de consulta que coincidan o bien satisfagan alguna puntuación umbral de valor positivo T cuando están alineadas con una palabra de la misma longitud en una secuencia de base de datos. T se refiere al umbral de puntuación de palabras de vecindad (Altschul et al., supra). Estos resultados iniciales de palabras de vecindad actúan como semillas para iniciar búsquedas para encontrar HSP más largas que los contienen. Los resultados de palabras se extienden en ambas direcciones a lo largo de cada secuencia mientras se pueda incrementar la puntuación de alineación acumulativa. Las puntuaciones acumulativas se calculan usando, para secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos emparejados, siempre > 0) y N (puntuación de penalización para los residuos de emparejamiento erróneo, siempre < 0). Para secuencias de aminoácidos se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los resultados de palabras en cada dirección se detiene cuando: la puntuación de alineación acumulativa se reduce en la cantidad X con respecto a su valor máximo logrado; la puntuación acumulativa se desplaza a cero o por debajo, debido a la acumulación de una o más alineaciones de residuos de puntuación negativa; o se alcanza el final de cualquiera de las dos secuencias. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) usa como valores predeterminados una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparación de ambas hebras. Para secuencias de aminoácidos, el programa BLASTP usa como valores predeterminados una longitud de palabra de 3, una expectativa (E) de 10, y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915, 1989) usa alineaciones (B) de 50, una expectativa (E) de 10, M = 5, N = -4 y una comparación de ambas hebras.
El algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (véase, por ejemplo, Karlin y Altschul, Proc. Natl. Acad. Sci. USA 90:5873-87, 1993). Una medida de similitud proporcionada por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad por la que se produciría por casualidad un emparejamiento entre dos secuencias de aminoácidos o nucleótidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba con respecto al ácido nucleico de referencia es menos de aproximadamente 0,2, típicamente menos de aproximadamente 0,01 y más típicamente menos de aproximadamente 0,001.
El término "eficacia de transcripción inversa" se refiere a la fracción de moléculas de ARN que se transcriben de manera inversa como ADNc en una reacción de transcripción inversa dada. En determinados modos de realización, las ADN polimerasas mutantes de la invención tienen eficacias de transcripción inversa mejoradas en relación con las formas no modificadas de estas ADN polimerasas. Es decir, estas ADN polimerasas mutantes transcriben de manera
5
10
15
20
25
30
35
40
45
50
55
60
65
inversa una fracción más alta de moldes de ARN que sus formas no modificadas en un conjunto particular de condiciones de reacción. Sin estar limitada por la teoría, la capacidad de una ADN polimerasa mutante descrita en el presente documento para transcribir de manera inversa una fracción más alta de moldes de ARN se puede deber a una actividad de transcripción inversa incrementada, por ejemplo, una velocidad de incorporación de nucleótidos incrementada y/o una procesividad incrementada de la enzima. La eficacia de transcripción inversa se puede medir, por ejemplo, midiendo el punto de corte (Pc) de una reacción de PCR usando un molde de ARN y comparando el valor de Pc con un valor de Pc de una reacción de control en la que se amplifica un molde de ADN de la misma secuencia (excepto que las U se reemplazan por T), en la que las amplificaciones de ARN y ADN usan un conjunto de cebadores común y la misma polimerasa, por ejemplo, como se describe en los ejemplos. Una polimerasa de prueba tiene eficacia de RT mejorada cuando la polimerasa de prueba tiene un valor de Pc disminuido en comparación con una polimerasa de control cuando se usa ARN como molde, pero tiene un valor de Pc sustancialmente sin cambios en relación con la polimerasa de control cuando se usa ADN como molde. En algunos modos de realización, una polimerasa de la invención tiene una eficacia de RT mejorada, de tal manera que el Pc es al menos una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más unidades menos que la polimerasa de control correspondiente en el molde de ARN. La eficacia de RT mejorada de una polimerasa de prueba se puede medir como se describe en los ejemplos.
El término "tolerancia al emparejamiento erróneo" se refiere a la capacidad de una polimerasa para tolerar una secuencia que contiene emparejamiento erróneo al extender un ácido nucleico (por ejemplo, un cebador u otro oligonucleótido) de una manera dependiente de molde acoplando (por ejemplo, covalentemente) uno o más nucleótidos al ácido nucleico. El término "tolerancia al emparejamiento erróneo en 3'" se refiere a la capacidad de una polimerasa para tolerar una secuencia (prácticamente complementaria) que contiene emparejamiento erróneo en la que el ácido nucleico que se va a extender (por ejemplo, un cebador u otro oligonucleótido) tiene un emparejamiento erróneo con su molde en el nucleótido de extremo 3' del cebador. Los emparejamientos erróneos con respecto al molde también se pueden localizar en el penúltimo nucleótido en 3' del cebador, o en otra posición de la secuencia del cebador.
La expresión "discriminación por emparejamiento erróneo" se refiere a la capacidad de una polimerasa para distinguir una secuencia completamente complementaria de una secuencia que contiene emparejamiento erróneo al extender un ácido nucleico (por ejemplo, un cebador u otro oligonucleótido) de una manera dependiente de molde acoplando (por ejemplo, covalentemente) uno o más nucleótidos al ácido nucleico. El término "discriminación por emparejamiento erróneo en 3'" se refiere a la capacidad de una polimerasa para distinguir una secuencia completamente complementaria de una secuencia (prácticamente complementaria) que contiene emparejamiento erróneo en la que el ácido nucleico que se va a extender (por ejemplo, un cebador u otro oligonucleótido) tiene un emparejamiento erróneo en el extremo 3' del ácido nucleico en comparación con el molde al que se hibrida el ácido nucleico. El término "emparejamiento erróneo" se refiere a la existencia de uno o más apareamientos erróneos de bases (u "oposiciones de bases no complementarias") en un tramo de secuencias formadoras de dúplex (o potencialmente formadoras de dúplex) por lo demás complementarias.
El término "valor de Pc" o valor de "punto de corte" se refiere a un valor que permite la cuantificación de ácidos nucleicos diana de entrada. El valor de Pc se puede determinar de acuerdo con el procedimiento del máximo de la segunda derivada (Van Luu-The et al., "Improved real-time RT-PCR method for high-throughput measurements using second derivative calculation and double correction", BioTechniques, vol. 38, n.° 2, febrero de 2005, págs. 287-293). En el procedimiento de la segunda derivada, un Pc corresponde al primer pico de una curva de segunda derivada. Este pico corresponde al comienzo de una fase semilogarítmica. El procedimiento de la segunda derivada calcula un valor de segunda derivada de la curva de intensidad de fluorescencia en tiempo real, y únicamente se obtiene un valor. El procedimiento de Pc original se basa en una aproximación diferenciable definida localmente de los valores de intensidad, por ejemplo, mediante una función polinómica. A continuación, se computa la tercera derivada. El valor de Pc es la raíz más pequeña de la tercera derivada. El Pc también se puede determinar usando el procedimiento de punto de ajuste, en el que el Pc se determina mediante la intersección de una paralela a la línea umbral en la región semilogarítmica (Van Luu-The et al., BioTechniques, vol. 38, n.° 2, febrero de 2005, págs. 287-293). El valor de Pc proporcionado por el instrumento LightCycler ofrecido por Roche se obtiene mediante cálculo de acuerdo con el procedimiento del máximo de la segunda derivada.
El término "eficacia de la PCR" se refiere a una indicación de la eficacia de amplificación de ciclo a ciclo. La eficacia de la PCR se calcula para cada condición usando la ecuación: % de eficacia de la PCR = (10(-pendiente)-1) x 100, en la que la pendiente se calculó mediante regresión lineal con el logaritmo del número de copias representado en el eje de ordenadas y el Pc representado en el eje de abscisas. La eficacia de la PCR se puede medir usando un molde de cebador perfectamente emparejado o emparejado erróneamente.
El término "velocidad de extensión de ácido nucleico" se refiere a la velocidad en la que un biocatalizador (por ejemplo, una enzima, tal como una polimerasa, ligasa o similar) extiende un ácido nucleico (por ejemplo, un cebador u otro oligonucleótido) de una manera dependiente de molde o independiente de molde acoplando (por ejemplo, covalentemente) uno o más nucleótidos al ácido nucleico. Como ilustración, determinadas ADN polimerasas mutantes descritas en el presente documento tienen velocidades de extensión de ácido nucleico mejoradas en relación con formas no modificadas de dichas ADN polimerasas, de tal manera que pueden extender cebadores a velocidades más altas que estas formas no modificadas en un conjunto dado de condiciones de reacción.
5
10
15
20
25
30
35
40
45
50
55
60
65
El término "tolerancia a los inhibidores de polimerasa y RT" se refiere a la capacidad de una polimerasa para mantener la actividad (actividad polimerasa o de transcripción inversa) en presencia de una cantidad de un inhibidor que inhibiría la actividad polimerasa o actividad de transcripción inversa de una polimerasa de control. En algunos modos de realización, la polimerasa mejorada puede tener actividad polimerasa o de transcripción inversa en presencia de una cantidad del inhibidor que eliminaría esencialmente la actividad polimerasa de control.
El término "sonda de 5'-nucleasa" se refiere a un oligonucleótido que comprende al menos un resto de marcaje emisor de luz y que se usa en una reacción de 5'-nucleasa para lograr la detección de ácidos nucleicos diana. En algunos modos de realización, por ejemplo, una sonda de 5'-nucleasa incluye solamente un único resto emisor de luz (por ejemplo, un tinte fluorescente, etc.). En determinados modos de realización, las sondas de 5'-nucleasa incluyen regiones de autocomplementariedad, de tal manera que las sondas pueden formar estructuras de horquilla en condiciones seleccionadas. Como ilustración adicional, en algunos modos de realización una sonda de 5'-nucleasa comprende al menos dos restos de marcaje y emite radiación de intensidad incrementada después de que uno de los dos marcadores se escinda o se separe de otro modo del oligonucleótido. En determinados modos de realización, una sonda de 5'-nucleasa se marca con dos tintes fluorescentes diferentes, por ejemplo, un tinte indicador de extremo 5' y el resto o tinte extintor de extremo 3'. En algunos modos de realización, las sondas de 5'-nucleasa se marcan en una o más posiciones distintas de, o además de, las posiciones de extremo. Cuando la sonda está intacta, la transferencia de energía se produce típicamente entre los dos fluoróforos, de tal manera que la emisión fluorescente del tinte indicador se extingue al menos en parte. Durante una etapa de extensión de una reacción en cadena de la polimerasa, por ejemplo, una sonda de 5'-nucleasa unida a un ácido nucleico molde se escinde por la actividad de nucleasa de 5' a 3' de, por ejemplo, una Taq polimerasa u otra polimerasa que tenga esta actividad, de tal manera que la emisión fluorescente del tinte indicador ya no se extingue. Sondas de 5'-nucleasa ejemplares también se describen, por ejemplo, en la patente de EE. UU. n.° 5.210.015, la patente de EE. UU. n.° 5.994.056 y la patente de EE. UU. n.° 6.171.785. En otros modos de realización, una sonda de 5'-nucleasa se puede marcar con dos o más tintes indicadores diferentes y un resto o tinte extintor de extremo 3'.
El término "FRET" o "transferencia de energía por resonancia de fluorescencia" o "transferencia de energía por resonancia de Forster" se refiere a una transferencia de energía entre al menos dos cromóforos, un cromóforo donador y un cromóforo aceptador (denominado extintor). El donador transfiere típicamente la energía al aceptador cuando se excita el donador mediante radiación de luz con una longitud de onda adecuada. El aceptador reemite típicamente la energía transferida en forma de radiación de luz con una longitud de onda diferente. Cuando el aceptador es un extintor "oscuro", disipa la energía transferida en una forma distinta de la luz. Que un fluoróforo particular actúe como un donador o como un aceptador depende de las propiedades del otro miembro del par de FRET. Los pares donador- aceptador usados comúnmente incluyen el par FAM-TAMRA. Los extintores usados comúnmente son DABCYL y TAMRA. Los extintores oscuros usados comúnmente incluyen BlackHole Quenchers™ (BHQ) (Biosearch Technologies, Inc., Novato, Cal.), lowa Black™ (Integrated ADN Tech., Inc., Coralville, lowa) y BlackBerry™ Quencher 650 (BBQ-650) (Berry & Assoc., Dexter, Mich.).
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La figura 1 representa una alineación de secuencias de aminoácidos de una región del dominio de polimerasa de ADN polimerasas ejemplares de diversas especies de bacterias: especie Z05 de Thermus (Z05) (SEQ ID NO: 12), Thermus aquaticus (Taq) (SEQ ID NO: 13), Thermus filiformus (Tfi) (SEQ ID NO: 14), Thermus flavus (Tfl) (SEQ iD NO: 15), especie sps17 de Thermus (Sps17) (SEQ ID NO: 16), Thermus thermophilus (Tth) (SEQ ID NO: 17), Thermus caldophilus (Tea) (SEQ ID NO: 18), Thermotoga maritima (Tma) (SEQ ID nO: 19), Thermotoga neopolitana (Tne) (SEQ ID NO: 20), Thermosipho africanus (Taf) (SEQ ID NO: 21), Deinococcus radiodurans (Dra) (SEQ ID NO: 23), Bacillus stearothermophilus (Bst) (SEQ ID No: 24) y Bacillus caldotenax (Bca) (SEQ ID NO: 25). Además, las regiones polipeptídicas mostradas comprenden el motivo aminoacídico X1-X2-X3-X4-D-Y-S-Q-X5-E-L-R-X6-L-A-H-X7-X8-X9-D (SEQ ID NO: 26), cuyas posiciones variables se definen adicionalmente en el presente documento. Este motivo está resaltado en negrita para cada secuencia de polimerasa. Las posiciones de aminoácidos susceptibles de mutación se indican con un asterisco (*). Los huecos en las alineaciones se indican con un punto (.).
La figura 2 proporciona identidades de secuencia entre las siguientes enzimas ADN polimerasa I: ADN polimerasa de Thermus sp. Z05 (Z05); ADN polimerasa de Thermus aquaticus (Taq); ADN polimerasa de Thermus filiformis (Tfi); ADN polimerasa de Thermus flavus (Tfl); ADN polimerasa de Thermus sp. sps17 (Sps17); ADN polimerasa de Thermus thermophilus (Tth); ADN polimerasa de Thermus caldophilus (Tca); ADN polimerasa de Deinococcus radiodurans (Dra); ADN polimerasa de Thermotoga maritima (Tma); ADN polimerasa de Thermotoga neopolitana (Tne); ADN polimerasa de Thermosipho africanus (Taf); ADN polimerasa de Bacillus stearothermophilus (Bst); y ADN polimerasa de Bacillus caldotenax (Bca). (A) Identidades de secuencia en toda la enzima polimerasa I (correspondiente a los aminoácidos 1-834 de Z05); y (B) identidades de secuencia en el subdominio de polimerasa correspondiente a los aminoácidos 420-834 de Z05.
La figura 3 proporciona identidades de secuencia entre diversas enzimas ADN polimerasa I de la especie Thermus: ADN polimerasa de Thermus sp. Z05 (Z05); ADN polimerasa de Thermus aquaticus (Taq); ADN polimerasa de Thermus filiformis (Tfi); ADN polimerasa de Thermus flavus (Tfl); ADN polimerasa de Thermus sp. sps17 (Sps17); ADN
5
10
15
20
25
30
35
40
45
50
55
60
65
polimerasa de Thermus thermophilus (Tth); y ADN polimerasa de Thermus caldophilus (Tca). (A) Identidades de secuencia en toda la enzima polimerasa I (correspondiente a los aminoácidos 1-834 de Z05); y (B) identidades de secuencia en el subdominio de polimerasa correspondiente a los aminoácidos 420-834 de Z05.
DESCRIPCIÓN DETALLADA
La presente invención proporciona ADN polimerasas mejoradas en las que se han mutado uno o más aminoácidos del dominio de polimerasa en relación con una ADN polimerasa funcional. Las ADN polimerasas de la invención son enzimas activas que tienen eficacia de transcriptasa inversa incrementada (por ejemplo, en presencia de cationes divalentes de Mn2+ y Mg2+) en relación con la forma no modificada de la polimerasa. También pueden tener incrementadas la tolerancia al emparejamiento erróneo, la velocidad de extensión y la tolerancia a los inhibidores de polimerasa y RT. Las ADN polimerasas mutantes se pueden usar en concentraciones más bajas para un rendimiento superior o equivalente al de las enzimas precursoras. Las ADN polimerasas mutantes pueden tener eficacia de transcriptasa inversa incrementada mientras que retienen sustancialmente la misma actividad polimerasa dependiente de ADN en relación con una polimerasa no modificada o de control. La invención se expone en las reivindicaciones adjuntas a esta descripción.
Las ADN polimerasas que realizan más eficazmente la transcripción inversa son útiles, por ejemplo, en una variedad de aplicaciones que implican ensayos que emplean RT-PCR para detectar y/o cuantificar dianas de ARN. Por lo tanto, las ADN polimerasas son útiles en una variedad de aplicaciones que implican la extensión de polinucleótidos, así como la transcripción inversa o amplificación de moldes de polinucleótido, que incluyen, por ejemplo, aplicaciones en estudios de ADN recombinante y en el diagnóstico médico de enfermedades. Las ADN polimerasas mutantes también son particularmente útiles, debido a su tolerancia a los emparejamientos erróneos, para detectar dianas que posiblemente tienen secuencias variables (por ejemplo, dianas víricas o marcadores genéticos de cáncer y otras enfermedades).
En el presente documento se divulgan ADN polimerasas que se pueden caracterizar por tener el siguiente motivo:
X1-X2-X3-X4-Asp-Tyr-Ser-Gln-X5-Glu-Leu-Arg-X6-Leu-Ala-His-X7-X8-X9-Asp (también denominado en el presente documento en el código de una letra como X1-X2-X3-X4-D-Y-S-Q-X5-E-L-R-X6-L-A-H-X7-X8-X9-D) (SEQ ID NO: 8); en el que:
X1 es Leu (L) o Ile (I);
X2 es Val (V), Leu (L), Ile (I) o Phe (F);
X3 es Ala (A), Val (V), Ser (S) o Gly (G);
X4 es Leu (L) o Ala (A);
X5 es cualquier aminoácido distinto de Ile (I), Lys (K); Asn (N), Gln (Q) y Thr (T);
X6 es Val (V), Ile (I) o Leu (L);
X7 es Leu (L), Val (V) o Ile (I);
X8 es Ser (S) o Ala (A);
X9 es Gly (G), Lys (K), Asp (D) o Glu (E).
En el presente documento, X5 se puede seleccionar de G, A, W, P, S, F, Y, C, D, E, V, R, L, M o H.
También se divulgan ADN polimerasas que se pueden caracterizar por tener el siguiente motivo:
Leu-Val-X3-Leu-Asp-Tyr-Ser-Gln-X5-Glu-Leu-Arg-Val-Leu-Ala-His-Leu-Ser-Gly-Asp (también
denominado en el presente documento en el código de una letra como L-V-X3-L-D-Y-S-Q-X5-E-L-R-V-L- A-H-L-S-G-D) (SEQ ID NO: 9); en el que:
X3 es Ala (A) o Val (V); y
X5 es cualquier aminoácido distinto de Ile (I), Lys (K); Asn (N), Gln (Q) y Thr (T).
También se divulgan ADN polimerasas que se pueden caracterizar por tener el siguiente motivo:
Leu-Val-Ala-Leu-Asp-Tyr-Ser-Gln-Xs-Glu-Leu-Arg-Val-Leu-Ala-His-Leu-Ser-Gly-Asp (también
denominado en el presente documento en el código de una letra como L-V-A-L-D-Y-S-Q-X5-E-L-R-V-L-
5
10
15
20
25
30
35
40
A-H-L-S-G-D) (SEQ ID NO: 10); en el que:
X5 es cualquier aminoácido distinto de Ile (I), Lys (K); Asn (N), Gln (Q) y Thr (T).
También se divulgan ADN polimerasas que se pueden caracterizar por tener el siguiente motivo:
Leu-Val-Ala-Leu-Asp-Tyr-Ser-Gln-X5-Glu-Leu-Arg-Val-Leu-Ala-His-Leu-Ser-Gly-Asp (también
denominado en el presente documento en el código de una letra como L-V-A-L-D-Y-S-Q-X5-E-L-R-V-L- A-H-L-S-G-D) (SEQ ID NO: 11); en el que:
X5 es Met (M).
El aminoácido en la posición X3 de la SEQ ID NO: 8 o 9 puede no ser Val (V). El aminoácido en la posición X3 de la SEQ ID NO: 8 o 9 puede no ser Asp (D). El aminoácido en la posición X3 de la SEQ ID NO: 8 o 9 puede ser Ala (A).
También se divulgan ADN polimerasas que se pueden caracterizar por tener los motivos anteriores (por ejemplo, las SEQ ID NO: 8, 9, 10 y 11), opcionalmente en combinación con motivos adicionales descritos a continuación. Por ejemplo, la ADN polimerasa comprende además el motivo de la SEQ ID NO: 29 y/o la SEQ ID NO: 38.
Este motivo está presente en el dominio de los "dedos" (hélice alfa L) de muchas ADN polimerasas dependientes de ADN de tipo de la familia A, particularmente ADN polimerasas termoestables de bacterias termófilas (Li et al., EMBO J. 17:7514-7525, 1998). Por ejemplo, la figura 1 muestra una alineación de secuencias de aminoácidos de una región del dominio de los "dedos" de las ADN polimerasas de diversas especies de bacterias: Bacillus caldotenax, Bacillus stearothermophilus, Deinococcus radiodurans, Thermosipho africanus, Thermotoga marítima, Thermotoga neopolitana, Thermus aquaticus, Thermus caldophilus, Thermus filiformus, Thermus flavus, Thermus sp. sps17, Thermus sp. Z05 y Thermus thermophilus. Como se muestra, la secuencia natural correspondiente al motivo anterior está presente en cada una de estas polimerasas, indicando una función conservada de esta región de la polimerasa. La figura 2 proporciona identidades de secuencia entre estas ADN polimerasas.
En consecuencia, la divulgación proporciona una polimerasa que comprende la SEQ ID NO:8, 9, 10 u 11, que tiene actividad y/o características mejoradas descritas en el presente documento, y en la que la ADN polimerasa es por lo demás una ADN polimerasa natural, tal como, por ejemplo, una polimerasa de cualquiera de las especies de bacterias termófilas enumeradas anteriormente o es sustancialmente idéntica a dicha ADN polimerasa natural. Por ejemplo, la polimerasa puede comprender la SEQ ID NO: 8, 9, 10 u 11 y es al menos un 80 %, 85 %, 90 % o 95 % idéntica a la SEQ ID NO: 1. En una variación, la forma no modificada de la polimerasa es de una especie del género Thermus. También se divulga que la polimerasa no modificada es de una especie termófila distinta de Thermus, por ejemplo, Thermotoga. La secuencia de aminoácidos y ácido nucleico completa para numerosas ADN polimerasas termoestables está disponible. Las secuencias de cada una de las polimerasas de Thermus aquaticus (Taq), Thermus thermophilus (Tth), especie Z05 de Thermus (SEQ ID NO: 1), especie Thermus, Thermotoga maritima (Tma) y Thermosipho africanus (Taf) se han publicado en la publicación de patente internacional PCT n.° WO 92/06200. En particular, el documento Wo 92/06200 divulga la secuencia de aminoácidos natural de una ADN polimerasa termoestable derivada de la especie Z05 de Thermus (SEQ ID NO: 1) de la siguiente manera:

Mee Lys Ala Mee Leu Pro Leu Phe Glu Pro Lys Gly Arg Val Leu Leu 15 10 15

Val Asp Gly His His Leu Ala Tyr Arg Thr Phe Phe Ala Leu Lys Gly 20 25 30

Leu Thr Thr Ser Arg Gly Glu Pro Val Gln Ala Val Tyr Gly Phe Ala 35 40 45

Lys Ser Leu Leu Lys Ala Leu Lys Glu Asp Gly Tyr Lys Ala Val Phe 50 55 60

Val Val Phe Asp Ala Lys Ala Pro Ser Phe Arg His Glu Ala Tyr Glu 65 70 75 80

Ala Tyr Lys Ala Gly Arg Ala Pro Thr Pro Glu Asp Phe Pro Arg Gln 85 90 95

Leu Ala Leu lie Lys Glu Leu Val Asp Leu Leu Gly Phe Thr Arg Leu 100 105 110

Glu Val Pro Gly Phe Glu Ala Asp Asp Val Leu Ala Thr Leu Ala Lys 115 120 125

Lys Ala Glu Arg Glu Gly Tyr Glu Val Arg lie Leu Thr Ala Asp Arg 130 135 140

Asp Leu Tyr Gln Leu Val Ser Asp Arg Val Ala Val Leu His Pro Glu 145 150 155 160

Gly His Leu lie Thr Pro Glu Trp Leu Trp Glu Lys Tyr Gly Leu Lys 165 170 175

Pro Glu Gln Trp Val Asp Phe Arg Ala Leu Val Gly Asp Pro Ser Asp 180 185 190

Asn Leu Pro Gly Val Lys Gly lie Gly Glu Lys Thr Ala Leu Lys Leu 195 200 205

Leu Lys Glu Trp Gly Ser Leu Glu Asn lie Leu Lys Asn Leu Asp Arg 210 215 220
Val Lys Pro Glu Ser Val Arg Glu Arg lie Lys Ala His Leu Glu Asp

225 230 235 240
Leu Lys Leu Ser Leu Glu Leu Ser Arg Val Arg Ser Asp Leu Pro Leu

245 250 255

Glu Val Asp Phe Ala Arg Arg Arg Glu Pro Asp Arg Glu Gly Leu Arg 260 265 270

Ala Phe Leu Glu Arg Leu Glu Phe Gly Ser Leu Leu His Glu Phe Gly 275 280 285

Leu Leu Glu Ala Pro Ala Pro Leu Glu Glu Ala Pro Trp Pro Pro Pro 290 295 300
Glu Gly Ala Phe Val Gly Phe Val Leu Ser Arg Pro Glu Pro Mee Trp

305 310 315 320
Ala Glu Leu Lys Ala Leu Ala Ala Cys Lys Glu Gly Arg Val His Arg

325 330 335

Ala Lys Asp Pro Leu Ala Gly Leu Lys Asp Leu Lys Glu Val Arg Gly 340 345 350

Leu Leu Ala Lys Asp Leu Ala Val Leu Ala Leu Arg Glu Gly Leu Asp 355 360 365

Leu Ala Pro Ser Asp Asp Pro Met Leu Leu Ala Tyr Leu Leu Asp Pro 370 375 380
Ser Asn Thr Thr Pro Glu Gly Val Ala Arg Arg Tyr Gly Gly Glu Trp

385 390 395 400
Thr Glu Asp Ala Ala His Arg Ala Leu Leu Ala Glu Arg Leu Gln Gln

405 410 415

Asn Leu Leu Glu Arg Leu Lys Gly Glu Glu Lys Leu Leu Trp Leu Tyr 420 425 430
Gln Glu Val Glu Lys Pro Leu Ser Arg Val Leu Ala His Met Glu Ala

435 440 445

Thr Gly Val Arg Leu Asp Val Ala Tyr Leu Lys Ala Leu Ser Leu Glu 450 455 460
Leu Ala Glu Glu lie Arg Arg Leu Glu Glu Glu Val Phe Arg Leu Ala

465 470 475 480

Gly His Pro Phe Asn Leu Asn Ser Arg Asp Gln Leu Glu Arg Val Leu 485 490 495

Phe Asp Glu Leu Arg Leu Pro Ala Leu Gly Lys Thr Gln Lys Thr Gly 500 505 510

Lys Arg Ser Thr Ser Ala Ala Val Leu Glu Ala Leu Arg Glu Ala His 515 520 525

Pro lie Val Glu Lys lie Leu Gln His Arg Glu Leu Thr Lys Leu Lys 530 535 540
Asn Thr Tyr Val Asp Pro Leu Pro Gly Leu Val His Pro Arg Thr Gly

545 550 555 560
Arg Leu His Thr Arg Phe Asn Gln Thr Ala Thr Ala Thr Gly Arg Leu

565 570 575

Ser Ser Ser Asp Pro Asn Leu Gln Asn lie Pro lie Arg Thr Pro Leu 580 585 590

Gly Gln Arg lie Arg Arg Ala Phe Val Ala Glu Ala Gly Trp Ala Leu 595 600 605

Val Ala Leu Asp Tyr Ser Gln lie Glu Leu Arg Val Leu Ala His Leu 610 615 620

Ser Gly Asp Glu Asn Leu lie Arg Val Phe Gln Glu Gly Lys Asp lie 625 630 635 640

His Thr Gln Thr Ala Ser Trp Met Phe Gly Val Ser Pro Glu Ala Val 645 650 655

Asp Pro Leu Mee Arg Arg Ala Ala Lys Thr Val Asn Phe Gly Val Leu 660 665 670

Tyr Gly Met Ser Ala His Arg Leu Ser Gln Glu Leu Ala lie Pro Tyr 675 680 685

Glu Glu Ala Val Ala Phe lie Glu Arg Tyr Phe Gln Ser Phe Pro Lys 690 695 700

Val Arg Ala Trp lie Glu Lys Thr Leu Glu Glu Gly Arg Lys Arg Gly 705 710 715 720
Tyr Val Glu Thr Leu Phe Gly Arg Arg Arg Tyr Val Pro Asp Leu Asn

725 730 735

Ala Arg Val Lys Ser Val Arg Glu Ala Ala Glu Arg Met Ala Phe Asn 740 745 750

Met Pro Val Gln Gly Thr Ala Ala Asp Leu Met Lys Leu Ala Met Val 755 760 765

Lys Leu Phe Pro His Leu Arg Glu Met Gly Ala Arg Met Leu Leu Gln 770 775 780
5
10
15
20
25
30
35
40
45
50
imagen1
Glu
800
Ala
Ala
La secuencia para la ADN polimerasa de Thermus flavus se ha publicado en Akhmetzjanov y Vakhitov (Nucleic Acids Research 20:5839, 1992). La secuencia de la ADN polimerasa termoestable de Thermus caldophilus se encuentra en el n.° de acceso a EMBL/GenBank U62584. La secuencia de la ADN polimerasa termoestable de Thermus filiformis se puede recuperar del n.° 42380 del depósito de ATCC usando, por ejemplo, los procedimientos proporcionados en la patente de EE. UU. n.° 4.889.818, así como la información de secuencia proporcionada en la tabla 1. La secuencia de la ADN polimerasa de Thermotoga neapolitana es del n.° de acceso a la base de datos de patentes GeneSeq R98144 y el documento PCT WO 97/09451. La secuencia de la ADN polimerasa termoestable de Bacillus caldotenax se describe, por ejemplo, en Uemori et al. (J Biochem (Tokio) 113 (3):401-410, 1993; véase también el n.° de acceso a la base de datos Swiss-Prot Q04957 y los n.os de acceso a GenBank D12982 y BAA02361). Ejemplos de formas no modificadas de ADN polimerasas que se pueden modificar como se describe en el presente documento se describen, por ejemplo, en las patentes de EE. UU. n.os 6.228.628; 6.346.379; 7.030.220; 6.881.559; 6.794.177; 6.468.775 y en las patentes de EE. UU. n.os 7.148.049; 7.179.590; 7.410.782; 7.378.262.
También son susceptibles de las mutaciones descritas en el presente documento ADN polimerasas funcionales que se han modificado previamente (por ejemplo, mediante sustitución, adición o eliminación de aminoácidos). Dichas polimerasas modificadas funcionales retienen el motivo de aminoácidos de la SEQ ID NO: 8 (o un motivo de la SEQ ID NO: 9, 10 u 11) y opcionalmente el motivo de aminoácidos de la SEQ ID NO: 38. Por lo tanto, las ADN polimerasas no modificadas adecuadas también incluyen variantes funcionales de polimerasas naturales. Dichas variantes tienen típicamente una similitud o identidad de secuencia sustancial con respecto a la polimerasa natural, típicamente de al menos un 80 % de identidad de secuencia y más típicamente de al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 % 96 %, 97 %, 98 % o 99 % de identidad de secuencia.
Una polimerasa, además de tener un dominio de polimerasa que comprende la SEQ ID NO: 8, 9, 10 u 11, también puede comprender un dominio de nucleasa (por ejemplo, correspondiente a las posiciones 1 a 291 de Z05).
Una polimerasa puede ser una polimerasa quimérica, es decir, que comprende regiones de polipéptidos de dos o más enzimas. Los ejemplos de dichas ADN polimerasas quiméricas se describen, por ejemplo, en la patente de EE. UU. n.° 6.228.628. Son particularmente adecuadas las ADN polimerasas de la familia CS quiméricas, que incluyen las polimerasas CS5 y CS6 y variantes de las mismas que tienen una identidad sustancial de secuencia de aminoácidos (típicamente al menos un 80 % de identidad de secuencia de aminoácidos y más típicamente al menos un 90 %, 91 %, 92 %; 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia de aminoácidos) y, por lo tanto, se pueden modificar para que contengan la SEQ ID NO: 8. Las ADN polimerasas CS5 y CS6 son enzimas quiméricas derivadas de las ADN polimerasas de Thermus sp. Z05 y Thermotoga maritima (Tma). Comprenden el dominio de 5'- nucleasa de extremo N de la enzima de Thermus y los dominios de polimerasa y exonucleasa 3'-5' de extremo C de la enzima de Tma. Estas enzimas tienen actividad transcriptasa inversa eficaz, pueden extender cebadores que contienen análogos de nucleótidos y pueden incorporar alfa-fosforotioato dNTP, dUTP, dITP y también dNTP marcados de la familia de los tintes de fluoresceína y cianina. Las polimerasas CS5 y CS6 también son enzimas de PCR activadas por Mg2+ eficaces. Las polimerasas quiméricas CS5 y CS6 se describen adicionalmente, por ejemplo, en la patente de EE. UU. n.° 7.148.049.
Las sustituciones de aminoácidos pueden ser sustituciones de aminoácidos únicos. Las ADN polimerasas proporcionadas en el presente documento pueden comprender una o más sustituciones de aminoácidos en el sitio activo en relación con la polimerasa no modificada. Las sustituciones de aminoácidos pueden comprender al menos la posición X5 del motivo expuesto en la SEQ ID NO: 8 (o un motivo de la SEQ ID NO: 9, 10 u 11). La sustitución de aminoácidos en esta posición confiere incremento de la eficacia de transcriptasa inversa, tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de polimerasa y RT, produciendo una ADN polimerasa mutante con un incremento de la eficacia de transcriptasa inversa, tolerancia al emparejamiento erróneo, velocidad de extensión y/o tolerancia a los inhibidores de polimerasa y RT en relación con la polimerasa no modificada. Típicamente, el aminoácido en la posición X5 está sustituido por un aminoácido que no se corresponde con la secuencia natural en el motivo expuesto en la SEQ ID NO: 8 (o un motivo de la SEQ ID NO: 9, 10 u 11). Por lo tanto, típicamente, el aminoácido en la posición X5, si está sustituido, no es Ile (I), ya que la Ile se produce en esta posición en las polimerasas naturales. Véase, por ejemplo, la figura 1. Las sustituciones de aminoácidos incluyen G, A, W, P, S, T, F,
5
10
15
20
25
30
35
40
45
50
55
60
65
Y, C, N, Q, D, E, K, V, R, L, M o H en la posición X5. Las sustituciones de aminoácidos en la posición X5 no incluyen I, K, N, Q o T. Las sustituciones de aminoácidos pueden incluir metionina (M) en la posición X5. Otras sustituciones de aminoácidos adecuadas en uno o más de los sitios identificados se pueden determinar usando, por ejemplo, procedimientos conocidos de mutagénesis dirigida a sitio y determinación del rendimiento de extensión de polinucleótidos en ensayos descritos adicionalmente en el presente documento o conocidos de otro modo por los expertos en la técnica.
La polimerasa divulgada en el presente documento puede comprender la SEQ ID NO: 8, 9, 10 u 11 y puede comprender además uno o más cambios de aminoácidos adicionales (por ejemplo, mediante sustitución, adición o eliminación de aminoácidos) en comparación con una polimerasa natural. Dichas polimerasas retienen el motivo aminoacídico de la SEQ ID NO: 8 (o un motivo de la SEQ ID NO: 9, 10 u 11) y comprenden además el motivo aminoacídico de la SEQ ID NO: 38 (correspondiente a la mutación D580X de Z05 (SeQ ID NO:1)) de la siguiente manera:
Thr-Gly-Arg-Leu-Ser-Ser-X7-X8-Pro-Asn-Leu-Gln-Asn (también denominado en el presente documento en el código de una letra como T-G-R-L-S-S-X7-X8-P-N-L-Q-N) (SEQ ID NO: 38); en el que X7 es Ser (S) o Thr (T); y X8 es cualquier aminoácido que no sea Asp (D) o Glu (E).
La mutación caracterizada por la SEQ ID NO: 38 se analiza en más detalle, por ejemplo, en la publicación de patente de EE. UU. n.° 2009/0148891. Dichas polimerasas variantes funcionales típicamente tendrán una identidad o similitud de secuencia sustancial con la polimerasa natural (por ejemplo, SEQ ID NO: 1), típicamente al menos un 80 % de identidad de secuencia de aminoácidos y más típicamente al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia de aminoácidos.
También se divulgan polimerasas que comprenden la SEQ ID NO: 8, 9, 10 u 11 y que comprenden además el motivo aminoacídico de la SEQ ID NO: 29 (correspondiente a la mutación I709X de Z05 (SEQ ID NO:1)) de la siguiente manera:
X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12-X13-Gly-Tyr-Val-X14-Thr-Leu (también denominado en el presente documento en el código de una letra como X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-X12-X13-G-Y-V-X14-T-L) (SEQ ID NO: 29); en el que:
X1
es Ala (A), Asp (D), Ser (S), Glu (E), Arg (R) o Gln (Q);
X2
es Trp (W) o Tyr (Y);
X3
es cualquier aminoácido distinto de Ile (I), Leu (L) o Met (M);
X4
es Glu (E), Ala (A), Gln (Q), Lys (K), Asn (N) o Asp (D);
X5
es Lys (K), Gly (G), Arg (R), Gln (Q), His (H) o Asn (N);
X6
es Thr (T), Val (V), Met (M) o Ile (I);
X7
es Leu (L), Val (V) o Lys (K);
X8
es Glu (E), Ser (S), Ala (A), Asp (D) o Gln (Q);
X9
es Glu (E) o Phe (F);
X10 es Gly (G) o Ala (A);
X11 es Arg (R) o Lys (K);
X12 es Lys (K), Arg (R), Glu (E), Thr (T) o Gln (Q);
X13 es Arg (R), Lys (K) o His (H); y X14 es Glu (E), Arg (R) o Thr (T).
Dichas polimerasas variantes funcionales típicamente tendrán una identidad o similitud de secuencia sustancial con la polimerasa natural (por ejemplo, SEQ ID NO: 1), típicamente al menos un 80 % de identidad de secuencia de aminoácidos y más típicamente al menos un 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia de aminoácidos.
También se divulgan ADN polimerasas que comprenden una sustitución de aminoácidos en la posición X5 (por
5
10
15
20
25
30
35
40
ejemplo, como en un motivo seleccionado de la SEQ ID NO: 8, 9, 10 u 11) y que comprenden una sustitución de aminoácidos correspondiente a la SEQ ID NO: 38 y la SEQ ID NO: 29.
En el presente documento se puede sustituir el aminoácido en la posición X5 por un aminoácido como se expone en la SEQ ID NO: 8, 9, 10 u 11, y el aminoácido en la posición X8 (de la SEQ ID NO: 38) se puede sustituir por un aminoácido como se expone en la SEQ ID NO: 38. Por lo tanto, el aminoácido en la posición X5 puede ser cualquier aminoácido distinto de Ile (I) y el aminoácido en la posición X8 puede ser cualquier aminoácido distinto de Asp (D) o Glu (E). Las sustituciones de aminoácidos pueden incluir leucina (L), glicina (G), treonina (T), glutamina (Q), alanina (A), serina (S), asparagina (N), arginina (R) y lisina (K) en la posición X8 de la SEQ ID NO: 38. Las sustituciones de aminoácidos pueden incluir independientemente metionina (M) en la posición X5 de la SEQ ID NO: 8, 9, 10 u 11 y glicina (G) en la posición X8 de la SEQ ID NO: 38.
El aminoácido en la posición X5 se puede sustituir por un aminoácido como se expone en la SEQ ID NO: 8, 9, 10 u 11, y el aminoácido en la posición X3 se puede sustituir por un aminoácido como se expone en la SEQ ID NO: 29. Por lo tanto, el aminoácido en la posición X5 puede ser cualquier aminoácido distinto de Ile (I) y el aminoácido en la posición X3 puede ser cualquier aminoácido distinto de Ile (I), Leu (L) o Met (M). Las sustituciones de aminoácidos pueden incluir lisina (K), arginina (R), serina (S), glicina (G) o alanina (A) en la posición X3 de la SEQ ID NO: 29. Las sustituciones de aminoácidos pueden incluir independientemente metionina (M) en la posición X5 de la SEQ ID NO: 8, 9, 10 o 11 y lisina (K) en la posición X3 de la SEQ ID NO: 29.
Otras sustituciones de aminoácidos adecuadas en uno o más de los sitios identificados se pueden determinar usando, por ejemplo, procedimientos conocidos de mutagénesis dirigida a sitio y determinación del rendimiento de extensión de polinucleótidos en ensayos descritos adicionalmente en el presente documento o conocidos de otro modo por los expertos en la técnica, por ejemplo, sustituciones de aminoácidos descritas en las publicaciones de solicitud de patente de EE. UU. n.os 2009/0148891 y 2009/0280539.
Dado que la longitud precisa de las ADN polimerasas varía, las posiciones de aminoácidos precisas correspondientes a cada una de X5 (SEQ ID NO: 8), Xs (SEQ ID NO: 38) y X3 (SEQ ID NO: 29) pueden variar dependiendo de la polimerasa mutante particular usada. Los programas de alineación de secuencias de aminoácidos y ácido nucleico están fácilmente disponibles (véanse, por ejemplo, los remitidos supra) y, dados los motivos particulares identificados en el presente documento, sirven para ayudar a la identificación de los aminoácidos exactos (y codones correspondientes) para la modificación de acuerdo con la presente invención. Las posiciones correspondientes a cada una de X5, X8 y X3 se muestran en
la Tabla 1 para ADN polimerasas termoestables quiméricas representativas y ADN polimerasas termoestables de especies termófilas ejemplares.
Tabla 1. Posiciones de aminoácidos correspondientes a las posiciones X5 (por ejemplo, de las SEQ ID NO: 8, 9, 10 y 11), X8 (de la SEQ ID NO: 38) y X3 (de la sEq ID NO: 29) del motivo en polimerasas ejemplares.
Oraanismo o secuencia quimérica
Posición de aminoácido
Consenso (SEQ ID NO:)
X5 X8 (de la SEQ ID NO: 38) X3 (de la SEQ ID NO: 29)
T. thermophilus
616 580 709
T. caldophilus
616 580 709
T. sp. Z05 (1)
616 580 709
T. aquaticus
614 578 707
T. flavus
613 577 706
T. filiformis
612 576 705
T. sp. sps17
612 576 705
T. maritima
677 640 770
T. neapolitana
677 640 770
T. africanus
676 639 769
B. caldotenax
658 621 751
B. stearothermophilus
657 620 750
CS5
677 640 770
CS6
677 640 770
5
10
15
20
25
30
35
40
45
50
55
60
65
La ADN polimerasa puede derivar de la ADN polimerasa de Thermus sp. Z05 (SEQ ID NO: 1) o una variante de la misma (por ejemplo, que porta la mutación D580G o similar). Como se menciona anteriormente, en la ADN polimerasa de Thermus sp. Z05, la posición X5 corresponde a isoleucina (I) en la posición 616; la posición Xs corresponde a aspartato (D) en la posición 580 y la posición X3 corresponde a isoleucina (l) en la posición 709. La polimerasa mutante puede comprender al menos una sustitución de aminoácido, con respecto a una ADN polimerasa de Thermus sp. Z05 (o una ADN polimerasa que es sustancialmente idéntica, por ejemplo, al menos aproximadamente un 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica a la SEQ ID NO: 1), en 1616, D580 y/o 1709. Por lo tanto, típicamente, el aminoácido en la posición 616 de la SEQ ID NO: 1 no es I. El aminoácido en la posición 616 de la SEQ ID NO: 1 se puede seleccionar de G, A, V, R, F, W, P, S, T, C, Y, N, Q, D, E, K, L, M o H. El residuo de aminoácido en la posición 616 de la SEQ ID NO: 1 es M en la invención. Los residuos de aminoácido en la posición 580 de SEQ ID NO: 1 se pueden seleccionar de leucina (L), glicina (G), treonina (T), glutamina (Q), alanina (A), serina (S), asparagina (N), arginina (R) y lisina (K). Por lo tanto, el residuo de aminoácido en la posición 580 de la SEQ ID NO: 1 es glicina (G). Además, el aminoácido en la posición 709 de la SEQ ID NO: 1 no es I. También se divulga que el aminoácido en la posición 709 de la SEQ ID NO: 1 se selecciona de G, A, V, R, F, W, P, S, T, C, Y, N, Q, D, E, K, L, M o H. El aminoácido en la posición 709 de la SEQ ID NO: 1 es K, R, S, G o A en la invención. Más específicamente, el aminoácido en la posición 709 de la SEQ ID NO: 1 es K.
Los mutantes de ADN polimerasa de Thermus sp. Z05 ejemplares incluyen los que comprenden las sustituciones de aminoácidos I616M y/o I709K (o I709R, I709S, I709G, I709A) y/o D580G. La ADN polimerasa de Thermus sp. Z05 mutante comprende, por ejemplo, las sustituciones de residuos de aminoácido I616M y D580G. En algunos modos de realización, la ADN polimerasa de Thermus sp. Z05 mutante comprende, por ejemplo, las sustituciones de residuos de aminoácido I616M e I709K. En algunos modos de realización, la ADN polimerasa de Thermus sp. Z05 mutante comprende, por ejemplo, las sustituciones de residuos de aminoácido I616M, I709K y D580G. La ADN polimerasa de Thermus sp. Z05 mutante comprende, por ejemplo, las sustituciones de residuos de aminoácido seleccionadas independientemente de I616M, I709K y/o D580G.
También se divulga que el aminoácido correspondiente a la posición 604 de la SEQ ID NO: 1 es Ala (A). En el presente documento, el aminoácido correspondiente a la posición 604 de la SEQ ID NO: 1 puede no ser Glu (E). El aminoácido correspondiente a la posición 604 de la SEQ ID NO: 1 puede no ser Val (V). El aminoácido correspondiente a la posición 610 de la SEQ ID NO: 1 puede ser Ala (A). El aminoácido correspondiente a la posición 610 de la SEQ ID NO: 1 puede no ser Asp (D) o Val (V). El aminoácido correspondiente a la posición 616 de la SEQ ID NO: 1 no es Lys (K), Asn (N), Gln (Q) o Thr (T). También se divulga que el aminoácido correspondiente a la posición 617 de la SEQ ID NO: 1 puede ser Glu (E). El aminoácido correspondiente a la posición 617 de la SEQ ID NO: 1 puede no ser Gly (G) o Asp (d).
Las sustituciones del aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 descritas anteriormente pueden dar como resultado ADN polimerasas que tienen una eficacia de transcripción inversa mejorada (es decir, incrementada), actividad de RT-PCR incrementada (por ejemplo, amplificación más eficaz de un molde de ARN sin comprometer la eficacia de la PCR en un molde de ADN), aumento de la eficacia de RT-PCR en presencia de Mg2+, actividad transcriptasa inversa incrementada en presencia de inhibidores (por ejemplo, productos de descomposición de hemoglobina, tales como hemina y/o heparina), velocidad de extensión incrementada y tolerancia al emparejamiento erróneo en 3' mejorada en comparación con una polimerasa de control (véase la solicitud de patente de EE. UU. n.° 61/474.160). Por lo tanto, se espera que las polimerasas mejoradas que comprenden sustituciones en el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 descritas en el presente documento también tengan las propiedades mejoradas descritas anteriormente.
Además de las mutaciones y sustituciones descritas en el presente documento, las ADN polimerasas de la presente invención también pueden incluir otras modificaciones no sustitutivas. Dichas modificaciones pueden incluir, por ejemplo, modificaciones covalentes conocidas en la técnica para conferir una ventaja adicional en aplicaciones que comprenden extensión de polinucleótidos. Por ejemplo, una de dichas modificaciones es una modificación covalente reversible térmicamente que inactiva la enzima, pero que se invierte para activar la enzima tras la incubación a una temperatura elevada, tal como una temperatura usada típicamente para la extensión de polinucleótidos. Los reactivos ejemplares para dichas modificaciones reversibles térmicamente se describen en las patentes de EE. UU. n.os 5.773.258 y 5.677.152.
Las ADN polimerasas de la presente invención se pueden construir mutando las secuencias de ADN que codifican la polimerasa no modificada correspondiente (por ejemplo, una polimerasa natural o una variante correspondiente de la que deriva la polimerasa de la invención), tal como usando técnicas denominadas comúnmente mutagénesis dirigida a sitio. Las moléculas de ácido nucleico que codifican la forma no modificada de la polimerasa se pueden mutar mediante una variedad de técnicas de reacción en cadena de la polimerasa (PCR) bien conocidas por los expertos en la técnica (véase, por ejemplo, PCR Strategies (M. A. Innis, D. H. Gelfand y J. J. Sninsky eds., 1995, Academic Press, San Diego, CA) en el capítulo 14; PCR Protocols: A Guide to Methods and Applications (M. A. Innis, D. H. Gelfand, J. J. Sninsky y T. J. White eds., Academic Press, NY, 1990).
A modo de ejemplo no limitante, se puede emplear el sistema de dos cebadores, utilizado en el kit de mutagénesis dirigida a sitio por transformador de Clontech, para introducir mutantes dirigidos a sitio en un polinucleótido que codifica
5
10
15
20
25
30
35
40
45
50
55
60
65
una forma no modificada de la polimerasa. Después de la desnaturalización del plásmido diana en este sistema, se hibridan simultáneamente dos cebadores al plásmido; uno de estos cebadores contiene la mutación dirigida a sitio deseada, el otro contiene una mutación en otro punto del plásmido que da como resultado la eliminación de un sitio de restricción. A continuación, se lleva a cabo la síntesis de la segunda hebra, enlazando firmemente estas dos mutaciones, y los plásmidos resultantes se transforman en una cepa mutS de E. coli. El ADN plasmídico se aísla de las bacterias transformadas, se restringe con la enzima de restricción pertinente (linealizando de este modo los plásmidos no mutados) y, a continuación, se retransforma en E. coli. Este sistema permite la generación de mutaciones directamente en un plásmido de expresión, sin la necesidad de subclonar o generar fagómidos monocatenarios. El firme enlace de las dos mutaciones y la linealización posterior de los plásmidos no mutados dan como resultado una eficacia de mutación alta y permiten un cribado mínimo. Después de la síntesis del cebador de sitio de restricción inicial, este procedimiento requiere el uso de únicamente un nuevo tipo de cebador por sitio de mutación. En lugar de preparar cada mutante posicional por separado, se puede sintetizar un conjunto de cebadores oligonucleotídicos "degenerados diseñados" para introducir simultáneamente todas las mutaciones deseadas en un sitio dado. Los transformantes se pueden cribar mediante secuenciación del ADN plasmídico a través de la región mutagenizada para identificar y clasificar clones mutantes. A continuación, cada ADN mutante se puede restringir y analizar mediante electroforesis, tal como, por ejemplo, en un gel de potenciación de la detección de mutaciones (Mallinckrodt Baker, Inc., Phillipsburg, NJ) para confirmar que no se han producido otras alteraciones en la secuencia (mediante comparación por desplazamiento de banda con respecto al control no mutagenizado). De forma alternativa, se puede secuenciar toda la región de ADN para confirmar que no se ha producido ningún acontecimiento mutacional adicional fuera de la región diana.
Las ADN polimerasas con más de un aminoácido sustituido se pueden generar de diversas maneras. En el caso de aminoácidos localizados cerca entre sí en la cadena polipeptídica, se pueden mutar simultáneamente usando un oligonucleótido que codifique todas las sustituciones de aminoácidos deseadas. Sin embargo, si los aminoácidos están localizados a cierta distancia entre sí (separados en más de diez aminoácidos, por ejemplo), es más difícil generar un único oligonucleótido que codifique todos los cambios deseados. En su lugar, se puede emplear uno de dos procedimientos alternativos. En el primer procedimiento se genera un oligonucleótido separado para cada aminoácido que se va a sustituir. A continuación, los oligonucleótidos se hibridan simultáneamente al ADN molde monocatenario y la segunda hebra de ADN que se sintetiza a partir del molde codificará todas las sustituciones de aminoácidos deseadas. Un procedimiento alternativo implica dos o más rondas de mutagénesis para producir el mutante deseado. La primera ronda es como se describe para los mutantes únicos: se usa el ADN que codifica la polimerasa no modificada para el molde, se hibrida un oligonucleótido que codifica la primera o primeras sustituciones de aminoácidos deseadas a este molde y, a continuación, se genera la molécula de ADN de heterodúplex. La segunda ronda de mutagénesis utiliza el ADN mutado producido en la primera ronda de mutagénesis como molde. Por lo tanto, este molde ya contiene una o más mutaciones. A continuación, el oligonucleótido que codifica las sustituciones de aminoácidos deseadas adicionales se hibrida a este molde y la cadena de ADN resultante codifica ahora mutaciones tanto de la primera como de la segunda ronda de mutagénesis. Este ADN resultante se puede usar como un molde en una tercera ronda de mutagénesis, y así sucesivamente. De forma alternativa, se puede utilizar el procedimiento de mutagénesis de sitio múltiple de Seyfang y Jin (Anal. Biochem. 324:285-291,2004).
En consecuencia, también se proporcionan ácidos nucleicos recombinantes que codifican cualquiera de las ADN polimerasas de la presente invención. Usando un ácido nucleico de la presente invención, que codifica una ADN polimerasa, se pueden preparar una variedad de vectores. En la práctica de la invención se puede usar cualquier vector que contenga replicón y secuencias de control que deriven de una especie compatible con la célula huésped. En general, los vectores de expresión incluyen regiones de ácido nucleico reguladoras de la transcripción y de la traducción enlazadas de forma funcional al ácido nucleico que codifica la ADN polimerasa. El término "secuencias de control" hace referencia a secuencias de ADN necesarias para la expresión de una secuencia codificante enlazada de forma funcional en un organismo huésped particular. Las secuencias de control que son adecuadas para procariotas, por ejemplo, incluyen un promotor, opcionalmente una secuencia operadora, y un sitio de unión a ribosoma. Además, el vector puede contener un elemento retrorregulador positivo (PRE) para potenciar la semivida del ARNm transcrito (véase Gelfand et al., patente de EE. UU. n.° 4.666.848). Las regiones de ácido nucleico reguladoras de la transcripción y de la traducción, en general, son apropiadas para la célula huésped usada para expresar la polimerasa. En la técnica se conocen numerosos tipos de vectores de expresión apropiados y secuencias reguladoras adecuadas para una variedad de células huésped. En general, las secuencias reguladoras de la transcripción y de la traducción pueden incluir, por ejemplo, secuencias promotoras, sitios de unión a ribosoma, secuencias de inicio y parada de la transcripción, secuencias de inicio y parada de la traducción y secuencias potenciadoras o activadoras. En modos de realización típicos, las secuencias reguladoras incluyen un promotor y secuencias de inicio y parada de la transcripción. Los vectores también incluyen típicamente una región de policonector que contiene varios sitios de restricción para la inserción de ADN exógeno. En determinados modos de realización se usan "señales de fusión" para facilitar la purificación y, si se desea, la retirada posterior de la secuencia identificadora/señal, por ejemplo, el "identificador His". Sin embargo, en general son innecesarias cuando se purifica una proteína termoactiva y/o termoestable de un huésped mesófilo (por ejemplo, E. coli) en el que se puede emplear una "etapa de calor". La construcción de vectores adecuados que contienen ADN que codifica secuencias de replicación, secuencias reguladoras, genes de selección de fenotipo y la polimerasa de interés se preparan usando procedimientos de ADN recombinante estándar. Los plásmidos aislados, vectores víricos y fragmentos de ADN se escinden, adaptan y ligan entre sí en un orden específico para generar los vectores deseados, como se conoce bien en la técnica (véase, por
5
10
15
20
25
30
35
40
45
50
55
60
65
ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Nueva York, NY, 2.a ed. 1989)).
El vector de expresión puede contener un gen marcador seleccionable para permitir la selección de células huésped transformadas. Los genes de selección se conocen bien en la técnica y varían con la célula huésped usada. Los genes de selección adecuados pueden incluir, por ejemplo, genes que codifiquen resistencia a tetraciclina y/o ampicilina, que posibilita que las células transformadas con estos vectores crezcan en presencia de estos antibióticos.
Un ácido nucleico que codifica una ADN polimerasa se puede introducir en una célula, ya sea solo o en combinación con un vector. Por "introducir en" o equivalentes gramaticales en el presente documento se entiende que los ácidos nucleicos entran en las células de una manera adecuada para la posterior integración, amplificación y/o expresión del ácido nucleico. El procedimiento de introducción viene dictado en gran medida por el tipo de célula seleccionada como diana. Los procedimientos ejemplares incluyen precipitación con CaPÜ4, fusión de liposomas, LIPOFECTIN®, electroporación, infección vírica y similares.
Los procariotas se pueden usar típicamente como células huésped para las etapas de clonación iniciales. Son particularmente útiles para la producción rápida de grandes cantidades de ADN, para la producción de moldes de ADN monocatenario usados para la mutagénesis dirigida a sitio, para cribar simultáneamente muchos mutantes y para la secuenciación de ADN de los mutantes generados. Las células huésped procariotas adecuadas incluyen la cepa 94 de E. coli K12 (ATCC n.° 31,446), la cepa W3110 de E. coli (ATCC n.° 27.325), la cepa DG116 de E. coli K12 (ATCC n.° 53.606), E. coli X1776 (ATCC n.° 31.537) y E. coli B; sin embargo, se pueden usar como huésped muchas otras cepas de E. coli, tales como HB101, JM101, NM522, NM538, NM539 y muchas otras especies y géneros de procariotas, que incluyen bacilos, tales como Bacillus subtilis, otras enterobacterias como Salmonella typhimurium o Serratia marcesans y diversas especies de Pseudomonas. Las células huésped procarióticas u otras células huésped con paredes celulares rígidas se transforman típicamente usando el procedimiento de cloruro de calcio como se describe en la sección 1.82 de Sambrook et al., supra. De forma alternativa, se puede usar electroporación para la transformación de estas células. Las técnicas de transformación de procariotas se exponen, por ejemplo, en Dower, en Genetic Engineering, Principles and Methods 12:275-296 (Plenum Publishing Corp., 1990); Hanahan et al., Meth. Enzymol., 204:63, 1991. Los plásmidos usados típicamente para la transformación de E. coli incluyen pBR322, pUCI8, pUCI9, pUCI18, pUC119 y Bluescript M13, que se describen todos en las secciones 1.12-1.20 de Sambrook et al., supra. Sin embargo, también están disponibles muchos otros vectores adecuados.
Las ADN polimerasas de la presente invención se producen típicamente cultivando una célula huésped transformada con un vector de expresión que contiene un ácido nucleico que codifica la ADN polimerasa, en las condiciones apropiadas para inducir o provocar la expresión de la ADN polimerasa. Los procedimientos de cultivo de células huésped transformadas en condiciones adecuadas para la expresión de proteínas se conocen bien en la técnica (véase, por ejemplo, Sambrook et al., supra). Las células huésped adecuadas para la producción de las polimerasas a partir de vectores plasmídicos que contienen promotor pL de lambda incluyen la cepa DG116 de E. coli (ATCC n.° 53606) (véase la patente de EE. UU. n.° 5.079.352 y Lawyer, F.C. et al., PCR Methods and Applications 2:275-87, 1993). Después de la expresión, la polimerasa se puede recoger y aislar. Los procedimientos para purificar la ADN polimerasa termoestable se describen, por ejemplo, en Lawyer et al., supra. Una vez purificada, se puede someter a prueba la capacidad de las ADN polimerasas para tener eficacia de RT mejorada, tolerancia al emparejamiento erróneo incrementada, velocidad de extensión incrementada y/o tolerancia a los inhibidores de polimerasa y RT incrementada (por ejemplo, como se describe en los ejemplos).
Las ADN polimerasas mejoradas de la presente invención se pueden usar para cualquier propósito en el que dicha actividad enzimática sea necesaria o deseada. En consecuencia, en otro aspecto de la invención, se proporcionan procedimientos de extensión de polinucleótidos (por ejemplo, PCR) usando las polimerasas. Las condiciones adecuadas para la extensión de polinucleótidos se conocen en la técnica (véase, por ejemplo, Sambrook et al., supra, véase también Ausubel et al., Short Protocols in Molecular Biology (4.a edición, John Wiley & Sons 1999)). En general, un cebador se hibrida a un ácido nucleico diana para formar un complejo cebador-molde. El complejo cebador-molde se pone en contacto con la ADN polimerasa y nucleósidos trifosfato en un ambiente adecuado para permitir la adición de uno o más nucleótidos al extremo 3' del cebador, produciendo de este modo un cebador extendido complementario al ácido nucleico diana. El cebador puede incluir, por ejemplo, uno o más análogos de nucleótidos. Además, los nucleósidos trifosfato pueden ser nucleótidos convencionales, nucleótidos no convencionales (por ejemplo, ribonucleótidos o nucleótidos marcados) o una mezcla de los mismos. En algunas variaciones, la reacción de extensión de polinucleótidos comprende la amplificación de un ácido nucleico diana. Las condiciones adecuadas para la amplificación de ácidos nucleicos usando una ADN polimerasa y un par de cebadores también se conocen en la técnica (por ejemplo, procedimientos de amplificación por PCR); (véase, por ejemplo, Sambrook et al., supra; Ausubel et al., supra; PCR Applications: Protocols for Functional Genomics (Innis et al. eds., Academic Press 1999)). En otros modos de realización que no son mutuamente excluyentes, la reacción de extensión de polinucleótidos comprende la transcripción inversa de un molde de ARN (por ejemplo, RT-PCR). En algunos modos de realización, las polimerasas mejoradas encuentran uso en la secuenciación 454 (Margulies, M et al. 2005, Nature, 437, 376-380).
Opcionalmente, la reacción de extensión del cebador comprende un inhibidor real o potencial de una polimerasa de referencia o no modificada. Por ejemplo, el inhibidor puede inhibir la velocidad de extensión de ácido nucleico y/o la
5
10
15
20
25
30
35
40
45
50
55
60
65
eficacia de transcripción inversa de una polimerasa de referencia o no modificada (de control). En el presente documento, el inhibidor puede ser hemoglobina o un producto de degradación de la misma. Por ejemplo, el producto de degradación de hemoglobina puede ser un producto de descomposición de hemo, tal como hemina, hematoporfirina o bilirrubina. El inhibidor puede ser un quelante de hierro o un pigmento púrpura. El inhibidor puede ser heparina. El inhibidor puede ser un tinte intercalante. El inhibidor puede ser melanina, que se ha descrito como un inhibidor de la polimerasa (véase, por ejemplo, Ekhardt et al., Biochem Biophys Res Commun. 271(3):726-30 (2000)).
Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de moldes de polinucleótido aislados de muestras que comprenden inhibidores de la polimerasa, por ejemplo, tales como sangre. Por ejemplo, las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de hemoglobina, un componente principal de la sangre, o en presencia de un producto de degradación de hemoglobina. La hemoglobina se puede degradar en diversos productos de descomposición de hemo, tales como hemina, hematina, hematoporfirina y bilirrubina. Por lo tanto, se pueden usar ADN polimerasas de la presente invención para extender moldes en presencia de productos de degradación de hemoglobina, incluyendo, pero no limitados a, hemina, hematina, hematoporfirina y bilirrubina. En el presente documento, el producto de degradación de hemoglobina puede ser hemina. Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de hemina aproximadamente 0,5 a 20,0 pM, aproximadamente 0,5 a 10,0 pM, aproximadamente 0,5 a 5,0 pM, aproximadamente
1.0 a 10,0 pM, aproximadamente 1,0 a 5,0 pM, aproximadamente 2,0 a 2,0 5,0 pM, o aproximadamente 2,0 a 3,0 pM. Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de hemina al menos aproximadamente 0,5, 1,0, 1,5, 2,0, 2,5, 3,0, 4,0, 5,0, 10,0, 20,0 o más de 20 pM. Los productos de descomposición de hemoglobina incluyen quelantes de hierro y pigmentos púrpura. Por lo tanto, las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de quelantes de hierro y/o pigmentos púrpura. Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de cantidades de productos de degradación de hemoglobina que inhibirían la extensión del mismo molde por una ADN polimerasa de referencia o de control.
Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de heparina. La heparina está presente comúnmente como un anticoagulante en muestras aisladas de sangre. Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de aproximadamente 1,0 a 400 ng/pl, de
1.0 a 300 ng/pl, de 1,0 a 200 ng/pl, de 5,0 a 400 ng/pl, de 5,0 a 300 ng/pl, de 5,0 a 200 ng/pl, de 10,0 a 400 ng/pl, de
10.0 a 300 ng/pl o de 10,0 a 200 ng/pl de heparina. Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de al menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400 ng/l o más de 400 ng/l de heparina. Las ADN polimerasas de la presente invención se pueden usar para extender moldes en presencia de cantidades de heparina que inhibirían la extensión del mismo molde por una ADN polimerasa de referencia o de control.
Una polimerasa mejorada de la invención se puede usar en una reacción de transcripción inversa. La reacción de transcripción inversa se puede llevar a cabo en una mezcla que contenga el molde de ARN, uno o más cebadores y una ADN polimerasa termoestable de la invención. La mezcla de reacción contiene típicamente los cuatro desoxirribonucleósidos trifosfato estándar (dNTP) y un tampón que contiene un catión divalente y un catión monovalente. Los cationes ejemplares incluyen, por ejemplo, Mg2+, aunque otros cationes, tales como Mn2+ o Co2+, pueden activar ADN polimerasas. La reacción de transcripción inversa se puede llevar a cabo con una ADN polimerasa termoactiva de la invención. La polimerasa mejorada de la invención puede permitir una amplificación más eficaz de moldes de ARN sin comprometer la amplificación eficaz de un molde de ADN en presencia de Mn2+o Mg2+, como se describe en los ejemplos.
La polimerasa mejorada puede tener una eficacia de transcripción inversa incrementada en comparación con una polimerasa de control. No se apreció previamente que las sustituciones en el aminoácido correspondiente a la posición 616 de la SEQ ID NO: 1 pudieran dar como resultado una eficacia de RT incrementada. Por lo tanto, las ADN polimerasas que tienen una sustitución de Ile (I) por Met (M) en el aminoácido correspondiente a la posición 616 de la SEQ ID NO: 1 pueden tener una eficacia de RT incrementada.
La ADN polimerasa que tiene una eficacia de transcripción inversa incrementada puede comprender una sustitución de Ile (I) por Met (M) en el aminoácido correspondiente a la posición 616 de la SEQ ID NO: 1, y puede tener al menos un 80 %, preferentemente al menos un 90 %, más preferentemente al menos un 95 % de identidad de secuencia de aminoácidos con la SEQ ID NO: 1.
La polimerasa mejorada puede tener eficacia de transcripción inversa incrementada usando un molde de ARN sin una disminución sustancial de la actividad polimerasa usando un molde de ADN. Por lo tanto, la ADN polimerasa mejorada puede tener una eficacia de RT incrementada sin una disminución sustancial de la actividad polimerasa dependiente de ADN cuando se compara con una polimerasa de control. La ADN polimerasa mejorada descrita en el presente documento puede tener actividad polimerasa dependiente de ADN que sea sustancialmente la misma que la de una polimerasa de control. Por lo tanto, la ADN polimerasa mejorada descrita en el presente documento puede tener actividad polimerasa dependiente de ADN que sea al menos aproximadamente un 90 % de la actividad de una polimerasa de control, por ejemplo, al menos aproximadamente un 90 %, 91 %, 92 %, 93 %, 94 %, 95 % o más de la actividad de una polimerasa de control. La actividad polimerasa dependiente de ADN se puede medir, por ejemplo,
5
10
15
20
25
30
35
40
45
50
55
60
65
amplificando un molde de ADN y determinando los valores de Pc como se describe en el presente documento. Por lo tanto, la ADN polimerasa puede tener una eficacia de RT mejorada medida como un valor de Pc disminuido en comparación con una polimerasa de control cuando se usa ARN como molde, pero puede tener un valor de Pc sustancialmente sin cambios en relación con la polimerasa de control cuando se usa ADN como molde. Por ejemplo, cuando se amplifica un molde de ADN, la ADN polimerasa mejorada puede tener un valor de Pc que difiere en menos de 1,0, menos de 0,5, menos de 0,4, menos de 0,3, menos de 0,2 o menos de 0,1 en comparación con una polimerasa de control. La actividad polimerasa dependiente de ADN se puede determinar como se describe en los ejemplos.
Una polimerasa mejorada de la invención puede incrementar la eficacia de transcripción inversa reduciendo el tiempo de reacción requerido para extender un molde de ARN. Por ejemplo, una polimerasa mejorada descrita en el presente documento puede reducir significativamente el tiempo de reacción requerido para transcribir ARN a ADNc en comparación con una polimerasa de control, incrementando de este modo la eficacia de transcriptasa inversa. Sin estar limitada por la teoría, la polimerasa mejorada puede incrementar la eficacia de RT, por ejemplo, incrementando la actividad de la enzima sobre un molde de ARN, así como incrementando la velocidad de incorporación de nucleótidos y/o incrementando la procesabilidad de la polimerasa, reduciendo eficazmente de este modo el tiempo de extensión de un molde de ARN o población de moldes de ARN. Los tiempos de reacción para la etapa de RT inicial son típicamente del orden de 30 minutos o más a 65 grados Celsius cuando se usa una polimerasa no modificada o de control. Por lo tanto, la polimerasa mejorada puede ser capaz de transcribir un molde de ARN en ADNc en menos de aproximadamente 30 minutos, menos de aproximadamente 20 minutos, menos de aproximadamente 10 minutos, menos de aproximadamente 8 minutos, menos de aproximadamente 5 minutos, menos de aproximadamente
4 minutos, menos de aproximadamente 3 minutos o menos de aproximadamente 2 minutos a 65 grados Celsius. La polimerasa mejorada puede ser capaz de transcribir un molde de ARN derivado del transcrito JP2-5 del virus de la hepatitis C (VHC), que contiene las primeras 800 bases de la 5'NTR del genotipo Ib del VHC, en ADNc en menos tiempo o más rápido que una polimerasa de control. Por ejemplo, la polimerasa mejorada puede ser capaz de transcribir 240 bases del molde de ARN de JP2-5 del VHC en ADNc de longitud completa en aproximadamente 15 segundos menos, 30 segundos menos, un minuto menos, dos minutos menos, 3 minutos menos, 4 minutos menos,
5 minutos menos o aproximadamente 10 minutos menos que una polimerasa de control en idénticas condiciones de reacción. La polimerasa mejorada puede ser capaz de transcribir 240 bases del molde de ARN de JP2-5 del VHC en ADNc de longitud completa más rápido que una polimerasa de control, por ejemplo, en aproximadamente 5 segundos, 10 segundos, 15 segundos, 30 segundos, 45 segundos o 60 segundos o más rápido que una polimerasa de control en condiciones de reacción idénticas. Las condiciones de reacción pueden ser las descritas en los ejemplos. Una polimerasa mejorada descrita en el presente documento se puede poner en contacto con un molde de ARN a 65 grados Celsius durante aproximadamente 2 minutos en la mezcla de reacción descrita anteriormente. La etapa de extensión puede ir seguida de amplificación por PCR del molde extendido, como se describe en los ejemplos.
La actividad de RT más eficaz en ADN polimerasas termoestables se ha logrado usando Mn2+ como el activador de iones de metal divalentes. Sin embargo, se conoce bien que cuando el Mn2+ está presente en las reacciones, la fidelidad de las ADN polimerasas es más baja. A menos se esté tratando de generar mutaciones, en general se favorece mantener una fidelidad más alta. Afortunadamente, la mayoría de las aplicaciones convencionales de secuenciación, PCR y RT-PCR, no requieren condiciones de alta fidelidad porque los sistemas de detección buscan, en general, una población de productos. Con la llegada de la siguiente generación de secuenciación, la PCR digital, etc., la fidelidad del producto es más importante y los procedimientos que permiten una síntesis de ADN de fidelidad más alta son críticos. Conseguir una actividad de RT eficaz usando Mg2+ como activador de iones de metal divalentes es una excelente manera de incrementar sustancialmente la fidelidad de la ADN polimerasa y permitir una copia más fiable de la diana de ácido nucleico. En consecuencia, la polimerasa mejorada de la invención puede permitir una extensión y/o amplificación eficaces de moldes de ARN usando Mg2+ como activador de iones de metal divalentes, como se describe en los ejemplos.
Debido a que las polimerasas descritas en el presente documento también pueden tener tolerancia al emparejamiento erróneo incrementada, las polimerasas encuentran uso en procedimientos en los que es probable la variación del molde diana y, no obstante, se desea que el molde aún se amplifique independientemente de la variación en el molde diana. Un ejemplo de dichos moldes puede incluir, por ejemplo, secuencias víricas, bacterianas o de otros patógenos. Puede ser deseable determinar simplemente si un sujeto (humano o animal no humano) tiene una infección vírica u otra infección, independientemente de la variante vírica precisa que ha infectado al sujeto. Como ejemplo, se puede usar un par de cebadores para amplificar el VHC usando una polimerasa de la invención y detectar la presencia del VHC incluso si el virus particular que infecta al sujeto tiene una mutación que da como resultado un emparejamiento erróneo en el sitio de hibridación del cebador.
Los ácidos nucleicos diana pueden proceder de una fuente biológica o sintética. La diana puede ser, por ejemplo, ADN o ARN. En general, cuando se generan amplicones, los amplicones estarán compuestos de ADN, aunque también se pueden incorporar ribonucleótidos o nucleótidos sintéticos en el amplicón. Cuando se desea detectar un ARN, el procedimiento de amplificación implica típicamente el uso de transcripción inversa, incluyendo, por ejemplo, PCR de transcripción inversa (RT-PCR).
Las secuencias diana específicas pueden incluir, por ejemplo, ácidos nucleicos víricos (por ejemplo, virus de la inmunodeficiencia humana (VIH), virus de la hepatitis B (VHB), (citomegalovirus (CMV), parvovirus B19, virus de
5
10
15
20
25
30
35
40
45
50
55
60
65
Epstein-Barr, virus de la hepatitis C (VHC), virus del papiloma humano (VPH), virus de la encefalitis japonesa (VEJ), virus del Nilo Occidental (VNO), virus de la encefalitis de San Luis (VESL), virus de la encefalitis del valle de Murray y virus Kunjin), ácidos nucleicos bacterianos (por ejemplo, S. aureus, Neisseria meningitidis, Plasmodium falciparum, Chlamydia muridarum, Chlamydia trachomatis), micobacterias, ácidos nucleicos fúngicos o ácidos nucleicos de animales o plantas. Los ácidos nucleicos diana pueden ser ácidos nucleicos de animales (por ejemplo, humanos) o pueden derivar de una muestra animal (por ejemplo, humana) (es decir, puede haber ácidos nucleicos de organismos víricos u otros patógenos presentes en una muestra de una biopsia animal, muestra de sangre, muestra de orina, muestra fecal, saliva, etc.).Los ácidos nucleicos diana son, por ejemplo, regiones genéticas humanas que pueden incluir variantes asociadas con la enfermedad (por ejemplo, cáncer, diabetes, etc.). Debido a que las polimerasas de la invención pueden tener tolerancia al emparejamiento erróneo, dichas enzimas pueden ser particularmente útiles, por ejemplo, cuando puede haber una diversidad de secuencias relacionadas en una secuencia diana. Como ejemplo, la invención se puede usar para detectar patógenos víricos, en la que los patógenos víricos tienen suficiente variación en sus genomas para hacer difícil o imposible diseñar un conjunto único o pequeño de cebadores que amplifiquen la mayoría o todos los genomas víricos posibles o marcadores genéticos de cáncer u otras enfermedades en los que se sabe que se produce o es probable que se produzca una variación en la secuencia.
Otros procedimientos para detectar productos de extensión o productos de amplificación que usan las polimerasas mejoradas descritas en el presente documento incluyen el uso de tintes de unión a nucleótidos bicatenarios fluorescentes o tintes intercalantes de nucleótidos bicatenarios fluorescentes. Los ejemplos de tintes de unión a ADN bicatenario fluorescentes incluyen SYBR-green (Molecular Probes). Los tintes de unión a ADN bicatenario se pueden usar junto con el análisis de curvas de fusión para medir productos de extensión del cebador y/o productos de amplificación. El análisis de curvas de fusión se puede realizar en un instrumento de PCR en tiempo real, tal como el instrumento ABI 5700/7000 (formato de 96 pocillos) o ABI 7900 (formato de 384 pocillos) con programa informático integrado (SDS 2.1). De forma alternativa, el análisis de curvas de fusión se puede realizar como un análisis de criterio de valoración. Los procedimientos ejemplares de análisis de puntos de fusión se describen en la publicación de patente de EE. UU. n.° 2006/0172324.
En otro aspecto de la presente invención, se proporcionan kits para su uso en procedimientos de extensión del cebador descritos en el presente documento. En el presente documento, el kit se puede compartimentar para facilitar su uso y contiene al menos un recipiente que proporciona una ADN polimerasa mejorada de acuerdo con la presente invención. También se pueden incluir uno o más recipientes adicionales que proporcionan un reactivo o reactivos adicionales. El kit también puede incluir un tubo de extracción sanguínea, recipiente o unidad que comprende heparina o una sal de la misma, o libera heparina en solución. La unidad de extracción sanguínea puede ser un tubo heparinizado. Dichos recipientes adicionales pueden incluir cualquier reactivo u otros elementos reconocidos por el experto en la técnica para su uso en procedimientos de extensión del cebador de acuerdo con los procedimientos descritos anteriormente, incluyendo reactivos para su uso, por ejemplo, en procedimientos de amplificación de ácidos nucleicos (por ejemplo, PCR, RT-PCR), procedimientos de secuenciación de ADN o procedimientos de marcaje de ADN. Por ejemplo, el kit puede incluir además un recipiente que proporciona un cebador codificante 5' hibridable, en condiciones de extensión del cebador, a un molde de polinucleótido predeterminado, o un par de cebadores que comprende el cebador codificante 5' y un cebador no codificante 3' correspondiente. El kit puede incluir uno o más recipientes que proporcionan nucleósidos trifosfato (convencionales y/o no convencionales). Más específicamente, el kit puede incluir alfa-fosforotioato dNTP, dUTP, dITP y/o dNTP marcados, tales como, por ejemplo, dNTP marcados con familias de tintes de fluoresceína y cianina. El kit también puede incluir uno o más recipientes que proporcionan un tampón adecuado para una reacción de extensión del cebador.
En otro aspecto de la presente invención, se proporcionan mezclas de reacción que comprenden las polimerasas con eficacia de transcriptasa inversa incrementada, tolerancia al emparejamiento erróneo incrementada, velocidad de extensión incrementada y/o tolerancia a los inhibidores de polimerasa y RT incrementada como se describe en el presente documento. Las mezclas de reacción pueden comprender además reactivos para su uso, por ejemplo, en procedimientos de amplificación de ácidos nucleicos (por ejemplo, PCR, RT-PCR), procedimientos de secuenciación de ADN o procedimientos de marcaje de ADN. Por ejemplo, las mezclas de reacción pueden comprender un tampón adecuado para una reacción de extensión del cebador. Las mezclas de reacción también pueden contener un ácido nucleico molde (ADN y/o ARN), uno o más polinucleótidos de sonda o cebador, nucleósidos trifosfato (incluyendo, por ejemplo, desoxirribonucleótidos, ribonucleótidos, nucleótidos marcados, nucleótidos no convencionales), sales (por ejemplo, Mn2+, Mg2+), marcadores (por ejemplo, fluoróforos). Las mezclas de reacción pueden contener un cebador codificante 5' hibridable, en condiciones de extensión del cebador, a un molde de polinucleótido predeterminado o un par de cebadores que comprende el cebador codificante 5' y un cebador no codificante 3' correspondiente. Las mezclas de reacción pueden contener alfa-fosforotioato dNTP, dUTP, dITP y/o dNTP marcados, tales como, por ejemplo, dNTP marcados con familias de tintes de fluoresceína y cianina. Las mezclas de reacción pueden comprender un quelante de hierro o un tinte púrpura. Las mezclas de reacción pueden comprender hemoglobina o un producto de degradación de hemoglobina. Por ejemplo, los productos de degradación de hemoglobina pueden incluir productos de descomposición de hemo, tales como hemina, hematina, hematoporfirina y bilirrubina. Las mezclas de reacción pueden comprender heparina o una sal de la misma. La mezcla de reacción puede contener un ácido nucleico molde que se aísla de la sangre. El ácido nucleico molde puede ser ARN y la mezcla de reacción puede comprender heparina o una sal de la misma.
5
10
15
20
25
30
35
40
45
50
55
60
65
La mezcla de reacción puede comprender dos o más polimerasas. Por ejemplo, la mezcla de reacción puede comprender una primera ADN polimerasa que tenga eficacia de transcriptasa inversa incrementada en comparación con una polimerasa de control y una segunda ADN polimerasa que tenga actividad polimerasa dependiente de ADN. La segunda ADN polimerasa puede ser una polimerasa natural o no modificada, o puede ser una polimerasa mejorada que tenga actividad polimerasa dependiente de ADN incrementada. Dichas mezclas de reacción son útiles para la amplificación de moldes de ARN (por ejemplo, RT-PCR) proporcionando tanto una polimerasa que tiene actividad transcriptasa inversa incrementada como una polimerasa que tiene actividad polimerasa dependiente de ADN.
EJEMPLOS
Se ofrecen los siguientes ejemplos para ilustrar, pero no para limitar la invención reivindicada.
Ejemplo 1: Generación de genoteca
En resumen, las etapas en este procedimiento de cribado incluyen la generación de genotecas, expresión y purificación parcial de las enzimas mutantes, cribado de las enzimas frente a las propiedades deseadas, secuenciación de ADN, purificación de clones y caracterización adicional de mutantes candidatos seleccionados. Cada una de estas etapas se describe más adelante.
Generación de genotecas de clones: Un ácido nucleico que codificaba el dominio de polimerasa de la ADN polimerasa Z05 D580G_I709K se sometió a PCR propensa a errores (mutagénica) entre los sitios de restricción Blp I y Bgl II de un plásmido que incluía esta secuencia de ácido nucleico. Los cebadores usados para esto se dan a continuación:
Cebador directo: 5’- CTACCTCCTGGACCCCTCCAA-3’ (SEQ ID NO: 30); y,
Cebador inverso: 5’- ATAACCAACTGGTAGTGGCGTGTAA-3’ (SEQ ID NO: 31)
La PCR se realizó usando una concentración de Mg2+ de 1,8 mM para generar una genoteca con una tasa de mutación deseada. Las condiciones del tampón fueron bicina 50 mM pH 8,2, KOAc 115 mM, glicerol al 8 % p/v y 0,2 mM de cada dNTP. Se utilizó una enzima de PCR de inicio en caliente GeneAmp® AccuRT a 0,15 U/pl. Comenzando con 5 x 105 copias de ADN plasmídico de Z05 D580G_I709K linealizado por volumen de reacción de 50 pl, se desnaturalizaron las reacciones usando una temperatura de 94 °C durante 60 segundos, a continuación, se realizaron 30 ciclos de amplificación usando una temperatura de desnaturalización de 94 °C durante 15 segundos, una temperatura de hibridación de 60 °C durante 15 segundos, una temperatura de extensión de 72 °C durante 120 segundos y seguidos de una extensión final a una temperatura de 72 °C durante 5 minutos.
El amplicón resultante se purificó con un kit de purificación de PCR QIAquick (Qiagen, Inc., Valencia, CA, EE. UU.) y se cortó con Blp I y Bgl II; a continuación, se volvió a purificar con un kit de purificación de PCR QIAquick. Se preparó un plásmido de vector de Z05 D580G_I709K cortando con las mismas dos enzimas de restricción y tratando con fosfatasa alcalina, recombinante (RAS, n.° cat. 03359123001) y se purificó con un kit de purificación de PCR QIAquick. El vector cortado y el inserto mutado se mezclaron en una proporción 1:3 y se trataron con ADN ligasa T4 durante 5 minutos a temperatura ambiente (kit Quick Ligation™ de NEB). Las ligaciones se purificaron con un kit de purificación de PCR QIAquick y se transformaron en una cepa huésped de E. coli mediante electroporación.
Se sembraron en placas alícuotas de los cultivos expresados en medio selectivo de ampicilina para determinar el número de transformantes únicos en cada transformación. Las transformaciones se agruparon y almacenaron a -70 °C hasta -80 °C en presencia de glicerol como crioprotector.
A continuación, la genoteca se extendió en placas de agar selectivas a ampicilina de gran formato. Las colonias individuales se transfirieron a placas de 384 pocillos que contenían caldo Luria 2X con ampicilina y glicerol al 10 % p/v usando un colector automatizado de colonias (QPix2, Genetix Ltd). Estas placas se incubaron durante la noche a 30 °C para permitir que los cultivos crecieran y, a continuación, se almacenaron a -70 °C hasta -80 °C. El glicerol añadido al caldo Luria 2X era suficientemente bajo para permitir el crecimiento del cultivo, pero suficientemente alto para proporcionar crioprotección. Se prepararon varios miles de colonias de esta manera para su uso posterior.
Preparación de genotecas de extractos, parte 1 - fermentación: A partir de las genotecas de clones descritas anteriormente, se preparó una genoteca correspondiente de extractos parcialmente purificados adecuados para propósitos de cribado. La primera etapa de este procedimiento fue preparar cultivos de expresión a pequeña escala de cada clon. Estos cultivos se cultivaron en un formato de 96 pocillos; por lo tanto, había 4 placas de cultivo de expresión para cada placa de la genoteca de 384 pocillos. Se transfirieron 0,5 pl de cada pocillo de la placa de la genoteca de clones a un pocillo de una placa de siembra de 96 pocillos que contenía 150 pl de medio A (véase la tabla 3 a continuación). Esta placa de siembra se agitó durante la noche a 1150 rpm a 30 °C en una estufa/agitador de placas iEMS (ThermoElectron). A continuación, estos cultivos de siembra se usaron para inocular el mismo medio, esta vez inoculando 20 pl en 250 pl de medio A en placas de 96 pocillos de gran formato (Nunc n.° 267334). Estas
5
10
15
20
25
30
35
placas se incubaron durante la noche a 37 °C con agitación. El plásmido de expresión contenía elementos de control de la transcripción, que permiten la expresión a 37 °C, pero no a 30 °C. Después de la incubación durante la noche, los cultivos expresaron la proteína del clon a típicamente un 1-10 % de la proteína celular total. Las células de estos cultivos se recogieron mediante centrifugación. Estas células se congelaron (-20 °C) o bien se procesaron inmediatamente, como se describe a continuación.
Tabla 2. Medio A (esterilizado por filtración antes de su uso)
Componente
Concentración
MgSO4.7H2O
0,2 g/l
Ácido cítrico.H2O
2 g/l
K2HPO4
10 g/l
NaNH4PO4.4H2O
3,5 g/l
MgSO4
2 mM
Ácidos casamino
2,5 g/l
Glucosa
2 g/l
Tiamina. HCl
10 g/l
Ampicilina
100 mg/l
Preparación de la genoteca de extractos, parte 2 - extracción: Los sedimentos celulares de la etapa de fermentación se resuspendieron en 25 pl de tampón de lisis (tabla 3 a continuación) y se transfirieron a placas de termociclador de 384 pocillos y se precintaron. Obsérvese que el tampón contenía lisozima para ayudar en la lisis celular y DNasa para retirar el ADN del extracto. Para lisar las células, las placas se incubaron a 37 °C durante 15 minutos, se congelaron durante la noche a -20 °C y se incubaron de nuevo a 37 °C durante 15 minutos. Se añadió sulfato de amonio (1,5 pl de una solución 2 M) y las placas se incubaron a 75 °C durante 15 minutos para precipitar e inactivar las proteínas contaminantes, incluyendo las nucleasas añadidas de manera exógena. Las placas se centrifugaron a 3000 x g durante 15 minutos a 4 °C y los sobrenadantes se transfirieron a una placa de termociclador de 384 pocillos nueva. Estas placas de extractos se congelaron a -20 °C para su uso posterior en cribados.
Cada pocillo contenía aproximadamente 0,5-3 pM de la enzima polimerasa de la genoteca de mutantes.
Tabla 3. Tampón de lisis
Componente
Concentración o porcentaje
Tris pH 7,5
50 mM
EDTA
1 mM
MgCl2
6 mM
Tween 20
0,5 % v/v
Lisozima (a partir de polvo)
1 mg/ml
DNasa I
0,05 unidades/pl
Ejemplo 2: Identificación de ADN polimerasas mutantes con eficacia de transcripción inversa mejorada
Cribado de genotecas de extractos para una eficacia de transcripción inversa mejorada: La genoteca de extractos se cribó comparando los valores de Pc (punto de corte) de las curvas de crecimiento generadas por la actividad 5'-nucleasa fluorescente (TaqMan) de extractos enzimáticos en bruto en un sistema de RT-PCR a partir de la amplificación de un amplicón de 240 pares de bases del transcrito JP2-5 del virus de la hepatitis C (VHC), que contenía las primeras 800 bases de la 5'NTR del genotipo Ib del VHC en pSP64 poli(A) (Promega).
Las reacciones se llevaron a cabo en el termociclador cinético LC 480 de Roche en formato de 384 pocillos, conteniendo cada pocillo 3 pl de un extracto enzimático único diluido 10 veces con tampón que contenía Tris-HCl 20 mM, pH 8, KCl 100 mM, EDTA 0,1 mM y Tween-20 al 0,1 % añadido a 12 pl de mezcla maestra de RT-PCR descrita en la tabla 4. Las condiciones de termociclado fueron: 2 minutos a 50 °C (etapa de "UNG"); 2 minutos a 65 °C (etapa de "RT"); 5 ciclos de 94 °C durante 15 segundos, seguidos de 62 °C durante 30 segundos; y 45 ciclos de 91 °C durante 15 segundos, seguidos de 62 °C durante 30 segundos.
5
10
15
20
25
30
35
Tabla 4
Componente
Concentración
Tricina pH 8,3
50 mM
KOAc
60 mM
Glicerol
5 % (v/v)
DMSO
2 % (v/v)
Cebador 1
200 nM
Cebador 2
200 nM
Sonda TaqMan
100 nM
Aptámero
200 nM
dATP
200 pM
dCTP
200 pM
dGTP
200 pM
dUTP
400 pM
UNG
0,2 unidades/pl
ARN diana
6666 copias/pl
Mg(OAc)2
2 mM
Aproximadamente 5000 clones se cribaron usando el protocolo anterior. Se seleccionaron 40 clones del grupo original para un nuevo cribado basándose en los valores de punto de corte (Pc) más tempranos y valores de meseta fluorescente por encima de un corte arbitrario calculado mediante el procedimiento de cuantificación absoluta/máximo de la 2.a derivada. Los pocillos de cultivo correspondientes a los extractos superiores se muestrearon en medio de cultivo reciente y se cultivaron nuevamente para producir nuevas placas de cultivo que contenían los mejores mutantes, así como una serie de cultivos de Z05 D580G_I709K precursores que se usarían para controles comparativos. A continuación, se usaron estas placas de cultivo para preparar nuevos extractos en bruto que se cribaron de nuevo con la misma diana de ARN y condiciones como se describe previamente para el cribado original. La tabla 5 muestra los valores de Pc promedio obtenidos a partir del incremento de señales fluorescentes debido a la hidrólisis en 5' de una sonda marcada con FAM. Los resultados muestran que el clon 0686-C21 amplifica la diana de ARN con mayor eficacia que el precursor Z05 D580G_I709K.
Tabla 5
Clon
Pc promedio
0686-C21
20,9
Z05 D580G_I709K
28,0
La secuencia de ADN de la región mutada del gen de la polimerasa se secuenció para determinar las mutaciones que estaban presentes en cualquier clon individual. El clon 0686-C21 se eligió para pruebas adicionales, de modo que la proteína polimerasa mutante se expresó en cultivo en matraz, se purificó hasta la homogeneidad y se cuantificó.
Uso del mutante Z05 D580G_I709K en RT-PCR basada en Mg2+: Los resultados de secuenciación revelaron que la polimerasa expresada por el clon 0686-C21 llevaba la mutación I616M, además de las mutaciones D580G e I709K precursoras. El mutante Z05 D580G_I709K_I616M purificado se comparó con el Z05 D580G_I709K precursor en RT- PCR basada en Mg2+ TaqMan. Las eficacias de transcripción inversa y PCR se midieron comparando los valores de Pc de las amplificaciones del transcrito de ARN JP2-5 y del plásmido lineal de ADN pJP2-5 digeridos con la endonucleasa de restricción EcoRI. Los oligonucleótidos y las condiciones de mezcla maestra (tabla 4) fueron los mismos que se usaron en el cribado original. Cada reacción tenía 100 000 copias de ARN de transcrito JP2-5, 100 000 copias de ADN plasmídico lineal de pJP2-5 o 1000 copias de ADN plasmídico lineal de pJP2-5. Se amplificaron todas las dianas con el cebador 1 y el cebador 2, como se describe anteriormente, en reacciones por duplicado para generar un amplicón de 240 pares de bases. Todas las reacciones se realizaron en el termociclador Light Cycler 480 de Roche con un volumen de reacción de 15 pl. Los puntos de corte (Pc) se calcularon mediante el procedimiento de cuantificación absoluta/máximo de la 2.a derivada y se promediaron. Las amplificaciones se llevaron a cabo usando un intervalo de concentraciones de ADN polimerasa desde 5 nM hasta 40 nM. Las condiciones de termociclado fueron: 2 minutos a 50 °C (etapa de "UNG"); 2 minutos a 65 °C (etapa de "RT"); 5 ciclos de 94 °C durante 15 segundos, seguidos de 62 °C durante 30 segundos; y 45 ciclos de 91 °C durante 15 segundos, seguidos de 62 °C
5
10
15
20
25
30
35
durante 30 segundos. La tabla 6 muestra los valores de Pc obtenidos a partir del incremento de señales fluorescentes debido a la escisión de la sonda TaqMan en condiciones de enzima 20 nM.
Tabla 6
Enzima
Pc de 105 copias de ARN Pc de 105 copias de ADN Pc de 103 copias de ADN
Z05 D580G_I709K
28,8 17,5 24,4
Z05 D580G_I709K_I616M
19,9 17,4 24,3
Los resultados indican que Z05 D580GJ709KJ616M mutante permite una amplificación más eficaz de la diana de ARN sin comprometer la eficacia de la PCR en una diana de ADN, en comparación con la enzima precursora D580G_I709K.
Ejemplo 3: Mezclado de la ADN polimerasa mutante Z05 D580G_I709K_I616M con la ADN polimerasa AmpliTaq Gold® en RT-PCR basada en Mg2+
El mutante Z05 D580G_I709K_I616M purificado (0686-C21) se mezcló con ADN polimerasa AmpliTaq Gold® ("TaqGold") en una mezcla maestra TaqGold tamponada con Tris-HCl modificada (tabla 7) y se usó para amplificar moldes de ARN y ADN en RT-PCR basada en Mg2+ TaqMan®.
Tabla 7
Componente
Concentración
Tris-HCl pH 8,0
50 mM
KOAc, pH 7,0
70 mM
Glicerol
5 % (v/v)
DMSO
2 % (v/v)
Cebador 1
200 nM
Cebador 2
200 nM
Sonda TaqMan
100 nM
Aptámero
200 nM
dATP
200 pM
dCTP
200 pM
dGTP
200 pM
dUTP
400 pM
UNG
0,2 unidades/pl
Mg(OAc)2
2 mM
Las eficacias de transcripción inversa y PCR se midieron comparando los valores de Pc de las amplificaciones del transcrito de ARN JP2-5 y del plásmido lineal de ADN pJP2-5 digeridos con la endonucleasa de restricción EcoRI. Cada reacción tenía 100 000 copias de ARN de transcrito JP2-5, 100 000 copias de ADN plasmídico lineal de pJP2-5 o 1000 copias de ADN plasmídico lineal de pJP2-5. Se amplificaron todas las dianas con el cebador 1 y el cebador 2, como se describe anteriormente, en reacciones por duplicado para generar un amplicón de 240 pares de bases. Todas las reacciones se realizaron en el termociclador Light Cycler 480 de Roche con un volumen de reacción de 15 pl. Los puntos de corte (Pc) se calcularon mediante el procedimiento de cuantificación absoluta/máximo de la 2.a derivada y se promediaron. La amplificación de cada uno de los moldes de ARN y ADN se llevó a cabo con las siguientes condiciones de enzimas separadas: 10 nM de Z05 D580G_I709K_I616M mezclada con 0,5 U/pl de TaqGold; 0,5 U/pl de TaqGold; 20 nM de Z05 D580G_I709K_I616M. Las condiciones de termociclado fueron: 2 minutos a 50 °C (etapa de "UNG"); 2 minutos a 55 °C, 4 minutos a 60 °C, 60 minutos a 65 °C (etapa de "RT" a tres temperaturas); 10 minutos a 95 °C (etapa de activación de "TaqGold"); 5 ciclos de 94 °C durante 15 segundos, seguidos de 62 °C durante 30 segundos; y 45 ciclos de 91 °C durante 15 segundos, seguidos de 62 °C durante 30 segundos. La tabla 8 muestra los valores de Pc obtenidos a partir del incremento de señales fluorescentes debido a la escisión de la sonda TaqMan para las tres condiciones de enzimas diferentes.
Tabla 8
Enzima(s)
Pc de 105 copias de ARN Pc de 105 copias de ADN Pc de 103 copias de ADN
TaqGold
N/S 17,7 25,1
Z05 D580G_I709K_I616M
N/S N/S N/S
Mezcla Z05 D580G_I709K_I616M / TaqGold
20,0 17,6 24,9
N/S = sin señal
Los resultados indican que la combinación del mutante Z05 D580G_I709K_I616M con TaqGoId permite la 5 amplificación eficaz de la diana de ARN sin comprometer la eficacia de la PCR en la diana de ADN. La condición de control de TaqGold confirma el hecho comúnmente conocido de que la polimerasa Taq amplifica los moldes de ARN con una eficacia escasa. El control Z05 D580G_I709K_I616M sugiere que la ADN polimerasa mutante no puede amplificar las dianas de ARN o ADN en esta mezcla maestra tamponada basada en Tris con este perfil térmico modificado.
10
Se entiende que los ejemplos y modos de realización descritos en el presente documento son únicamente para propósitos ilustrativos y que se sugerirán diversas modificaciones o cambios a la luz de los mismos a expertos en la técnica.

Claims (15)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Una ADN polimerasa que tiene al menos un 80 % de identidad de secuencia con la SEQ ID NO: 1 y que tiene una eficacia de transcriptasa inversa incrementada en comparación con una ADN polimerasa de control, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es M y en la que el aminoácido correspondiente a la posición 709 de SEQ ID NO: 1 se selecciona del grupo que consiste en K, R, S, G y A, y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 616 de la SEQ ID NO: 1 es I y el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es I.
  2. 2. La ADN polimerasa de la reivindicación 1, en la que la ADN polimerasa comprende una secuencia de aminoácidos al menos un 90 % idéntica a la SEQ ID NO: 1.
  3. 3. La ADN polimerasa de las reivindicaciones 1 o 2, en la que el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 es cualquier aminoácido distinto de D.
  4. 4. La ADN polimerasa de la reivindicación 3, en la que el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 se selecciona del grupo que consiste en L, G, T, Q, A, S, N, R y K.
  5. 5. La ADN polimerasa de la reivindicación 4, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 580 de la SEQ ID NO: 1 es G.
  6. 6. La ADN polimerasa de una cualquiera de las reivindicaciones 1 a 5, en la que el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es K.
  7. 7. La ADN polimerasa de una cualquiera de las reivindicaciones 1 a 6, en la que el aminoácido de la ADN polimerasa correspondiente a la posición 616 de la SEQ ID NO: 1 es M, el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es K y el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 es G y en la que la ADN polimerasa de control tiene la misma secuencia de aminoácidos que la ADN polimerasa, excepto que el aminoácido de la ADN polimerasa de control correspondiente a la posición 616 de la SEQ ID NO: 1 es I, el aminoácido correspondiente a la posición 709 de la SEQ ID NO: 1 es I y el aminoácido correspondiente a la posición 580 de la SEQ ID NO: 1 es D.
  8. 8. Un ácido nucleico recombinante que codifica la ADN polimerasa de acuerdo con una cualquiera de las reivindicaciones 1 a 7.
  9. 9. Un vector de expresión que comprende el ácido nucleico recombinante de la reivindicación 8.
  10. 10. Una célula huésped que comprende el vector de expresión de la reivindicación 9.
  11. 11. Un procedimiento de producción de la ADN polimerasa de acuerdo con las reivindicaciones 1 a 7, comprendiendo dicho procedimiento:
    cultivar la célula huésped de la reivindicación 10 en condiciones adecuadas para la expresión del ácido nucleico que codifica la ADN polimerasa.
  12. 12. Un procedimiento para llevar a cabo la extensión del cebador, que comprende:
    poner en contacto una ADN polimerasa como en una de las reivindicaciones 1 a 7 con un cebador, un molde de polinucleótido y nucleósidos trifosfato en condiciones adecuadas para la extensión del cebador, produciendo de este modo un cebador extendido.
  13. 13. Un kit para producir un cebador extendido, que comprende:
    al menos un recipiente que proporciona una ADN polimerasa como en una de las reivindicaciones 1 a 7.
  14. 14. El kit de acuerdo con la reivindicación 13, que comprende además uno o más recipientes adicionales seleccionados del grupo que consiste en:
    (a) un recipiente que proporciona un cebador hibridable, en condiciones de extensión del cebador, a un molde de polinucleótido predeterminado;
    (b) un recipiente que proporciona nucleósidos trifosfato; y
    (c) un recipiente que proporciona un tampón adecuado para la extensión del cebador.
  15. 15. Una mezcla de reacción que comprende una ADN polimerasa como en una de las reivindicaciones 1 a 7, al menos un cebador, un molde de polinucleótido y nucleósidos trifosfato.
ES12809109.7T 2011-12-08 2012-12-04 ADN polimerasas con actividad mejorada Active ES2668448T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161568294P 2011-12-08 2011-12-08
US201161568294P 2011-12-08
PCT/EP2012/004993 WO2013083264A1 (en) 2011-12-08 2012-12-04 Dna polymerases with improved activity

Publications (1)

Publication Number Publication Date
ES2668448T3 true ES2668448T3 (es) 2018-05-18

Family

ID=47471678

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12809109.7T Active ES2668448T3 (es) 2011-12-08 2012-12-04 ADN polimerasas con actividad mejorada

Country Status (8)

Country Link
US (4) US8945882B2 (es)
EP (1) EP2788481B1 (es)
JP (1) JP6144697B2 (es)
CN (1) CN103987843B (es)
CA (1) CA2858264C (es)
ES (1) ES2668448T3 (es)
HK (1) HK1198704A1 (es)
WO (1) WO2013083264A1 (es)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103492559B (zh) 2011-04-11 2016-07-06 霍夫曼-拉罗奇有限公司 具有改进活性的dna聚合酶
ES2668448T3 (es) 2011-12-08 2018-05-18 F. Hoffmann-La Roche Ag ADN polimerasas con actividad mejorada
ES2624406T3 (es) * 2012-12-13 2017-07-14 F. Hoffmann-La Roche Ag ADN polimerasas con actividad mejorada
WO2016077795A1 (en) * 2014-11-14 2016-05-19 Illumina, Inc. Polymerases
US10280411B2 (en) 2015-10-27 2019-05-07 Pacific Biosciences of California, In.c Methods, systems, and reagents for direct RNA sequencing
CN109154026B (zh) 2016-05-13 2021-09-07 豪夫迈·罗氏有限公司 用于将dlbcl分类的方法和组合物
WO2018033615A1 (en) 2016-08-18 2018-02-22 Roche Diagnostics Gmbh Multiplex allele specific pcr assays for detection of estrogen receptor esr1 mutations
EP3541958A1 (en) 2016-11-15 2019-09-25 Ventana Medical Systems, Inc. Compositions and methods for prognosing and treating colorectal cancer
US10487317B1 (en) * 2017-03-23 2019-11-26 New England Biolabs, Inc. Stabilizing 5′-flap endonuclease activity
CN111051531A (zh) 2017-09-13 2020-04-21 豪夫迈·罗氏有限公司 短核酸的多重检测
EP3720970A1 (en) 2017-12-08 2020-10-14 H. Hoffnabb-La Roche Ag Detection of nucleic acids from platelet enriched plasma samples
ES2958745T3 (es) 2018-02-20 2024-02-14 Hoffmann La Roche Detección mejorada de inestabilidad microsatelital
JP7319990B2 (ja) 2018-03-21 2023-08-02 エフ. ホフマン-ラ ロシュ アーゲー メチル化dNTPを効率的かつ効果的に組み込むDNAポリメラーゼ
US11384376B2 (en) 2018-05-31 2022-07-12 Roche Molecular Systems, Inc. Reagents and methods for post-synthetic modification of nucleic acids
KR20210031699A (ko) * 2018-07-13 2021-03-22 다카라 바이오 가부시키가이샤 Rna로부터의 핵산 증폭반응에 적합한 dna 폴리머라아제 돌연변이체
US11739306B2 (en) 2018-09-13 2023-08-29 Roche Molecular Systems, Inc. Mutant DNA polymerase(s) with improved strand displacement ability
CN111849939B (zh) * 2020-07-16 2022-03-22 浙江大学 一种缺口dna偏好性高保真聚合酶及其应用
CN114075558B (zh) * 2020-08-21 2024-04-26 深圳华大生命科学研究院 一种wh54聚合酶及其在rt-pcr中的应用

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4666848A (en) 1984-08-31 1987-05-19 Cetus Corporation Polypeptide expression using a portable temperature sensitive control cassette with a positive retroregulatory element
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5407800A (en) * 1986-08-22 1995-04-18 Hoffmann-La Roche Inc. Reverse transcription with Thermus thermophilus polymerase
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US5693502A (en) 1990-06-11 1997-12-02 Nexstar Pharmaceuticals, Inc. Nucleic acid ligand inhibitors to DNA polymerases
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
JP2582980B2 (ja) 1990-09-28 1997-02-19 エフ.ホフマン−ラ ロシュ アクチェンゲゼルシャフト モルモシポ・アフリカヌスからの純化された熱安定性核酸ポリメラーゼ
EP0550687B1 (en) 1990-09-28 1999-06-09 F. Hoffmann-La Roche Ag 5' to 3' exonuclease mutations of thermostable dna polymerases
US5994056A (en) 1991-05-02 1999-11-30 Roche Molecular Systems, Inc. Homogeneous methods for nucleic acid amplification and detection
US5773258A (en) 1995-08-25 1998-06-30 Roche Molecular Systems, Inc. Nucleic acid amplification using a reversibly inactivated thermostable enzyme
US5948614A (en) 1995-09-08 1999-09-07 Life Technologies, Inc. Cloned DNA polymerases from thermotoga maritima and mutants thereof
EP0834569A1 (en) 1996-10-03 1998-04-08 Roche Diagnostics GmbH Thermostable DNA polymerase from carboxydothermus hydrogenoformans
US6020128A (en) 1997-06-10 2000-02-01 United States Of Ameria DNA polymerase from Treponema pallidum
US6228628B1 (en) 1997-07-09 2001-05-08 Roche Molecular Systems Mutant chimeric DNA polymerase
CA2243985C (en) 1997-09-11 2004-08-10 F. Hoffmann-La Roche Ag Thermostable dna polymerases incorporating nucleoside triphosphates labeled with fluorescein family dyes
EP0921196A1 (en) 1997-12-02 1999-06-09 Roche Diagnostics GmbH Modified DNA-polymerase from carboxydothermus hydrogenoformans and its use for coupled reverse transcription and polymerase chain reaction
EP1088891B1 (en) 1999-09-28 2005-01-12 Roche Diagnostics GmbH Thermostable enzyme promoting the fidelity of thermostable DNA polymerases - for improvement of nucleic acid synthesis and amplification in vitro
US6329178B1 (en) 2000-01-14 2001-12-11 University Of Washington DNA polymerase mutant having one or more mutations in the active site
JP2001269188A (ja) 2000-03-11 2001-10-02 Roche Diagnostics Gmbh Pcrにおける性能が向上したb型dnaポリメラーゼ変異体
US7179590B2 (en) 2000-04-18 2007-02-20 Roche Molecular Systems, Inc High temperature reverse transcription using mutant DNA polymerases
US6214557B1 (en) 2000-06-06 2001-04-10 Washington University Cold sensitive mutant DNA polymerases
EP1436385A4 (en) * 2001-09-14 2005-12-14 Invitrogen Corp DNA POLYMERASES AND MUTANTS CORRESPONDING
EP1466013A4 (en) 2001-09-14 2006-09-06 Applera Corp NUCLEIC ACID POLYMERASES FROM THERMUS SCOTODUCTUS
CA2409775C (en) 2001-12-03 2010-07-13 F. Hoffmann-La Roche Ag Reversibly modified thermostable enzymes for dna synthesis and amplification in vitro
US7148049B2 (en) 2002-04-02 2006-12-12 Roche Molecular Systems, Inc. Thermostable or thermoactive DNA polymerase molecules with attenuated 3′-5′ exonuclease activity
WO2003102213A2 (en) 2002-05-31 2003-12-11 University Of Washington Error-prone dna polymerase i mutants and methods for targeted random mutagenesis in continuous culture using error-prone dna polymerase i mutants
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
US7572581B2 (en) 2003-06-30 2009-08-11 Roche Molecular Systems, Inc. 2′-terminator nucleotide-related methods and systems
ES2546945T3 (es) * 2003-11-03 2015-09-30 Medical Research Council Polimerasa
US7417133B2 (en) 2004-02-27 2008-08-26 Institut Pasteur Methods for obtaining thermostable enzymes, DNA polymerase I variants from Thermus aquaticus having new catalytic activities, methods for obtaining the same, and applications of the same
US7462475B2 (en) 2004-05-20 2008-12-09 Dna Poleymerase Technology, Inc. Use of whole blood in PCR reactions
US20060172324A1 (en) 2005-01-28 2006-08-03 Roche Molecular Systems, Inc. Methods of genotyping using differences in melting temperature
WO2007117331A2 (en) 2005-12-22 2007-10-18 Ge Healthcare Bio-Sciences Corp. Novel dna polymerase from thermoanaerobacter tengcongenesis
JP5457184B2 (ja) 2006-09-14 2014-04-02 ディエヌエイ・ポリメラーゼ・テクノロジー・インコーポレイテッド Pcr阻害物質の存在下におけるdna増幅のためのtaqポリメラーゼ変異体酵素の使用
US8962293B2 (en) 2006-10-18 2015-02-24 Roche Molecular Systems, Inc. DNA polymerases and related methods
US8208381B2 (en) 2007-07-27 2012-06-26 Eg Innovations Pte. Ltd. Root-cause approach to problem diagnosis in data networks
US9315787B2 (en) 2011-01-14 2016-04-19 Kapa Biosystems, Inc. Modified DNA polymerases for improved amplification
CN103492559B (zh) 2011-04-11 2016-07-06 霍夫曼-拉罗奇有限公司 具有改进活性的dna聚合酶
JP6224613B2 (ja) 2011-12-08 2017-11-01 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 改善された活性を有するdnaポリメラーゼ
JP6140182B2 (ja) 2011-12-08 2017-05-31 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 改善された活性を有するdnaポリメラーゼ
ES2668448T3 (es) 2011-12-08 2018-05-18 F. Hoffmann-La Roche Ag ADN polimerasas con actividad mejorada

Also Published As

Publication number Publication date
CN103987843B (zh) 2015-12-23
US20180135033A1 (en) 2018-05-17
WO2013083264A8 (en) 2014-02-27
EP2788481B1 (en) 2018-03-07
US20140051126A1 (en) 2014-02-20
US9441269B2 (en) 2016-09-13
CA2858264A1 (en) 2013-06-13
CA2858264C (en) 2018-01-02
US9890366B2 (en) 2018-02-13
US10294462B2 (en) 2019-05-21
JP2015504651A (ja) 2015-02-16
WO2013083264A1 (en) 2013-06-13
JP6144697B2 (ja) 2017-06-07
US8945882B2 (en) 2015-02-03
HK1198704A1 (zh) 2015-05-29
CN103987843A (zh) 2014-08-13
EP2788481A1 (en) 2014-10-15
US20150184226A1 (en) 2015-07-02
US20170029792A1 (en) 2017-02-02

Similar Documents

Publication Publication Date Title
ES2668448T3 (es) ADN polimerasas con actividad mejorada
ES2624406T3 (es) ADN polimerasas con actividad mejorada
ES2561885T3 (es) ADN polimerasas de actividad mejorada
ES2716277T3 (es) ADN polimerasas con actividad mejorada
US9951320B2 (en) DNA polymerases with improved activity
US20180010106A1 (en) Dna polymerases with improved activity
ES2969883T3 (es) ADN polimerasas para la incorporación eficiente y eficaz de dNTP metilados