ES2385828T3 - Sondas, bibliotecas y kits para análisis de mezclas de ácidos nucleicos y procedimientos para construirlos - Google Patents

Sondas, bibliotecas y kits para análisis de mezclas de ácidos nucleicos y procedimientos para construirlos Download PDF

Info

Publication number
ES2385828T3
ES2385828T3 ES04738926T ES04738926T ES2385828T3 ES 2385828 T3 ES2385828 T3 ES 2385828T3 ES 04738926 T ES04738926 T ES 04738926T ES 04738926 T ES04738926 T ES 04738926T ES 2385828 T3 ES2385828 T3 ES 2385828T3
Authority
ES
Spain
Prior art keywords
library
probe
sequence
probes
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES04738926T
Other languages
English (en)
Inventor
Niels B. Ramsing
Peter Mouritzen
Sören Morgenthaler ECHWALD
Niels Tolstrup
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Exiqon AS
Original Assignee
Exiqon AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Exiqon AS filed Critical Exiqon AS
Priority claimed from PCT/DK2004/000429 external-priority patent/WO2004113563A2/en
Application granted granted Critical
Publication of ES2385828T3 publication Critical patent/ES2385828T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Una biblioteca de sondas oligonucleotídicas para un transcriptoma dado en la que cada sonda en la bibliotecaconsiste en una marca de la secuencia de reconocimiento que tiene una longitud de 6 a 12 nucleótidos y unresto de detección en el que al menos un monómero en cada sonda oligonucleotídica es un análogo delmonómero modificado, lo que incrementa la afinidad de unión por la secuencia diana complementariarespecto al correspondiente oligodesoxirribonucleótido sin modificar, de modo que las sondas de la bibliotecatienen suficiente estabilidad para la unión específica de secuencia y la detección de al menos un 70 %,preferentemente al menos un 90 % de todos los ácidos nucleicos diana diferentes en un transcriptoma de unaespecie y en la que el número de diferentes secuencias de reconocimiento comprende menos del 10 % detodas las marcas de secuencia posibles de una(s) longitud(es) dada(s).

Description

Sondas, bibliotecas y kits para análisis de mezclas de ácidos nucleicos y procedimientos para construirlos
Campo de la invención
La invención se refiere a sondas de ácido nucleico, bibliotecas de sondas de ácido nucleico y kits para detectar, clasificar o cuantificar componentes en una mezcla compleja de ácidos nucleicos, tal como un transcriptoma, y procedimientos de usarlos.
Antecedentes de la invención
Con el advenimiento de las micromatrices para realizar el perfil de expresión de miles de genes, tales como matrices GeneChip™ (Affymetrix, Inc., Santa Clara, CA) se pueden identificar las correlaciones entre genes expresados y fenotipos celulares en una fracción con los costes y trabajo necesarios para los procedimientos tradicionales, tales como transferencia Northern o análisis de transferencia de puntos. Las micromatrices permiten el desarrollo de múltiples ensayos paralelos para identificar y validar biomarcadores de enfermedad y dianas farmacológicas que se pueden usar en el diagnóstico y tratamiento. También se pueden usar perfiles de expresión génica para estimar y predecir las consecuencias metabólicas y toxicológicas de la exposición a un agente (p. ej., tal como un fármaco, una posible toxina o carcinógeno etc.) o una condición (p. ej., temperatura, pH etc.).
Los experimentos con micromatrices a menudo proporcionan datos redundantes, solo una fracción de los cuales tiene valor para el investigador. Adicionalmente, dado el formato muy paralelo de los ensayos basados en micromatrices, las condiciones pueden no ser óptimas para sondas de captura individuales. Por estos motivos, a los experimentos con micromatrices les suelen seguir, o suelen ser sustituidos por ellos, estudios confirmatorios usando ensayos homogéneos con un único gen, Estos son, con mayor frecuencia, procedimientos basados en PCR cuantitativa tal como el ensayo con 5’ nucleasa u otros tipos de ensayos cuantitativos con sondas con marcaje doble. No obstante, estos ensayos siguen requiriendo tiempo y son ensayos de una sola reacción que están dificultados por costes elevados y procedimientos de diseño de sondas que requieren mucho tiempo. Además, las sondas para el ensayo de 5' nucleasa son relativamente largas (p. ej., de 15-30 nucleótidos). Por tanto, las limitaciones en los sistemas de ensayo homogéneo que se conocen actualmente crean un cuello de botella en la validación de los hallazgos de micromatrices y en los procedimientos de validación de dianas enfocadas.
Un enfoque para evitar este cuello de botella es omitir las caras sondas indicadoras con marcaje doble usadas en los procedimientos del ensayo de la 5’ nucleasa y balizas moleculares y, en su lugar, usar pigmentos que se intercalan en el ADN no específicos de secuencia, tales como el Verde SYBR que brilla cuando se une al ADN bicatenario pero no al monocatenario. Usando dichos pigmentos es posible detectar de forma universal cualquier secuencia amplificada en tiempo real. No obstante, esta tecnología se ve dificultada por varios problemas. Por ejemplo, el cebado inespecífico durante el procedimiento de amplificación por PCR puede generar amplicones no diana accidentales que contribuirán al proceso de cuantificación. Además, son frecuentes las interacciones entre los cebadores para PCR en la reacción que forman “cebador-dímeros". Debido a la elevada concentración de cebadores de uso habitual en una reacción de PCR, esto puede conducir a cantidades significativas de amplicones no diana bicatenarios cortos a los que también se unen los pigmentos de intercalación. Por tanto, el procedimiento preferido de cuantificación de ARNm mediante PCR en tiempo real usa sondas de detección específicas de secuencia.
Un enfoque para evitar el problema de la amplificación aleatoria y la formación de cebador-dímeros es usar sondas de detección genéricas que se pueden usar para detectar un gran número de tipos diferentes de moléculas de ácido nucleico, mientras que la retención de alguna especificidad de secuencia ha sido descrita por Simeonov, y col. (Nucleic Acid Research 30(17): 91, 2002; U.S. Patent Publication 20020197630) e implica el uso de una biblioteca de sondas que comprende más del 10 % de todas las posibles secuencias de una longitud (o longitudes) dada. La biblioteca puede incluir varias nucleobases no naturales y otras modificaciones para estabilizar la unión de sondas/cebadorres en la biblioteca a una secuencia diana. Incluso en este caso, para la mayoría de las secuencias se requiere una longitud mínima de al menos 8 bases para alcanzar un grado de estabilidad que sea compatible con la mayoría de las condiciones de ensayo relevantes para aplicaciones tales como la PCR en tiempo real. Dado que una biblioteca universal de todos los posibles octámeros contiene 65.536 secuencias diferentes, incluso la biblioteca más pequeña considerada anteriormente por Simeonov, y col. contiene más del 10 % de todas las posibilidades, es decir al menos 6554 secuencias, cuya manipulación no es práctica y es muy caro de construir.
Desde un punto de vista práctico, varios factores limitan la facilidad de uso y la accesibilidad de las aplicaciones de ensayos homogéneos contemporáneos. Los problemas que se encuentran los usuarios de las tecnologías de ensayo convencionales incluyen:
costes prohibitivamente elevados al intentar detectar muchos genes diferentes en pocas muestras, ya que el precio de adquisición de una sonda para cada tránscrito es alto.
la síntesis de sondas marcadas requiere tiempo y el tiempo desde el pedido hasta la recepción desde el fabricante suele ser superior a una semana.
Los kits diseñados pueden no funcionar la primera vez y los kits validados son caros por ensayo. 2
Es difícil analizar rápidamente una diana nueva o mejora iterativamente un diseño de una sonda.
La secuencia exacta de la sonda de las sondas validadas comerciales puede ser desconocida para el cliente, lo que da lugar a problemas con la evaluación de los resultados y la idoneidad para publicación científica.
Cuando las condiciones o los componentes de los ensayos son oscuros, puede ser imposible pedir reactivos de una fuente alternativa.
La invención descrita aborda estos problemas prácticos y está dirigida a asegurar un desarrollo de ensayo rápido y barato de ensayos precisos y específicos para la cuantificación de tránscritos génicos.
Sumario de la invención
Es deseable poder cuantificar la expresión de la mayoría de los genes (p. ej., > 98 %) en, por ejemplo, el transcriptoma humano, usando un número limitado de sondas de detección oligonucleotídicas en un sistema de ensayo homogéneo. La presente invención resuelve los problemas con los que se encuentran los enfoque contemporáneos con los ensayos homogéneos destacados anteriormente proporcionando un procedimiento para la construcción de multi-sondas genéricas con suficiente especificidad de secuencia, de modo que es improbable que detecten un fragmento de secuencia amplificada alatoriamente o cebador-dímeros, pero todavía son capaces de detectar muchas secuencias diana diferentes cada una. Dichas sondas se pueden usar en diferentes ensayos y se pueden combinar en pequeñas bibliotecas de sondas (50 a 500 sondas) que se pueden usar para detectar y/o cuantificar componentes individuales en mezclas complejas compuestas por miles de ácidos nucleicos diferentes (p. ej., detección de tránscritos individuales en el transcriptoma humano compuesto por > 30.000 ácidos nucleicos diferentes) cuando se combinan con un conjunto de cebadores específicos de diana.
Cada multisonda comprende dos elementos: 1) un elemento de detección o resto de detección que consiste en uno
o más marcadores parta detectar la unión de la sonda a la diana; y 2) un elementos de reconocimiento o marcador de secuencia de reconocimiento que garantiza la unión a la(s) diana(s) específica(s) de interés. El elemento de detección puede ser cualquiera de varios principios de detección usados en ensayos homogéneos. La detección de la unión es directa mediante un cambio mensurable en las propiedades de uno o más de los marcadores tras la unión a la diana (p. ej., un ensayo de tipo baliza molecular con o sin estructura troncal) o indirecta mediante una reacción posterior tras la unión (p. ej. escisión meciante actividad 5' nucleasa de la ADN polimerasa en ensayos de 5' nucleasa).
El elemento de reconocimiento es un nuevo componente de la presente invención. Comprende un resto oligonucleotídico corto cuya secuencia se ha seleccionado para permitir la detección de una gran suboblación de nucleótidos diana en una mezcla de muestras complejas dada. Las sondas nuevas diseñadas para detectar muchas moléculas diana diferentes cada una se denominan multi-sondas. El concepto de diseñar una sonda para múltiples diana y explotar la recurrencia de una secuencia de reconocimiento corta seleccionando las secuencias más frecuentes es nuevo y contrario a las sondas convencionales que están diseñadas para ser lo más específicas posibles para una única secuencia diana. Los cebadores adyacentes y la elección de la secuencia de la sonda en combinación garantiza la especificidad de las multi-sondas. Los nuevos principios de diseño que surgen de los intentos de abordar el mayor número de dianas con el menor número de sondas son, asimismo, parte de la invención. Esto lo permite el descubrimiento de que las sondas de LNA muy cortas de 8-9 unidades de mezcla de unidades son compatibles con los ensayos basados en PCR. En un aspecto de la presente invención, en el elemento de reconocimiento se incorporan nucleobases, bases nucleosídicas o nucleótidos modificados o análogos, posiblemente junto con aglutinantes de ranura menores y otras modificaciones, todas ellas dirigidas a estabilizar el dúplex formado entre la sonda y la molécula diana de modo que se puede usar la secuencia de sonda más corta posible con la mayor cantidad de dianas. En un aspecto preferido de la invención, las modificaciones son incorporación de residuos de LNA para reducir la longitud del elemento de reconocimiento de 8 o 9 nucleótidos al tiempo que mantiene la estabilidad suficiente del dúplex formado para ser detectable en las condiciones de ensayo habituales.
Preferentemente, las multi-sondas se modifican con el fin de multiplicar al menos por dos la afinidad de unión de la sonda por una secuencia diana en comparación con una sonda de la misma secuencia sin la modificación, en las mismas condiciones de detección, tales como, por ejemplo, las condiciones de PCR o condiciones de hibridación rigurosas. Las modificaciones preferidas incluyen, entre otras, inclusión de nucleobases, bases nucleosídicas o nucleótidos que se han modificado mediante un resto químico o se han sustituido por un análogo (p. ej., incluido un análogo de ribosa o de desoxiribosa) o usando enlaces internucleotídicos distintos a los enlaces fosfodiéster (tales como enlaces internucleotídicos sin fosfato), todo para incrementar la afinidad de unión. Las modificaciones preferidas también pueden incluir la unión de agentes de estabilización de dúplex tales como, por ejemplo, ligandos de unión al surco menor (MGB) o ácidos nucleicos intercalantes (INA). Adicionalmente, las modificaciones preferidas pueden también incluir la adición de bases no discriminatorias, tales como, por ejemplo, 5-nitroindol, que son capaces de estabilizar la formación de dúplex con independencia de la nucleobase en la posición opuesta de la hebra diana. Por último, las multi-sondas compuestas por una estructura de fosfato sin azúcar tal como, por ejemplo, PNA, que son capaces de unirse a la secuencia, específicamente a una secuencia diana, también se consideran una modificación, Todas las diferentes modificaciones de incremento de la afinidad mencionadas anteriormente se denominarán, a continuación, “la(s) modificación(es) estabilizante(s)” y la consiguiente multi-sonda también se
denominará, en los sucesivo, “oligonucleótido modificado”. Más preferentemente, la afinidad de unión del oligonucleótido modificado es al menos aproximadamente 3 veces, 4 veces, 5 veces o 20 veces mayor que la unión de una sonda de la misma secuencia pero sin la(s) modificación(es) estabilizante(s).
Más preferentemente, la(s) modificación(es) estabilizante(s) es la inclusión de uno o más análogos nucleotídicos de LNA. Las sondas de 6 a 12 nucleótidos de acuerdo con la invención pueden comprender de 1 a 8 nucleótidos estabilizantes, tales como nucleótidos LNA. Cuando se incluyen al menos dos nucleótidos LNA, estos pueden ser consecutivos o estar separados por uno o más nucleótidos que no son LNA. En un aspecto, los nucleótidos LNA son alfa y/o xilo nucleótidos LNA.
La invención también proporciona una biblioteca de multi-sondas oligométicas útiles en las condiciones usadas en los ensayos basados en NASBA.
El NASBA es un procedimiento isotérmico específico de la amplificación de ácido nucleico adecuado para la amplificación de ARN. El aislamiento del ácido nucleico se consigue mediante la lisis con tiocianato de guanidina más Triton X-100 y finalizando con la elución del ácido nucleico purificado de partículas de dióxido de silicio. La amplificación mediante NASBA implica las actividades coordinadas de tres enzimas, transcriptasa inversa AMV, RNasa H y ARN polimerasa de T7. La detección cuantitativa se consigue a modo de calibradores internos, añadidos en el momento del aislamiento, que se co-amplifican y después se identifican junto con el ARN silvestre usando electroquimioluminiscencia.
La invención también proporciona una biblioteca de multi-sondas oligoméricas que comprende multi-sondas que comprenden al menos una con modificaciones estabilizantes como se ha definido anteriormente. Preferentemente, las sondas tienen una longitud menor de aproximadamente 20 nucleótidos y, más preferentemente, menor de aproximadamente 12 nucleótidos, y, más preferentemente, de aproximadamente 8 o 9 nucleótidos. También, preferentemente, la biblioteca comprende menos de aproximadamente 3000 sondas y, más preferentemente, la biblioteca comprende menos de aproximadamente 500 sondas y, más preferentemente, aproximadamente 100 sondas. Las bibliotecas que contienen multi-sondas marcadas se pueden usar en diversas aplicaciones en función del tipo de elemento de detección unido al elemento de reconocimiento. Estas aplicaciones incluyen, entre otras, ensayos de marcaje doble o sencillo, tales como el ensayo de 5’ nucleasa, aplicaciones de baliza molecular (véase, por ejemplo, Tyagi y Kramer Nat. Biotechnol. 14: 303-308 (1996) y otros ensayos basados en FRET.
En un aspecto de la invención, las multi-sondas descritas anteriormente se diseñan juntas para complementarse entre sí como un subconjunto predefinido de todas las posibles secuencias de las longitudes dadas seleccionadas para poder detectar/caracterizar/cuantificar el mayor número de ácidos nucleicos en una mezcla compleja usando el menor número de secuencias de multi-sondas. Estos pequeños subconjuntos prediseñados de todas las posibles secuencias constituyen una biblioteca de multi-sondas. Las bibliotecas de multi-sondas descritas por la presente invención consiguen su funcionalidad a una complejidad considerablemente reducida seleccionando deliberadamente los oligómeros más frecuentes de una longitud o longitudes dadas al tiempo que se intenta diversificar la selección para obtener la mejor cobertura posible de la población diana de ácidos nucleicos complejos. En un aspecto preferido, las sondas de la biblioteca hibridan con más de aproximadamente 60 % de una población diana de ácidos nucleicos, tales como una población de ARNm humanos. Más preferentemente, las sondas hibridan con más del 70 %, más del 80 %, más del 90 %, más del 95 % e incluso más del 98 % de todas las moléculas de ácido nucleico diana en una población de moléculas diana (véase, por ejemplo, la Fig. 1).
En un aspecto más preferido de la invención, una biblioteca de sondas (es decir, tal como aproximadamente 100 multi-sondas), que comprende aproximadamente 0,1 % de todas las posibles secuencias de la(s) longitud(es) seleccionada(s) es capaz de detectar, clasificar y/o cuantificar más del 98 % de los tránscritos de ARNm en el transcriptoma de cualquier especie específica, en particular mamíferos y, más concretamente, seres humanos (es decir, > 35.000 de secuencias de ARNm diferentes). De hecho, se prefiere que al menos el 85 % de todos los ácidos nucleicos diana en una población diana esté cubierto por una biblioteca de multi-sondas de la invención.
Los problemas con los ensayos homogéneos existentes mencionados anteriormente se abordan mediante el uso de una biblioteca de multi-sondas de acuerdo con la invención que consiste en un conjunto mínimo de sondas de detección cortas para reconocer o detectar una mayoría de todos los genes expresados en un tipo de célula dada de un organismo dado. En un aspecto, la biblioteca comprende sondas que detectan cada tránscrito en un transcriptoma de más de aproximadamente 10.000 genes, más de aproximadamente 15.000 genes, más de aproximadamente 20.000 genes, más de aproximadamente 25.000 genes, más de aproximadamente 30.000 genes
o más de aproximadamente 35.000 genes o un número equivalente de diferentes tránscritos de ARNm. En un aspecto preferido, la biblioteca comprende sondas que detectan secuencias de transcritos de mamífero tales como, por ejemplo, secuencias de ratón, rata, conejo, mono o ser humano.
Proporcionando un conjunto de multi-sondas rentable útil para el desarrollo rápido de ensayos de PCR cuantitativa en tiempo real y de punto final, la presente invención supera las limitaciones tratadas anteriormente para ensayos homogéneos contemporáneos. El elemento de detección de las multi-sondas de acuerdo con la invención puede estar con marcaje único o doble (p. ej., comprendiendo un marcador en cada extremo de la sonda o una posición interna). Por tanto, las sondas de acuerdo con la invención se pueden adaptar para usar en ensayos de 5’ nucleasa, ensayos de baliza molecular, ensayos FRET y otros ensayos similares. En un aspecto, la multi-sonda de detección
comprende dos marcadores capaces de interaccionar entre sí para producir una señal o para modificar una señal. De modo que se puede detectar una señal o un cambio en una señal cuando la sonda hibrida con una secuencia diana. Un aspecto concreto es cuando los dos marcadores comprenden un inactivador y una molécula indicadora.
En otro aspecto, la sonda comprende un segmento de reconocimiento específico de diana capaz de hibridar específicamente con una pluralidad de diferentes moléculas de ácido nucleico que comprenden la secuencia de reconocimiento de complementariedad. Un aspecto de detección concreto de la invención, denominado “baliza molecular con una región troncal” es cuando el segmento de reconocimiento está flanqueado por una primera y una segunda secuencias formadoras de horquilla complementarias, que pueden hibridar para formar una horquilla. Un marcador indicador está unido al extremo de una secuencia complementaria y un resto inactivador está unido al extremo de la otra secuencia complementaria. El tronco formado cuando las secuencias complementarias primera y segunda hibridan (es decir, cuando el segmento de reconocimiento de la sonda no hibrida con su diana) mantiene en estrecha proximidada estos dos marcadores, lo que hace que una señal producida por el indicador se inactive mediante transferencia de energía por resonancia de fluorescencia (FRET). La proximidad de los dos marcadores se reduce cuando la sonda hibrida a una secuencia diana y el cambio en la proximidad produce un cambio en la interacción entre los marcadores. Por tanto, la hibridación de la sonda tiene como resultado una señal (p. ej., fluorescencia) producida por la molécula indicadora, que se puede detectar y/o cuantificar.
En otro aspecto, la multi-sonda comprende un indicador y una molécula inactivadota en extremos opuestos de la secuencia de reconocimiento corta, de modo que estos restos están lo bastante cercanos entre sí como para que el inactivador reduzca sustancialmente la señal producida por la molécula indicadora. Este es el caso cuando la sonda está libre en solución y cuando está unida al ácido nucleico diana. Un aspecto de detección concreto de la invención denominado “ensayo de 5’ nucleasa” es cuando la multi-sonda puede ser susceptible a la escisión mediante la actividad de 5’ nucleasa de la ADN polimerasa. Posiblemente, esta reacción puede tener como resultado la separación de la molécula inactivadota de la molécula indcadora y la producción de una señal detectable. Por tanto, dichas sondas se pueden usar en ensayos basados en amplificación para detectar y/o cuantificar el procedimiento de amplificación para un ácido nucleico diana.
En un primer aspecto, la presente invención se refiere a bibliotecas de multi-sondas como se ha tratado anteriormente. En dicha bib lioteca de sondas oligonucleotídicas, cada sonda comprende un elemento de detección y un segmento de reconocimiento que tiene una longitud de aproximadamente x nucleótidos, en el que algunas o todas las nucleobases en dichos oligonucleotidos están sustituidas por bases no naturales que tienen el efecto de incrementar la afinidad de unión en comparación con las nucleobases naturales y/o algunas o todas las unidades nucleotídicas de la sonda oligonucleotídica están modificadas con un resto químico para incrementar la afinidad de unión y/o en el que dichos oligonucleotidos están modificados con un resto químico para incrementar la afinidad de unión, de modo que la sonda tiene suficiente estabilidad para la unión a la secuencia diana en condiciones adecuadas para la detección, y en el que el número de diferentes segmentos de reconocimiento comprende menos del 10 % de todos los posibles segmentos de la longitud dada y en el que más del 90 % de las sondas puede detectar más de una diana complementaria en una población diana de ácidos nucleicos, de modo tal que la biblioteca de sondas oligonucleotídicas puede detectar una fracción sustancial de todas las secuencias diana en una población diana de ácidos nucleicos.
Por tanto, la invención se refiere a una biblioteca de sondas oligonucleotídicas en la que cada sonda en la biblioteca consiste en una marca de la secuencia de reconocimiento y un resto de detección en el que al menos un monómero en cada sonda oligonucleotídica es un análogo del monómero modificado, lo que incrementa la afinidad de unión por la secuencia diana complementaria respecto al correspondiente oligodesoxirribonucleótido sin modificar, de modo que las sondas de la biblioteca tienen suficiente estabilidad para la unión específica de secuencia y la detección de una fracción sustancial de un ácido nucleico diana en cualquier población diana dada y en la que el número de diferentes secuencias de reconocimiento comprende menos del 10 % de todas las marcas de secuencia posibles de una(s) longitud(es) dada(s).
La invención además se refiere a una biblioteca de sondas oligonucleotídicas en la que el segmento marca de la secuencia de reconocimiento de las sondas en la biblioteca se ha modificado de al menos uno de los modos siguientes:
i) sustitución con al menos un nucleótido no natural; y
ii) sustitución con al menos un resto químico para incrementar la estabilidad de la sonda.
Además, la invención se refiere a una biblioteca de sondas oligonucleotídicas en la que la marca de la secuencia de reconocimiento tiene una longitud de 6 a 12 nucleótidos (es decir, 6, 7, 8, 9, 10, 11 o 12), y en la que la longitud preferida es de 8 o 9 nucleótidos.
Además, la invención se refiere a marcas de la secuencia de reconocimiento que están sustituidas con nucleótidos LNA.
Además, la invención se refiere a bibliotecas de la invención en las que más del 90 % de las sondas oligonucleotídicas pueden unirse y detectar al menos dos secuencas diana en una población de ácido nucleico,
preferentemente porque las secuencas diana unidas son complementarias a la secuencia de reconocimiento de las sondas.
También preferentemente, la sonda puede detectar más de una diana en una población diana de ácidos nucleicos, por ejemplo la sonda puede hibridar con una pluralidad de diferentes moléculas de ácido nucleico contenidas dentro de la población diana de ácidos nucleicos.
La invención también proporciona un procedimiento, sistema y programa informático incluido en un medio legible por ordenador ("un producto de programa informático”) para diseñar multi-sondas que comprenden al menos una nucleobase estabilizante. El procedimiento comprende buscar en una base de datos de secuencias diana (p. ej., tal como una base de datos de secuencias expresadas) y diseñar un pequeño conjunto de sondas (p. ej., tal como 50 o 100 o 200 o 300 o 500), que: i) tiene suficiente estabilidad de unión para unirse a su respectiva secuencia diana en condiciones de PCR, ii) tienen una propensión limitada para formar estructuras dúplex con ella misma y iii) son capaces de unirse y detectar/cuantificar al menos aproximadamente 60 %, al menos aproximadamente 70 %, al menos aproximadamente 80 %, al menos aproximadamente 90 % o al menos aproximadamente 95 % de todas las secuencias de la base de datos dada de las secuencias, tal como una base de datos de secuencias expresadas.
Las sondas están diseñadas “in silico”, que comprenden todas las combinaciones posibles de nucleótidos de una longitud dada que forman una base de datos de sondas candidatas virtuales. Estas sondas virtuales se buscan contra la base de datos de secuencias diana para identificar sondas que comprenden la capacidad máxima para detectar las secuencias diana más diferentes en la base de datos (“sondas óptimas”). Las sondas óptimas identificadas de este modo se retiran de la base de datos de sondas virtual. Adicionalmente, los ácidos nucleicos diana, que se identificaron mediante el conjunto anterior de sondas óptimas, se restan de la base de datos de ácidos nucleicos diana. Las sondas restantes se buscan después contra las secuencias diana restantes para identificar un segundo conjunto de sondas óptimas. El procedimiento se repite hasta que se identifica un conjunto de sondas que puede proporcionar la cobertura deseada de la base de datos de las secuencias diana. El conjunto se puede almacenar en una base de datos como fuente de secuencias para el análisis de transcriptomas. Se pueden sintetizar multi-sondas que tienen secuencias de reconocimiento, que corresponden a las de la base de datos para generar una biblioteca de multi-sondas.
En un aspecto preferido, la base de datos de secuencias diana comprende secuencias de ácido nucleico correspondientes a ARNm humano (p. ej., moléculas de ARNm, ADNc y similares).
En otro aspecto, el procedimiento comprende además calcular la estabilidad basada en la suposición de que la secuencia de reconocimiento comprende al menos un nucleótido estabilizante, tal como una molécula de LNA. En un aspecto preferido, La estabilida calculada se usa para eliminar las secuencias de reconocimiento de las sondas con una estabilidad inadecuada de la base de datos de sondas candidatas virtuales antes de la búsqueda inicial contra la base de datos de secuencias diana para iniciar la identificación de secuencias de reconocimiento de sondas óptimas.
En otro aspecto, el procedimiento comprende además calcular la propensión para una secuencia de reconocimiento de sondas dada para formar una estructura dúplex con sí misma en base a la suposición de que la secuencia de reconocimiento comprende al menos un nucleótido estabilizante, tal como una molécula de LNA. En un aspecto preferido, la propensión calculada se usa para eliminar las secuencias de reconocimiento que es probable que formen dúplex de sondas a partor de la base de datos de sondas candidatas virtuales antes de la búsqueda inicial contra la base de datos de secuencias diana para iniciar la determinación de secuencias de reconocimiento de sondas óptimas.
En otro aspecto, el procedimiento comprende además evaluar la aplicabilidad general de una secuencia de reconocimiento de sonda candidata dada para la inclusión en el conjunto creciente de candidatas a sonda óptima mediante búsqueda contra las secuencias diana restantes así como una búsqueda contra el conjunto original de secuencias diana. En un aspecto preferido, solo las secuencias de reconocimiento de sondas que con frecuencia se encuentran en las secuencias diana restantes y en las secuencias diana originales se añaden al conjunto creciente de secuencias de reconocimiento de sonda óptima. En un aspecto más preferido, esto se consigue calculando el producto de las puntuaciones de estas búsquedas y seleccionando la secuencia de reconocimiento de sondas con el producto más alto que todavía está entre las secuencias de reconocimiento de sonda con el 20 % de mejor puntuación en la búsqueda contra las dianas actuales.
La invención también proporciona un programa informático incluido en un medio legible por ordenador que comprende instrucciones para buscar una base de datos que comprende una pluralidad de diferentes secuencias diana y para identificar un conjunto de secuencias de reconocimiento de sondas capaces de identificar hasta al menos aproximadamente 60 %, aproximadamente 70 %, aproximadamente 80 %, aproximadamente 90 % y aproximadamente 95 % de las secuencias dentro de la base de datos. En un aspecto, el programa proporciona instrucciones para ejecutar el procedimiento descrito anteriormente. En otro aspecto, el programa proporciona instrucciones para implementar un algoritmo como se muestra en la Fig. 2. La invención proporciona además un sistema en el que el sistema comprende una memoria para almacenar una base de datos que comprende información de la secuencia para una pluralidad de diferentes secuencias diana y también comprende un programa de aplicación para ejecutar las instruccions del programa para buscar en la base de datos un conjunto de secuencias
de reconocimiento de sondas capaz de hibridar con al menos aproximadamente 60 %, aproximadamente 70 %, aproximadamente 80 %, aproximadamente 90 % y aproximadamente 95 % de las secuencias dentro de la base de datos.
Otro aspecto de la invención se refierea una sonda oligonucleotídica que comprende un elemento de detección y un segmento de reconocimiento cada uno de forma independiente con una longitud de aproximadamente 1 a 8 nucleótidos, en el que algunos o todos los nucleótidos en los oligonucleótidos están sustituidos por bases o análogos de bases no naturales que tienen el efecto de incrementar la afinidad de unión en comparación con las nucleobases naturales y/o algunas o todas las unidades nucleotídicas de la sonda oligonucleotídica están modificadas con un resto químico o sustituidas con un análogo para incrementar la afinidad de unión y/o en el que dichos oligonucleotidos están modificados con un resto químico o es un análogo oligonucleotídico para incrementar la afinidad de unión, de modo que la sonda tiene suficiente estabilidad para la unión a la secuencia diana en condiciones adecuadas para la detección, y en el que la sonda es capaz de detectar más de una diana complementaria en una población diana de ácidos nucleicos.
Se divulga un kit para la caracterización o detección o cuantificación de ácidos nucleicos diana que comprenden muestras de una biblioteca de multi-sondas. En un aspecto, el kit comprende protocolos in silico para su uso. En otro aspecto, el kit comprende información relacionada con sugerencias para obtener cebadores de ADN económicos. Las sondas contenidas en estos kits pueden tener cualquiera o todas las características descritas anteriormente. En un aspecto preferido, una pluralidad de sondas comprende al menos un nucleótido estabilizante, tal como un nucleótido LNA. En otro aspecto, la pluralidad de sondas comprende un nucleótido acoplado o asociado de forma estable con al menos un resto químico para incrementar la estabilidad de unión de la sonda. En un aspecto preferido adicional, el kit comprende aproximadamente 100 sondas diferentes, Los kits de acuerdo con la invención permiten que un usuario desarrolle rápida y eficazmente un ensayo para miles de diferentes dianas de ácido nucleico.
La invención proporciona además una multi-sonda que comprende uno o más nucleótidos LNA, que tiene una longitud reducida de aproximadamente 8 o 9 nucleótidos. Seleccionando octámeros y nonámeros frecuentes como dianas, es posible detectar muchos genes diferentes con la misma sonda. Cada sonda de 8 o 9 unidades se puede usar para detectar más de 7000 secuencias de ARNm humano diferentes. La especificidad necesaria se garantiza mediante el efecto combinado de cebadores de ADN baratos para el gen diana y dirigiendo la secuencia de sonda de 8 o 9 unidades al ADN amplificado (Fig. 1).
En una realización preferida, la presente invención se refiere a una biblioteca de multi-sondas oligonucleotídicas que comprende octámeros y nonámeros sustituidos con LNA de menos de aproximadamente 1000 secuencias, preferentemente de menos de aproximadamente 500 secuencias o, más preferentemente, de menos de aproximadamente 200 secuencias, tal como consistentes en aproximadamente 100 secuencias diferentes seleccionadas de modo que la biblioteca sea capaz de reconocer más de aproximadamente 90 %, más preferentemente más de aproximadamente 95 % y más preferentemente más de aproximadamente 98 % de las secuencias de ARNm de un organismo diana u órgano diana.
Muestras control positivo:
Un problema recurrente en el diseño de ensayos de detección por PCR en tiempo real para múltiples genes es que la tasa de éxito de estos diseños de novo es inferior al 100 %. La resolución de los problemas de un ensayo no funcional puede ser difícil ya que, idealmente se necesita un molde específico de la diana para cada sonda para analizar la funcionalidad de la sonda de detección. Además, un molde específico de la diana puede ser útil como control positivo si se desconoce si la diana está disponible en la muestra de ensayo.
Cuando se opera con un número limitado de sondas de detección en un kit de biblioteca de la sonda como se describe en la presente invención (p. ej., 90), es factible también proporcionar dianas control positivo en forma de moldes amplificables por PCR que contienen todas las dianas posibles para el número limitado de sondas (p. ej., 90). Esta característica permite que los usuarios evalúen la función de cada sonda y no es factible para ensayos basados en sondas no recurrentes y, por tanto, constituye una característica beneficiosa adicional de la invención. Para las secuencias de reconocimiento de sonda preferidas sugeridas enumeradas en la Fig. 13, los inventores han diseñado concatémeros de secuencias control para todas las sondas, que contienen una diana amplificable por PCR para cada sonda en las 40 primeras sondas.
Selección de secuencias sonda
Un aspecto importante de la presente invención es la selección de secuencias diana de sondas óptimas con el fin de apuntar a tantas dianas con el menor número de sondas posibles, dado un criterios de selección diana. Esto se puede conseguir seleccionando deliberadamente secuencias diana que aparecen con más frecuencia de lo que cabría esperar a partir de una distribución aleatoria.
Por tanto, la invención se refiere, en un aspecto, a un procedimiento de seleccionar secuencias oligonucleotídicas útiles en una biblioteca de multi-sondas de la invención, en el que el procedimiento comprende:
a) proporcionar una primera lista de todos los posibles oligonucleótidos de un número predefinido de
nucleótidos, N (normalmente un número entero seleccionado de 6, 7, 8, 9, 10, 11 y 12, preferentemente 8 o 9), teniendo dichos oligonucleótidos una temperatura de fusión, Tm, de al menos 50 ºC (preferentemente al menos 60 ºC).
b) proporcionar una segunda lista de secuencias de ácido nucleico diana (tal como una lista de una población de ácidos nucleicos diana tratada en el presente documento),
c) identificar y almacenar para cada miembro de dicha primera lista, el número de miembros de dicha segunda lista, que incluye una secuencia complementaria de cada miembro citado,
d) seleccionar un miembro de dicha primera lista, que en la identificación en la etapa c coincide con el número máximo, identificado en la etapa c, de miembros de dicha segunda lista,
e) añadir el miembro seleccionado en la etapa d a una tercera lista consistente en los oligonucleótidos seleccionados útiles en la biblioteca de acuerdo con una cualquiera de las reivindicaciones precedentes.
f) restar el miembro seleccionado en la etapa d de dicha primera lista para proporcionar una primera lista revisada,
m) repetir las etapas d a f hasta que dicha tercera lista consista en miembros que, juntos, serán complementarios con al menos el 30 % de los miembros de la lista de secuencias de ácidos nucleicos diana de la etapa b (normalmente el porcentaje será mayor, tal como al menos 40 %, al menos 50 %, al menos 60 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 % o incluso mayor, tal como al menos 97 %, al menos 98 % e incluso tan alto como de al menos 99 %).
Se prefiere que la primera lista solo incluya oligonucleótidos incapaces de autohibridación con el fin de hacer que un uso posterior de las sondas sea menos propensa a dar falsos positivos.
El procedimiento de selección puede incluir una serie de etapas después de la etapa f, pero antes de la etapa m
g) resta de todos los miembros de dicha segunda lista, que incluye una secuencia complementaria al miembro seleccionado en la etapa d para obtener una segunda lista revisada,
h) identificación y almacenamiento para cada miembro de dicha primera lista revisada, el número de miembros de dicha segunda lista revisada, que incluye una secuencia complementaria de cada miembro citado,
i) seleccionar un miembro de dicha primera lista, que en la identificación en la etapa h coincide con el número máximo, identificado en la etapa h, de miembros de dicha segunda lista, o seleccionar un miembro de dicha primera lista proporciona el número máximo obtenido multiplicando el número identificado en la etapa h con el número identificado en la etapa c,
j) adición del miembro seleccionado en la etapa i a dicha tercera lista,
k) resta del miembro seleccionado en la etapa i de dicha primera lista revisada, y
j) resta de todos los miembros de dicha segunda lista revisada, que incluye una secuencia complementaria al miembro seleccionado en la etapa i.
La selección en la etapa d después de la etapa c está convenientemente precedida por la identificación de los miembros de dicha primera lista que hibrida con más de un porcentaje seleccionado (60 % o más, tal como el 80 5 preferido) del número máximo de miembros de dicha segunda lista de modo que solo dichos miembros identificados de este modo se someten a la selección en la etapa d.
En la implementación práctica del procedimiento de selección, dichas primera, segunda y tercera listas se almacenan en la memoria de un sistema informático, preferentemente en la base de datos. La memoria (también denominada “medio de lectura informática”) puede ser volátil y no volátil, es decir cualquier dispositivo de memoria usada convencionalmente en sistemas informáticos. una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), un dispositivo de almacenamiento de datos, tal como un disco duro, un CD-ROM, DVD-ROM, y cualquier otro dispositivo de memoria conocido.
La invención también proporciona un producto de programa informático que proporciona instrucciones para implementar el procedimiento de selección, incluido en un medio de lectura informática (definida como anteriormente). Es decir, el programa informático se puede recopilar y cargar en una memoria informática activa o puede cargarse en un dispositivo de almacenamiento no volátil (opcionalmente en formato comprimido) desde donde se puede ejecutar. En consecuencia, la invención también incluye un sistema que comprende una base de datos de secuencias diana y un programa de aplicación para ejecutar el programa informático. Un código fuente para dicho programa informático se indica en la Fig. 17.
En una población de ácidos nucleicos distribuidos al azar, la aparición de secuencias seleccionadas de una longitud
dada seguirá una distribución estadística definida por:
N1 = la longitud completa de la población de ácidos nucleicos dada (p. ej., 76.002.917 pares de bases en la versión 1 de 30 de junio de 2003 de RefSeq).
N2 = el número de fragmentos que comprende la población de ácidos nucleicos (p. ej., 38.556 genes en la versión 1 de 30 de junio de 2003 de RefSeq).
N3 = la longitud de la secuencia de reconocimiento (p. ej., 9 pares de bases)
N4 = la frecuencia de aparición
N4 = (N1 – ((N3 – 1) x 2 x N”))/(4N3)
P. ej.,
76.002.917 – x2 x 38.556 aproximadamente 287 veces de secuencias de 9 unidades
= 49
o
76.002.917 – 7x2 x 38.556 aproximadamente 1,151 veces de secuencias de 8 unidades
= 48
Por tanto, como se describe en el ejemplo proporcionado anteriormente, una secuencia aleatoria de 8 y de 9 unidades se produciría, de media, 1.151 y 287 veces, respectivamente, en una población aleatoria de las 38.556 secuencias de ARNm descritas.
En el ejemplo anterior, las 76.002.917 pares de bases que se originan de 38.556 genes corresponderían a una longitud media del tránscrito de 1971 pb, cada uno contiene 1971-16 o 1955 secuencias diana cada uno de 9 unidades. Por tanto, sería necesario un mínimo estadístico, 38.556/1955/287 or 5671 sondas de 9 unidades para una sonda dirigida a cada gen.
No obstante, la aparición de secuencias de 9 unidades no está distribuida al azar. De hecho, una pequeña subpoblación de secuencias se produce a una prevalencia sorprendentemente alta, hasta más de 30 veces la prevalencia prevista a partir de una distribución aleatoria. En una población diana específica seleccionada de acuerdo con criterios preferidos, preferentemente las secuencias más frecuentes deberán seleccionarse para aumentar la cobertura de una biblioteca seleccionada de secuencias diana de la sonda. Como se ha descrito previamente, la selección debería ser escalonada, de modo que la selección de las secuencias diana más frecuentes se evalúa, así como en la población diana de partida, sí como en la población restante tras cada etapa de selección.
En una realización preferida de la invención, las dianas para la biblioteca de sondas son todo el transcriptoma expresado.
Dado que la tasa de éxito de la reacción de la transcriptasa inversa disminuye con la distancia desde el cebador de RT usado y dado que usar un cebador poli-T dirigido al tracto poli-A en ARNm es frecuente, la diana mencionada anteriormente puede estar restringida además a incluir únicamente las 1000 bases más proximales en cada ARNm. Esto puede tener como resultado la selección de otro conjunto de secuencias diana de la sonda óptima para una cobertura óptima.
Asimismo, la diana mencionada anteriormente puede estar restringida a incluir solo los 50 pb de la secuencia de la región de codificación que flanquea los intrones de un gen para asegurar los ensayos que preferentemente solo monitorizan el ARNm y no el ADN genómico o para incluir únicamente regiones que no contienen secuencias di, tri o tetra repetidas, para evitar la unión repetida o sondas o cebadores o regiones que no contienen una variación alélica conocida, para evitar la hibridación errónea del cebador o la sonda debido a variaciones de secuencia en las secuencias o regiones diana de contenido extremadamente alto en GC para evitar la inhibición de la amplificación por PCR.
Dependiendo de la selección de cada diana, el conjunto óptimo de sondas puede variar en función de la prevalencia de las secuencias diana en cada selección diana.
Selección de medios de detección e identificación de ácidos nucleicos sencillos
Otra parte de la invención se refiere a la identificación de un medio para la detección de un ácido nucleico diana, en el que el procedimiento comprende
A) introducir, en un sistema informático, datos que identifican de forma única la secuencia de ácido nucleico de dicho ácido nucleico diana, en el que dicho sistema informático comprende una base de datos que contiene información de la composición de al menos una biblioteca de sondas de ácido nucleico de la invención, y en el que el sistema informático comprende además una base de datos de secuencias de ácido nucleico diana para cada sonda de dicha al menos una biblioteca y/o comprende además medios para adquirir y comparar datos de las secuencias de ácido nucleico,
B) Identificar, en el sistema informático, una sonda de al menos una biblioteca, en el que la secuencia de la sonda existe en la secuencia del ácido nucleido diana o una secuencia complementaria a la secuencia del ácido nucleico diana;
C) Identificar, en el sistema informático, el cebador que amplificará la secuencia del ácido nucleico diana, y
D) proporcionar, como identificación del medio específico para la detección, una salida que destaca la sonda identificada en la etapa B y las secuencias de los cebadores identificados en le etapa C.
El procedimiento indicado anteriormente tiene varias ventajas en el caso de que se desee identificar rápida y específicamente un ácido nucleico concreto. Si el investigador ya ha adquirido una biblioteca de multi-sondas adecuada de la invención, el procedimiento hace posible en segundos adquirir información en relación con cuál de las sondas en la biblioteca se debería usar para un ensayo posterior y de los cebadores que se deberían sintetizar. El factor tiempo es importante, ya que la síntesis de un par de cebadores se puede conseguir durante la noche, mientras que la síntesis de la sonda normalmente requeriría tiempo y sería dificultoso.
Para facilitar el usp del procedimiento, la biblioteca de sondas se puede identificar (p. ej., por medio de un código de producto que esencialmente dice al sistema informático cómo está compuesta la biblioteca de sondas). Después, la etapa A comprende introducir en el sistema informático los datos que identifica la al menos una biblioteca de ácidos nucleicos a partir de la cual se desea seleccionar un miembro para usar en el medio de detección específico.
La interfaz de introducción preferida es una interfaz de web basada en Internet, ya que el procedimiento se almacena convenientemente en un servidor de web para permitir el acceso de los usuarios que han adquirido una biblioteca de sondas de la presente invención. No obstante, el procedimiento también sería útil como parte de una aplicación informática instalable, que podría instalarse en un único ordenador o en una red de área local.
En realizaciones preferidas de este procedimiento, los cebadores identificados en la etapa C se escogen de un modo tal que se minimiza la posibilidad de amplificar ácidos nucleicos genómicos en una reacción de PCR. Por supuesto, esto es solo relevante cuando es probable que la muestra contenga material genómico. Un modo simple de minimizar la probabilidad de amplificación de ácidos nucleicos genómicos es incluir, en al menos uno de los cebadores, una secuencia nucleotídica que en el ADN genómico está interrumpida por un intrón. De este modo, el cebador solo cebará la amplificación de los tránscritos en los que el intrón se ha cortado.
Otra optimización del procedimiento es escoger los cebadores de la etapa C para minimizar la longitud de los amplicones obtenidos de la PCR realizada en la secuencia de ácidos nucleicos diana y también se prefiere seleccionar los cebadores para optimizar el contenido en GC para realizar una PCR posterior.
En cuando al procedimiento de selección de sondas, el procedimiento de selección para medios de detección se puede proporcionar al usuario final como un producto de programa informático entregando instrucciones para implementar el procedimiento, incluidas en un medio legible por ordenador. En consecuencia, la invención también proporciona un sistema que comprende una base de datos de sondas de ácido nucleico de la invención y un programa de aplicación para ejecutar este programa informático.
El procedimiento y los programas y el sistema informáticos permite la detección cuantitativa o cualitativa de la presencia de un ácido nucleico diana en una muestra, que comprende
i) identificar, por medio del procedimiento de selección del medio de detección de la invención, un medio específico para detección del ácido nucleico diana, en el que el medio específico para detección comprende una sonda oligonucleotídica y un conjunto de cebadores,
ii) obtener los cebadores y la sonda oligonucleotídica identificada en la etapa i),
iii) someter la muestra a un procedimiento de amplificación molecular en presencia de los cebadores y la sonda oligonucleotídica de la etapa ii), y
iv) determinar la presencia del ácido nucleico diana basada en el resultado de la etapa iii).
Convenientemente, los cebadores obtenidos en la etapa ii) se obtienen mediante síntesis y se prefiere que la sonda oligonucleotídica se obtiene a partir de una biblioteca de la presente invención.
Normalmente, el procedimiento de amplificación molecular es una PCR o un procedimiento NASBA, pero cualquier procedimiento in vitro para amplificación específica (y, posiblemente, detección) de un ácido nucleico es útil. El
procedimiento de PCR preferido es una PCRq (también conocida como PCR de transcripción inversa en tiempo real
o RT-PCR cinética).
Otros aspectos de la invención se tratan más adelante.
Breve descripción de las figuras
La Fig. 1 ilustra el uso de sondas largas convencionales en el panel (A), así como las propiedades y el uso de multi-sondas cortas (B) de una biblioteca construida de acuerdo con la invención. Las multi-sondas cortas comprenden un segmento de reconocimiento escogido de forma que cada secuencia de sonda se puede usar para detectar y/o cuantificar varias secuencias diana diferentes, que comprenden la secuencia de reconocimiento complementaria. La Fig. 1A muestra un procedimiento de acuerdo con la técnica anterior. La Fig. 1B muestra un procedimiento de acuerdo con un aspecto de la invención.
La Fig. 2 es un diagrama de flujo que muestra un procedimiento para diseñar secuencias de multi-sondas para una biblioteca de acuerdo con un aspecto de la invención. El procedimiento se puede implementar ejecutando las instrucciones proporcionadas por un programa informático integrado en un medio legible por ordenador. En un aspecto, las instrucciones del programa son ejecutadas por un sistema, que comprende una base de datos de secuencias tales como las secuencias expresadas.
La Fig. 3 es un gráfico que ilustra la redundancia de las sondas dirigidas a cada gen en una biblioteca de 100 sondas de acuerdo con un aspecto de la invención. El eje x muestra el número de genes en el transcriptoma humano a los que están dirigidos un número diferente de sondas en la biblioteca. Es evidente que varias sondas están dirigidas una mayoría de todos los genes. El número medio de sondas por gen es 17,4.
La Fig. 4 muestra la cobertura teórica del transcriptoma humano mediante una selección de oligonucleótidos hiperabundantes de una longitud dada. Los gráficos muestran el porcentaje de aproximadamente 38.000 secuencias de ARNm humano que se puede detectar mediante un número creciente de multi-sondas cortas bien escogidas de longitud diferente. El gráfico ilustra la cobertura teórica del transcriptoma humano mediante multi-sondas cortas óptimamente escogidas (es decir, hiperabundantes, no autocomplementarias y térmicamente estables) de longitudes diferentes. La secuencia del transcriptoma del homo sapiens se obtuvo del Instituto Europeo de Bioinformática (EMBL-EBI). Se usó una reguón de 1000 nucleótidos proximales en el extremo 3' de cada secuencia de ARNm para el análisis (de 50 nucleótidos a 1050 nucleótidos cadena arriba desde el extremo 3'). Como la amplificación de cada secuencia es mediante PCR, ambas hebras del dúplex amplificado se consideraron una diana válida para multi-sondas en la biblioteca de sondas. Las secuencias de las sondas que incluso con sustituciones de LNA tienen una Tm inadecuada, además de las secuencias de sondas autocomplementarias, se excluyen.
La Fig. 5 muestra el espectro MALDI-MS de la sonda oligonucleotídica EQ13992, que muestra [M-H] -= 4121,3 Da.
La Fig. 6 muestra curvas de PCR en tiempo real representativas para multi-sondas de 9 unidades que detectan secuencias diana en un ensayo de sonda con marcaje doble. Los resultados proceden de reacciones de PCR en tiempo real con sondas con marcaje doble potenciadas con LNA de 9 nucleótidos de longitud dirigidas a diferentes secuencias de 9 unidades dentro del mismo gen. Cada una de las tres sondas con marcaje doble diferentes se analizó en PCR, generando los amplicones de 469, 570 o 671 SSA4 (cada una de una longitud de entre 81 a 95 nucleótidos). La sonda con marcaje doble 469, 570 y 671 se muestra en el Panel a, b y c, respectivamente. Cada sonda solo detecta el amplicón para cuya detección se diseñó. Los valores de Ct fueron 23.,7, 23,2, y 23,4 para las sondas con marcaje doble 469, 570, y 671, respectivamente. Como molde se añadieron 2 x 107 copias del ADNc de SSA4. La elevada similitud entre los resultados, a pesar de las diferencias en ambas secuencias de sondas y sus pares de cebadores individuales, indican que los ensayos son muy sólidos.
La Fig. 7 muestra ejemplos de curvas de PCR en tiempo real para Balizas Moleculares con un sitio de reconocimiento de 9 y de 10 unidades. Panel (A): Sonda de baliza molecular con un sitio de reconocimiento de 10 unidades que detecta el amplicón 469 SSA4. La señal solo se obtiene en la muestra en la que se añadió ADNc de SSA4 (2 x 107 copias). Se obtuvo un valor de Ct de 24,0. En el panel (B) se muestra un experimento similar con una baliza molecular que tiene un sitio de reconocimiento de 9 unidades que detecta el amplicón 570 SSA4. La señal solo se obtuvo cuando se añadió ADNc de SSA4 (2 x 107 copias).
La Fig. 8 muestra un ejemplo de una curva de PCR en tiempo real para una sonda-SYBR con un un sitio de reconocimiento de 9 unidades dirigido al amplicón 570 SSA4. La señal solo se obtuvo en la muestra en la que se añadió ADNc de SSA4 (2 x 107 copias), mientras que no se detectó señal sin adición de molde.
La Fig. 9 muestra una curva de calibración para tres multi-sondas diferentes de multi-sondas usando un principio del ensayo de sonda con marcaje doble. Detección de niveles diferentes de números de copias del ADNc de SSA4 mediante las tres sondas con marcaje doble. El ciclo del umbral nr define el número de ciclo al que la señal se detectó por primera vez para la correspondiente PCR. La pendiente (α) y los coeficientes
de correlación (R2) de las tres líneas de regresión lineal son: α = -3,456 y R2 = 0,9999 (con marcaje doble469), α = -3,468 y R2 = 0,9981 (con marcaje doble-570), y α = -3,499 y R2 = 0,9993 (con marcaje doble-671).
La Fig. 10 muestra el uso de multi-sondas de 9 unidades con marcaje doble para cuantificar una proteína del shock térmico antes y después de la exposición al shock térmico en una cepa de levadura silvestre así como una cepa mutante, en la que se ha delecionado el correspondiente gen. Se muestra la detección en tiempo real de los niveles del tránscrito de SSA4 en levadura silvestre (wt) y en el mutante defectivo de SSA4 con la sonda 570 con marcaje doble. Las diferentes cepas se cultivaron a 30 ºC hasta la recolección (-HS) o se expusieron a 40 ºC durante 30 minutos antes de la recolección. En este ejemplo se usó la sonda 570 con marcaje doble. El tránscrito sólo se detectó en la cepa silvestre, en la que fue más abundante en el cultivo + HS . Los valores de Ct fueron 26,1 y 30,3 para el cultivo + HS y el cultivo -HS culture, respectivamente.
La Fig. 11 muestra un ejemplo de cómo se puede detectar más de un gen con la misma sonda de 9 unidades, mientras que no se detectarán las moléculas de ácido nucleico sin la secuencia diana de la sonda (es decir, complementaria a la secuencia de reconocimiento. En (a) 469 con marcaje doble detecta el trásncrito SSA4 (amplicón 469) y el tránscrito POL5 con valores Ct de 29,7 y 30,1, respectivamente. No se detectó señal alguna de los tránscritos de APG9 y HSP82. En (b) 570 con marcaje doble detecta el trásncrito SSA4 (amplicón 570) y el tránscrito APG9 con valores Ct de 31,3 y 29,2, respectivamente. No se detectó señal alguna de los tránscritos de POL5 y HSP82 . En (c) 671 con marcaje doble detecta el trásncrito SSA4 (amplicón 671) y el tránscrito HSP82 con valores Ct de 29,8 y 25,6, respectivamente. No se detectó señal alguna de los tránscritos de POL5 y APG9 . El amplicón producido en las PCR diferentes está indicado en la leyenda. Se usó la misma cantidad de ADNc que en los experimentos representados en la Figura 10. Solo se usó ADNc de levaduras silvestres no sometidos a shock térmico.
La Fig. 12 muestra electroforesis en gel de agarosa de una fracción de los amplicones generados en las reacciones de PCR mostradas en el ejemplo de la Fig. 11, que demuestra que las sondas son específicas de las secuencias diana que comprenden la secuencia de reconocimiento, pero que no hibridan con las moléculas del ácido nucleico que no comprenden la secuencia diana. La calle 1 contiene el amplicón SSA4469 (81 pb), la calle 2 contiene el amplicón POL5 (94 pb), la calle 3 contiene el amplicón APG9 (97 pb) y la calle 4 contiene el amplicón HSP82 (88 pb). La calle M contiene una escalera de 50 pb como indicador de tamaño. Está claro que en los cuatro casos se formó un producto; no obstante, solo los amplificados que contienen la correcta secuencia diana de multi-sonda (es decir, SSA4-467 y POLS) se detectaron mediante la sonda 467 con marcaje doble. A partir de la diferencia del tamaño en los fragmentos detectados de la calle 1 y 2 es evidente que se producían y detectaban dos amplificados diferentes.
Fig. 13: Secuencias diana preferidas.
Fig. 14: Secuencias diana preferidas adicionales.
Fig. 15: Oligómeros largos (controles positivos). Las secuencias se exponen en las SEC ID Nº 32-46.
Fig. 16: Procedimiento para la selección de las sondas y el diseño de los cebadores para PCRq.
Fig. 17: Código fuente para el programa usado en el cálculo de un conjunto de datos para multi-sondas.
Descripción detallada
La presente invención se refiere a sondas oligonucleotídicas o multi-sondas cortas, escogidas y diseñadas para detectar, clasificar o caracterizar y/o cuantificar muchas moléculas de ácido nucleido diana diferentes. Estas multisondas comprenden al menos una modificación no natural (p. ej., tal como un nucleótido LNA) para aumentar la afinidad de unión de las sondas para una secuencia de reconocimiento, que es una subsecuencia de las moléculas de ácido nucleico diana. Las moléculas de ácido nucleico diana son, de otro modo, diferentes fuera de la secuencia de reconocimiento.
En un aspecto, las multi-sondas comprenden al menos un nucleótido modificado con un resto químico para aumentar la afinidad de unión de las sondas para una secuencia de reconocimiento, que es una subsecuencia de la secuencia de ácido nucleico diana. En otro aspecto, las sondas comprenden al menos un nucleótido no natural y al menos un nucleótido modificado con un resto químico. En un aspecto adicional, el al menos un nucleótido no natural está modificado con un resto químico. La invención también proporciona kits, bibliotecas y otras composiciones que comprenden las sondas.
La invención proporciona además procedimientos para escoger y diseñar sondas oligonucleotídicas adecuadas para una mezcla diana de secuencias diana, ii) sondas individuales con estas capacidades y iii) bibliotecas de dichas sondas escogidas y diseñadas para poder detectar, clasificar y/o cuantificar el mayor número de nucleótidos Diana con el menor número de secuencias sonda. Cada sonda de acuerdo con la invención es capaz de unirse a muchas dianas diferentes, pero se puede usar para crear un ensayo específico cuando se combina con un conjunto de cebadores específicos en ensayos de PCR.
Los oligonucleótidos preferidos de la invención están compuestos por aproximadamente 8 a 9 unidades de
nucleótidos, una porción sustancial de la cual comprende estabilizar nucleótidos, tales como nucleótidos LNA. Una biblioteca preferida contiene aproximadamente 100 de estas sondas escogidas y diseñadas para caracterizar un conjunto específico de ácidos nucleicos, tales como ARNm, ADNc o ADN genómico. Dicha biblioteca se puede usar en una amplia variedad de aplicaciones, por ejemplo análisis de expresión génica, detección de SNP y similares. (Véase, por ejemplo, la Fig. 1).
Definiciones
Las definiciones siguientes se proporcionan para términos específicos que se usan en la divulgación de la presente invención.
Como se usa en el presente documento, la forma del singular “un” “uno/una” y “el/la” incluyen referencias al plural a menos que el contexto indique claramente lo contrario. Por ejemplo, el término “una célula” incluye una pluralidad de células, incluidas mezclas de las mismas. La expresión “una molécula de ácido nucleico” incluye una pluralidad de moléculas de ácido nucleico.
Como se usa en la presente memoria descriptiva, el término “transcriptoma” se refiere a la colección completa de elementos transcritos del genoma de cualquier especie.
Además de ARNm, también representa ARN no codificantes que se usan con fines estructurales y reguladores.
Como se usa en el presente documento, el término “Amplicón” se refiere a fragmentos pequeños de ADN en replicación.
Como se usa en el presente documento, una “muestra” se refiere a una muestra de tejido o de fluido aislada de un organismo u organismos que incluye, entre otros, por ejemplo, piel, plasma, suero, líquido cefalorraquídeo, líquido linfático, fluido sinovial, orina, lágrimas, células sanguíneas, órganos, tumores, así como muestras de constituyentes de cultivos celulares in vitro, incluidos, entre otros, medios acondicionados resultantes del crecimiento de células en el medio de cultivo celular, células recombinantes y componentes celulares.
Como se usa en el presente documento, un “organismo” se refiere a una entidad viva, incluidas, entre otras, por ejemplo, ser humano, ratón, rata, Drosophila, C. elegans, levadura, Arabidopsis, pez cebra, primates, animales domésticos etc.
Con la expresión “nucleobases de SBC” se quiere decir nucleobases “Complementarias de Unión Selectiva”, es decir nucleobases modificadas que pueden formar enlaces de hidrógeno estables con sus nucleobases complementarias, pero son incapaces de formar enlaces de hidrógeno estables con otras nucleobases SBC. Como ejemplo, la nucleobase SBC A’ puede formar un par de enlaces de hidrógeno estables con su nucleobase complementaria sin modificar, T. Asimismo, la nucleobase SBC T’ puede formar un par de enlaces de hidrógeno estables con su nucleobase A complementaria sin modificar. No obstante, las nucleobases SBC A’ y T’ formarán un par de enlaces de hidrógeno inestables en comparación con los pares de bases A’-T y A-T’. Asimismo, una nucleobase SBC de C se designa C’ y puede formar un par de enlaces de hidrógeno estables con su nucleobase complementaria sin modificar, G y una nucleobase SBC de G se designa G’ y puede formar un par de enlaces de hidrógeno estables con su nucleobase C complementaria sin modificar, aunque C’ y G’ formarán un par de enlaces de hidrógeno inestables en comparación con los pares de bases C’-G y C-G’. Un par de enlaces de hidrógeno estables se obtiene cuando se forman 2 o más enlaces de hidrógeno, por ejemplo el par entre A’ y T, A y T’, C y G’, y C’ y G. Un par de enlaces de hidrógeno inestables se obtiene cuando se forma 1 o ningún enlace de hidrógeno, por ejemplo el par entre A’ y T’, y C’ y G’.
Nucleobases SBC especialmente interesantes son 2,6-diaminopurina (A’, también denominada D) junto con 2-tiouracilo (U’, también denominado 2SU)(2-tio-4-oxo-pirimidina) y 2-tio-timina (T’, también denominada 2ST)(2-tio-4-oxo5-metil-pirimidina). La Fig. 4 ilustra que los pares A-2ST y D-T tienen 2 o más de 2 enlaces de hidrógeno, mientras que el par D-2ST forma un único enlace de hidrógeno (inestable). Asimismo, las nucleobases SBC pirrolo-[2,3d]pirimidin-2(3H)-ona (C’, también denominada PirroloPir) e hipoxantina (G’, también denominada I)(6-oxo-purina) se muestran en la Fig. 9, en la que los pares PirroloPir-G y CI tienen 2 enlaces de hidrógeno cada uno, mientras que el par PirroloPir-I forma un único enlace de hidrógeno.
Con "oligómero SBC LNA" se quiere decir un "oligómero de LNA" que contiene al menos una “unidad de LNA" en la que la nucleobase es una "nucleobase SBC". Por “unidad de LNA" con una nucleobase SBC se quiere decir un “monómero de LNS SBC”. En términos generales los oligómeros de LNA SBC incluyen oligómeros que además del (los) monómero(s) de LNA SBC contienen otros nucleótidos o nucleósidos naturales o modificados. Por “monómero de SBC" se quiere decir un monómero que no es LNS con una nucleobase SBC. Por “oligonucleótido isosecuencial” se quiere decir un oligonucleótido con la misma secuencia en el sentido de Watson-Crick que el correspondiente oligonucleótido modificado, por ejemplo las secuencias agTtcATg es igual a agTscD2SUg, en la que s es igual al monómero de ADN de SBC 2-tio-t o 2-tio-u, D es igual al monómero LNA de SBC LNA-D y 2SU es igual al monómero LNS de SBC LNA 2SU.
Como se usa en el presente documento, los términos´”ácido nucleico”, “polinucleótido” y “oligonucleótido” se refieren a cebadores, sondas, fragmentos oligoméricos que se van a detectar, controles oligoméricos y oligómeros de
bloqueo sin marcar y serán genéricos de los polidesoxiribonucleótidos (que contienen 2-desoxi-D-rinosa), de poliribonucleótidos (que contienen D-ribosa) y de cualquier otro tipo de polinucleótido que es un N-glicósido de una base purina o pirimidina, o bases purina o pirimidina modificadas. No existe ninguna distinción pretendida en la longitud entre los términos “ácido nucleico”, “poli9nucleótido” y “oligonucleótido”, y estos términos se usarán de forma intercambiable. Estos términos hacen referencia únicamente a la estructura primaria de la molécula. Por tanto, estos términos incluyen ADN bicatenario y monocatenario, así como ARN bicatenario y monocatenario. El oligonucleótido está compuesto por una secuencia de aproximadamente al menos 3 nucleótidos, preferentemente al menos aproximadamente 6 nucleótidos y más preferentemente al menos aproximadamente 8-30 nucleótidos correspondientes a una región de la secuencia nucleotídica designada. “Correspondiente” significa idéntico a o complementario a la secuencia designada.
El oligonucleótido no necesariamente deriva físicamente de ninguna secuencia existente o natural pero se puede generar de cualquier modo, incluyendo síntesis química, replicación de ADN, transcripción inversa o una combinación de los mismos. Con los términos “oligonucleótido” o “ácido nucleico” se pretende decir un polinucleótido de ADN o ARN o ADNc genómico de origen semisintético o sintético que, en virtud de su origen o manipulación: (1) no está asociado con todo o parte del polinucleótido con el que está asociado por naturaleza; y/o
(2) está unido a un polinucleótido aparte del que al que está unido por naturaleza; y (3) no se encuentra en la naturaleza.
Ya que los mononucleótidos se hacen reaccionar para preparar oligonucleótidos de un modo tal que el fosfato 5’ de un anillo de pentosa de mononucleótido se une al oxígeno 3’ de su vecino en una dirección mediante un enlace fosfodiéster, un extremo de un oligonucleótido se denomina el “extremo 5’” si su fosfato 5’ no se enlaza al oxígeno 3’ de un anillo pentosa de mononucleótido y el “extremo 3’” si su oxígeno 3’ no se enlaza a un fosfato 5’ de un anillo de pentosa de mononucleótido posterior. Como se usa en el presente documento, se puede decir que una secuencia de ácido nucleico, incluso si es interna a un oligonucleótido mayor, también tiene extremos 5’ y 3’.
Cuando dos oligonucleótidos diferentes, no solapantes hibridan con regiones diferentes de la misma secuencia de ácido nucleico complementaria lineal y el extremo 3’ de un oligonucleótido se dirige hacia el extremo 5’ del otro, el primero se puede denominar el oligonucleótido “cadena arriba” y el último, el oligonucleótido “cadena abajo”.
El término “cebador” puede hacer referencia a más de un cebador y se refiere a un oligonucleótido, natural como en un digesto de restricción purificado o producido sintéticamente, que es capaz de actuar como punto de inicio de la síntesis junto con una hebra complementaria cuando se introduce en las condiciones en las que la síntesis de un producto de extensión del cebador, que es complementario a una hebra de ácido nucleico, se cataliza. Dichas condiciones incluyen la presencia de cuatro desoxirribonucleótidos trifosfato diferentes y un agente inductor de la polimerización, tal como ADN polimerasa o transcriptasa inversa, en un tampón adecuado (“tampón” incluye sustituyentes que son cofactores, o que afectan al pH, la fuerza iónica etc.), y a una temperatura adecuada. Preferentemente, el dejador es monocatenario para una máxima eficiencia en la amplificación.
Como se usa en el presente documento, las expresiones “reacción de PCR”, “amplificación por PCR”, “PCR” y “PCR en tiempo real” son expresiones intercambiables usados para significar el uso de un sistema de amplificación de ácido nucleico, que multiplica los ácidos nucleicos diana que se quieren detectar. Ejemplos de dichos sistemas incluyen el sistema de la reacción en cadena de la polimerasa (PCR) y el sistema de la reacción en cadena de la ligasa (LCR). Otros procedimientos descritos recientemente y conocidos por el experto en la técnica son la amplificación basada en la secuencia de ácido nucleico (NASBA™, Cangene, Mississauga, Ontario) y los sistemas de Q Beta replicasa. Los productos formados mediante dicha reacción de amplificación pueden o no monitorizarse en tiempo real o solo después de la reacción como medición de punto final.
El complemento de una secuencia de ácido nucleico como se usa en el presente documento se refiere a un oligonucleótido que, cuando se alinea con la secuencia de ácido nucleico de modo que el extremo 5’ de una secuencia esté emparejado con el extremo 3’ de la otra, está en “asociación antiparalela". Lass bases que no se encuentran habitualmente en los ácidos nucleicos naturales se pueden incluir en los ácidos nucleicos de la presente invención incluyen, por ejemplo, inopina y 7-deazaguanina. La complementariedad puede no ser perfecta, dúplex estables pueden contener pares de bases apareadas incorrectamente o bases sin aparear. Los expertos en la técnica de la tecnología de los ácidos nucleicos pueden determinar la estabilidad del dúplex empíricamente considerando una serie de variables incluidas, por ejemplo, la longitud del oligonucleótido, la composición en bases y la secuencia del oligonucleótido, la concentración en porcentaje de las bases de citosina y guanina en el oligonucleótido, la fuerza iónica y la incidencia de pares de bases apareadas incorrectamente.
La estabilidad de un dúplex de ácido nucleico se mide mediante la temperatura de fusión, o "Tm". La Tm de un dúplex de ácido nucleico concreto en condiciones específicas es la temperatura a la cual se ha desasociado la mitad de los pares de bases.
Como se usa en el presente documento, el término “sonda” se refiere a un oligonucleótido marcado que forma una estructura dúplex con una secuencia en el ácido nucleico diana, debido a la complementariedad de al menos una secuencia en la sonda con una secuencia en la región diana. Preferentemente, la sonda no contiene una complementariedad de secuencia con la(s) secuencia(s) usadas para cebar la reacción en cadena de la polimerasa. En general, el extremo 3’ de la sonda se “bloqueará” para prohibir la incorporación de la sonda en un producto de
extensión con cebador. El “bloqueo“ se puede conseguir usando bases no complementarias o añadiendo un resto químico, tal como biotina o incluso un grupo fosfato en el extremo hidroxilo en 3’ del último nucleótido, que puede, en función del resto seleccionado, servir para un fin doble al actuar también como marcador.
El término “marcador” como se usa en el presente documento se refiere a cualquier átomo o molécula que se puede usar para proporcionar una señal detectable (preferiblemente cuantificable) y que se puede unir a un ácido nucleico o a una proteína. Los marcadores pueden proporcionar señales detectables por fluorescencia, radiactividad, colorimetría, difracción de rayos X o absorción, magnetismo, actividad enzimática y
similares.
Como se define en el presente documento, “actividad nucleasa 5’→3’” o “actividad nucleasa de 5’a 3’ “ se refiere a la actividad de un ácido nucleico polimerasa específica de molde, incluyendo una actividad exonucleasa 5’→3’ asociada tradicionalmente con algunas ADN polimerasas, de modo que se eliminan los nucleótidos del extemo 5’ de un oligonucleótido de forma secuencial (es decir, la ADN polimerasa I de E. coli tiene esta actividad, mientras que el fragmento Klenow no) o una actividad endonucleasa 5’→3’ en la que la escisión se produce en más de un nucleótido desde el extremo 5', o ambos.
Como se usa en el presente documento, la expresión "ácido nucleico polimerasa termoestable" se refiere a una enzima que es relativamente estable al calor cuando se compara con, por ejemplo, nucleótido polimerasas de E. coli y que cataliza la polimerización de nucleósidos. En general, la enzima iniciará la síntesis en el extremo 3’ del cebador hibridado con la secuencia diana y procederá en la dirección 5’ a lo largo del molde y, su posee una actividad nucleasa 5’ to 3’, hidrolizar o desplazar la sonda intercalada hibridada para liberar fragmentos de sonda marcados o no marcados o la sonda intacta, hasta que la síntesis termina. Una enzima termoestable representativa aislada de Thermus aquaticus (Tag) se describe en la patente de EE.UU. nº 4.889.818 y un procedimiento para usarla en PCR convencional se describe en Saiki y col., (1988), Science 239:487.
El término “nucleobase” cubre las nucleobases naturales adenina (A), guanina (G), citosina (C), timina (T) y uracilo (U), así como nucleobases no naturales, tales como xantina, diaminopurina, 8-oxoN6-metiladenina, 7-deazaxantina, 7-deazaguanina, N4,N4-etanocitosina, N6,N6-etano-2,6-diaminopurina, 5-metilcitosina, 5-(C3-C6)-alquinilcitosina, 5fluorouracilo, 5-bromouracilo, pseudoisocitosina, 2-hidroxi-5-metil-4-triazolopiridina, isocitosina, isoguaninA, inosina y las nucleobases "no naturales" descritas en Benner y col., la patente de EE.UU. nº 5,432,272 y Susan M. Freier y Karl-Heinz Altmann, Nucleic Acid Research,25 4429-4443, 1997. El término “nucleobase” incluye no solo los heterociclos de purina y pirimidina conocidos, sino también los análogos heterocíclicos y los tautómeros de los mismos. Además, las nucleobases naturales y no naturales incluyen las divulgadas en la patente de EE.UU. ºn 3,687,808; en el capítulor 15 de Sanghvi, en Antisense Research and Application, Ed. S. T. Crooke y B. Lebleu, CRC Press, 1993; en Englisch, y col., Angewandte Chemie, International Edition, 30: 613-722, 1991 (véase, especialmente las páginas 622 y 623, y en la Concise Encyclopedia of Polymer Science and Engineering, J. I. Kroschwitz Ed., John Wiley & Sons, pages 858-859, 1990, Cook, Anti-Cancer DrugDesign 6: 585-607, 1991).
Con la expresión “base nucleosídica” o “análogo de nucleobase” se pretende incluir compuestos heterocíclicos que sirven como bases nucleosídicas, incluidas ciertas “bases universales” que no son bases nucleosídicas en el sentido más clásico, pero sirven como bases nucleosídicas. Especialmente mencionada como base universal es 3-niitropirrol como 5-nitroindol. Otros compuestos preferidos incluyen pireno y derivados de piridiloxaol, pirenilo, derivados de pirenilmetilglicerol y similares. Otras bases universales preferidas incluyen derivados de pirrol, diazol o triazol, incluidas las bases universales conocidas en la técnica.
Con “base universal” se quiere decir un compuesto o resto natural o, deseablemente, no natural que se puede aparear con una base natural (p.ej., adenina, guanina, citosina, uracilo y/o timina) y que tiene una Tm diferencial de 15, 12, 10, 8, 6, 4, o 2˚ C o menor, tal como se describe en el presente documento.
Con “oligonucleótido”, “oligómero” u “oligo” se quiere decir una cadena sucesiva de monómeros (p. ej., glicósidos de bases heterocíclicas) conectados mediante enlaces internucleosídicos. El enlace entre dos monómeros sucesivos en el oligo consisten de 2 a 4, deseablemente 3, grupos/átomos seleccionados de -CH2-, -O -, -S-, -NRH -, >C=O, >C=NRH , >C=S, -Si(R")2-, -SO-, -S(O)2-, -P(O)2-, -PO(BH3)-, -P(O,S)-, -P(S)2-, -PO(R")-, -PO(OCH3)-, y -PO(NHRH)-, en los que RH se selecciona de hidrógeno, alquilo C1-4 y R’’ se selecciona de alquilo C1-6 y fenilo. Ejemplos ilustrativos de dichos enlaces son -CH2-CH2-CH2-, -CH2-CO-CH2-, -CH2-CHOH-CH2-, -O-CH2-O-, -O-CH2-CH2-, -OCH2-CH= (incluido R5 cuando se usa como enlace a un monómero que le sucede), -CH2-CH2-O-, -NRH-CH2-CH2-, -CH2-CH2-NRH-, -CH2-NRH-CH2-, -OCH2-CH2-NRH-, -NRH-CO-O-, -NRH-CO-NRH-, -NRH-CS-NRH-, -NRH-C(=NRH)-NRH-, -NRH-CO-CH2-NRH-, -O-COO-, -O-CO-CH2-O-, -O-CH2-CO-O-, -CH2-CO-NRH-, -O-CO-NRH-, -NRH-CO-CH2-, -O-CH2-CO-NRH-, -O-CH2-CH2-NRH-, -CH=N-O-, -CH2-NRH-O-, -CH2-O-N= (incluido R5 cuando se usa como enlace a un monómero que le sucede), -CH2-O-NRH-, -CO-NRH-CH2-, -CH2-NRH-O-, -CH2-NRH-CO-, -O-NRH-CH2-, -O-NRH-, -O-CH2-S-, -S-CH2-O-, -CH2-CH2-S-, -OCH2-CH2-S-, -S-CH2-CH= (incluido R5 cuando se usa como enlace a un monómero que le sucede), -S-CH2-CH2-, -SCH2-CH2-O-, -S-CH2-CH2-S-, -CH2-S-CH2-, -CH2-SO-CH2-, -CH2-SO2-CH2-, -O-SO-O-, -O-S(O)2-O-, -O-S(O)2-CH2-, -O-S(O)2-NRH-, -NRH-S(O)2-CH2-, -O-S(O)2-CH2-, -O-P(O)2-O-, -O-P(O,S)-O-, -OP(S)2-O-, -S-P(O)2-O-, -S-P(O,S)-O-, -S-P(S)2-O-, -O-P(O)2-S-, -O-P(O,S)-S-, -O-P(S)2-S-, -S-P(O)2-S-, -S-P(O,S)-S-, -S-P(S)2-S-, -O-PO(R")-O-, -O-PO (OCH3)-O-, -O-PO(OCH2CH3)-O-, -O-PO(OCH2CH2S-R)-O-, -OPO(BH3)-O-, -O-PO(NHRN)-O-, -O-P(O)2-NRH-, -NRH-P(O)2-O-,-O-P(O,NRH)-O-, -CH2-P(O)2-O-, -O-P(O)2-CH2-, y -O
Si(R")2-O-; entre los cuales -CH2-CO-NRH-, -CH2-NRH-O-, -S-CH2-O-, -O-P(O)2-O-, -O-P(O,S)-O-, -O-P(S)2-O-, NRH-P(O)2-O-, -OP(O,NRH)-O-, -O-PO(R")-O-, -O-PO(CH3)-O-, y -O-PO(NHRN)-O-, en los que RH se selecciona de hidrógeno, alquilo C14 y R" se selecciona de alquilo C1-6 y fenilo son especialmente deseables. Otros ejemplos ilustrativos se proporcionan en Mesmaeker y col., Current Opinion in Structural Biology 1995, 5, 343-355 y Susan M. Freier y Karl-Heinz Altmann, Nucleic Acids Research, 1997, vol 25, pp 4429-4443. La parte de la izquierda del enlace internucleosídico está unuda al anillo de 5 miembros como sustituyente P* en la posición 3’, mientras que la parte derecha está unida en la posición 5’ de un monómero precedente.
Con “unidad de LNA” se quiere decir un monómero de LNA individual (p. ej., un nucleósido de LNA o nucleótido de LNA) o un oligómero (p. ej., un oligonucleotido o ácido nucleico) que incluye al menos un monómero de LNA. Las unidades de LNA como se divulgan en el documento WO 99/14226 son, en general, ácidos nucleicos modificados particularmente deseables para incorporar en un oligonucleótido de la invención. Adicionalmente, los ácidos nucleicos pueden estar modificados en el extremo 3’ y/o 5’ por cualquier tipo de modificación conocida en la técnica. Por ejemplo, uno o ambos extremos pueden estar tapados con un grupo protector unido a un grupo d eunión flexible, unido a un grupo reactivo para ayudar en la unión a la supeficie del sustrato etc. Las unidades de LNA deseables y su procedimiento de síntesis también se divulgan en los documentos WO 00/47599, US 6,043,060, US 6,268,490, PCT/JP98/00945, WO 0107455, WO 0100641, WO 9839352, WO 0056746, WO 0056748, WO 0066604, Morita y col., Bioorg. Med. Chem. Lett. 12(1):73-76, 2002; Hakansson et al., Bioorg. Med. Chem. Lett. 11(7):935-938, 2001; Koshkin et al., J. Org. Chem. 66(25):8504-8512, 2001; Kvaerno et al., J. Org. Chem. 66(16):5498-5503, 2001; Hakansson et al., J. Org. Chem. 65(17):5161-5166, 2000; Kvaerno et al., J. Org. Chem. 65(17):5167-5176, 2000; Pfundheller et al., Nucleosides Nucleotides 18(9):2017-2030, 1999; y Kumar et al., Bioorg. Med. Chem. Lett. 8(16):2219-2222, 1998.
Los monómeros de LNA preferidos, también denominados “oxi-LNA” son monómeros de LNA que incluyen compuestos bicíclicos como se divulga en la publicación de PCT WO 03/020739, en los que el puente entre R4’ and R2’ como se muestra en la fórmula (I) más adelante designan -CH2-O-(metiloxi LNA) o -CH2-CH2-O-(etiloxi LNA, también denominado ENA).
Otros monómeros de LNA preferidos se denominan “tio-LNA” o “amino-LNA”, incluidas estructuras bicíclicas como se divulga en el documento WO 99/14226, en el que el heteroátomo en el puente entre R4’ yd R2’ como se muestra en la fórmula (I) más adelante designan -CH2-S-, -CH2-CH2-S-, -CH2-NH-or -CH2-CH2-NH-.
Con “oligonucleótido modifica con LNA” se quiere decir un oligonucleótido que comprende al menos una unidad monomérica de LNA de fórmula (I) descrita más adelante, que tiene los ejemplos ilustrativos descritos más delante de las modificaciones:
en las que X se selecciona de -O-, -S-, -N(RN)-, -C(R6R6*)-, -O-C(R7R7*)-, -C(R6R6**)-O-, -S-C(R7R7*)-, -C(R6R6*)-S-, -N(RN*)-C(R7R7*)-, -C(R6R6*)-N(RN*)-, y-C(R6R6*)-C(R7R7*).
B se selecciona de una base modificada como se ha tratado anteriormente, por ejemplo un arilo opcionalmente sustituido, tal como pirano opcionalmente sustituido o pirenilmetilglicerol opcionlamente sustituido o un heteroalicíclico opcionalmente sustituido o un heteroaromático opcionlamente sustituido, tal como piridiloxazol opcionalmente sustituido, pirrol opcionalmente sustituido, diazol opcionalmente sustituido o triazol opcionalmente sustituido; hidrógeno, hidroxi, alcoxi C1-4 opcionalmente sustituido, alquilo C1-4 opcionalmente sustituido, alcoxi C1-4 opcionalmente sustituido, nucleobases, intercalantes de ADN, grupos fotoquímicamente activos, grupos termoquímicamente activos, grupos quelantes, grupos inidicadreos y ligandos.
P designa la posición del radical para un enlace internucleosídico a un monómero sucesivo, o un grupo terminal en 5’, tal como un enlace internucleosídico o un grupo terminal en 5’ que opcionalmente incuye el sustituyente R5. Uno de los sustituyentes R7, R2*, R3 y R3* es un grupo P* que designa un enlace internucleosídico a un monómero precedente o un grupo terminal 2’/3’. Los sustituyentes de R1*, R4*, R5 , R5 *, R6, R6*, R7, R7*, RN, y los de R2, R2*, R3, y R3* que no designan P*, designa cada uno un biradical que comprende aproximadamente 1-8 grupos/átomos seleccionados de -C(RaRb)-,-C(Ra)C=(Ra)-, -C(Ra)=N-, -C(Ra)-O-, -O-, -Si(Ra)2-, -C(Ra)-S, -S-, -SO2-, -C(Ra)-N(Rb)-,-N(Ra)-, and >C=Q, en las que Q se selecciona de -O-, -S-, y -N(Ra)-, y Ra y Rb, cada uno de forma independiente, se selecciona de hidrógeno, alquilo C1-12 opcionalmente sustituido, alquenilo C2-12 opcionalmente sustituido, alquinilo C2-12 opcionalmente sustituido,
hidroxi, alcoxi C1-12, alqueniloxi C2-12, carboxi, alcoxicarbonilo C1-12, alquilcarbonilo C1-12, formilo, arilo ariloxicarbonilo, ariloxi, arilcarbonilo, heteroarilo, hetero-ariloxi-carbonilo, heteroariloxi, heteroarilcarbonilo, amino, mono y di alquil C1-6-mino, carbamoílo, mono y di(alquil C1-6)-amino-carbonilo, amino-alquilo C1-6aminocarbonilo, mono y di(alquil C1-6)amino-alquil C1-6-aminocarbonilo, alquil C1-6-carbonilamino, carbamido, alcaloiloxi C1-6, sulfono, alquilo C1-6-sulfoniloxi, nitro, azido, sulfanilo, alquilC1-6-tio, halógeno, intercalantes de ADN, grupos fotoquímciamente activos, grupos quelantes, grupos indicadores y ligandos, en los que arilo y heteroarilo pueden estar sustituidos opcionalmente y en los que dos sustituyentes geminales Ra y Rb juntos pueden designa metileno (=CH2) opcionalmente sustituido y en los que dos sustituyentes geminales o no geminales seleccionados de , Ra, Rb, y cualquiera de los sustituyentes R1*, R2, R2*, R3, R3*, R4* , R5 , R5 *, R6 y R6*, R7, y R7* que están presentes y no implicados en P, P* o el (los) biradical(es) juntos pueden formar un biradical asociado seleccionado de biradicales del mismo tipo que se ha definido anteriormente; el(los) par(es) de los sustituyentes no geminales forman una entidad mono o bi cíclica junto con (i) los átomos a los que dichos sustituyentes no geminales están unidos y (ii) cualquier átomo intermedio.
Cada uno de los sustituyentes de R1*, R4*, R5 , R5 *, R6, R6*, R7 y R7*que están prsentes y no implicados en P, P* o el(los) biradicales se selecciona de hidrógeno, alquilo C1-12 opcionalmente sustituido, alquenilo C2-12 opcionalmente sustituido, alquinilo C2-12 opcionalmente sustituido, hidroxi, alcoxi C1-12, alqueniloxi C2-12, carboxi, alcoxicarbonilo C1-12, alquilcarbonilo C1-12, formilo, arilo ariloxi-carbonilo, ariloxi, arilcarbonilo, heteroarilo, hetero-ariloxi-carbonilo, heteroariloxi, heteroarilcarbonilo, amino, mono y di alquil C1-6-mino, carbamoílo, mono y di(alquil C1-6)-amino-carbonilo, amino-alquilo C1-6-aminocarbonilo, mono y di(alquil C16)amino-alquil C1-6-aminocarbonilo, alquil C1-6-carbonilamino, carbamido, alcaloiloxi C1-6, sulfono, alquilo C1-6sulfoniloxi, nitro, azido, sulfanilo, alquilC1-6-tio, halógeno, intercalantes de ADN, grupos fotoquímicamente activos, grupos quelantes, grupos indicadores y ligandos, en los que arilo y heteroarilo pueden estar sustituidos opcionalmente y en los que dos sustituyentes geminales Ra y Rb juntos pueden designar oxo, tioxo, imino o metileno opcionalmente sustituido o juntos pueden formar un biradical espiro que consiste en una cadena de alquileno de 1-5 átomos de carbono que está interrumpida opcionalmente y/o terminada por uno o más heteroátomos/grupos seleccionados de -O-, -S-, y -(NRN), en los que RN se selecciona de hidrógeno, alqulo C1-4, y en el que dos sustituyentes adyacentes (no geminales) pueden designar un enlace adicional resultante en un enlace doble; y RN*, cuando está presente y no implicado en un biradical, se selecciona de hidrógeno y alquilo C1-4, y sales básicas y sales de adición de ácido de los mismos.
Ejemplos de grupos terminales 5’, 3’ y/o 2’ inlcuyen -H, -OH, halo (p. ej., cloro, flúor, yodo o bromo), arilo opcionalmente sustituido (p. ej., fenilo o bencilo), alquilo (p. ej., metilo o etilo), alcoxi (p. ej., metoxi), acilo (p. ej., acetilo o benzoíli), aroílo, aralquilo, hidroxi, hidroxialquilo, alcoxi (p. ej., metoxi), acilo (p. ej., acetilo o benzoílo), aroílo, aralquilo, hidroxi, hidroxialquilo, alcoxi, ariloxi, aralcoxi, nitro, ciano, carboxi, alkoxicarbonilo, ariloxicarbonilo, aralcoxicarbonilo, acilamino, aroilamino, alquilosulfonilo, arilsulfonilo, heteroarilsulfonilo, alquilsulfinilo, arilsulfinilo, heteroarIlsulfinilo, alquiltio, ariltio, heteroariltio, aralquiltio, heteroaralquiltio, amidino, amino, carbamoílo, sulfamoílo, alqueno, aquino, grupos protectores (p.ej., sililo, 4,4’-dimetoxitritilo, monometoxitritilo, o tritil(trifenilmetilo)), ligadoress
(p. ej.,, un ligador que contiene una amina, etilenglicol, quinona tal como antraquinona), marcadores detectables (p. ej., radiomarcadores o marcadores fluorescentes) y biotina.
Se entiende que las referencias en el presente documento a una unidad de ácido nucleico, residuo de ácido nucleico, unidad de LNA o término similar incluyen unidades nucleosídicas individuales y unidades nucleosídicas y unidades nucleotídicas dentro de un nucleótido.
Una "base modificada" u otro término similar se refiere a una composición (p. ej., una base nucleosídica o nucleobase no natural), que se puede aparear con una base natural (p. ej., adenine, guanine, citosina, uracilo y/o timina) y/o se puede aparear con una base nucleosídica o nucleobase no natural. Deseablemente, la base modificada proporciona una Tm diferencial de 15, 12, 10, 8, 6, 4, o 2˚ C o menor, como se describe en el presente documento. Ejemplos de bases modificadas se describen en el documento EP 1072 679 y el documento WO 97/12896.
El término “resto químico” se refiere a una parte de una molécula. Por tanto, “modificado por un resto químico” se refiere a una modificación de la estructura molecular estándar mediante inclusión de una estructura química inusual. La unión de dicha estructura puede ser covalente o no covalente.
La expresión “inclusión de un resto químico” en una sonda oligonucleotídicas se refiere, por tanto, a la unión de una estructura molecular. Dicho resto químico incluye, entre otros, ligandos de unión al surco menor unidos (MGB) de forma covalente o no covalente y/o ácidos nucleicos intercalantes (LNA) seleccionados de un grupo que consiste en pigmentos de cianina asimétricos, DAPI, SYBR Verde I, SYBR Verde II, SYBR Oro, PicoGreen, naranja tiazol, Hoechst 33342, bromuro de etidio, 1-O-(1-pirenilmetil)glicerol y Hoechst 33258. Otros restos químicos incluyen las nucleobases, bases nucleosídicas modificadas u oligonucleótidos modificados con LNA.
La expresión “sonda con marcaje doble” se refiere a un oligonucleótido con dos marcadores unidos. En un aspecto, un marcador está unido al extremo 5’ de la molécula sonda, mientras que el otro marcador está unido al extremo 3’ de la molécula. Un aspecto concreto de la invención contiene una molécula fluorescente unida a un extremo y una molécula que puede inactivar este fluoróforo mediante transferencia de energía de resonancia con fluorescencia
(FRET) unido al otro extremo. Las sondas para ensayo de 5’ nucleasa y algunas balizas moleculares son ejemplos de sondas con marcaje doble.
La expresión “sonda para ensayo de 5’ nucleasa” se refiere a una sonda con marcaje doble que se puede hidrolizar mediante la actividad 5’-3’ exonucleasa de una ADN polimerasa. Un sonda para ensayo de 5’ nucleasa no necesariamente se hidroliza mediante la actividad 5’-3’ exonucleasa de una ADN polimerasa en las condiciones usadas en el ensayo de PCR concreto. El nombre “ensayo de 5’ nucleasa” se usa con independencia del grado de hidrólisis observado y no indica ninguna expectativa en representación del investigador. La expresión “sonda para ensayo de 5’ nucleasa” y “ensayo de 5’ nucleasa” simplemente hace referencia a ensayos en los que no se tan tomado precauciones especiales para evitar la hidrólisis de la sonda implicada. Las “sondas para ensayo de 5’ nucleasa” a menudo se denominan “sondas de ensayo TaqMan” y el “ensayo de 5’ nucleasa” “ensayo TaqMan”. Estos nombres se usan de forma intercambiable en esta solicitud.
La expresión “análogo oligonucleotídico” se refiere a una molécula de unión a ácido nucleico capaz de reconocer una secuencia nucleotídica diana concreta. Un análogo oligonucleotídico concreto es un ácido nucleico peptídico (PNA) en el que la estructura de azúcar fosfato de un oligonucleótido está sustituida por una estructura de tipo proteico. En el PNA, las nucleobases están unidas a una estructura de poliamida sin carga, que da una estructura de ácido nucleico seudopeptídico, que es homomorfa con las formas de ácido nucleico.
La expresión “Baliza Molecular” se refiere a una única sonda con marcaje simple o doble que no es probable que esté afectado por la actividad 5’-3’ exonucleasa de una ADN polimerasa. Se han efectuado modificaciones especiales en la sonda, la polimerasa o las condiciones de ensayo para evitar la separación de los marcadores o nucleótidos constituyentes mediante la actividad 5’-3’ exonucleasa de una ADN polimerasa. Por tanto, el principio de detección depende de una diferencia detectable en la señal producida por el marcador tras la unión de la baliza molecular a su secuencia diana. En un aspecto de la invención, la sonda oligonucleotídicas forma una estructura de horquilla intramolecular a la temperatura de ensayo escogida mediada por las secuencias complementarias en los extremos 5’ y 3’ del oligonucleótido. Eloligonucleótido puede tener una molécula fluorescente unida en un extremo y una molécula unida en el otro, que puede inactivar el fluoróforo cuando está en las proximidades de cada una en la estructura en horquilla. En otro aspecto de la invención, una estructura en horquilla no se forma en base a la estructura complementaria en los extremos de la secuencia de la sonda, en su lugar, el cambio en la señal detectado tras la unión puede ser el resultado de la interacción entre uno o ambos marcadores con la estructura dúplex formada o de un cambio general de conformación espacial de la sonda tras la unión o de una interacción reducida entre los marcadores tras la unión. Un aspecto concreto de la baliza molecular contiene una serie de residuos de LNA para inhibir la hidrólisis mediante la actividad 5’-3’ exonucleasa de una ADN polimerasa.
La expresión “multi-sonda”, como se usa en el presente documento, se refiere a una sonda que comprende un segmento de reconocimiento que es una secuencia de sonda suficientemente complementaria a una secuencia de reconocimiento en una molécula de ácido nucleico diana para unirse a la secuencia en condiciones moderadamente rigurosas y/o en condiciones adecuadas para la PCR, ensayo 5’ nucleasa y/o análisis de baliza molecular (o, en general, cualquier procedimiento basado en FRET). Dichas condiciones son bien conocidas para los expertos en la técnica. Preferentemente, la secuencia de reconocimiento se encuentra en una pluralidad de secuencias que se están evaluando, por ejemplo como un transcriptoma. Una multi-sonda de acuerdo con la invención puede comprender un nucleótido no natural (“un nucleótido estabilizante”) y puede temer una afinidad de unión mayor por la secuencia de reconocimiento que una sonda que comprende una secuencia idéntica pero sin la moléculas estabilizante. Preferentemente, al menos un nucleótido de una multi-sonda está modificado por un resto químico (p. ej., asociado covalentemente o, de otro modo, de forma estable durante al menos las etapas de hibridación de una reacción de PCR) para aumentar la afinidad de unión del segmento de reconocimiento por la secuencia de reconocimiento.
Como se usa en el presente documento, una multi-sonda con una “afinidad de unión” por una secuencia de reconocimiento mayor que una sonda que comprenda la misma secuencia pero que no comprenda un nucleótido estabilizante se refiere a una sonda para la cual la constante de asociación (Ka) del segmento de reconocimiento de la sonda es mayor que la constante de asociación de las hebras complementarias de una molécula bicatenaria. En otra realización preferida, la constante de asociación del segmento de reconocimiento de la sonda es mayor que la constante de disociación (Kd) de la hebra complementaria de la secuencia de reconocimiento en la secuencia Diana en una molécula bicatenaria.
Una “biblioteca de multi-sondas” comprende una pluralidad de multi-sondas, de un modo tal que la suma de las sondas en la biblioteca pueden reconocer una proporción mayoritaria de un transcriptoma, incluidas las secuencias más abundantes, de modo que aproximadamente el 60 %, aproximadamente el 70 %, aproximadamente el 80 %, aproximadamente el 85 %, más preferentemente aproximadamente el 90 % y todavía más preferentemente el 95 % de los ácidos nucleicos diana en el transcriptoma son detectados por las sondas.
Monómeros hacen referencia a ser “complementario” si contienen nucleobases que pueden formar enlaces de hidrógeno de acuerdo con las normas de apareamiento de bases de Watson-Crick (p. ej., G con C, A con T o A conh U) u ptros motivos de unión a hidrógeno, tal como, por ejemplo, diaminopurina conh T, inosina con C, seudoisocitosina con G, etc
La expresión “monómero sucesivo” se refiere al monómero vecino en la dirección 5’ terminal y el “monómero precedente” se refiere al monómero vecino en la dirección 3’ terminal.
Como se usa en le presente documento, la expresión “población diana” se refiere a una pluralidad de secuencias diferentes de ácidos nucleicos, por ejemplo el genoma de otros ácidos nucleicos de una especie concreta, incluido el transcriptoma del genoma, en el que el transcriptoma se refiere al conjunto completo de elementos transcritos del genoma de cualquier especie. Normalmente, el número de secuencias diana diferentes en una población de ácidos nucleicos es de al menos 100, pero, como quedará claro, el número suele ser mucho mayor (más de 200, 500, 1000, y 10000), en el caso en el que la población diana es un transcriptoma eucariota.
Como se usa en le presente documento, la expresión “ácido nucleico diana” se refiere a cualquier ácido nucleico relevante de una única secuencia específica, por ejemplo un ácido nucleico biológico, por ejemplo derivado de un paciente, un animal (un animal humano o no humano), una planta, una bacteria, un hongo, un alga, una célula, un tejido un organismo etc. Por ejemplo, cuando el ácido nucleico diana deriva de una bacteria, alga, planta, animal no humano, célula, hongo u organismo no humano, el procedimiento comprende además, opcionalmente, seleccionar la bacteria, alga, planta, animal no humano, célula, hongo u organismo no humano según la detección del ácido nucleico diana. En una realización, el ácido nucleico diana procede de un paciente, por ejemplo un paciente humano. En esta realización, la invención incluye además, opcionalmente, seleccionar un tratamiento, diagnosticar una enfermedad o diagnosticar una predisposición genética a una enfermedad en base a la detección del ácido nucleico diana.
Como se usa en el presente documento, “secuencia diana” se refiere a cualquier secuencia de ácido nucleico específica dentro de cualquier un ácido nucleico diana.
La expresión “condiciones rigurosas”, como se usa en el presente documento, es la “rigurosidad” que se produce dentro de un intervalo de aproximadamente Tm -5˚ C (5 ºC por debajo de la temperatura de fusion ™ de la sonda) a aproximadamente 20 ºC a 25 ºC por debajo de la Tm. Como entenderán los expertos en la técnica, la rigurosidad de la hibridación se puede alterar con el fin de identificar o detectar secuencias polinucleotídicas idénticas o relacionadas. En general, las técnicas de hibridación se describen en Nucleic Acid Hybridization, A Practical Approach, Ed. Hames, B. D. and Higgins, S. J., IRL Press, 1985; Gall and Pardue, Proc. Natl. Acad. Sci., USA 63: 378-383, 1969; and John, et al. Nature 223: 582-587, 1969.
Multi-sondas
En referencia ahora a la Fig. 1B, una multi-sonda de acuerdo con la invención es, preferentemente, una sonda de secuencia corta que se une a una secuenca de reconocimiento encontrada en una pluralidad de diferentes ácidos nucleicos diana, de un modo tal que la multi-sonda hibrida específicamente con el ácido nucleico diana pero no hibrida a ningún nivel detectable con moléculas de ácido nucleico que no comprenden la secuencia de reconocimiento. Preferentemente, un conjunto de multi-sondas o biblioteca de multi-sondas puede reconocer una proporción mayoritaria de un transcriptoma, incluidas las secuencias más abundantes, de modo que aproximadamente el 60 %, aproximadamente el 70 %, aproximadamente el 80 %, aproximadamente el 85 %, más preferentemente aproximadamente el 90 % y todavía más preferentemente el 95 % de los ácidos nucleicos diana en el transcriptoma son detectados por las sondas. Una multi-sonda de acuerdo con la invención comprende una “modificación estabilizante”, por ejemplo tal como un nucleótido no natural (“un nucleótido estabilizante”) y puede temer una afinidad de unión mayor por la secuencia de reconocimiento que una sonda que comprende una secuencia idéntica pero sin la secuencia estabilizante. Preferentemente, al menos un nucleótido de una multi-sonda está modificado por un resto químico (p. ej., asociado covalentemente o, de otro modo, de forma estable con la sonda durante al menos las etapas de hibridación de una reacción de PCR) para aumentar la afinidad de unión del segmento de reconocimiento por la secuencia de reconocimiento.
En un aspecto, una multi-sonda de 6 a 12 nucleótidos comprende de 1 a 6. o incluso hasta 12, nucleótidos estabilizantes, tales como nucleótidos LNA. Una biblioteca de sondas potenciadas con LAN contiene sondas cortas que reconocen una secuencia de reconocimiento corta (p. ej., de 8-9 nucleótidos). Las nucleobases de LNA pueden comprender moléculas de α-LNA (véase, por ejemplo, el documento WO 00/66604) o moléculas de xilo-LNA (véase, por ejemplo, el documento WO 00/56748).
En un aspecto, se prefiere que la Tm de la multi-sonda cuando se une a su secuencia de reconocimiento está entre aproximadamente 55 ºC a aproximadamente 70 ºC.
En otro aspecto, las multi-sondas comprenden una o más nucleobases modificadas. Las unidades de bases modificadas pueden comprender una unidad cíclica (p. ej., una unidad carbocíclica tales como pirenilo) que está unida a una unidad nucleica, tal como una 1’-posición del anillo de furasonilo a través de un ligador, tal como un grupo alquileno o alquenileno de cadena lineal o ramificada. Los grupos alquenilo que tienen adecuadamente de 1 (es decir -CH2-) a aproximadamente 12 átomos de carbono, más habitualmente de 1 a aproximadamente 8 átomos de carbono, todavía más típicamente de 1 a aproximadamente 6 átomos de carbono. Los grupos alquenilo tienen adecuadamente uno, dos o tres dobles enlaces carbono-carbono y de 2 a aproximadamente 12 átomos de carbono, más habitualmente de 2 a aproximadamente 8 átomos de carbono, todavía más típicamente de 2 a aproximadamente 6 átomos de carbono.
Las multi-sondas de acuerdo con la invención son ideales para realizar dichos ensayos como PCR en tiempo real, dado que las sondas de acuerdo con la invención tienen, preferentemente, menos de aproximadamente 25 nucleótidos, menos de aproximadamente 15 nucleótidos, menos de aproximadamente 10 nucleótidos, por ejemplo d e8 o 9 nucleótidos. Preferentemente, una multi-sonda puede hibridar específicamente con una secuencia de reconocimiento dentro de una secuencia diana en condiciones de PCR y, preferentemente, la secuencia de reconocimiento se encuentra en al menos aproximadamente 50, al menos aproximadamente 100, al menos aproximadamente 200, al menos aproximadamente 500 moléculas de ácido nucleico diana diferentes. Una biblioteca de multi-sondas de acuerdo con la invención comprenderá multi-sondas, que comprenden secuencias de reconocimiento no idénticas, de un modo tal que dos cualquiera multi-sondas hibridan con diferentes conjuntos de moléculas de ácido nucleico diana. En un aspecto, los conjuntos de moléculas de ácido nucleico diana comprenden algunas moléculas de ácido nucleico diana idénticas, es decir una molécula de ácido nucleico diana que comprende una secuencia génica de interés puede estar unida por más de una multi-sonda. Dicha molécula de ácido nucleico diana contendrá al menos dos secuencias de reconocimiento diferentes que pueden solapar en uno o más, pero menos de x nucleótidos de una secuencia de reconocimiento que comprende x nucleótidos.
En un aspecto, una biblioteca de multi-sondas comprende una pluralidad de diferentes multi-sondas, cada sonda diferente localizada en una localización pequeña sobre un sustrato sólido. Como se usa en el presente documento, “localizar” se refiere a estar limitado o dirigido a la localización de un modo tal que el acontecimiento de hibridación detectada en la localización se puede seguir hasta una sonda de identidad de secuencia conocida. Una sonda localizada puede o no estar asociada de forma estable con el sustrato. Por ejemplo, la sonda podría estar en solución en el pocillo de una placa de microtitulación y, por tanto, localizada o dirigida al pocillo. Como alternativa, o adicionalmente, la sonda podría estar asociada de forma estable con el sustrato de un modo tal que permanece en una localización definida sobre el sustrato tras uno o más lavados del sustrato con un tampón. Por ejemplo, la sonda puede estar asociada químicamente con el sustrato, bien directamente o a través de una molécula ligadora, que puede ser una secuencia de ácido nucleico, un péptido u otro tipo de molécula, que tiene una afinidad por moléculas sobre el sustrato.
Como alternativa, las moléculas de ácico nucleico diana pueden estar localizadas sobre un sustrato (p. ej., una célula o lisado celular o ácidos nucleicos punteados sobre el sustrato).
Una vez que se determinan las secuencias adecuadas, las multi-sondas de LNA se sintetizan químicamente, preferentemente, usando procedimientos y equipos comercialmente disponibles como se describe en la técnica (Tetrahedron 54: 3607-30, 1998). Por ejemplo, se puede usar el procedimiento de fosforoamidita de fase sólida para producir sondas de LNA cortas (Caruthers, et al., Cold Spring Harbor Symp. Quant. Biol. 47:411-418, 1982, Adams, et al., J. Am. Chem. Soc. 105: 661 (1983).
La determinación de la extensión de la hibridación de multi-sondas de una biblioteca de multi-sondas a una o más secuencias diana (preferentemente a una pluralidad de secuencias diana) se puede llevar a cabo mediante cualquiera de los procedimientos bien conocidos en la técnica. Si no hay hibridación detectable, la extensión de la hibridación es, por tanto, 0. Normalmente, los ácidos nucleico señal marcados se usan para detectar hibridación. Los ácidos nucleicos complementarios o ácidos nucleicos señal pueden marcarse mediante uno cualquiera de varios procedimientos usados habitualmente para detectar la presencia de polinucleótidos hibridados. El procedimiento de detección más habitual es el uso de ligandos, que se unen a anticuerpos marcados, fluoróforos o agentes quimioluminiscentes. Otros marcadores incluyen anticuerpos, que pueden servir como miembros de pares de unión específica para un ligando marcado. La elección del marcador depende de la sensibilidad requerida, la facilidad de la conjugación con la sonda, los requisitos de estabilidad y la instrumentación disponible.
Las sondas que contienen LNA normalmente se marcan durante la síntesis. La flexibilidad del enfoque de la síntesis con fosforoamidita facilita además la facilidad de la producción de LNA portadores de todos los ligadores comercialmente disponibles, fluoróforos y moléculas marcadoras disponibles para esta química estándar. Los LNA también se pueden marcar mediante reacciones enzimáticas, por ejemplo con quinasas.
Las multi-sondas de acuerdo con la invención pueden comprender un marcador o una pluralidad de marcadores. En un aspecto, la pluralidad de marcadores comprende un par de marcadores que interaccionan entre sí para producir una señal o para producir un cambio en una señal cuando se produce la hibridación de la multi-sonda con una secuencia diana.
En otro aspecto, la multi-sonda comprende un resto fluoróforo y un resto inactivador, colocados de tal modo que el estado hibridado de la sonda se uede distinguir del estado no hibridado de la sonda mediante un incremento de la señal fluorescente del nucleótido. En un aspecto, la multi-sonda comprende, además del elemento de reconocimiento, una primera y una segunda secuencia complementaria que hibridan específicamente entre sí, cuando la sonda no hibrida con una secuencia de reconocimiento en una molécula diana, llevando la molécula inactivadota lo bastante cerca de dicha molécula indicadora como para inactivar la fluorescencia de la molécula indicadora. La hibridación de la molécula diana distancia el inactivador de la molécula indicadora y tiene como resultado una señal, que es proporcional a la cantidad de hibridación.
En otro aspecto, cuando la polimerización de hebras de ácidos nucleicos se puede detectar usando una polimerasa con actividad 5’ nucleasa. Las moléculas fluoróforo e inactivadoras se incorporan en la sonda lo suficientemente
cerca de modo que el inactivador inactiva la señal de la molécula fluoróforo cuando la sonda hibrida con su secuencia de reconocimiento. La escisión de la sonda mediante la polimerasa con actividad 5’ nculeasa tiene como resultado la separación del inactivador y la molécula fluoróforo, y la presencia en cantidades crecientes de la sñela como secuencias de ácido nucleico.
En el presente contexto, el término “marcador” significa un grupo indicador que puede ser detectado por sí mismo o como parte de una serie de detección. Ejemplos de partes funcionales de grupos indicadores son biotina, digoxigenina, grupos fluorescentes (grupos que pueden absorber radiación electromagnética, por ejemplo luz o rayos X, de una determinada longitud de onda y que, después, reemite la energía absorbida como radiación de una longitud de onda mayor; ejemplos ilustrativos son DANSILO (5-dimetilamino)1-naftalenosulfonilo), DOXILO (N-oxil4,4-dimetiloxazolidina), PROXILO (N-oxil-2,2,5,5-tetrametilpirrolidina), TEMPO (N-oxil-2,2,6,6-tetrametilpiperidina), dinitrofenilo, acridinas, coumarinas, Cy3 y Cy5 (marcas de Biological Detection Systems, Inc.), eritrosina, ácido cumárico, umbeliferona, rojo Texas, rodamina, tetrametil rodamina, Rox, 7-nitrobenzo-2-oxa-1-diazol (NBD), pireno, fluoresceína, Europio, Rutenio, Samario y otros metales térreos raros), marcadores radioisotópicos, marcadores quimioluminiscentes (marcadores que son detectables a tafvés de la emisión de luz durante una reacción química), marcadores de espín (un radical libre (p. ej., nicróxidos orgánicos sustituidos) u otras sondas paramagnéticas (p. ej., Cu2+ , Mg2+) unidos a una molécula biológica detectable mediante el uso de espectroscopia de resonancie de electroespín). Ejemplos especialmente interesantes son biotina, fluoresceína, rojo Texas, rodamina, dinitrofenilo, digoxigenina, Rutenio, Europio, Cy5, Cy3, etc.
Muestras adecuadas de moléculas de ácido nucleico diana pueden comprender un amplio abanico de células eucariotas y procariotas, incluidos protoplastos, otros materiales biológicos, que pueden alojar los ácidos nucleico diana. Por tanto, los procedimientos son aplicables a células animales en cultivo tisular, células animales (p. ej., sangre, suero, plasma, reticulocitos, linfocitos, orina, tejido de médula ósea, líquido cefalorraquídeo o cualquier producto preparado a partir de sangre o linfa) o cualquier tipo de biopsia tisular (p. ej., una biopsia muscular, una biopsia hepática, una biopsia renal, una biopsia de vejiga, una biopsia ósea, una biopsia de cartílago, una biopsia de piel, una biopsia de páncreas, una biopsia del tracto intestinal, una biopsia de timo, una biopsia de mama, una biopsia de útero, una biopsia testicular, una biopsia ocular o una biopsia cerebral, por ejemplo homogeneizado en tampón de lisis), tejido de archivo, ácidos nucleicos, células vegetales u otras células sensibles al shock osmótico y células de bacterias, levaduras, virus, micoplasmas, protozoos, rickettsia, hongos y otras células mcirobianas pequeñas y similares,
Los ácidos nucleicos diana que son reconocidos por una pluralidad de multi-sondas se pueden analizar para detectar secuencias que están presentes en menos del 10 % en una población de moléculas de ácido nucleico diana, menos de aproximadamente un 5%, menos de aproximadamente un 1%, menos de aproximadamente un 0,1 % y menos de aproximadamente un 0,01 % (p. ej., tal como secuencias génicas específicas). El tipo de ensayo usado para detectar estas secuencias es una característica no limitante de la invención y puede comprender PCR o algún otro ensayo adecuado tal como se conoce en la técnica o desarrollado para detectar secuencias de reconocimiento que se encuentran en menos del 10 % de una población de moléculas de ácido nucleico diana.
En un aspecto, el ensayo para detectar las secuencias de reconocimiento menos abundantes comprende hibridar al menos un cebador capaz de hibridar específicamente con la secuencia de reconocimiento, pero sustancialmente incapaz de hibridar con más de aproximadamente 50, más de aproximadamente 25, más de aproximadamente 10, más de aproximadamente 5, más de aproximadamente 2 moléculas de ácido nucleico diana (p. ej., la sonda reconoce ambas copias de una secuencia génica homocigota) o más de un ácido nucleico diana en una población
(p. ej., tal como un alelo de una secuencia génica heterocigota de una sola copia presente en una muestra). En un aspecto preferido, se proporciona un par de dichos cebadores y flanquean la secuencia de reconocimiento identificada por la multi-sonda, es decir están dentro de una distancia amplificable de la secuencia de reconocimiento, de modo que se pueden producir amplicones de aproximadamente 40-5.000 bases y, preferentemente, se producen amplicones de 50-500 o, más preferentemente, de 60-100 bases. Se pueden marcar uno o más de los cebadores.
Los expertos en la técnica conocen bien varias reacciones de amplificación e incluyen, entre otras, PCR, RT-PCR, LCR, transcripción in vitro, PCR en círculo rodante, OLA y similares. También se pueden usar múltiples cebadores en PCR multiplexada para detectar un conjunto de moléculas diana específicas.
La invención proporciona además un procedimiento para diseñar secuencias de multi-sondas para usar en los procedimientos y kits de acuerdo con la invención. En la Fig. 1 se muestra un diagrama de flujo que esboza las etapas del procedimiento.
En un aspecto, se genera “in silico” una pluralidad de n-meros de n nucleótidos que contienen todos los posibles nmeros. Se selecciona una subpoblación de n-meros que tiene una Tm ≥ 60˚ C. En otro aspecto, se selecciona una subpoblación de estas sondas que no autohibridan para proporcionar una lista o bases de datos de n-meros candidatos. La secuencia de cada n-mero se usa para realizar una búsqueda en una base de datos que comprende una pluralidad de secuencias diana. Preferentemente, la base de datos de secuencias diana comprende secuencias expresadas, tales como secuencias de ARNm humano.
De la lista de n-meros candidatos usados para realizar la búsqueda en la base de datos se seleccionan n-meros que
identifican un número máximo de secuencias diana (p. ej., n-meros que comprenden segmentos de reconocimiento que son complementarios a subsecuencias de un número máximo de secuencias diana en la base de datos diana) para generar una matriz de n-mero/secuencia diana. Las secuencias de n-meros que se unen a un número máximo de secuencias diana se almacenan en una base de datos de secuencias de sondas óptimas y estas se extraen de la base de datos de n-meros candidatos. Las secuencias diana que se identifican mediante el primer conjunto de sondas óptimas se eliminan de la base de datos de las secuencias diana. Después, el proceso se repite para el resto de sondas candidatas hasta identificar un conjunto de multi-sondas que comprenda n-meros que cubran más de aproximadamente el 60 %, más de aproximadamente el 80 %, más de aproximadamente el 90 % y más de aproximadamente el 95 % de las secuencias diana. Las secuencias óptimas identificadas en cada etapa se pueden usar para generar una base de datos de las secuencias virtuales de las multi-sondas. Después, se pueden sintetizar multi-sondas que comprenden secuencias de la base de datos de multi-sondas.
En otro aspecto, el procedimiento comprende además evaluar la aplicabilidad general de una secuencia de reconocimiento de sonda candidata dada para la inclusión en el conjunto creciente de candidatas a sonda óptima mediante búsqueda contra las secuencias diana restantes así como una búsqueda contra el conjunto original de secuencias diana. En un aspecto preferido, solo las secuencias de reconocimiento de sondas que con frecuencia se encuentran en las secuencias diana restantes y en las secuencias diana originales se añaden al conjunto creciente de secuencias de reconocimiento de sonda óptima. En un aspecto más preferido, esto se consigue calculando el producto de las puntuaciones de estas búsquedas y seleccionando la secuencia de reconocimiento de sondas con el producto más alto que todavía está entre las secuencias de reconocimiento de sonda con el 20 % de mejor puntuación en la búsqueda contra las dianas actuales.
La invención también proporciona productos de programas informáticos para facilitar el procedimiento descrito anteriormente (véase, p. ej., la Fig. 2). En un aspecto, el productos de programas informáticos comprende instrucciones de programa que puede ejecutar un ordenador o un dispositivo del usuario conectable a una red en comunicación con una memoria.
La invención proporciona además un sistema que comprende una memoria informática que comprende una base de datos de secuencias diana y un sistema de aplicación para ejecutar las instrucciones proporcionadas por el programa informático.
Kits que comprenden multi-sondas
Una realización preferida de la invención es un kit para la caracterización o detección o cuantificación de ácidos nucleicos diana que comprenden muestras de una biblioteca de multi-sondas. En un aspecto, el kit comprende protocolos in silico para su uso. En otro aspecto, el kit comprende información relacionada con sugerencias para obtener cebadores de ADN económicos.
Las sondas contenidas en estos kits pueden tener cualquiera o todas las características descritas anteriormente. En un aspecto preferido, una pluralidad de sondas comprende al menos una nuclebase estabilizante, tal como una nuclebase de LNA.
En otro aspecto, la pluralidad de sondas comprende un nucleótido acoplado o asociado de forma estable con al menos un resto químico para incrementar la estabilidad de unión de la sonda. En un aspecto preferido adicional, el kit comprende una serie de sondas diferentes para cubrir al menos un 60 % de una población de secuencias diana diferentes, tal como un transcriptoma.
En un aspecto preferido, el transcriptoma es un transcriptoma humano.
En otro aspecto, el kit comprende al menos una sonda marcada con uno o más marcadores. En otro aspecto más, una o más sondas comprenden marcadores capaces de interaccionar entre sí en un ensayo basado en FRET, es decir las sondas se pueden diseñar para realizar en ensayos con 5' nucleasa o de balizas moleculares.
Los kits de acuerdo con la invención permiten que un usuario desarrolle rápida y eficazmente ensayos para muchas dianas de ácido nucleico diferentes. El kit puede comprender adicionalmente uno o más reactivos para realizar una reacción de amplificación, tal como PCR.
Ejemplos
La invención se ilustrará adicionalmente a continuación con referencia a los ejemplos siguientes. Debe entenderse que la lo siguiente se ha descrito únicamente a modo de ejemplo y que se pueden realizar modificaciones siempre que permanezcan dentro del alcance de la invención.
En los ejemplos siguientes, los números de referencia de las sondas designan las secuencias de LN— oligonucleótido mostradas e los ejemplos de síntesis siguientes.
Ejemplo 1
Fuente de los datos de transcriptoma
Las secuencias de ARNm del trascriptoma human se obtuvieron de ENSEMBL. ENSEMBL es un proyecto conjunto entre EMBL -EBI y el Sanger Institute para desarrollar un sistema de sofware que produce y mantiene una anotación automática sobre genomas eucarióticas (véase, por ejemplo, Butler, Nature 406 (6794): 333, 2000). ENSEMBL está financiado principalmente por el Wellcome Trust. Se indica que los datos de secuencia se pueden obtener de cualquier tipo de base de datos que comprende secuencias expresadas, aunque ENSEMBL es particularmente atractivo porque presenta datos de secuencia actualizados y la anotación mejor posible para genomas de metozoos. El archivo "Homo_sapiens.cdna.fa" se descargó del sitio ftp de ENSEMBL: ftp://ftp.ensembl.org/pub/currenthuman/data/ el 14 de mayo de 2003. El archivo contiene todas las predicciones de tránscritos de ENSEMBL (ies decir, 37347 secuencias diferentes). De cada secuencia se extrajo la región que comienza a los 50 nucleótidos cadena arriba desde el extremo 3’ a 1050 nucleótidos cadena arriba desde el extremo 3’. El conjunto escogido de secuencias de sondas (véase el mejor modo más adelante) se evaluó adicionalmente frente a las secuencias de ARNm humano en la colección de la Secuencia de Referencia (RefSeq) del NCBI. Los patrones de RefSeq sirven de base para estudios médicos, funcionales y de diversidad; proporcionan una referencia estable para la identificación y caracetrización de genes, análisis de mutación, estudios de expresión, descubrimeinto de polimorfismos y análisis comparativos. La colección RefSeq está dirigida a proporcionar un conjunto exhaustivo, integrado y no redundante de secuencias, incluido el ADN genómico, tránscritos (ARN) y productos proteicos, para organismos e investigación principales. Se encontró una cobertura similar para las 37347 secuencias de ENSEMBL y las 19567 secuencias en la colección RefSeq, es decir, que demuestra que el tipo de base de datos es una característica no limitante de la invención.
Ejemplo 2
Cálculo de un conjunto de datos de multi-sonda (biblioteca alfa)
Se diseñó un software especial para ordenadores UNIX con el fin de calcular el conjunto óptimo de sondas en una biblioteca. L algoritmo se ilustra en el diagrama de flujo que se muestra en la Fig. 2.
La cobertura óptima de un transcriptoma se encuentra en dos etapas. En la primera etapa se determina una matriz dispersa de n unidades y genes, de modo que el número de genes que contiene un n-mero dado se puede encontrar fácilmente. Esto se realiza pasando el programa getcover con la opción –p y un archivo de secuencia en formato FASTA como entrada.
La segunda etapa es determinar la cobertura óptima con un algoritmo, en base a la matriz determinada en la primera etapa. Con este fin se pasa un programa, como el programa getcover, con la matriz como entrada. No obstante, los expertos en la técnica pueden diseñar fácilmente programas que realizan funciones similares y para ejecutar etapas similares
Obtención de buena cobertura oligonucleotídica del transcriptoma.
1.
Se generan todos los n-meros 4n y se calcula la temperatura de fusión prevista. Los n-meros con una temperatura de fusión inferior a 60 ºC o con una elevada energía de autohibridación se eliminan del conjunto. Esto da una lista de n-meros que tienen propiedades físicas aceptables.
2.
Una lista de secuencias génicas que representa el transcriptoma humano se extrae de la base de datos ENSEMBL.
3.
Inicio del bucle principal: Dada la lista de n-meros y de los genes se genera una matriz dispersa de nmeros frente a genes identificando todos los n-meros en un gen dado y almacenando el resultado en una matriz.
4.
Si esta es la primera repetición, una copia de la matriz se deja a un lado y se denomina “matriz total de nmeros/genes”:
5.
Se identifica el n-mero que cubre la mayoría de los genes y el número de genes que cubre se almacena como "max_gene".
6.
Se determina la cobertura de los genes restantes en la matriz y los genes con cobertura de al menos un 80 % de max_gene se almacenan en la “lista de n-meros con buena cobertura”:
7.
El n-mero óptimo es aquél en el que el producto de su cobertura actual y la cobertura total es máxima.
8.
El n-mero óptimo se elimina de la lista de n-mero (etapa 1).
9.
Los genes cubiertos por este n-mero se eliminan de la lista de genes (etapa 2).
10.
El n-mero se añade a la lista de n-meros óptimos, el proceso continua desde la etapa 3 hasta que no se pueden encontrar más n-meros.
El código del programa ("getcover" versión 1.0 de Niels Tolstrup 2003) para calcular un conjunto de datos de multisondas se indica en la Fig. 17. Consiste en tres módulos patentados. getcover.c, dyp.c, dyp.h
El programa también incorpora cuatro módulos cubiertos por la licencia GNU Lesser General Public Licence: getopt.c, getopt.h, getopt1.c, getopt_init.c /* Copyright (C) 1987,88,89,90,91,92,93,94,95,96,98,99,2000,2001 Free Software Foundation, Inc.
Estos archivos forman parte de la biblioteca GNU C. La biblioteca GNU C es software libre; se puede redistribuir y/o modificarlo según los términos del GNU Lesser General Public License, según lo publicado por la Free Software Foundation */
El software se recopiló con aap. El archivo main.aap usado para hacer el programa también se enumiera en la Fig
17.
Para iniciar el programa recopilado se usa el comando siguiente: getcover -l 9 -p -f < h_sap_cdna_50_1050.fasta > h_sap_cdna_50_1050_l9.stat getcover -l 9 -i 1 -d 10 -t 60 -c -n -m -s < h_sap_cdna_50_1050_l9.stat > h_sap_cdna_50_1050_l9.cover
El programa informático se usó con las instrucciones para implementar el algoritmo descrito anteriormente para analizar el transcriptoma humano con los siguientes parámetros: L89: Longtitud de la sonda = 8 o 9 nucleótidos i1: Fracción de inclusión= 100 % d10: Tm delta requerida para el dúplex diana contra el autodúplex= 10 ºC t60: Tm mínima para el dúplex diana= 60 ºC
c: Secuencia diana complementaria usada también
m80: sondas óptimas seleccionadas entre las sondas más generales dirigidas a las dianas restantes con la norma del producto y la norma del 80 %
n: Los nucleótidos LNA se incluyeron, preferentemente, en la parte central del segmento de reconocimiento;
y tuvo como resultado la identificación de una base de datos de secuencias diana de multi-sondas.
Las secuencias diana en este base se datos son ejemplos de dianas óptimas para una biblioteca de multi-sondas. Estas multi-sondas óptimas se enumeran en la TABLA 1 siguiente y comprenden fluoróforos de 5' fluoresceína e inactivadores 3' Eclipse (véase más adelante).
TABLA 1 Sondas oligonucleotídicas con marcaje doble
cagcctcc
cagagcca agctgtga aggaggga
aggaggag
ctggaagc cagagagc tgtggaga
cccaggag
cagccaga tgaggaga ctggggaa
ctccagcc
cttctggg acagtgga ctcctgca
ctcctcca
ttctgcca acagccat tgaggtgg
ctgctgcc
aggagaga tttctcca aaggcagc
ctccagca
ttcctgca cagtggtg ctgtggca
ctgctggg
tttgggga aaagggga agaagggc
cttcctgg
caggcaga tgtgggaa tggatgga
acagcagc
ctgtgcca actgggaa ttctggca
cagctcca
ttccctgg tcacagga cagaaggc
ccccaccc
aaccccat ttcctccc atcccaga
tggtggtg
ctgcccag aggtggaa caggtgct
ttcctcca
ctgaggca tgtggaca ctgtctcc
ctgctcca
ctgctggt tggaggcc tgctgtga
24
tggagaga cagtgcca atggtgaa agctggat aaggcaga atggggaa ctggaagg tggagagc cagccagg agggagag caggcagc cttggtgg cagcagga ctctgcca tcaggagc caccttgg ctgtgctg ctgctgag acacacac cagccacc agaggaga ccctccca catcttca ctgtgacc ctgtggct aggaggca cacctgca agggggaa cagtggct cactgcca ccagggcc tgggacca ttctccca ctgtgtgg cagaggca acagggaa cctggagc ttcccagt ctgggact ctgggcaa cccagcag tccagtgt ctgcctgt ctggagga ttctcctg ctcctccc tggaaggc tccactgc cttcctgc cttcccca ctgtgcct ctgccacc ccacctcc ctctgcca ctgtgctc acagcctca ttcdctg cagcaggt ctgtgagc ctgtggtc tggtgatg ctccatcc tcctcctc cttcaggc tgtggctg tgctgtcc ctcagcca tctgggtc cttctccc tcctctcc ctcttccc cttggagc dgcctcc ctctgcct ctgggcac ccaggctc ctccttcc ctggctgc tgggcatc tctctggt tcctgctc ccgccgcc ctctggct cttgggct catcctcc ctcctcct tgctgggc ctgccatc aggagctg cagcctgg ctgctctc cactggga tcctgctg cagcagcc ctggagtc tgccctga ctcctcca tgctggag cttcagcc ttggtggt ccagccag cttcctcc cttccagc ttgggact cagcccag ttcctggc tccaggtc ctgctgga ctccacca tcctcagc cagcatcc caggagct ctccagcc aggagcag cagaggct ctcagcct tggctctg ccaggagg ctgccttc ttctggct caggcagc cagcctcc ctgggaga ctgtctgc ctgcctct agctggag cccagccc ctgtccca cttctgcc ctgctgcc cagctccc tctgccca ctgctccc tggctgtg ccagccgc ctggacac
tggtggaa cctggaga cctcagcc ttgccatc agctggga ccagggcc tcctcttct cttcccct ctgcttcc ccaccacc ctggctcc cttgggca cagcaggc tctgctgc ccagggca ttctggtc tctggagc cagccacc ctccacct ccgccgcc catccagc cagaggag ctgcccca cttcttctc atggctgc ctctcctc tgggcagc ttccctcc ctcctgcc caggagcc ctggtctc ttcctcaga tggtggcc tctggtcc ctggggcc tccaaggc ctggggct ctgtctcc cagtggca ttggggtc
Estas secuencias de 9 y 8 unidades hiperabundantes cumplen los criterios de selección de la Fig. 2, es decir,
Cada sonda diana se produce en al menos 6 % de las secuencias en el transcriptoma humano (es decir, más de 2200 secuencias diana cada una, más de 800 secuencias objetivo en 100 nucleótidos proximales al extremo 3’ del tránscrito).
No son autocomplementarias (es decir, es improbable que formen dúplex de sonda). La autopuntuación es al menos 10 por debajo de la estimación de la Tm para el dúplex formado con la diana.
El dúplex formado con su secuencia diana tiene una Tm de 60 ºC o superior.
Cubren > 98 % de los ARNm en el transcriptoma humano cuando se combinan.
Versiones especialmente preferidas de las multi-sondas de la tabla 1 se presentan en la tabla 1a siguiente:
TABLA 1a Cien oligonucleótidos sustituidos con LNA
cAgCCTCc cAGAGCCa aGCTGTGa aGGAGGGa aGGAGGAg cTGGAAGc cAGAGAGc tGTGGAGa ccCAGGAg cAGCCAGa tGAGGAGa ctGGGGAa cTCCAgCc cTTCTGGg aCAGTGGa cTCCtGCa cTCCTCCa tTCTGCCa aCAGCCAt tGAGGtGg cTgCTGCc aGGAGAGa tTTCTCCa aAGGCAGc cTCCAGCa tTCCTGCa cAGTGGTg ctGTGGCa cTGCTGgg tTTGGGGa aAAGGGGa aGAAGGGc cTTCCTGg cAGGCAGa tGTGGGAa tGGATGGa aCAGCAGc ctGTGCCa aCTGGGAa tTCTGGCa caGCTCCa tTCCCTGg tCACAGGa cAGAAGGc cCCCACCc aACCCCAt tTCCTCCc aTCCCAGa tGGTGGTg ctGCCCag aGGTGGAa cAGGtGCt tTCCTCCa cTGAGGCa tGTGGACa cTGTCTCc cTGCTCCa cTGCtGGt tGGAGgCc tGCTGTGa tGGAGAGa cAGtGCCa atGGTGAA aGCTGGAt aAGGCAGa aTGGGGAa cTGGAAGg tGGAGAGc cAGCcAGg aGGGAGAg cAGGcAGc cTTGGTGg cAGCAGGa cTCtGCCa tCAGGaGc cACCTTGg cTGTGCTg cTGCTGAg aCACACAC cAgCCACc aGAGGAGa cCCtCCCa cATCTTCA cTGTGACc ctGTGGCt aGGAGGca cACCtGCa aGGGGGAa caGTGGCt cACtGCCa cCAGgGcc tGgGACCa tTCTCCCa cTGTGTGg cAGAGGCa aCAGGGAa
5 -en la que las letras minúsculas designan un monómero de ADN y las letras en mayúscula designan un nucleótido LNA.
> 95,0 % de las secuencias del ARNm son el objetivo dentro de los 1000 nucleótidos cerca del extremo 3’ (posición 50 a 1050 desde el extremo 3’) y > 95,0 % del ARNm contiene la secuencia diana para más de una sonda en la biblioteca. Más de 650.000 sitios diana para estas 100 multi-sondas se identificaron en el transcriptoma humano que
10 contiene 37.347 secuencias de ácido nucleico. El número medio de multi-sondas dirigidas a cada tránscrito en el transcriptoma es 17,4 y la mediana del valor es sitios diana para 14 sondas diferentes.
Las secuencias indicadas anteriormente también son una elección excelente de sondas para otros transcriptomas, aunque no se seleccionaron para optimizad para los organismos concretos. Por tanto, los inventores han evaluado la cobertura de la biblioteca indicada anteriormente para el genoma de ratón y de rata, a pesar del hecho de que las
15 sondas anteriores se3 diseñaron para detectar/caracterizar/cuantificar los tránscritos solo en el transcriptoma humano. Véase, por ejemplo, la tabla 2.
TABLA 2 Transcriptoma Biblioteca de sondas humanas De ser humano De ratón De rata
no. Nº de secuencias de ARNm
37347 32911 28904
Cobertura de ARNm de longitud
96,70 % 94,60 % 93,50 %
completa
Cobertura de 1000 nt cerca
del 91,00 % - -
extremo 3’
Cubierto al menos por dos sondas
89,80 % 80,20 % 77,00 %
nt ~ nucleótidos
Ejemplo 3 20 Cobertura prevista del transcriptoma humano por oligonucleótidos de 9 unidades de frecuente aparición
Datos piloto experimentales (similares a la Fig. 6) indicaron que era posible reducir la longitud de la secuencia de reconocimiento de una sonda con marcaje doble para ensayos de PCR en tiempo real a 8 o 9 nucleótidos según la secuencia, si la sonda está potenciada con LNA. Las propiedades únicas de estabilización de dúplex del LNA son necesarias para garantizar una estabilidad adecuada para un dúplex tan corto (es decir, Tm > 60 ˚ C). La sonda para PCR en tiempo real funcional será LNA casi puro, con de 6 a 10 nucleótidos de LNA en la secuencia de reconocimiento. No obstante, la corta secuencia de reconocimiento hace posible usar la misma sonda de LNA para detectar y cuantificar la abundancia de muchos genes diferentes. Mediante selección adecuada de las mejores (es decir, las más frecuentes) secuencias de reconocimiento de 8 o 9 unidades de acuerdo con el algoritmo representado en la Fig. 2, es posible obtener una cobertura del transcriptoma humano que contiene aproximadamente 37.347 ARNm (Fig. 3).
La Fig. 3 muestra la cobertura prevista en forma de porcentaje del número total de secuencias de ARNm en el transcriptoma humano que son detectables en una tira de 1000 nucleótidos de longitud cerca del extremo 3’ de las respectivas secuencias (es decir, la secuencia desde el nucleótido 50 al nucleótido 1050 desde el extremo 3’) por sondas optimizadas de diferentes longitudes. Las sondas tienen que ser lo suficientemente estables (Tm>60 ºC) y con una baja propensión a formar autodúplex, que eliminan muchas secuencias de sonda de 9 unidades, e incluso más de 8 unidades.
Si todas las secuencias de las sondas de una longitud dada se pudieran usar como sondas, obviamente los inventores obtendrían la mejor cobertura del transcriptoma con las secuencias de sondas más cortas posibles. De hecho, este es el caso cuando en la biblioteca se incluye solo un número limitado de sondas (< 55) (Fig. 4). Sin embargo, dado que muchas sondas cortas con un contenido bajo en GC tienen una estabilidad térmica inadecuada, fueron omitidas de la biblioteca. La limitada diversidad de las sondas de 8 unidades aceptables es menos eficiente en la detección de genes con bajo contenido en GC y una biblioteca compuesta por 100 sondas diferentes de 9 unidades tiene una cobertura mejor del transcriptoma que una biblioteca similar de 8 unidades. No obstante, lamedor elección es una biblioteca mixta compuesta por secuencias de diferentes longitudes, tales como la mejor biblioteca propuesta anterior. La cobertura de esta biblioteca no se muestra en la Fig. 4.
La biblioteca de sondas diseñada 100 de los nonámeros y octámeros más frecuentes, es decir la “biblioteca de sondas de ARNm humano” se pueden manipular en una caja conveniente o formato de placa de microtitulación.
El conjunto inicial de 100 sondas para ARNm humanos se puede modificar para generar similares kits de biblioteca para transcriptomas de otros organismos (ratón, rata, Drosophila, C. elegans, levadura, Arabidopsis, pez cebra, primates, animales domésticos etc.). La construcción de estas nuevas bibliotecas de sondas requerirá pocos esfuerzos, ya que la mayoría de las sondas de ARNm humano se pueden volver a usar en los kits de bibliotecas nuevas (TABLA 2).
Ejemplo 4
Número de sondas en la biblioteca dirigidas a cada gen
El limitado número de sondas en las bibliotecas propuestas no solo está dirigido a una fracción grande (> 98 %) del transcriptoma humano, sino que también hay un elevado grado de redundancia en cuanto a que la mayoría de los genes (Casi el 95 %) puede detectarse con más de una sonda. En el transcriptoma humano (37347 genes) se han identificado más de 650.000 sitios diana para las 100 sondas en la biblioteca del mejor modo mostrada anteriormente. Esto da un número medio de sitios diana por sonda de 6782 (es decir, el 18 % del transcriptoma) que varía desde 2527 a 12066 secuencias por sonda. El número medio de sondas capaces de detectar un gen concreto es 17,4 y la mediana del valor es 14. Por tanto, dentro de la biblioteca de solo 100 sondas, los inventores tienen al menos 14 sondas para más del 50 % de todas las secuencias de ARNm humano.
El número de genes a los que está dirigido un número dado de sondas en la biblioteca se representa en la Fig. 4.
Ejemplo 5
Diseño de sondas de 9 unidades para demostrar viabilidad
El gen SSA4 de levaduras (Saccharomyces cerevisiae) se seleccionó para los ensayos de expresión porque el nivel de transcripción génica se puede inducir mediante shock térmico y se dispone de mutantes cuando se inactiva la expresión. Se seleccionaron tres secuencias diferentes de 9 unidades entre las secuencias de 9 unidades frecuentes dentro del transcriptoma humano (Tabla 3). Las secuencias estaban presentes cerca del extremo 3’ de 1,8 a 6,4 % de todas las secuencias de ARNm dentro del transcritota humano. Otros criterios de selección fueron un nivel moderado de autocomplementariedad y una Tm of 60˚ C o superior. Las tres secuencias estaban presentes dentro de las 1000 bases terminales del ORF de SSA4. Se construyeron tres sondas para ensayo de 5’ nucleasa sintetizando las tres secuencias con un fluoróforo FITCH en el extremo 5’ y un inactivador Eclipse (Epoch Biosciences) en el extremo 3’. Las sondas se nombraron de acuerdo con su posición dentro del ORF YER103W (SSA4), en el que la posición 1201 se fijó como la posición 1. Se diseñaron tres conjuntos de cebadores para producir tres amplicones no solapantes, cada uno de ellos con una de las tres secuencias de sonda. Los amplicones se nombraron de acuerdo la secuencia de sonda que abarcaban.
Tabla 3. Sondas y cebadores diseñados para el ensayo de 5’ nucleasa
Secuencia
Nombre de la sonda Secuencia del cebador directo Secuencia del cebador inverso Longitud del amplicón
aaGGAGAAG
469 con cgcgtttactttgaaaaattctg gcttccaatttcctggcatc 81 pb
marcaje doble
(SEC ID Nº 1) (SEC ID Nº 2)
cAAGGAAAg
570 con gcccaagatgctataaattggttag gggtttgcaacaccttctagttc 95 pb
marcaje doble
(SEC ID Nº 3) (SEC ID Nº 4)
ctGGAGCaG
671 con tacggagctgcaggtggt gttgggccgttgtctggt 86 pb
marcaje doble
(SEC ID Nº 5) (SEC ID Nº 6)
pb ~ pares de bases
También se diseñaron dos balizas moleculares para detectar la secuencia de SSA4 469 y de SSA4 570 y se denominaron Baliza 469 y Baliza 570, respectivamente. La secuencia de la baliza SSA4 469 era CAAGGAGAAGTTG (SEC ID Nº 7, sitio de reconocimiento 10 unidades), que debería permitir que este oligonucleótido formara la estructura de baliza intramolecular con un tronco formado por las interacciones LNA-LNA entre 5’-CAA y TTG-3’. La secuencia de la baliza SSA4 570 fue CAAGGAAAGttG (sitio de reconocimiento 9 unidades) en la que la estructura de baliza intramolecular puede formarse entre 5’-CAA y ttG-3’. Ambas secuencias se sintetizaron con un fluoróforo de fluoresceína en el extremo 5’ y un inactivador Dabcyl en el extremo 3’.
También se diseñó una sonda marcada con SYBR verde para detectar la secuencia de SSA4 570 y se denominó SYBRSonda-570. La secuencia de esta sonda fue CAAGGAAaG. Esta sonda se sntetizó con un ligando de unión a amino-C6 en el extremo 5’ sobre el cual se fijó el fluoróforo SYBR Verde 101 (Molecular Probes) de acuerdo con las instrucciones del fabricante. Tras la hibridación con la secuencia diana, el ligando de unión unido al fluoróforo se intercalará en la reguón dúplex LN—ADN generada, lo que incrementa la fluorescencia del SYBR Verde 101.
TABLA 4: SECUENCIAS
Número Posición
Nombre Tipo Secuencia
EQ enelgen 5
Sonda para ensayo con
5’-Flúor-aaGGAGAAG
13992
469 con marcaje doble nucleasa 5' Eclipse-3’ 469-477
Sonda para ensayo con
5’-Flúor-cAAGGAAAg
13994
c 570 con marcaje doble nucleasa 5' Eclipse-3’ 570-578
Sonda para ensayo con
5’-Flúor-ctGGAGCaG
13996
671 con marcaje doble nucleasa 5' Eclipse-3’ 671-679
5’-Flúor-
CAAGGAGAAGTTG
Dabcyl-3’
13997
Baliza 469 Baliza molecular 5’-Fluor-
CAAGGAGAAGTTG
Dabcyl-3’)
(5’-Flúor-SEC ID Nº 8
Dabcyl-3’)
5’-Flúor-CAAGGAAAGttG
Dabcyl-3’
5’-Flúor-CAAGGAAAGttG
14148
Baliza 570 Baliza molecular Dabcyl-3’
(5’-Flúor-SEC ID Nº 9
Dabcyl-3’)
5’-SYBR101-NH2C6
14165
SYBR-Sonsa-570 SYBR-Sonda cAAGGAAAg-3’
Número
Posición
EQ
Nombre Tipo Secuencia en el gen
cgcgtttactttgaaaaattctg
14012
SSA4-469-F Cebador (SEC ID Nº 10)
gcttccaatttcctggcatc
14013
SSA4-469-R Cebador (SEQID NO: 11)
gcccaagatgctataaattggttag
14014
SSA4-570-F Cebador (SEC ID Nº 12)
gggtttgcaacaccttctagttc
14015
SSA4-570-R Cebador (SEC ID Nº 13)
tacggagctgcaggtggt
14016
SSA4-671-F Cebador (SEQID NO: 14)
gttgggccgttgtctggt
14017
SSA4-671-R Cebador (SEC ID Nº 15)
gcgagagaaaacaagcaagg
14115
POL5-469-F Cebador (SEC ID Nº 16)
attcgtcttcactggcatca
14116
POL5-469-R Cebador (SEC ID Nº 17)
cagctaaaaatgatgacaataatgg
14117
APG9-570-F Cebador (SEC ID Nº 18)
attacatcatgattagggaatgc
14118
APG9-570-R Cebador (SEC ID Nº 19)
gggtttgaacattgatgagga
14119
HSP82-671-F Cebador (SEC ID Nº 20)
ggtgtcagctggaacctctt
14120
HSP82-671-R Cebador (SEC ID Nº 21)
Ejemplo 6
Síntesis, desprotección y purificación de oligonucleótidos con marcaje doble
Los oligonucleótidos con marcaje doble EQ13992 a EQ14148 (Tabla 4) se prepararon en un sintetizador automático de ADN (Expedite 8909 DNA synthesizer, PerSeptive Biosystems, escala 0,2 mmol) usando el enfoque con fosforoamidita (Beaucage and Caruthers, Tetrahedron Lett. 22: 1859-1862, 1981) con LNA protegido con 2-cianoetilo y fosforoamiditas en ADN (Sinha, et al., Tetrahedron Lett.24: 5843-5846, 1983). Los soportes sólidos CPG se obtuvieron con el inactivador eclipse (EQ13992-EQ13996) o dabcilo (EQ13997-EQ14148) y 5’-fluoresceína fosforamidita (GLEN Research, Sterling, Virginia, EE.UU.). El ciclo de síntesis se modificó para las fosforoamiditas LNA (tiempo de acoplamiento 250 s) en comparación con las fosforamiditas de ADN. Como activador en la etapa de acoplamiento se usó 1H-tetrazol o 4,5-dicianoimidazol (Proligo, Hamburgo, Alemania).
Los oligonucleótidos se desprotegieron usando amoniaco acuoso al 32 % (1 h a temperatura ambiente, después 2 horas a 60 ºC) y se purificaron mediante HPLC (Shimadzu-SpectraChrom series; Xterra™ RP18 columnA, 10?m 7,8 x 150 mm (Waters). Tampones: A: Acetato de trimetilamonio 0,05M pH 7,4. B. 50 % de acetonitrilo en agua. Eluyente: 0-25 min: 10-80 % B; 25-30 min: 80 % B). La composición y la pureza de los oligonucleótidos se verificaron mediante análisis MALDI-MS (PerSeptive Biosystem, Voyager DE-PRO), véase la Tabla 5. La Fig. 5 es el espectro MALDI-MS de EQ13992 que muestra [M-H]-= 4121,3 Da. Este es un espectro MALDI-MS típico para las sondas de 9 unidades de la invención.
TABLA 5:
PM
Nº EQ
Secuencias PM (Calc.) (Encontrado)
13992
5’-Fitc-aaGGAGAAG-EQL-3’ 4091,8 Da. 4091,6 Da.
13994
5’-Fitc-cAAGGAAAg-EQL-3’ 4051,9 Da. 4049,3 Da.
13996
5’-Fitc-ctGGAGmCaG-EQL-3’ 4020,8 Da. 4021,6 Da.
Nº EQ
Secuencias PM (Calc.) PM (Encontrado)
5’-Fitc-mCAAGGAGAAGTTG-dabcyl-3’
13997
(5’-Fitc-SEC ID Nº 22-dabcilo-3’) 5426,3 Da. 5421,2 Da.
Las mayúsculas designan monómeros de LNA (A, G, mC, T), en los que mC es LNA metilcitosina. Las letras en minúscula designan monómeros de ADN (a, g c, t). Fitc = Fluoresceína; EQL = Inactivador Eclipse Dabcyl = inactivador de dabcilo. PM= Peso molecular.
Ejemplo 7
Producción de patrones de ADNc de SSA4 para la detección con sondas de 9 unidades
La funcionalidad de las sondas de 9 unidades construidas se analizó en ensayos de PCR en los que se cuetionó la capacidad de las sondas para detectar diferentes amplicones de PCR de SSA4. El molde para la reacción de PCR fue ADNc obtenido de la transcripción inversa de ARNc producido por transcripción in vitro de una región cadena abajo del gen SSA4 en el vector de expresión pTRIamp18 (Ambion). La región cadena abajo del gen SSA4 se clonó del siguiente modo:
Amplificación por PCR
Se realizó amplificación del gen parcial de levadura mediante PCR estándar usando ADN genómico de levadura como molde. El ADN genómico se preparó a partir de una cepa de laboratorio patrón silvestre de Saccharomyces cerevisiae usando el kit de extracción Nucleon MiY DNA (Amersham Biosciences) de acuerdo con las instrucciones del proveedor. En la primera etapa de la amplificación por PCR se usaron un cebador directo que contiene un sitio para enzima de restricción y un cebador inverso que contiene una secuencia de unión universal. En esta etapa se añadieron 20 pb en el extremo 3’ del amplicón, al lado del codón de terminación. En la segunda etapa de la amplificación, el cebador inverso se intercambió con un cebador anidado que contenía una cola de poli-T20 y un sitio para enzima de restricción. El amplicón SSA4 contiene 729 pb del ORF de SSA4 más una secuencia de unión universal de 20pb y una cola de poli-A20.
Los cebadores para PCR usados fueron:
YER103W-Dir-SacI: acgtgagctcattgaaactgcaggtggtattatga (SEC ID Nº 23)
YER103W-Inv-Uni: gatccccgggaattgccatgctaatcaacctcttcaaccgttgg (SEC ID Nº 24)
Uni-poliT-BamHI: acgtggatccttttttttttttttttttttgatccccgggaattgccatg (SEC ID Nº 25).
Construcciones de ADN plasmídico
El amplicón de la PCR se digirió con las enzimas de restricción EcoRI + BamHI. El fragmento de ADN se ligó en el vector pTRIamp18 (Ambion) usando el kit Quick Ligation Kit (New England Biolabs) de acuerdo con las isntrucciones del proveedor y se transformó en E. coli DH-5 mediante procedimientos estándar.
Secuenciación de ADN
Para verificar la clonación del amplicón de PCR se secuenció el ADN plasmídico usando los cebadores directo de M13 e inverso de M13 y se analizó en un ABI 377.
Transcripción in vitro:
El ARNc de SSA4 se obtuvo realizando transcripción in vitro con el kit Megascript T7 kit (Ambion) de acuerdo con las instrucciones del proveedor.
Transcripción inversa
La transcripción inversa se realizó con 1 µg de ARNc y 0,2 U de la transcriptasa inversa Superscript II RT (Invitrogen) de acuerdo con las instrucciones del proveedor, a excepción de que se añadieron 20 U de Superase-In (inhibidor de la ARNasa -Ambion) El ADNc producido se purificó en una columna de purificación de PCR QiaQuick (Qiagen) de acuerdo con las instrucciones del proveedor usando el tampón de elución EB suministrado. La concentración de ADN del ADNc eluido se midió y diluyó hasta una concentración de copias de ADNc de SSA4 correspondiente a 2x 107 copies por µl.
Ejemplo 8
Protocolo de ensayos de sonda con marcaje doble
Los reactivos para las PCR con sondas con marcaje doble se mezclaron de acuerdo con el esquema siguiente (Tabla 6):
Tabla 6 Reactivos Concentración final
H2O GeneAmp 10x PCR buffer II 1x Mg2+ 5,5 mM DNTP 0,2 mM Sonda con marcaje doble 0,1 o 0,3 µM* Molde 1 µl
Cebador directo 0,2 µM Cebador inverso 0,2 µM AmliTaq Gold 2,5 U
Total 50 µL
* Concentración final de la sonda del ensayo de 5’ nucleasa 0,1 µM y Baliza/SYBR-sonda 0,3 µM.
En los presentes experimentos se añadieron como molde 2 x 107 copias del ADNc de SSA4. Los ensayos se realizaron en una DNA Engine Option® (MJ Research) usando los siguientes protocolos del ciclo de PCR:
Tabla 7
Ensayos con nucleasa 5' Ensayos con Baliza y SYBR (sonda)
95 ºC durante 7 minutos 95 ºC durante 7 minutos & & 40 ciclos de 40 ciclos de 94 ºC durante 20 segundos 94 ºC durante 30 segundos 60 ºC durante 1 minuto 52 ºC durante 1 minuto*
Detección de fluorescencia Detección de fluorescencia 72 ºC durante 30 segundos
* Para la Baliza-570 con sitio de reconocimiento de 9 unidades, la temperatura de hibridación se redujo a 44 ºC
10 A la composición de las reacciones de PCR mostrada en la Tabla 6 junto con los protocolos del ciclo de PCR enumerados en la Tabla 7 se hará referencia como las condiciones del ensayo de 5’ nuculeasa y del ensayo con baliza estándar.
Ejemplo 9
Especificidad de las sondas de 9 unidades para el ensayo con 5’ nucleasa
15 La especificidad de las sondas para el ensayo con 50 nucleasa se demostró en los ensayos en los que las sondas se añadieron a 3 reacciones diferentes de PCR, generando cada una un amplicón de PCR de SSA4 diferente. Como se muestra en la Fig. 6, cada sonda solo produce una señal fluorescente junto con el amplicón para cuya detección se diseñó (véase también las Figs. 10. 11 y 12). Es importante que diferentes sondas tenían valores de Ct del umbral del ciclo similares (de 23,2 a 23,7), lo que muestra que los ensayos y sondas tienen una eficiencia muy igual.
20 Además, indica que los ensayos deberán detectar niveles de expresión similares cuando se usan en ensayos de expresión real. Este es un hallazgo importante, ya que no se desea variabilidad en el funcionamiento de sondas diferentes.
Ejemplo 10
Especificidad de las sondas de 9 y 10 unidades de balizas moleculares
25 La capacidad para detectar en tiempo real amplicones de PCR recién generados también se demostró para el concepto del diseño de baliza molecular. La baliza molecular diseñada contra el amplicón 469 con una secuencia de reconocimiento de 10 unidades produjo una señal clara cuando el ADNc molde de SSA4 y los cebadores para
generar el amplicón 469 estaban presentes en la PCR, Fig. 7A. El valor de Ct observado fue 24,0 y muy similar a los obtenidos con las sondas para el ensayo con 5' nucleasa, lo que de nuevo indica una sensibilidad muy similar de las diferentes sondas. No se produjo señal cuando no se añadió el molde de SSA4. Un resultado similar se produjo mediante la baliza molecular diseñada contra el amplicón 570 con una secuencia de reconocimiento de 9 unidades, Fig. 7B.
Ejemplo 11.
Especificidad de las sondas-SYBR de 9 unidades
La capacidad para detectar amplicones de PCR recién generados también se demostró para el concepto del diseño de SYBR-sonda. La SYBR-sonda de 9 unidades diseñada contra el amplicón 570 del ADNc de SSA4 produjo una señal clara cuando el molde de ADNc de SSA4 y los cebadores para generar el amplicón 570 estaban presentes en la PCR, Fig. 8. No se produjo señal cuando no se añadió e molde de SSA4.
Ejemplo 12
Cuantificación del número de copias del tránscrito
La capacidad para detectar niveles diferentes de tránscritos génicos es un requisito esencial para que una sonda funcione en un ensayo de expresión verdadero. El cumplimiento del requisito se mostró mediante las tres sondas para el ensayo de 5' nucleasa en un ensayo en el que diferentes niveles del ADNc de SSA4 derivado del vector de expresión se añadieron a diferentes reacciones de PCR junto con una de las sondas para el ensayo de 5' nucleasa (Fig. 9). La composición y las condiciones del ciclo eran de acuerdo con las condiciones del ensayo de 5' nucleasa estándar.
El número de copias del ADNc en la PCR antes del inicio del ciclo se refleja en el valor de Ct del umbral del ciclo, es decir el número de ciclo en el que se detectó la señal por primera vez. Aquí, la señal solo se define como señal si la fluorescencia es cinco veces la desviación estándar de la fluorescencia detectada en los ciclos de PCR 3 a 10. Los resultados muestran una buena correlación global entre el logaritmo del número de copias del ADNc inicial y el valor de Ct (Fig. 9). La correlación aparece como una línea recta con la pendiente entre -3,456 y -3,499 según la sonda y los coeficientes de correlación entre 0,9981 y 0,9999. La pendiente de las curvas refleja la eficiencia de las PCR, correspondiendo una eficiencia del 100 % a una pendiente de -3.322 suponiendo la duplicación del amplicón en cada cico de PCR. Las pendientes de las presentes PCR indican eficiencias de la PCR entre 94 % y 100 %. Los coeficientes de correlación y las eficiencias de la PCR son tan elevadas o mayores que los valores obtenidos con las sondas para el ensayo de la nucleasa 5’ de una longitud de 17 a 26 nucleótidos en los ensayos de detección de los mismos niveles de ADNc de SSA4 (los resultados no se muestran). Por tanto, estos resultados muestran que las tres sondas de ensayo de 5’ nucleasa de 9 unidades cumplen los requisitos para las sondas de expresión verdadera que las sondas deben funcionar en los ensayos de perfil de la expresión.
Ejemplo 13
Detección de los niveles de transcripción de SSA4 en levaduras
Los niveles de expresión del tránscrito de SSA4 se detectaron en diferentes cepas de levadura cultivadas en diferentes condiciones de cultivo (6 shock térmico). En los experimentos descritos en el presente documento se usó como levadura silvestre una cepa de laboratorio estándar de Saccharomyces cerevisiae. En EUROSCARF se obtuvo un mutante defectivo de SSA4 (número de registro Y06101). Esta cepa se denomina en el presente documento mutante de SSA4. Ambas cepas de levadura se cultivaron en medio YPD a 30 ºC hasta una DO600 de 0,8A. los cultivos de levadura que s eiban a someter a shock térmico se transfirieron a 40 ºC durantte 30 minutos, tras los cuales se recogieron las células mediante centrifugación y el sedimento se congeló a -80º C. Las células no sometidas al shock térmico se dejaron cultivar a 30 ºC durante 30 minutos y después se recogieron como se ha mencionado.
El ARN se aisló de la levadura recogida usando el kit FastRNA Kit(Bio 101) y la máquina FastPrep de acuerdo con las instrucciones del proveedor.
La transcripción inversa se realizó con 5 µg del cebador oligo(dT) anclado para ccebar la reacción en 1 µg de ARN total y 0,2 U de la transcriptasa inversa Superscript II RT (Invitrogen) de acuerdo con las instrucciones del proveedor, a excepción de que se añadieron 20 U de Superase-In (inhibidor de la ARNasa -Ambion) Tras una incubación de dos horas se realizó inactivación enzimática a 70 ºC durante 5 minutos. Las reacciones de ADNc se dliuyeron 5 veces en tampón Tris 10 mM Tris a pH 8,5 y se eliminaron los oligonucleótidos y las enzimas mediante purificación en una columna MicroSpin™ S-400 HR (Amersham Pharmacia Biotech). Antes de realizar el ensayo de expresión, el ADNc se diluyó 20 veces. El ensayo de expresión se realizó con la sonda 570 con marcaje doble usando las condiciones del ensayo de 5’ nucleasa estándar, a excepción de que se añadieron 2 µl del molde. El moldeo fue una dilución a 100 veces de las reacciones de transcripción inversa originales. Los cuatro moldes diferentes de ADNc usados procedieron de los silvestres o mutantes con o sin shock térmico. El ensayo produjo los resultados previstos (Fig. 10), que muestran niveles mayores del tránscrito de SSA4 en la levadura silvestre sometida a shock térmico (Ct
=26,1) en comparación con la levadura silvestre no sometida a una temperatura elevada (Ct =30,3). No se detectaron transcritos en la levadura mutante con independencia de las condiciones de cultivo. La diferencia en los valores de Ct de 3,5 corresponde a una inducción por 17 del nivel de expresión de los sometidos al shock térmico frente a la levadura silvestre no sometida a shock térmico, y este valor está cerca de los valores de aproximadamente 19 indicados en la literatura (Causton, y col. 2001). Estos valores se obtuvieron usando la curva estándar obtenida para la sonda 570 con marcaje doble en los experimentos de cuantificación con cantidades conocidas del tránscrito de SSA4 (véase la Fig. 9).
Los experimentos demuestran que las sondas de 9 unidades pueden detectar niveles de expresión que corresponden bien con los resultados publicados.
Ejemplo 14
Detección de múltiples tránscritos con sondas individuales de 9 unidades
Para demostrar la capacidad de las tres sondas del ensayo de 5’ nculeasa para detectar los niveles de expresión de otros genes también, se seleccionaron tres genes de levadura diferentes en los que estaba presente una de las secuencias de sonda. Los cebadores se diseñaron para amplificar una región de 60-100 pares de bases alrededor de la secuencia de la sonda. Los tres genes de levadura seleccionados y los correspondientes cebadores se muestran en la Tabla.
TABLA 8. Diseño de ensayos de expresión alternativos
Secuencia/Nombre
Sonda equivalente Secuencia cebador directo del Secuencia del cebador inverso Longitud del amplicón
YEL055C/POL5
469 con marcaje doble gcgagagaaaacaagcaagg (SEC ID Nº 26) attcgtcttcactggcatca (SEC ID Nº 27) 94 pb
YDL149W_APG9
570 con marcaje doble cagctaaaaatgatgacaataatgg (SEC ID Nº 28) attacatcatgattagggaatgc (SEC ID Nº 29) 97 pb
YPL240C_HSP82
671 con marcaje doble gggtttgaacattgatgagga (SEC ID Nº 30) ggtgtcagctggaacctctt (SEC ID Nº 31) 88 pb
El ADNc total derivado de levadura silvestre no sometida a shock térmico se usó como molde para el ensayo de expresión, que se realizó usando condiciones estándar del ensayo de 5' nucleasa a excepción de que se añadieron 2 µl del molde. Como se muestra en la Fig. 11, las tres sondas pudieron detectar expresión de los genes de acuerdo con el diseño del ensayo indicado en la Tabla 8. La expresión no se detectó con ninguna otrea combinación de sonda y debadores que las indicadas en la Tabla 8. En la literatura se dispone de datos de expresión para SSA4, POL5, HSP82, y APG9 (Holstege, y col. 1998). Para levaduras no sometidas al shock térmico, estos datos describen niveles de expresió similares para SSA4 (0,8 copias del tránscrito por célula), POL5 (0,8 copias del tránscrito por célula) y HSP82 (1,3 copias del tránscrito por célula) mientras que los niveles del tránscrito de APG9 son algo menores (0,1 copias del tránscrito por célula).
Este dato se corresponde bien con los resultados obtenidos en el presente documento, ya que todos estos genes mostraron valores de Ct similares, a excepción de HSP82, que tuvo un valor de Ct de 25,6. Esto sugiere que el tránscrito de HSP82 era más abundante en la cepa usada en estos experimentos que lo que se indica en la literatura. Se realizó electroforesis en gel de agarosa con las PCR mostradas en la Fig. 11a para la sonda 469 con marcaje doble. El gel de agarosa (Fig. 12) muestra que el producto de PCR se generó, de hecho, en reacciones en las que no se obtuvo señal y, por tanto, la falta de señal fluorescente de estas reacciones no se debía a un fallo de la PCR. Además, la diferente longitud de los amplicones producidos en los ensayos de expresión para diferentes genes indica que la señal producida en los ensayos de expresión para diferentes genes es, de hecho, específica del gen en cuestión.
Ejemplo 15
Selección de dianas
Usando el software EnsMart, versión 16.1 de http://www.ensembl.org/EnsMart, las 50 bases de cada extremo de todos los exones de los genes NCBI 33 dbSNP115 Ensembl Genes de Homo Sapiens se extrajeron para formar un conjunto de dianas de Exon50 humano. Usando le programa GetCover program (cf. Fig. 17), se calculó la existencia de todas las secuencias diana de la sonda y se eliminaron las secuencias diana de la sonda que no pasan los criterios de selección de acuerdo con un exceso de autocomplementariedad, contenido excesivo de GC etc. Entre las secuencias restantes, se seleccionaron las secuencias diana de sonda más abundantes (nº 1, que cubre 3200
dianas) y, después, todas las dianas sondas que tienen una prevalencia superior a 0,8 veces la prevalencia de la más abundante ((3200 x 0,8) o superior a 2560 dianas. A partir de la muestra restante, el número de nuevas coincidencias para cada sonda se computó y el producto del número de nuevas coincidencias por diana de sonda se comparó con la selección existente y la prevalencia total de la misma diana de sonda se computó y usó para
5 seleccionar la siguiente secuencia de la diana de sonda más abundante seleccionando el número de producto más elevado. La longitud de la diana de sonda (n) y la secuencia (n-mero) y la aparición en la diana total (cobertura), así como el número de nuevas coincidencias por sección de la diana de sonda (Newhit), el producto de Newhit y la cobertura (newhit x cobertura) y el número de coincidencias acumuladas en la población diana de todas las sondas acumuladas (suma) se indica en la tabla siguiente.
newhit x Nº n n-mero Newhit Cobertura cobertura suma
1 8 ctcctcct 3200 3200 10240000 3200 2 8 ctggagga 2587 3056 7905872 5787 3 8 aggagctg 2132 3074 6553768 7919 4 8 cagcctgg 2062 2812 5798344 9981 5 8 cagcagcc 1774 2809 4983166 11755 6 8 tgctggag 1473 2864 4218672 13228 7 8 agctggag 1293 2863 3701859 14521 8 8 ctgctgcc 1277 2608 3330416 15798 9 8 aggagcag 1179 2636 3107844 16977 10 8 ccaggagg 1044 2567 2679948 18021 11 8 tcctgctg 945 2538 2398410 18966 12 8 cttcctcc 894 2477 2214438 19860 13 8 ccgccgcc 1017 2003 2037051 20877 14 8 cctggagc 781 2439 1904859 21658 15 8 cagcctcc 794 2325 1846050 22452 16 8 tggctgtg 805 2122 1708210 23257 17 8 cctggaga 692 2306 1595752 23949 18 8 ccagccag 661 2205 1457505 24610 19 8 ccagggcc 578 2318 1339804 25188 20 8 cccagcag 544 2373 1290912 25732 21 8 ccaccacc 641 1916 1228156 26373 22 8 ctcctcca 459 3010 1381590 26832 23 8 ttctcctg 534 1894 1011396 27366 24 8 cagcccag 471 2033 957543 27837 25 8 ctggctgc 419 2173 910487 28256 26 8 ctccacca 426 2097 893322 28682 27 8 cttcctgc 437 1972 861764 29119 28 8 cttccagc 415 1883 781445 29534 29 8 ccacctcc 366 2018 738588 29900 30 8 ttcctctg 435 1666 724710 30335 31 8 cccagccc 354 1948 689592 30689 32 8 tggtgatg 398 1675 666650 31087 33 8 tggctctg 358 1767 632586 31445 34 8 ctgccttc 396 1557 616572 31841 35 8 ctccagcc 294 2378 699132 32135 36 8 tgtggctg 304 1930 586720 32439 37 8 cagaggag 302 1845 557190 32741 38 8 cagctccc 275 1914 526350 33016 39 8 ctgcctcc 262 1977 517974 33278 40 8 tctgctgc 267 1912 510504 33545 41 8 ctgcttcc 280 1777 497560 33825
newhit x Nº n n-mero Newhit Cobertura cobertura suma
42 8 cttctccc 291 1663 483933 34116 43 8 cctcagcc 232 1863 432216 34348 44 8 ctccttcc 236 1762 415832 34584 45 8 cagcaggc 217 1868 405356 34801 46 8 ctgcctct 251 1575 395325 35052 47 8 ctccacct 215 1706 366790 35267 48 8 ctcctccc 205 1701 348705 35472 49 8 cttcccca 224 1537 344288 35696 50 8 cttcagcc 203 1650 334950 35899 51 8 ctctgcca 201 1628 327228 36100 52 8 ctgggaga 192 1606 308352 36292 53 8 cttctgcc 195 1533 298935 36487 54 8 cagcaggt 170 1711 290870 36657 55 8 tctggagc 206 1328 273568 36863 56 8 tcctgctc 159 1864 296376 37022 57 8 ctggggcc 159 1659 263781 37181 58 8 ctcctgcc 155 1733 268615 37336 59 8 ctgggcaa 185 1374 254190 37521 60 8 ctggggct 149 1819 271031 37670 61 8 tggtggcc 145 1731 250995 37815 62 8 ccagggca 147 1613 237111 37962 63 8 ctgctccc 146 1582 230972 38108 64 8 tgggcagc 135 1821 245835 38243 65 8 ctccatcc 161 1389 223629 38404 66 8 ctgcccca 143 1498 214214 38547 67 8 ttcctggc 155 1351 209405 38702 68 8 atggctgc 157 1285 201745 38859 69 8 tggtggaa 155 1263 195765 39014 70 8 tgctgtcc 135 1424 192240 39149 71 8 ccagccgc 159 1203 191277 39308 72 8 catccagc 122 1590 193980 39430 73 8 tcctctcc 118 1545 182310 39548 74 8 agctggga 121 1398 169158 39669 75 8 ctggtctc 128 1151 147328 39797 76 8 ttcccagt 142 1023 145266 39939 77 8 caggcagc 108 1819 196452 40047 78 8 tcctcagc 105 1654 173670 40152 79 8 ctggctcc 103 1607 165521 40255 80 9 tcctcttct 127 1006 127762 40382 81 8 tccagtgt 123 968 119064 40505
Ejemplo 16
PCRq para genes humanos
El uso de la biblioteca de sondas está acoplado al uso del software de diseño de PCR en tiempo real que puede:
reconocer una secuencia de entrada a través de un identificador único o registrando una secuencia de ácido nucleico presentada
identificar todas las sondas que pueden dirigirse al ácido nucleico
Clasificar las sondas de acuerdo con los criterios de selección de secuencias diana, tal como proximidad al
extremo 3’ o proximidad a los límites intrón-exón
Si es posible, diseñar cebadores para PCR que flanquean las sondas dirigidas a la secuencia de ácido nucleico de acuerdo con las normas de diseño de PCR
Sugerir ensayos de PCR en tiempo real disponibles basados en los procedimientos anteriores.
5 El diseño de un ensayo de PCRq eficiente y fiable para un gen humano se lleva a cabo mediante el software encontrado en www.probelibrary.com.
El software ProbeFinder diseña sondas óptimas para PCRq y cebadores de un modo rápido y fiable para un gen humano dado.
El diseño comprende las etapas siguientes:
10 1) Determinación de las posiciones del intrón
El ruido del ADN cromosómico se elimina seleccionando PCRq que abarca intrones. Los intrones se determinan mediante una búsqueda rápida contra el genoma humano. Las regiones halladas en el ADN, pero no en el tránscrito, se consideran intrones.
2) Hacer coincidir la biblioteca de la sonda con el gen
15 Casi todos los tránscritos humanos están cubiertos por al menos una de las 90 sondas, la elevada cobertura se hace posible mediante modificaciones con LNA de las marca de la secuencia de reconocimiento.
3) Diseño de cebadores y selección de ensayo de PCRq óptimo
Los cebadores están diseñados con ’PrimeR3’ (Whitehead Inst. For Biomedical Research, S. Rozen and H.J. Skaletsky). Por último, las sondas se clasifican de acuerdo con las normas seleccionadas que garantizan la
20 PCRq mejor posible. Las normas favorecen los amplicones con intrones para eliminar señales falsa de contaminación por ADN, el tamaño pequeño del amplicón para ensayos reproducibles y comparables y un contenido en GC optimizado para PCR.
Ejemplo 17
Preparación de ena-monómeros y oligómeros
25 Se preparan monómeros ENA-T y se usan para la preparación de sondas con marcaje doble de la invención.
En las secuencias siguientes, la X indica un 2’-O,4’-C-etilen-5-metiluridina (ENA-T). La síntesis de este monómero se describe en el documento WO 00/47599. las condiciones de reacción para la incorporación de una 5’-ODimetoxitritil-2’-O,4’-C-etilen-5metiluridina-3’-O-(2-cianoetil-N,N-diisopropil)fosforamidita corresponde a las condiciones de reacción para la preparación de oligómeros de LNA como se describe en el Ejemplo 6.
30 Las siguientes tres sondas con marcaje doble se preparan:
Nº EQ
Secuencias PM (Calc.) PM
(Encontrado)
16533
5’-Fitc-ctGmCXmCmCAg-EQL-3’ 4002 Da. 4001 Da.
16534
5’-Fitc-cXGmCXmCmCA-EQL-3’ 3715 Da. 3716 Da.
16535
5’-Fitc-tGGmCGAXXX-EQL-3’ 4128 Da. 4130 Da.
X designa el monómero ENA-T. Las letras en minúscula designan monómeros de ADN (a, g c, t). Fitc = Fluoresceína; EQL = Inactivador Eclipse Dabcyl = inactivador de dabcilo. PM= Peso molecular. Las letras en mayúscula distintas a “X” designan LNA nucleótidos de metiloxi,.
Referencias y notas
1.
Helen C. Causton, Bing Ren, Sang Seok Koh, Christopher T. Harbison, Elenita Kanin, Ezra G. Jennings, Tong Ihn Lee, Heather L. True, Eric S. Lander, and Richard A. Young (2001). Remodelling of Yeast Genome Expression in Response to Environmental Changes. Mol. Biol. Cell 12:323-337 (2001).
2.
Frank C. P. Holstege, Ezra G. Jennings, John J. Wyrick, Tong Ihn Lee, Christoph J. Hengartner, Michael R. Green, Todd R. Golub, Eric S. Lander, and Richard A. Young (1998). Dissecting the Regulatory Circuitry of a Eukaryotic Genome. Cell 1998 95: 717-728.
3.
Simeonov, Anton and Theo T. Nikiforov, Single nucleotide polymorphism genotyping using short,
fluorescently labelled locked nucleic acid (LNA) probes and fluorescence polarization detection, Nucleic Acid Research, 2002, Vol.30 No 17 e 91.
Los expertos en la técnica conocerán variaciones, modificaciones y otras implementaciones de lo que se ha descrito en el presente documento sin desviarse del alcance de la invención, como se describe y reivindica en el presente documento, y dichas variaciones, modificaciones e implementaciones entran dentro del alcance de la invención.
LISTADO DE SECUENCIAS
<110> Exiqon A/S
10 <120> SONDAS, BIBLIOTECAS Y KITS PROCEDIMIENTOS PARA CONSTRUIRLOS
<130> 15769PCT00
15 <160> 46
<170> PatentIn versión 3.2
<210> 1
<211> 23 20 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética 25
<400> 1 cgcgtttact ttgaaaaatt ctg 23
<210> 2 30 <211> 20
<212> ADN
<213> Secuencia artificial
<220> 35 <223> Secuencia sintética
<400> 2 gcttccaatt tcctggcatc 20
40 <210> 3
<211> 25
<212> ADN
<213> Secuencia artificial
45 <220>
<223> Secuencia sintética
<400> 3
gcccaagatg ctataaattg gttag 25 50
<210> 4
<211> 23
<212> ADN
<213> Secuencia artificial 55
<220>
<223> Secuencia sintética
<400> 4 60 gggtttgcaa caccttctag ttc 23
<210> 5
<211> 18
PARA ANÁLISIS DE MEZCLAS DE ÁCIDOS NUCLEICOS Y
<212> ADN
<213> Secuencia artificial
<220> 5 <223> Secuencia sintética
<400> 5 tacggagctg caggtggt 18
<210> 6
<211> 18
<212> ADN
<213> Secuencia artificial
15 <220>
<223> Secuencia sintética
<400> 6 gttgggccgt tgtctggt 18
<210> 7
<211> 13
<212> ADN
<213> Secuencia artificial 25
<220>
<223> Secuencia sintética
<400> 7 caaggagaag ttg 13
<210> 8
<211> 13
<212> ADN 35 <213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 8 caaggagaag ttg 13
<210> 9
<211> 12 45 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 9 caaggaaagt tg 12
<210> 10 55 <211> 23
<212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 10 cgcgtttact ttgaaaaatt ctg 23
65 <210> 11
<211> 20
<212> ADN
<213> Secuencia artificial
<220> 5 <223> Secuencia sintética
<400> 11 gcttccaatt tcctggcatc 20
<210> 12
<211> 25
<212> ADN
<213> Secuencia artificial
15 <220>
<223> Secuencia sintética
<400> 12 gcccaagatg ctataaattg gttag 25
<210> 13
<211> 23
<212> ADN
<213> Secuencia artificial 25
<220>
<223> Secuencia sintética
<400> 13 gggtttgcaa caccttctag ttc 23
<210> 14
<211> 18
<212> ADN 35 <213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 14 tacggagctg caggtggt 18
<210> 15
<211> 18 45 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 15 gttgggccgt tgtctggt 18
<210> 16 55 <211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 16 gcgagagaaa acaagcaagg 20
65 <210> 17
<211> 20
<212> ADN <213> Secuencia artificial
5
<220> <223> Secuencia sintética
<400> 17 attcgtcttc actggcatca 20
10
<210> 18 <211> 25 <212> ADN <213> Secuencia artificial
15
<220> <223> Secuencia sintética
20 25
<400> 18 cagctaaaaa tgatgacaat aatgg 25 <210> 19 <211> 23 <212> ADN <213> Secuencia artificial <220> <223> Secuencia sintética
30
<400> 19 attacatcat gattagggaa tgc 23
35
<210> 20 <211> 21 <212> ADN <213> Secuencia artificial
<220> <223> Secuencia sintética
40
<400> 20 gggtttgaac attgatgagg a 21
45
<210> 21 <211> 20 <212> ADN <213> Secuencia artificial
50
<220> <223> Secuencia sintética <400> 21 ggtgtcagct ggaacctctt 20
55
<210> 22 <211> 13 <212> ADN <213> Secuencia artificial
60
<220> <223> Secuencia sintética
65
<220> <221> base modificada <222> (1)..(1) <223> N es LNA metil citosina
<220>
<221> misc feature
<222> (1) .. (1)
<223>n es a,c,g o t 5
<400> 22 naaggagaag ttg 13
<210> 23
<211> 35
<212> ADN
<213> Secuencia artificial
<220> 15
<223> Secuencia sintética
<400> 23 acgtgagctc attgaaactg caggtggtat tatga 35
<210> 24
<211> 44
<212> ADN
<213> Secuencia artificial 25
<220>
<223> Secuencia sintética
<400> 24 gatccccggg aattgccatg ctaatcaacc tcttcaaccg ttgg 44
<210> 25
<211> 50
<212> ADN 35 <213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 25 acgtggatcc tttttttttt tttttttttt gatccccggg aattgccatg 50
<210> 26
<211> 20 45 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 26 gcgagagaaa acaagcaagg 20
<210> 27 55 <211> 20
<212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 27 attcgtcttc actggcatca 20
65 <210> 28
<211> 25
<212> ADN <213> Secuencia artificial
5
<220> <223> Secuencia sintética
<400> 28 cagctaaaaa tgatgacaat aatgg 25
10
<210> 29 <211> 23 <212> ADN <213> Secuencia artificial
15
<220> <223> Secuencia sintética
20 25
<400> 29 attacatcat gattagggaa tgc 23 <210> 30 <211> 21 <212> ADN <213> Secuencia artificial <220> <223> Secuencia sintética
30
<400> 30 gggtttgaac attgatgagg a 21
35
<210> 31 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Secuencia sintética
40
<400> 31 ggtgtcagct ggaacctctt 20
45
<210> 32 <211> 164 <212> ADN <213> Secuencia artificial
50
<220> <223> Secuencia sintética <400> 32
<210> 33 55 <211> 108
<212> ADN
<213> Secuencia artificial
<220> 60 <223> Secuencia sintética
<400> 33
5 <210> 34
<211> 115
<212> ADN
<213> Secuencia artificial
10 <220>
<223> Secuencia sintética
<400> 34
<210> 35
<211> 106 20 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética 25
<400> 35
30 <210> 36
<211> 124
<212> ADN
<213> Secuencia artificial
35 <220>
<223> Secuencia sintética
<400> 36
<210> 37
<211> 115
<212> ADN 45 <213> Secuencia artificial
<220>
<223> Secuencia sintética
50 <400> 37
<210> 38
<211> 121
<212> ADN 5 <213> Secuencia artificial
<220>
<223> Secuencia sintética
10 <400> 38
<210> 39 15 <211> 115
<212> ADN
<213> Secuencia artificial
<220> 20 <223> Secuencia sintética
<400> 39
25
<210> 40
<211> 114
<212> ADN
<213> Secuencia artificial
30
<220>
<223> Secuencia sintética
<400> 40
35
<210> 41
<211> 114 40 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética 45
<400> 41
50 <210> 42
<211> 122
<212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética
<400> 42
<210> 43
<211> 124 10 <212> ADN
<213> Secuencia artificial
<220>
<223> Secuencia sintética 15
<400> 43
20 <210> 44
<211> 122
<212> ADN
<213> Secuencia artificial
25 <220>
<223> Secuencia sintética
<400> 44
<210> 45
<211> 118
<212> ADN 35 <213> Secuencia artificial
<220>
<223> Secuencia sintética
40 <400> 45
<210> 46 45 <211> 124
<212> ADN
<213> Secuencia artificial
<220> 50 <223> Secuencia sintética
<400> 46

Claims (55)

  1. REIVINDICACIONES
    1. Una biblioteca de sondas oligonucleotídicas para un transcriptoma dado en la que cada sonda en la biblioteca consiste en una marca de la secuencia de reconocimiento que tiene una longitud de 6 a 12 nucleótidos y un resto de detección en el que al menos un monómero en cada sonda oligonucleotídica es un análogo del
    5 monómero modificado, lo que incrementa la afinidad de unión por la secuencia diana complementaria respecto al correspondiente oligodesoxirribonucleótido sin modificar, de modo que las sondas de la biblioteca tienen suficiente estabilidad para la unión específica de secuencia y la detección de al menos un 70 %, preferentemente al menos un 90 % de todos los ácidos nucleicos diana diferentes en un transcriptoma de una especie y en la que el número de diferentes secuencias de reconocimiento comprende menos del 10 % de
    10 todas las marcas de secuencia posibles de una(s) longitud(es) dada(s).
  2. 2. La biblioteca de acuerdo con la reivindicación 1, en la que las sondas de la biblioteca tienen una estabilidad suficiente para la unión específica de secuencia y la detección de al menos el 70 % de todos los ácidos nucleicos diana diferentes en cualquier transcriptoma eucariótico diana.
  3. 3. La biblioteca de acuerdo con la reivindicación 2, en la que el transcriptoma eucariótico está seleccionado del 15 grupo compuesto por un transcriptoma de hongos, de plantas y de un animal, tal como un mamífero.
  4. 4. La biblioteca de acuerdo con la reivindicación 1, en la que las sondas de la biblioteca tienen una estabilidad suficiente para la unión específica de secuencia y la detección de al menos el 90 % de todos los ácidos nucleicos diana diferentes en el transcriptoma de una especie seleccionada de un ser humano, un ratón, una rata y un mono.
    20 5. Una biblioteca de sondas oligonucleotídicas de acuerdo con cualquiera de las reivindicaciones precedentes, en la que el segmento marca de la secuencia de reconocimiento de las sondas en la biblioteca se ha modificado de al menos uno de los modos siguientes:
    i) sustitución con al menos un nucleótido no natural
    ii) sustitución con al menos un resto químico para incrementar la estabilidad de la sonda.
    25 6. Una biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 1 o 5, en la que la marca de la secuencia de reconocimiento tiene una longitud de 8 o 9 nucleótidos.
  5. 7.
    Una biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 6, en la que las marcas de la secuencia de reconocimiento están sustituidas por nucleótidos LNA.
  6. 8.
    Una biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones
    30 precedentes, en la que más del 90 % de las sondas oligonucleotídicas se pueden unir y detectar al menos dos secuencias diana en una población de ácido nucleico.
  7. 9.
    Una biblioteca de acuerdo con la reivindicación 8, en la que la marca de la secuencia de reconocimiento es complementaria a al menos dos secuencias diana en la población de ácido nucleico.
  8. 10.
    Una biblioteca de sondas oligonucleotídicas de 8 y 9 nucleótidos de longitud, que comprende una mezcla de
    35 subconjuntos de sondas oligonucleotídicas definidas en una cualquiera de las reivindicaciones 1-9 de modo que las sondas oligonucleotídicas tienen una estabilidad suficiente para la unión específica de secuencia y la detección de al menos el 70 % de todos los ácidos nucleicos diana en un transcriptoma.
  9. 11. Una biblioteca de sondas oligonucleotídicas de una cualquiera de las reivindicaciones precedentes, en la que el número de diferentes secuencias diana en una población de ácido nucleico es al menos 100.
    40 12. Una biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que al menos un nucleótido en cada sonda oligonucleotídica está sustituido con un análogo nucleotídico no natural, un análogo de desoxirribosa o de ribosa o un enlace internucleotídico distinto a un enlace fosfodiéster.
  10. 13. Una biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones 45 precedentes, en la que el resto de detección es un ligando de unión al surco menor unido de forma covalente
    o no covalente o un intercalante seleccionado del grupo que comprende pigmentos de cianina asimétricos, DAPI, SYBR Verde I, SYBR Verde II, SYBR Oro, PicoGreen, naranja tiazol, Hoechst 33342, bromuro de etidio, 1-O-(1-pirenilmetil)glicerol y Hoechst 33258.
  11. 14. La biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 12 o 13, en la que el enlace 50 internucleotídico distinto al enlace fosfodiéster es un enlace internucleotídico sn fosfato.
  12. 15. La biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 14, en la que el enlace internucleotídico está seleccionado del grupo que consiste en fosfonato de alquilo, fosforoamidita, alquilfosfotriéster, fosforotioato y enlaces fosforoditioato.
  13. 16. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que dichas sondas oligonucleotídicas contienen nucleótidos no naturales, tales como 2’-Ometilo, diaminapurina, 2-tiouracilo, 5-nitroindol, bases universales o degeneradas, ácidos nucleicos intercalantes o ligandos de unión a surco menor, para potenciar su unión a una secuencia de ácido nucleico
    5 complementaria.
  14. 17.
    La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que dichas secuencias de reconocimiento diferentes comprenden menos del 1 % de todos los posibles oligonucleótidos de una longitud dada.
  15. 18.
    La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones
    10 precedentes, en la que cada sonda se puede detectar usando una marca doble mediante el principio de ensayo de baliza molecular.
  16. 19.
    La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones 1-17, en la que cada sonda se puede detectar usando una marca doble mediante el principio de ensayo de 5’ nucleasa.
  17. 20.
    La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones
    15 precedentes, en la que cada sonda contiene un único resto de detección que se puede detectar mediante el principio de ensayo de baliza molecular.
  18. 21. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que la población de ácido nucleico diana es una muestra de ARNm, una muestra de ADNc
    o una muestra de ADN genómico.
    20 22. La biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 21, en la que dicha población de ARNm diana o de ADNc diana se origina de los transcriptomas de ser humano, ratón o rata.
  19. 23. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que dichas secuencias diana de la sonda se producen al menos una vez dentro de más del 4 % de diferentes ácidos nucleico diana en una población de ácido nucleico diana.
    25 24. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que las secuencias de la sonda autocomplementarias se han omitido de dicha biblioteca.
  20. 25.
    La biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 24, en la que se ha eliminado la selección de dichas secuencias autocomplementarias.
  21. 26.
    La biblioteca de sondas oligonucleotídicas de acuerdo con la reivindicación 24, en la que sdichas secuencias
    30 autocomplementarias se han eliminado mediante modificaciones específicas de secuencia, tal como nucleótidos no estándar, nucleótidos con nucleobases SBC, 2’-O-metilo, diamina purina, 2-tio uracilo, bases universales o degeneradas o ligandos de unión al surco menor.
  22. 27. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que la temperatura de fusión Tm de cada sonda está ajustada para que sea adecuada para
    35 ensayos basados en PCR mediante sustitución con modificaciones no naturales, tales como LNA, modificado opcionalmente con nucleobases de SBC, 2’-O-metilo, diamina purina, 2-tio-uracilo, 5-nitroindol, bases universales o degeneradas, ácidos nucleicos intercalantes o ligandos de unión a surco menor, para potenciar su unión a una secuencia de ácido nucleico complementaria.
  23. 28. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones 40 precedentes, en la que la temperatura de fusión (Tm) de cada sonda es al menos 50 ºC.
  24. 29.
    La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que cada sonda tiene un nucleótido de ADN en el extremo 5’.
  25. 30.
    La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que cada sonda contiene un par de fluoróforo-inactivador para detección.
    45 31. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que cada sonda se puede detectar mediante el principio de ensayo de baliza molecular.
  26. 32. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que cada sonda está unida a un fluoróforo intercalante o ligando de unión a surco menor, que, tras la unión a un ADN bicatenario o a un heterodúplex de ADN-ARN diana, altera la fluorescencia.
    50 33. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones precedentes, en la que la población diana es el transcriptoma humano.
  27. 34. La biblioteca de sondas oligonucleotídicas de acuerdo con una cualquiera de las reivindicaciones
    precedentes, en la que cada sonda oligonucleotídica detecta el mayor número posible de diferentes ácidos nucleicos diana resultante en una cobertura máxima para una población de ácido nucleico diana mediante dicha biblioteca.
  28. 35. La biblioteca de sondas oligonucleotídicas en la TABLA Ia capaz de detectar las secuencias complementarias 5 en cualquier población de ácidos nucleicos dada.
  29. 36. La biblioteca de acuerdo con una cualquiera de las reivindicaciones precedentes, que comprende sondas, cada una ellas con un elemento de reconocimiento enumerado en la TABLA Ia en la memoria y/o que comprende sondas, teniendo cada una un elemento de reconocimiento complementario a los elementos de reconocimiento enumerado en la TABLA 1.
    10 37. Un procedimiento de seleccionar secuencias oligonucleotídicas útiles en la biblioteca de acuerdo con una cualquiera de las reivindicaciones precedentes, que comprende
    a) proporcionar una primera lista de todos los oligonucleótidos posibles de un número predefinido de nucleótidos, N, teniendo dichos oligonucleótidos una temperatura de fusión, Tm, de al menos 50 ºC.
    b) proporcionar una segunda lista de secuencias de ácido nucleico,
    15 c) identificar y almacenar para cada miembro de dicha primera lista, el número de miembros de dicha segunda lista, que incluye una secuencia complementaria de cada miembro citado,
    d) seleccionar un miembro de dicha primera lista, que en la identificación en la etapa c coincide con el número máximo, identificado en la etapa c, de miembros de dicha segunda lista,
    e) añadir el miembro seleccionado en la etapa d a una tercera lista consistente en los oligonucleótidos 20 seleccionados útiles en la biblioteca de acuerdo con una cualquiera de las reivindicaciones precedentes.
    f) restar el miembro seleccionado en la etapa d de dicha primera lista para proporcionar una primera lista revisada,
    m) repetir las etapas de f hasta que dicha tercera lista consiste en miembros que, juntos, serán complementarios de al menos el 70 % de todos los ácidos nucleicos diana diferentes en el transcriptoma 25 dada o de al menos 90 % de todos los ácidos nucleicos diana diferentes en un transcriptoma de una especie.
  30. 38.
    El procedimiento de acuerdo con la reivindicación 37, en el que la Tm es al menos 60 ºC.
  31. 39.
    El procedimiento de acuerdo con cualquiera de las reivindicaciones 37 o 38, en el que la primera lista de oligonucleótidos solo incluye oligonucleótidos incapaces de autohibridación.
    30 40. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-39, que, después de la etapa f y antes de la etapa m, comprende las etapas siguientes:
    g) restar todos los miembros de dicha segunda lista, que incluye una secuencia complementaria al miembro seleccionado en la etapa d para obtener una segunda lista revisada,
    h) identificar y almacenar para cada miembro de dicha primera lista revisada, el número de miembros de 35 dicha segunda lista revisada, que incluye una secuencia complementaria de cada miembro citado,
    i) seleccionar un miembro de dicha primera lista, que en la identificación en la etapa h coincide con el número máximo, identificado en la etapa h, de miembros de dicha segunda lista, o seleccionar un miembro de dicha primera lista proporciona el número máximo obtenido multiplicando el número identificado en la etapa h con el número identificado en la etapa c,
    40 j) añadir el miembro seleccionado en la etapa i a dicha tercera lista,
    k) restar del miembro seleccionado en la etapa i de dicha primera lista revisada, y
    j) restar todos los miembros de dicha segunda lista revisada, que incluye una secuencia complementaria al miembro seleccionado en la etapa i.
  32. 41. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-40, en el que la repetición en la
    45 etapa m continua hasta que dicha tercera lista consiste en miembros que, juntos, serán complementarios a al menos 85 % de los miembros de la lista de las secuencias de ácido nucleico diana de la etapa b.
  33. 42. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-41, en el que, tras la selección del primer miembro de dicha tercera lista, la selección en la etapa d después de la etapa c está precedida por la identificación de los miembros de dicha primera lista que hibrida con más de un porcentaje seleccionado del
    50 número máximo de miembros de dicha segunda lista, de modo que solo dichos miembros identificados de
    este modo se someten a la selección en la etapa d.
  34. 43.
    El procedimiento de acuerdo con la reivindicación 42, en el que el porcentaje seleccionado es 80 %.
  35. 44.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-43, en el que N es un número entero seleccionado de 6, 7, 8, 9, 10, 11 y 12.
    5 45. El procedimiento de acuerdo con la reivindicación 46, en el que N es 8 o 9.
  36. 46.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-47, en el que dicha segunda lista de la etapa b comprende secuencias de ácido nucleico diana como se definen en la reivindicación 21 o 22.
  37. 47.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-46, realizado esencialmente como se establece en la Fig. 2.
    10 48. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-47, en la que dichas primera, segunda y tercera listas se almacenan en la memoria de un sistema informático, preferentemente en una base de datos.
  38. 49. Un programa informático que proporciona instrucciones para implementar el procedimiento de acuerdo con una cualquiera de las reivindicaciones 37-48 incorporadas en un medio legible por ordenador.
    15 50. Un sistema que comprende una base de datos de secuencias diana y un programa de aplicación para ejecutar el programa informático de la reivindicación 49.
  39. 51. Un procedimiento para identificar una sonda para la detección de y cebadores que amplificarán, un ácido nucleico diana, en el que el procedimiento comprende
    A) introducir, en un sistema informático, datos que identifican de forma única la secuencia de ácido nucleico
    20 de dicho ácido nucleico diana, en el que dicho sistema informático comprende una base de datos que contiene información de la composición de al menos una biblioteca de sondas de ácido nucleico de acuerdo con una cualquiera de las reivindicaciones 1-36, y en el que el sistema informático comprende además una base de datos de secuencias de ácido nucleico diana para cada sonda de dicha al menos una biblioteca y/o comprende además medios para adquirir y comparar datos de las secuencias de ácido nucleico,
    25 B) Identificar, en el sistema informático, una sonda de al menos una biblioteca, en el que la secuencia de la sonda existe en la secuencia del ácido nucleido diana o una secuencia complementaria a la secuencia del ácido nucleico diana
    C) Identificar, en el sistema informático, el cebador que amplificará la secuencia del ácido nucleico diana
    D) proporcionar, como identificación de un medio específico para la detección, una salida que destaca la 30 sonda identificada en la etapa B y las secuencias de los cebadores identificadas en le etapa C.
  40. 52. El procedimiento de acuerdo con la reivindicación 51, en el que la etapa A comprende también introducir en el sistema informático los datos que identifica la al menos una biblioteca de ácidos nucleicos a partir de la cual se desea seleccionar un miembro para usar en el medio de detección específico.
  41. 53. El procedimiento de acuerdo con la reivindicación 52, en el que el dato que identifica la composición de al 35 menos una biblioteca es un código de producto.
  42. 54.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 51-53, en el que la entrada en la etapa A se realiza a través de una interfaz de web en Internet.
  43. 55.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 51-54, en el que los cebadores
    identificados en la etapa C se escogen de un modo tal que se minimiza la posibilidad de amplificar ácidos 40 nucleicos genómicos en una reacción de PCR.
  44. 56.
    El procedimiento de acuerdo la reivindicación 55, en el que al menos uno de los cebadores se selecciona de modo que induzca una secuencia de nucleótidos que en el ADN genómico está interrumpida por un intrón,
  45. 57.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 51-56, en el que los cebadores
    seleccionados en la etapa C se escogen de un modo tal que se minimiza la longitud de amplicones obtenidos 45 de PCR realizada en la secuencia de ácido nucleico diana.
  46. 58. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 51-57, en el que los cebadores seleccionados en la etapa C se escogen de un modo tal que se optimiza el contenido en GC para realizar la PCR.
  47. 59. Un programa informático que proporciona instrucciones para implementar el procedimiento de acuerdo con 50 una cualquiera de las reivindicaciones 51-58 incorporadas en un medio legible por ordenador.
  48. 60.
    Un sistema que comprende una base de datos de sondas de ácido nucleico como se definen en una cualquiera de las reivindicaciones 1-36 y un programa de aplicación para ejecutar el programa informático de la reivindicación 59.
  49. 61.
    Un procedimiento para realizar una pluralidad de secuencias diana, que comprende poner en contacto una
    5 muestra de secuencias diana con una biblioteca de acuertdo con una cualquiera de las reivindicaciones 1-36 y detectar, caracterizar o cuantificar las secuencias de la sonda que se unen a las secuencias diana.
  50. 62. El procedimiento de acuerdo con la reivindicación 61, que proporciona la detección de una secuencia de ácico nucleico que está presente en menos del 10 % de la pluralidad de secuencias que están unidas por las secuencias multi-sondas.
    10 63. El procedimiento de acuerdo con la reivindicación 62, en el que las secuencias de ARNm diana o las secuencias de ADNc comprenden un transcriptoma.
  51. 64.
    El procedimiento de acuerdo con la reivindicación 63, en el que el transcriptoma es un transcriptoma humano.
  52. 65.
    El procedimiento de acuerdo con una cualquiera de las reivindicaciones 61-64, en el que la biblioteca de sondas está acoplada covalentemente a un soporte sólido.
    15 66. El procedimiento de acuerdo con la reivindicación 65, en el que el soporte sólido comprende una placa de microtitulación y cada pocillo de la placa de microtitulación comprende una sonda de la biblioteca diferente.
  53. 67. El procedimiento de acuerdo con una cualquiera de las reivindicaciones 61-66, en el que la etapa de detectar se realiza amplificando una secuencia de ácido nucleico diana que contiene una secuencia de reconocimiento complementaria a una sonda de la biblioteca.
    20 68. El procedimiento de acuerdo con la reivindicación 67, en el que la amplificación del ácido nucleico diana se lleva a cabo usando un par de sondas oligonucleotídicas que flanquean la secuencia de reconocimiento complementaria a una sonda de la biblioteca.
  54. 69. El procedimiento de acuerdo con la reivindicación 61-68, en el que la presencia o el nivel de expresión de una
    o más secuencias de ácido nucleico diana se correlaciona con el fenotipo de una especie.
    25 70. El procedimiento de la reivindicación 69, en el que el fenotipo es una enfermedad.
  55. 71. Un procedimiento de análisis de una mezcla de ácidos nucleicos que usa una biblioteca de acuerdo con una cualquiera de las reivindicaciones 1-36 que comprende las etapas de
    (a) poner en contacto un ácido nucleico diana con una biblioteca de sondas oligonucleotídicas marcadas, teniendo cada una de dichas sondas oligonucleotíticas una secuencia conocida y estando unidas a un
    30 soporte sólido en una posición conocida, para hibridar dicho ácido nucleico diana con al menos un miembro de dicha biblioteca de sondas, de modo que se forma una biblioteca hibridada;
    (b) o bien (i) poner en contacto dicha biblioteca hibridada con una nucleasa capaz de escindir los oligonucleótidos bicatenarios para liberar de dicha biblioteca hibridada una porción de dichas sondas oligonucleotídicas marcadas o fragmentos de las mismas; o (ii) identificar dichas posiciones de dicha
    35 biblioteca hibridada en la que las sondas marcadas o fragmentos de las mismas que han hibridado, para determinar la secuencia de dicho ácido nucleico diana; y
    (c) identificar dichas posiciones de dicha biblioteca hibridada de la que se han eliminado las sondas marcadas, o fragmentos de las mismas, para determinar la secuencia de dicho ácido nucleico diana sin marcar.
    Figura 17 (cont.)
    66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149
    Figura 17 (cont.)
ES04738926T 2003-06-20 2004-06-18 Sondas, bibliotecas y kits para análisis de mezclas de ácidos nucleicos y procedimientos para construirlos Expired - Lifetime ES2385828T3 (es)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
DKPA200300933 2003-06-20
DK200300933 2003-06-20
DK200301066 2003-07-12
DKPA200301066 2003-07-12
DK200400242 2004-02-17
DKPA200400242 2004-02-17
DKPA200400353 2004-03-01
DK200400353 2004-03-01
US54934604P 2004-03-02 2004-03-02
US549346P 2004-03-02
PCT/DK2004/000429 WO2004113563A2 (en) 2003-06-20 2004-06-18 Probes, libraries and kits for analysis of mixtures of nucleic acids and methods for constructing the same

Publications (1)

Publication Number Publication Date
ES2385828T3 true ES2385828T3 (es) 2012-08-01

Family

ID=45935360

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04738926T Expired - Lifetime ES2385828T3 (es) 2003-06-20 2004-06-18 Sondas, bibliotecas y kits para análisis de mezclas de ácidos nucleicos y procedimientos para construirlos

Country Status (5)

Country Link
US (2) US20050089889A1 (es)
CN (1) CN1833034B (es)
AT (1) ATE553216T1 (es)
DK (1) DK1639130T3 (es)
ES (1) ES2385828T3 (es)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060166238A1 (en) * 2004-12-22 2006-07-27 Ramsing Niels B Probes, libraries and kits for analysis of mixtures of nucleic acids and methods for constructing the same
US20070067110A1 (en) * 2005-09-21 2007-03-22 Nelson Charles F Iii Generation of negative controls for arrays
WO2007136834A2 (en) * 2006-05-19 2007-11-29 Codon Devices, Inc. Combined extension and ligation for nucleic acid assembly
WO2008027558A2 (en) 2006-08-31 2008-03-06 Codon Devices, Inc. Iterative nucleic acid assembly using activation of vector-encoded traits
US9157116B2 (en) * 2008-02-08 2015-10-13 Fluidigm Corporation Combinatorial amplification and detection of nucleic acids
CN101659952B (zh) * 2009-07-14 2012-07-18 上海之江生物科技有限公司 锁核酸和小沟结合物共修饰核酸片段
CN102409043B (zh) * 2010-09-21 2013-12-04 深圳华大基因科技服务有限公司 高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头
CN102409408B (zh) * 2010-09-21 2013-08-07 深圳华大基因科技服务有限公司 一种利用微量基因组dna进行全基因组甲基化位点精确检测的方法
EP4039363A1 (en) 2010-11-12 2022-08-10 Gen9, Inc. Protein arrays and methods of using and making the same
EP2638157B1 (en) 2010-11-12 2015-07-22 Gen9, Inc. Methods and devices for nucleic acids synthesis
EP3594340B1 (en) 2011-08-26 2021-06-30 Gen9, Inc. Compositions and methods for high fidelity assembly of nucleic acids
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
EP3543350B1 (en) 2012-04-24 2021-11-10 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
WO2014004393A1 (en) 2012-06-25 2014-01-03 Gen9, Inc. Methods for nucleic acid assembly and high throughput sequencing
CN103484458A (zh) * 2013-10-10 2014-01-01 东南大学 一种含通用碱基寡核苷酸序列及其在dna杂交分析中的应用
WO2016089958A1 (en) * 2014-12-02 2016-06-09 Tribiotica Llc Methods and kits for theranostic applications
CN105297145B (zh) * 2015-11-06 2019-03-08 艾吉泰康生物科技(北京)有限公司 一种制备基因dna探针文库的方法和试剂盒
JP6685138B2 (ja) * 2016-01-27 2020-04-22 シスメックス株式会社 核酸増幅の精度管理方法、精度管理用試薬およびその試薬キット
EP3613049B1 (en) * 2017-04-17 2022-08-10 Seegene, Inc. Methods for preparing optimal combination of oligonucleotides
CN112402592B (zh) * 2020-12-04 2023-06-02 中国人民解放军陆军军医大学 Spink7蛋白在制备促进过度炎症创面愈合的药物中的应用
CN112480242B (zh) * 2020-12-04 2023-06-06 中国人民解放军陆军军医大学 Spink7蛋白在制备预防和/或治疗溃疡性结肠炎的药物中的应用
CN113322254B (zh) * 2021-01-06 2022-05-20 南京诺唯赞生物科技股份有限公司 多靶点蛋白质-dna相互作用的研究方法和工具
US20220229819A1 (en) * 2021-01-21 2022-07-21 Applied Materials, Inc. Methods, mediums, and systems for configuring a dna/rna target probe design
CN113699155B (zh) * 2021-10-29 2022-02-11 和元生物技术(上海)股份有限公司 一种CuO突变体及其应用
US20240093308A1 (en) * 2022-08-01 2024-03-21 Idexx Laboratories, Inc. Human Fractional Abundance Assays

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) * 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4889818A (en) * 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5432272A (en) * 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US6582908B2 (en) * 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
CN1066519A (zh) * 1991-05-03 1992-11-25 上海工业大学 微机硬盘写保护卡
US5912340A (en) 1995-10-04 1999-06-15 Epoch Pharmaceuticals, Inc. Selective binding complementary oligonucleotides
ATE232880T1 (de) * 1996-11-18 2003-03-15 Takeshi Imanishi Neue nucleotidanaloga
JPH10234381A (ja) * 1997-02-28 1998-09-08 Shinkinrui Kinou Kaihatsu Kenkyusho:Kk リゾクトニア属菌検出用の核酸配列
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
ES2242291T5 (es) 1997-09-12 2016-03-11 Exiqon A/S Análogos de nucleósidos bicíclicos y tricíclicos, nucleótidos y oligonucleótidos
US6794499B2 (en) * 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
US7572582B2 (en) * 1997-09-12 2009-08-11 Exiqon A/S Oligonucleotide analogues
AU758463B2 (en) * 1998-02-04 2003-03-20 Applied Biosystems, Llc Determination of a genotype of an amplification product at multiple allelic sites
US6322976B1 (en) * 1998-05-28 2001-11-27 Medical Research Council Compositions and methods of disease diagnosis and therapy
WO1999065928A2 (en) * 1998-06-19 1999-12-23 Genzyme Corporation Polynucleotide population isolated from non-metastatic and metastatic breast tumor tissues
US7071324B2 (en) * 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
ES2234563T5 (es) 1999-02-12 2018-01-17 Daiichi Sankyo Company, Limited Nuevos análogos de nucleósidos y oligonucleótidos
AU777049B2 (en) 1999-03-18 2004-09-30 Qiagen Gmbh Xylo-LNA analogues
US7084125B2 (en) * 1999-03-18 2006-08-01 Exiqon A/S Xylo-LNA analogues
US6734291B2 (en) * 1999-03-24 2004-05-11 Exiqon A/S Synthesis of [2.2.1]bicyclo nucleosides
DK1163250T3 (da) 1999-03-24 2006-11-13 Exiqon As Forbedret syntese af [2.2.1]bicyclonukleosider
ES2283298T3 (es) * 1999-05-04 2007-11-01 Santaris Pharma A/S Analogos de l-ribo-lna.
AU5429000A (en) 1999-06-25 2001-01-31 Sankyo Company Limited Novel bicyclonucleoside derivatives
EP1072679A3 (en) 1999-07-20 2002-07-31 Agilent Technologies, Inc. (a Delaware corporation) Method of producing nucleic acid molecules with reduced secondary structure
JP4151751B2 (ja) 1999-07-22 2008-09-17 第一三共株式会社 新規ビシクロヌクレオシド類縁体
US6579680B2 (en) * 2000-02-28 2003-06-17 Corning Incorporated Method for label-free detection of hybridized DNA targets
AU2002210791A1 (en) 2000-07-28 2002-02-13 Compugen Inc. Oligonucleotide library for detecting rna transcripts and splice variants that populate a transcriptome
EP1377686A4 (en) * 2001-04-12 2007-07-25 Caliper Life Sciences Inc SYSTEMS AND METHOD FOR GENETIC ANALYSIS WITH HIGH THROUGHPUT
JP2002360247A (ja) 2001-06-13 2002-12-17 Takara Bio Inc 核酸固定化物
JP2005514005A (ja) 2001-09-04 2005-05-19 エクシコン エ/エス 新規のlna組成物およびその使用
AU2002351077A1 (en) 2001-11-05 2003-05-19 Exiqon A/S Oligonucleotides modified with novel alpha-l-rna analogues
US7569575B2 (en) * 2002-05-08 2009-08-04 Santaris Pharma A/S Synthesis of locked nucleic acid derivatives
JP4694201B2 (ja) * 2002-09-20 2011-06-08 インテグレイテッド ディーエヌエイ テクノロジーズ インコーポレイテッド アントラキノン消光色素、それらの製造方法及び使用
US20040219565A1 (en) 2002-10-21 2004-11-04 Sakari Kauppinen Oligonucleotides useful for detecting and analyzing nucleic acids of interest

Also Published As

Publication number Publication date
DK1639130T3 (da) 2012-07-09
CN1833034A (zh) 2006-09-13
US20050089889A1 (en) 2005-04-28
US20170081719A1 (en) 2017-03-23
ATE553216T1 (de) 2012-04-15
US11111535B2 (en) 2021-09-07
CN1833034B (zh) 2014-04-16

Similar Documents

Publication Publication Date Title
ES2385828T3 (es) Sondas, bibliotecas y kits para análisis de mezclas de ácidos nucleicos y procedimientos para construirlos
US8383344B2 (en) Methods for quantification of microRNAs and small interfering RNAs
ES2380923T3 (es) Procedimientos de cuantificación de microARN y ARN interferentes pequeños
ES2764096T3 (es) Bibliotecas de secuenciación de próxima generación
KR102134361B1 (ko) 광응답성 핵산류를 포함한 프로브를 이용한 광연결 방법
JP2021000085A (ja) 化学組成物とそれを利用する方法
US7045610B2 (en) Modified oligonucleotides for mismatch discrimination
US8188255B2 (en) Human microRNAs associated with cancer
WO2006069584A2 (en) NOVEL OLIGONUCLEOTIDE COMPOSITIONS AND PROBE SEQUENCES USEFUL FOR DETECTION AND ANALYSIS OF microRNAs AND THEIR TARGET mRNAs
RU2019108294A (ru) Способы обнаружения изменений количества геномных копий в образцах днк
CA2459347A1 (en) Locked nucleic acid (lna) compositions and uses thereof
WO2008040355A2 (en) Novel methods for quantification of micrornas and small interfering rnas
WO2004024314A2 (en) A population of nucleic acids including a subpopulation of lna oligomers
US20060166238A1 (en) Probes, libraries and kits for analysis of mixtures of nucleic acids and methods for constructing the same
US20060014183A1 (en) Extendable probes
WO2004035819A2 (en) Oligonucleotide analogues for detecting and analyzing nucleic acids
CN101090979A (zh) 用于分析核酸混合物的探针、文库和试剂盒及其构建方法
EP1639130B1 (en) Probes, libraries and kits for analysis of mixtures of nucleic acids and methods for constructing the same
Takahashi et al. Age prediction by methylation analysis of small amounts of DNA using locked nucleic acids
JP2008523828A (ja) 核酸混合物を解析するためのプローブ、ライブラリーおよびキット、並びにその構築方法
WO2005121358A2 (en) Extendable probes
Yan et al. LNA-modified isothermal oligonucleotide microarray for differentiating bacilli of similar origin
Dempcy et al. T m leveling compositions
Booth Propargylamino modified bases for DNA duplex stabilisation