ES2387878T3 - Estrategias para la identificación de alto rendimiento y la detección de polimorfismos - Google Patents

Estrategias para la identificación de alto rendimiento y la detección de polimorfismos Download PDF

Info

Publication number
ES2387878T3
ES2387878T3 ES10184351T ES10184351T ES2387878T3 ES 2387878 T3 ES2387878 T3 ES 2387878T3 ES 10184351 T ES10184351 T ES 10184351T ES 10184351 T ES10184351 T ES 10184351T ES 2387878 T3 ES2387878 T3 ES 2387878T3
Authority
ES
Spain
Prior art keywords
dna
nucleic acid
aflp
sample
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10184351T
Other languages
English (en)
Inventor
Michael Josephus Theresia Van Eijk
Henricus Johannes Adam Van Der Poel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keygene NV
Original Assignee
Keygene NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keygene NV filed Critical Keygene NV
Application granted granted Critical
Publication of ES2387878T3 publication Critical patent/ES2387878T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/10Methods of screening libraries by measuring physical properties, e.g. mass

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Método para identificar uno o más polimorfismos en muestras de ácido nucleico, comprendiendo dichométodo las etapas de:a) proporcionar una pluralidad de muestras de ácido nucleico de interés;b) realizar una reducción de la complejidad en cada una de las muestras para proporcionar una pluralidadde bibliotecas de muestras de ácido nucleico,c) ligar adaptadores a las muestras de ácido nucleico de complejidad reducida en las bibliotecas, usando undaptador que porta una proyección 3'-T;d) secuenciar al menos una parte de las bibliotecas;e) alinear las secuencias de cada muestra obtenida en la etapa d);f) determinar uno o más polimorfismos entre la pluralidad de muestras de ácido nucleico en la alineación dela etapa e);g) opcionalmente, examinar un ácido nucleico de muestra de prueba de interés para identificar la presencia,ausencia o cantidad del uno o más polimorfismos determinados en la etapa f) usando sondas de detección.

Description

Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
Campo técnico
La presente invención se refiere a los campos de la biología molecular y la genética. La invención se refiere a la rápida identificación de múltiples polimorfismos en una muestra de ácido nucleico. Los polimorfismos identificados pueden usarse para el desarrollo de sistemas de examen de alto rendimiento para detectar polimorfismos en muestras de prueba.
Antecedentes de la invención
La exploración del ADN genómico ha sido largamente deseada por la comunidad científica, en particular la médica. El ADN genómico contiene la clave para la identificación, el diagnóstico y el tratamiento de enfermedades tales como cáncer y enfermedad de Alzheimer. Además de la identificación y el tratamiento de la enfermedad, la exploración del ADN genómico puede proporcionar ventajas significativas en esfuerzos de cría de animales y plantas, lo que puede proporcionar respuestas a problemas de nutrición y alimentos en el mundo.
Se sabe que muchas enfermedades están asociadas con componentes genéticos específicos, en particular con polimorfismos en genes específicos. La identificación de polimorfismos en muestras grandes tales como genomas es en la actualidad una tarea laboriosa y que requiere mucho tiempo. Sin embargo, tal identificación es de gran valor en áreas tales como investigación biomédica, desarrollo de productos de farmacia, tipificación de tejidos, genotipado y estudios poblacionales.
Sumario de la invención
La presente invención proporciona un método de identificación eficaz y detección fiable de polimorfismos en una muestra de ácido nucleico compleja, por ejemplo muy grande (por ejemplo ADN o ARN) de una manera rápida y económica usando una combinación de métodos de alto rendimiento.
Esta integración de métodos de alto rendimiento entre sí proporciona una plataforma que es particularmente adecuada para la identificación y detección fiable de polimorfismos en muestras de ácido nucleico sumamente complejas en las que la identificación convencional y el mapeo de polimorfismos serían laboriosos y requerirían mucho tiempo.
Una de las cosas que los presentes inventores han encontrado es una solución para la identificación de polimorfismos, preferiblemente polimorfismos de nucleótido único, pero asimismo para (micro)satélites y/o indels, en particular en genomas grandes. El método es único en su aplicabilidad a genomas grandes y pequeños parecidos, pero proporciona ventajas particulares para genomas grandes, en particular especies poliploidales.
Para identificar SNP (y posteriormente detectar los SNP identificados), hay varias posibilidades disponibles en la técnica. En una primera opción, puede secuenciarse el genoma completo, y esto puede hacerse así para varios individuos. Esto es principalmente un ejercicio teórico, ya que esto es engorroso y caro y, a pesar del rápido desarrollo de la tecnología, simplemente no es viable hacerlo para cada organismo, especialmente los que tienen genomas más grandes. Una segunda opción es usar la información de secuencia disponible (fragmentada), tal como bibliotecas de EST. Esto permite la generación de cebadores de PCR, la resecuenciación y la comparación entre individuos. De nuevo, esto requiere información de secuencia inicial que no está disponible o sólo en una cantidad limitada. Además, tienen que desarrollarse ensayos de PCR separados para cada región, lo que añade un enorme coste y tiempo de desarrollo.
La tercera opción es limitarse uno mismo a parte del genoma para cada individuo. La dificultad reside en que la parte proporcionada del genoma debe ser la misma para diferentes individuos con el fin de proporcionar un resultado comparable para lograr una identificación de SNP satisfactoria. Los presentes inventores han solucionado ahora este dilema mediante la integración de métodos sumamente reproducibles para seleccionar parte del genoma con secuenciación de alto rendimiento para la identificación de polimorfismos integrados con preparación de muestras y plataformas de identificación de alto rendimiento. La presente invención acelera el proceso de descubrimiento de polimorfismos y usa los mismos elementos en el proceso posterior para el aprovechamiento de los polimorfismos descubiertos para permitir un genotipado de alto rendimiento fiable y eficaz.
Las aplicaciones previstas adicionales del método de la presente invención incluye el examen de bibliotecas de microsatélites enriquecidas, realizar la obtención del perfil de transcrito de ADNc-AFLP (hibridación de tipo Northern digital), secuenciación de genomas complejos, secuenciación de bibliotecas de EST (en ADNc completo o ADNc-AFLP), descubrimiento de microARN (secuenciación de bibliotecas de insertos pequeñas), secuenciación de cromosomas artificiales bacterianos (BAC) (cóntigos), enfoque de análisis de segregantes agrupados AFLP/ADNc-AFLP, detección de rutina de fragmentos de AFLP, por ejemplo para retrocruzamientos asistidos por marcador
(MABC), etcétera.
Definiciones
En la siguiente descripción y ejemplos, se usan varios términos. Con el fin de proporcionar una comprensión clara y sistemática de la memoria descriptiva y las reivindicaciones, incluyendo el alcance que se da a tales términos, se proporcionan las siguientes definiciones. A menos que se defina lo contrario en el presente documento, todos los términos técnicos y científicos usados tienen el mismo significado que entiende comúnmente un experto habitual en la técnica a la que pertenece esta invención. Las descripciones de todas las publicaciones, solicitudes de patente, patentes y otras referencias se incorporan en el presente documento en su totalidad como referencia.
Polimorfismo: Polimorfismo se refiere a la presencia de dos o más variantes de una secuencia de nucleótidos en una población. Un polimorfismo puede comprender uno o más cambios de bases, una inserción, una repetición o una deleción. Un polimorfismo incluye por ejemplo una repetición de secuencia simple (SSR) y un polimorfismo de nucleótido único (SNP), que es una variación, que se produce cuando se altera un único nucleótido: adenina (A), timina (T), citosina (C) o guanina (G). Una variación debe producirse generalmente en al menos el 1% de la población para que se considere un SNP. Los SNP constituyen por ejemplo el 90% de todas las variaciones genéticas humanas, y se producen cada de 100 a 300 bases a lo largo del genoma humano. Dos de cada tres SNP sustituyen citosina (C) por timina (T). Las variaciones en las secuencias de ADN de por ejemplo seres humanos o plantas pueden afectar a cómo soportan enfermedades, bacterias, virus, productos químicos, fármacos, etc.
Ácido nucleico: Un ácido nucleico según la presente invención puede incluir cualquier polímero u oligómero de bases de pirimidina y purina, preferiblemente citosina, timina y uracilo, y adenina y guanina, respectivamente (véase Albert
L. Lehninger, Principles of Biochemistry, en 793-800 (Worth Pub. 1982) que se incorpora en el presente documento como referencia en su totalidad para todos los fines). La presente invención contempla cualquier desoxirribonucleótido, ribonucleótido o componente de ácido nucleico peptídico, y cualquier variante química de los mismos, tales como formas metiladas, hidroximetiladas o glicosiladas de estas bases, y similares. Los polímeros u oligómeros pueden ser heterogéneos u homogéneos en composición, y pueden aislarse de fuentes que se producen de manera natural o pueden producirse de manera sintética o artificial. Además, los ácidos nucleicos pueden ser ADN o ARN, o una mezcla de los mismos, y pueden existir permanente o transitoriamente en forma mono o bicatenaria, incluyendo homodúplex, heterodúplex y estados híbridos.
Reducción de la complejidad: El término reducción de la complejidad se usa para indicar un método en el que se reduce la complejidad de una muestra de ácido nucleico, tal como ADN genómico, mediante la generación de un subconjunto de la muestra. Este subconjunto puede ser representativo de la muestra completa (es decir, compleja) y es preferiblemente un subconjunto reproducible. Reproducible significa en este contexto que cuando se reduce la complejidad de la misma muestra usando el mismo método, se obtiene el mismo subconjunto o al menos uno comparable. El método usado para la reducción de la complejidad puede ser cualquier método para la reducción de la complejidad conocido en la técnica. Los ejemplos de métodos para la reducción de la complejidad incluyen por ejemplo AFLP® (Keygene N.V., Países Bajos; véase por ejemplo el documento EP 0 534 858), los métodos descritos por Dong (véase por ejemplo los documentos WO 03/012118, WO 00/24939), unión indexada (Unrau et al., véase a continuación), etc. Los métodos de reducción de la complejidad usados en la presente invención tienen en común que son reproducibles. Reproducible en el sentido de que cuando se reduce la complejidad de la misma muestra de la misma manera, se obtiene el mismo subconjunto de la muestra, en oposición a una reducción de la complejidad más aleatoria tal como microdisección o el uso de ARNm (ADNc) que representa una parte del genoma transcrito en un tejido seleccionado y por ello su reproducibilidad depende de la selección de tejido, el tiempo de aislamiento, etc.
Etiquetado: El término etiquetado se refiere a la adición de una etiqueta a una muestra de ácido nucleico con el fin de poder distinguirla de una segunda muestra de ácido nucleico o adicionales. El etiquetado puede realizarse por ejemplo mediante la adición de un identificador de secuencia durante la reducción de la complejidad o mediante cualquier otro medio conocido en la técnica. Tal identificador de secuencia puede ser por ejemplo una secuencia de bases única de longitud variable pero definida usada únicamente para identificar una muestra de ácido nucleico específica. Los ejemplos típicos de las mismas son por ejemplo secuencias ZIP. Usando tal etiqueta, puede determinarse el origen de una muestra tras el procesamiento adicional. En el caso de combinar productos procesados que se originan a partir de diferentes muestras de ácido nucleico, las diferentes muestras de ácido nucleico deben identificarse usando etiquetas diferentes.
Biblioteca etiquetada: El término biblioteca etiquetada se refiere a una biblioteca de ácido nucleico etiquetado.
Secuenciación: El término secuenciación se refiere a la determinación del orden de nucleótidos (secuencias de bases) en una muestra de ácido nucleico, por ejemplo ADN o ARN.
Alinear y alineación: Con el término “alinear” y “alineación” quiere decirse la comparación de dos o más secuencias de nucleótidos basada en la presencia de tramos cortos o largos de nucleótidos similares o idénticos. Se conocen en la técnica varios métodos para la alineación de secuencias de nucleótidos, tal como se explicará adicionalmente a
continuación.
Sondas de detección: El término “sondas de detección” se usa para indicar sondas diseñadas para detectar una secuencia de nucleótidos específica, en particular secuencias que contienen uno o más polimorfismos.
Examen de alto rendimiento: El examen de alto rendimiento, abreviado a menudo como HTS, es un método de experimentación científica especialmente relevante en los campos de biología y química. A través de una combinación de robótica moderna y otro equipo de laboratorio especializado, permite a un investigador examinar de manera eficaz grandes cantidades de muestras simultáneamente.
Ácido nucleico de muestra de prueba: El término “ácido nucleico de muestra de prueba” se usa para indicar una muestra de ácido nucleico que se investiga para detectar polimorfismos usando el método de la presente invención.
Endonucleasa de restricción: Una endonucleasa de restricción o enzima de restricción es una enzima que reconoce una secuencia de nucleótidos específica (sitio diana) en una molécula de ADN bicatenaria, y escindirá ambas hebras de la molécula de ADN en cada sitio diana.
Fragmentos de restricción: Las moléculas de ADN producidas mediante digestión con una endonucleasa de restricción se denominan fragmentos de restricción. Cualquier genoma dado (o ácido nucleico, independientemente de su origen) se digerirá por una endonucleasa de restricción particular para dar un conjunto diferenciado de fragmentos de restricción. Los fragmentos de ADN que resultan de la escisión con endonucleasas de restricción pueden usarse adicionalmente en una variedad de técnicas y pueden detectarse por ejemplo mediante electroforesis en gel.
Electroforesis en gel: Con el fin de detectar fragmentos de restricción, puede requerirse un método analítico para fraccionar moléculas de ADN bicatenarias basándose en el tamaño. La técnica más comúnmente usada para lograr tal fraccionamiento es la electroforesis en gel (capilar). La velocidad a la que los fragmentos de ADN se mueven en tales geles depende de su peso molecular; por tanto, las distancias recorridas disminuyen a medida que la longitud del fragmento aumenta. Los fragmentos de ADN fraccionados mediante electroforesis en gel pueden visualizarse directamente mediante un procedimiento de tinción, por ejemplo tinción con plata o tinción usando bromuro de etidio, si el número de fragmentos incluidos en el patrón es suficientemente pequeño. Alternativamente, el tratamiento adicional de los fragmentos de ADN puede incorporar marcadores detectables en los fragmentos, tales como fluoróforos o marcadores radiactivos.
Ligamiento: La reacción enzimática catalizada por una enzima ligasa en la que dos moléculas de ADN bicatenarias se unen covalentemente entre sí se denomina ligamiento. En general, ambas hebras de ADN se unen covalentemente entre sí, pero también es posible impedir el ligamiento de una de las dos hebras a través de modificación química o enzimática de uno de los extremos de las hebras. En ese caso, la unión covalente se producirá en sólo una de las dos hebras del ADN.
Oligonucleótido sintético: Moléculas de ADN monocatenarias que tienen preferiblemente desde aproximadamente 10 hasta aproximadamente 50 bases, que pueden sintetizarse químicamente se denominan oligonucleótidos sintéticos. En general, estas moléculas de ADN sintéticas están diseñadas para tener una secuencia de nucleótidos única o deseada, aunque es posible sintetizar familias de moléculas que tienen secuencias relacionadas y que tienen diferentes composiciones de nucleótidos en posiciones específicas dentro de la secuencia de nucleótidos. El término oligonucleótido sintético se usará para referirse a moléculas de ADN que tienen una secuencia de nucleótidos diseñada o deseada.
Adaptadores: Moléculas de ADN bicatenarias cortas con un número limitado de pares de bases, por ejemplo de aproximadamente 10 a aproximadamente 30 pares de bases de longitud, que están diseñados de manera que puedan ligarse a los extremos de los fragmentos de restricción. Los adaptadores están compuestos generalmente por dos oligonucleótidos sintéticos que tienen secuencias de nucleótidos que son parcialmente complementarias entre sí. Cuando se mezclan los dos oligonucleótidos sintéticos en disolución en condiciones apropiadas, se aparearán entre sí formando una estructura bicatenaria. Tras aparearse, un extremo de la molécula adaptadora está diseñado de manera que sea compatible con el extremo de un fragmento de restricción y pueda ligarse al mismo; el otro extremo del adaptador puede estar diseñado de modo que no pueda ligarse, pero no es necesario que éste sea el caso (adaptadores ligados dobles).
Fragmentos de restricción ligados a adaptadores: Fragmentos de restricción cuyos extremos se han ocupado mediante adaptadores.
Cebadores: En general, el término cebadores se refiere a una hebra de ADN que puede cebar la síntesis de ADN. La ADN polimerasa no puede sintetizar ADN de novo sin cebadores: sólo puede extender una hebra de ADN existente en una reacción en la que se usa la hebra complementaria como molde para dirigir el orden de nucleótidos que han de ensamblarse. Se hará referencia a las moléculas de oligonucleótidos sintéticos que se usan en una reacción en cadena de la polimerasa (PCR) como cebadores.
Amplificación del ADN: El término amplificación del ADN se usará normalmente para indicar la síntesis in vitro de moléculas de ADN bicatenarias usando PCR. Se indica que existen otros métodos de amplificación y pueden usarse en la presente invención sin apartarse de lo esencial.
Descripción detallada de la invención
La presente invención proporciona un método para identificar uno o más polimorfismos, comprendiendo dicho método las etapas de: 10 a) proporcionar una primera muestra de ácido nucleico de interés;
b) realizar una reducción de la complejidad en la primera muestra de ácido nucleico de interés para proporcionar una primera biblioteca de la primera muestra de ácido nucleico; 15 c) realizar consecutiva o simultáneamente las etapas a) y b) con una segunda muestra de ácido nucleico de interés
o adicionales para obtener una segunda biblioteca o adicionales de la segunda muestra de ácido nucleico de interés
o adicionales;
20 d) secuenciar al menos una parte de la primera biblioteca y la segunda biblioteca o adicionales;
e) alinear las secuencias obtenidas en la etapa d);
f) determinar uno o más polimorfismos entre la primera muestra de ácido nucleico y la segunda muestra de ácido 25 nucleico o adicionales en la alineación de la etapa e);
g) usar el uno o más polimorfismos determinados en la etapa f) para diseñar una o más sondas de detección;
h) proporcionar un ácido nucleico de muestra de prueba de interés;
30 i) realizar la reducción de la complejidad de la etapa b) en el ácido nucleico de muestra de prueba de interés para proporcionar una biblioteca de prueba del ácido nucleico de muestra de prueba;
j) someter la biblioteca de prueba a examen de alto rendimiento para identificar la presencia, ausencia o la cantidad 35 de los polimorfismos determinados en la etapa f) usando la una o más sondas de detección diseñadas en la etapa g).
En la etapa a), se proporciona una primera muestra de ácido nucleico de interés. Dicha primera muestra de ácido nucleico de interés es preferiblemente una muestra de ácido nucleico compleja tal como ADN genómico total o una 40 biblioteca de ADNc. Se prefiere que la muestra de ácido nucleico compleja sea ADN genómico total.
En la etapa b), se realiza una reducción de la complejidad en la primera muestra de ácido nucleico de interés para proporcionar una primera biblioteca de la primera muestra de ácido nucleico.
45 En una realización de la invención, la etapa de reducción de la complejidad de la muestra de ácido nucleico comprende cortar enzimáticamente la muestra de ácido nucleico en fragmentos de restricción, separar los fragmentos de restricción y seleccionar un grupo particular de fragmentos de restricción. Opcionalmente, los fragmentos seleccionados se ligan entonces a secuencias adaptadoras que contienen secuencias de unión/moldes de cebadores de PCR.
50 En una realización de la reducción de la complejidad, se usa un tipo de endonucleasa IIs para digerir la muestra de ácido nucleico y los fragmentos de restricción se ligan selectivamente a secuencias adaptadoras. Las secuencias adaptadoras pueden contener diversos nucleótidos en la proyección que va a ligarse y sólo el adaptador con el conjunto de nucleótidos coincidentes en la proyección se liga al fragmento y posteriormente se amplifica. Esta
55 tecnología se representa en la técnica como ligadores de indexación. Pueden encontrarse ejemplos de este principio entre otros en Unrau P. y Deugau K.V. (1994) Gene 145:163-169.
En otra realización, el método de reducción de la complejidad utiliza dos endonucleasas de restricción que tienen frecuencias y sitios diana diferentes y dos secuencias adaptadoras diferentes.
60 En otra realización de la invención, la etapa de reducción de la complejidad comprende realizar una PCR cebada arbitrariamente sobre la muestra.
Aún en otra realización de la invención, la etapa de reducción de la complejidad comprende eliminar secuencias 65 repetidas desnaturalizando y volviendo a aparear el ADN y entonces eliminando dúplex bicatenarios.
En otra realización de la invención, la etapa de reducción de la complejidad comprende hibridar la muestra de ácido nucleico con una perla magnética que se une a una sonda oligonucleotídica que contiene una secuencia deseada. Esta realización puede comprender además exponer la muestra hibridada a una ADN nucleasa monocatenaria para eliminar el ADN monocatenario, ligando una secuencia adaptadora que contiene una enzima de restricción de la clase IIs para liberar la perla magnética. Esta realización puede comprender o no la amplificación de la secuencia de ADN aislada. Además, la secuencia adaptadora puede usarse o no como molde para el cebador oligonucleotídico de PCR. En esta realización, la secuencia adaptadora puede contener o no una etiqueta o identificador de secuencia.
En otra realización, el método de reducción de la complejidad comprende exponer la muestra de ADN a una proteína de unión a apareamientos erróneos y digerir la muestra con una exonucleasa de 3’ a 5’ y luego una nucleasa monocatenaria. Esta realización puede incluir o no el uso de una perla magnética unida a la proteína de unión a apareamientos erróneos.
En otra realización de la presente invención, la reducción de la complejidad comprende el método CHIP tal como se describe en el presente documento en otra parte o el diseño de cebadores de PCR dirigidos contra motivos conservados tales como SSR, regiones NBS (regiones de unión a nucleótidos), secuencias promotoras/potenciadoras, secuencias consenso de telómeros, genes de caja MADS, familias de genes de ATP-asa y otras familias de genes.
En la etapa c), las etapas a) y b) se realizan consecutiva o simultáneamente con una segunda muestra de ácido nucleico o adicionales de interés para obtener una segunda biblioteca o adicionales de la segunda muestra de ácido nucleico o adicionales de interés. Dicha segunda muestra de ácido nucleico o adicionales de interés es también preferiblemente una muestra de ácido nucleico compleja tal como ADN genómico total. Se prefiere que la muestra de ácido nucleico compleja sea ADN genómico total. También se prefiere que dicha segunda muestra de ácido nucleico o adicionales se refiera a la primera muestra de ácido nucleico. La primera muestra de ácido nucleico y el segundo ácido nucleico o adicionales pueden ser por ejemplo líneas diferentes de una planta, tales como líneas de pimiento diferentes, o variedades diferentes. Las etapas a) y b) pueden realizarse para simplemente una segunda muestra de ácido nucleico de interés, pero también pueden realizarse adicionalmente para una tercera, cuarta, quinta, etc. muestra de ácido nucleico de interés.
Debe indicarse que el método según la presente invención será lo más útil cuando la reducción de la complejidad se realiza usando el mismo método y en sustancialmente las mismas condiciones, preferiblemente idénticas, para la primera muestra de ácido nucleico y la segunda muestra de ácido nucleico o adicionales. En tales condiciones, se obtendrán fracciones similares (comparables) de las muestras de ácido nucleico (complejas).
En la etapa d), se secuencia al menos una parte de la primera biblioteca y de la segunda biblioteca o adicionales. Se prefiere que la cantidad de solapamiento de fragmentos secuenciados de la primera biblioteca y la segunda biblioteca o adicionales sea al menos del 50%, más preferiblemente al menos del 60%, aún más preferiblemente al menos del 70%, incluso más preferiblemente al menos del 80%, aún más preferiblemente al menos del 90% y lo más preferiblemente al menos del 95%.
La secuenciación puede realizarse en principio mediante cualquier medio conocido en la técnica, tal como el método de terminación de la cadena didesoxi. Sin embargo, se prefiere que la secuenciación se realice usando métodos de secuenciación de alto rendimiento, tales como los métodos dados a conocer en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation), por Seo et al. (2004) Proc. Natl. Acad. Sci. USA 101:5488-93, y tecnologías de Helios, Solexa, US Genomics. Lo más preferido es que la secuenciación se realiza usando el aparato y/o método dado a conocer en los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation). La tecnología descrita permite la secuenciación de 40 millones de bases en una única ronda y es 100 veces más rápida y barata que la tecnología de la competencia. La tecnología de secuenciación consiste en líneas generales en 4 etapas: 1) fragmentación del ADN y ligamiento de un adaptador específico a una biblioteca de ADN monocatenario (ADNmc); 2) apareamiento de ADNmc a perlas y emulsificación de las perlas en microrreactores de agua en aceite; 3) deposición de perlas que portan ADN en una placa PicoTiter®; y 4) secuenciación simultánea en 100.000 pocillos mediante generación de una señal luminosa de pirofosfato. El método se explicará en más detalle a continuación.
En la etapa e), se alinean las secuencias obtenidas en la etapa d) para proporcionar una alineación. Se conocen bien en la técnica métodos de alineación de secuencias para fines de comparación. Se describen diversos programas y algoritmos de alineación en: Smith y Waterman (1981) Adv. Appl. Math. 2:482; Needleman y Wunsch (1970) J. Mol. Biol. 48:443; Pearson y Lipman (1988) Proc. Natl. Acad. Sci. USA 85:2444; Higgins y Sharp (1988) Gene 73:237-244; Higgins y Sharp (1989) CABIOS 5:151-153; Corpet et al. (1988) Nucl. Acids Res. 16:10881-90; Huang et al. (1992) Computer Appl. in the Biosci. 8:155-65; y Pearson et al. (1994) Meth. Mol. Biol. 24:307-31. Altschul et al. (1994) Nature Genet. 6:119-29 presentan una consideración detallada de métodos de alineación de secuencias y cálculos de homología.
La herramienta de búsqueda de alineación local básica del NCBI (“Basic Local Alignment Search Tool”) (BLAST)
(Altschul et al., 1990) está disponible de varias fuentes, incluyendo el Centro Nacional de Información Biológica (“National Center for Biological Information”) (NCBI, Bethesda, Md.) e Internet, para su uso conjuntamente con los programas de análisis de secuencias blastp, blastn, blastx, tblastn y tblastx. Puede accederse al mismo en <http://www.ncbi. nlm.nih.gov/BLAST/>. Está disponible una descripción de cómo determinar la identidad de secuencia usando este programa en <http: //www.ncbi.nlm.nih.gov/BLAST/blasthelp.html>. Una aplicación adicional puede ser en prospección de microsatélites (véase Varshney et al. (2005) Trends in Biotechn. 23(1):48-55.
Normalmente, la alineación se realiza sobre los datos de secuencias que se han recortado por los adaptadores/cebador y/o identificadores, es decir, usando sólo los datos de secuencias de los fragmentos que se originan a partir de la muestra de ácido nucleico. Normalmente, los datos de secuencias se usan para identificar el origen del fragmento (es decir, de qué muestra procede), las secuencias derivadas del adaptador y/o identificador se eliminan de los datos y se realiza la alineación sobre este conjunto recortado.
En la etapa f), se determinan uno o más polimorfismos entre la primera muestra de ácido nucleico y la segunda muestra de ácido nucleico o adicionales en la alineación. La alineación puede hacerse de manera que las secuencias derivadas de la primera muestra de ácido nucleico y la segunda muestra de ácido nucleico o adicionales puedan compararse. Pueden identificarse entonces diferencias que reflejan polimorfismos.
En la etapa g), el uno o más polimorfismos determinados en la etapa g) se usan para diseñar sondas de detección, por ejemplo para la detección mediante hibridación sobre chips de ADN o una plataforma de detección a base de perlas. Las sondas de detección están diseñadas de manera que se refleja en las mismas un polimorfismo. En el caso de polimorfismos de nucleótido único (SNP), las sondas de detección contienen normalmente los alelos de SNP variantes en la posición central tal como para maximizar la diferenciación de alelos. Tales sondas pueden usarse ventajosamente para examinar muestras de prueba que tienen un determinado polimorfismo. Las sondas pueden sintetizarse usando cualquier método conocido en la técnica. Las sondas están diseñadas normalmente de manera que son adecuadas para métodos examen de alto rendimiento.
En la etapa h), se proporciona un ácido nucleico de muestra de prueba de interés. El ácido nucleico de muestra de prueba puede ser cualquier muestra, pero es preferiblemente otra línea o variedad que va a mapearse para detectar polimorfismos. Comúnmente, se usa una colección de muestras de prueba que representan el germoplasma de los organismos estudiados para validar experimentalmente que el polimorfismo (SN) es genuino y detectable y para calcular las frecuencias alélicas de los alelos observados. Opcionalmente, se incluyen muestras de una población de mapeo genético en la etapa de validación con el fin de determinar la posición en el mapa genético del polimorfismo también.
En la etapa i), la reducción de la complejidad de la etapa b) se realiza sobre el ácido nucleico de muestra de prueba de interés para proporcionar una biblioteca de prueba del ácido nucleico de muestra de prueba. Se prefiere sumamente que durante todo el método según la presente invención se use el mismo método para la reducción de la complejidad usando sustancialmente las mismas condiciones, preferiblemente idénticas, cubriendo así una fracción similar de la muestra. Sin embargo, no se requiere obtener una biblioteca de prueba etiquetada, aunque puede estar presente una etiqueta en los fragmentos de la biblioteca de prueba.
En la etapa j), se somete la biblioteca de prueba a examen de alto rendimiento para identificar la presencia, ausencia
o cantidad de los polimorfismos determinados en la etapa f) usando las sondas de detección diseñadas en la etapa g). Un experto en la técnica conoce varios métodos para el examen de alto rendimiento usando sondas. Se prefiere que se inmovilicen una o más sondas diseñadas usando la información obtenida en la etapa g) sobre una matriz, tal como un chip de ADN, y que tal matriz se ponga en contacto posteriormente con la biblioteca de prueba en condiciones de hibridación. Los fragmentos de ADN dentro de la biblioteca de prueba complementarios a una o más sondas en la matriz se hibridarán en tales condiciones con tales sondas, y por tanto podrán detectarse. También se prevén otros métodos de examen de alto rendimiento dentro del alcance de la presente invención, tales como inmovilización de la biblioteca de prueba obtenida en la etapa j) y puesta en contacto de dicha biblioteca de prueba inmovilizada con las sondas diseñadas en la etapa h) en condiciones de hibridación.
Se proporciona otra técnica de examen por secuenciación de alto rendimiento entre otros por Affymetrix usando detección basada en chips de SNP y tecnología de perlas proporcionada por Illumina.
En una realización ventajosa, la etapa b) en el método según la presente invención comprende además la etapa de etiquetar la biblioteca para obtener una biblioteca etiquetada, y dicho método comprende además la etapa c1) de combinar la primera biblioteca etiquetada y la segunda biblioteca etiquetada o adicionales para obtener una biblioteca combinada.
Se prefiere que el etiquetado se realice durante la etapa de reducción de la complejidad para reducir la cantidad de etapas requeridas para obtener la primera biblioteca etiquetada de la primera muestra de ácido nucleico. Tal etiquetado simultáneo puede lograrse por ejemplo mediante AFLP, usando adaptadores que comprenden un identificador único (nucleótido) para cada muestra.
Se pretende que el etiquetado distinga entre muestras de diferente origen, por ejemplo obtenidas de diferentes líneas de plantas, cuando las bibliotecas de dos o más muestras de ácido nucleico se combinan para obtener una biblioteca de combinación. Por tanto, se usan preferiblemente etiquetas diferentes para preparar las bibliotecas etiquetadas de la primera muestra de ácido nucleico y la segunda muestra de ácido nucleico o adicionales. Cuando se usan por ejemplo cinco muestras de ácido nucleico, se pretende obtener cinco bibliotecas etiquetadas de manera diferente, indicando las cinco etiquetas diferentes las muestras originales respectivas.
La etiqueta puede ser cualquier etiqueta conocida en la técnica para distinguir muestras de ácido nucleico, pero es preferiblemente una secuencia identificadora corta. Tal secuencia identificadora puede ser por ejemplo una secuencia de bases única de longitud variable usada para indicar el origen de la biblioteca obtenida mediante reducción de la complejidad.
En una realización preferida, el etiquetado de la primera biblioteca y la segunda biblioteca o adicionales se realiza usando etiquetas diferentes. Tal como se comentó anteriormente, se prefiere que cada biblioteca de una muestra de ácido nucleico se identifique mediante su propia etiqueta. El ácido nucleico de muestra de prueba no necesita estar etiquetado.
En una realización preferida de la invención, la reducción de la complejidad se realiza por medio de AFLP® (Keygene N.V., Países Bajos; véase por ejemplo el documento EP 0 534 858 y Vos et al. (1995). AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research, vol. 23, n.º 21, 07-4414).
AFLP es un método para la amplificación selectiva de fragmentos de restricción. AFLP no necesita ninguna información de secuencia previa y puede realizarse sobre cualquier ADN de partida. En general, AFLP comprende las etapas de:
(a)
digerir un ácido nucleico, en particular un ADN o ADNc, con una o más endonucleasas de restricción específicas, para fragmentar el ADN para dar una serie correspondiente de fragmentos de restricción;
(b)
ligar los fragmentos de restricción así obtenidos con un adaptador oligonucleotídico sintético bicatenario, un extremo del cual es compatible con uno o ambos de los extremos de los fragmentos de restricción, para producir de ese modo fragmentos de restricción ligados a adaptador, preferiblemente etiquetados, del ADN de partida;
(c)
poner en contacto los fragmentos de restricción ligados a adaptador, preferiblemente etiquetados, en condiciones de hibridación con al menos un cebador oligonucleotídico que contiene al menos un nucleótido selectivo en su extremo 3’;
(d)
amplificar el fragmento de restricción ligado a adaptador, preferiblemente etiquetado, hibridado con los cebadores mediante PCR o una técnica similar de modo para provocar el alargamiento adicional de los cebadores hibridados a lo largo de los fragmentos de restricción del ADN de partida con el que los cebadores se hibridaron; y (e) detectar, identificar o recuperar el fragmento de ADN amplificado o alargado así obtenido.
AFLP proporciona por tanto un subconjunto reproducible de fragmentos ligados a adaptador. Otros métodos adecuados para la reducción de la complejidad son inmunoprecipitación de cromatina (“Chromatine Immuno Precipitation”) (ChiP). Esto significa que se aísla ADN nuclear, mientras que proteínas tales como factores de transcripción se unen al ADN. Con ChiP, se usa en primer lugar un anticuerpo contra la proteína, dando como resultado un complejo Ac-proteína-ADN. Purificando este complejo y precipitándolo, se selecciona ADN al que se une esta proteína. Posteriormente, el ADN puede usarse para la construcción y secuenciación de la biblioteca. Es decir, este es un método para realizar una reducción de la complejidad de un modo no aleatorio dirigido a zonas funcionales específicas; en el presente ejemplo factores de transcripción específicos.
Un variante útil de la tecnología AFLP usa nucleótidos no selectivos (es decir, +0/+0 cebadores) y algunas veces se denomina PCR de ligador. Esto proporciona también una reducción de la complejidad muy adecuada.
Para una descripción adicional de AFLP, sus ventajas, sus realizaciones, así como las técnicas, enzimas, adaptadores, cebadores y compuestos y herramientas adicionales usados en el mismo, se hace referencia a los documentos US 6.045.994, EP-B-0 534 858, EP 976835 y EP 974672, WO01/88189 y Vos et al. Nucleic Acids Research, 1995, 23, 4407-4414.
Por tanto, en una realización preferida del método de la presente invención, la reducción de la complejidad se realiza
-
digiriendo la muestra de ácido nucleico con al menos una endonucleasa de restricción para fragmentarlo en fragmentos de restricción;
-
ligando los fragmentos de restricción obtenidos con al menos un adaptador oligonucleotídico sintético bicatenario que tiene un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados a adaptador;
-
poner en contacto dichos fragmentos de restricción ligados a adaptador con uno o más cebadores oligonucleotídicos en condiciones de hibridación; y
5 - amplificar dichos fragmentos de restricción ligados a adaptador mediante alargamiento del uno o más cebadores oligonucleotídicos,
en la que al menos uno de los uno o más cebadores oligonucleotídicos incluye una secuencia de nucleótidos que tiene la misma secuencia de nucleótidos que las partes terminales de las hebras en los extremos de dichos
10 fragmentos de restricción ligados a adaptador, incluyendo los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción e incluyendo al menos parte de los nucleótidos presentes en los adaptadores, en los que, opcionalmente, al menos uno de dichos cebadores incluye en su extremo 3’ una secuencia seleccionada que comprende al menos un nucleótido ubicado inmediatamente adyacente a los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción.
15 AFLP es un método sumamente reproducible para la reducción de la complejidad y es por tanto particularmente adecuado para el método según la presente invención.
En una realización preferida del método según la presente invención, el adaptador o el cebador comprende una
20 etiqueta. Éste es particularmente el caso para la identificación real de los polimorfismos, cuando es importante distinguir entre secuencias derivadas de bibliotecas separadas. La incorporación de una etiqueta oligonucleotídica en un adaptador o cebador es muy conveniente ya que no se requieren etapas adicionales para etiquetar una biblioteca.
25 En otra realización, la etiqueta es una secuencia identificadora. Tal como se comentó anteriormente, tal secuencia identificadora puede ser de longitud variable dependiendo de la cantidad de muestras de ácido nucleico que van a compararse. Una longitud de aproximadamente 4 bases (44 = 256 secuencias de etiqueta diferentes posibles) es suficiente para distinguir entre el origen de un número limitado de muestras (hasta 256), aunque se prefiere que las secuencias de etiqueta difieran en más de una base entre las muestras que van a distinguirse. Según se necesite, la
30 longitud de las secuencias de etiqueta puede ajustarse por consiguiente.
En una realización, la secuenciación se realiza sobre un soporte sólido tal como una perla (véase por ejemplo los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation). Tal método de secuenciación es particularmente adecuado para
35 una secuenciación barata y eficaz de muchas muestras simultáneamente.
En una realización preferida, la secuenciación comprende las etapas de:
-
aparear fragmentos ligados a adaptador con perlas, apareándose cada perla con un único fragmento ligado a 40 adaptador;
-
emulsionar las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una única perla;
45 - cargar las perlas en pocillos, comprendiendo cada pocillo una única perla; y
-
generar una señal de pirofosfato.
En la primera etapa, se ligan adaptadores de secuenciación a fragmentos dentro de la biblioteca de combinación.
50 Dicho adaptador de secuenciación incluye al menos una región “clave” para aparearse a una perla, una región de cebador de secuenciación y una región de cebador de PCR. Por tanto, se obtienen fragmentos ligados a adaptador.
En una etapa adicional, se aparean fragmentos ligados a adaptador con perlas, apareándose cada perla con un único fragmento ligado a adaptador. Al grupo de fragmentos ligados a adaptador, se le añaden perlas en exceso
55 para garantizar el apareamiento de un único fragmento ligado a adaptador por perla para la mayoría de las perlas (distribución de Poisson).
En una etapa posterior, se emulsionan las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una única perla. Están presentes reactivos de PCR en los microrreactores de agua
60 en aceite que permiten que tenga lugar una reacción de PCR dentro de los microrreactores. Posteriormente, se rompen los microrreactores, y se enriquecen las perlas que comprenden ADN (perlas positivas para ADN).
En la siguiente etapa, se cargan las perlas en pocillos, comprendiendo cada pocillo una única perla. Los pocillos son preferiblemente parte de una placa PicoTiter™ que permite la secuenciación simultánea de una gran cantidad de
65 fragmentos.
Tras la adición de perlas que portan enzimas, se determina la secuencia de los fragmentos usando pirosecuenciación. En etapas sucesivas, se someten la placa PicoTiter y las perlas así como las perlas de enzimas en la misma a diferentes desoxirribonucleótidos en presencia de reactivos de secuenciación convencionales, y tras la incorporación de un desoxirribonucleótido se genera una señal luminosa que se registra. La incorporación del nucleótido correcto generará una señal de pirosecuenciación que puede detectarse.
Se conoce por sí misma la pirosecuenciación en la técnica y se describe entre otros en www.biotagebio.com; www.pyrosequencing.com/tab technology. La tecnología se aplica además en por ejemplo los documentos WO 03/004690, WO 03/054142, WO 2004/069849, WO 2004/070005, WO 2004/070007 y WO 2005/003375 (todos a nombre de 454 Corporation).
El examen de alto rendimiento de la etapa k) se realiza preferiblemente mediante inmovilización de las sondas diseñadas en la etapa h) sobre una matriz, seguido por la puesta en contacto de la matriz que comprende las sondas con una biblioteca de prueba en condiciones de hibridación. Preferiblemente, la etapa de puesta en contacto se realiza en condiciones de hibridación rigurosas (véase Kennedy et al. (2003) Nat. Biotech.; publicado en Internet el 7 de septiembre de 2003: 1-5). Un experto en la técnica es consciente de métodos adecuados para la inmovilización de sondas sobre una matriz y de métodos de puesta en contacto en condiciones de hibridación. Se revisa la tecnología típica que es adecuada para este fin en Kennedy et al. (2003) Nat. Biotech.; publicado en Internet el 7 de septiembre de 2003: 1-5.
Una aplicación ventajosa particular se encuentra en la cría de cultivos poliploidales. Secuenciando cultivos poliploidales con una alta cobertura, identificando SNP y los diversos alelos y desarrollando sondas para amplificación específica de alelos, pueden realizarse avances significativos en la cría de cultivos poliploidales.
Como parte de la invención, se ha encontrado que la combinación de generación de subconjuntos seleccionados aleatoriamente usando amplificación selectiva para una pluralidad de muestras y tecnología de secuenciación de alto rendimiento presenta determinados problemas complejos que han de solucionarse para la mejora adicional del método descrito en el presente documento para la identificación eficaz y de alto rendimiento de polimorfismos. Más en detalle, se ha encontrado que cuando se combinan muestras múltiples (es decir, la primera y la segunda o adicionales) en un grupo tras realizar una reducción de la complejidad, se produce el problema de que muchos fragmentos parecen derivarse de dos muestras o, en otras palabras, se identificaron muchos fragmentos que no podían asignarse de manera única a una muestra y por tanto no podían usarse en el procedimiento de identificación de polimorfismos. Esto condujo a una reducción de la fiabilidad del método y a que pudiesen identificarse adecuadamente menos polimorfismos (SNP, indels, SSR).
Tras un análisis cuidadoso y detallado de toda la secuencia de nucleótidos de los fragmentos que no podían asignarse, se encontró que esos fragmentos contenían dos adaptadores que comprendían etiquetas diferentes y se formaron probablemente entre la generación de las muestras de complejidad reducida y el ligamiento de los adaptadores de secuenciación. El fenómeno se representa como un “etiquetado mixto”. El fenómeno representado como “etiquetado mixto”, tal como se usa en el presente documento, se refiere por tanto a fragmentos que contienen una etiqueta que se refiere al fragmento en un lado de la muestra, mientras que el lado opuesto del fragmento contiene una etiqueta que se refiere al fragmento en otra muestra. Por tanto, un fragmento parece derivarse de dos muestras (lo que no es así). Esto conduce a la identificación errónea de polimorfismos y por tanto no es deseable.
Se ha especulado que la formación de fragmentos de heterodúplex entre dos muestras se encuentra detrás de esta anomalía.
La solución a este problema se ha encontrado en un rediseño de la estrategia para la conversión de muestras de las que se reduce la complejidad a fragmentos apareados a perlas que pueden amplificarse antes de la secuenciación de alto rendimiento. En esta realización, se somete cada muestra a reducción de la complejidad y purificación opcional. Después de eso, se hacen romos los extremos de cada muestra (pulido de extremos) seguido por ligamiento del adaptador de secuenciación que puede aparearse con la perla. Se combinan entonces los fragmentos ligados a adaptador de secuenciación y se ligan a las perlas para la polimerización en emulsión y la posterior secuenciación de alto rendimiento.
Como parte adicional de esta invención, se encontró que la formación de concatámeros dificultaba la identificación apropiada de polimorfismos. Los concatámeros se han identificado como fragmentos que se forman tras la reducción de la complejidad de productos “con extremos romos” o “pulidos”, por ejemplo mediante ADN polimerasa de T4, y en lugar de ligar a los adaptadores que permiten el apareamiento a las perlas, se ligan entre sí, creando de ese modo concatámeros, es decir, un concatámero es el resultado de la dimerización de fragmentos con extremos romos.
La solución a este problema se encontró en el uso de determinados adaptadores modificados específicamente. Los fragmentos amplificados obtenidos a partir de la reducción de la complejidad contienen normalmente una proyección 3’-A debido a las características de determinadas polimerasas preferidas que no tienen actividad de corrección de lectura exonucleasa 3’-5’. La presencia de una proyección 3’-A de este tipo es también el motivo por el cual se hacen romos los extremos de los fragmentos antes del ligamiento al adaptador. Proporcionando un adaptador que puede aparearse a una perla, conteniendo el adaptador una proyección 3’-T, se encontró que tanto el problema de las “etiquetas mixtas” como el de los concatámeros pueden solucionarse en una etapa. Una ventaja adicional del uso de estos adaptadores modificados es que la etapa de “hacer romos los extremos” convencional y la etapa de fosforilación posterior pueden omitirse.
5 Por tanto, en una realización preferida adicional, tras la etapa de reducción de la complejidad de cada muestra, se realiza una etapa sobre los fragmentos de restricción ligados a adaptador amplificados obtenidos a partir de la etapa de reducción de la complejidad, mediante la cual se ligan a estos fragmentos adaptadores de secuenciación, adaptadores de secuenciación que contienen una proyección 3’-T y que pueden aparearse con las perlas.
10 Se ha encontrado además que, cuando los cebadores usados en la etapa de reducción de la complejidad están fosforilados, la etapa de pulido de extremos (obtención de extremos romos) y la fosforilación intermedia antes del ligamiento pueden evitarse.
15 Por tanto, en una realización sumamente preferida de la invención, la invención se refiere a un método para identificar uno más polimorfismos, comprendiendo dicho método las etapas de:
a) proporcionar una pluralidad de muestras de ácido nucleico de interés;
20 b) realizar una reducción de la complejidad sobre cada una de las muestras para proporcionar una pluralidad de bibliotecas de las muestras de ácido nucleico, en el que la reducción de la complejidad se realiza
-
digiriendo cada muestra de ácido nucleico con al menos una endonucleasa de restricción para fragmentarlo en
fragmentos de restricción; 25
-
ligando los fragmentos de restricción obtenidos con al menos un adaptador oligonucleotídico sintético, bicatenario que tiene un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados a adaptador;
30 - poniendo en contacto dichos fragmentos de restricción ligados a adaptador con uno o más cebadores oligonucleotídicos fosforilados en condiciones de hibridación; y
-
amplificando dichos fragmentos de restricción ligados a adaptador mediante el alargamiento del uno o más cebadores oligonucleotídicos, en el que al menos uno del uno o más cebadores oligonucleotídicos incluye una 35 secuencia de nucleótidos que tiene la misma secuencia de nucleótidos que las partes terminales de las hebras en los extremos de dichos fragmentos de restricción ligados a adaptador, incluyendo los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción e incluyendo al menos parte de los nucleótidos presentes en los adaptadores, en los que, opcionalmente, al menos uno de dichos cebadores incluye en su extremo 3’ una secuencia seleccionada que comprende al menos un nucleótido ubicado inmediatamente
40 adyacente a los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción y en los que el adaptador y/o el cebador contienen una etiqueta;
c) combinar dichas bibliotecas con una biblioteca combinada;
45 d) ligar adaptadores de secuenciación que pueden aparearse a perlas a los fragmentos con extremos ocupados por adaptador amplificados en la biblioteca combinada, usando un adaptador de secuenciación que porta una proyección 3’-T y sometiendo los fragmentos apareados a polimerización en emulsión;
e) secuenciar al menos una parte de la biblioteca combinada; 50 f) alinear las secuencias de cada muestra obtenida en la etapa e);
g) determinar uno o más polimorfismos entre la pluralidad de muestras de ácido nucleico en la alineación de la etapa f); 55 h) usar el uno o más polimorfismos determinados en la etapa g) para diseñar sondas de detección;
i) proporcionar un ácido nucleico de muestra de prueba de interés;
60 j) realizar la reducción de la complejidad de la etapa b) sobre el ácido nucleico de muestra de prueba de interés para proporcionar una biblioteca de prueba del ácido nucleico de muestra de prueba;
k) someter la biblioteca de prueba a examen de alto rendimiento para identificar la presencia, ausencia o cantidad de los polimorfismos determinados en la etapa g) usando las sondas de detección diseñadas en la etapa h). 65
Breve descripción de los dibujos
La figura 1A muestra un fragmento según la presente invención apareado sobre una perla (“perla 454”) y la secuencia de cebador usado para la amplificación previa de las dos líneas de pimiento. “Fragmento de ADN” indica el fragmento obtenido tras la digestión con una endonucleasa de restricción, “adaptador génico clave” indica un adaptador que proporciona un sitio de apareamiento para los cebadores oligonucleotídicos (fosforilados) usados para generar una biblioteca, “KRS” indica una secuencia identificadora (etiqueta), “adaptador de SEQ. de 454” indica un adaptador de secuenciación y “adaptador de PCR de 454” indica un adaptador para permitir la amplificación en emulsión del fragmento de ADN. El adaptador de PCR permite el apareamiento de la perla y la amplificación y puede contener una proyección 3’-T.
La figura 1B muestra un cebador esquemático usado en la etapa de reducción de la complejidad. Un cebador de este tipo comprende generalmente una región de sitio de reconocimiento indicada como (2), una región constante que puede incluir una sección de etiqueta indicada como (1) y uno o más nucleótidos selectivos en una región selectiva indicada como (3) en el extremo 3’ del mismo).
La figura 2 muestra una estimación de la concentración de ADN usando electroforesis en gel de agarosa al 2%. S1 indica PSP11; S2 indica PI201234. 50, 100, 250 y 500 ng indican respectivamente 50 ng, 100 ng, 250 ng y 500 ng para estimar las cantidades de ADN de S1 y S2. Las figuras 2C y 2D muestran la determinación de la concentración de ADN usando espectrofotometría Nanodrop.
La figura 3 muestra los resultados de evaluaciones de la calidad intermedias del ejemplo 3.
La figura 4 muestra diagramas de flujo del sistema de procesamiento de datos de secuencia, es decir, las etapas tomadas desde la generación de los datos de secuenciación hasta la identificación de los supuestos SNP, SSR e indels, mediante las etapas de la eliminación de información de secuencias conocidas en el recorte y etiquetado que dan como resultado datos de secuencias recortadas que se agrupan y ensamblan para producir cóntigos y singletons (fragmentos que no pueden ensamblarse en un cóntigo) tras lo cual pueden identificarse y evaluarse supuestos polimorfismos. La figura 4B explica en mayor detalle el proceso de prospección de polimorfismos
La figura 5 aborda el problema de las etiquetas mixtas y proporciona en el panel 1 un ejemplo de una etiqueta mixta, que porta etiquetas asociadas con la muestra 1 (MS1) y la muestra 2 (MS2). El panel 2 proporciona una explicación esquemática del fenómeno. Se ligan fragmentos de restricción AFLP derivados de la muestra 1 (S1) y de la muestra 2 (S2) con adaptadores (“adaptador de Keygene”) en ambos lados que portan etiquetas específicas de muestras S1 y S2. Tras la amplificación y secuenciación, los fragmentos esperados e son aquéllos con las etiquetas S1-S1 y las etiquetas S2-S2. Lo que se observa adicional e inesperadamente son también fragmentos que portan etiquetas S1-S2 o S2-S1. El panel 3 explica la causa planteada como hipótesis de la generación de etiquetas mixtas por lo cual se forman productos de heterodúplex a partir de fragmentos de las muestras 1 y 2. Posteriormente, los heterodúplex se liberan, debido a la actividad exonucleasa 3’-5’ de la ADN polimerasa de T4 o Klenow, de los extremos sobresalientes en 3’. Durante la polimerización, se rellenan los huecos con nucleótidos y se introduce la etiqueta incorrecta. Esto funciona para heterodúplex de aproximadamente la misma longitud (panel superior) pero también para heterodúplex de longitud más variable. El panel 4 proporciona a la derecha el protocolo convencional que conduce a la formación de etiquetas mixtas y a la derecha el protocolo modificado.
La figura 6 aborda el problema de la formación de concatámeros, por lo cual en el panel 1 se proporciona un ejemplo típico de un concatámero, por lo cual las diversas secciones de etiqueta y adaptador están subrayadas y con su origen (es decir, MS1, MS2, ES1 y ES2 correspondientes respectivamente a un adaptador-sitio de restricción MseI de la muestra 1, adaptador-sitio de restricción MseI de la muestra 2, adaptador sitio de restricción EcoRI de la muestra 1, adaptador-sitio de restricción EcoRI de la muestra 2). El panel 2 demuestra los fragmentos esperados que portan etiquetas S1-S1 y etiquetas S2-S2 y los observados pero inesperados S1-S1-S2-S2, que son un concatámero de fragmentos de la muestra 1 y de la muestra 2. Solución del panel 3 para evitar la generación de concatámeros así como etiquetas mixtas introduciendo una proyección en los adaptadores AFLP, adaptadores de secuenciación modificados y la omisión de la etapa de pulido de extremos cuando se ligan adaptadores de secuenciación. No se encuentra formación de concatámeros porque los fragmentos AFLP no pueden ligarse entre sí y no se producen fragmentos mixtos ya que se omite la etapa de pulido de extremos. El panel 4 proporciona el protocolo modificado usando adaptadores modificados para evitar la formación de concatámeros así como etiquetas mixtas.
Figura 7. Alineación múltiple “10037 C1a989contig2” de secuencias de fragmentos AFLP de pimiento, que contienen un supuesto polimorfismo de nucleótido único (SNP). Obsérvese que el SNP (indicado mediante la flecha negra) está definido por un alelo A presente en ambas lecturas de la muestra 1 (PSP11), indicado por la presencia de la etiqueta MS1 en el nombre de las dos lecturas superiores, y un alelo G presente en la muestra 2 (PI201234), indicado por la presencia de la etiqueta MS2 en el nombre de las dos lecturas inferiores. Los nombres de las lecturas se muestras a la izquierda. La secuencia consenso de esta alineación múltiple es (5’- 3’):
Figura 8A. Representación esquemática de la estrategia de enriquecimiento para seleccionar como diana repeticiones de secuencias simples (SSR) en combinación con secuenciación de alto rendimiento para el 5 descubrimiento de SSR de novo SSR.
Figura 8B: Validación de un SNP G/A en pimiento usando detección SNPWave. P1 = PSP11; P2 = PI201234. Se indican ocho descendientes RIL mediante los números 1-8.
10 Ejemplos
Ejemplo 1
Se generó una mezcla de ligamiento por restricción con EcoRI/MseI (1) a partir de ADN genómico de las líneas de
15 pimiento PSP-11 y PI20234. Se diluyó 10 veces la mezcla de ligamiento por restricción y se preamplificaron 5 microlitros de cada muestra (2) con los cebadores EcoRI +1(A) y MseI +1(C) (conjunto I). Tras la amplificación, se comprobó la calidad del producto de preamplificación de las dos muestras de pimiento en un gel de agarosa al 1%. Se diluyeron 20 veces los productos de preamplificación, seguido por una preamplificación de KRSEcoRI +1(A) y KRSMseI +2(CA) AFLP. Las secciones KRS (identificador) están subrayadas y los nucleótidos selectivos están en
20 negrita en el extremo 3’ en la secuencia de cebador SEQ ID 1-4 a continuación. Tras la amplificación, se comprobó la calidad del producto de preamplificación de las dos muestras de pimiento en un gel de agarosa al 1% y mediante la huella de EcoRI +3(A) y MseI +3(C) (3) AFLP (4). Se purificaron por separado los productos de preamplificación de las dos líneas de pimiento en una columna QiagenPCR (5). Se midió la concentración de las muestras en el instrumento nanodrop. Se mezclaron y secuenciaron un total de 5006,4 ng de PSP-11 y 5006,4 ng de PI20234.
25 Conjunto I de cebadores usado para la preamplificación de PSP-11
E01LKRS1 5’-CGTCAGACTGCGTACCAATTCA-3’ [SEQ ID 1]
30 M15FCRRS1 5’-TGGTGATGAGTCCTGAGTAACA-3’ [SEQ ID 2]
Conjunto II de cebadores usado para la preamplificación de PI20234
E01LKRS2 5’-CAAGAGACTGCGTACCAATTCA-3’ [SEQ ID 3]
35 M15KKRS2 5’-AGCCGATGAGTCCTGAGTAACA-3’ [SEQ ID 4]
(1) Mezcla de ligamiento por restricción con EcoRI/MseI
40 Mezcla de restricción (40 ul/muestra)
Incubación durante 1 h a 37ºC 45 Adición de: Mezcla de ligamiento (10 μl/muestra)
ADN 6 μl (±6300 ng) ECoRI (5U) 0,1 μl MseI (2U) 0,05 μl
5xRL 8 μl MQ 25,85 μl
Total 40 μl
ATP 10 mM ADN ligasa de T4 adapt. ECoRI (5 pmol/μl) adapt. MseI (50 pmol/μl) 5xRL MQ Total 1 μl 1 μl 1 μl 1 μl 2 μl 4 μl 10 μl Incubación durante 3 h a 37ºC
Adaptador EcoRI
5 91M35/91M36: *-CTCGTAGACTGCGTACC :91M35 [SEQ ID 5] ± bio CATCTGACGCATGGTTAA :91M36 [SEQ ID 6]
Adaptador MseI
92A18/92A19: 5-GACGATGAGTCCTGAG-3 :92A18 [SEQ ID 7J 3-TACTCAGGACTCAT-5 :92A19 [SEQ ID 8J
10 (2) Preamplificación
Preamplificación (A/C):
Mezcla RL (10x) 5 μl EcoRI-pr E01L(50 ng/ul) 0,6 μl MseI-pr M02K(50 ng/ul) 0,6 μl dNTP (25 mM) 0,16 μl Taq.pol.(5U) 0,08 μl
10XPCR 2,0 μl MQ 11,56 μl Total 20 ml/reacción
15 Perfil térmico de la preamplificación
Se realizó una preamplificación selectiva en un volumen de reacción de 50 μl. Se realizó la PCR en un instrumento PE GeneAmp PCR System 9700 y se inició un perfil de 20 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido por una etapa de apareamiento de 56ºC durante 60 segundos y una etapa de
20 extensión de 72ºC durante 60 segundos.
EcoRI +1(A)1 E01 L 92R11: 5-AGACTGCGTACCAATTCA-3 [SEQ ID 9] MseI +1(C)1
M02k 93E42: 5-GATGAGTCCTGAGTAAC-3 [SEQ ID 10]
Preamplificación A/CA:
PA+1/+1-mix (20x): 5 μl EcoRI-pr: 1,5 μl MseI-pr.: 1,5 μl dNTP (25 mM) : 0,4 μl Taq.pol. (5 U): 0,2 μl
10XPCR : 5 μl MQ: 36,3 μl Total: 50 μl
25 Se realizó la preamplificación selectiva en un volumen de reacción de 50 μl. Se realizó la PCR en un instrumento PE GeneAmp PCR System 9700 y se inició un perfil de 30 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido por una etapa de apareamiento de 56ºC durante 60 segundos y una etapa de extensión de 72ºC durante 60 segundos.
(3) KRSEcoRI +1(A) y RRSMseI +2 (CA) 2
05F212 E01LKRS1 CGTCAGACTGCGTACCAATTCA -3’ [SEQ ID 11] 05F213 E01LKRS2 CAAGAGACTGCGTACCAATTCA -3’ [SEQ ID 12]
05F214 M15KKRS1 TGGTGATGAGTCCTGAGTAACA -3’ [SEQ ID 13] 05F215 M15KKRS2 AGCCGATGAGTCCTGAGTAACA -3’ [SEQ ID 14] 5
nucleótidos selectivos en negrita y etiquetas (KRS) subrayadas Muestra PSP11: E07.LKRS1/M15KKRS1 Muestra PI120234: E01LKRS2/M15KKRS2
(4) Protocolo de AFLP
Se realizó la amplificación selectiva en un volumen de reacción de 20 μl. Se realizó la PCR en un instrumento PE GeneAmp PCR System 9700. Se inició un perfil de 13 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido por una etapa de apareamiento de 65ºC durante 30 segundos, con una fase de descenso en la que la temperatura de apareamiento se disminuyó 0,7ºC en cada ciclo, y una etapa de extensión de 72ºC durante 60 segundos. A este perfil le siguió un perfil de 23 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido por una etapa de apareamiento de 56ºC durante 30 segundos y una etapa de extensión de 72ºC durante 60 segundos.
EcoRI +3(AAC) y Msel +(CAG) E32 92SO2: 5-GACTGCGTACCAATTCACC-3 [SEQ ID 15]
M49 92G23: 5-GATGAGTCCTGAGTAACAG-3 [SEQ ID 16]
(5) Columna Qiagen
Se realizó la purificación Qiagen según las instrucciones del fabricante: manual de QIAquick® Spin (http://wwwl.qiagen.com/literature/handbooks/PDF/DNACleanupAndConcentration/QQ Spin/1021422 HBQQSpin 072002WW.pdf)
Ejemplo 2: PIMIENTO
Se usó ADN de las líneas de pimiento PSP-11 y PI20234 para generar producto de AFLP mediante el uso de cebadores específicos de sitios de reconocimiento Keygene de AFLP. (Estos cebadores de AFLP son esencialmente iguales a cebadores de AFLP convencionales, por ejemplo descritos en el documento EP 0 534 858, y contendrán generalmente una región de sitio de reconocimiento, una región constante y uno o más nucleótidos selectivos en una región selectiva. A partir de las líneas de pimiento PSP-11 o PI20234, se digirieron 150 ng de ADN con las endonucleasas de restricción EcoRI (5 U/reacción) y MseI (2 U/reacción) durante 1 hora a 37ºC seguido por inactivación durante 10 minutos a 80ºC. Se ligaron los fragmentos de restricción obtenidos con adaptador oligonucleotídico sintético bicatenario, un extremo del cual es compatible con uno o ambos de los extremos de los fragmentos de restricción de EcoRI y/o MseI. Se realizaron reacciones de preamplificación de AFLP (20 μl/reacción) con cebadores de AFLP +1/+1 sobre una mezcla de ligamiento por restricción diluida 10 veces. Perfil de PCR: 20*(30 s a 94ºC + 60 s a 56ºC + 120 s a 72ºC). Se realizaron reacciones de AFLP adicionales (50 μl/reacción) con diferentes cebadores específicos de sitios de reconocimiento Keygene de AFLP +1 EcoRI y +2 MseI (tabla a continuación, las etiquetas están en negrita, los nucleótidos selectivos están subrayados) sobre un producto de preamplificación de AFLP +1/+1 EcoRI/MseI diluido 20 veces. Perfil de PCR: 30*(30 s a 94ºC + 60 s a 56ºC + 120 s a 72ºC). Se purificó el producto de AFLP usando el kit de purificación de PCR QIAquick (QIAGEN) siguiendo el manual de QIAquick® Spin 07/2002 página 18 y se midió la concentración con un espectrofotómetro NanoDrop® ND-1000. Se reunió un total de 5 μg de producto de AFLP +1/+2 PSP-11 y 5 μg de producto de AFLP +1/+2 PI20234 AFLP y se solubilizó en 23,3 μl de TE. Finalmente, se obtuvo una mezcla con una concentración de producto de AFLP +1/+2 de 430 ng/μl.
Tabla
SEQ ID
Cebador de PCR Cebador-3’ Pimiento Reacción de AFLP
[SEQ ID 17]
05F21 CGTCAGACTGCGTACCAATTCA PSP- 1
[SEQ ID 18]
05F21 TGGTGATGAGTCCTGAGTAACA PSP- 1
[SEQ ID 19]
05F21 CAAGAGACTGCGTACCAATTCA PI2023 2
[SEQ ID 20]
05F21 AGCCGATGAGTCCTGAGTAACA PI2023 2
Ejemplo 3: Maíz
Se usó ADN de las líneas de maíz B73 y M017 para generar producto de AFLP mediante el uso de cebadores específicos de sitios de reconocimiento Keygene de AFLP. (Estos cebadores de AFLP son esencialmente iguales a cebadores de AFLP convencionales, por ejemplo descritos en el documento EP 0 534 858, y contendrán generalmente una región de sitio de reconocimiento, una región constante y uno o más nucleótidos selectivos en el extremo 3’ de los mismos).
Se digirió ADN las líneas de pimiento B73 o M017 con las endonucleasas de restricción TaqI (5 U/reacción) durante 1 hora a 65ºC y MseI (2 U/reacción) durante 1 hora a 37ºC seguido por inactivación durante 10 minutos a 80ºC. Se ligaron los fragmentos de restricción obtenidos con adaptador oligonucleotídico sintético bicatenario, un extremo del cual es compatible con uno o ambos de los extremos de los fragmentos de restricción de TaqI y/o MseI. 5 Se realizaron reacciones de preamplificación de AFLP (20 μl/reacción) con cebadores de AFLP +1/+1 sobre una mezcla de ligamiento por restricción diluida 10 veces. Perfil de PCR: 20*(30 s a 94ºC + 60 s a 56ºC + 120 s a 72ºC). Se realizaron reacciones de AFLP adicionales (50 μl/reacción) con diferentes cebadores de sitios de reconocimiento Keygene de AFLP +2 TaqI y MseI (tabla a continuación, las etiquetas están en negrita, los nucleótidos selectivos 10 están subrayados) sobre un producto de preamplificación de AFLP +1/+1 TaqI/MseI diluido 20 veces. Perfil de PCR: 30*(30 s a 94ºC + 60 s a 56ºC + 120 s a 72ºC). Se purificó el producto de AFLP usando el kit de purificación de PCR QIAquick (QIAGEN) siguiendo el manual de QIAquick® Spin 07/2002 página 18 y se midió la concentración con un espectrofotómetro NanoDrop® ND-1000. Se reunió un total de 1,25 μg de cada producto de AFLP B73 +2/+2 diferente y 1,25 μg de cada producto de AFLP M017 +2/+2 diferente y se solubilizó en 30 μl de TE. Finalmente, se 15 obtuvo una mezcla con una concentración de producto de AFLP +2/+2 de 333 ng/μl.
Tabla
SEQ ID
Cebador de PCR Secuencia de cebador Maíz Reacción de AFLP
[SEQ ID 21]
05G360 ACGTGTAGACTGCGTACCGAAA B73 1
[SEQ ID 22]
05G368 ACGTGATGAGTCCTGAGTAACA B73 1
[SEQ ID 23]
05G362 CGTAGTAGACTGCGTACCGAAC B73 2
[SEQ ID 24]
05G370 CGTAGATGAGTCCTGAGTAACA B73 2
[SEQ ID 25]
05G364 GTACGTAGACTGCGTACCGAAG B73 3
[SEQ ID 26]
05G372 GTACGATGAGTCCTGAGTAACA B73 3
[SEQ ID 27]
05G366 TACGGTAGACTGCGTACCGAAT B73 4
[SEQ ID 28]
05G374 TACGGATGAGTCCTGAGTAACA B73 4
[SEQ ID.29]
05G361 AGTCGTAGACTGCGTACCGAAA M017 5
[SEQ ID 30]
05G369 AGTCGATGAGTCCTGAGTAACA M017 5
[SEQ ID 31]
05G363 CATGGTAGACTGCGTACCGAAC M017 6
[SEQ ID 32]
05G371 CATGGATGAGTCCTGAGTAACA M017 6
[SEQ ID 33]
05G365 GAGCGTAGACTGCGTACCGAAG M017 7
[SEQ ID 34]
05G373 GAGCGATGAGTCCTGAGTAACA M017 7
[SEQ ID 35]
05G367 TGATGTAGACTGCGTACCGAAT M017 8
[SEQ ID 36]
05G375 TGATGATGAGTCCTGAGTAACA M017 8
Finalmente, se agruparon las 4 muestras P1 y las 4 muestras P2 y se concentraron. Se obtuvo una cantidad total de 20 25 μl de producto de ADN y una concentración final de 400 ng/ul (total de 10 μg). Se proporcionan evaluaciones de la calidad intermedias en la figura 3.
SECUENCIACIÓN POR 454
25 Se procesaron muestras de fragmentos de AFLP de pimiento y maíz preparadas tal como se describió anteriormente por 454 Life Sciences tal como se describe (Margulies et al., 2005. Genome sequencing in microfabricated highdensity picolitre reactors. Nature 437 (7057):376-80. Epub 31 de julio de 2005).
PROCESAMIENTO DE DATOS
Sistema de procesamiento: Datos de entrada:
35 Se recibieron datos de secuencias sin procesar para cada ronda:
-
200.000 – 400.000 lecturas -puntuaciones de calidad de la lectura automática de bases
Recorte y etiquetado
5 Se analizaron estos datos de secuencias para detectar la presencia de sitios de reconocimiento Keygene (KRS) al comienzo y al final de la lectura. Estas secuencias de KRS consisten tanto en una secuencia de adaptador de AFLP como en una secuencia de marcador de muestra y son específicas para una determinada combinación de cebadores de AFLP en una determinada muestra. Las secuencias de KRS se identifican mediante BLAST y se
10 recortan y se restauran los sitios de restricción. Las lecturas se marcan con una etiqueta para la identificación del origen del KRS. Se seleccionan secuencias recortadas según su longitud (mínimo de 33 nt) para que participen en el procesamiento adicional.
Agrupación y ensamblaje
15 Se realiza un análisis MegaBlast sobre todas las lecturas recortadas, seleccionadas por tamaño para obtener agrupaciones de secuencias homólogas. Consecutivamente, se ensamblan todas las agrupaciones con CAP3 para dar como resultado cóntigos ensamblados. A partir de ambas etapas, se identifican lecturas de secuencias únicas que no coinciden con ninguna otra lectura. Estas lecturas se marcan como singletons.
20 El sistema de procesamiento que lleva a cabo las etapas descritas en el presente documento anteriormente se muestra en la figura 4A
Prospección de polimorfismos y evaluación de la calidad
25 Los cóntigos resultantes del análisis de ensamblaje forman la base de la detección de polimorfismos. Cada “apareamiento erróneo” en la alineación de cada agrupación es un posible polimorfismo. Se definen criterios de selección para obtener una puntuación de calidad:
30 - número de lecturas por cóntigo
-
frecuencia de “alelos” por muestra
-
aparición de secuencia de homopolímero 35
-
aparición de polimorfismos vecinos
Se identifican SNP e indels con una puntuación de calidad por encima del umbral como supuestos polimorfismos. Para la prospección de SSR, se usa la herramienta MISA (identificación de MIcroSatélites) (http://pgrc.ipk40 gatersleben.de/misa). Esta herramienta identifica di, tri, tetranucleótidos y motivos SSR de compuestos con criterios predefinidos y resume las apariciones de estas SSR.
La prospección de polimorfismos y el procedimiento de asignación de calidad se muestran en la figura 4B.
45 Resultados
La tabla a continuación resume los resultados del análisis combinado de secuencias obtenidas a partir de 2 rondas de secuenciación de 454 para las muestras de pimiento combinadas y 2 rondas para las muestras de maíz combinadas.
50 Ejemplo 4. Descubrimiento de polimorfismos de nucleótido único (SNP) en pimiento.
Pimiento
Maíz
Número total de lecturas
457178 492145
Número de lecturas recortadas
399623 411008
Número de singletons
105253 313280
Número de cóntigos
31863 14588
Número de lecturas en cóntigos
294370 97728
Número total de secuencias que contienen SSR
611 202
Número de secuencias que contienen SSR diferentes
104 65
Número de motivos SSR diferentes (di, tri, tetra y compuesto)
49 40
Número de SNP con puntuación Q � 0,3 *
1636 782
Número de indels *
4090 943
* ambos con selección frente a SNP vecinos, secuencia flanqueante de al menos 12 pb y sin producirse en secuencias de homopolímeros mayores de 3 nucleótidos.
Aislamiento de ADN
5 Se aisló ADN genómico a partir de las dos líneas originales de una población consanguínea recombinante (RIL) de pimiento y 10 progenies RIL. Las líneas originales son PSP11 y PI201234. Se aisló ADN genómico de material de hoja de plántulas individuales usando un procedimiento CTAB modificado descrito por Stuart y Via (Stuart, C.N., Jr y Via, L.E. (1993) A rapid CTAB ADN isolation technique useful for RAPD fingeprinting and other PCR applications.
10 Biotechniques, 14, 748-750). Se diluyeron las muestras de ADN hasta una concentración de 100 ng/μl en TE (Tris-HCl 10 mM pH 8,0, EDTA 1 mM) y se almacenaron a -20ºC.
Preparación de moldes de AFLP usando cebadores de AFLP etiquetados
15 Se prepararon moldes de AFLP de las líneas originales de pimiento PSP11 y PI201234 usando la combinación de endonucleasas de restricción EcoRI/MseI tal como se describe por Zabeau & Vos, 1993: Selective restriction fragment amplification; a general method for ADN fingerprinting. Documento EP 0534858-Al, B1; patente estadounidense 6045994) y Vos et al (Vos, P., Hogers, R., Bleeker, M., Reijans, M., van de Lee, T., Hornes, M., Frijters, A., Pot, J., Peleman, J., Kuiper, M. et al. (1995) AFLP: a new technique for ADN fingerprinting. Nucl. Acids
20 Res., 21, 4407-4414).
Específicamente, se llevó a cabo la restricción de ADN genómico con EcoRI y MseI tal como sigue:
Restricción del ADN
ADN 100-500 ng EcoRI 5 unidades MseI 2 unidades tampón 5xRL 8 μl
Agua MilliQ hasta 40 μl
La incubación fue durante 1 hora a 37ºC. Tras la restricción con enzimas, se inactivaron las enzimas mediante 30 incubación durante 10 minutos a 80ºC.
Ligamiento de adaptadores
ATP 10 mM 1 μl ADN ligasa de T4 1 μl adaptador EcoRI (5 pmol/μl) 1 μl adaptador MseI (50 pmol/μl) 1 μl tampón 5xRL. 2 μl
35 Agua MilliQ hasta 40 μl.
La incubación fue durante 3 horas a 37ºC.
Amplificación AFLP selectiva
40 Tras la restricción-ligamiento, se diluyó la reacción de restricción/ligamiento 10 veces con T10E0,1 y se usaron 5 μl de mezcla diluida como molde en una etapa de amplificación selectiva. Obsérvese que puesto que se pretendía una amplificación selectiva +1/+2, se realizó en primer lugar una etapa de preamplificación selectiva +1/+1 (con cebadores de AFLP convencionales). Las condiciones de reacción de la amplificación +1/+1 (+A/+C) fueron las
45 siguientes.
Mezcla de restricción-ligamiento (diluida 10 veces) 5 μl Cebador EcoRI +1 (50 ng/μl): 0,6 μl
cebador MseI +1 (50 ng/μl) 0,6 μl dNTP (20mM) 0,2 μl Taq polimerasa (5 U/μl Amplitaq, PE) 0,08 μl Tampón de PCR 10X 2,0 μl Agua MilliQ hasta 20 μl
Las secuencias de los cebadores eran:
EcoRI+1: 5’-AGACTGCGTACCAATTCA-3’ [SEQ ID 9] y 5 MseI+1: 5’-GATGAGTCCTGAGTAAC-3’[SEQ ID 10]
Se realizaron las amplificaciones por PCR usando un instrumento PE9700 con un bloque de oro o plata usando las siguientes condiciones: 20 veces (30 s a 94ºC, 60 s a 56ºC y 120 s a 72ºC).
10 Se comprobó la calidad de los productos de preamplificación +1/+1 generados en un gel de agarosa al 1% usando un marcador de tamaño molecular de 100 pares de bases y un marcador de tamaño molecular de 1 Kb para comprobar la distribución de longitud de fragmentos. Tras la amplificación selectiva +1/+1, se diluyó la reacción 20 veces con T10E0,1 y se usaron 5 μl de mezcla diluida como molde en la etapa de amplificación selectiva +1/+2
15 usando cebadores de AFLP etiquetados.
Finalmente, se realizaron amplificaciones AFLP selectivas +1/+2 (A/+CA):
Producto de amplificación selectiva +1/+1 (diluido 20 veces) 5,0 pl Cebador KRS EcoRI +A (50 ng/μl) 1,5 μl Cebador KRS MseI + CA (50 ng/μl) 1,5 μl dNTP (20 mM) 0,5 μl Taq polimerasa (5U/μl Amplitaq, Perkin Elmer) 0,2 μl Tampón de PCR 10X 5,0 μl MQ hasta 50 μl
20 Las secuencias de los cebadores de AFLP etiquetados eran:
PSP11:
O5F212: EcoRI+1: 5’-CGTCAGACTGCGTACCAATTCA-3’ [SEQ ID 1] y 25 O5F214: MseI+2: 5’-TGGTGATGAGTCCTGAGTAACA-3’ [SEQ ID 2]
PI201234:
30 05F213: EcoRI+1: 5’-CAAGAGACTGCGTACCAATTCA-3’ [SEQ ID 3] y
05F215: MseI+1: 5’-AGCCGATGAGTCCTGAGTAACA-3’ [SEQ ID 4]
Obsérvese que estos cebadores contienen etiquetas de 4 pb (subrayadas anteriormente) en sus extremos 5 prima 35 para distinguir los productos de amplificación que se originan a partir de las respectivas líneas de pimiento al final del procedimiento de secuenciación.
Representación esquemática de productos de amplificación AFLP +1/+2 de pimiento tras la amplificación con cebadores de AFLP que contienen secuencias de etiqueta en 5 prima de 4 pb. 40 Etiqueta EcoRI Etiqueta MseI PSP 11:
5’-CGTC ACCA-3’ 3’_GCAG TGGT-5’ PI201234 5’-CAAG GGCT-3’ 3’-GTTC CCGA-5’
Se realizaron las amplificaciones por PCR (24 por muestra) usando un instrumento PE9700 con un bloque de oro o plata usando las siguientes condiciones: 30 veces (30 s a 94 ºC + 60 s a 56 ºC + 120 s a 72ºC).
45 Se comprobó la calidad de los productos de amplificación generados en un gel de agarosa al 1% usando un marcador de tamaño molecular de 100 pares de bases y un marcador de tamaño molecular de 1 Kb para comprobar la distribución de longitud de fragmentos.
Purificación y cuantificación de la reacción de AFLP
5 Tras agrupar dos reacciones de AFLP selectivas +1/+2 de 50 microlitros por muestra de pimiento, se purificaron los 12 productos de reacción de AFLP de 100 μl resultantes usando el kit de purificación de PCR QIAquick (QIAGEN), siguiendo el manual QIAquick® Spin (página 18). En cada columna, se cargó un máximo de 100 μl de producto. Se eluyeron los productos amplificados en T10E0,1. Se comprobó la calidad de los productos purificados en un gel de agarosa al 1% y se midieron las concentraciones en el instrumento Nanodrop (figura 2).
10 Se usaron las mediciones de la concentración con Nanodrop para ajustar la concentración final de cada producto de PCR purificado a 300 nanogramos por microlitro. Se mezclaron cinco microgramos de producto amplificado purificado de PSP11 y 5 microgramos de PI201234 para generar 10 microgramos de material de molde para la preparación de la biblioteca de secuencias de 454.
15 Preparación de la biblioteca de secuencias y secuenciación de alto rendimiento
Se sometieron productos de amplificación mezclados de ambas líneas de pimiento a secuenciación de alto rendimiento usando la tecnología de secuenciación de 454 Life Sciences tal como se describe por Margulies et al., 20 (Margulies et al., Nature 437, págs. 376-380 y suplementos en Internet). Específicamente, en primer lugar se pulieron los extremos de los productos de PCR de AFLP y posteriormente se ligaron a adaptadores para facilitar la amplificación por PCR en emulsión y la secuenciación de fragmentos posterior tal como se describe por Margulies y colaboradores. Las secuencias de adaptadores de 454, los cebadores de PCR en emulsión, la secuencia-cebadores y las condiciones de rondas de secuenciación se describen todos por Margulies y colaboradores. El orden lineal de
25 elementos funcionales en un fragmento de PCR en emulsión amplificado en perlas de Sepharose en el procedimiento de secuenciación de 454 fue tal como sigue tal como se muestra a modo de ejemplo en la figura 1A:
Adaptador de PCR de 454 – adaptador de secuencia de 454 – etiqueta 1 de cebador de AFLP de 4 pb – secuencia 1 de cebador de AFLP incluyendo nucleótido(s) selectivo(s) – secuencia interna de fragmento de AFLP – secuencia 2 30 de cebador de AFLP incluyendo nucleótido(s) selectivo(s), etiqueta 2 de cebadores de AFLP de 4 pb – adaptador de secuencia de 454 – adaptador de PCR de 454 – perla de Sepharose
Se realizaron dos rondas de secuenciación de 454 de alto rendimiento por 454 Life Sciences (Branford, CT; Estados Unidos de América). 35 Procesamiento de datos de secuenciación de 454.
Se procesaron datos de secuencias que resultan de 2 rondas de secuenciación de 454 usando un sistema bioinformático (Keygene N.V.). Específicamente, se convirtieron lecturas de secuencias con lectura automática de 40 bases 454 sin procesar en formato FASTA y se inspeccionaron para determinar la presencia de secuencias de adaptadores de AFLP etiquetados usando un algoritmo BLAST. Con coincidencias de alta confianza con las secuencias de cebadores de AFLP etiquetados conocidos, se recortaron las secuencias, se restauraron los sitios de endonucleasas de restricción y se asignaron las etiquetas apropiadas (muestra 1 EcoRI (ES1), muestra 1 MseI (MS1), muestra 2 EcoRI (ES2) o muestra 2 MseI (MQ2), respectivamente). A continuación, se agruparon todas las 45 secuencias recortadas mayores de 33 bases usando un procedimiento megaBLAST basándose en homologías de secuencia global. A continuación, se ensamblaron agrupaciones en uno o más cóntigos y/o singletons por agrupación, usando un algoritmo de alineación múltiple CAP3. Se inspeccionaron cóntigos que contenían más de una secuencia para detectar los apareamientos erróneos de secuencias, que representan supuestos polimorfismos. Se asignaron a los apareamientos erróneos de secuencias puntuaciones de calidad basándose en los siguientes
50 criterios:
*
los números de lecturas en un cóntigo
*
la distribución de alelos observada
55 Los dos criterios anteriores forman la base para la denominada puntuación Q asignada a cada supuesto SNP/indel. Las puntuaciones Q oscilan entre 0 y 1; una puntuación Q de 0,3 sólo puede alcanzarse en el caso de que ambos alelos se observen al menos dos veces.
*
ubicación en homopolímeros de una determinada longitud (ajustable; parámetro por defecto para evitar 60 polimorfismos ubicados en homopolímeros de 3 bases o mayores).
* número de cóntigos en la agrupación.
*
distancia hasta los apareamientos erróneos de secuencias vecinas más cercanos (ajustable; importante para 65 determinados tipos de ensayos de genotipado que estudian con sonda secuencias flanqueantes).
* el nivel de asociación de alelos observados con la muestra 1 o la muestra 2; en el caso de una asociación perfecta, constante entre los alelos de un supuesto polimorfismo y las muestras 1 y 2, el polimorfismo (SNP) se indica como un supuesto polimorfismo (SNP) de “élite”. Se cree que un polimorfismo de élite tiene una alta probabilidad de estar ubicado en una secuencia del genoma de copia única o con bajo número de copias en el caso de que se hayan
5 usado dos líneas homocigotas en el procedimiento de descubrimiento. A la inversa, una asociación débil de un polimorfismo con un origen de muestra conlleva un alto riesgo de haber descubierto polimorfismos falsos que surgen de la alineación de secuencias no alélicas en un cóntigo.
Se identificaron secuencias que contienen motivos SSR usando la herramienta de búsqueda MISA (herramienta de 10 identificación de MIcroSatélites; disponible de http://pgrc.ipk-gatersleben.de/misa/
Se muestra la estadística global de la ronda en la tabla a continuación.
Tabla. Estadística global de una ronda de secuenciación de 454 para el descubrimiento de SNP en pimiento 15
Combinación de enzimas
Ronda
Recorte
Todas las lecturas
254308
Erróneas
5293 (2 %)
Correctas
249015 (98%)
Concatámeros
2156 (8,5 %)
Etiquetas mixtas
1120 (0,4 %)
Lecturas correctas
Recortado un extremo
240817 (97%)
Recortados ambos extremos
8198 (3 %)
Número de lecturas de la muestra 1
136990 (55%)
Número de lecturas de la muestra 2
112025 (45 %)
Agrupamiento
Número de cóntigos
21918
Lecturas en cóntigos
190861
Número promedio de lecturas por cóntigo
8,7
Prospección de SNP
SNP con puntuación Q 0,3 *
1483
Indel con puntuación Q 0,3 *
3300
Prospección de SSR
Número total motivos SSR identificados
359
Número de lecturas que contienen uno o más motivos SSR
353
Número de motivos SSR con tamaño unitario 1 (homopolímero)
0
Número de motivos SSR con tamaño unitario 2
102
Número de motivos SSR con tamaño unitario 3
240
Número de motivos SSR con tamaño unitario 4
17
* Los criterios de prospección de SNP / indels fueron los siguientes: sin polimorfismos vecinos con puntuación Q mayor de 0,1 dentro de 12 bases en cualquier lado, no presentes en homopolímero de 3 o más bases. Los criterios de prospección no tuvieron en cuenta la asociación constante con la muestra 1 y 2, es decir, los SNP e indels no son necesariamente supuestos SNP/indels de élite.
Se muestra un ejemplo de una alineación múltiple que contiene un supuesto polimorfismo de nucleótido único de
élite en la figura 7.
Ejemplo 5. Validación de SNP mediante amplificación por PCR y secuenciación de Sanger
5 Con el fin de validar el supuesto SNP A/G identificado en el ejemplo 1, se diseñó un ensayo de sitio etiquetado de secuencia (STS) para este SNP usando cebadores de PCR flanqueantes. Las secuencias de los cebadores de PCR eran las siguientes:
cebador 1.2f: 5’-AAACCCAAACTCCCCCAATC-3’, [SEQ ID 37] y
10 cebador 1.2r: 5’-AGCGGATAACAATTTCACACAGGACATCAGTAGTCACACTGGTA CAAAAATAGAGCAAAACAGTAGTG-3’ [SEQ ID 38]
Obsérvese que el cebador 1.2r contenía un sitio de unión a cebador de secuencia M13 y un fragmento de relleno de
15 longitud en su extremo 5 prima. Se llevó a cabo la amplificación por PCR usando productos de amplificación AFLP +A/+CA de PSP11 y PI210234 preparados tal como se describió en el ejemplo 4 como molde. Las condiciones de PCR fueron las siguientes:
Durante 1 reacción de PCR se mezclaron los siguientes componentes:
20 5 μl de mezcla de AFLP diluida 1/10 (aprox. 10 ng/μl)
5 μl de cebador 1.2f 1 pmol/μl (diluido directamente a partir de una disolución madre 500 μM)
25 5 μl de cebador 1.2r 1 pmol/μl (diluido directamente a partir de una disolución madre 500 μM)
5 μl de mezcla de PCR - 2 ml de tampón de PCR 10 x
-
1 ml de dNTP 5 mM
-
1,5 ml de MgCl2 5 mM 30 - 0,5 ml de H2O
5 μl de mezcla de enzimas - 0,5 ml de tampón de PCR 10 x (Applied Biosystems)
-
0,1 ml de ADN polimerasa AmpliTaq 5 U/ml (Applied Biosystems)
-
4,4 ml de H2O 35
Se usó el siguiente perfil de PCR: Ciclo 1 2’; 94ºC Ciclo 2-34 20’’; 94ºC
30’’; 56ºC 2’30’’; 72ºC
Ciclo 35 7’; 72ºC ∞; 4ºC
Se clonaron los productos de PCR en el vector pCR2.1 (kit de clonación TA; Invitrogen) usando el método de clonación TA y se transformaron en células de E. coli competentes INVαF’. Se sometieron los transformantes a
40 selección azul/blanca. Se seleccionaron tres transformantes blancos independientes cada uno para PSP11 y PI201234 y se hicieron crecer durante la noche en medio líquido selectivo para el aislamiento de plásmidos.
Se aislaron plásmidos usando el kit QIAprep Spin Miniprep (QIAGEN). Posteriormente, se secuenciaron los insertos de estos plásmidos según el protocolo a continuación y se resolvieron en el instrumento MegaBACE 1000
45 (Amersham). Se inspeccionaron las secuencias obtenidas para detectar la presencia del alelo de SNP. Dos plásmidos independientes que contenían el inserto PI-201234 y 1 plásmido que contenía el inserto PSP11 contenían la secuencia consenso esperada que flanquea al SNP. La secuencia derivada del fragmento PSP11 contenía el alelo A esperado (subrayado) y la secuencia derivada del fragmento PI-201234 contenía el alelo G esperado (doblemente subrayado):
PSP11 (secuencia 1): (5’-3’)
55 PI-201234 (secuencia 1): (5’-3’) PI-201234 (secuencia 2): (5’-3’)
Este resultado indica que el supuesto SNP A/G de pimiento representa un polimorfismo genético verdadero detectable usando el ensayo de STS diseñado. 10 Ejemplo 6: Validación de SNP mediante detección SNPWave.
Con el fin de validar el supuesto SNP A/G identificado en el ejemplo 1, se definieron conjuntos de sondas de ligamiento SNPWave para ambos alelos de este SNP usando la secuencia consenso. Las secuencias de las sondas 15 de ligamiento eran las siguientes:
Secuencias de sondas SNPWave (5’-3’):
06A162 GATGAGTCCTGAGTAACCCAATCGATTTCAAACCTAGAACAA (42 bases) [SEQ ID 42] 20 06A163 GATGAGTCCTGAGTAACCACCAATCGATTTCAAACCTAGAACAG (44 bases) [SEQ ID 43]
06A164 Fosfato-TGTTGGTTTTGGTGCTAACTTCAACCAACATCTGGAATTGGTACGCAGTC (52 bases) [SEQ ID 44]
25 Obsérvese que las sondas específicas de alelos 06A162 y 06A163 para los alelos A y G, respectivamente, difieren en 2 bases en tamaño, de manera que tras el ligamiento a la sonda específica de locus común 06A164, resultan tamaños de productos de ligamiento de 94 (42+54) y 96 (44+52) bases.
30 Se llevaron a cabo reacciones de PCR y ligamiento SNPWave tal como se describe por Van Eijk y colaboradores (M.
J. T. van Eijk, J. L.N. Broekhof, H. J.A. van der Poel, R. C. J. Hogers, H. Schneiders, J. Kamerbeek, E. Verstege, J.
W. van Aart, H. Geerlings, J. B. Buntjer, A. J. van Oeveren, y P. Vos. (2004). SNPWave™ a flexible multiplexed SNP genotyping technology. Nucleic Acids Research 32: e47), usando 100 ng de ADN genómico de las líneas de pimiento PSP11 y PI201234 y 8 descendientes RIL como material de partida. Las secuencias de los cebadores de
35 PCR eran:
93L01FAM (E00k) 5-GACTGCGTACCAATTC-3’ [SEQ ID 45]
93E40 (M00k) 5-GATGAGTCCTGAGTAA-3’ [SEQ ID 46]
40 Tras la amplificación por PCR, la purificación de producto de PCR y la detección en el instrumento MegaBACE1000 fueron tal como se describe por van Eijk y colaboradores (véase anteriormente). Se muestra en la figura 8B una imagen de pseudo-gel de los productos de amplificación obtenidos a partir de PSP11, PI201234 y 8 descendientes RIL.
45 Los resultados de SNPWave demuestran claramente que se detecta el SNP A/G mediante el ensayo SNPWave, dando como resultado productos de 92 pb (=AA genotipo homocigoto) para P1 (PSP11) y descendientes RIL 1, 2, 3, 4, 6 y 7), y productos de 94 pb (=GG genotipo homocigoto) para P2 (PI201233) y descendientes RIL 5 y 8.
50 Ejemplo 7: Estrategias para enriquecer bibliotecas de fragmentos de AFLP en secuencias con bajo número de copias.
Este ejemplo describe varios métodos de enriquecimiento para seleccionar como diana un bajo número de copias de secuencias de genoma únicas con el fin de aumentar el rendimiento de polimorfismos de élite tal como se describe 55 en el ejemplo 4. Los métodos pueden dividirse en cuatro categorías:
1) métodos dirigidos a preparar ADN genómico de alta calidad, excluyendo secuencias de cloroplastos.
En este caso se propone preparar ADN nuclear en lugar de ADN genómico completo tal como se describe en el 60 ejemplo 4, para excluir el aislamiento conjunto de ADN de cloroplastos abundante, lo que puede dar como resultado una reducción del número de secuencias de ADN genómico vegetal, dependiendo de las endonucleasas de
restricción y los cebadores de AFLP selectivos usados en el procedimiento de preparación de la biblioteca de fragmentos. Se ha descrito un protocolo para el aislamiento de ADN nuclear de tomate sumamente puro por Peterson, DG., Boehm, K.S. & Stack S. M. (1997). Isolation of Milligram Quantities of Nuclear ADN From Tomato (Lycopersicon esculentum), A Plant Containing High Levels of Polyphenolic Compounds. Plant Molecular Biology Reporter 15 (2), páginas 148-153.
2) Métodos dirigidos a usar endonucleasas de restricción en el procedimiento de preparación de moldes de AFLP que se espera que produzcan niveles elevados de secuencias con bajo número de copias.
En este caso se propone usar determinadas endonucleasas de restricción en el procedimiento de preparación de moldes de AFLP, que se espera que seleccionen como diana secuencias de genoma únicas o con bajo número de copias, dando como resultado bibliotecas de fragmentos enriquecidas en polimorfismos con aumento de la capacidad para poder convertirse en ensayos de genotipado. Un ejemplo de una endonucleasa de restricción que selecciona como diana una secuencia con bajo número de copias en genomas vegetales es PstI. Otras endonucleasas de restricción sensibles a metilación pueden seleccionar como diana también secuencias de genoma únicas o con bajo número de copias preferentemente.
3) Métodos dirigidos a eliminar selectivamente secuencias sumamente duplicadas basándose en la cinética de reapareamiento de secuencias repetidas frente a secuencias con bajo número de copias.
En este caso se propone eliminar selectivamente secuencias sumamente duplicadas (repeticiones) o bien de la muestra de ADN genómico total o bien del material de molde de (ADNc-)AFLP antes de la amplificación selectiva.
3a) La preparación de ADN High-C0t es una técnica comúnmente usada para enriquecer secuencias con bajo número de copias que se aparean lentamente a partir de una mezcla de ADN genómico vegetal compleja (Yuan et al. 2003; High-Cot sequence analysis of the maize genome. Plant J. 34: 249-255). Se sugiere tomar High-C0t en lugar de ADN genómico total como material de partida para enriquecer polimorfismos ubicados en secuencias con bajo número de copias.
3b) Una alternativa a la laboriosa preparación de high-C0t puede ser incubar ADNbc de reapareamiento y desnaturalizado con una nucleasa novedosa del cangrejo de Kamchatka, que escinde dúplex de ADN cortos, perfectamente coincidentes a una tasa superior que dúplex de ADN no perfectamente coincidentes, tal como se describe por Zhulidov y colaboradores (2004; Simple cDNA normalization using Kamchatka crab duplex-specific nuclease. Nucleic Acids Research 32, e37) y Shagin y colaboradores (2006; a novel method for SNP detection using a new duplex-specific nuclease from crab hepatopancreas. Genome Research 12: 1935-1942). Específicamente, se propone incubar mezclas de restricción/ligamiento de AFLP con esta endonucleasa para eliminar de la mezcla secuencias sumamente duplicadas, seguido por amplificación AFLP selectiva de las secuencias de genoma únicas o con bajo número de copias restantes.
3c) La metil-filtración es un método para enriquecer fragmentos de ADN genómico hipometilados usando la endonucleasa de restricción McrBC que corta ADN metilado en la secuencia [A/G]C, en la que la C está metilada (véase Pablo D. Rabinowicz, Robert Citek, Muhammad A. Budiman, Andrew Nunberg, Joseph A. Bedell, Nathan Lakey, Andrew L. O’Shaughnessy, Lidia U. Nascimento, W. Richard McCombie y Robert A. Martienssen. Differential methylation of genes and repeats in land plants. Genome Research 15:1431-1440, 2005). Puede usarse McrBC para enriquecer la fracción de secuencias con bajo número de copias de un genoma como material de partida para el descubrimiento de polimorfismos.
4) El uso de ADNc en contraposición a ADN genómico con el fin de seleccionar como diana secuencias génicas.
Finalmente, se propone en este caso usar ADNc cebado con oligodT en contraposición a ADN genómico como material de partida para el descubrimiento de polimorfismos, opcionalmente en combinación con el uso de la nucleasa específica de dúplex de cangrejo descrita en el punto 3b para la normalización. Obsérvese que el uso de ADNc cebado con oligodT también excluye secuencias de cloroplastos. Alternativamente, se usan moldes de ADNc-AFLP en lugar de ADNc cebado con oligodT para facilitar la amplificación de las secuencias con bajo número de copias restantes en analogía a AFLP (véase también el punto 3b anterior).
Ejemplo 8: Estrategia para el enriquecimiento de repeticiones de secuencias simples
Este ejemplo describe la estrategia propuesta para el descubrimiento de secuencias de repeticiones de secuencias simples, en analogía al descubrimiento de SNP descrito en el ejemplo 4.
Específicamente, se realiza restricción-ligamiento de ADN genómico de dos o más muestras, por ejemplo usando las endonucleasas de restricción PstI/MseI. Se realiza amplificación AFLP selectiva tal como se describe en el ejemplo
4. A continuación, se enriquecen fragmentos que contienen los motivos SSR seleccionados mediante uno de dos métodos:
1) hibridación por transferencia de tipo Southern sobre filtros que contienen oligonucleótidos que coinciden con los motivos SSR previstos (por ejemplo (CA)15 en el caso de enriquecimiento de repeticiones CA/GT), seguido por amplificación de fragmentos unidos de un modo similar al descrito por Armour y colaboradores (Armour, J., Sismani, C., Patsalis, P., y Cross, G. (2000). Measurement of locus copy number by hybridization with amplifiable probes.
5 Nucleic Acids Research vol. 28, n.º 2, págs. 605-609) o mediante
2) enriquecimiento usando sondas de hibridación oligonucleotídicas de captura biotiniladas para capturar fragmentos (AFLP) en disolución tal como se describe por Kijas y colaboradores (Kijas, J.M., Fowler, J.C., Garbett C.A., y Thomas, M.R., (1994). Enrichment of microsatellites from the citrus genome using biotinylated oligonucleotide
10 sequences bound to streptavidin-coated magnetic particles. Biotechniques, vol. 16, págs. 656-662.
A continuación, se amplifican los fragmentos de AFLP enriquecidos en motivos SSR usando los mismos cebadores de AFLP que se usan en la etapa de preamplificación, para generar una biblioteca de secuencias. Se clona T/A una alícuota de los fragmentos amplificados y se secuencian 96 clones para estimar la fracción de clones positivos 15 (clones que contienen el motivo SSR previsto, por ejemplo motivos CA/GT mayores de 5 unidades de repetición. Se detecta otra alícuota de la mezcla de fragmentos de AFLP enriquecida mediante electroforesis en gel de poliacrilamida (PAGE), opcionalmente tras amplificación selectiva adicional para obtener una huella legible, con el fin de inspeccionar visualmente si están enriquecidos fragmentos que contienen SSR. Tras completar satisfactoriamente estas etapas de control, se someten las bibliotecas de secuencias a secuenciación de 454 de alto
20 rendimiento.
La estrategia anterior para el descubrimiento de SSR de novo SSR se representa esquemáticamente en la figura 8A, y puede adaptarse para otros motivos de secuencia sustituyendo las secuencias oligonucleotídicas de captura por consiguiente.
25 Ejemplo 9. Estrategia para evitar etiquetas mixtas.
Etiquetas mixtas se refiere a la observación de que además de la combinación de cebadores de AFLP etiquetados esperada por muestra, se observa una baja fracción de secuencias que contienen una etiqueta de la muestra 1 en
30 un extremo, y una etiqueta de la muestra 2 en el otro extremo (véase también la tabla 1 en el ejemplo 4). Esquemáticamente, la configuración de secuencias que contienen etiquetas mixtas se representa en el presente documento a continuación.
Representación esquemática de las combinaciones de etiquetas de muestras esperadas. 35 Etiqueta EcoRI Etiqueta MseI PSP 11: 5’-CGTC ACCA-3’ 3’-GCAG TGGT-5’
GGCT-3’
PI-201234 5’-CAAG 3’-GTTC CCGA-5’
Representación esquemática de las etiquetas mixtas.
Etiqueta EcoRI Etiqueta MseI 5’-CGTC GGCT-3’ 3’-GCAG CCGA-
5’
5’-CAAG ACCA-3’ 3’-GTTC TGGT-5’
40 La observación de etiquetas mixtas excluye la asignación correcta de la secuencia a o bien PSP11 o bien PI201234.
Se muestra en la figura 5A un ejemplo de una secuencia de etiquetas mixtas observada en la ronda de secuenciación de pimiento descrita en el ejemplo 4. Se muestra en el panel 2 de la figura 5A una revisión de la 45 configuración de fragmentos observados que contienen etiquetas esperadas y etiquetas mixtas.
La explicación molecular propuesta para las etiquetas mixtas es que durante la etapa de preparación de bibliotecas de secuencias, se hacen romos los extremos de fragmentos de ADN usando ADN polimerasa de T4 o enzima Klenow para eliminar extremos sobresalientes en 3 prima, antes del ligamiento al adaptador (Margulies et al., 2005). 50 Aunque esto puede funcionar bien cuando se procesa una única muestra de ADN, en el caso de usar una mezcla de
dos o más muestras de ADN etiquetadas de manera diferente, el relleno por la polimerasa da como resultado la incorporación de la secuencia de etiqueta errónea en el caso en el que se ha formado un heterodúplex entre las hebras complementarias derivadas de muestras diferentes (figura 5B panel 3, etiquetas mixtas). Se ha encontrado la solución agrupando las muestras tras la etapa de purificación que seguía al ligamiento al adaptador en la epata de construcción de bibliotecas de secuencias 454 tal como se muestra en la figura 5C panel 4.
Ejemplo 10. Estrategia para evitar etiquetas mixtas y concatámeros usando un diseño mejorado para la preparación de bibliotecas de secuencias 454.
Además de la observación bajas frecuencias de lecturas de secuencias que contienen etiquetas mixtas tal como se describe en el ejemplo 9, se ha observado una baja frecuencia de lecturas de secuencias observadas a partir de fragmentos de AFLP concatenados.
Se muestra en la figura 6A panel 1 un ejemplo de una lectura de secuencia derivada de un concatámero. Esquemáticamente, se muestra en la figura 6A panel 2 la configuración de secuencias que contienen etiquetas esperadas y concatámeros.
La explicación molecular propuesta para la aparición de fragmentos de AFLP concatenados es que durante la etapa de preparación de bibliotecas de secuencias 454, se hacen romos los extremos de fragmentos de ADN usando ADN polimerasa de T4 o enzima Klenow para eliminar extremos sobresalientes en 3 prima, antes del ligamiento al adaptador (Margulies et al., 2005). Como resultado, fragmentos de ADN de muestras con extremos romos están en competición con los adaptadores durante la etapa de ligamiento y pueden ligarse entre sí antes de ligarse a los adaptadores. Este fenómeno es de hecho independiente de si se incluye una única muestra de ADN o una mezcla de múltiples muestras (etiquetadas) en la etapa de preparación de bibliotecas, y por tanto también puede producirse durante la secuenciación convencional tal como se describe por Margulies y colaboradores. En el caso de usar muestras de etiquetado múltiple tal como se describe en el ejemplo 4, los concatámeros complican la asignación correcta de lecturas de secuencias a muestras basándose en la información de etiquetas y por tanto deben evitarse.
La solución propuesta a la formación de concatámeros (y etiquetas mixtas) es reemplazar el ligamiento de adaptadores con extremos romos por ligamiento de adaptadores que contienen una proyección T en 3 prima, en analogía a la clonación T/A de productos de PCR, tal como se muestra en la figura 6B panel 3. Convenientemente, se propone que estos adaptadores que contienen una proyección T en 3 prima contengan una proyección C en el extremo 3’ opuesto (que no se ligará al fragmento de ADN de muestra, para prevenir la formación de concatámeros con extremos romos de secuencias adaptadoras (véase la figura 6B panel 3). El flujo de trabajo adaptado resultante en el procedimiento de construcción de bibliotecas de secuencias cuando se usa el enfoque de adaptador modificado se muestra esquemáticamente en la figura 6C panel 4.
LISTA DE SECUENCIAS
<110> Keygene NV 5 <120> Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
<130> P27819EP01
<160> 46 10
<170> Patente en versión 3.3
<210> 1
<211> 22 15 <212> ADN
<213> Artificial
<220>
<223> Cebador 20
<400> 1
25 <210> 2
<211> 22
<212> ADN
<213> Artificial
30 <220>
<223> cebador
<400> 2
<210> 3
<211> 22
<212> ADN 40 <213> Artificial
<220>
<223> cebador
45 <400> 3
<210> 4 50 <211> 22
<212> ADN
<213> Artificial
<220>
<223> cebador
<400> 4
5
10
<210> 5 <211> 17 <212> ADN <213> Artificial
<220> <223> adaptador
15
<400> 5
20
<210> 6 <211> 18 <212> ADN <213> Artificial
25
<220> <223> adaptador
<400> 6
30 35
<210> 7 <211> 16 <212> ADN <213> Artificial <220> <223> adaptador
40
<400> 7
45
<210> 8 <211> 14 <212> ADN <213> Artificial
50
<220> <223> adaptador <400> 8
5
<210> 9 <211> 18 <212> ADN <213> Artificial <220> <223> cebador
10
<400> 9
15
<210> 10 <211> 17 <212> ADN <213> Artificial
20
<220> <223> cebador <400> 10
25
<210> 11 <211> 22 <212> ADN <213> Artificial
30
<220> <223> cebador
<400> 11
35
40
<210> 12 <211> 22 <212> ADN <213> Artificial
<220> <223> cebador
45
<400> 12
50
<210> 13 <211> 22 <212> ADN <213> Artificial
55
<220> <223> cebador
<400> 13
5
<210> 14 <211> 22 <212> ADN <213> Artificial
10
<220> <223> cebador <400> 14
15
<210> 15 <211> 19 <212> ADN <213> Artificial
20
<220> <223> cebador
<400> 15
25
30
<210> 16 <211> 19 <212> ADN <213> Artificial
<220> <223> cebador
35
<400> 16
40
<210> 17 <211> 22 <212> ADN <213> Artificial
45
<220> <223> cebador
<400> 17
50 55
<210> 18 <211> 22 <212> ADN <213> Artificial
<220>
<223> cebador
<400> 18
5
<210> 19
<211> 22
10
<212> ADN
<213> Artificial
<220>
<223> cebador
15
<400> 19
20
<210> 20
<211> 22
<212> ADN
<213> Artificial
25
<220>
<223> cebador
<400> 20
30
<210> 21
<211> 22
<212> ADN
35
<213> Artificial
<220>
<223> cebador
40
<400> 21
<210> 22
45
<211> 22
<212> ADN
<213> Artificial
<220>
50
<223> cebador
<400> 22
55
<210> 23
<211> 22
<212> ADN <213> Artificial
5
<220> <223> cebador
<400> 23
10 15
<210> 24 <211> 22 <212> ADN <213> Artificial <220> <223> cebador
20
<400> 24
25
<210> 25 <211> 22 <212> ADN <213> Artificial
30
<220> <223> cebador <400> 25
35
<210> 26 <211> 22 <212> ADN <213> Artificial
40
<220> <223> cebador
<400> 26
45
50
<210> 27 <211> 22 <212> ADN <213> Artificial
<220> <223> cebador
55
<400> 27
5
<210> 28 <211> 22 <212> ADN <213> Artificial <220> <223> cebador
10
<400> 28
15
<210> 29 <211> 22 <212> ADN <213> Artificial
20
<220> <223> cebador <400> 29
25
<210> 30 <211> 22 <212> ADN <213> Artificial
30
<220> <223> cebador
<400> 30
35
40
<210> 31 <211> 22 <212> ADN <213> Artificial
<220> <223> cebador
45
<400> 31
50
<210> 32 <211> 22 <212> ADN <213> Artificial
55
<220> <223> cebador
<400> 32
5
<210> 33 <211> 22 <212> ADN <213> Artificial
10
<220> <223> cebador <400> 33
15
<210> 34 <211> 22 <212> ADN <213> Artificial
20
<220> <223> cebador
<400> 34
25
30
<210> 35 <211> 22 <212> ADN <213> Artificial
<220> <223> cebador
35
<400> 35
40
<210> 36 <211> 22 <212> ADN <213> Artificial
45
<220> <223> cebador
<400> 36
50 55
<210> 37 <211> 20 <212> ADN <213> artificial <220> <223> cebador
<400> 37
5
<210> 38
<211> 68
<212> ADN
<213> artificial
10
<220>
<223> cebador
<400> 38
15
<210> 39
<211> 91 20 <212> ADN
<213> artificial
<220>
<223> sonda 25
<400> 39
30 <210> 40
<211> 90
<212> ADN
<213> artificial
35 <220>
<223> secuencia que contiene PI-201234 SNP
<400> 40
<210> 41
<211> 90
<212> ADN 45 <213> artificial
<220>
<223> PI-201234 SNP
50 <400> 41 <210> 42
<211> 42 5 <212> ADN
<213> artificial
<220>
<223> sonda SNPWave 10
<400> 42
15 <210> 43
<211> 44
<212> ADN
<213> artificial
20 <220>
<223> sonda SNPWave
<400> 43
<210> 44
<211> 50
<212> ADN 30 <213> artificial
<220>
<223> sonda snpwave
35 <400> 44
40
<210> 45 <211> 16 <212> ADN <213> artificial
45
<220> <223> cebador
<400> 45
50 55
<210> 46 <211> 16 <212> ADN <213> artificial
ES72737877877T3

Claims (6)

  1. REIVINDICACIONES
    1. Método para identificar uno o más polimorfismos en muestras de ácido nucleico, comprendiendo dicho método las etapas de:
    5 a) proporcionar una pluralidad de muestras de ácido nucleico de interés;
    b) realizar una reducción de la complejidad en cada una de las muestras para proporcionar una pluralidad de bibliotecas de muestras de ácido nucleico,
    10 c) ligar adaptadores a las muestras de ácido nucleico de complejidad reducida en las bibliotecas, usando un adaptador que porta una proyección 3’-T;
    d) secuenciar al menos una parte de las bibliotecas; 15 e) alinear las secuencias de cada muestra obtenida en la etapa d);
    f) determinar uno o más polimorfismos entre la pluralidad de muestras de ácido nucleico en la alineación de la etapa e);
    20 g) opcionalmente, examinar un ácido nucleico de muestra de prueba de interés para identificar la presencia, ausencia o cantidad del uno o más polimorfismos determinados en la etapa f) usando sondas de detección.
  2. 2. Método según la reivindicación 1, en el que el ácido nucleico de muestra de prueba es una muestra de
    25 ácido nucleico de complejidad reducida que se ha obtenido usando la reducción de la complejidad usada en la etapa b).
  3. 3. Método según la reivindicación 1, en el que la etapa b) comprende además la etapa de etiquetar la
    biblioteca para obtener una biblioteca etiquetada. 30
  4. 4.
    Método según la reivindicación 3, en el que la etiqueta se proporciona en el adaptador y/o el cebador.
  5. 5.
    Método según la reivindicación 3, en el que la etiqueta es una secuencia identificadora.
    35 6. Método según la reivindicación 4, en el que al menos uno de los cebadores está fosforilado.
  6. 7. Método según la reivindicación 6, en el que la secuenciación comprende secuenciar sobre un soporte sólido.
    40 8. Método según cualquiera de las reivindicaciones anteriores, en el que el examen se realiza mediante inmovilización de las sondas diseñadas en la etapa g) según la reivindicación 1 sobre una matriz, seguido por la puesta en contacto de la matriz que comprende sondas con una biblioteca de prueba en condiciones de hibridación.
    45 9. Uso del método según las reivindicaciones 1-8 para examinar bibliotecas de microsatélites enriquecidas, realizar la obtención del perfil de transcrito de ADNc-AFLP (hibridación de tipo Northern digital), secuenciación de genomas complejos, secuenciación de bibliotecas de etiquetas de secuencia expresada (en ADNc completo o ADNc-AFLP), descubrimiento de microARN (secuenciación de bibliotecas de insertos pequeñas), secuenciación de cromosomas artificiales bacterianos (cóntigos), enfoque de análisis de
    50 segregantes agrupados en combinación con AFLP/ADNc-AFLP, detección de rutina de fragmentos AFLP (retrocruzamientos asistidos por marcador).
    ES72737877877T3
    ES72737877877T3
ES10184351T 2005-06-23 2006-06-23 Estrategias para la identificación de alto rendimiento y la detección de polimorfismos Active ES2387878T3 (es)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US69305305P 2005-06-23 2005-06-23
US693053P 2005-06-23
EP06075104 2006-01-16
EP06075104 2006-01-16
US75903406P 2006-01-17 2006-01-17
US759034P 2006-01-17

Publications (1)

Publication Number Publication Date
ES2387878T3 true ES2387878T3 (es) 2012-10-03

Family

ID=36940150

Family Applications (2)

Application Number Title Priority Date Filing Date
ES10184351T Active ES2387878T3 (es) 2005-06-23 2006-06-23 Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
ES10075564T Active ES2393318T3 (es) 2005-06-23 2006-06-23 Estrategias para la identificación y detección de alto rendimiento de polimorfismos

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES10075564T Active ES2393318T3 (es) 2005-06-23 2006-06-23 Estrategias para la identificación y detección de alto rendimiento de polimorfismos

Country Status (9)

Country Link
US (15) US8785353B2 (es)
EP (3) EP2302070B1 (es)
JP (2) JP5220597B2 (es)
CN (3) CN101641449B (es)
AT (2) ATE491045T1 (es)
DE (1) DE602006018744D1 (es)
DK (2) DK2292788T3 (es)
ES (2) ES2387878T3 (es)
WO (1) WO2006137733A1 (es)

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1885882T3 (da) 2005-05-10 2011-04-11 State Of Oregon Acting By & Through The State Board Of Higher Eduction On Behalf Of The University O Fremgangsmåder til kortlægning af polymorfier og polymorfi-mikroarray
ES2387878T3 (es) 2005-06-23 2012-10-03 Keygene N.V. Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
US10316364B2 (en) 2005-09-29 2019-06-11 Keygene N.V. Method for identifying the source of an amplicon
ATE453728T1 (de) 2005-09-29 2010-01-15 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
JP5198284B2 (ja) * 2005-12-22 2013-05-15 キージーン ナムローゼ フェンノートシャップ 高処理量配列決定技術を使用する転写産物の特徴づけのための改良された戦略
JP5452021B2 (ja) 2005-12-22 2014-03-26 キージーン ナムローゼ フェンノートシャップ ハイスループットaflp系多型検出法
US7932029B1 (en) * 2006-01-04 2011-04-26 Si Lok Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
PT2963127T (pt) 2006-04-04 2017-10-06 Keygene Nv Detecção de alto rendimento de marcadores moleculares com base em fragmentos de restrição
WO2008027558A2 (en) 2006-08-31 2008-03-06 Codon Devices, Inc. Iterative nucleic acid assembly using activation of vector-encoded traits
CL2008001682A1 (es) 2007-06-08 2008-12-12 Monsanto Technology Llc Metodos para el mejoramiento de plantas mediante el uso de informacion directa de secuencias de acidos nucleicos.
WO2009040682A2 (en) * 2007-09-26 2009-04-02 Population Genetics Technologies Ltd. Methods and compositions for reducing the complexity of a nucleic acid sample
EP2367937B1 (en) * 2008-12-04 2013-04-17 Keygene N.V. Method for the reduction of repetitive sequences in adapter-ligated restriction fragments
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
JP5799484B2 (ja) * 2009-12-14 2015-10-28 トヨタ自動車株式会社 Dnaマイクロアレイにおけるプローブ設計方法、当該方法により設計されたプローブを有するdnaマイクロアレイ
CA2794522C (en) 2010-04-05 2019-11-26 Prognosys Biosciences, Inc. Spatially encoded biological assays
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
WO2011155833A2 (en) 2010-06-09 2011-12-15 Keygene N.V. Combinatorial sequence barcodes for high throughput screening
KR101862756B1 (ko) * 2010-07-09 2018-05-30 세르겐티스 비.브이. 관심있는 3-d 게놈 영역 서열화 전략
CN102409048B (zh) * 2010-09-21 2013-10-23 深圳华大基因科技服务有限公司 一种基于高通量测序的dna标签文库构建方法
CN102409046B (zh) * 2010-09-21 2013-09-18 深圳华大基因科技服务有限公司 小分子rna标签
GB201016484D0 (en) 2010-09-30 2010-11-17 Geneseque As Method
EP3360963B1 (en) 2010-11-12 2019-11-06 Gen9, Inc. Methods and devices for nucleic acids synthesis
EP2637780B1 (en) 2010-11-12 2022-02-09 Gen9, Inc. Protein arrays and methods of using and making the same
AU2012205884A1 (en) * 2011-01-14 2013-08-29 Keygene N.V. Paired end random sequence based genotyping
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
BR112013033462A2 (pt) 2011-06-27 2017-03-01 Univ Florida método para a redução de complexidade do genoma e detecção de polimorfismo
LT3594340T (lt) 2011-08-26 2021-10-25 Gen9, Inc. Kompozicijos ir būdai, skirti nukleorūgščių didelio tikslumo sąrankai
CN102567652A (zh) * 2011-12-13 2012-07-11 上海大学 一种面向snp数据的筛选方法
EP2802666B1 (en) 2012-01-13 2018-09-19 Data2Bio Genotyping by next-generation sequencing
RS61631B1 (sr) 2012-02-17 2021-04-29 Hutchinson Fred Cancer Res Kompozicije i postupci za preciznu identifikaciju mutacija
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US20130281308A1 (en) * 2012-04-24 2013-10-24 Gen9, Inc. Methods for sorting nucleic acids and preparative in vitro cloning
EP2841601B1 (en) 2012-04-24 2019-03-06 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
KR101890140B1 (ko) 2012-05-07 2018-09-28 삼성전자주식회사 카메라 장치를 이용하여 디스플레이 장치를 제어하는 방법 및 이를 적용한 모바일 장치, 디스플레이 장치, 그리고 시스템
AU2013266394B2 (en) 2012-05-21 2019-03-14 The Scripps Research Institute Methods of sample preparation
LT2864531T (lt) 2012-06-25 2019-03-12 Gen9, Inc. Nukleorūgšties konstravimo ir aukšto produktyvumo sekvenavimo būdai
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
GB201217888D0 (en) 2012-10-05 2012-11-21 Univ Leuven Kath High-throughput genotyping by sequencing of single cell
EP2946345B1 (en) 2013-01-17 2024-04-03 Personalis, Inc. Methods and systems for genetic analysis
US9822408B2 (en) 2013-03-15 2017-11-21 Nugen Technologies, Inc. Sequential sequencing
US9879313B2 (en) 2013-06-25 2018-01-30 Prognosys Biosciences, Inc. Methods and systems for determining spatial patterns of biological targets in a sample
EP3039161B1 (en) 2013-08-30 2021-10-06 Personalis, Inc. Methods and systems for genomic analysis
WO2015044412A1 (en) * 2013-09-30 2015-04-02 Qiagen Gmbh Dna-adapter-molecules for the preparation of dna-libraries and method for producing them and use
GB2535066A (en) 2013-10-03 2016-08-10 Personalis Inc Methods for analyzing genotypes
GB201319779D0 (en) * 2013-11-08 2013-12-25 Cartagenia N V Genetic analysis method
CA2929596C (en) 2013-11-13 2022-07-05 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
GB201413929D0 (en) 2014-08-06 2014-09-17 Geneseque As Method
CA2960821A1 (en) 2014-09-09 2016-03-17 Igenomx International Genomics Corporation Methods and compositions for rapid nucleic acid library preparation
EP3212808B1 (en) 2014-10-30 2022-03-02 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
CN104450697B (zh) * 2014-12-02 2017-01-11 中国科学院海洋研究所 一种与牡蛎抗病毒特性相关的snp标记及其应用
EP4119677B1 (en) 2015-04-10 2023-06-28 Spatial Transcriptomics AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
US10344336B2 (en) 2015-06-09 2019-07-09 Life Technologies Corporation Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging
ES2911421T3 (es) 2015-12-08 2022-05-19 Twinstrand Biosciences Inc Adaptadores, métodos y composiciones mejorados para secuenciación dúplex
CN105420363A (zh) * 2015-12-15 2016-03-23 江苏省中国科学院植物研究所 一种适用于狗牙根基因差异表达研究的cDNA-AFLP方法
ES2914396T3 (es) 2016-03-22 2022-06-10 Vib Vzw Medios y métodos de amplificación de secuencias de nucleótidos
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
EP3443066A4 (en) 2016-04-14 2019-12-11 Guardant Health, Inc. EARLY DETECTION METHODS FOR CANCER
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
CN106480191A (zh) * 2016-10-20 2017-03-08 南昌大学 一种河蛏蚌f型线粒体基因组全序列扩增的方法
WO2018093724A1 (en) 2016-11-15 2018-05-24 Quest Diagnostics Investments Llc Methods for detecting dna mutations using mitra tip extraction
CN110168100A (zh) 2016-11-15 2019-08-23 奎斯特诊断投资有限责任公司 使用mitra尖端提取检测囊性纤维化突变的方法
WO2018183942A1 (en) 2017-03-31 2018-10-04 Grail, Inc. Improved library preparation and use thereof for sequencing-based error correction and/or variant identification
FI3872187T3 (fi) * 2017-04-23 2022-12-15 Koostumuksia ja menetelmiä näytteiden identifioinnin parantamiseksi indeksoiduissa nukleiinihappokirjastoissa
JP7056012B2 (ja) * 2017-05-19 2022-04-19 トヨタ自動車株式会社 ランダムプライマーセット、及びこれを用いたdnaライブラリーの作製方法
WO2019060716A1 (en) 2017-09-25 2019-03-28 Freenome Holdings, Inc. SAMPLE EXTRACTION METHODS AND SYSTEMS
US11099202B2 (en) 2017-10-20 2021-08-24 Tecan Genomics, Inc. Reagent delivery system
CN107589193B (zh) * 2017-10-25 2020-05-05 南京工业大学 一种利用微反应装置筛选蛋白抑制剂的方法
SG11202003885UA (en) 2017-11-08 2020-05-28 Twinstrand Biosciences Inc Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
WO2019121603A1 (en) 2017-12-18 2019-06-27 Keygene N.V. Chemical mutagenesis of cassava
JP7047373B2 (ja) 2017-12-25 2022-04-05 トヨタ自動車株式会社 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法
CN111683958A (zh) * 2018-02-20 2020-09-18 威廉马歇莱思大学 使用多重抑制探针置换扩增进行等位基因富集的***和方法
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
BR112021000409A2 (pt) 2018-07-12 2021-04-06 Twinstrand Biosciences, Inc. Métodos e reagentes para caracterizar edição genômica, expansão clonal e aplicações associadas
CN112752848A (zh) * 2018-07-26 2021-05-04 莱森特生物公司 使用单个流动池的多重测序
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
JP2022511633A (ja) 2018-11-28 2022-02-01 キージーン ナムローゼ フェンノートシャップ エンドヌクレアーゼ保護による標的化濃縮
US20220025447A1 (en) 2018-12-10 2022-01-27 10X Genomics, Inc. Generating spatial arrays with gradients
JP2022515002A (ja) * 2018-12-17 2022-02-17 イルミナ インコーポレイテッド 配列決定用ライブラリーを調製するための方法および手段
CN111378557B (zh) 2018-12-26 2023-06-06 财团法人工业技术研究院 用于产生液珠的管状结构及液珠产生方法
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
CN113474466A (zh) 2019-02-21 2021-10-01 主基因有限公司 多倍体基因分型
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
US10927409B1 (en) 2019-10-14 2021-02-23 Pioneer Hi-Bred International, Inc. Detection of sequences uniquely associated with a dna target region
WO2021092433A2 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Enhancing specificity of analyte binding
EP4073245A1 (en) 2019-12-12 2022-10-19 Keygene N.V. Semi-solid state nucleic acid manipulation
EP4077661A1 (en) 2019-12-20 2022-10-26 Keygene N.V. Ngs library preparation using covalently closed nucleic acid molecule ends
EP3891300B1 (en) 2019-12-23 2023-03-29 10X Genomics, Inc. Methods for spatial analysis using rna-templated ligation
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
ES2965354T3 (es) 2020-04-22 2024-04-12 10X Genomics Inc Métodos para análisis espacial que usan eliminación de ARN elegido como diana
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
EP4153775A1 (en) 2020-05-22 2023-03-29 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
CN116249785A (zh) 2020-06-02 2023-06-09 10X基因组学有限公司 用于抗原-受体的空间转录组学
AU2021283174A1 (en) 2020-06-02 2023-01-05 10X Genomics, Inc. Nucleic acid library methods
EP4162074B1 (en) 2020-06-08 2024-04-24 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
EP4165207A1 (en) 2020-06-10 2023-04-19 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
AU2021294334A1 (en) 2020-06-25 2023-02-02 10X Genomics, Inc. Spatial analysis of DNA methylation
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US20220017956A1 (en) * 2020-07-14 2022-01-20 Accugenomics, Inc. Endogenous complexity calibration ladder target
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
EP4225914A1 (en) 2020-10-06 2023-08-16 Keygene N.V. Targeted sequence addition
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
US20240002904A1 (en) 2020-11-24 2024-01-04 Keygene N.V. Targeted enrichment using nanopore selective sequencing
EP4251750A1 (en) 2020-11-25 2023-10-04 Koninklijke Nederlandse Akademie van Wetenschappen Ribosomal profiling in single cells
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
CN112695125B (zh) * 2021-01-29 2021-08-27 广东省农业科学院环境园艺研究所 一种卡特兰属ssr分子标记引物组合物及其应用
EP4196605A1 (en) 2021-09-01 2023-06-21 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
CN113832250B (zh) * 2021-09-29 2024-06-07 石家庄博瑞迪生物技术有限公司 一种基于mSNP技术检测玉米种子纯度的混样检测方法
WO2024121354A1 (en) 2022-12-08 2024-06-13 Keygene N.V. Duplex sequencing with covalently closed dna ends

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US24939A (en) 1859-08-02 Improvement in sewing-machines
EP0124990B1 (en) 1983-04-28 1987-08-19 Flexible Steel Lacing Company Method and apparatus for riveting fasteners to a belt
JPH04504356A (ja) 1989-01-31 1992-08-06 ユニバーシティ オブ マイアミ 染色体dnaの顕微解剖と増幅
ZA927323B (en) 1991-09-24 1993-08-30 Keygene Nv Selective restriction fragment amplification: A general method for DNA fingerprinting
US20100267023A1 (en) 1992-09-24 2010-10-21 Keygene N.V. Selective restriction fragment amplification: fingerprinting
AU1682595A (en) 1994-01-21 1995-08-08 North Carolina State University Methods for within family selection in woody perennials using genetic markers
EG23907A (en) 1994-08-01 2007-12-30 Delta & Pine Land Co Control of plant gene expression
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
JPH10509594A (ja) 1994-11-28 1998-09-22 イー・アイ・デユポン・ドウ・ヌムール・アンド・カンパニー 遺伝的多型の検出のための複合ミクロサテライトプライマー
US5565340A (en) 1995-01-27 1996-10-15 Clontech Laboratories, Inc. Method for suppressing DNA fragment amplification during PCR
AU6024598A (en) 1997-01-10 1998-08-03 Pioneer Hi-Bred International, Inc. Hybridization-based genetic amplification and analysis
US6090556A (en) 1997-04-07 2000-07-18 Japan Science & Technology Corporation Method for quantitatively determining the expression of a gene
DK0981609T3 (da) 1997-05-13 2001-11-12 Azign Bioscience As Fremgangsmåde til kloning af mRNA'er og display af differentielt udtrykte transkripter (DODET)
DE69838210T2 (de) 1997-12-15 2008-05-15 Csl Behring Gmbh Markierter Primer, geeignet für die Detektion von Nukleinsäuren
CA2273616A1 (en) * 1998-06-08 1999-12-08 The Board Of Trustees Of The Leland Stanford Junior University Method for parallel screening of allelic variation
US6124201A (en) 1998-06-12 2000-09-26 Advanced Micro Devices, Inc. Method for manufacturing semiconductors with self-aligning vias
ATE236997T1 (de) 1998-07-21 2003-04-15 Keygene Nv Verbesserte primer zur aflp amplifizierung
DE69816286T2 (de) 1998-07-29 2004-05-27 Keygene N.V. Verfahren zur Erkennung von Nukleinsäuremethylierungen durch AFLP
US6232067B1 (en) 1998-08-17 2001-05-15 The Perkin-Elmer Corporation Adapter directed expression analysis
US6703228B1 (en) 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
EP1001037A3 (en) 1998-09-28 2003-10-01 Whitehead Institute For Biomedical Research Pre-selection and isolation of single nucleotide polymorphisms
AU2144000A (en) 1998-10-27 2000-05-15 Affymetrix, Inc. Complexity management and analysis of genomic dna
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
EP1141384A2 (en) 1999-01-06 2001-10-10 Cornell Research Foundation, Inc. Method for accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing
US20040029155A1 (en) 1999-01-08 2004-02-12 Curagen Corporation Method for identifying a biomolecule
CA2358638A1 (en) 1999-01-12 2000-07-20 Quanam Medical Corporation Composition and methods for administration of water-insoluble paclitaxel derivatives
DE19911130A1 (de) 1999-03-12 2000-09-21 Hager Joerg Verfahren zur Identifikation chromosomaler Regionen und Gene
EP1190092A2 (en) 1999-04-06 2002-03-27 Yale University Fixed address analysis of sequence tags
AU773855B2 (en) 1999-04-09 2004-06-10 Keygene N.V. Method for the analysis of AFLP reaction mixtures using primer extension techniques
US20040031072A1 (en) 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US20020119448A1 (en) 1999-06-23 2002-08-29 Joseph A. Sorge Methods of enriching for and identifying polymorphisms
US20030204075A9 (en) 1999-08-09 2003-10-30 The Snp Consortium Identification and mapping of single nucleotide polymorphisms in the human genome
AU7712400A (en) 1999-09-23 2001-04-24 Gene Logic, Inc. Indexing populations
US6287778B1 (en) 1999-10-19 2001-09-11 Affymetrix, Inc. Allele detection using primer extension with sequence-coded identity tags
US6958225B2 (en) * 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
WO2001038572A1 (fr) 1999-11-19 2001-05-31 Takara Bio Inc. Methode d'amplification d'acides nucleiques
AU2001253063A1 (en) 2000-03-31 2001-10-15 Fred Hutchinson Cancer Research Center Reverse genetic strategy for identifying functional mutations in genes of known sequence
US20110131679A2 (en) 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
WO2001088189A2 (en) 2000-05-15 2001-11-22 Keygene N.V. Microsatellite-aflp®
US7300751B2 (en) 2000-06-30 2007-11-27 Syngenta Participations Ag Method for identification of genetic markers
GB0016742D0 (en) 2000-07-10 2000-08-30 Simeg Limited Diagnostic method
AU2002246612B2 (en) 2000-10-24 2007-11-01 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic DNA
CA2438574C (en) * 2001-02-15 2009-08-11 Hiroaki Sagawa Method of detecting nucleotide polymorphism
US7141364B1 (en) 2001-03-29 2006-11-28 Council Of Scientific And Industrial Research Universal primers for wildlife identification
US20040053236A1 (en) 2001-03-30 2004-03-18 Mccallum Claire M. Reverse genetic strategy for identifying functional mutations in genes of known sequences
WO2002083911A1 (en) 2001-04-12 2002-10-24 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Production of plants with increased tolerance to drought stress or with increased transpiration
EP1386005A1 (en) 2001-04-20 2004-02-04 Karolinska Innovations AB Methods for high throughput genome analysis using restriction site tagged microarrays
US20050009022A1 (en) 2001-07-06 2005-01-13 Weiner Michael P. Method for isolation of independent, parallel chemical micro-reactions using a porous filter
AU2002323509A1 (en) 2001-08-30 2003-03-18 Purdue Research Foundation Methods to produce transgenic plants resistant to osmotic stress
EP1288301A1 (en) 2001-08-31 2003-03-05 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Berlin Plant-derived resistance gene
US6902921B2 (en) 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US7504222B2 (en) * 2001-10-31 2009-03-17 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
CA2498668C (en) 2002-03-27 2012-05-08 Agrinomics Llc Generation of plants with improved drought tolerance
US6815167B2 (en) 2002-04-25 2004-11-09 Geneohm Sciences Amplification of DNA to produce single-stranded product of defined sequence and length
US20070065816A1 (en) 2002-05-17 2007-03-22 Affymetrix, Inc. Methods for genotyping
US7108976B2 (en) 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
US20040086912A1 (en) 2002-06-21 2004-05-06 Shujun Luo Method for detecting foreign DNA in a host Genome
US20060281082A1 (en) * 2002-09-05 2006-12-14 Jiahui Zhu Genome partitioning
US20040157238A1 (en) 2002-09-20 2004-08-12 Quinn John J. Method for detection of multiple nucleic acid sequence variations
EP1573009B1 (en) 2002-12-18 2011-09-21 Third Wave Technologies, Inc. Detection of small nucleic acids
JP2004208586A (ja) 2002-12-27 2004-07-29 Wakunaga Pharmaceut Co Ltd Hlaの検出
WO2004063323A2 (en) 2003-01-10 2004-07-29 Keygene N.V. Aflp-based method for integrating physical and genetic maps
JP4480715B2 (ja) 2003-01-29 2010-06-16 454 コーポレーション 二重末端シーケンシング
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
CN103289893B (zh) 2003-02-26 2015-11-18 凯利达基因组股份有限公司 通过杂交进行的随机阵列dna分析
JP4888876B2 (ja) * 2003-06-13 2012-02-29 田平 武 アルツハイマー病の治療のための組換えアデノ随伴ウィルスベクター
ATE506442T1 (de) 2003-06-24 2011-05-15 Agrigenetics Inc Erzeugung von pflanzen mit verbesserter toleranz gegenüber trockenheit
US7754945B2 (en) 2003-06-24 2010-07-13 Agrigenetics Inc. Generation of plants with improved drought tolerance
US7051935B2 (en) 2003-07-28 2006-05-30 Imageid Ltd. Color calibration for color bar codes
US7365179B2 (en) 2003-09-09 2008-04-29 Compass Genetics, Llc Multiplexed analytical platform
EP2302062A1 (en) 2003-10-20 2011-03-30 CropDesign N.V. Identification of E2F target genes and uses thereof
US20050153317A1 (en) 2003-10-24 2005-07-14 Metamorphix, Inc. Methods and systems for inferring traits to breed and manage non-beef livestock
WO2005065814A1 (en) 2004-01-07 2005-07-21 Solexa Limited Modified molecular arrays
US20050233354A1 (en) 2004-01-22 2005-10-20 Affymetrix, Inc. Genotyping degraded or mitochandrial DNA samples
US7217522B2 (en) 2004-02-12 2007-05-15 Campass Genetics Llc Genetic analysis by sequence-specific sorting
WO2006019407A2 (en) 2004-02-18 2006-02-23 The Trustees Of Boston University Method for detecting and quantifying rare mutations/polymorphisms
EP1574585A1 (en) 2004-03-12 2005-09-14 Plant Research International B.V. Method for selective amplification of DNA fragments for genetic fingerprinting
WO2006020147A2 (en) * 2004-07-28 2006-02-23 The Regents Of The University Of California Use of pcr-based techniques to analyze compositions of botanicals
JP4809594B2 (ja) 2004-08-02 2011-11-09 東京エレクトロン株式会社 検査装置
FR2876479B1 (fr) 2004-10-11 2006-12-15 Parkeon Machine a pieces a receptacle de pieces de monnaie amovible
US7220549B2 (en) 2004-12-30 2007-05-22 Helicos Biosciences Corporation Stabilizing a nucleic acid for nucleic acid sequencing
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
DK1885882T3 (da) 2005-05-10 2011-04-11 State Of Oregon Acting By & Through The State Board Of Higher Eduction On Behalf Of The University O Fremgangsmåder til kortlægning af polymorfier og polymorfi-mikroarray
DK1907583T4 (da) 2005-06-15 2020-01-27 Complete Genomics Inc Enkeltmolekyle-arrays til genetisk og kemisk analyse
ES2387878T3 (es) * 2005-06-23 2012-10-03 Keygene N.V. Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
US20090142758A1 (en) 2005-06-23 2009-06-04 Keygene N V Strategies for sequencing complex genomes using high throughput sequencing technologies
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US10316364B2 (en) 2005-09-29 2019-06-11 Keygene N.V. Method for identifying the source of an amplicon
ATE453728T1 (de) 2005-09-29 2010-01-15 Keygene Nv Screening mutagenisierter populationen mit hohem durchsatz
EP1960541B1 (en) 2005-11-14 2013-04-24 Keygene N.V. Method for high throughput screening of transposon tagging populations and massive parallel sequence identification of insertion sites
JP5452021B2 (ja) 2005-12-22 2014-03-26 キージーン ナムローゼ フェンノートシャップ ハイスループットaflp系多型検出法
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
PT2963127T (pt) 2006-04-04 2017-10-06 Keygene Nv Detecção de alto rendimento de marcadores moleculares com base em fragmentos de restrição
US8362325B2 (en) 2007-10-03 2013-01-29 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
US20090124758A1 (en) 2007-11-09 2009-05-14 Bridgestone Sports Co., Ltd. Golf ball
US20140051585A1 (en) * 2012-08-15 2014-02-20 Natera, Inc. Methods and compositions for reducing genetic library contamination
EP3004381A1 (en) 2013-06-07 2016-04-13 Keygene N.V. Method for targeted sequencing

Also Published As

Publication number Publication date
US20210202035A1 (en) 2021-07-01
CN102925561B (zh) 2015-09-09
CN105039313A (zh) 2015-11-11
US20160145689A1 (en) 2016-05-26
US20190147977A1 (en) 2019-05-16
US9447459B2 (en) 2016-09-20
JP2013063095A (ja) 2013-04-11
US9898576B2 (en) 2018-02-20
US20180247017A1 (en) 2018-08-30
US20150232924A1 (en) 2015-08-20
US20090036323A1 (en) 2009-02-05
EP1910562A1 (en) 2008-04-16
US9898577B2 (en) 2018-02-20
US20140274744A1 (en) 2014-09-18
ATE557105T1 (de) 2012-05-15
US8685889B2 (en) 2014-04-01
US10978175B2 (en) 2021-04-13
EP2302070B1 (en) 2012-08-22
US20180025111A1 (en) 2018-01-25
DK2292788T3 (da) 2012-07-23
EP2302070A3 (en) 2011-06-22
US8785353B2 (en) 2014-07-22
US20170206314A1 (en) 2017-07-20
DE602006018744D1 (de) 2011-01-20
ATE491045T1 (de) 2010-12-15
CN101641449B (zh) 2014-01-29
JP5220597B2 (ja) 2013-06-26
EP2302070A2 (en) 2011-03-30
EP2292788A1 (en) 2011-03-09
US9376716B2 (en) 2016-06-28
US20170137872A1 (en) 2017-05-18
US9023768B2 (en) 2015-05-05
JP5823994B2 (ja) 2015-11-25
US10235494B2 (en) 2019-03-19
US9453256B2 (en) 2016-09-27
US20180137241A1 (en) 2018-05-17
JP2008546404A (ja) 2008-12-25
EP1910562B1 (en) 2010-12-08
US9493820B2 (en) 2016-11-15
CN105039313B (zh) 2018-10-23
US20120316073A1 (en) 2012-12-13
US20140213462A1 (en) 2014-07-31
US20160060686A1 (en) 2016-03-03
ES2393318T3 (es) 2012-12-20
DK2302070T3 (da) 2012-11-26
CN101641449A (zh) 2010-02-03
US20200185056A1 (en) 2020-06-11
WO2006137733A1 (en) 2006-12-28
US10095832B2 (en) 2018-10-09
CN102925561A (zh) 2013-02-13
US9896721B2 (en) 2018-02-20
EP2292788B1 (en) 2012-05-09

Similar Documents

Publication Publication Date Title
ES2387878T3 (es) Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
ES2357549T3 (es) Estrategias para la identificación y detección de alto rendimiento de polimorfismos.
ES2391837T3 (es) Método para la detección de polimorfismos basados en AFLP de alto rendimiento
ES2829295T3 (es) Detección de alto rendimiento de marcadores moleculares basados en AFLP y secuenciación de alto rendimiento