ES2856598T3 - Construcción de alta eficiencia de bibliotecas de ADN - Google Patents

Construcción de alta eficiencia de bibliotecas de ADN Download PDF

Info

Publication number
ES2856598T3
ES2856598T3 ES16865029T ES16865029T ES2856598T3 ES 2856598 T3 ES2856598 T3 ES 2856598T3 ES 16865029 T ES16865029 T ES 16865029T ES 16865029 T ES16865029 T ES 16865029T ES 2856598 T3 ES2856598 T3 ES 2856598T3
Authority
ES
Spain
Prior art keywords
dna
oligonucleotide
sample
ligation
adapter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16865029T
Other languages
English (en)
Inventor
Christopher K Raymond
Lee P Lim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Resolution Bioscience Inc
Original Assignee
Resolution Bioscience Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Resolution Bioscience Inc filed Critical Resolution Bioscience Inc
Application granted granted Critical
Publication of ES2856598T3 publication Critical patent/ES2856598T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Un método para construir una biblioteca de ADN, que comprende: (a) eliminar los restos de fosfato terminales de uno o más fragmentos de ADN; (b) tratar los fragmentos de ADN desfosforilados con una o más enzimas de reparación de extremos para generar ADN de extremos reparados; (c) ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3' de cada hebra de los fragmentos de ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre-adaptador de ADNbc comprende (i) un oligonucleótido de hebra de ligación que está ligado al extremo 3' de cada hebra del ADN de extremos reparados y comprende una secuencia de anclaje; y (ii) un oligonucleótido de hebra pareja no de ligación; (d) desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación; y (e) tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de fragmentos de ADNbc contiguos, en la que el oligonucleótido de reparación se liga al extremo 5' de cada hebra de los fragmentos de ADN de extremos reparados.

Description

DESCRIPCIÓN
Construcción de alta eficiencia de bibliotecas de ADN
ANTECEDENTES
Campo técnico
La invención se refiere en general a composiciones y métodos mejorados para construir bibliotecas de ADN. En particular, la presente invención se refiere a la construcción eficiente de bibliotecas de clones de ADN para análisis genéticos cuantitativos.
Descripción de la técnica relacionada
Diversas muestras de ADN que son de interés para el análisis posterior se recogen en cantidades diminutas. A modo de ejemplo, el ADN libre de células (cfDNA) recolectado de la fracción plasmática de sangre completa está presente generalmente en cantidades de nanogramos por ml de plasma. Dado que un genoma humano diploide pesa 6 picogramos, esto significa que hay unos pocos centenares a unos pocos miles de genomas totales de información que se pueden aislar de una sola extracción de sangre.
En los pacientes con cáncer, el ADN del tumor se elimina al torrente sanguíneo en cantidades muy variables que van desde < 0,1% a > 10% de ADN circulante total. Las extracciones de sangre contienen solo unos pocos nanogramos de ADN, y si los genomas tumorales están presentes en el 0,1% del ADN circulante total, entonces solo están presentes de 1 a 10 copias totales del genoma tumoral. Para identificar inequívocamente el ADN del tumor mediante el análisis de secuencia, es necesario observar dos o más copias de una lesión genética específica del tumor. Sin embargo, existe la necesidad de maximizar la sensibilidad de detección del ADN, lo que significa que aún no se ha logrado una detección precisa del ADN tumoral en el intervalo de 0,1%.
Estas consideraciones iluminan el problema fundamental de que el análisis genético fiable de tumores sólidos usando sangre se rige, en parte, por la capacidad de aislar y analizar fragmentos genómicos raros. Además, muchas lesiones tumorales terapéuticamente procesables implican fusiones de genes, inserciones o supresiones significativas de la secuencia de ADN, y/o cambios en el número de copias de genes. Tales alteraciones son refractarias al análisis por PCR, en el que se deben conocer dos sitios de unión del cebador adyacentes, y en el que la variación de la copia se ve oscurecida por muchas rondas de amplificación diana.
En la actualidad, los métodos de recuperación de dianas se usan para un análisis exhaustivo de posibles lesiones en el ADN tumoral circulante. Dichos métodos de recuperación se basan en la creación de bibliotecas de clones de ADN. Desafortunadamente, los métodos actuales para crear estas bibliotecas de ADN son ineficaces, y solo un pequeño porcentaje de fragmentos de ADN se convierte con éxito en clones de biblioteca útiles. Los documentos w O 2015/117040 y WO 2015/134552 describen métodos de ligación de adaptadores a los extremos de moléculas de ADN bicatenario fragmentadas. El documento US 2014/274731 describe un método para generar una biblioteca de ADN etiquetada. El documento US 2014/274740 describe métodos para preparar una biblioteca de secuenciación para detectar anomalías cromosómicas usando ADN libre de células (cfDNA).
BREVE SUMARIO
La invención se define de acuerdo con las reivindicaciones adjuntas, y se refiere en general a composiciones y métodos para la unión de alta eficacia de adaptadores de ADN a fragmentos de ADN para generar bibliotecas de ADN para análisis genéticos cuantitativos.
En diversas realizaciones, se proporciona un método para construir una biblioteca de ADN, que comprende: eliminar los restos de fosfatos terminales de uno o más fragmentos de ADN; tratar los fragmentos de ADN desfosforilados con una o más enzimas de reparación de extremos para generar ADN de extremos reparados; ligar uno o más pre­ adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra del ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre-adaptador de ADNbc comprende un oligonucleótido de hebra de ligación, que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados y comprende una secuencia de anclaje, y un oligonucleótido de hebra pareja no de ligación; desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación; y tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de fragmentos de ADN bicatenarios contiguos, en la que el oligonucleótido de reparación está ligado al extremo 5’ de cada hebra de los fragmentos de ADN de extremos reparados.
En realizaciones particulares, el oligonucleótido de hebra pareja no de ligación comprende una modificación en el término 3’ que evita su ligación al extremo 5’ del ADN de extremos reparados y/o la formación del dímero de adaptador.
En ciertas realizaciones, la fuente del uno o más fragmentos de ADN es ADN seleccionado del grupo que consiste en: ADN genómico (ADNg), ADN complementario (ADNc), y ADN libre de células (cfDNA).
En realizaciones adicionales, la fuente del ADN es una muestra biológica seleccionada del grupo que consiste en: sangre, piel, cabello, folículos pilosos, saliva, mucosa oral, mucosa vaginal, sudor, lágrimas, tejidos epiteliales, orina, semen, fluido seminal, plasma seminal, líquido prostático, líquido pre-eyaculatorio (líquido de Cowper), excrementos, biopsia, fluido ascítico, líquido cefalorraquídeo, linfa, y muestra de extracto de tejido o muestra de biopsia.
En realizaciones particulares, la fuente del ADN es una muestra biológica seleccionada del grupo que consiste en: líquido amniótico, sangre, plasma, suero, semen, líquido linfático, líquido cefalorraquídeo, líquido ocular, orina, saliva, heces, moco, y sudor.
En realizaciones adicionales, los métodos comprenden además aislar el ADN de una muestra biológica de un sujeto. En algunas realizaciones, los métodos comprenden además fragmentar el ADN de una muestra biológica de un sujeto.
En ciertas realizaciones, los métodos comprenden además reparar el daño del uno o más fragmentos de ADN antes de la ligación.
En realizaciones particulares, el daño es una citosina desaminada (uracilo), un sitio abásico, metilación de guanina a O6MeG, muescas de ADN, espacios vacíos, o un dímero de timina.
En algunas realizaciones, el oligonucleótido de hebra de ligación comprende uno o más sitios de unión del cebador de PCR para la amplificación por PCR de la una o más moléculas de biblioteca de ADN bicatenarios contiguos. En realizaciones particulares, el oligonucleótido de hebra de ligación comprende uno o más códigos de lectura única. En realizaciones particulares, el oligonucleótido de hebra de ligación comprende uno o más códigos de muestra para la multiplexación de muestras.
En ciertas realizaciones, el oligonucleótido de hebra de ligación comprende una o más secuencias para la secuenciación del ADN.
En realizaciones particulares, la secuencia de anclaje del oligonucleótido de hebra de ligación es complementaria de la secuencia de anclaje del oligonucleótido de reparación.
En realizaciones adicionales, el sitio de unión del cebador de PCR del oligonucleótido de hebra de ligación es complementario del sitio de unión del cebador de PCR del oligonucleótido de reparación.
En realizaciones particulares, el uno o más adaptadores comprenden una pluralidad de especies de oligonucleótido de hebra de ligación.
En algunas realizaciones, el uno o más adaptadores comprenden una pluralidad de especies de oligonucleótido de reparación.
En realizaciones particulares, el sitio de unión del cebador del oligonucleótido de hebra de ligación no es complementario del sitio de unión del cebador del oligonucleótido de reparación.
En ciertas realizaciones, un cebador que se une al sitio de unión del cebador del oligonucleótido de hebra de ligación no se une sustancialmente al sitio de unión del cebador del oligonucleótido de reparación.
En realizaciones particulares, la biblioteca de ADN se amplifica para generar una biblioteca de clones de ADN. En algunas realizaciones, el análisis genético cuantitativo se realiza en una pluralidad de loci genéticos en la biblioteca de clones de ADN.
En realizaciones particulares, el análisis genético cuantitativo comprende la secuenciación de ADN para generar una pluralidad de lecturas de secuenciación.
En realizaciones adicionales, los métodos comprenden además el análisis bioinformático de la pluralidad de lecturas de secuenciación.
En realizaciones particulares, el análisis genético cuantitativo se realiza en una pluralidad de loci genéticos en la biblioteca de clones de ADN, y en el que el análisis bioinformático se usa: para cuantificar el número de equivalentes genómicos analizados en la biblioteca de clones de ADN; para detectar variantes genéticas en un locus genético diana; para detectar mutaciones dentro de un locus genético diana; para detectar fusiones genéticas dentro de un locus genético diana; y/o para medir las fluctuaciones del número de copias dentro de un locus genético diana.
En ciertas realizaciones, el análisis genético cuantitativo se usa para identificar o detectar una o más lesiones genéticas que causan o están asociadas con la enfermedad genética.
En realizaciones particulares, la lesión genética comprende una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes.
En diversas realizaciones, se proporciona un método para predecir, diagnosticar o monitorizar una enfermedad genética en un sujeto, que comprende: aislar u obtener ADN de una muestra biológica de un sujeto; eliminar los restos de fosfatos terminales del ADN; tratar el ADN desfosforilado con una o más enzimas de reparación de extremos para generar ADN de extremos reparados; ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra del ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre-adaptador de ADNbc comprende un oligonucleótido de hebra de ligación que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados, y un oligonucleótido de hebra pareja no de ligación; desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación; tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de fragmentos de ADN bicatenarios contiguos, en el que el oligonucleótido de reparación está ligado al extremo 5’ de cada hebra de los fragmentos de ADN de extremos reparados; amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN; determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; y realizar un análisis genético cuantitativo de uno o más loci genéticos diana asociados con la enfermedad genética en la biblioteca de clones de ADN, en el que la identificación o detección de una o más lesiones genéticas en uno o más loci genéticos diana es pronóstica para, diagnóstica de, o monitoriza la progresión de la enfermedad genética.
En ciertas realizaciones, el ADN es ADN genómico, ADN de muestras fijadas con formalina y embebidas en parafina (FFPE), ADNc, o cfDNA.
En realizaciones adicionales, la lesión genética comprende una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes.
En realizaciones particulares, la enfermedad genética es cáncer.
En diversas realizaciones, se proporciona un diagnóstico complementario para una enfermedad genética, que comprende: aislar u obtener ADN de una muestra biológica de un sujeto; eliminar los restos de fosfato terminales del ADN; tratar el ADN desfosforilado con una o más enzimas de reparación de extremos para generar ADN de extremos reparados; ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra del ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en el que cada pre-adaptador de ADNbc comprende un oligonucleótido de hebra de ligación que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados, y un oligonucleótido de hebra pareja no de ligación; desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación; tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de ADN bicatenarios contiguos, en la que el oligonucleótido de reparación está ligado al extremo 5’ de cada hebra de los fragmentos de ADN de extremos reparados; amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN; determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; y realizar un análisis genético cuantitativo de uno o más biomarcadores asociados con la enfermedad genética en la biblioteca de clones de ADN, en el que la detección de, o el fracaso en la detección de, al menos uno del uno o más biomarcadores indica si el sujeto debe ser tratado para la enfermedad genética.
En realizaciones adicionales, el ADN es ADN genómico, ADN de muestras fijadas con formalina y embebidas en parafina (FFPE), ADNc o cfDNA.
En realizaciones particulares, el biomarcador es una lesión genética.
En realizaciones adicionales, la lesión genética comprende una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes.
En ciertas realizaciones, la enfermedad genética es cáncer.
BREVE DESCRIPCIÓN DE LAS VARIAS VISTAS DE LOS DIBUJOS
La Figura 1 muestra la tecnología de ligación convencional frente a la de alta eficiencia (HE). (A) Los fragmentos de ADN diana se fosforilan en 5’ antes de la ligación de ADN con adaptadores dúplex no fosforilados. (B) Una ineficacia común con los enfoques de ligación convencionales es que los extremos 5’ del fragmento de ADN diana que carecen de un grupo fosfato no se ligan con adaptadores dúplex no fosforilados. (C) Ligación de fragmentos de ADN diana entre sí. (D) El adaptador dúplex que comprende un grupo fosfato 5’ requerido está ligado al extremo 3’ del fragmento de ADN diana. El círculo rayado del oligonucleótido de hebra pareja del adaptador representa un grupo de bloqueo 3’. (E) El grupo de bloqueo 3’ también evita que los adaptadores se liguen entre sí. (F) Los dúplex adaptadores ocasionales que carecen de un fosfato 5’ no se ligan a los fragmentos diana.
La Figura 2 muestra una imagen representativa de un gel de agarosa de la ligación completa del plásmido pUC19 desfosforilado digerido con Rsal a una serie de nueve adaptadores HE diferentes. Los fragmentos no ligados se indican en la línea de control, que está junto a los marcadores de peso molecular (MW) de 740, 500, 300, y 150 pb (de arriba a abajo). El cambio completo en la movilidad de los tres fragmentos de vector (flechas) indica la ligación completa de adaptadores a ambos extremos a través de los nueve adaptadores. Estos resultados muestran que la tecnología de ligación HE es generalizable.
La Figura 3 muestra métodos ejemplares para completar constructos ligados mediante HE. (A) El producto de ligación de HE es un oligonucleótido adaptador extendido 3’ unido al extremo 3’ de los fragmentos. (B) Una estrategia para “reparar” el producto de ligación inicial es añadir un oligonucleótido de reparación (hebra superior; verde); T4 polinucleótido cinasa puede añadir un fosfato (P) al extremo 5’ del fragmento diana, y puede usarse una ligasa de sellado de muescas, tal como Taq ADN ligasa, para ligar el oligonucleótido de reparación al fragmento diana. (C) Una estrategia alternativa es combinar el oligonucleótido adaptador complementario, una ADN polimerasa que tiene actividad de exonucleasa 5’ a 3’ (por ejemplo, BstI ADN polimerasa), y una Taq ADN ligasa. La BstI ADN polimerasa extiende el oligonucleótido de reparación al eliminar las bases 5’ del fragmento diana para exponer los fosfatos 5’ que permiten la ligación de sellado de muescas mediante Taq ADN ligasa. (D) Los oligonucleótidos adaptadores complementarios también se pueden diseñar para introducir características de secuencia adicionales en la hebra de ligación de HE original con la BstI ADN polimerasa.
La Figura 4 muestra la preparación de bibliotecas de ADN usando tecnología de ligación de HE. (A) Los fragmentos de ADN pueden poseer extremos “irregulares” heterogéneos, que pueden poseer o no grupos fosfato (P). El tratamiento de los fragmentos de ADN con una fosfatasa elimina los fosfatos 5’ y 3’ expuestos. A continuación, el ADN se puede tratar con enzimas que reparan el daño del ADN, tales como citosinas desaminadas (U), sitios abásicos (T), y dímeros de timina, y que “pulen” los salientes 5’ o 3’ para obtener extremos romos. (B) Los adaptadores se añaden a los fragmentos de ADN en dos etapas. En primer lugar, un adaptador dúplex que comprende una hebra de ligación fosforilada en 5’ y una hebra pareja bloqueada en 3’ se liga a los fragmentos diana. La hebra pareja, que tiene una temperatura de fusión de ~ 30°C, se elimina en etapas posteriores que se producen a temperaturas > 37°C. En segundo lugar, los oligonucleótidos de reparación se hibridan con los fragmentos ligados al adaptador; los oligonucleótidos de reparación se unen covalentemente al extremo 5’ del fragmento diana usando una estrategia de cinasa/ligasa o una estrategia de polimerasa/exonucleasa/ligasa (Figura 3). La extensión del cebador de la hebra de ligación inicial copia la información del oligo de reparación en un dúplex adaptador de longitud completa que es adecuado para el análisis posterior.
La Figura 5 muestra una estrategia de tecnología de ligación de HE para generar fragmentos de ADN adaptados a un cebador de PCR dual. En este esquema, la hebra de ligación porta secuencias adicionales (cebador 2) que sirven como un sitio de unión del cebador independiente. El oligonucleótido de reparación, aunque complementario de una porción de la hebra de ligación, tiene su propia secuencia divergente que sirve como un segundo sitio de unión del cebador de PCR (cebador 1). Los adaptadores completamente terminados permiten la amplificación de los fragmentos de la muestra de ADN usando métodos de PCR de cebador dual universal más convencionales.
DESCRIPCIÓN DETALLADA
A. RESUMEN
La presente invención contempla, en parte, composiciones y métodos para abordar la necesidad aguda en el campo de los análisis genéticos cuantitativos de métodos mejorados y altamente eficientes para clonar tales fragmentos de ADN para análisis posteriores.
Los métodos actuales para el análisis de ADN comprenden la ligación de adaptadores especializados a fragmentos de ADN (Figura 1). En las técnicas convencionales, los fragmentos de ADN diana se fosforilan en 5’ antes de la ligación de ADN para permitir la ligación covalente con adaptadores dúplex no fosforilados. El fragmento de ADN diana y el adaptador pueden tener extremos romos, o pueden compartir salientes complementarios (por ejemplo, T/A). (Figura 1A). Esto es un serio inconveniente debido a que no es posible asegurar que ambos extremos de todos los fragmentos de ADN diana estén fosforilados, y los extremos no fosforilados son incapaces de ligarse, y estos fragmentos diana se pierden de las bibliotecas posteriores. (Figura 1B). A modo de ejemplo no limitativo, si el 70% de los extremos de los fragmentos de ADN diana poseen un fosfato 5’, entonces solo el 49% de los fragmentos (0,7 x 0,7 x 100%), como máximo, podrían ligarse en ambos extremos del fragmento, y se requiere la ligación a ambos extremos para la clonación. Además, la presencia de fosfatos en 5’ en fragmentos de ADN diana promueve un artefacto indeseable separado en el que los fragmentos de ADN pueden ligarse entre sí (Figura 1C). Esto crea eventos artefacto de fusión de secuencias cromosómicas que pueden confundir la detección de reordenamientos cromosómicos específicos de la enfermedad.
En diversas realizaciones, la presente invención contempla, en parte, composiciones y métodos para unir de forma eficiente secuencias adaptadoras a fragmentos de ADN diana. En realizaciones particulares, los fosfatos se eliminan de los términos 5’ y 3’ de los fragmentos de ADN diana. Estos fragmentos desfosforilados se tratan entonces con enzimas que crean extremos romos del ADN, y opcionalmente con enzimas que reparan muchos tipos de daño en el ADN que pueden haber sido infligidos en el ADN, por ejemplo, citosina desaminada (uracilo), un sitio abásico, metilación de guanina a O6MeG, muescas, roturas de doble hebra, o un dímero de timina. El adaptador comprende un oligonucleótido de hebra de ligación en dúplex con un oligonucleótido de hebra pareja no de ligación. La hebra de ligación del adaptador porta el grupo fosfato 5’ requerido para la ligación a los fragmentos de ADN diana, y la hebra pareja comprende un grupo de bloqueo 3’ (Figura 1D). El grupo de bloqueo 3’ evita la formación de dímeros adaptador:adaptador (Figura IE). Como ocurre con los fragmentos de ADN, no todas las secuencias adaptadoras poseerán un fosfato 5’ (los enlaces fosfato terminales expuestos al disolvente son de forma inherente químicamente lábiles). Si bien estos adaptadores no fosforilados estarán presentes, solo se conectarán transitoriamente con la maquinaria de ligación (Figura 1F); el emparejamiento improductivo de dichos adaptadores con fragmentos se disocian rápidamente y son reemplazados por emparejamientos de adaptador:fragmento de ADN diana que pueden proporcionar una unión covalente productiva. Finalmente, el ~100% de los fragmentos de ADN diana se unen en ambos extremos con moléculas adaptadoras, lo que ilustra la alta eficiencia de las composiciones y métodos contemplados aquí para construir bibliotecas de ADN.
En diversas realizaciones, las composiciones y métodos contemplados aquí para la construcción de alta eficiencia de bibliotecas de ADN proporcionan un nuevo marco integral que aborda el análisis genético molecular usando ADN disponible de una variedad de fuentes biológicas. La clonación de ADN purificado introduce secuencias de ADN etiquetadas que conforman el análisis posterior, y permiten la amplificación de las bibliotecas de clones resultantes. La captura híbrida con oligonucleótidos específicos de la diana se usa para recuperar secuencias específicas para el análisis posterior. Se aplican a cada muestra medidas independientes del número de genomas presentes en la biblioteca, y estos ensayos proporcionan un medio para estimar la sensibilidad del ensayo. Los ensayos contemplados aquí proporcionan métodos fiables, reproducibles y robustos para el análisis, detección, diagnóstico o monitorización de estados, afecciones, o enfermedades genéticas.
La práctica de realizaciones particulares de la invención empleará, a menos que se indique específicamente lo contrario, métodos convencionales de química, bioquímica, química orgánica, biología molecular, microbiología, técnicas de ADN recombinante, genética, inmunología, y biología celular que están dentro de la habilidad de la técnica, muchas de las cuales se describen a continuación con fines ilustrativos. Estas técnicas se explican completamente en la bibliografía. Véanse, por ejemplo, Sambrook, et al., Molecular Cloning: A Laboratory Manual (3a Edición, 2001); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2a Edición, 1989); Maniatis et al., Molecular Cloning: A Laboratory Manual (1982); Ausubel et al., Current Protocols in Molecular Biology (John Wiley and Sons, actualizado en julio de 2008); Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience; Glover, DNA Cloning: A Practical Approach, vol. I & II (IRL Press, Oxford, 1985); Anand, Techniques for the Analysis of Complex Genomes, (Academic Press, New York, 1992); Transcription and Translation (B. Hames & S. Higgins, Eds., 1984); Perbal, A Practical Guide to Molecular Cloning (1984); y Harlow y Lane, Antibodies, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1998).
B. DEFINICIONES
A menos que se defina de otro modo, todos los términos técnicos y científicos usados aquí tienen el mismo significado que el que entienden comúnmente los expertos en la técnica a la que pertenece la invención. Aunque se puede usar cualquier método y material similar o equivalente a los descritos aquí en la práctica o ensayo de la presente invención, se describen aquí realizaciones preferidas de composiciones, métodos y materiales. Para los fines de la presente invención, a continuación, se definen los siguientes términos.
Los artículos “un”, “una” y “el/la” se usan aquí para referirse a uno o más de uno (es decir, a al menos uno) del objeto gramatical del artículo. A modo de ejemplo, “un elemento” significa un elemento o más de un elemento.
El uso de la alternativa (por ejemplo, “o”) debe entenderse que significa una, ambas, o cualquier combinación de las alternativas.
El término “y/o” debe entenderse que significa o bien una o ambas de las alternativas.
Como se usa aquí, la expresión “alrededor de” o “aproximadamente” se refiere a una cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud que varía hasta en un 15%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% o 1% con respecto a una cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud de referencia. En una realización, la expresión “alrededor de” o “aproximadamente” se refiere a un intervalo de cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño, cantidad, peso o longitud ± 15%, ± 10%, ± 9%, ± 8%, ± 7%, ± 6%, ± 5%, ± 4%, ± 3%, ± 2% o ± 1% sobre una cantidad, nivel, valor, número, frecuencia, porcentaje, dimensión, tamaño de referencia, cantidad, peso o longitud.
A lo largo de esta memoria descriptiva, a menos que el contexto requiera lo contrario, se entenderá que las palabras “comprender”, “comprende” y “que comprende” implican la inclusión de una etapa o elemento señalado o grupo de etapas o elementos, pero no la exclusión de cualquier otra etapa o elemento o grupo de etapas o elementos. En realizaciones particulares, los términos “incluye”, “tiene”, “contiene”, y “comprende” se usan como sinónimos.
Por “que consiste en” se entiende que incluye, y se limita a, todo lo que sigue a la frase “que consiste en”. De este modo, la frase “que consiste en” indica que los elementos enumerados son necesarios u obligatorios, y que no pueden estar presentes otros elementos.
Por “que consiste esencialmente en” se entiende que incluye cualquier elemento enumerado después de la frase, y se limita a otros elementos que no interfieren ni contribuyen a la actividad o acción especificada en la descripción para los elementos enumerados. De este modo, la frase “que consiste esencialmente en” indica que los elementos enumerados son necesarios u obligatorios, pero que ninguno de otros elementos es opcional y pueden estar presentes o no dependiendo de si afectan o no a la actividad o acción de los elementos enumerados.
La referencia a lo largo de esta memoria descriptiva a “una realización”, “una realización particular”, “una realización relacionada”, “una cierta realización”, “una realización adicional”, o “una realización más”, o combinaciones de las mismas, significa que un rasgo, estructura o característica particular descrita en relación con la realización se incluye en al menos una realización de la presente invención. De este modo, las apariciones de las frases anteriores en diversos lugares a lo largo de esta memoria descriptiva no se refieren necesariamente a la misma realización. Además, los rasgos, estructuras o características particulares pueden combinarse de cualquier manera adecuada en una o más realizaciones.
Como se usa aquí, el término “aislado” significa material que está sustancial o esencialmente libre de componentes que normalmente lo acompañan en su estado nativo. En realizaciones particulares, el término “obtenido” o “derivado” se usa como sinónimo de aislado.
Como se usa aquí, el término “ADN” se refiere a ácido desoxirribonucleico. En diversas realizaciones, el término ADN se refiere a ADN genómico, ADN recombinante, ADN sintético, ADN complementario (ADNc), o ADN libre de células (cfDNA). En una realización, ADN se refiere a ADN genómico o ADNc. En una realización, ADN se refiere a cfDNA. En realizaciones particulares, el ADN es un fragmento de ADN que comprende una “región diana”, que también se denomina fragmento de ADN diana en ciertas realizaciones. Las bibliotecas de ADN contempladas aquí incluyen bibliotecas de ADN genómico, bibliotecas de cfDNA, y bibliotecas de ADNc construidas a partir de ARN, por ejemplo, una biblioteca de expresión de ARN. En diversas realizaciones, las bibliotecas de ADN comprenden una o más secuencias de ADN y/o etiquetas adicionales.
Un “locus genético diana” o “región diana de ADN” se refiere a una región de interés dentro de una secuencia de ADN. En diversas realizaciones, se realizan análisis genéticos dirigidos en el locus genético diana. En realizaciones particulares, la región diana de ADN es una región de un gen que está asociado con un estado genético particular, afección genética, enfermedades genéticas; pruebas fetales; mosaicismo genético, pruebas de paternidad; predicción de la respuesta a un tratamiento farmacológico; diagnóstico o monitorización de una afección médica; obtención del perfil de microbioma; detección de patógenos; o monitorización de trasplantes de órganos.
Como se usa aquí, las expresiones “ADN circulante”, “ADN libre de células circulante” y “ADN libre de células” se usan a menudo de manera intercambiable, y se refieren al ADN que es ADN extracelular, ADN que se ha extruido de las células, o ADN que se ha liberado de células necróticas o apoptóticas.
Un “sujeto”, “individuo”, o “paciente”, como se usa aquí, incluye cualquier animal que presente un síntoma de una afección que pueda detectarse o identificarse con las composiciones contempladas aquí. Los sujetos adecuados incluyen animales de laboratorio (tales como ratón, rata, conejo, o cobaya), animales de granja (tales como caballos, vacas, ovejas, cerdos), y animales domésticos o mascotas (tal como un gato o un perro). En realizaciones particulares, el sujeto es un mamífero. En ciertas realizaciones, el sujeto es un primate no humano, y, en realizaciones preferidas, el sujeto es un ser humano.
Una “vasija de reacción” significa un recipiente adecuado para llevar a cabo una de las reacciones contempladas aquí. Los ejemplos ilustrativos de vasijas de reacción adecuadas para uso en realizaciones particulares incluyen, pero no se limitan a, tubos de ensayo, tubos de microcentrífuga (por ejemplo, tubos de PCR), placas de microtitulación (por ejemplo, placas de 96 pocillos, placas de 384 pocillos, placas de 1536 pocillos), portaobjetos, placas, matrices, y micromatrices.
C. CONSTRUCCIÓN DE ALTA EFICIENCIA DE LA BIBLIOTECA DE ADN
En realizaciones particulares, los métodos de construcción de bibliotecas de ADN contemplados aquí comprenden la ligación de de alta eficiencia de adaptadores a fragmentos de ADN diana.
(a) Fuente de ADN
Los métodos y composiciones contemplados aquí están diseñados para analizar, detectar, diagnosticar y/o monitorizar de manera eficiente estados genéticos, afecciones genéticas, enfermedades genéticas, mosaicismo genético, diagnóstico fetal, pruebas de paternidad, obtención perfiles de microbiomas, detección de patógenos, y monitorización de trasplantes de órganos, usando ADN como un analito. El ADN adecuado para uso en las composiciones y métodos contemplados aquí puede provenir de cualquier fuente conocida por los expertos en la técnica. En realizaciones particulares, el ADN es ADN genómico aislado de cualquier fuente, ADN de copia (ADNc) sintetizado a partir de ArN, o ADN libre de células (cfDNA).
En algunas realizaciones, el ADN es ADN de alto peso molecular (> 1000 pb). El uso de ADN de alto peso molecular en las composiciones y métodos contemplados aquí comprende a menudo una etapa de fragmentación. El ADN de alto peso molecular se puede fragmentar en alrededor de 25 a alrededor de 750 pares de bases, alrededor de 25 a alrededor de 500 pares de bases, alrededor de 25 a alrededor de 250 pares de bases, alrededor de 25 a alrededor de 200 pares de bases, alrededor de 25 a alrededor de 150 pares de bases, alrededor de 25 a alrededor de 100 pares de bases, alrededor de 25 a alrededor de 50 pares de bases, alrededor de 100 a alrededor de 200 pares de bases, alrededor de 150 a alrededor de 180 pares de bases, alrededor de 150 pares de bases, alrededor de 155 pares de bases, alrededor de 160 pares de bases, alrededor de 165 pares de bases, alrededor de 170 pares de bases, alrededor de 175 pares de bases, o alrededor de alrededor de 180 pares de bases.
Los métodos ilustrativos para fragmentar ADN adecuados para uso en realizaciones particulares de las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: cizallamiento, sonicación, digestión enzimática, que incluye digestiones de restricción, así como otros métodos. En realizaciones particulares, se puede emplear con la presente invención cualquier método conocido en la técnica para fragmentar ADN.
Las fuentes ilustrativas de ADN y ARN genómico (para generar ADNc) adecuadas para uso en realizaciones particulares de las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, muestras biológicas seleccionadas del grupo que consiste en: tejido cerebral, tejido óseo, tejido ocular, tejido olfativo, tejido muscular, tejido cardíaco, tejido pulmonar, tejido hepático, tejido pancreático, tejido renal, tejido gástrico, tejido intestinal, tejido del colon, sangre, piel, cabello, folículos pilosos, saliva, mucosa oral, mucosa vaginal, sudor, lágrimas, tejidos epiteliales, orina, semen, líquido seminal, plasma seminal, líquido prostático, líquido pre-eyaculatorio (líquido de Cowper), excrementos, biopsia, fluido ascítico, líquido cefalorraquídeo, linfa, y muestra de extracto de tejido o muestra de biopsia, y similares.
En realizaciones particulares, el ADN es cfDNA. La distribución de tamaños de cfDNA oscila desde fragmentos de alrededor de 150 pb hasta alrededor de 180 pb. La fragmentación puede ser el resultado de la actividad endonucleolítica y/o exonucleolítica, y presenta un desafío formidable para el análisis preciso, fiable y robusto de cfDNA. Otro desafío para el análisis de cfDNA es su corta vida media en el torrente sanguíneo, del orden de unos 15 minutos. Sin desear estar ligado a ninguna teoría en particular, la presente invención contempla, en parte, que el análisis de cfDNA es como una “biopsia líquida”, y es una instantánea en tiempo real de los procesos biológicos actuales.
En algunas realizaciones, el cfDNA aislado de la fracción del plasma sanguíneo puede estar sustancialmente contaminado con ADN genómico largo (> 10 kilopares de bases), de alto peso molecular, que se libera de las células sanguíneas nucleadas que se lisan durante el protocolo de recogida. Este ADN largo y contaminante, si se deja sin fragmentar, no se clona ni amplifica bien, y por lo tanto se pierde durante la preparación de la biblioteca aguas abajo. Sin embargo, en realizaciones particulares, en ausencia de fragmentación de ADN, los métodos de construcción de bibliotecas de ADN de alta eficiencia contemplados aquí clonan selectivamente fragmentos más cortos (<1000 pb) de una colección de tamaños de fragmentos presentes en una muestra de ADN. Sin desear estar ligado a ninguna teoría en particular, la clonación selectiva de fragmentos cortos de cfDNA de una muestra de ADN que es una mezcla de fragmentos largos y cortos es ventajosa en la construcción de una biopsia líquida.
Ejemplos ilustrativos de muestras biológicas que son fuentes adecuadas de las que aislar cfDNA en realizaciones particulares incluyen, pero no se limitan a, líquido amniótico, sangre, plasma, suero, semen, líquido linfático, líquido cefalorraquídeo, líquido ocular, orina, saliva, mucosas, y sudor.
En realizaciones particulares, la muestra biológica es sangre o plasma sanguíneo.
En ciertas realizaciones, la muestra de ADN podría derivar de tejidos embebidos tales como FFPE o aspirados con aguja fina, de hisopos destinados a interrogar las secuencias del microbioma presentes, de muestras forenses tales como cabello, ropa, huellas dactilares, etc., o de cualquier otra fuente de ADN que requiera los métodos de construcción de bibliotecas contemplados aquí que son especialmente eficientes para construir bibliotecas a partir de muestras de ADN de baja producción.
En ciertas realizaciones, los kits disponibles comercialmente y otros métodos conocidos por el experto en la técnica pueden usarse para aislar cfDNA directamente de las muestras biológicas de un paciente o de una muestra biológica obtenida previamente y opcionalmente estabilizada, por ejemplo, por congelación y/o adición de agentes quelantes de enzimas, incluyendo, pero sin limitarse a, EDTA, EGTa , u otros agentes quelantes específicos para cationes divalentes.
(b) Desfosforilación del ADN de entrada
En realizaciones particulares, el ADN de entrada, por ejemplo, fragmentos de ADN diana, se trata primero con una fosfatasa termolábil que elimina los restos de fosfato terminales. Véase, por ejemplo, la Figura 4A.
Ejemplos ilustrativos de fosfatasas termolábiles que son adecuadas para uso en realizaciones particulares de las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, fosfatasa alcalina termolábil APex™ (Epicentre Biotechnologies), fosfatasa termolábil NTPhos™ (Epicentre Biotechnologies), fosfatasa termolábi1HK™ (Epicentre Biotechnologies), y fosfatasa alcalina de gamba (SAP; NEB).
En una realización, la fosfatasa termolábil es SAP.
(c) Reversión del daño al ADN en los fragmentos de ADN diana
En realizaciones particulares, el ADN de entrada o ADN desfosforilado también se trata con una o más enzimas que revierten las fuentes comunes de daño del ADN, tales como la desaminación de citosinas a uracilo, adición oxidativa a guaninas, dímeros de timidina, pérdida de bases que conduce a sitios abásicos, muescas o espacios vacíos en una hebra de ADN dúplex, etc. Véase, por ejemplo, la Figura 4A.
En una realización, el daño interno al ADN se revierte usando una composición que comprende una o más de las siguientes enzimas: Taq ADN ligasa, endonucleasa IV, Bst ADN polimerasa, Fpg (8-oxoguanina ADN glicosilasa), uracil-ADN glicosilasa (UDG), T4 PDG (T4 endonucleasa V), endonucleasa VIII, y T4 ADN polimerasa.
En una realización, el daño interno al ADN se revierte usando una composición que comprende Taq ADN ligasa, endonucleasa IV, Bst ADN polimerasa, Fpg, uracil-ADN glicosilasa (UDG), T4 PDG (T4 endonucleasa V), endonucleasa VIII, y T4 ADN polimerasa.
(d) Generación de ADN de extremos reparados
En realizaciones particulares, las composiciones y métodos contemplados aquí comprenden generar fragmentos de ADN de extremos reparados. En ciertas realizaciones, los fragmentos de ADN se reparan en los extremos para generar fragmentos de ADN de extremos reparados con extremos romos, salientes 5’ o salientes 3’. Véase, por ejemplo, la Figura 4A. En realizaciones particulares, el ADN es cfDNA.
En algunas realizaciones, el ADN de extremos reparados contiene extremos romos. En algunas realizaciones, el ADN de extremos reparados se procesa para que contenga extremos romos. En realizaciones preferidas, los fragmentos de ADN se reparan en los extremos mediante una o más enzimas de reparación de extremos para generar fragmentos de ADN de extremos reparados con extremos romos.
Ejemplos ilustrativos de enzimas de reparación de extremos adecuadas para generar fragmentos de ADN de extremos romos en realizaciones particulares de las composiciones y métodos contemplados aquí incluyen ADN polimerasas que retienen la actividad de polimerización y la actividad de exonucleasa 3’ ® 5’, pero que carecen de actividad de exonucleasa 5’ ® 3’ (por ejemplo, T4 ADN polimerasa, fragmento de Klenow de ADN polimerasa I, etc.). La ADN polimerasa se usa para rellenar los salientes 5’ o para “masticar” los salientes 3’, dejando los fragmentos de ADN con extremos romos.
En algunas realizaciones, los extremos romos del ADN de extremos reparados se modifican adicionalmente para que contengan un saliente de un solo par de bases. En algunas realizaciones, el ADN de extremos reparados que contiene extremos romos se puede procesar adicionalmente para que contenga un saliente de adenina (A)/timina (T). En algunas realizaciones, el ADN de extremos reparados que contiene extremos romos puede procesarse adicionalmente para que contenga un saliente de adenina (A)/timina (T) como saliente de un solo par de bases. En algunas realizaciones, el ADN de extremos reparados tiene salientes 3’ sin molde. En algunas realizaciones, el ADN de extremos reparados se procesa para que contenga salientes 3’. En algunas realizaciones, el ADN de extremos reparados se procesa con transferasa terminal (TdT) para que contenga salientes 3’. En algunas realizaciones, TdT puede añadir una cola G. En algunas realizaciones, el ADN de extremos reparados se procesa para que contenga extremos salientes usando digestión parcial con cualquier enzima de restricción conocida (por ejemplo, con la enzima Sau3A, y similares).
(e) Ligación de pre-adaptadores al ADN de extremos reparados
En realizaciones particulares, las composiciones y métodos contemplados aquí comprenden ligar un pre-adaptador de ADN dúplex a cada extremo del ADN de extremos reparados.
Como se usa aquí, el término “pre-adaptador” se refiere a una molécula de ADN bicatenario o dúplex de ADN que
comprende un oligonucleótido de hebra de ligación y un oligonucleótido de hebra pareja. El pre-adaptador puede
ligarse a los fragmentos de ADN de extremos reparados usando cualquier ligasa adecuada. En una realización, la
ligasa es T4 ADN ligasa. Véanse, por ejemplo, las Figuras 4B y 5.
El “oligonucleótido de hebra de ligación” es un polinucleótido que comprende un fosfato 5’, y es capaz de ligarse a
cada extremo 3’ del fragmento de ADN de extremos reparados.
El “oligonucleótido de hebra pareja” es complementario y se hibrida con una parte de, o con todos, los nucleótidos
del oligonucleótido de hebra de ligación. El oligonucleótido de hebra pareja comprende una modificación en su
extremo 3’ que evita o inhibe sustancialmente que el oligonucleótido de hebra pareja se ligue a otro adaptador o a un
extremo 5’ fosforilado de un fragmento de ADN diana. Las modificaciones químicas del extremo 3’ de la hebra pareja
que pueden bloquear la ligación incluyen, pero no se limitan a, análogos nucleotídicos de didesoxirribosa, análogos
ribosílicos de 2-hidroxildesoxirribosa, y una amplia variedad de modificaciones químicas para el azúcar de ribosa.
Varias consideraciones entran en el diseño de la secuencia y el contenido de los oligonucleótidos de hebra de
ligación usados en el pre-adaptador. El oligonucleótido de hebra de ligación puede variar en longitud desde la
longitud mínima requerida para formar un dúplex de ADN estable a temperaturas en las que la ADN ligasa es activa
(~5 nt) hasta los oligonucleótidos que empujan los límites de las capacidades de síntesis actuales (>200 nt). En
realizaciones particulares, el oligonucleótido de hebra de ligación tiene alrededor de 8 a alrededor de 60 nucleótidos,
o alrededor de 8 a alrededor de 15 nucleótidos.
Como consideración adicional relacionada con el análisis NGS de fragmentos de ADN, el instrumento de
secuenciación utiliza las bases de ADN incorporadas por la hebra de ligación para calibrar las lecturas de
nucleótidos de ADN a lo largo del experimento de secuenciación del ADN. El instrumento y el software de estos
instrumentos requieren que las cuatro bases de ADN estén presentes en cada posición de base a lo largo de la
longitud de los 8-15 nucleótidos iniciales secuenciados, y esto incluye a menudo bases embebidas en la hebra
adaptadora de ligación. Por esta razón, a menudo se usan conjuntos de cuatro hebras de ligación que poseen
mutuamente las cuatro bases a lo largo de la longitud de la secuencia de la hebra de ligación. En las Tablas 1 y 2 se
muestran ejemplos no limitantes de tales oligonucleótidos de hebra de ligación.
En otras diversas realizaciones, el oligonucleótido de hebra de ligación comprende los siguientes elementos: (i) un
sitio de unión del cebador de PCR para la amplificación de la biblioteca de cebador único; (ii) un código de lectura de
5 nucleótidos que actúa para identificar de forma única cada lectura de secuenciación; (iii) una secuencia de anclaje
de 8 a 15 nucleótidos que actúa como una secuencia de identificación de muestras, permite la multiplexación de
muestras dentro de una serie de secuenciación; permite la calibración de las lecturas de nucleótidos adecuadas en
las lecturas de secuenciación, y actúa como un anclaje para la hibridación con un oligonucleótido de hebra pareja.
En otras diversas realizaciones, el oligonucleótido de hebra de ligación comprende una secuencia de anclaje de 8 a
15 nucleótidos que actúa como una secuencia de identificación de muestras, permite la multiplexación de muestras
dentro de una serie de secuenciación; permite la calibración de las lecturas de nucleótidos adecuadas en las
lecturas de secuenciación, y actúa como un anclaje para la hibridación con un oligonucleótido de hebra pareja.
En realizaciones particulares, un oligonucleótido de hebra de ligación comprende una o más secuencias de
cebadores de PCR, uno o más códigos de lectura, uno o más códigos de muestra, una o más secuencias de anclaje,
o dos o más nucleótidos 3’ que son sustratos de ligación eficientes. En realizaciones adicionales, el oligonucleótido
de hebra de ligación comprende además uno o más sitios de unión del cebador de secuenciación.
En realizaciones particulares, un oligonucleótido de hebra de ligación comprende una o más secuencias de unión de
cebadores de PCR para la amplificación de una biblioteca de ADN. En una realización, la secuencia de unión del
cebador de PCR tiene alrededor de 12 a alrededor de 40 nucleótidos, alrededor de 18 a alrededor de 40 nucleótidos,
, alrededor , alrededor , alrededor , alrededor , alrededor
Figure imgf000010_0001
, alrededor de 38 nucleótidos, alrededor de 39 nucleótidos, o alrededor de 40 nucleótidos, o más.
En una realización, la secuencia de unión del cebador de PCR tiene alrededor de 25 nucleótidos.
En realizaciones particulares, un oligonucleótido de hebra de ligación comprende una o más secuencias de código
de lectura. Como se usa aquí, el término “código de lectura” se refiere a un polinucleótido que se usa para identificar
lecturas de secuenciación únicas. En una realización, el código de lectura es una secuencia aleatoria de nucleótidos.
En una realización, el código de lectura tiene alrededor de 1 nucleótido, alrededor de 2 nucleótidos, alrededor de 3 nucleótidos, alrededor de 4 nucleótidos, alrededor de 5 nucleótidos, alrededor de 6 nucleótidos, alrededor de 7 nucleótidos, alrededor de 8 nucleótidos, alrededor de 9 nucleótidos, alrededor de 10 nucleótidos, o más.
A modo de ejemplo no limitativo, un código de lectura de 5 nucleótidos consiste en 256 posibles secuencias únicas en las que cada código escogido tiene 2 nucleótidos diferentes de todos los demás códigos en el conjunto. Esta característica permite diferenciar las lecturas únicas y distintas de las lecturas que parecen ser únicas debido a un error de secuenciación en la región del código. En realizaciones particulares, los códigos que se han determinado empíricamente que interfieren con la función del adaptador, debido a combinaciones de secuencias particulares, pueden excluirse del uso, por ejemplo, siete códigos de los 256 tenían una sobrerrepresentación de nucleótidos G y se excluyeron.
En otras realizaciones, cada código de lectura de 5, 6, 7, 8, 9, 10 o más nucleótidos puede diferir en 2, 3, 4, o 5 nucleótidos de todos los demás códigos de lectura.
En una realización, el código de lectura tiene alrededor de 5 nucleótidos, y opcionalmente difiere todos los demás códigos de lectura en 2 nucleótidos.
En realizaciones particulares, un oligonucleótido de hebra de ligación comprende una o más secuencias de código de muestra. Como se usa aquí, la expresión “código de muestra” se refiere a un polinucleótido que se usa para identificar la muestra. El código de muestra también es útil para establecer reacciones de secuenciación multiplex debido a que cada código de muestra es único para la muestra y, de este modo, puede usarse para identificar una lectura de una muestra particular dentro de una reacción de secuenciación multiplexada.
En una realización, el código de muestra comprende una secuencia de alrededor de 1, alrededor de 2 nucleótidos, alrededor de 3 nucleótidos, alrededor de 4 nucleótidos, o alrededor de 5 nucleótidos, o más. En otra realización, cada código de muestra de 2, 3, 4, 5 o más nucleótidos puede diferir de cualquier otro código de muestra en 2, 3, 4, o 5 nucleótidos.
En una realización, el código de muestra tiene alrededor de tres nucleótidos, y se diferencia de cualquier otro código de muestra usado en otras muestras en dos nucleótidos.
En realizaciones particulares, un oligonucleótido de hebra de ligación comprende una o más secuencias de anclaje. Como se usa aquí, una “secuencia de anclaje” se refiere a una secuencia nucleotídica de al menos 8 nucleótidos, al menos 10 nucleótidos, al menos 12 nucleótidos, al menos 14 nucleótidos, o al menos 16 nucleótidos que se hibrida con un oligonucleótido de hebra pareja y que comprende las siguientes propiedades: (1) cada secuencia de anclaje es parte de una familia de cuatro secuencias de anclaje que representan colectivamente cada una de las cuatro posibles bases de ADN en cada sitio dentro de la extensión; esta característica, representación de base equilibrada, es útil para calibrar la lectura de nucleótidos adecuada en lecturas de secuenciación en realizaciones particulares; y (2) cada secuencia de anclaje está compuesta por números iguales de A C y G T, y de este modo, cada secuencia de anclaje comparte alrededor de la misma temperatura de fusión y estabilidad del dúplex que cualquier otra secuencia de anclaje en un conjunto de cuatro. En una realización, la secuencia de anclaje o una parte de la misma también sirve para identificar la muestra, permite la multiplexación de la muestra dentro de una serie de secuenciación, permite la calibración de las lecturas de nucleótidos adecuadas en las lecturas de secuenciación, y actúa como un anclaje para la hibridación con un oligonucleótido de hebra pareja.
Además, varias consideraciones están involucradas en el diseño del oligonucleótido de hebra pareja no de ligación. El oligonucleótido de hebra pareja es al menos parcialmente complementario (>5 nt) con el oligonucleótido de hebra de ligación en la región que forma el extremo romo fosforilado. En segundo lugar, el extremo 3’ del oligonucleótido de hebra pareja se modifica para bloquear o inhibir sustancialmente que el oligonucleótido se convierta en un sustrato de ligación, en particular en la formación de dímeros adaptadores autoligados. El oligonucleótido de hebra pareja está diseñado para formar un dúplex estable con la hebra de ligación a temperaturas en las que se realizan las ligaciones (< 22°C), pero también está diseñado para disociarse del oligonucleótido de hebra de ligación a temperaturas en las que se incorpora un oligonucleótido de reparación en el adaptador (> 37°C). Esta consideración de diseño se representa como el oligonucleótido de hebra pareja disociado que se muestra en las Figuras 4B y 5 en la generación de los complejos de adaptador/ADN de extremos reparados, ya que la reacción se desplaza desde la ligación a la etapa de terminación del adaptador que está mediada por oligonucleótidos de reparación.
En realizaciones particulares, las composiciones y métodos contemplados aquí comprenden una etapa de ligación en la que se liga un pre-adaptador al ADN de extremos reparados para generar una biblioteca de ADN “etiquetados”. En algunas realizaciones, se emplea una única especie de pre-adaptador. En algunas realizaciones, se emplean dos, tres, cuatro o cinco especies de pre-adaptador. En algunas realizaciones, un pre-adaptador de secuencia idéntica se liga a cada extremo del ADN de extremos reparados fragmentado.
En una realización, una pluralidad de especies de pre-adaptador se liga a una biblioteca de ADN de extremos reparados. Cada uno de la pluralidad de pre-adaptadores puede comprender uno o más sitios de unión del cebador para la amplificación de la biblioteca de ADN, una o más secuencias de código de lectura, una o más secuencias para la multiplexación de muestras, una o más secuencias de anclaje, o una o más secuencias para la secuenciación del ADN.
(f) Formación de complejos de adaptador/ADN de extremos reparados
En realizaciones particulares, las composiciones y métodos contemplados aquí comprenden desplazar el oligonucleótido de hebra pareja del complejo de pre-adaptador/ADN de extremos reparados y reemplazar el oligonucleótido de hebra pareja desplazado por un oligonucleótido de reparación para generar un complejo de adaptador/ADN de extremos reparados. Véase, por ejemplo, la Figura 3. En realizaciones particulares, el diseño del adaptador puede manipularse para permitir estrategias de amplificación de cebador único o cebador dual. Véanse, por ejemplo, las Figuras 4A y 5.
En realizaciones particulares, las composiciones y métodos contemplados aquí comprenden una etapa de ligación en la que un adaptador que comprende un oligonucleótido de hebra de ligación y un oligonucleótido de reparación se liga al ADN de extremos reparados para generar una biblioteca de ADN “etiquetados”. En algunas realizaciones, se emplea una única especie de adaptador. En algunas realizaciones, se emplean dos, tres, cuatro o cinco especies de adaptador. En algunas realizaciones, un adaptador de secuencia idéntica se liga a cada extremo del ADN de extremos reparados fragmentado.
Las consideraciones de diseño del oligonucleótido de hebra pareja permiten que sea desplazado del complejo de pre-adaptador/ADN de extremos reparados debido a que se disocia del oligonucleótido de hebra de ligación a temperaturas a las que el oligonucleótido de reparación se hibrida con el oligonucleótido de hebra de ligación (por ejemplo, > 37°C) y a temperaturas a las que se llevan a cabo las etapas enzimáticas para incorporar el oligonucleótido de reparación en un complejo de adaptador/ADN de extremos reparados, para generar una molécula de biblioteca de ADN bicatenarios contiguos (por ejemplo, > 37°C).
Como se usa aquí, la expresión “oligonucleótido de reparación” se refiere a una secuencia polinucleotídica que es complementaria y se hibrida con una parte de, o con todos, los nucleótidos del oligonucleótido de hebra de ligación. El oligonucleótido de reparación puede variar en longitud desde la longitud mínima requerida para formar un dúplex de ADN estable a temperaturas en las que la ligasa de ADN está activa (~8 nt) hasta los oligonucleótidos que empujan los límites de las capacidades de síntesis actuales (>200 nt). En realizaciones particulares, el “oligonucleótido de reparación” incluye secuencias de ADN funcionales adicionales que no están necesariamente presentes en el oligonucleótido de hebra de ligación.
En realizaciones particulares, el oligonucleótido de hebra de ligación tiene alrededor de 8 a alrededor de 15 nucleótidos, y el oligonucleótido de reparación tiene 35 a 60 nucleótidos. En este diseño, la secuencia del oligonucleótido de hebra de ligación se extiende por extensión del cebador y genera una secuencia nucleotídica complementaria del oligonucleótido de reparación. Este diseño produciría sitios de unión del cebador de PCR idénticos. Los sitios de unión del cebador de PCR idénticos permiten una estrategia de amplificación de biblioteca de cebadores únicos. Véanse, por ejemplo, las Figuras 3D y 4A.
En realizaciones particulares, el oligonucleótido de hebra de ligación tiene alrededor de 35 a alrededor de 60 nucleótidos, y el oligonucleótido de reparación es completamente complementario del oligonucleótido de hebra de ligación. Los sitios de unión del cebador de PCR idénticos permiten una estrategia de amplificación de biblioteca de cebadores únicos. Véase, por ejemplo, la Figura 4A.
En realizaciones particulares, el oligonucleótido de hebra de ligación tiene alrededor de 35 a alrededor de 60 nucleótidos, y el oligonucleótido de reparación tiene alrededor de 35 a alrededor de 60 nucleótidos, y los dos oligonucleótidos son complementarios, pero para los sitios de unión del cebador de PCR. Los diferentes sitios de unión del cebador de PCR permiten una estrategia de amplificación de la biblioteca de cebadores duales. Véase, por ejemplo, la Figura 5.
En realizaciones preferidas, el oligonucleótido de hebra de ligación comprende los siguientes elementos: (i) un sitio de unión del cebador de PCR para la amplificación de la biblioteca de cebador único; (ii) un código de lectura de 5 nucleótidos que actúa para identificar de forma única cada lectura de secuenciación; (iii) una secuencia de anclaje de 8 a 15 nucleótidos que es parcial o completamente complementaria de la secuencia de anclaje del oligonucleótido de hebra de ligación.
En otras realizaciones, el oligonucleótido de hebra de ligación comprende una secuencia de anclaje de 8 a 15 nucleótidos que es parcial o completamente complementaria de la secuencia de anclaje del oligonucleótido de hebra de ligación.
En realizaciones particulares, un oligonucleótido de reparación comprende una o más secuencias de cebadores de PCR, uno o más códigos de lectura, uno o más códigos de muestra, una o más secuencias de anclaje, o dos o más nucleótidos 3’ que son sustratos de ligación eficientes. En realizaciones adicionales, el oligonucleótido de reparación comprende además uno o más sitios de unión del cebador de secuenciación.
En realizaciones particulares, un oligonucleótido de reparación comprende (i) una o más secuencias de unión del cebador de PCR que son complementarias de los sitios de unión del cebador de PCR en el oligonucleótido de hebra de ligación (permite la amplificación de la biblioteca de ADN de un cebador único), o (ii) una o más secuencias de unión de cebadores de PCR que no son complementarias de los sitios de unión del cebador de PCR en el oligonucleótido de hebra de ligación (permite la amplificación de la biblioteca de ADN de cebador dual. En una realización, la secuencia de unión del cebador de PCR tiene alrededor de 12 a alrededor de 40 nucleótidos, alrededor de 18 a alrededor de 40 nucleótidos, alrededor de 20 a alrededor de 35 nucleótidos, o alrededor de 20 a alrededor de 30 nucleótidos. En otra realización, la secuencia de unión del cebador de PCR tiene alrededor de 12 nucleótidos, alrededor de 13 nucleótidos, alrededor de 14 nucleótidos, alrededor de 15 nucleótidos, alrededor de 16 nucleótidos, alrededor de 17 nucleótidos, alrededor de 18 nucleótidos, alrededor de 19 nucleótidos, alrededor de 20 nucleótidos, alrededor de 21 nucleótidos, alrededor de 22 nucleótidos, alrededor de 23 nucleótidos, alrededor de 24 nucleótidos, alrededor de 25 nucleótidos, alrededor de 26 nucleótidos, alrededor de 27 nucleótidos, alrededor de 28 nucleótidos, alrededor de 29 nucleótidos, alrededor de 30 nucleótidos, alrededor de 31 nucleótidos, alrededor de 32 nucleótidos, alrededor de 33 nucleótidos, alrededor de 34 nucleótidos, alrededor de 35 nucleótidos, alrededor de 36 nucleótidos, alrededor de 37 nucleótidos, alrededor de 38 nucleótidos, alrededor de 39 nucleótidos, o alrededor de 40 nucleótidos o más.
En una realización, la secuencia de unión del cebador de PCR tiene alrededor de 25 nucleótidos.
En realizaciones particulares, un oligonucleótido de reparación comprende una o más secuencias de código de lectura. En una realización, el código de lectura es una secuencia aleatoria de nucleótidos. En una realización, el código de lectura tiene alrededor de 1 nucleótido, alrededor de 2 nucleótidos, alrededor de 3 nucleótidos, alrededor de 4 nucleótidos, alrededor de 5 nucleótidos, alrededor de 6 nucleótidos, alrededor de 7 nucleótidos, alrededor de 8 nucleótidos, alrededor de 9 nucleótidos, alrededor de 10 nucleótidos, o más.
A modo de ejemplo no limitativo, un código de lectura de 5 nucleótidos consiste en 256 posibles secuencias únicas en las que cada código escogido tiene 2 nucleótidos diferentes de todos los demás códigos en el conjunto. Esta característica permite diferenciar las lecturas únicas y distintas de las lecturas que parecen ser únicas debido a un error de secuenciación en la región del código. En realizaciones particulares, los códigos que se han determinado empíricamente que interfieren con la función del adaptador, debido a combinaciones de secuencias particulares, pueden excluirse del uso, por ejemplo, siete códigos de los 256 tenían una sobrerrepresentación de nucleótidos G y se excluyeron.
En otras realizaciones, cada código de lectura de 5, 6, 7, 8, 9, 10 o más nucleótidos puede diferir en 2, 3, 4, o 5 nucleótidos de todos los demás códigos de lectura.
En una realización, el código de lectura tiene alrededor de 5 nucleótidos, y opcionalmente difiere de todos los demás códigos de lectura en 2 nucleótidos.
En realizaciones particulares, un oligonucleótido de reparación comprende una o más secuencias de código de muestra. En una realización, el código de muestra comprende una secuencia que tiene alrededor de 1, alrededor de 2 nucleótidos, alrededor de 3 nucleótidos, alrededor de 4 nucleótidos, o alrededor de 5 nucleótidos, o más. En otra realización, cada código de muestra de 2, 3, 4, 5 o más nucleótidos puede diferir de cualquier otro código de muestra en 2, 3, 4 o 5 nucleótidos.
En una realización, el código de muestra tiene alrededor de tres nucleótidos, y se diferencia de cualquier otro código de muestra usado en otras muestras en dos nucleótidos.
En realizaciones particulares, un oligonucleótido de reparación comprende una o más secuencias de anclaje complementarias de la una o más secuencias de anclaje del oligonucleótido de hebra de ligación.
Sin desear estar ligado a ninguna teoría en particular, se contemplan al menos dos estrategias ejemplares para incorporar el oligonucleótido de reparación en un complejo de adaptador/ADN de extremos reparados.
En una realización, el oligonucleótido de hebra pareja se desplaza del complejo de pre-adaptador/ADN de extremos reparados; se añade el oligonucleótido de reparación, y se deja hibridar con la hebra de ligación; se utiliza polinucleótido cinasa, por ejemplo, T4 polinucleótido cinasa, para añadir un grupo fosfato al extremo 5’ del fragmento de ADN de extremos reparados; y se utiliza la ADN ligasa para reparar la muesca que existe entre el extremo 5’ del oligonucleótido de reparación y el extremo 3’ del fragmento de ADN de extremos reparados. En realizaciones particulares, la ADN ligasa es una ligasa específica de muesca termoestable que tiene actividad en un amplio intervalo de temperaturas, que incluye, pero no se limita a, Taq ADN ligasa, ADN ligasa de E. coli, ligasa 9° North (NEB), y cualquier otra ligasa que pueda sellar una muesca fosforilada. Véanse, por ejemplo, las Figuras 3A y 3B. En otra realización, el oligonucleótido de hebra pareja se desplaza del complejo de pre-adaptador/ADN de extremos reparados; se añade el oligonucleótido de reparación, y se deja hibridar con la hebra de ligación; una ADN polimerasa de baja procesividad que tiene una actividad de exonucleasa 5’ ® 3’ (y ninguna actividad de exonucleasa 3’ ® 5’ intrínseca) extiende el extremo 3’ del oligonucleótido de hebra de ligación y, además, elimina el nucleótido terminal 5’ desfosforilado y los nucleótidos adyacentes con una actividad de exonucleasa 5’ ® 3’ exponiendo de ese modo los grupos fosfato 5’ ligables y reemplazándolos por bases incorporadas que dejan una muesca cuando la enzima se disocia; y se utiliza ADN ligasa, por ejemplo, Taq ADN ligasa, para reparar las muescas.
Ejemplos ilustrativos de ADN polimerasas de baja procesividad adecuadas para uso en realizaciones particulares de las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, Taq ADN polimerasa y BstI ADN polimerasa.
D. AMPLIFICACIÓN DE LA BIBLIOTECA DE ADN
En realizaciones particulares, los métodos contemplados aquí comprenden la amplificación de una biblioteca de ADN para generar una biblioteca de clones de ADN o una biblioteca de clones de ADN. En realizaciones particulares, el ADN es cfDNA. Cada molécula de la biblioteca de ADN comprende un adaptador ligado a cada extremo de un ADN de extremos reparados, y cada adaptador comprende uno o más sitios de unión del cebador de PCR. En una realización, se ligan diferentes adaptadores a diferentes extremos del ADN de extremos reparados. En una realización, el mismo adaptador se liga a ambos extremos del ADN. La ligación del mismo adaptador a ambos extremos del ADN de extremos reparados permite la amplificación por PCR con una secuencia de cebador único. En realizaciones particulares, una porción de la biblioteca de ADN ligado al adaptador se amplificará usando técnicas de PCR estándar con una secuencia de cebador único que dirige la amplificación. En una realización, la secuencia de cebador único tiene alrededor de 25 nucleótidos, opcionalmente con una Tm proyectada de > 55°C en condiciones estándar de fuerza iónica.
En una realización, el adaptador ligado al extremo 3’ de un fragmento de ADN de extremos reparados comprende un sitio de unión del cebador de PCR diferente del adaptador ligado al extremo 5’ del fragmento de ADN de extremos reparados. En realizaciones particulares, una parte de la biblioteca de ADN ligado al adaptador se amplificará usando técnicas de PCR estándar con dos cebadores que dirigen la amplificación.
En realizaciones particulares, los picogramos de la biblioteca de ADN inicial se amplifican en microgramos de clones de ADN, lo que implica una amplificación de 10.000 veces. La cantidad de producto amplificado se puede medir usando métodos conocidos en la técnica, por ejemplo, cuantificación en un instrumento Qubit 2.0 o Nanodrop. E. MÉTODOS DE ANÁLISIS GENÉTICO DEL ADN
En diversas realizaciones, se proporciona un método para el análisis genético de ADN. En realizaciones particulares, el ADN es cfDNA. cfDNA es ADN libre de células que se encuentra en el plasma u otros fluidos corporales.
En realizaciones particulares, un método para el análisis genético de ADN comprende: generar y amplificar una biblioteca de ADN, determinar el número de equivalentes genómicos en la biblioteca de ADN; y realizar un análisis genético cuantitativo de uno o más loci diana genómicos.
1. DETERMINACIÓN DEL NÚMERO DE EQUIVALENTES GENÓMICOS
En diversas realizaciones, un método para el análisis genético de ADN comprende determinar el número de equivalentes genómicos en la biblioteca de clones de ADN. Como se usa aquí, la expresión “equivalente genómico” se refiere al número de copias del genoma en cada biblioteca. Un desafío importante al que se enfrentan las composiciones y métodos contemplados aquí es lograr una sensibilidad de ensayo suficiente para detectar y analizar mutaciones genéticas raras o diferencias en la secuencia genética. Para determinar el valor de sensibilidad del ensayo muestra por muestra, se miden los números de secuencias diferentes y distintas que están presentes en cada muestra, midiendo el número de equivalentes genómicos que están presentes en una biblioteca de secuenciación. Para establecer la sensibilidad, se debe medir el número de equivalentes genómicos para cada biblioteca de muestras.
El número de equivalentes genómicos se puede determinar mediante un ensayo de qPCR o mediante el recuento basado en bioinformática después de realizar la secuenciación. En el flujo del procedimiento de muestras clínicas, la medida de qPCR de los equivalentes genómicos se utiliza como una etapa de control de calidad para las bibliotecas de ADN. Establece una expectativa de sensibilidad del ensayo antes del análisis de secuencia, y permite excluir una muestra del análisis si su biblioteca de clones de ADN correspondiente carece de la profundidad requerida de equivalentes genómicos. En última instancia, el recuento de equivalentes genómicos basado en la bioinformática también se utiliza para identificar los equivalentes genómicos - y por lo tanto la sensibilidad del ensayo y las estimaciones de falsos negativos - para cada biblioteca de clones de ADN dada.
El ensayo de qPCR empírico y los ensayos de recuento estadístico deben estar bien correlacionados. En los casos en los que la secuenciación no revele la profundidad de la secuencia en una biblioteca de clones de ADN, es posible que se requiera el reprocesamiento de la biblioteca de clones de ADN y/o una secuenciación adicional.
En una realización, los equivalentes genómicos en una biblioteca de clones de ADN se determinan usando un ensayo de PCR cuantitativa (qPCR). En una realización particular, se usa una biblioteca estándar de concentración conocida para construir una curva estándar, y las medidas del ensayo de qPCR se ajustan a la curva estándar resultante, y se deriva del ajuste un valor para los equivalentes genómicos. El número de equivalentes genómicos medidos por los ensayos basados en repetición proporciona un rendimiento de biblioteca a biblioteca más consistente y una mejor alineación entre las estimaciones de qPCR de equivalentes genómicos y equivalentes de etiqueta contados bioinformáticamente en las series de secuenciación.
Los ejemplos ilustrativos de repeticiones adecuadas para uso en los ensayos de equivalentes genómicos basados en repeticiones contemplados aquí incluyen, pero no se limitan a: elementos nucleares intercalados cortos (SINE), por ejemplo repeticiones Alu; elementos nucleares intercalados largos (LINE), por ejemplo LINE1, LINE2, LINE3; elementos de repetición de microsatélites, por ejemplo repeticiones cortas en tándem (STR), repeticiones de secuencia simple (SSR); y repeticiones intercaladas de mamíferos (MIR).
En una realización, la repetición es una repetición Alu.
2. ANÁLISIS GENÉTICO CUANTITATIVO
En diversas realizaciones, un método para el análisis genético de ADN comprende el análisis genético cuantitativo de uno o más loci genéticos diana de los clones de la biblioteca de ADN. El análisis genético cuantitativo comprende una o más de, o todas, las siguientes etapas: capturar clones de ADN que comprenden un locus genético diana; amplificar el locus genético diana capturado; secuenciar el locus genético diana capturado amplificado; y analizar bioinformáticamente las lecturas de secuencias resultantes.
(a) Captura del locus genético diana
La presente invención contempla, en parte, un módulo de sonda de captura que es multifuncional y está diseñado para retener la eficiencia y fiabilidad de sondas más grandes pero que minimiza la generación de secuencias no informativas en una biblioteca de clones de ADN. Un “módulo de sonda de captura” se refiere a un polinucleótido que comprende una secuencia de sonda de captura y una secuencia de cola. En realizaciones particulares, la secuencia del módulo de sonda de captura o una porción de la misma sirve como un sitio de unión del cebador para uno o más cebadores de secuenciación.
En realizaciones particulares, un módulo de sonda de captura comprende una sonda de captura. Como se usa aquí, una “sonda de captura” se refiere a un polinucleótido que comprende una región capaz de hibridarse con una región diana de ADN específica. Debido a que el tamaño medio del ADN es relativamente pequeño y está muy fragmentado, las composiciones y métodos contemplados aquí comprenden el uso de sondas de captura de alta densidad y relativamente cortas para interrogar las regiones diana de ADN de interés.
En realizaciones particulares, un módulo de sonda de captura se combina con un oligonucleótido pareja que opcionalmente comprende un hapteno y que se hibrida con la secuencia de cola para generar un dúplex del módulo de sonda de captura.
Una preocupación particular con el uso de sondas de captura de alta densidad es que generalmente las sondas de captura se diseñan usando “reglas de secuencia” específicas. Por ejemplo, las regiones de secuencia redundante o que exhiben sesgos extremos en la composición de bases generalmente se excluyen al diseñar sondas de captura.
Sin embargo, los presentes inventores han descubierto que la falta de flexibilidad en las reglas de diseño de la sonda de captura no afecta sustancialmente al comportamiento de la sonda. Por el contrario, las sondas de captura escogidas estrictamente por restricción posicional proporcionaron información de secuencia correcta; exhiben captura de lectura muy poco incorrecta y no cartografiable; y producen lecturas uniformes, útiles y correctas con solo unas pocas excepciones. Además, la alta redundancia en el espacio reducido entre sondas compensa con creces las sondas de captura de comportamiento deficiente ocasionales.
En realizaciones particulares, una región diana es seleccionada como diana por una pluralidad de sondas de captura, en la que dos o más sondas de captura están diseñadas para unirse a la región diana dentro de los 10 nucleótidos entre sí, dentro de los 15 nucleótidos entre sí, dentro de los 20 nucleótidos entre sí, dentro de 25 nucleótidos entre sí, dentro de 30 nucleótidos entre sí, dentro de 35 nucleótidos entre sí, dentro de 40 nucleótidos entre sí, dentro de 45 nucleótidos entre sí, o dentro de 50 nucleótidos o más entre sí, así como todas las longitudes de nucleótidos intermedios.
En una realización, la sonda de captura tiene alrededor de 25 nucleótidos, alrededor de 26 nucleótidos, alrededor de 27 nucleótidos, alrededor de 28 nucleótidos, alrededor de 29 nucleótidos, alrededor de 30 nucleótidos, alrededor de 31 nucleótidos, alrededor de 32 nucleótidos, alrededor de 33 nucleótidos, alrededor de 34 nucleótidos, alrededor de 35 nucleótidos, alrededor de 36 nucleótidos, alrededor de 37 nucleótidos, alrededor de 38 nucleótidos, alrededor de 39 nucleótidos, alrededor de 40 nucleótidos, alrededor de 41 nucleótidos, alrededor de 42 nucleótidos, alrededor de 43 nucleótidos, alrededor de 44 nucleótidos, o alrededor de 45 nucleótidos.
En una realización, la sonda de captura tiene alrededor de 100 nucleótidos, alrededor de 200 nucleótidos, alrededor de 300 nucleótidos, alrededor de 400 nucleótido, o alrededor de 100 nucleótidos. En otra realización, la sonda de captura tiene de alrededor de 100 nucleótidos a alrededor de 500 nucleótidos, alrededor de 200 nucleótidos a alrededor de 500 nucleótidos, alrededor de 300 nucleótidos a alrededor de 500 nucleótidos, o alrededor de 400 nucleótidos a alrededor de 500 nucleótidos, o cualquier intervalo intermedio de los mismos.
En una realización particular, la sonda de captura tiene 60 nucleótidos.
En una realización particular, la sonda de captura no tiene 60 nucleótidos.
En otra realización, la sonda de captura es sustancialmente menor que 60 nucleótidos, pero se hibrida de manera comparable, como o mejor que una sonda de captura de 60 nucleótidos que se dirige a la misma región diana de ADN.
En cierta realización, la sonda de captura tiene 40 nucleótidos.
En ciertas realizaciones, un módulo de sonda de captura comprende una secuencia de cola. Como se usa aquí, la expresión “secuencia de cola” se refiere a un polinucleótido en el extremo 5’ del módulo de la sonda de captura, que en realizaciones particulares puede servir como un sitio de unión del cebador. En realizaciones particulares, un cebador de secuenciación se une al sitio de unión del cebador en la región de cola.
En realizaciones particulares, la secuencia de cola tiene alrededor de 5 a alrededor de 100 nucleótidos, alrededor de 10 a alrededor de 100 nucleótidos, alrededor de 5 a alrededor de 75 nucleótidos, alrededor de 5 a alrededor de 50 nucleótidos, alrededor de 5 a alrededor de 25 nucleótidos, o alrededor de 5 a alrededor de 20 nucleótidos. En ciertas realizaciones, la tercera región tiene de alrededor de 10 a alrededor de 50 nucleótidos, alrededor de 15 a alrededor de 40 nucleótidos, alrededor de 20 a alrededor de 30 nucleótidos, o alrededor de 20 nucleótidos, o cualquier número intermedio de nucleótidos.
En realizaciones particulares, la secuencia de cola tiene alrededor de 30 nucleótidos, alrededor de 31 nucleótidos, alrededor de 32 nucleótidos, alrededor de 33 nucleótidos, alrededor de 34 nucleótidos, alrededor de 35 nucleótidos, alrededor de 36 nucleótidos, alrededor de 37 nucleótidos, alrededor de 38 nucleótidos, alrededor de 39 nucleótidos, o alrededor de 40 nucleótidos.
En diversas realizaciones, el módulo de sonda de captura comprende un miembro específico de un par de unión para permitir el aislamiento y/o purificación de uno o más fragmentos capturados de una biblioteca de ADN etiquetados y o amplificados que se hibrida con la sonda de captura. En realizaciones particulares, el módulo de sonda de captura se conjuga con biotina u otro hapteno adecuado, por ejemplo, dinitrofenol, digoxigenina.
En diversas realizaciones, el módulo de sonda de captura se hibrida con una biblioteca de ADN etiquetados y opcionalmente amplificados para formar un complejo. En algunas realizaciones, el módulo de sonda de captura multifuncional se hibrida sustancialmente con una región diana genómica específica en la biblioteca de ADN.
Las condiciones de hibridación o hibridantes pueden incluir cualquier condición de reacción en la que dos secuencias nucleotídicas formen un complejo estable; por ejemplo, la biblioteca de ADN etiquetados y el módulo de sonda de captura forman un complejo estable de módulo de sonda de captura con la biblioteca de ADN etiquetados. Tales condiciones de reacción son bien conocidas en la técnica, y los expertos en la técnica apreciarán que tales condiciones se pueden modificar según sea apropiado, por ejemplo, temperaturas de hibridación menores con sondas de captura de menor longitud, y dentro del alcance de la presente invención. Puede ocurrir una hibridación sustancial cuando la segunda región del complejo de la sonda de captura exhibe 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92% 91%, 90%, 89%, 88%, 85%, 80%, 75% o 70% de identidad, homología o complementariedad de secuencia con una región de la biblioteca de ADN etiquetados.
En realizaciones particulares, la sonda de captura tiene alrededor de 40 nucleótidos, y tiene una temperatura de hibridación óptima de alrededor de 44°C o alrededor de 47°C.
En ciertas realizaciones, los métodos contemplados aquí comprenden aislar un complejo de módulo de sonda de captura con biblioteca de ADN etiquetados. En realizaciones particulares, los métodos para aislar complejos de ADN son bien conocidos por los expertos en la técnica, y cualquier método que un experto en la técnica considere apropiado puede emplearse con los métodos de la presente invención (Ausubel et al., Current Protocols in Molecular Biology, 2007-2012). En realizaciones particulares, los complejos se aíslan usando técnicas de aislamiento de biotina-estreptavidina. En algunas realizaciones, el oligonucleótido pareja de captura capaz de hibridarse con la secuencia de cola del módulo de sonda de captura multifuncional se modifica para contener una biotina en el extremo 5’ o en el extremo 3’ que es capaz de interactuar con la estreptavidina unida a una columna, perla u otro sustrato para uso en métodos de aislamiento de complejos de ADN.
En una realización, el oligonucleótido pareja de captura capaz de hibridarse con la secuencia de cola del módulo de sonda de captura multifuncional se modifica para contener una biotina en el extremo 3’ que es capaz de interactuar con estreptavidina unida a una columna, perla u otro sustrato para uso en métodos de aislamiento de complejos de ADN.
En realizaciones particulares, una secuencia de cola de un módulo de sonda de captura multifuncional se une a un oligonucleótido pareja de captura. En algunas realizaciones, el módulo de sonda de captura multifuncional se une al oligonucleótido pareja de captura antes de la formación de un complejo de módulo de sonda de captura multifuncional con biblioteca de ADN etiquetados. En algunas realizaciones, el módulo de sonda de captura multifuncional se une al oligonucleótido pareja de captura después de la formación de un complejo de módulo de sonda de captura multifuncional con biblioteca de ADN etiquetados. En algunas realizaciones, el módulo de sonda de captura multifuncional se une al oligonucleótido pareja de captura simultáneamente con la formación de un complejo de módulo de sonda de captura multifuncional con biblioteca de ADN etiquetados. En algunas realizaciones, el oligonucleótido pareja de captura se modifica químicamente. En una realización, el oligonucleótido pareja de captura se modifica añadiendo un hapteno al extremo 5’ o 3’. En una realización, el hapteno es biotina. En realizaciones particulares, se contempla la eliminación de los extremos 3’ monocatenarios del complejo de módulo de sonda de captura con biblioteca de ADN etiquetados aislado. En ciertas realizaciones, los métodos comprenden el procesamiento enzimático con exonucleasas 3’-5’ del complejo de módulo de sonda de captura multifuncional con biblioteca de ADN etiquetados aislado, para eliminar los extremos 3’ monocatenarios.
En otras ciertas realizaciones, los métodos comprenden realizar la extensión mediante 5’-3’ de la ADN polimerasa de la sonda de captura multifuncional utilizando como molde los fragmentos de la biblioteca de ADN etiquetados aislados.
En otras ciertas realizaciones, los métodos comprenden crear una molécula diana híbrida de sonda de captura-ADN etiquetado aislado mediante la acción concertada de una 5’ FLAP endonucleasa, polimerización de ADN, y cierre de muescas mediante una ADN ligasa.
Puede emplearse una variedad de enzimas para el procesamiento enzimático mediante 3’-5’ exonucleasas del complejo de módulo de sonda de captura multifuncional con biblioteca de ADN etiquetados aislado. Ejemplos ilustrativos de enzimas adecuadas, que exhiben actividad enzimática de 3’-5’ exonucleasa, que pueden emplearse en realizaciones particulares, incluyen, pero no se limitan a: T4 o exonucleasas I, III, V (véase también, Shevelev IV, Hübscher U., “The 3’ 5’ exonucleases”, Nat Rev Mol Cell Biol. 3(5):364-76 (2002)). En realizaciones particulares, la enzima que comprende la actividad de 3’-5’ exonucleasa es T4. En realizaciones particulares, se puede emplear una enzima que exhiba actividad enzimática de 3’-5’ exonucleasa y que sea capaz de extender el molde del cebador, incluyendo, por ejemplo, T4 o exonucleasas I, III, V. Id.
En algunas realizaciones, los métodos contemplados aquí comprenden realizar secuenciación y/o PCR en el complejo procesado enzimáticamente mediante 3’-5’ exonucleasas explicado más arriba y en cualquier otra parte aquí. En realizaciones particulares, se copia una porción de cola de una molécula de sonda de captura para generar una molécula de ácido nucleico híbrida. En una realización, la molécula de ácido nucleico híbrida generada comprende la región diana capaz de hibridarse con el módulo de sonda de captura y el complemento de la secuencia de cola del módulo de sonda de captura.
En una realización particular, el análisis genético comprende a) hibridar uno o más módulos de sonda de captura con uno o más loci genéticos diana en una pluralidad de clones de biblioteca de ADN para formar uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura; b) aislar uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura de a); c) procesar enzimáticamente el uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura aislados de la etapa b); d) realizar PCR en el complejo procesado enzimáticamente de c), en la que la porción de cola de la molécula de sonda de captura se copia para generar moléculas de ácido nucleico híbridas amplificadas, en la que las moléculas de ácido nucleico híbridas amplificadas comprenden una secuencia diana en el locus genómico diana capaz de hibridarse con la sonda de captura y el complemento de la secuencia de cola del módulo de sonda de captura; y e) realizar análisis genético cuantitativo sobre las moléculas de ácido nucleico híbridas amplificadas de d).
En una realización particular, se contemplan métodos para determinar el número de copias de un locus genético diana específico, que comprenden: a) hibridar uno o más módulos de sonda de captura con uno o más loci genéticos diana en una pluralidad de clones de la biblioteca de ADN para formar uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura; b) aislar el uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura de a); c) procesar enzimáticamente el uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura aislados de la etapa b); d) realizar PCR en el complejo procesado enzimáticamente de c), en la que la porción de cola de la molécula de sonda de captura se copia para generar moléculas de ácido nucleico híbridas amplificadas, en la que las moléculas de ácido nucleico híbridas amplificadas comprenden una secuencia diana en el locus genético diana capaz de hibridarse con la sonda de captura y el complemento de la secuencia de cola del módulo de la sonda de captura; e) realizar la amplificación por PCR de las moléculas de ácido nucleico híbridas amplificadas en d); y f) cuantificar la reacción de PCR en e), en la que la cuantificación permite una determinación del número de copias de la región diana específica.
En una realización, el procesamiento enzimático de la etapa c) comprende realizar el procesamiento enzimático con 3’-5’ exonucleasas en el uno o más complejos de clones de biblioteca de ADN con módulos de sonda de captura de b) usando una enzima con actividad de 3’-5’ exonucleasa para eliminar los extremos 3’ monocatenarios; crear una o más moléculas de clones de biblioteca de ADN con módulos de sonda de captura híbridas a través de la acción concertada de una 5’ FLAP endonucleasa, polimerización de ADN, y cierre de muescas mediante una ADN ligasa; o realizar una extensión mediante 5’-3’ ADN polimerasa de la sonda de captura usando como molde el clon de ADN aislado en el complejo.
En una realización, el procesamiento enzimático de la etapa c) comprende realizar la extensión mediante 5’-3’ ADN polimerasa de la sonda de captura usando como molde el clon de ADN aislado en el complejo.
En realizaciones particulares, la PCR se puede realizar usando cualquier condición de reacción de PCR estándar bien conocida por los expertos en la técnica. En ciertas realizaciones, la reacción de PCR en e) emplea dos cebadores de PCR. En una realización, la reacción de PCR en e) emplea un primer cebador de PCR que se hibrida con una repetición dentro del locus genético diana. En una realización particular, la reacción de PCR en e) emplea un segundo cebador de PCR que se hibrida con las moléculas de ácido nucleico híbridas en la unión locus genético diana/cola. En ciertas realizaciones, la reacción de PCR en e) emplea un primer cebador de PCR que se hibrida con el locus genético diana, y un segundo cebador de PCR que se hibrida con las moléculas de ácido nucleico híbridas amplificadas en la unión locus genético diana/cola. En realizaciones particulares, el segundo cebador se hibrida con la unión locus genético diana/cola de modo que al menos uno o más nucleótidos del cebador se hibridan con el locus genético diana, y al menos uno o más nucleótidos del cebador se hibridan con la secuencia de cola.
En ciertas realizaciones, las moléculas de ácido nucleico híbridas amplificadas obtenidas en la etapa e) se secuencian, y las secuencias se alinean horizontalmente, es decir, se alinean entre sí pero no se alinean con una secuencia de referencia. En realizaciones particulares, las etapas a) a e) se repiten una o más veces con uno o más módulos de sonda de captura. Los módulos de sonda de captura pueden ser iguales o diferentes, y están diseñados para dirigirse a cualquiera de las cadenas de ADN de un locus genético diana. En algunas realizaciones, cuando las sondas de captura son diferentes, se hibridan en secuencias diana superpuestas o adyacentes dentro de un locus genético diana en la biblioteca de clones de ADN etiquetados. En una realización, se usa una estrategia de sonda de captura de alta densidad, en la que una pluralidad de sondas de captura se hibridan con un locus genético diana, y en la que cada una de la pluralidad de sondas de captura se hibrida con el locus genético diana dentro de alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200 pb de cualquier otra sonda de captura que se hibrida con el locus genético diana en una biblioteca de clones de ADN etiquetados, incluyendo todas las distancias intermedias.
En algunas realizaciones, el método se puede realizar usando dos módulos de sonda de captura por locus genético diana, en el que uno se hibrida con la hebra de “Watson” (hebra no codificante o molde) en dirección 5’ de la región diana, y uno se hibrida con la hebra de “Crick” (cadena codificante o no molde) en dirección 3’ de la región diana. En realizaciones particulares, los métodos contemplados aquí se pueden realizar además varias veces con cualquier número de módulos de sonda de captura, por ejemplo 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más módulos de sonda de captura por locus genético diana, cualquier número de los cuales se hibrida con la hebra de Watson o Crick en cualquier combinación. En algunas realizaciones, las secuencias obtenidas se pueden alinear entre sí para identificar cualquiera de una serie de diferencias.
En ciertas realizaciones, se interroga a una pluralidad de loci genéticos diana, por ejemplo 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 10000, 50000, 100000, 500000 o más en una sola reacción, usando uno o más módulos de sonda de captura.
(b) Secuenciación
En realizaciones particulares, el análisis genético cuantitativo comprende secuenciar una pluralidad de moléculas de ácido nucleico híbridas, como se explica en otra parte aquí, más arriba, para generar profundidades de secuenciación suficientes para obtener una pluralidad de lecturas de secuenciación únicas. Una lectura única se define como la lectura de consenso única de una “familia” de lecturas que comparten el mismo código de lectura y el mismo punto de inicio de secuencia dentro del ADN. Cada sonda de captura produce un conjunto de lecturas únicas que se destilan computacionalmente de las lecturas totales agrupando en familias. Las lecturas únicas para una muestra determinada se calculan entonces como el promedio de todas las lecturas únicas observadas sonda por sonda. Los casos en los que hay un cambio obvio en el número de copias se excluyen del conjunto de datos utilizado para calcular el promedio. Las lecturas únicas son importantes debido a que cada lectura única debe derivar de un clon de ADN único. Cada lectura única representa la entrada y el análisis de un equivalente haploide de ADN genómico. La suma de lecturas únicas es la suma de genomas haploides analizados. El número de genomas analizados, a su vez, define la sensibilidad del ensayo de secuenciación. A modo de ejemplo no limitativo, si el recuento de lecturas únicas promedio es 100 equivalentes genómicos, entonces ese ensayo en particular tiene la sensibilidad de poder detectar una lectura mutante en 100, o 1%. Cualquier observación menor que esto no es defendible.
En realizaciones particulares, el análisis genético cuantitativo comprende la secuenciación multiplex de moléculas de ácido nucleico híbridas derivadas de una pluralidad de muestras.
En diversas realizaciones, el análisis genético cuantitativo comprende obtener uno o más o una pluralidad de clones de la biblioteca de ADN etiquetados, comprendiendo cada clon una primera secuencia de ADN y una segunda secuencia de ADN, en el que la primera secuencia de ADN comprende una secuencia en un locus genético diana, y la segunda secuencia de ADN comprende una secuencia de sonda de captura; realizar una reacción de secuenciación de extremos emparejados en el uno o más clones, y obtener una o más lecturas de secuenciación, o realizar una reacción de secuenciación en el uno o más clones, en la que se obtiene una sola lectura de secuenciación larga de más de alrededor de 100, 200, 300, 400, 500 o más nucleótidos, en la que la lectura es suficiente para identificar tanto la primera secuencia de ADN como la segunda secuencia de a DN; y ordenar o agrupar las lecturas de secuenciación del uno o más clones de acuerdo con las secuencias de sonda de las lecturas de secuenciación.
(c) Análisis bioinformático
En diversas realizaciones, el análisis genético cuantitativo comprende además el análisis bioinformático de las lecturas de secuenciación. El análisis bioinformático excluye cualquier análisis puramente mental realizado en ausencia de una composición o método de secuenciación. En ciertas realizaciones, el análisis bioinformático incluye, pero no se limita a: alineamientos de secuencia; análisis de equivalentes genómicos; análisis de variante de nucleótido único (SNV); análisis de variación del número de copias de genes (CNV); y detección de lesiones genéticas. En realizaciones particulares, el análisis bioinformático es útil para cuantificar el número de equivalentes genómicos analizados en la biblioteca de clones de ADN; para detectar el estado genético de un locus genético diana; para detectar lesiones genéticas en un locus genético diana; y para medir las fluctuaciones del número de copias dentro de un locus genético diana.
Los alineamientos de secuencia se pueden realizar entre las lecturas de secuencia y una o más secuencias de ADN de referencia humano. En realizaciones particulares, se pueden usar alineamientos de secuenciación para detectar lesiones genéticas en un locus genético diana, que incluye, pero no se limita a, la detección de una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes. La detección de lesiones genéticas que son indicadores causales o de pronóstico puede ser útil en el diagnóstico, pronóstico, tratamiento, y/o monitorización de una afección o enfermedad genética particular.
También se contemplan aquí métodos para el análisis de alineación de secuencias que se pueden realizar sin la necesidad de alineamiento con una secuencia de referencia, denominado aquí análisis de secuencia horizontal. Dicho análisis se puede realizar en cualquier secuencia generada por los métodos contemplados aquí o por cualquier otro método. En realizaciones particulares, el análisis de secuencia comprende realizar alineaciones de secuencia en las lecturas obtenidas mediante los métodos contemplados aquí.
En una realización, los equivalentes genómicos en una biblioteca de clones de ADN se determinan usando un recuento basado en bioinformática después de realizar la secuenciación. Cada lectura de secuenciación está asociada con una sonda de captura particular, y la colección de lecturas asignadas a cada sonda de captura se analiza en grupos. Dentro de un grupo, conjuntos de lecturas individuales comparten el mismo código de lectura y la misma posición de inicio de la secuencia de ADN dentro de la secuencia genómica. Estas lecturas individuales se agrupan en una “familia”, y un solo representante de consenso de esta familia se lleva adelante como una “lectura única”. Todas las lecturas individuales que constituyen una familia derivan de un solo evento de ligación, y de este modo son “hermanas” entre sí derivadas de la amplificación. Cada lectura única se considera un evento de ligación único, y la suma de lecturas únicas se considera equivalente al número de equivalentes genómicos analizados. A medida que el número de clones únicos se acerca al número total de posibles combinaciones de secuencias, la probabilidad dicta que el mismo código y las mismas combinaciones de sitios de inicio serán creadas por eventos independientes, y que estos eventos independientes se agruparán de manera inapropiada dentro de familias individuales. El resultado neto será una subestimación de los equivalentes genómicos analizados, y las lecturas de mutantes raros pueden descartarse como errores de secuenciación debido a que se solapan con las lecturas de tipo salvaje que poseen los mismos identificadores.
En realizaciones particulares, para proporcionar un análisis preciso para las bibliotecas de clones de ADN, el número de equivalentes genómicos analizados es alrededor de 1/10, alrededor de 1/12, alrededor de 1/14, alrededor de 1/16, alrededor de 1/18, alrededor de 1/20, alrededor de 1/25 o menos del número de posibles clones únicos. Debe entenderse que el procedimiento descrito anteriormente es meramente ilustrativo y no limitante.
En algunas realizaciones, puede ser necesario aumentar el número de equivalentes genómicos a analizar. Para ampliar la profundidad de los equivalentes genómicos, se contemplan al menos dos soluciones. La primera solución es utilizar más de un conjunto de adaptadores por muestra. Combinando adaptadores, es posible expandir multiplicativamente el número total de clones posibles, y por lo tanto expandir los límites cómodos de la entrada genómica. La segunda solución es expandir el código de lectura en 1, 2, 3, 4 o 5 o más bases. El número de códigos de lectura posibles que difieren en al menos 2 bases de cada otro código de lectura se escala como 4(n-1), en la que n es el número de bases dentro de un código de lectura. De este modo, en un ejemplo no limitativo, si un código de lectura tiene 5 nucleótidos y 4(5-1) = 256; por lo tanto, la inclusión de bases adicionales expande el repertorio disponible en un factor de cuatro por cada base adicional.
En una realización, el análisis genético cuantitativo comprende el análisis bioinformático de las lecturas de secuenciación para identificar variantes raras de un solo nucleótido (SNV).
La secuenciación de nueva generación tiene una tasa de error inherente de alrededor de 0,02-0,02%, lo que significa que entre 1/200 y 1/500 lecturas de nucleótidos son incorrectas. Para detectar variantes y otras mutaciones que ocurren a frecuencias inferiores a esta, por ejemplo a frecuencias de 1 por 1000 secuencias, es necesario invocar estrategias de anotación molecular. A modo de ejemplo no limitativo, el análisis de 5000 moléculas únicas usando tecnología de captura de secuencias específicas generaría - a profundidades de secuenciación suficientes de > 50.000 lecturas - una colección de 5000 lecturas únicas, perteneciendo cada lectura única a una “familia” de lecturas que poseen todas el mismo código de lectura. Una SNV que ocurre dentro de una familia es candidata a ser una variante rara. Cuando esta misma variante se observa en más de una familia, se convierte en un candidato muy fuerte para ser una variante rara que existe dentro de la muestra de partida. Por el contrario, las variantes que ocurren esporádicamente dentro de las familias probablemente sean errores de secuenciación, y las variantes que ocurren dentro de una y solo una familia son raras o el resultado de una alteración de base que ocurrió ex vivo (por ejemplo, oxidación de una base de ADN, o errores introducidos por PCR).
En una realización, los métodos de detección de las SNV comprenden introducir 10 veces más información genómica (genomas o equivalentes genómicos) que la sensibilidad diana deseada del ensayo. En un ejemplo no limitativo, si la sensibilidad deseada es 2% (2 en 100), entonces la diana experimental es una entrada de 2000 genomas.
En realizaciones particulares, el análisis bioinformático de los datos de secuenciación se usa para detectar o identificar SNV asociada con un estado, afección o enfermedad genética, mosaicismo genético, pruebas fetales, pruebas de paternidad, predicción de la respuesta al tratamiento farmacológico, diagnóstico o monitorización de una afección médica, elaboración de perfiles de microbiomas, detección de patógenos, y monitorización de trasplantes de órganos.
En diversas realizaciones, se proporciona un método para el análisis de determinación del número de copias, que comprende obtener uno o más o una pluralidad de clones, comprendiendo cada clon una primera secuencia de ADN y una segunda secuencia de ADN, en el que la primera secuencia de ADN comprende una secuencia en un locus genético diana, y la segunda secuencia de ADN comprende una secuencia de sonda de captura. En realizaciones relacionadas, se realiza una reacción de secuenciación de extremos emparejados en el uno o más clones, y se obtienen una o más lecturas de secuenciación. En otra realización, se realiza una reacción de secuenciación en el uno o más clones, en la que se obtiene una única lectura de secuenciación larga de más de alrededor de 100 nucleótidos, en la que la lectura es suficiente para identificar tanto la primera secuencia de ADN como la segunda secuencia de ADN. Las lecturas de secuenciación del uno o más clones se pueden ordenar o agrupar de acuerdo con la secuencia de la sonda de las lecturas de secuenciación.
Los análisis de número de copias incluyen, pero no se limitan a, análisis que examinan el número de copias de un gen o mutación en particular que se produce en una muestra de ADN genómico determinada, y pueden incluir además la determinación cuantitativa del número de copias de un gen dado o diferencias de secuencia en una muestra dada. En realizaciones particulares, el análisis del número de copias se usa para detectar o identificar la amplificación genética asociada con estados, afecciones o enfermedades genéticas, pruebas fetales, mosaicismo genético, pruebas de paternidad, predicción de la respuesta al tratamiento farmacológico, diagnóstico o monitorización de una afección médica, elaboración de perfiles de microbiomas, detección de patógenos, y monitorización de trasplantes de órganos.
En realizaciones particulares, el análisis bioinformático de los datos de secuenciación se usa para detectar o identificar una o más secuencias o lesiones genéticas en un locus diana que incluye, pero no se limita a, la detección de una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes. La detección de lesiones genéticas que son indicadores causales o de pronóstico puede ser útil en el diagnóstico, pronóstico, tratamiento y/o monitorización de una afección o enfermedad genética particular. En una realización, las lesiones genéticas están asociadas con estados, afecciones o enfermedades genéticas, pruebas fetales, mosaicismo genético, pruebas de paternidad, predicción de la respuesta al tratamiento farmacológico, diagnóstico o monitorización de una afección médica, elaboración de perfiles de microbiomas, detección de patógenos, y monitorización de trasplantes de órganos.
F. APLICACIONES CLÍNICAS DEL ANÁLISIS GENÉTICO CUANTITATIVO
En diversas realizaciones, la presente invención contempla un método para detectar, identificar, predecir, diagnosticar, o monitorizar una afección o enfermedad en un sujeto.
En realizaciones particulares, un método para detectar, identificar, predecir, diagnosticar o monitorizar un estado, afección o enfermedad genética en un sujeto comprende realizar un análisis genético cuantitativo de uno o más loci genéticos diana en una biblioteca de clones de ADN para detectar o identificar un cambio en la secuencia en uno o más loci genéticos diana. En una realización, el ADN es cfDNA.
En realizaciones particulares, un método para detectar, identificar, predecir, diagnosticar o monitorizar un estado genético, o afección o enfermedad genética seleccionada del grupo que consiste en: enfermedades genéticas; mosaicismo genético; pruebas fetales; prueba de paternidad; prueba de paternidad; predecir la respuesta al tratamiento farmacológico; diagnosticar o monitorizar una afección médica; elaboración de perfiles de microbiomas; detección de patógenos; y la monitorización del trasplante de órganos, comprende realizar un análisis genético cuantitativo de uno o más loci genéticos diana en una biblioteca de clones de ADN para detectar o identificar una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o un fusión de genes en la secuencia en el uno o más loci genéticos diana.
Los ejemplos ilustrativos de enfermedades genéticas que se pueden detectar, identificar, predecir, diagnosticar, o monitorizar con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, cáncer, enfermedad de Alzheimer (APOE1), enfermedad de Charcot-Marie-Tooth, neuropatía óptica hereditaria de Leber (LHON), síndrome de Angelman (UBE3A, ubiquitina-proteína ligasa E3A), síndrome de Prader-Willi (región en el cromosoma 15), p-talasemia (HBB, p-globina), enfermedad de Gaucher (tipo I) (GBA, glucocerebrosidasa), fibrosis quística (CFTR, canal de cloro epitelial), enfermedad de células falciformes (HBB, p-globina), enfermedad de Tay-Sachs (HEXA, hexosaminidasa A), fenilcetonuria (PAH, fenilalanina hidroxilasa), hipercolesterolemia familiar (LDLR, receptor de lipoproteínas de baja densidad), enfermedad renal poliquística del adulto (PKD1, policistina), enfermedad de Huntington (HDD, Huntington), neurofibromatosis tipo I (NF1, gen supresor de tumores NF1), distrofia miotónica (DM, miotonina), esclerosis tuberosa (TSC1, tuberina), acondroplasia (FGFR3, receptor del factor de crecimiento de fibroblastos), síndrome de X frágil (FMR1, proteína de unión a ARN), distrofia muscular de Duchenne (DMD, distrofina), hemofilia A (F8C, factor VIII de coagulación sanguínea), síndrome de Lesch-Nyhan (HPRT1, hipoxantina guanina ribosiltransferasa 1), y adrenoleucodistrofia (ABCD1).
Los ejemplos ilustrativos de cánceres que se pueden detectar, identificar, predecir, diagnosticar, o monitorizar con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: cáncer de células B, por ejemplo mieloma múltiple, melanomas, cáncer de mama, cáncer de pulmón (tal como carcinoma pulmonar no microcítico o CPCNP), cáncer de bronquios, cáncer colorrectal, cáncer de próstata, cáncer de páncreas, cáncer de estómago, cáncer de ovario, cáncer de vejiga urinaria, cáncer de cerebro o del sistema nervioso central, cáncer del sistema nervioso periférico, cáncer de esófago, cáncer de cuello uterino, cáncer de útero o endometrio, cáncer de cavidad oral o faringe, cáncer de hígado, cáncer de riñón, cáncer de testículo, cáncer de vías biliares, cáncer de intestino delgado o de apéndice, cáncer de glándula salival, cáncer de glándula tiroides, cáncer de glándula suprarrenal, osteosarcoma, condrosarcoma, cáncer de tejidos hematológicos, adenocarcinomas, tumores miofibroblásticos inflamatorios, tumor del estroma gastrointestinal (GIST), cáncer de colon, mieloma múltiple (MM), síndrome mielodisplásico (MDS), trastorno mieloproliferativo (MPD), leucemia linfocítica aguda (LLA), leucemia mielocítica aguda (LMA), leucemia mielocítica crónica (LMC), leucemia linfocítica crónica (LLC), policitemia vera, linfoma de Hodgkin, linfoma no de Hodgkin (NHL), sarcoma de tejidos blandos, fibrosarcoma, mixosarcoma, liposarcoma, sarcoma osteogénico, cordoma, angiosarcoma, endoteliosarcoma, linfangiosarcoma, linfangioendoteliosarcoma, sinovioma, mesotelioma, tumor de Ewing, leiomiosarcoma, rabdomiosarcoma, carcinoma de células escamosas, carcinoma de células basales, adenocarcinoma, carcinoma de glándulas sudoríparas, carcinoma de glándulas sebáceas, carcinoma papilar, adenocarcinomas papilares, carcinoma medular, carcinoma broncogénico, carcinoma de células renales, hepatoma, carcinoma de vías biliares, coriocarcinoma, seminoma, carcinoma embrionario, tumor de Wilms, carcinoma de vejiga, carcinoma epitelial, glioma, astrocitoma, meduloblastoma, craneofaringioma, ependimoma, pinealoma, hemangioblastoma, neuroma acústico, oligodendroglioma, meningioma, neuroblastoma, retinoblastoma, linfoma folicular, linfoma difuso de células B grandes, linfoma de células del manto, carcinoma hepatocelular, cáncer de tiroides, cáncer gástrico, cáncer de cabeza y cuello, cánceres microcíticos, trombocitemia esencial, metaplasia mieloide agnogénica, síndrome hipereosinofílico, mastocitosis sistémica, h i pe reos inofilia familiar, leucemia eosinofílica crónica, cánceres neuroendocrinos, tumores carcinoides, y similares.
En una realización, la lesión genética es una lesión anotada en la base de datos de Cosmic (las lesiones y los datos de secuencia se pueden descargar de cancer.sanger.ac.uk/cosmic/census) o una lesión anotada en el Cancer Genome Atlas (las lesiones y los datos de secuencia se pueden descargar de tcgadata.nci.nih.gov/tcga/tcgaDownload.jsp).
Los ejemplos ilustrativos de genes que albergan una o más lesiones genéticas asociadas con el cáncer que pueden detectarse, identificarse, predecirse, diagnosticarse, o monitorizarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, ABCB1, ABCC2, ABCC4, ABCG2, ABL1, a Bl2, AKT1, AKT2, AKT3, ALDH4A1, ALK, APC, AR, ARAF, ARFRP1, ARID1A, ATM, ATR, AURKA, AURKB, BCL2, BCL2A1, BCL2L1, BCL2L2, BCL6, BRAF, BRCA1, BRCA2, Clorf144, CARD11, CBL, CCND1, CCND2, CCND3, CCNE1, CDH1, CDH2, CDH20, CDH5, CDK4, CDK6, CDK8, CDKN2A, CDKN2B, CDKN2C, CEBPA, CHEK1, CHEK2, CRKL, CRLF2, CTNNB1, CYP1B1, CYP2C19, CYP2C8, CYP2D6, CYP3A4, CYP3A5, DNMT3A, DOT1L, DPYD, EGFR, EPHA3, EPHA5, EPHA6, EPHA7, EPHB1, EPHB4, EPHB6, EPHX1, ERBB2, ERBB3, ERBB4, ERCC2, ERG, ESR1, ESR2, ETV1, ETV4, ETV5, ETV6, EWSR1, EZH2, FANCA, FBXW7, FCGR3A, FGFR1, FGFR2, FGFR3, FGFR4, FLT1, FLT3, FLT4, FOXP4, GATA1, GNA11, GNAQ, GNAS, GPR124, GSTP1, GUCY1A2, HOXA3, HRAS, HSP90AA1, IDH1, IDH2, IGF1R, IGF2R, IKBKE, IKZF1, INHBA, IRS2, ITPA, JAK1, JAK2, JAK3, JUN, KDR, KIT, KRAS, LRP1B, LRP2, LTK, MAN1B1, MAP2K1, MAP2K2, MAP2K4, MCL1, MDM2, MDM4, MEN1, MET, MITF, MLH1, MLL, MPL, MRE11A, MSH2, MSH6, MTHFR, MTOR, MUTYH, MYC, MYCL1, MYCN, NF1, NF2, NKX2-1, NOTCH1, NPM1, NQO1, NRAS, NRP2, NTRK1, NTRK3, PAK3, PAX5, PDGFRA, PDGFRB, PIK3CA, PIK3R1, PKHD1, PLCG1, PRKDC, PTCH1, PTEN, PTPN11, PTPRD, RAF1, RARA, RB1, RET, RICTOR, RPTOR, RUNX1, SLC19A1, SLC22A2, SLCO1B3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMO, SOD2, SOX10, SOX2, SRC, STK11, SULT1A1, TBX22, TET2, TGFBR2, TMPRSS2, TNFRSF14, TOP1, TP53, TPMT, TSC1, TSC2, TYMS, UGT1A1, UMPS, USP9X, VHL, y WT1.
En realizaciones particulares, la lesión genética comprende una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes.
En una realización, la lesión genética es una fusión de genes que fusiona la región codificante 3’ del gen ALK con otro gen.
En una realización, la lesión genética es una fusión de genes que fusiona la región codificante 3’ del gen ALK con el gen EML4.
Ejemplos ilustrativos de afecciones adecuadas para pruebas fetales que pueden detectarse, identificarse, predecirse, diagnosticarse, o monitorizarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: síndrome de Down (trisomía 21), síndrome de Edwards (trisomía 18), Síndrome de Patau (trisomía 13), síndrome de Klinefelter (XXY), síndrome de triple X, síndrome de XYY, trisomía 8, trisomía 16, síndrome de Turner (XO), translocación robertsoniana, síndrome de DiGeorge, y síndrome de Wolf-Hirschhorn.
Los ejemplos ilustrativos de alelos adecuados para pruebas de paternidad que se pueden detectar, identificar, predecir, diagnosticar, o monitorizar con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, 16 o más de: D20S1082, D6S474, D12ATA63, D22S1045, D10S1248, D1S1677, D11S4463, D4S2364, D9S1122, D2S1776, D10S1425, D3S3053, D5S2500, D1S1627, D3S4529, D2S441, D17S974, D6S1017, D4S2408, D9S2157, Amelogenina, D17S1301, D1GATA113, D18S853, D20S482, y D14S1434.
Los ejemplos ilustrativos de genes adecuados para predecir la respuesta al tratamiento farmacológico que pueden detectarse, identificarse, predecirse, diagnosticarse, o monitorizarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, uno o más de los siguientes genes: ABCB1 (casete de unión a ATP, subfamilia B (MDR/TAP), miembro 1), ACE (enzima conversora de angiotensina I), ADH1A (alcohol deshidrogenasa 1A (clase I), polipéptido alfa), ADH1B (alcohol deshidrogenasa IB (clase I), polipéptido beta), ADH1C (alcohol deshidrogenasa 1C (clase I), polipéptido gamma), ADRB1 (receptor adrenérgico beta-1), ADRB2 (receptor adrenérgico, beta-2-, superficie), AHR (receptor de hidrocarburo arílico), ALDH1A1 (familia de aldehído deshidrogenasa 1, miembro A1), ALOX5 (araquidonato 5-lipoxigenasa), BRCA1 (cáncer de mama 1, inicio temprano), COMT (catecol-O-metiltransferasa), CYP2A6 (citocromo P450, familia 2, subfamilia A, polipéptido 6), CYP2B6 (citocromo P450, familia 2, subfamilia B, polipéptido 6), CYP2C9 (citocromo P450, familia 2, subfamilia C, polipéptido 9), CYP2C19 (citocromo P450, familia 2, subfamilia C, polipéptido 19), CYP2D6 (citocromo P450, familia 2, subfamilia D, polipéptido 6), CYP2J2 (citocromo P450, familia 2, subfamilia J, polipéptido 2), CYP3A4 (citocromo P450, familia 3, subfamilia A, polipéptido 4), CYP3A5 (citocromo P450, familia 3, subfamilia A, polipéptido 5), DPYD (dihidropirimidina deshidrogenasa), DRD2 (receptor de dopamina D2), F5 (factor de coagulación V), GSTP1 (glutationa S-transferasa pi), HMGCR (3-hidroxi-3-metilglutaril-coenzima A reductasa), KCNH2 (canal de potasio dependiente de voltaje, subfamilia H (relacionado con eag), miembro 2), KCNJ11 (canal rectificador de potasio hacia adentro, subfamilia J, miembro 11), MTHFR (5,10-metilentetrahidrofolato reductasa (NADPH)), NQO1 (NAD(P)H deshidrogenasa, quinona 1), P2RY1 (receptor purinérgico P2Y, acoplado a proteína G, 1), P2RY12 (receptor purinérgico P2Y, acoplado a proteína G, 12), PTGIS (prostaglandina 12 (prostaciclina) sintasa), SCN5A (canal de sodio, dependiente del voltaje, tipo V, alfa (síndrome de QT largo 3)), SLC19A1 (familia de transportadores de solutos 19 (transportador de folato), miembro 1), SLCO1B1 (familia de transportadores de aniones orgánicos transportadores de solutos, miembro 1B1), SULT1A1 (familia de sulfotransferasas, citosólico, 1A, que prefiere el fenol, miembro 1), TPMT (tiopurina S-metiltransferasa), TYMS (timidilato sintetasa), UGT1A1 (familia de UDP glucuronosiltransferasa 1, polipéptido A1), VDR (receptor de vitamina D (1,25-dihidroxivitamina D3)), VKORC1 (complejo de vitamina K epóxido reductasa, subunidad 1).
Ejemplos ilustrativos de afecciones médicas que pueden detectarse, identificarse, predecirse, diagnosticarse, o monitorizarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: accidente cerebrovascular, ataque isquémico transitorio, lesión cerebral traumática, enfermedad cardíaca, ataque cardíaco, angina, aterosclerosis, y hipertensión sanguínea.
Los ejemplos ilustrativos de patógenos que pueden cribarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: bacterias, hongos y virus.
Los ejemplos ilustrativos de especies bacterianas que pueden cribarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: Mycobacterium spp., Pneumococcus spp., Escherichia spp., Campylobacter spp., Corynebacterium spp., Clostridium spp., Streptococcus spp., Staphylococcus spp., Pseudomonas spp., Shigella spp., Treponema spp., o Salmonella spp.
Los ejemplos ilustrativos de especies de hongos que pueden cribarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: Aspergillis spp., Blastomyces spp., Candida spp., Coccicioides spp., Cryptococcus spp., dermatofitos, Tinea spp., Trichophyton spp., Microsporum spp., Fusarium spp., Histoplasma spp., Mucoromycotina spp., Pneumocystis spp., Sporothrix spp., Exserophilum spp., o Cladosporium spp.
Los ejemplos ilustrativos de virus que se pueden cribar con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a: gripe A tal como H1N1, H1N2, H3N2 y H5N1 (gripe aviar), gripe B, virus de la gripe C, virus de la hepatitis A, virus de la hepatitis B, virus de la hepatitis C, virus de la hepatitis D, virus de la hepatitis E, rotavirus, cualquier virus del grupo de virus Norwalk, adenovirus entéricos, parvovirus, virus de la fiebre del dengue, viruela del mono, mononegavirales, lyssavirus tales como el virus de la rabia, virus del murciélago de Lagos, virus de Mokola, virus de Duvenhage, virus del murciélago europeo 1 y 2 y virus del murciélago australiano, efemerovirus, vesiculovirus, virus de la estomatitis vesicular (VSV), virus del herpes tales como el virus del herpes simple tipos 1 y 2, varicela zóster, citomegalovirus, virus de Epstein-Bar (EBV), virus del herpes humano (HHV), virus del herpes humano tipo 6 y 8, virus de la leucemia murina de Moloney (M-MuLV), virus del sarcoma murino de Moloney (MoMSV), virus del sarcoma murino de Harvey (HaMuSV), virus del tumor mamario murino (MuMTV), virus de la leucemia del gibón (GaLV), virus de la leucemia felina (FLV), espumavirus, virus de la leucemia murina de Friend, virus de células madre murinas (MSCV) y virus del sarcoma de Rous (RSV), VIH (virus de inmunodeficiencia humana; incluyendo el VIH tipo 1 y el VIH tipo 2), el virus de visna-maedi (VMV), el virus de la artritis-encefalitis caprina (CAEV), el virus de la anemia infecciosa equina (IEAV), el virus de la inmunodeficiencia felina (VIF), el virus de la inmunodeficiencia bovina (VIB), virus de la inmunodeficiencia de los simios (VIS), virus del papiloma, gammaherpesvirus murino, arenavirus tales como el virus de la fiebre hemorrágica argentina, el virus de la fiebre hemorrágica boliviana, el virus de la fiebre hemorrágica asociada a Sabia, el virus de la fiebre hemorrágica venezolana, el virus de la fiebre de Lassa, el virus de Machupo, virus de la coriomeningitis linfocítica (LCMV), Bunyaviridiae tales como el virus de la fiebre hemorrágica de Crimea-Congo, hantavirus, fiebre hemorrágica con el virus causante del síndrome renal, virus de la fiebre del Valle del Rift, Filoviridae (filovirus) que incluye la fiebre hemorrágica del Ébola y la fiebre hemorrágica de Marburg, Flaviviridae que incluye el virus de la enfermedad del bosque de Kaysanur, virus de la fiebre hemorrágica de Omsk, virus causante de encefalitis transmitida por garrapatas, y Paramyxoviridae tales como el virus Hendra y el virus Nipah, Variola major y Variola minor (viruela), alfavirus tales como el virus de la encefalitis equina venezolana, el virus de la encefalitis equina oriental, el virus de la encefalitis equina occidental, el coronavirus asociado al SARS (SARS-CoV), el virus del Nilo occidental, y cualquier virus que cause encefalitis.
Ejemplos ilustrativos de genes adecuados para monitorizar un trasplante de órgano en un receptor de trasplante que pueden detectarse, identificarse, predecirse, diagnosticarse, o monitorizarse con las composiciones y métodos contemplados aquí incluyen, pero no se limitan a, uno o más de los siguientes genes: HLA-A, HLA-B, HLA-C, HLA-DR, HLA-DP y HLA-DQ.
En realizaciones particulares, se usa un análisis bioinformático para cuantificar el número de equivalentes genómicos analizados en la biblioteca de clones de ADN; detectar variantes genéticas en un locus genético diana; detectar mutaciones dentro de un locus genético diana; detectar fusiones genéticas dentro de un locus genético diana; o medir las fluctuaciones del número de copias dentro de un locus genético diana.
G. DIAGNÓSTICO COMPLEMENTARIOS
En diversas realizaciones, se proporciona un diagnóstico complementario para una enfermedad genética, que comprende: aislar u obtener ADN, por ejemplo cfDNA, de una muestra biológica de un sujeto; eliminar los restos de fosfato terminales del ADN; tratar el ADN desfosforilado con una o más enzimas de reparación de extremos para generar ADN de extremos reparados; ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra del ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre-adaptador de ADNbc comprende un oligonucleótido de hebra de ligación que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados, y un oligonucleótido de hebra pareja no de ligación; desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación; y tratar los complejos de de adaptador/ADN extremos reparados con una o más enzimas para formar una biblioteca de ADN bicatenarios contiguos; amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN; determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; y realizar un análisis genético cuantitativo de uno o más biomarcadores asociados con la enfermedad genética en la biblioteca de clones de ADN, en el que la detección o el fracaso en la detección de al menos uno de los uno o más biomarcadores indica si el sujeto debe ser tratado para la enfermedad genética.
Como se usa aquí, la expresión “diagnóstico complementario” se refiere a una prueba diagnóstica que está vinculada a una terapia contra el cáncer particular. En una realización particular, los métodos de diagnóstico comprenden la detección de una lesión genética en un biomarcador asociado a una muestra biológica, lo que permite una rápida identificación de los pacientes que deben o no deben ser tratados con la terapia anticancerosa.
La terapia contra el cáncer incluye, pero no se limita a, cirugía, radiación, quimioterapia, fármacos contra el cáncer, e inmunomoduladores.
Los ejemplos ilustrativos de fármacos contra el cáncer incluyen, pero no se limitan a: agentes alquilantes tales como tiotepa y ciclofosfamida (CYTOXAN™); alquil sulfonatos tales como busulfán, improsulfán y piposulfán; aziridinas tales como benzodopa, carbocuona, meturedopa y uredopa; etileniminas y metilamelaminas que incluyen altretamina, trietilenmelamina, trietilenfosforamida, trietilentiofosforamida y trimetilolmelamina; mostazas de nitrógeno tales como clorambucilo, clornafazina, clorofosfamida, estramustina, ifosfamida, mecloretamina, hidrocloruro de óxido de mecloretamina, melfalán, novembichina, fenesterina, prednimustina, trofosfamida, mostaza de uracilo; nitrosoureas tales como carmustina, clorozotocina, fotemustina, lomustina, nimustina, ranimustina; antibióticos tales como aclacinomisinas, actinomicina, autramicina, azaserina, bleomicinas, cactinomicina, caliqueamicina, carabicina, carminomicina, carzinofilina, cromomicinas, dactinomicina, daunorrubicina, detorrubicina, 6-diazo-5-oxo-L-norleucina, doxorrubicina y sus formulaciones pegiladas; epirrubicina, esorrubicina, idarrubicina, marcelomicina, mitomicinas, ácido micofenólico, nogalamicina, olivomicinas, peplomicina, porfiromicina, puromicina, quelamicina, rodorrubicina, estreptonigrina, estreptozocina, tubercidina, ubenimex, zinostatina, zorrubicina; antimetabolitos tales como metotrexato y 5-fluorouracilo (5-FU); análogos de ácido fólico tales como denopterina, metotrexato, pteropterina, trimetrexato; análogos de purina tales como fludarabina, 6-mercaptopurina, tiamiprina, tioguanina; análogos de pirimidina tales como ancitabina, azacitidina, 6-azauridina, carmofur, citarabina, didesoxiuridina, doxifluridina, enocitabina, floxuridina, 5-FU; andrógenos tales como calusterona, propionato de dromostanolona, epitiostanol, mepitiostano, testolactona; anti-adrenales tales como aminoglutetimida, mitotano, trilostano; reponedor de ácido fólico, tal como ácido frolínico; aceglatona; glicósido de aldofosfamida; ácido aminolevulínico; amsacrina; bestrabucilo; bisantreno; edatraxato; defofamina; demecolcina; diaziquona; elformitina; acetato de eliptinio; etoglucida; nitrato de galio; hidroxiurea; lentinano; lonidamina; mitoguazona; mitoxantrona; mopidamol; nitracrina; pentostatina; fenamet; pirarrubicina; ácido podofilínico; 2-etilhidrazida; procarbazina; PSK®; razoxano; sizofirano; espirogermanio; ácido tenuazónico; triaziquona; 2,2’,2”-triclorotrietilamina; uretano; vindesina; dacarbazina; manomustina; mitobronitol; mitolactol; pipobromano; gacitosina; arabinósido (“Ara-C”); ciclofosfamida; tiotepa; taxoides, por ejemplo paclitaxel (TAXOL®, Bristol-Myers Squibb Oncology, Princeton, N.J.) y doxetaxel (TAXOTERE®, Rhne-Poulenc Rorer, Antony, Francia); clorambucilo; gemcitabina; 6-tioguanina; mercaptopurina; metotrexato; análogos de platino tales como cisplatino y carboplatino; vinblastina; platino; etopósido (VP-16); ifosfamida; mitomicina C; mitoxantrona; vincristina; vinorrelbina; navelbina; novantrona; tenipósido; aminopterina; xeloda; ibandronato; CPT-11; inhibidor de topoisomerasa RFS 2000; difluorometilornitina (DMFO); derivados de ácido retinoico tales como Targretin™ (bexaroteno), Panretin™ (alitretinoína); ONTAK™ (denileucin diftitox); espiramicinas; capecitabina; y sales, ácidos o derivados farmacéuticamente aceptables de cualquiera de los anteriores. También se incluyen en esta definición agentes anti-hormonales que actúan para regular o inhibir la acción hormonal en cánceres, tales como anti-estrógenos, incluyendo por ejemplo tamoxifeno, raloxifeno, 4(5)-imidazoles inhibidores de aromatasa, 4-hidroxitamoxifeno, trioxifeno, keoxifeno, LY117018, onapristona y toremifeno (Fareston); y antiandrógenos tales como flutamida, nilutamida, bicalutamida, leuprolida y goserelina; y sales, ácidos o derivados farmacéuticamente aceptables de cualquiera de los anteriores.
Los ejemplos ilustrativos de inmunomoduladores incluyen, pero no se limitan a: ciclosporina, tacrolimus, tresperimus, pimecrolimus, sirolimus, verolimus, laflunimus, laquinimod e imiquimod, así como análogos, derivados, sales, iones y complejos de los mismos.
EJEMPLOS EJEMPLO 1
PRUEBA DE CONCEPTO PARA LIGACIÓN DE ADAPTADORES DE ALTA EFICIENCIA
Este ejemplo proporciona evidencia cuantitativa directa de que las estrategias de ligación de alta eficiencia contempladas aquí dan como resultado la ligación a ambos extremos del fragmento de ADN en ausencia de formación de dímero de adaptador (Figura 2).
El ADN plasmídico del vector de clonación pUC19 se digirió con la enzima de restricción RsaI para generar extremos romos, y se desfosforiló con fosfatasa alcalina antártica. Estos fragmentos de ADN desfosforilados de extremos romos se ligaron a una colección de nueve adaptadores diferentes de alta eficiencia (Tabla 1). En todos los casos, se observó un cambio cuantitativo en la movilidad de los fragmentos después de la reacción de ligación (flechas), y el cambio en la movilidad fue equivalente a la unión de un adaptador a cada extremo de cada fragmento de ADN. Este ejemplo proporciona una prueba de concepto de que las composiciones y los métodos contemplados aquí dan como resultado una ligación de alta eficiencia de adaptadores a fragmentos de ADN, aumentando así la eficiencia global de la construcción de bibliotecas de ADN.
Tabla 1 Secuencias de oligonucleótido de hebra de ligación y de hebra pareja utilizadas para crear adaptadores de alta eficiencia (he) de ensayo
Figure imgf000024_0001
Figure imgf000025_0001
EJEMPLO 2
CONSTRUCCIÓN DE BIBLIOTECA DE ADN DE ALTA EFICIENCIA
I. REPARACIÓN DE LOS EXTREMOS DE LOS FRAGMENTOS
Los extremos de los fragmentos de ADN libre de células (cfDNA) se desfosforilaron, se reparó el daño interno al dúplex de ADN, y los extremos del ADN se “pulieron” hasta que los extremos fueron romos. Los fragmentos resultantes se denominan “fragmentos de extremos reparados”.
Los extremos de los fragmentos de cfDNA se desfosforilaron combinando 81 ml de cfDNA purificado, 10 ml de amortiguador de New England Biolabs (NEB) CutSmart (B7204S), y 5 ml de fosfatasa alcalina de gamba NEB (M0371). La mezcla de reacción se incubó a 37°C durante 15 min., y después a 65°C durante 5 min.
El daño interno a los fragmentos de cfDNA desfosforilados se reparó añadiendo 4 ml de la siguiente mezcla, preparada en hielo: 1,1 ml de mezcla de dNTP 10 mM (NEB N0447), 2,2 ml de mezcla de enzima PreCR (M0309) y I , 1 ml de T4 ADN polimerasa (M0203). Esta mezcla de reacción se incubó a 20°C durante 15 min., y después a 70°C durante 10 min. Los fragmentos de cfDNA reparados y pulidos de esta manera están listos para su uso directo en una reacción de ligación de ADN.
II. DISEÑO DE PRE-ADAPTADORES
Se utilizaron varias consideraciones de diseño para generar los pre-adaptadores, que se componen de un oligonucleótido de hebra de ligación y un oligonucleótido de hebra pareja complementario con un extremo 3’ bloqueado.
Los pre-adaptadores usados en este ejemplo se diseñaron para tener las siguientes características: un oligonucleótido de hebra de ligación que tiene una longitud de 10 nt; un equilibrio igual de restos A/T o G/C; cada una de las cuatro bases de ADN representadas en cada posición de base dentro de cada conjunto de pre­ adaptadores; una temperatura de fusión predicha de la secuencia de 10 bases que es ~37°C en 50 mM de Na+ (o K+), MgCl2 10 mM; tanto una A/T como una G/C nt como las dos primeras bases de cada secuencia de pre­ adaptador; una secuencia de oligonucleótido pareja complementaria que tiene 8 nt de longitud, que se bloquea químicamente mediante el uso de bases de ADN modificadas con 2-hidroxil ribosa (MWG Eurofins), y que tiene una temperatura de fusión de ~25°C en 50 mM de Na+ o K+, MgCl210 mM.
Incluso con las restricciones de diseño vigentes, se realizó una cribado del rendimiento empírico de los conjuntos de adaptadores. En el experimento actual, se identificaron cinco conjuntos de cuatro adaptadores con un comportamiento aceptable (véase, por ejemplo, la Tabla 2). La columna denominada “puntuación” muestra el porcentaje de eficiencia de clonación de cada adaptador con respecto al adaptador que se comporta mejor (conjunto 6-2).
Tabla 2. Conjuntos de adaptadores validados empíricamente.
Figure imgf000025_0002
Figure imgf000026_0001
III. LIGACIÓN DE PRE-ADAPTADORES
Se ligó un pre-adaptador a los fragmentos de extremos reparados generados en la etapa I de este ejemplo. Se combinaron 25 pl de fragmento de extremos reparados con 10 pl de adaptador 10 pM. Normalmente, se realizaron de 1 a 4 reacciones de ligación dependiendo del número de adaptadores separados añadidos a la reacción. Se añadieron 15 pl de cóctel de ligación (5 pl de amortiguador de ligación de T4-ADN 10X, 7,5 pl de PEG8000 al 50%, y 2,5 pl de HC T4 ADN ligasa (NEB; M0202)) a cada reacción de ligación, en un volumen final de 50 pl. La reacción se mezcló y se incubó a 20°C durante 60 min, después a 65°C durante 10 min, y después se enfrió hasta temperatura ambiente.
Después de la reacción de ligación, 50 ul de TEzero (Tris 10 mM pH 8,0, EDTA 0,1 mM, Tween 20 al 0,05%) y 120 ul de perlas de purificación de ADN se añadieron a cada reacción, y se mezclaron bien. La reacción se incubó durante 10 min a temperatura ambiente, después las perlas se lavaron dos veces con 200 pl de etanol al 70%/agua (v/v), se secaron al aire brevemente (~5 min), y se eluyeron con 20 pl de TEzero.
IV. OLIGONUCLEÓTIDOS DE REPARACIÓN
En la Tabla 3 se muestra una lista completa de los oligonucleótidos de reparación usados en este ejemplo. Cada oligonucleótido de reparación es un conjunto de 249 oligonucleótidos individuales. La secuencia invariante en cada oligonucleótido de reparación representa un sitio de unión del cebador de PCR, y se muestra en la parte izquierda de la Tabla 3.
Cada uno de los 249 oligonucleótidos comprende un código de muestra de 5 nucleótidos, que se muestra como “XXXXX” en la secuencia del oligonucleótido de reparación. La muestra de 5 nucleótidos se muestra en la parte derecha de la Tabla 3. Los códigos de 5 nucleótidos consisten en 256 secuencias únicas posibles que se escogieron para ser 2 cambios de base diferentes de todos los demás códigos en el conjunto. Esta característica permitió diferenciar las lecturas únicas y distintas de las lecturas que parecían ser únicas debido a un error de secuenciación en la región del código. Se eliminaron siete códigos en los que los restos G están sobrerrepresentados y que se mostró empíricamente que interferían con la función del adaptador, dejando 249 códigos aleatorios.
Tabla 3. Oligos de reparación y sus códigos de lectura asociados
Figure imgf000027_0001
Figure imgf000028_0001
V. ADICIÓN DE OLIGONUCLEÓTIDOS DE REPARACIÓN A BIBLIOTECAS DE PRE-ADAPTADORES
La construcción de la biblioteca se completó añadiendo oligonucleótidos de reparación al adaptador. Los oligonucleótidos de reparación ilustrados en este ejemplo contienen un sitio de unión del cebador de PCR; códigos de muestra; y una secuencia de anclaje, que es un marcador de secuencia aleatoria que actúa como un medio para identificar la secuencia, que permite la calibración de las lecturas de nucleótidos adecuadas en las lecturas de secuenciación, y que actúa como un anclaje para la hibridación con el oligonucleótido de hebra de ligación.

Claims (23)

REIVINDICACIONES
1. Un método para construir una biblioteca de ADN, que comprende:
(a) eliminar los restos de fosfato terminales de uno o más fragmentos de ADN;
(b) tratar los fragmentos de ADN desfosforilados con una o más enzimas de reparación de extremos para generar ADN de extremos reparados;
(c) ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra de los fragmentos de ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre-adaptador de ADNbc comprende (i) un oligonucleótido de hebra de ligación que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados y comprende una secuencia de anclaje; y (ii) un oligonucleótido de hebra pareja no de ligación;
(d) desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación; y
(e) tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de fragmentos de ADNbc contiguos, en la que el oligonucleótido de reparación se liga al extremo 5’ de cada hebra de los fragmentos de ADN de extremos reparados.
2. El método de la reivindicación 1, en el que el oligonucleótido de hebra pareja no de ligación comprende una modificación en el término 3’ que evita la ligación al extremo 5’ de los fragmentos de ADN de extremos reparados y/o la formación de dímero de adaptador.
3. El método de la reivindicación 1 o la reivindicación 2, en el que la fuente de uno o más fragmentos de ADN es ADN seleccionado del grupo que consiste en ADN genómico (ADNg), ADN complementario (ADNc), y ADN libre de células (cfDNA).
4. El método de la reivindicación 4, en el que la fuente del ADN es una muestra biológica seleccionada del grupo que consiste en una muestra de líquido amniótico, una muestra de sangre, una muestra de piel, una muestra de cabello, una muestra de folículo piloso, una muestra de saliva, una muestra de mucosa, una muestra de mucosa oral, una muestra de mucosa vaginal, una muestra de sudor, una muestra de lágrima, una muestra de tejido epitelial, una muestra de orina, una muestra de semen, una muestra de líquido seminal, una muestra de plasma seminal, una muestra de líquido prostático, un muestra de líquido pre-eyaculatorio (líquido de Cowper), una muestra de excrementos, una muestra de biopsia, una muestra de fluido ascítico, una muestra de líquido cefalorraquídeo, una muestra de linfa, una muestra de extracto de tejido, una muestra de biopsia, una muestra de plasma, una muestra de suero, una muestra de líquido linfático, una muestra de líquido ocular, una muestra de heces, y una muestra fijada con formalina y embebida en parafina (FFPE).
5. El método de la reivindicación 4, que comprende además aislar el ADN de la muestra biológica, fragmentar el ADN, y reparar el daño del uno o más fragmentos de ADN antes de la etapa (c).
6. El método de la reivindicación 5, en el que el daño es una citosina desaminada (uracilo), un sitio abásico, metilación de guanina a O6MeG, muescas de ADN, espacios vacíos, o un dímero de timina.
7. El método de una cualquiera de las reivindicaciones anteriores, en el que el oligonucleótido de hebra de ligación comprende además uno o más de
(i) uno o más códigos de lectura única;
(ii) un sitio de unión del cebador de PCR para la amplificación por PCR de la una o más moléculas de biblioteca de ADNbc contiguos;
(iii) uno o más códigos de muestra para la multiplexación de muestras;
(iv) uno o más sitios de unión del cebador para la secuenciación del ADN.
8. El método de una cualquiera de las reivindicaciones anteriores, en el que el oligonucleótido de reparación comprende una secuencia de anclaje y uno o más de:
(i) uno o más códigos de lectura única;
(ii) uno o más sitios de unión del cebador para la amplificación por PCR de la una o más moléculas de biblioteca de ADNbc contiguos;
(iii) uno o más códigos de muestra para la multiplexación de muestras; o
(iv) uno o más sitios de unión del cebador para la secuenciación del ADN.
9. El método de una cualquiera de las reivindicaciones precedentes, en el que cada uno del oligonucleótido de hebra de ligación y el oligonucleótido de reparación comprende una secuencia de anclaje, y en el que la secuencia de anclaje de la hebra de ligación es al menos parcialmente complementaria de la secuencia de anclaje del oligonucleótido de reparación.
10. El método de la reivindicación 9, en el que cada uno del oligonucleótido de hebra de ligación y el oligonucleótido de reparación comprenden además un sitio de unión del cebador de PCR para la amplificación del uno o más fragmentos de ADNbc etiquetados, y en el que el sitio de unión del cebador de PCR del oligonucleótido de hebra de ligación es complementario del sitio de unión del cebador de PCR del oligonucleótido de reparación.
11. El método de una cualquiera de las reivindicaciones anteriores, en el que el uno o más adaptadores comprenden una pluralidad de especies de oligonucleótido de hebra de ligación y/o una pluralidad de especies de oligonucleótido de reparación.
12. El método de la reivindicación 9, en el que cada uno del oligonucleótido de hebra de ligación y el oligonucleótido de reparación comprenden además un sitio de unión del cebador de PCR para la amplificación del uno o más fragmentos de ADNbc etiquetados, y en el que el sitio de unión del cebador de PCR del oligonucleótido de hebra de ligación no es complementario del sitio de unión del cebador de PCR del oligonucleótido de reparación.
13. El método de la reivindicación 12, en el que un cebador que se une al sitio de unión del cebador de PCR del oligonucleótido de hebra de ligación no se une sustancialmente al sitio de unión del cebador de PCR del oligonucleótido de reparación.
14. El método de una cualquiera de las reivindicaciones anteriores, en el que la eficiencia de la ligación del adaptador aumenta en comparación con un método en el que las moléculas de adaptador desfosforiladas se ligan a fragmentos de ADN fosforilados.
15. El método de una cualquiera de las reivindicaciones anteriores, en el que la biblioteca de ADN se amplifica para generar una biblioteca de clones de ADN, y en el que se realiza un análisis genético cuantitativo en una pluralidad de loci genéticos en la biblioteca de clones de ADN.
16. El método de una cualquiera de las reivindicaciones anteriores, en el que el análisis genético cuantitativo comprende la secuenciación de ADN para generar una pluralidad de lecturas de secuenciación, y comprende además análisis bioinformático de la pluralidad de lecturas de secuenciación.
17. El método de 16, que comprende además el análisis bioinformático de la pluralidad de lecturas de secuenciación, en el que el análisis bioinformático se usa:
(a) para cuantificar el número de equivalentes genómicos analizados en la biblioteca de clones de ADN;
(b) para detectar variantes genéticas en un locus genético diana;
(c) para detectar mutaciones dentro de un locus genético diana;
(d) para detectar fusiones genéticas dentro de un locus genético diana; y/o
(e) para medir las fluctuaciones del número de copias dentro de un locus genético diana.
18. El método de la reivindicación 17, en el que el análisis genético cuantitativo se usa para identificar o detectar una o más lesiones genéticas que causan o están asociadas con una enfermedad genética, y en el que la lesión genética comprende una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes.
19. Un método para predecir, diagnosticar o monitorizar una enfermedad genética en un sujeto, que comprende: (a) aislar u obtener ADN de una muestra biológica del sujeto;
(b) eliminar los restos de fosfato terminales del ADN;
(c) tratar el ADN desfosforilado con una o más enzimas de reparación de extremos para generar ADN de extremos reparados;
(d) ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra del ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre­ adaptador de ADNbc comprende un oligonucleótido de hebra de ligación que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados, y un oligonucleótido de hebra pareja no de ligación;
(e) desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación;
(f) tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de fragmentos de ADN bicatenarios contiguos, en la que el oligonucleótido de reparación se liga al extremo 5’ de cada hebra de los fragmentos de ADN de extremos reparados;
(g) amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN;
(h) determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; e
(i) realizar un análisis genético cuantitativo de uno o más loci genéticos diana asociados con la enfermedad genética en la biblioteca de clones de ADN, en el que la identificación o detección de una o más lesiones genéticas en el uno o más loci genéticos diana es pronóstica para, diagnóstico de, o monitoriza la progresión de la enfermedad genética.
20. Un diagnóstico complementario para una enfermedad genética, que comprende:
(a) aislar u obtener ADN de una muestra biológica de un sujeto;
(b) eliminar los restos de fosfato terminales del ADN;
(c) tratar el ADN desfosforilado con una o más enzimas de reparación de extremos para generar ADN de extremos reparados;
(d) ligar uno o más pre-adaptadores de ADN bicatenario (ADNbc) al extremo 3’ de cada hebra del ADN de extremos reparados para formar complejos de pre-adaptador/ADN de extremos reparados, en los que cada pre­ adaptador de ADNbc comprende un oligonucleótido de hebra de ligación que está ligado al extremo 3’ de cada hebra del ADN de extremos reparados, y un oligonucleótido de hebra pareja no de ligación;
(e) desplazar el oligonucleótido de hebra pareja no de ligación de los complejos de pre-adaptador/ADN de extremos reparados con un oligonucleótido de reparación, para formar complejos de adaptador/ADN de extremos reparados, en los que cada adaptador comprende el oligonucleótido de hebra de ligación y el oligonucleótido de reparación;
(f) tratar los complejos de adaptador/ADN de extremos reparados con una polinucleótido cinasa y una ADN ligasa para formar una biblioteca de ADN bicatenarios contiguos, en la que el oligonucleótido de reparación se liga al extremo 5’ de cada hebra de los fragmentos de ADN de extremos reparados;
(g) amplificar la biblioteca de ADN para generar una biblioteca de clones de ADN;
(h) determinar el número de equivalentes genómicos en la biblioteca de clones de ADN; e
(i) realizar un análisis genético cuantitativo de uno o más biomarcadores asociados con la enfermedad genética en la biblioteca de clones de ADN, en el que la detección de, o la falta de detección de, al menos uno de los uno o más biomarcadores indica si el sujeto debe ser tratado para la enfermedad genética.
21. El método de la reivindicación 19 o 20, en el que el ADN es ADN genómico, ADN de muestras fijadas con formalina y embebidas en parafina (FFPE), ADNc, o cfDNA.
22. El método de la reivindicación 20, en el que el biomarcador es una lesión genética seleccionada de una transición o transversión de nucleótido, una inserción o supresión de nucleótido, un reordenamiento genómico, un cambio en el número de copias, o una fusión de genes.
23. El método de una cualquiera de las reivindicaciones 18 a 22, en el que la enfermedad genética es cáncer.
ES16865029T 2015-11-11 2016-11-10 Construcción de alta eficiencia de bibliotecas de ADN Active ES2856598T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562254110P 2015-11-11 2015-11-11
PCT/US2016/061395 WO2017083562A1 (en) 2015-11-11 2016-11-10 High efficiency construction of dna libraries

Publications (1)

Publication Number Publication Date
ES2856598T3 true ES2856598T3 (es) 2021-09-27

Family

ID=58695623

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16865029T Active ES2856598T3 (es) 2015-11-11 2016-11-10 Construcción de alta eficiencia de bibliotecas de ADN

Country Status (14)

Country Link
US (2) US11339391B2 (es)
EP (2) EP3889257A1 (es)
JP (4) JP6913089B2 (es)
KR (1) KR20180113973A (es)
CN (2) CN108431233B (es)
AU (1) AU2016353133B2 (es)
BR (1) BR112018009606A8 (es)
CA (1) CA3004435A1 (es)
DK (1) DK3374525T3 (es)
ES (1) ES2856598T3 (es)
IL (2) IL259237B (es)
MX (2) MX2018005858A (es)
RU (1) RU2018121254A (es)
WO (1) WO2017083562A1 (es)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3561072A1 (en) 2012-12-10 2019-10-30 Resolution Bioscience, Inc. Methods for targeted genomic analysis
DK3374525T3 (da) 2015-11-11 2021-04-06 Resolution Bioscience Inc Højeffektiv konstruktion af dna-biblioteker
EP3504347A4 (en) * 2016-08-25 2020-04-29 Resolution Bioscience, Inc. METHODS FOR DETECTING GENOMIC COPY CHANGES IN DNA SAMPLES
CA3068446A1 (en) * 2017-06-30 2019-01-02 The Regents Of The University Of California Methods and systems for evaluating dna methylation in cell-free dna
WO2019051484A1 (en) * 2017-09-11 2019-03-14 Ludwig Institute For Cancer Research Ltd SELECTIVE MARKING OF 5-METHYLCYTOSINE IN CIRCULATING ACELLULAR DNA
KR20200085783A (ko) 2017-10-27 2020-07-15 주노 다이어그노스틱스, 인크. 초저용량 액체 생검을 위한 장치, 시스템 및 방법
WO2019173552A1 (en) * 2018-03-08 2019-09-12 St. John's University Circulating serum cell-free dna biomarkers and methods
CA3094717A1 (en) 2018-04-02 2019-10-10 Grail, Inc. Methylation markers and targeted methylation probe panels
WO2020023493A1 (en) * 2018-07-24 2020-01-30 Ripple Biosolutions Llc Methods and composition for targeted genomic analysis
WO2020069350A1 (en) 2018-09-27 2020-04-02 Grail, Inc. Methylation markers and targeted methylation probe panel
US11781169B2 (en) 2018-10-05 2023-10-10 Microsoft Technology Licensing, Llc Enzymatic DNA repair
CN111074353B (zh) * 2018-10-18 2023-10-13 深圳华大智造科技股份有限公司 全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库
US11926821B2 (en) * 2018-10-22 2024-03-12 The Chinese University Of Hong Kong Cell-free DNA quality
CN109576799B (zh) * 2018-11-30 2022-04-26 深圳安吉康尔医学检验实验室 Fh测序文库的构建方法和引物组及试剂盒
AU2020245532A1 (en) * 2019-03-27 2021-11-11 Juno Diagnostics, Inc. Optimized ultra-low volume liquid biopsy methods, systems, and devices
GB202013141D0 (en) * 2020-08-21 2020-10-07 Univ College Cardiff Consultants Ltd A screening method for the detection of DNA damage
KR20230065295A (ko) * 2020-09-08 2023-05-11 레졸루션 바이오사이언스, 인크. 유전자 라이브러리 및 유전자 분석의 고효율성 구축을 위한 어댑터 및 방법
CN114317528A (zh) * 2020-09-30 2022-04-12 北京吉因加科技有限公司 特异分子标签umi组、混合特异分子标签接头及应用

Family Cites Families (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5591582A (en) 1985-07-23 1997-01-07 The Board Of Rijks Universiteit Leiden Methods for detecting activated RAS oncogenes
US5888731A (en) 1995-08-30 1999-03-30 Visible Genetics Inc. Method for identification of mutations using ligation of multiple oligonucleotide probes
JP2002511767A (ja) 1997-08-28 2002-04-16 ピーイー コーポレイション(エヌワイ) 化学切断による、核酸における変異の改良された検出
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
US6812341B1 (en) 2001-05-11 2004-11-02 Ambion, Inc. High efficiency mRNA isolation methods and compositions
WO2003052116A2 (en) 2001-07-17 2003-06-26 Stratagene Methods for detection of a target nucleic acid using multi-subunit probes
US7432084B2 (en) 2001-08-31 2008-10-07 Rosetta Inpharmatics Llc Methods for preparing nucleic acid samples
US7361821B2 (en) 2002-09-20 2008-04-22 Intel Corporation Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading
JP4441623B2 (ja) * 2002-12-11 2010-03-31 学校法人慶應義塾 対応付け分子およびその構成要素のライブラリーの製造方法および利用方法
TW200506052A (en) 2003-05-07 2005-02-16 Takara Bio Inc Method of analyzing DNA region
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US20090264305A1 (en) 2005-07-07 2009-10-22 Athlomics Pty Ltd. Polynucleotide Marker Genes and their Expression, for Diagnosis of Endotoxemia
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US7939645B2 (en) 2006-01-06 2011-05-10 Agilent Technologies, Inc Reaction buffer composition for nucleic acid replication with packed DNA polymerases
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
US8383338B2 (en) 2006-04-24 2013-02-26 Roche Nimblegen, Inc. Methods and systems for uniform enrichment of genomic regions
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
WO2008045158A1 (en) 2006-10-10 2008-04-17 Illumina, Inc. Compositions and methods for representational selection of nucleic acids fro complex mixtures using hybridization
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
WO2009023676A1 (en) 2007-08-12 2009-02-19 Integrated Dna Technologies, Inc. Microarray system with improved sequence specificity
US9388457B2 (en) 2007-09-14 2016-07-12 Affymetrix, Inc. Locus specific amplification using array probes
AU2008335362B2 (en) * 2007-12-05 2013-07-25 Complete Genomics, Inc. Efficient base determination in sequencing reactions
WO2009091798A1 (en) 2008-01-16 2009-07-23 Helicos Biosciences Corporation Quantitative genetic analysis
US8202691B2 (en) 2008-01-25 2012-06-19 Illumina, Inc. Uniform fragmentation of DNA using binding proteins
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
WO2010038042A1 (en) 2008-10-02 2010-04-08 Illumina Cambridge Ltd. Nucleic acid sample enrichment for sequencing applications
WO2010068856A1 (en) 2008-12-11 2010-06-17 Trustees Of Boston University Isolation of rna
EP2789694A1 (en) 2009-04-02 2014-10-15 Fluidigm Corporation Microfluidic device with reaction product recovery system
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
WO2010129937A2 (en) 2009-05-08 2010-11-11 Life Technologies Corporation Methods for detecting genetic variations in dna samples
PL2669387T3 (pl) 2009-08-25 2016-12-30 Sposoby selekcji i amplifikacji polinukleotydów
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US10378064B1 (en) 2010-04-16 2019-08-13 Chronix Biomedical Analyzing circulating nucleic acids to identify a biomarker representative of cancer presented by a patient population
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US8828688B2 (en) 2010-05-27 2014-09-09 Affymetrix, Inc. Multiplex amplification methods
WO2011156529A2 (en) 2010-06-08 2011-12-15 Nugen Technologies, Inc. Methods and composition for multiplex sequencing
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
EP2619329B1 (en) 2010-09-24 2019-05-22 The Board of Trustees of The Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
EP4269623A3 (en) 2010-11-30 2024-03-06 The Chinese University Of Hong Kong Analysis of a biological sample of an organism for chromosomal deletions or amplifications associated with cancer
KR20190100425A (ko) 2010-12-30 2019-08-28 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
JP6153874B2 (ja) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法
US9260753B2 (en) 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
RS57837B1 (sr) 2011-04-12 2018-12-31 Verinata Health Inc Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
CN103748236B (zh) 2011-04-15 2018-12-25 约翰·霍普金斯大学 安全测序***
WO2013056178A2 (en) 2011-10-14 2013-04-18 Foundation Medicine, Inc. Novel estrogen receptor mutations and uses thereof
CN103103624B (zh) * 2011-11-15 2014-12-31 深圳华大基因科技服务有限公司 高通量测序文库的构建方法及其应用
US10227587B2 (en) 2012-01-10 2019-03-12 Berry Genomics Co., Ltd. Method for constructing a plasma DNA sequencing library
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
DK2828218T3 (da) 2012-03-20 2020-11-02 Univ Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
US20130288915A1 (en) 2012-04-27 2013-10-31 Htg Molecular Diagnostics, Inc. Compositions and methods for alk molecular testing
CA2872141C (en) 2012-05-31 2016-01-19 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
CA2877740A1 (en) 2012-07-03 2014-01-09 Integrated Dna Technologies, Inc. Tm-enhanced blocking oligonucleotides and baits for improved target enrichment and reduced off-target selection
DK2880447T3 (da) 2012-07-31 2019-08-12 Novartis Ag Markører forbundet med følsomhed for hæmmere af human double minute 2 (MDM2)
AU2013296237B2 (en) 2012-08-03 2019-05-16 Foundation Medicine, Inc. Human papilloma virus as predictor of cancer prognosis
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
KR102393608B1 (ko) 2012-09-04 2022-05-03 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
WO2014052487A1 (en) 2012-09-28 2014-04-03 Cepheid Two-primer pcr for microrna multiplex assay
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA3120521A1 (en) 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014071295A1 (en) 2012-11-02 2014-05-08 Enzymatics Inc. Methods and kits for nucleic acid sample preparation for sequencing
WO2014071358A2 (en) 2012-11-05 2014-05-08 Foundation Medicine, Inc. Novel ntrk1 fusion molecules and uses thereof
EP3561072A1 (en) * 2012-12-10 2019-10-30 Resolution Bioscience, Inc. Methods for targeted genomic analysis
EP2931922B1 (en) 2012-12-14 2018-10-17 Chronix Biomedical Personalized biomarkers for cancer
US11158425B2 (en) 2013-01-05 2021-10-26 Foundation Medicine, Inc. System and method for managing genomic information
US20140242581A1 (en) 2013-01-23 2014-08-28 Reproductive Genetics And Technology Solutions, Llc Compositions and methods for genetic analysis of embryos
EP2954054B1 (en) 2013-02-08 2018-12-05 Qiagen GmbH Method for separating dna by size
US10017807B2 (en) * 2013-03-15 2018-07-10 Verinata Health, Inc. Generating cell-free DNA libraries directly from blood
WO2014151117A1 (en) 2013-03-15 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
AU2014262481A1 (en) 2013-05-10 2015-11-26 Foundation Medicine, Inc. Analysis of genetic variants
US20150072344A1 (en) 2013-09-10 2015-03-12 Imdaptive Incorporated Barcoded Universal Marker Indicator (BUMI) Tags
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
JP6525473B2 (ja) 2013-11-13 2019-06-05 ニューゲン テクノロジーズ, インコーポレイテッド 複製物配列決定リードを同定するための組成物および方法
CN103668471B (zh) * 2013-12-19 2015-09-30 上海交通大学 一种构建dna高通量测序文库的方法及其配套试剂盒
ES2784450T3 (es) 2013-12-28 2020-09-25 Guardant Health Inc Métodos y sistemas para detectar variantes genéticas
EP3099796B1 (en) * 2014-01-31 2018-08-29 Swift Biosciences, Inc. Improved methods for processing dna substrates
US10208338B2 (en) 2014-03-03 2019-02-19 Swift Biosciences, Inc. Enhanced adaptor ligation
US10975371B2 (en) 2014-04-29 2021-04-13 Illumina, Inc. Nucleic acid sequence analysis from single cells
CA2953469A1 (en) 2014-06-26 2015-12-30 10X Genomics, Inc. Analysis of nucleic acid sequences
US10102337B2 (en) 2014-08-06 2018-10-16 Nugen Technologies, Inc. Digital measurements from targeted sequencing
US20160053301A1 (en) 2014-08-22 2016-02-25 Clearfork Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
CA2957657A1 (en) * 2014-08-22 2016-02-25 Resolution Bioscience, Inc. Methods for quantitative genetic analysis of cell free dna
JP2017525369A (ja) * 2014-09-05 2017-09-07 キアゲン ゲーエムベーハー アダプター連結アンプリコンの調製
ES2925014T3 (es) * 2014-09-12 2022-10-13 Univ Leland Stanford Junior Identificación y uso de ácidos nucleicos circulantes
US9890375B2 (en) * 2014-09-12 2018-02-13 Bgi Shenzhen Co., Limited Isolated oligonucleotide and use thereof in nucleic acid sequencing
CA2967447A1 (en) 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples
US11072814B2 (en) 2014-12-12 2021-07-27 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
WO2016109452A1 (en) 2014-12-31 2016-07-07 Guardant Health , Inc. Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
ES2908347T3 (es) 2015-02-10 2022-04-28 Univ Hong Kong Chinese Detección de mutaciones para cribado de cáncer y análisis fetal
CA2993362A1 (en) 2015-07-23 2017-01-26 The Chinese University Of Hong Kong Analysis of fragmentation patterns of cell-free dna
WO2017062867A1 (en) 2015-10-09 2017-04-13 Helmy Eltoukhy Population based treatment recommender using cell free dna
CN108368546B (zh) 2015-10-10 2023-08-01 夸登特健康公司 无细胞dna分析中基因融合检测的方法和应用
DK3374525T3 (da) 2015-11-11 2021-04-06 Resolution Bioscience Inc Højeffektiv konstruktion af dna-biblioteker
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
WO2017151524A1 (en) 2016-02-29 2017-09-08 Foundation Medicine, Inc. Methods and systems for evaluating tumor mutational burden
WO2017214557A1 (en) 2016-06-10 2017-12-14 Counsyl, Inc. Nucleic acid sequencing adapters and uses thereof
EP3504347A4 (en) 2016-08-25 2020-04-29 Resolution Bioscience, Inc. METHODS FOR DETECTING GENOMIC COPY CHANGES IN DNA SAMPLES
SG11201811159SA (en) 2016-09-30 2019-01-30 Guardant Health Inc Methods for multi-resolution analysis of cell-free nucleic acids
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
US20180142299A1 (en) * 2016-11-17 2018-05-24 SeraCare Life Sciences,Inc Methods for preparing dna reference materials and controls
WO2018104908A2 (en) 2016-12-09 2018-06-14 Boreal Genomics, Inc. Linked ligation
ES2868074T3 (es) 2017-04-14 2021-10-21 Guardant Health Inc Métodos para unir adaptadores a ácidos nucleicos de muestra
GB2595076B8 (en) 2018-11-21 2023-08-23 Agilent Technologies Inc Methods for targeted nucleic acid library formation

Also Published As

Publication number Publication date
JP6913089B2 (ja) 2021-08-04
JP7318054B2 (ja) 2023-07-31
AU2016353133B2 (en) 2022-12-08
US20220267763A1 (en) 2022-08-25
IL285202A (en) 2021-08-31
BR112018009606A8 (pt) 2019-02-26
BR112018009606A2 (pt) 2018-11-06
MX2018005858A (es) 2019-02-20
CN108431233B (zh) 2022-04-01
US20180245072A1 (en) 2018-08-30
WO2017083562A1 (en) 2017-05-18
JP2021073252A (ja) 2021-05-13
EP3374525B1 (en) 2021-01-20
EP3374525A4 (en) 2019-05-29
US11339391B2 (en) 2022-05-24
IL259237A (en) 2018-07-31
CN115044645A (zh) 2022-09-13
AU2016353133A1 (en) 2018-05-24
EP3889257A1 (en) 2021-10-06
CN108431233A (zh) 2018-08-21
CA3004435A1 (en) 2017-05-18
MX2023008338A (es) 2023-07-25
JP2022105062A (ja) 2022-07-12
EP3374525A1 (en) 2018-09-19
JP2023113960A (ja) 2023-08-16
KR20180113973A (ko) 2018-10-17
DK3374525T3 (da) 2021-04-06
JP2019504618A (ja) 2019-02-21
IL259237B (en) 2021-08-31
RU2018121254A (ru) 2019-12-16
JP7223788B2 (ja) 2023-02-16

Similar Documents

Publication Publication Date Title
ES2856598T3 (es) Construcción de alta eficiencia de bibliotecas de ADN
US20220325353A1 (en) Methods for the detection of genomic copy changes in dna samples
US20220073906A1 (en) Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis
US20240191293A1 (en) Compositions and methods for simultaneous genetic analysis of multiple libraries