ES2905265T3 - Análisis digital de analitos moleculares mediante detección de molécula única - Google Patents

Análisis digital de analitos moleculares mediante detección de molécula única Download PDF

Info

Publication number
ES2905265T3
ES2905265T3 ES13855452T ES13855452T ES2905265T3 ES 2905265 T3 ES2905265 T3 ES 2905265T3 ES 13855452 T ES13855452 T ES 13855452T ES 13855452 T ES13855452 T ES 13855452T ES 2905265 T3 ES2905265 T3 ES 2905265T3
Authority
ES
Spain
Prior art keywords
analytes
probes
probe
signals
cycles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13855452T
Other languages
English (en)
Inventor
Bryan Staker
Niandong Liu
Bart Staker
Michael Mclaughlin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apton Biosystems LLC
Original Assignee
Apton Biosystems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apton Biosystems LLC filed Critical Apton Biosystems LLC
Application granted granted Critical
Publication of ES2905265T3 publication Critical patent/ES2905265T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54306Solid-phase reaction mechanisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6825Nucleic acid detection involving sensors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/30Staining; Impregnating ; Fixation; Dehydration; Multistep processes for preparing samples of tissue, cell or nucleic acid material and the like for analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6486Measuring fluorescence of biological material, e.g. DNA, RNA, cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/536Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/13Linear codes
    • H03M13/15Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes
    • H03M13/151Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes using error location or error correction polynomials
    • H03M13/1515Reed-Solomon codes

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Medical Informatics (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Organic Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)

Abstract

Un método para detectar una pluralidad de analitos en una muestra biológica, en donde cada analito objetivo distinto, de N analitos objetivo distintos, se inmoviliza sobre un sustrato sólido en una ubicación que está espacialmente separada de cualquier otro analito objetivo distinto, de los N analitos objetivo distintos, comprendiendo el método: seleccionar conjuntos de sondas etiquetadas con fluorescencia, que comprenden X colores distintos, en donde cada una de dichas sondas está marcada de manera detectable, de tal manera que una sonda está configurada para detectar un analito objetivo distinto; realizar al menos M ciclos de detección de molécula individual, comprendiendo cada ciclo uno o más pasos; en donde cada paso comprende la unión selectiva entre las sondas y distintos analitos objetivo y detección de señales; en donde cada ciclo comprende además la eliminación de las sondas del sustrato; detectar, a partir de cada uno de dichos al menos M ciclos, la presencia o ausencia de una pluralidad de señales desde dichas ubicaciones espacialmente separadas de dicho sustrato; y determinar, a partir de dicha pluralidad de señales, información sobre la presencia o ausencia de uno o más de dichos X colores para cada uno de los N analitos objetivo distintos, en cada uno de los pasos del ciclo; y codificar dicha información en al menos K bits de información, usando un código de corrección de errores, combinando dichos K bits de información en L = K x M bits de información total de modo que L bits de información describan la presencia o ausencia de uno o más de dichos N analitos objetivo distintos; en donde K, M y X se eligen de modo que XM>N, L> Log2 (N); y en donde dichos M ciclos comprenden uno o más ciclos adicionales para tener en cuenta los errores en las señales detectadas, generando bits de información adicionales en comparación con el número mínimo de bits de información necesarios para identificar dichos N analitos distintos.

Description

DESCRIPCIÓN
Análisis digital de analitos moleculares mediante detección de molécula única
Antecedentes
Campo técnico
Esta divulgación se refiere a los campos de la teoría del diagnóstico y las comunicaciones, y se refiere a específicamente con los métodos para el análisis digital de analitos moleculares.
Descripción de la técnica relacionada
Están disponibles múltiples enfoques moleculares y bioquímicos para la identificación y cuantificación de analitos moleculares. Los ejemplos incluyen ensayos basados en ácidos nucleicos de uso común, como qPCR (reacción cuantitativa en cadena de la polimerasa ) y microarreglos de ADN, y enfoques basados en proteínas, tales como inmunoensayos y espectrometría de masas. Sin embargo, existen diferentes limitaciones en las tecnologías actuales de análisis de analitos. Por ejemplo, los métodos actuales tienen limitaciones de sensibilidad, especialmente cuando los analitos están presentes en muestras biológicas en un bajo número de copias o en bajas concentraciones. La mayoría de las tecnologías de cuantificación de ácidos nucleicos implican la amplificación de muestras, para una mayor sensibilidad. Sin embargo, las técnicas de amplificación introducen sesgos e imprecisiones en la cuantificación. Además, la amplificación no es posible para proteínas y péptidos. Debido a la falta de sensibilidad, las aproximaciones para la detección y cuantificación requieren frecuentemente volúmenes de muestra relativamente grandes. Los métodos actuales también están limitados en su capacidad para la identificación y cuantificación de un gran número de analitos. La cuantificación de todo el ARNm y las proteínas en una muestra requiere una alta multiplexidad y un amplio rango dinámico. Además, las tecnologías actuales carecen de la capacidad para detectar y cuantificar ácidos nucleicos y proteínas simultáneamente.
Los métodos actuales a menudo generan errores durante la detección y cuantificación de analitos, debido a condiciones tales como detección de señal débil, falsos positivos y otros errores. Estos errores pueden provocar una identificación errónea y una cuantificación imprecisa de los analitos.
Por lo tanto, se necesitan métodos y sistemas para el análisis de analitos, que permitan una alta sensibilidad con un volumen de muestra pequeño, alta multiplexidad, amplio rango dinámico y la capacidad para detectar moléculas de proteínas y de ácido nucleico en un solo ensayo. Más importante aún, se necesitan métodos de corrección de errores para corregir los errores de detección de analitos. Gunderson et al., (2004) Genome Research, vol 14, 870-877 dan a conocer un método para decodificar arreglos de ADN ordenadas al azar. Gunson et al. divulgan un método para detectar una pluralidad de analitos (N) de ácido nucleico, inmovilizados en una perla y separados espacialmente de otros analitos. Las sondas en Gunderson están marcadas con fluorescencia con dos colores diferentes (es decir, X = 2), de modo que una sonda está configurada para detectar un tipo de esfera distinto, y esa esfera también está vinculada a un analito de ADN específico. Los métodos usan pasos o ciclos de hibridación secuencial (ciclos M), y los ciclos M pueden incluir un ciclo adicional para la detección de errores. En cada ciclo, los métodos implican detectar la presencia o ausencia de cada marcador fluorescente, para determinar la presencia o ausencia de cada tipo de esfera y, por lo tanto, extrapolar la presencia o ausencia de un analito de ADN. El ciclo genera K bits de información. En Gunderson, el total de bits de información generados (es decir, L bits de información) puede ser mayor que log2(N). Sin embargo, la información no se codifica mediante un código de corrección de errores, el total de bits de información necesarios (L) no se calcula mediante la fórmula K x M = L y el número de etiquetas fluorescentes utilizadas en el método no se calcula mediante la fórmula XM>N. El método divulgado en Gunderson et al. se basa en un gran número de copias para la unión de la sonda y, a diferencia de los métodos reivindicados, no es adecuado para la detección de una sola molécula. Goransson et al., (2009) Nucleic Acid Research, vol 37, no. 1, e7, divulgan un método de amplificación de círculo rodante para detectar moléculas de ácido nucleico individuales amplificadas. En la técnica se conocen otros métodos para detectar moléculas individuales, por ejemplo, como se resume en la página de Wikepedia "Single-molecule Experiment" (Anónimo: "Single Molecule Experiment" obtenido de la URL de Internet: https://en.wikipedia.org/w/index.php?title=Single-molecule_experiment&oldid=517365491).
La presente invención aborda estas y otras limitaciones de la técnica anterior, mediante la introducción de la identificación y cuantificación de una molécula única sensible de analitos biológicos, con una lectura digital.
Breve descripción de los dibujos
Las realizaciones divulgadas tienen otras ventajas y características que serán más evidentes a partir de la siguiente descripción detallada de la invención y las reivindicaciones adjuntas, cuando se toman en conjunto con los dibujos adjuntos, en los que:
Figura (o "FIG.") 1 es un diagrama de bloques de alto nivel que ilustra un ejemplo de un ordenador, de acuerdo con una realización de la invención.
FIG. 2A ilustra un ejemplo de una sonda que comprende un anticuerpo y un marcador detectable, donde la sonda se une a una proteína objetivo, de acuerdo con una realización de la invención.
FIG. 2B ilustra un ejemplo de una sonda que comprende un anticuerpo primario y un anticuerpo secundario conjugados con un marcador detectable, de acuerdo con una realización de la invención.
FIG. 3 muestra un analito objetivo unido a una sonda que comprende un aptámero y una región de cola, de acuerdo con una realización de la invención.
FIG. 4 muestra una etiqueta fluorescente unida a una sonda que comprende un aptámero y una región de cola, de acuerdo con una realización de la invención.
FIG. 5 muestra un ejemplo de una sonda que comprende un anticuerpo unido a una región que puede hibridarse con una región de cola, de acuerdo con una realización de la invención.
FIG. 6 ilustra un ejemplo de una sonda que comprende un anticuerpo primario y un anticuerpo secundario conjugados con una región de cola, de acuerdo con una realización de la invención.
FIG. 7 muestra un ejemplo de un sustrato sólido unido a una muestra que comprende analitos (p. ej., proteínas, ADN y/o ARN), de acuerdo con una realización de la invención.
FIG. 8 muestra un sustrato de ejemplo (arreglo de 10x10) para unir analitos, de acuerdo con una realización de la invención.
FIG. 9 es una vista desde arriba de un sustrato sólido con analitos unidos aleatoriamente al sustrato, de acuerdo con una realización de la invención.
FIGs. 10A-10D ilustran un ejemplo de dieciséis proteínas objetivo dispuestas sobre un sustrato. Las FIGs. 10B y 10C representan ejemplos de imágenes del sustrato después del contacto con diferentes conjuntos de sondas, de acuerdo con una realización de la invención.
FIG. 11 ilustra una estructura de corrección de errores Reed-Solomon de ejemplo, de acuerdo con una realización de la invención.
FIG. 12A ilustra un sustrato de ejemplo dividido en tres regiones que representan los niveles de concentración del analito objetivo, de acuerdo con una realización de la invención.
FIGs. 12B-12C muestran gráficos de rangos de abundancia de analitos objetivo, de acuerdo con una realización de la invención.
FIG. 13 ilustra un ensayo de detección de ejemplo, que usa un sustrato y cuatro analitos que usan una etiqueta fluorescente de un solo color, un solo paso, conteo oscuro y 1 bit por ciclo, de acuerdo con una realización de la invención.
FIG. 14 muestra un ensayo de detección de ejemplo, que usa un sustrato y cuatro analitos que usan una etiqueta fluorescente de un solo color, cuatro pasos por ciclo, el ciclo oscuro no se cuenta y 2 bits por ciclo, de acuerdo con una realización de la invención.
FIG. 15 muestra secuencias de color e IDs para analitos objetivo, y muestra resultados de barrido de los analitos objetivo para los ciclos de sondeo, unión y eliminación, de acuerdo con una realización de la invención.
FIG. 16A muestra los números de analitos objetivo específicos identificados en diferentes partes de un sustrato, de acuerdo con una realización de la invención.
FIG. 16B muestra secuencias de color e IDs para analitos objetivo, de acuerdo con una realización de la invención. FIG. 17 es una imagen de sondas de fluorescentes individuales hibridadas con analitos objetivo unidas (¿?) a un sustrato, de acuerdo con una realización de la invención.
FIG. 18 ilustra ejemplos de identificación de diferentes analitos objetivo usando detección de fluorescente individual, de acuerdo con una realización de la invención.
FIG. 19 muestra secuencias de color e IDs para dos analitos objetivo, y muestra los resultados del barrido de los analitos objetivo para los ciclos de sondeo, unión y eliminación, de acuerdo con una realización de la invención. FIG. 20 es una imagen de péptidos de una sola molécula unidos a un sustrato, hibridados con anticuerpos conjugados, de acuerdo con una realización de la invención.
FIG. 21 muestra un gráfico de probabilidad de concentraciones estimadas de proteínas de la base de datos UniProt, de acuerdo con una realización de la invención.
FIG. 22 muestra una lista de valores estimados para diversas regiones de abundancia de un sustrato, de acuerdo con una realización de la invención.
FIG. 23 es una imagen simulada de identificación de proteínas en cualquier rango de abundancia, de acuerdo con una realización de la invención.
FIG. 24 ilustra un gráfico de la rata de error del sistema frente a la rata de error bruto para identificar analitos objetivo, de acuerdo con una realización de la invención.
Resumen de la invención
El alcance de la invención está definido por las reivindicaciones adjuntas.
En el presente documento se describen sistemas y métodos para detectar una pluralidad de analitos, que comprenden: obtener una pluralidad de conjuntos de reactivos de sonda ordenados, comprendiendo cada uno de los conjuntos de reactivos de sonda ordenados una o más sondas dirigidas a un subconjunto definido de N analitos objetivo distintos, en donde los N distintos analitos objetivo se inmovilizan en regiones espacialmente separadas de un sustrato, y cada una de las sondas se marca de manera detectable. El método también incluye pasos para realizar al menos M ciclos de unión de sonda y detección de señal, comprendiendo cada ciclo uno o más pasos, comprendiendo un paso el uso de al menos uno de los conjuntos de reactivos de sonda ordenados. El método comprende detectar, a partir de al menos M ciclos, la presencia o ausencia de una pluralidad de señales de las regiones separadas espacialmente del sustrato.
El método incluye determinar, a partir de la pluralidad de señales, al menos K bits de información por ciclo para uno o más de los N analitos objetivo distintos, en donde los al menos K bits de información se usan para determinar L bits totales de información, en donde K x M = L bits de información y L > log2 (N), y en donde los L bits de información se utilizan para determinar la presencia o ausencia de uno o más de los N analitos objetivo distintos.
En los métodos de la invención, L > log2 (N) y L comprende bits de información para la identificación del objetivo. Como se describe aquí, L > log2 (N), y L puede comprender bits de información que se ordenan en un orden predeterminado.
Como se describe aquí, el orden predeterminado puede ser un orden aleatorio. Como se describe en el presente documento, L > log2 (N), y L puede comprender bits de información que comprenden una clave para decodificar un orden de la pluralidad de conjuntos de reactivos de sonda ordenados.
El método también incluye digitalizar la pluralidad de señales para expandir un rango dinámico de detección de la pluralidad de señales. En algunas realizaciones, los al menos K bits de información comprenden información sobre el número de pasos en un ciclo. En otra realización, los al menos K bits de información comprenden información sobre la ausencia de una señal para uno de los N analitos objetivo distintos.
En los métodos y kits de la invención, el marcador detectable es un marcador fluorescente. En otra realización, la sonda comprende un anticuerpo. En una realización, el anticuerpo se conjuga directamente con un marcador. El anticuerpo también se puede unir a un anticuerpo secundario conjugado con un marcador. En otras realizaciones, la sonda comprende un aptámero. En una realización, el aptámero comprende una región base homopolimérica. En otras realizaciones, la pluralidad de analitos comprende una proteína, un aptámero peptídico o una molécula de ácido nucleico.
El método puede incluir detectar a partir de al menos M ciclos la presencia o ausencia de una pluralidad de señales ópticas. El método también puede incluir detectar a partir de al menos M ciclos la presencia o ausencia de una pluralidad de señales eléctricas.
En una realización, el método se implementa por ordenador. En otra realización, K es un bit de información por ciclo. En otras realizaciones, K son dos bits de información por ciclo. K también puede ser tres o más bits de información por ciclo.
El método incluye determinar, a partir de los L bits de información, una corrección de error para la pluralidad de señales de salida. El método de corrección de errores puede ser un código Reed-Solomon.
El método también puede incluir la determinación de un tipo de conjuntos de reactivos de sonda, con base en el tipo de N analitos objetivo distintos.
En una realización, los N analitos objetivo distintos están presentes en una muestra, que se divide en una pluralidad de alícuotas diluidas hasta una pluralidad de diluciones finales distintas, y cada una de la pluralidad de alícuotas se inmoviliza en una sección distinta del sustrato. En otra realización, una de las distintas diluciones finales se determina en base a una probable concentración que ocurre naturalmente, de al menos uno de los N analitos objetivo distintos. En otra realización, se determina una concentración de uno de los N analitos objetivo distintos, contando las apariciones del analito objetivo dentro de una de las secciones distintas, y ajustando el recuento de acuerdo con la dilución de la alícuota respectiva.
La invención incluye un kit para detectar una pluralidad de analitos, como se define en las reivindicaciones adjuntas.
En algunas realizaciones, el kit incluye una o más sondas que comprenden un anticuerpo. En otra realización, la sonda es un anticuerpo. En una realización, el anticuerpo se conjuga directamente con un marcador fluorescente. En otra realización más, el anticuerpo se une a un anticuerpo secundario conjugado con un marcador. En otras realizaciones, la sonda comprende un aptámero. El aptámero puede comprender una región base homopolimérica. En algunas realizaciones, la pluralidad de analitos comprende una proteína, un aptámero peptídico o una molécula de ácido nucleico.
En otras realizaciones, L > log2 (N). En otra realización, M<N. El kit también puede incluir instrucciones para determinar una identificación de cada uno de los N analitos objetivo distintos, utilizando los L bits de información, en donde L comprende bits de información para la identificación del objetivo.
Un kit descrito en el presente documento puede incluir instrucciones para determinar un orden de una pluralidad de conjuntos de reactivos de sonda ordenados, utilizando L bits de información, en donde L comprende bits de información que se ordenan en un orden predeterminado. El orden predeterminado puede ser un orden aleatorio. El kit también puede incluir instrucciones para usar una clave para decodificar un orden de la pluralidad de conjuntos de reactivos de sonda ordenados.
Descripción detallada
Ahora se hará referencia en detalle a varias realizaciones, cuyos ejemplos se ilustran en las figuras adjuntas. Se observa que, siempre que sea practicable, se pueden usar números de referencia similares o parecidos en las figuras, y pueden indicar una funcionalidad similar o parecida. Las figuras representan realizaciones del sistema (o método) divulgado, únicamente con fines ilustrativos.
Definiciones
Un "analito objetivo" o "analito" se refiere a una molécula, compuesto, sustancia o componente que se va a identificar, cuantificar y caracterizar de otro modo. Un analito objetivo puede comprender, a modo de ejemplo, pero sin limitación, un átomo, un compuesto, una molécula (de cualquier tamaño molecular), un polipéptido, una proteína (plegada o desplegada), una molécula de oligonucleótido (ARN, ADNc o ADN), un fragmento del mismo, una molécula modificada del mismo, tal como un ácido nucleico modificado, o una combinación de los mismos. En una realización, un polipéptido o proteína analito objetivo tiene una longitud de aproximadamente nueve aminoácidos. En general, un analito objetivo puede estar en cualquiera de una amplia gama de concentraciones (p. ej., desde el rango de mg/ml a ag/ml), en cualquier volumen de solución (p. ej., tan bajo como el rango de picolitros). Por ejemplo, las muestras de sangre, suero, tejido embebido en parafina fijado con formol (FFPE), saliva u orina podrían contener diferentes analitos objetivo. Los analitos objetivo se reconocen mediante sondas, que se utilizan para identificar y cuantificar los analitos objetivo, mediante métodos de detección eléctricos u ópticos.
Las modificaciones a una proteína objetivo, por ejemplo, pueden incluir modificaciones postraslacionales, tales como unir a una proteína otros grupos funcionales bioquímicos (tales como acetato, fosfato, diferentes lípidos y carbohidratos), cambiar la naturaleza química de un aminoácido (por ejemplo, citrulinación), o realizar cambios estructurales (por ejemplo, formación de puentes disulfuro). Los ejemplos de modificaciones postraslacionales también incluyen, pero no se limitan a, la adición de grupos hidrófobos para la localización de la membrana (p. ej., miristoilación, palmitoilación), la adición de cofactores para mejorar la actividad enzimática (p. ej., lipoliación), modificaciones de factores de traslación (p. ej., formación de diftamida), adición de grupos químicos (p. ej., acilación, alquilación, formación de enlaces amida, glicosilación, oxidación), modificaciones del azúcar (glicación), adición de otras proteínas o péptidos (ubiquinación) o cambios en la naturaleza química de los aminoácidos ( ej., desamidación, carbamilación).
En otras realizaciones, los analitos objetivo son oligonucleótidos que se han modificado. Los ejemplos de modificaciones del ADN incluyen la metilación del ADN y la modificación de histona.
Una "sonda", como se usa en el presente documento, se refiere a una molécula que es capaz de unirse a otras moléculas (p. ej., oligonucleótidos que comprenden ADN o ARN, polipéptidos o proteínas de longitud completa, etc.), componentes o estructuras celulares (lípidos, paredes celulares, etc.), o células, para detectar o evaluar las propiedades de las moléculas, componentes o estructuras celulares, o células. La sonda comprende una estructura o componente que se une al analito objetivo. En algunas realizaciones, múltiples sondas pueden reconocer diferentes partes del mismo analito objetivo. Los ejemplos de sondas incluyen, pero no se limitan a, un aptámero, un anticuerpo, un polipéptido, un oligonucleótido (ADN, ARN) o cualquier combinación de los mismos. A continuación también se describen en detalle como sondas, anticuerpos, aptámeros, secuencias de oligonucleótidos y combinaciones de los mismos.
La sonda puede comprender una etiqueta que se usa para detectar la presencia del analito objetivo. La etiqueta puede estar directa o indirectamente unida a, hibridada con, conjugada a o unida covalentemente, al componente de unión al analito objetivo. En algunas realizaciones, la etiqueta es un marcador detectable, tal como una molécula fluorescente o una molécula quimioluminiscente. En otras realizaciones, la etiqueta comprende una secuencia de oligonucleótidos que tiene una región base homopolimérica (p. ej., una cola poli-A). La sonda se puede detectar eléctrica, óptica o químicamente a través de la etiqueta.
Como se usa en el presente documento, el término "etiqueta" se refiere a una molécula capaz de detectar un analito objetivo). La etiqueta puede ser una secuencia de oligonucleótidos que tiene una región base homopolimérica (p. ej., una cola poli-A). En otras realizaciones, la etiqueta es un marcador, tal como un marcador fluorescente. La etiqueta puede comprender, pero no está limitada a, una molécula fluorescente, una molécula quimioluminiscente, un cromóforo, una enzima, un sustrato enzimático, un cofactor enzimático, un inhibidor enzimático, un colorante, un ion metálico, un sol metálico, un ligando (p. ej., biotina, avidina, estreptavidina o haptenos), isótopo radiactivo, y similares. La etiqueta puede unirse directa o indirectamente, hibridarse, conjugarse o unirse covalentemente a la sonda.
Una "proteína" o "polipéptido" o "péptido" se refiere a una molécula de dos o más aminoácidos, análogos de aminoácidos u otros peptidomiméticos. La proteína puede estar plegada o desplegada (desnaturalizada). El polipéptido o péptido puede tener una estructura secundaria, como una hélice a, lámina p u otra conformación. Como se usa en este documento, el término "aminoácido" se refiere a aminoácidos naturales y/o no naturales o sintéticos, incluyendo glicina y ambos isómeros ópticos D o L, y análogos de aminoácidos y peptidomiméticos. Un péptido puede tener una longitud de dos o más aminoácidos. Los péptidos de mayor longitud a menudo se denominan polipéptidos. Una proteína puede referirse a proteínas de longitud completa, los análogos y fragmentos de las mismas están incluidos en la definición. Los términos también incluyen modificaciones posteriores a la expresión de la proteína o polipéptido, por ejemplo, glicosilación, acetilación, fosforilación y similares. Además, como los grupos amino y carboxilo ionizables están presentes en la molécula, un polipéptido particular puede obtenerse como una sal ácida o básica, o en forma neutra. Una proteína o polipéptido se puede obtener directamente del organismo fuente, o se puede producir de forma recombinante o sintética.
Las proteínas se pueden identificar y caracterizar mediante una secuencia peptídica, modificaciones de cadena lateral y/o estructura terciaria. Las modificaciones de la cadena lateral incluyen fosforilación, acetilación, azúcares, etc. La fosforilación de grupos hidroxilo de aminoácidos de serina, treonina y tirosina son modificaciones de interés particularmente importantes.
El término "in vivo" se refiere a procesos que ocurren en un organismo vivo.
El término "mamífero", como se usa en el presente documento, incluye humanos y no humanos e incluye, pero no se limita a, humanos, primates no humanos, caninos, felinos, murinos, bovinos, equinos y porcinos.
"Muestra", tal como se usa en el presente documento, incluye un espécimen, cultivo o colección de un material biológico. Las muestras pueden derivarse o tomarse de un mamífero, incluidos, pero no se limita a, humanos, monos, ratas o ratones. Las muestras pueden incluir materiales tales como, pero no se limitan a, cultivos, sangre, tejido, tejido embebido en parafina fijado con formol (FFPE), saliva, cabello, heces, orina y similares. Estos ejemplos no deben interpretarse como limitantes de los tipos de muestras aplicables a la presente invención.
Un "bit", tal como se utiliza en este documento, se refiere a una unidad básica de información en informática y comunicaciones digitales. Un bit puede tener sólo uno de dos valores. Las representaciones más comunes de estos valores son 0 y 1. El término bit es una contracción de dígito binario. En un ejemplo, un sistema que usa 4 bits de información puede crear 16 valores diferentes (como se muestra en la Tabla lA). Todos los números hexadecimales de un solo dígito se pueden escribir con 4 bits. El decimal codificado en binario es un método de codificación digital para números, que usa notación decimal, con cada dígito decimal representado por cuatro bits. En otro ejemplo, en un cálculo usando 8 bits, hay 28 (o 256) valores posibles.
Tabla 1A. Valores de bits de ejemplo
Figure imgf000006_0001
Figure imgf000007_0001
Un "paso" en un ensayo de detección se refiere a un proceso donde se introduce una pluralidad de sondas en los analitos unidos, se produce una unión selectiva entre las sondas y distintos analitos objetivo, y se detecta una pluralidad de señales de las sondas. Un paso incluye la introducción de un conjunto de anticuerpos que se unen específicamente a un analito objetivo. Puede haber varios pasos de diferentes conjuntos de sondas, antes de que se elimine el sustrato de todas las sondas.
Un "ciclo" se define por la finalización de uno o más pasos y la eliminación de las sondas del sustrato. Se pueden realizar ciclos posteriores de una o más pasos por ciclo. Se pueden realizar varios ciclos en un solo sustrato o muestra. Para las proteínas, los ciclos múltiples requerirán que las condiciones de eliminación de la sonda (eliminación) mantengan las proteínas plegadas en su configuración adecuada, o que las sondas utilizadas se elijan para unirse a las secuencias peptídicas, de modo que la eficiencia de la unión sea independiente de la configuración del pliegue de la proteína.
Debe señalarse que, como se usa en la memoria descriptiva y las reivindicaciones adjuntas, las formas singulares "un", "uno" y "el" incluyen referentes plurales, a menos que el contexto indique lo claramente de otro modo.
Información general
Se divulgan técnicas de detección para la identificación de moléculas individuales altamente multiplexadas y la cuantificación de analitos usando sistemas tanto ópticos como eléctricos. Los analitos pueden incluir, pero no se limitan a, una proteína, un péptido, moléculas de ADN y ARN, con y sin modificaciones. La detección eléctrica se logra utilizando transistores de efecto de campo sensibles a iones (ISFET) integrados con estructuras MEMS (sistemas mecánicos microeléctricos), para mejorar la sensibilidad. Las técnicas incluyen etiquetas poli-A con y sin paradas diferenciales, sondas complementarias específicas y no específicas para la caracterización detallada de analitos, identificación de moléculas individuales altamente multiplexadas y cuantificación mediante sondas de anticuerpos. La detección óptica se logra mediante la detección de etiquetas fluorescentes o luminiscentes.
1. Sistema informático
FIG. 1 es un diagrama de bloques de alto nivel que ilustra un ejemplo de un ordenador 100 para uso en el análisis de analitos moleculares, de acuerdo con una realización. Se ilustran al menos un procesador 102 acoplado a un conjunto de chips 104. El conjunto 104 de chips incluye un concentrador 120 de controlador de memoria y un concentrador 122 de controlador de entrada/salida (E/S). Una memoria 106 y un adaptador 112 de gráficos están acoplados al concentrador 122 de controlador de memoria, y un dispositivo 118 de visualización está acoplado al adaptador 112 de gráficos. Un dispositivo 108 de almacenamiento, un teclado 110, un dispositivo 114 señalador y un adaptador 116 de red están acoplados al concentrador 122 del controlador de E/S. Otras realizaciones del ordenador 100 tienen arquitecturas diferentes. Por ejemplo, la memoria 106 está acoplada directamente al procesador 102 en algunas realizaciones.
El dispositivo 108 de almacenamiento es un medio de almacenamiento legible por ordenador no transitorio, tal como un disco duro, disco compacto de memoria de sólo lectura (CD-ROM), DVD o un dispositivo de memoria de estado sólido. La memoria 106 contiene instrucciones y datos utilizados por el procesador 102. El dispositivo 114 señalador se usa en combinación con el teclado 110 para ingresar datos en el sistema 100 informático. El adaptador 112 de gráficos muestra imágenes y otra información en el dispositivo 118 de visualización. En algunas realizaciones, el dispositivo 118 de visualización incluye una capacidad de pantalla táctil para recibir entradas y selecciones del usuario. El adaptador 116 de red acopla el sistema 100 de ordenador a la red. Algunas realizaciones del ordenador 100 tienen componentes diferentes y/u otros, de los que se muestran en la FIG. 1. Por ejemplo, el servidor puede estar formado por servidores de hoja múltiple y carecer de un dispositivo de visualización, teclado y otros componentes.
El ordenador 100 está adaptado para ejecutar módulos de programas de ordenador, para proporcionar la funcionalidad descrita en este documento. Como se usa en este documento, el término "módulo" se refiere a instrucciones de programas de ordenador y otra lógica utilizados para proporcionar la funcionalidad especificada. Por lo tanto, un módulo puede implementarse en hardware, firmware y/o software. En una realización, los módulos de programa formados por instrucciones de programas informáticos ejecutables se almacenan en el dispositivo 108 de almacenamiento, se cargan en la memoria 106 y se ejecutan mediante el procesador 102.
2. Composiciones
Se proporcionan composiciones que se unen y etiquetan analitos, como ADN, ARN, proteínas y péptidos, de una manera específica, de manera que las moléculas individuales pueden detectarse y contarse.
Anticuerpos como sondas
En algunas realizaciones, la sonda comprende anticuerpos que pueden usarse como sondas, para detectar analitos objetivo en una muestra. Como se describe a continuación, los anticuerpos son inmunoglobulinas que se unen específicamente a proteínas o polipéptidos objetivo. En una realización preferida, los anticuerpos usados en la invención son monoclonales y pueden unirse específicamente a proteínas plegadas o desplegadas.
"Anticuerpo" se refiere a una inmunoglobulina que se une específicamente a otra molécula y, por lo tanto, se define como complementaria a ella. El anticuerpo es una glicoproteína producida por las células B que el sistema inmunitario utiliza para identificar y neutralizar objetos extraños, tales como bacterias y virus. El anticuerpo reconoce una parte única del objetivo extraño, llamado antígeno. Los anticuerpos están formados típicamente por unidades estructurales básicas: dos cadenas pesadas grandes y dos cadenas ligeras pequeñas. El anticuerpo puede ser monoclonal o policlonal y puede ser de ocurrencia natural, modificado o recombinante. Los anticuerpos se pueden preparar mediante técnicas bien conocidas en la técnica, tales como la inmunización de un huésped y la recolección de sueros (policlonal), o mediante la preparación de líneas celulares híbridas continuas y la recolección de la proteína secretada (monoclonal), o mediante la clonación y expresión de secuencias de nucleótidos. o versiones mutagenizadas de las mismas, que codifican al menos las secuencias de aminoácidos requeridas para la unión específica de anticuerpos naturales. Los anticuerpos pueden incluir una inmunoglobulina completa o un fragmento de la misma, inmunoglobulinas que incluyen las diversas clases e isotipos, como IgA, IgD, IgE, IgG1, IgG2a, IgG2b e IgG3, IgM, etc. Los fragmentos de las mismas pueden incluir Fab, Fv y F(ab ')2, Fab' y similares.
Un "anticuerpo monoclonal" (mAB) es una inmunoglobulina producida por un clon individual de linfocitos, es decir, la progenie de una célula B individual, que reconoce solo un epítope individual en un antígeno. Además, se pueden usar agregados, polímeros y conjugados de inmunoglobulinas o sus fragmentos, cuando sea apropiado, siempre que se mantenga la afinidad de unión por un objetivo particular. Un anticuerpo (anticuerpo primario) se puede unir covalentemente a un marcador detectable (por ejemplo, un marcador fluorescente). En otras realizaciones, un anticuerpo primario se une a un anticuerpo secundario que está unido covalentemente a un marcador detectable. En algunas realizaciones, el anticuerpo primario se conjuga con una molécula de oligonucleótido marcada, como se describe en la Patente de EE.UU. 7,122,319 de Liu et al. presentada el 5 de noviembre de 2003.
La FIG. 2A ilustra un ejemplo de una sonda que comprende un anticuerpo 132 y una etiqueta detectable 134, y la sonda se une a un analito 130 objetivo. En la Fig. 2B, se muestra un ejemplo de una sonda que comprende un anticuerpo 132 primario y un anticuerpo 210 secundario. El anticuerpo 210 secundario se conjuga con un marcador 134 detectable.
Aptámeros
Un "aptámero", como se usa en el presente documento, se refiere a una molécula de ácido nucleico o una molécula peptídica que se une a un analito objetivo. Un aptámero puede ser un componente de una sonda. En algunas realizaciones, los aptámeros de ácidos nucleicos son moléculas de ácidos nucleicos que han sido diseñadas a través de rondas repetidas de selección in vitro o equivalentemente, SELEX (evolución sistemática de ligandos por enriquecimiento exponencial) para unirse a diferentes objetivos moleculares, tales como moléculas pequeñas, proteínas, ácidos nucleicos, e incluso células, tejidos y organismos. Ver Tuerk C y Gold L (1990). Otros métodos de generación de aptámeros incluyen SAAB (sitio de unión seleccionado y amplificado) y CASTing (amplificación cíclica y selección de objetivos). Evolución sistemática de ligandos por enriquecimiento exponencial: RNA ligands to bacteriophage T4 DNA polymerase. Science. 249: 505-510; M. Svobodová, A. Pinto, P. Nadal y CK O' Sullivan. (2012) Comparison of different methods for generation of single-stranded DNA for SELEX processes. "Anal Bioanal Chem" (2012) 404: 835-842. Los aptámeros pueden unirse a una secuencia de n-meros única que se encuentra en una proteína (p. ej., proteína desnaturalizada o plegada) o polipéptido. En una realización, el aptámero se une a una secuencia única de 9 unidades. En algunas realizaciones, el aptámero puede unirse a una etiqueta, como una cuerda de oligonucleótidos que comprende una región base homopolimérica (p. ej., una cola poli-A).
En algunas realizaciones, la sonda comprende un aptámero y una región de cola. Un aptámero es una molécula de oligonucleótido o péptido que se une a un analito objetivo específico. La FIG. 3 muestra un analito 130 objetivo que está unido a un aptámero 300. El aptámero 300 incluye una región 320 de sonda, que está configurada para unirse específicamente al analito 130 objetivo. La región 320 de sonda puede comprender una proteína, péptido o ácido nucleico, y la región 320 de sonda reconoce y se une al analito objetivo. Cada región 320 de sonda se puede acoplar a una etiqueta. En algunas realizaciones, la etiqueta es una región 310 de cola. La región 310 de cola es una molécula de oligonucleótido de al menos 25 nucleótidos y sirve como molde para la síntesis de polinucleótidos. La región de cola 310 es generalmente una molécula de ADN monocatenario, pero también podría ser una molécula de ARN. En una realización, la región 310 de la cola está unida covalentemente a la región 330 de la sonda a través de un esqueleto de ácido nucleico.
En otra realización, una porción de la región 310 de cola se une específicamente a una región 330 enlazadora. La región 330 conectora está unida covalentemente a la región 320 sonda a través de un esqueleto de ácido nucleico. La región 330 enlazadora se puede configurar para unirse específicamente a una porción de una región 310 de cola, o porciones de múltiples regiones de cola 310. En una realización, la región 330 enlazadora comprende al menos 10 nucleótidos. En otra realización, la región 330 enlazadora comprende de 20 a 25 nucleótidos. Una región 320 de sonda se puede unir covalentemente a una sola región 330 enlazadora, o se puede unir covalentemente a múltiples regiones 330 enlazadoras distintas, cada una de las cuales se une específicamente a una porción de una región 310 de cola distinta.
La región 310 de cola proporciona una plantilla para la síntesis de polinucleótidos. Durante la síntesis de polinucleótidos, se libera un ion de hidrógeno por cada nucleótido incorporado a lo largo de la plantilla de la región de cola. Un transistor puede detectar una pluralidad de estos iones de hidrógeno como una señal de salida eléctrica. Se debe liberar un número umbral mínimo de iones de hidrógeno para que el transistor detecte una señal de salida eléctrica. Por ejemplo, el número de umbral mínimo podría ser 25 de acuerdo con los detalles de la configuración del detector. En ese caso, la región 310 de cola debe tener una longitud de al menos 25 nucleótidos. En algunas realizaciones, la región 310 de cola tiene una longitud de al menos 25, 100, 200, 1000 o 10,000 nucleótidos. La región 310 de cola puede incluir una o más regiones base homopoliméricas. Por ejemplo, la región 310 de cola puede ser una cola poli-A, poli-C, poli-G o poli-T. En otra realización, la región 310 de cola comprende una región base homopolimérica seguida de una región base homopolimérica diferente, por ejemplo, una cola poli-A seguida de una cola poli-G. En una realización, la región 310 de cola es una cola poli-A basada en ADN que tiene una longitud de 100 nucleótidos. Los nucleótidos (dTTP) se agregan en condiciones que promueven la síntesis de polinucleótidos y los nucleótidos se incorporan para transcribir la región de cola, liberando así iones de hidrógeno. Si el número umbral mínimo de iones de hidrógeno para que el transistor detecte una señal de salida eléctrica es de 100 nucleótidos o menos, el transistor detectará una señal de salida eléctrica. Esta señal se utiliza para identificar el analito objetivo asociado con la región de cola poli-A y potencialmente determinar la concentración del analito objetivo en la solución.
En algunas realizaciones, la región 310 de cola comprende una región base homopolimérica que incluye una o más bases de parada. La FIG. 3 ilustra una base 330 de parada única que está flanqueada por dos regiones base homopoliméricas. Una base 330 de parada es una porción de una región 310 de cola que comprende al menos un nucleótido adyacente a una región base homopolimérica, de modo que el al menos un nucleótido está compuesto por una base que es distinta de las bases dentro de la región base homopolimérica. En una realización, la base 330 de parada es un nucleótido. En otras realizaciones, la base 330 de parada comprende una pluralidad de nucleótidos. Generalmente, la base 330 de parada está flanqueada por dos regiones base homopoliméricas. En una realización, las dos regiones de base homopoliméricas que flanquean una base 330 de parada están compuestas por la misma base. En otra realización, las dos regiones base homopoliméricas están compuestas por dos bases diferentes. En otra realización, la región 310 de cola contiene más de una base 330 de parada.
Más detalles sobre los aptámeros y las regiones de cola como sondas para la detección diferencial de moléculas pequeñas, se describen en la solicitud provisional de EE. UU. No. 61/868,988.
Etiquetas moleculares
En algunas realizaciones, la sonda comprende una etiqueta molecular para la detección del analito objetivo. Las etiquetas se pueden unir química o covalentemente a otras regiones de la sonda. Las etiquetas son moléculas fluorescentes. Las moléculas fluorescentes pueden ser proteínas fluorescentes o pueden ser un derivado reactivo de una molécula fluorescente conocida como fluoróforo. La FIG. 4 ilustra una etiqueta 402 fluorescente unida a una sonda 320. Los fluoróforos son compuestos químicos fluorescentes que emiten luz tras la excitación con la luz. En algunas realizaciones, el fluoróforo se une selectivamente a una región o grupo funcional específico en la molécula objetivo y se puede unir química o biológicamente. Los ejemplos de etiquetas fluorescentes incluyen, pero no se limita a, proteína fluorescente verde (GFP), proteína fluorescente amarilla (YFP), proteína fluorescente roja (RFP), proteína cian fluorescente (CFP), fluoresceína, isotiocianato de fluoresceína (FITC), isotiocianato de tetrametilrodamina (TRITC), cianina (Cy3), ficoeritrina (R-PE) 5,6-carboximetilfluoresceína, (éster de 5-carboxifluoresceína-N-hidroxisuccinimida), rojo de Texas, nitrobenz-2-oxa-1,3-diazol-4-ilo (NBD), cumarina, cloruro de dansilo y rodamina (5,6-tetrametil rodamina).
Otras etiquetas fluorescentes de ejemplo se enumeran a continuación en la Tabla 1B.
Tabla 1B: Etiquetas fluorescentes
Figure imgf000009_0001
Figure imgf000010_0001
Figure imgf000011_0001
Sondas que incluyen anticuerpos y oligonucleótidos
Como se muestra en la fig. 5, la sonda puede comprender un anticuerpo 132 unido a una región 410 que puede hibridar con una región 310 de cola de oligonucleótido. La región 310 de cola del oligonucleótido se puede unir al anticuerpo 132 a través de una región 410 de enlace, tal como una cadena de polietilenglicol (PEG), subunidades de óxido de etileno u otras cadenas similares que pueden unir el anticuerpo 132 a la cola 310 del oligonucleótido. En algunas realizaciones, la región de enlace puede incluir un oligonucleótido que se une al péptido del anticuerpo usando métodos químicos estándar tales como, p.ej, química de conjugación mediada por éster de NHS-maleimida, donde el péptido incorporado Cys N-terminal reacciona con un oligonucleótido ted activo de maleimida. En otras realizaciones, la unión se logra a través de una Cys interna, a través de la formación de oxima a través de una reacción peptídica modificada con hidroxilamina, con un oligonucleótido modificado con aldehído. Dichos métodos son conocidos por los expertos en la materia. La secuencia de oligonucleótidos en la región 410 de unión puede hibridar con una porción de la región 310 de cola de oligonucleótidos. La región 310 de cola de oligonucleótidos puede comprender una secuencia de oligonucleótidos que se usa como molde para la síntesis de polinucleótidos y la detección eléctrica, como se describió anteriormente. La Patente de EE.UU. No. 7,122,319, presentada el 5 de noviembre de 2003 a nombre de Liu et al. describe diferentes realizaciones para agentes de unión de analitos (p. ej., anticuerpos) unidos a etiquetas de oligonucleótidos.
Como se muestra en la fig. 6, la sonda comprende un anticuerpo 132 primario y un anticuerpo 210 secundario. El anticuerpo 132 primario se une al analito 130 objetivo y el anticuerpo 210 secundario se une al anticuerpo 132 primario. El anticuerpo 210 secundario se conjuga con una región 410 conectora que se hibrida con una región 310 de cola de oligonucleótidos. La región 310 de la cola actúa como una etiqueta detectable en la detección eléctrica del analito 130 objetivo.
3. Métodos
I. Preparación de muestras y sustratos
La presente invención proporciona métodos para identificar y cuantificar una amplia gama de analitos, desde un solo analito hasta decenas de miles de analitos, simultáneamente en muchos órdenes de magnitud de rango dinámico, teniendo en cuenta los errores en el ensayo de detección.
Como se muestra en la fig. 7, una muestra que comprende analitos 610 (por ejemplo, proteínas, péptidos, ADN y/o ARN) se une a un sustrato 600 sólido. El sustrato 600 puede comprender un portaobjetos de vidrio, una superficie de silicio, una membrana sólida, una placa o similar utilizado como superficie para inmovilizar los analitos 610. En una realización, el sustrato 600 comprende un revestimiento que une los analitos 610 a la superficie. En otra realización, el sustrato 600 comprende anticuerpos de captura o perlas para unir los analitos 610 a la superficie. Los analitos 610 se pueden unir aleatoriamente al sustrato 600 y se pueden separar espacialmente en el sustrato 600. La muestra puede estar en solución acuosa y lavarse sobre el sustrato, de modo que los analitos 610 se unan al sustrato 600. En una realización, las proteínas de la muestra se desnaturalizan y/o digieren usando enzimas, antes de unirse al sustrato 600. En algunas realizaciones, los analitos 610 se pueden unir covalentemente al sustrato. En otra realización, las sondas marcadas seleccionadas se unen aleatoriamente al sustrato 600 sólido, y los analitos 610 se lavan a través del sustrato.
La FIG. 8 muestra un sustrato 600 de ejemplo (arreglo de 10x10) para unir analitos 610, donde cada inserto 700 de arreglo tiene arreglos objetivo de 11 * 11 (110).
La FIG. 9 es una vista superior de un sustrato 600 sólido con analitos unidos aleatoriamente al sustrato 600. Los diferentes analitos se marcan como A, B, C y D. Para la detección óptica de los analitos, el sistema de formación de imágenes requiere que los analitos estén separados espacialmente en el sustrato 600 sólido, para que no haya superposición de señales fluorescentes. Para un arreglo aleatorio, esto significa que se necesitarán múltiples píxeles para cada punto fluorescente.
El número de píxeles puede ser tan bajo como 1 y tantos como cientos de píxeles por punto. Se espera que la cantidad óptima de píxeles por punto fluorescente esté entre 5 y 20 píxeles. En un ejemplo, un sistema de formación de imágenes tiene píxeles de 224 nm. Para un sistema con 10 píxeles por punto fluorescente en promedio, hay una densidad de superficie de 2 píxeles fluorescentes/pm2 Esto no significa que se requiera que la densidad superficial de la proteína sea tan baja. Si las sondas solo se eligen para proteínas de baja abundancia, entonces la cantidad de proteína en la superficie puede ser mucho mayor. Por ejemplo, si hay, en promedio, 20,000 proteínas por pm2 en la superficie, y las sondas se eligen solo para las proteínas más raras del 0.01 % (como una suma integrada), entonces la densidad superficial de la proteína fluorescente será de 2 píxeles fluorescentes/pm2 En otra realización, el sistema de formación de imágenes tiene píxeles de 163 nm. En otra realización, el sistema de formación de imágenes tiene píxeles de 224 nm. En una realización preferida, el sistema de formación de imágenes tiene píxeles de 325 nm. En otras realizaciones, el sistema de formación de imágenes tiene píxeles de hasta 500 nm.
II. Métodos de detección óptica
Los métodos de detección óptica se pueden utilizar para cuantificar e identificar un gran número de analitos simultáneamente en una muestra.
En una realización, la detección óptica de moléculas individuales etiquetadas con fluorescencia se puede lograr mediante absorción modulada en frecuencia y fluorescencia inducida por láser. La fluorescencia puede ser más sensible porque está intrínsecamente amplificada, ya que cada fluoróforo emite de miles a quizás un millón de fotones antes de ser fotoblanqueado. La emisión de fluorescencia generalmente ocurre en un ciclo de cuatro pasos: 1) transición electrónica desde el estado electrónico fundamental a un estado electrónico excitado, cuya rata es una función lineal de la potencia de excitación, b) relajación interna en el estado electrónico excitado, c) declive radiativo o no radiativo desde el estado excitado al estado fundamental, determinado por el tiempo de vida del estado excitado, y d) relajación interna en el estado fundamental. Las mediciones de fluorescencia de una molécula individual se consideran de naturaleza digital, porque la medición se basa en una lectura de señal/ausencia de señal, independiente de la intensidad de la señal.
La detección óptica requiere un instrumento o lector de detección óptica, para detectar la señal de las sondas marcadas. La Patente de EE. UU. No. 8,428,454 y Patente de EE. UU. No. 8,175,452 describen sistemas de formación de imágenes ejemplares, que se pueden usar y métodos para mejorar los sistemas para lograr tolerancias de alineación de subpíxeles. En algunas realizaciones, se pueden usar métodos de tecnología de microarreglo basada en aptámeros. Ver Optimization of Aptamer Microarray Technology for Multiple Protein Targets, Analytica Chimica Acta 564 (2006).
A. Detección óptica de múltiples analitos usando anticuerpos etiquetados
El método incluye la detección óptica de analitos utilizando anticuerpos etiquetados como sondas. Para un analito objetivo conocido (proteína) en la muestra, se selecciona un anticuerpo que se une específicamente al analito objetivo. Los anticuerpos seleccionados pueden ser los desarrollados para ELISA y sistemas comparables como sondas de molécula individual. Hay cientos a miles de anticuerpos primarios y secundarios existentes y calificados, que están fácilmente disponibles. En algunas realizaciones, se seleccionan anticuerpos primarios que se conjugan con una etiqueta, como un fluoróforo. En otras realizaciones, se seleccionan anticuerpos primarios que se unen a anticuerpos secundarios y los anticuerpos secundarios se conjugan con una molécula fluorescente.
En una realización, el método incluye seleccionar un anticuerpo primario que tiene una proteína objetivo específica conocida en la muestra. El anticuerpo primario está etiquetado con una etiqueta detectable, tal como una molécula fluorescente. Los anticuerpos primarios seleccionados se introducen y se lavan a través del sustrato. Los anticuerpos primarios se unen a sus analitos objetivo y se detectan las señales de las etiquetas.
En otra realización, se seleccionan un anticuerpo primario y un anticuerpo secundario conjugados con una etiqueta detectable. Los anticuerpos primarios seleccionados se introducen y se lavan a través del sustrato. Los anticuerpos primarios se unen a sus analitos objetivo. A continuación, los anticuerpos secundarios se lavan a través del sustrato y se unen a los anticuerpos primarios. Las etiquetas producen una señal detectable, y las señales se detectan y analizan, preferiblemente usando un ordenador, para determinar si una señal se detecta en una ubicación definida y, en algunas realizaciones, información adicional sobre la naturaleza de la señal (por ejemplo, el color del marcador).
Un paso comprende un paso de unión y un paso de detección de señal. Puede haber varios pasos por ciclo, donde cada paso incluye la unión de un conjunto de anticuerpos etiquetados a una proteína objetivo diferente, y la detección y análisis de señales de los anticuerpos etiquetados. Puede haber múltiples pasos de diferentes anticuerpos etiquetados, antes de que el sustrato sea eliminado de todos los anticuerpos etiquetados. Un ciclo concluye cuando se completan uno o más pasos y los anticuerpos etiquetados se eliminan del sustrato. Se pueden realizar ciclos posteriores de uno o más pasos por ciclo, con el mismo sustrato y muestra de analitos unidos.
Se usa un instrumento o lector de detección óptica, para detectar ópticamente cada una de las señales de los anticuerpos marcados. El número de señales, la ubicación de la señal y la presencia o ausencia de la señal se pueden registrar y almacenar. Los detalles sobre la cuantificación e identificación de los analitos, basados en las señales ópticas detectadas se describen a continuación.
1. Múltiples etiquetas para múltiples analitos
En una realización, se usa una pluralidad de anticuerpos conjugados con etiquetas fluorescentes, para detectar proteínas individuales unidas a un sustrato. Cada tipo distinto de proteína se etiqueta con un número limitado de etiquetas fluorescentes. Por ejemplo, en un solo paso, se introducen anticuerpos que se etiquetan con una etiqueta fluorescente roja y se unen selectivamente a la proteína A. El número de fluorescentes rojos en el sustrato se cuenta después de la unión. El número de etiquetas contadas es proporcional a la concentración de proteína A.
Cada paso posterior introduce una etiqueta fluorescente diferente (diferente color) para detectar una proteína diferente (p. ej., etiqueta fluorescente azul para la proteína B, etiqueta fluorescente amarilla para la proteína C, etc.). La presencia de cada etiqueta fluorescente se cuenta en cada paso y se registra. La FIG. 9 ilustra un sustrato sólido que comprende los analitos A, B, C y D. En cada paso, se puede detectar un analito diferente con una etiqueta fluorescente diferente y se puede contar en consecuencia.
En algunas realizaciones, se usa un "nivel oscuro" en la detección y análisis del analito. Existe un nivel oscuro donde no hay una etiqueta presente en el paso y no se cuenta ninguna señal positiva, lo que se denomina "paso oscuro". La ausencia de cualquier señal se considera un nivel (es decir, ciclo oscuro contado). La incorporación de un nivel oscuro permite reducir en uno el número de sondas por ciclo. En algunas realizaciones, se prefiere tener una señal positiva y no usar un nivel oscuro porque el uso de niveles oscuros puede ser más susceptible a errores. En la figura 13 se muestra un ejemplo de realización. En otras realizaciones, donde la rata de error bruto del sistema es baja y el número de sondas por ciclo es bajo, el uso de un nivel oscuro puede aumentar significativamente la cantidad de información transferida por ciclo.
Un caso específico en el que el uso de un nivel oscuro es útil es cuando una sonda de anticuerpo primario se hibrida con un analito unido a un sustrato, y en el que un anticuerpo secundario etiquetado con fluorescencia o eléctricamente, se une al primer anticuerpo. El anticuerpo secundario puede unirse de manera no específica a todos los anticuerpos, de modo que solo es posible un nivel de información por ciclo, para un sistema de paso individual. En este caso, se requiere el uso de un nivel oscuro (es decir, sin incluir un anticuerpo primario en el ciclo), para lograr 1 bit de información por ciclo.
Para eliminar el uso de un nivel oscuro cuando se usan anticuerpos secundarios, se requiere el uso de dos o más tipos de anticuerpos secundarios que tienen altas afinidades con un conjunto predeterminado de sondas de anticuerpos primarios, y tienen baja afinidad con otros conjuntos predeterminados de sondas de anticuerpos primarios, 0 al menos dos pasos por ciclo.
2. Etiqueta individual para múltiples analitos
En otra realización, se usa una pluralidad de anticuerpos conjugados con etiquetas fluorescentes, para detectar proteínas individuales unidas a un sustrato. Cada tipo de proteína se puede etiquetar con la misma etiqueta fluorescente (mismo color). Por ejemplo, en un paso, las sondas de anticuerpos etiquetadas con una etiqueta fluorescente roja se unen selectivamente a la proteína A y se cuenta el número de fluorescentes rojos en el sustrato. En un segundo paso, se introducen sondas de anticuerpos etiquetadas con una molécula fluorescente roja que se une específicamente a la proteína B, y se cuenta y registra la presencia de las etiquetas fluorescentes rojas adicionales en ubicaciones adicionales en el sustrato. Se pueden realizar pasos múltiples usando anticuerpos marcados con la misma marca fluorescente que se une específicamente a diferentes proteínas objetivo. Se cuenta y registra la presencia de etiquetas fluorescentes rojas adicionales detectadas en el sustrato en cada paso. En la figura 14 se muestra un ejemplo de realización.
B. Métodos para la detección óptica de analitos
Los métodos de cuantificación de analitos de alto rango dinámico de la invención permiten la medición de más de 10,000 analitos de una muestra biológica. El método puede cuantificar analitos con concentraciones de alrededor de 1 ag/ml a alrededor de 50 mg/ml y producir un rango dinámico de más de 1010. Las señales ópticas se digitalizan y los analitos se identifican con base en un código (código ID) de señales digitales para cada analito.
Como se describió anteriormente, los analitos se unen a un sustrato sólido y las sondas se unen a los analitos. Cada una de las sondas comprende etiquetas y se une específicamente a un analito objetivo. En algunas realizaciones, las etiquetas son moléculas fluorescentes que emiten el mismo color fluorescente, y las señales de fluorescentes adicionales se detectan en cada paso posterior. Durante un paso, un conjunto de sondas que comprenden etiquetas se ponen en contacto con el sustrato, lo que les permite unirse a sus objetivos. Se captura una imagen del sustrato y las señales detectables se analizan a partir de la imagen obtenida después de cada paso. La información sobre la presencia y/o ausencia de señales detectables se registra para cada posición detectada (p. ej., analito objetivo) en el sustrato.
En algunas realizaciones, la invención comprende métodos que incluyen pasos para detectar señales ópticas emitidas desde las sondas que comprenden etiquetas, contando las señales emitidas durante múltiples pasos y/o múltiples ciclos, en diferentes posiciones en el sustrato, y analizando las señales como información digital usando un cálculo basado en bits K, para identificar cada analito objetivo en el sustrato. La corrección de errores se puede utilizar para tener en cuenta los errores en las señales detectadas ópticamente, como se describe a continuación.
En algunas realizaciones, un sustrato se une con analitos que comprenden N analitos objetivo. Para detectar N analitos objetivo, se eligen M ciclos de unión de sonda y detección de señal. Cada uno de los M ciclos incluye 1 o más pasos, y cada paso incluye N conjuntos de sondas, de modo que cada conjunto de sondas se une específicamente a uno de los N analitos objetivo. En ciertas realizaciones, hay N conjuntos de sondas para los N analitos objetivo.
En cada ciclo existe un orden predeterminado de introducción de los conjuntos de sondas para cada paso. En algunas realizaciones, el orden predeterminado para los conjuntos de sondas es un orden aleatorizado. En otras realizaciones, el orden predeterminado para los conjuntos de sondas es un orden no aleatorizado. En una realización, el orden no aleatorio puede ser elegido por un procesador de ordenador. El orden predeterminado se representa en una clave para cada analito objetivo. Se genera una clave que incluye el orden de los conjuntos de sondas, y el orden de las sondas se digitaliza en un código para identificar cada uno de los analitos objetivo.
En algunas realizaciones, cada conjunto de sondas ordenadas está asociado con una etiqueta distinta, para detectar el analito objetivo, y el número de etiquetas distintas es menor que el número de N analitos objetivo. En ese caso, cada analito objetivo N se empareja con una secuencia de M etiquetas para los M ciclos. La secuencia ordenada de etiquetas se asocia con el analito objetivo, como un código de identificación.
En un ejemplo, hay 16 proteínas objetivo y 16 sondas distintas para cada una de las proteínas objetivo, pero solo cuatro etiquetas fluorescentes (roja, azul, verde y amarilla). La FIG. 10A ilustra un ejemplo de las 16 proteínas objetivo (marcadas como P1, P2, P3, etc.) dispuestas en un sustrato. El ensayo se puede configurar con dos ciclos y un paso por ciclo. En consecuencia, se crean dos conjuntos ordenados de agrupaciones (un conjunto ordenado por ciclo). Cada conjunto de sondas utiliza las cuatro etiquetas para marcar las 16 proteínas objetivo en una secuencia única de 2 colores.
La Tabla 2 a continuación muestra los 16 analitos objetivo y los números de sonda correspondientes. La Tabla 3 muestra las cuatro etiquetas fluorescentes (marcadas del 0 al 3). Las tablas 4 y 5 muestran dos conjuntos de sondas, donde cada uno de los 16 analitos objetivo se marca con una primera etiqueta fluorescente en el conjunto 1 de sondas y una segunda etiqueta fluorescente en el conjunto 2 de sondas. La FIG. 10B ilustra el sustrato de la FIG. 10A que se ha puesto en contacto con el grupo 1 de sondas. La FIG. 10C ilustra el sustrato de la FIG. 10A que se ha puesto en contacto con el grupo 2 de sondas. Por ejemplo, la sonda A2 está etiquetada con una etiqueta fluorescente azul en el grupo 1 de sondas y una etiqueta fluorescente roja en el grupo 2 de sondas. En consecuencia, en el ciclo 1, la sonda A2 (unida al analito P2) emitirá un color azul y en el ciclo 2, la sonda A2 emitirá un color rojo. En otro ejemplo, ilustrado por la FIG. 10D, la sonda A7 tiene una etiqueta verde (GRN) en el grupo 1 de sondas (o número de ciclo 1). En el grupo 2 de sondas, la sonda A7 tiene una etiqueta azul (BLU). En cada grupo de sondas, varias sondas comparten el mismo color de etiqueta, pero la secuencia de colores en los dos grupos es única para cada analito. En el grupo #1 de sondas, por ejemplo, las sondas A4 y A8 están etiquetadas en amarillo. Sin embargo, solo la sonda A9 está etiquetada en rojo en el grupo #1 de sondas y verde en el grupo # 2 de sondas.
Tabla 2. Analito y sonda
Figure imgf000014_0001
Tabla 3. Número de etiqueta y color
Figure imgf000015_0001
Tabla 4. Grupo 1 de sondas
Figure imgf000015_0002
Tabla 5. Grupo 2 de sondas
Figure imgf000015_0003
Figure imgf000016_0001
La Tabla 6 muestra un ejemplo de una clave que comprende un código ID (identificación) para cada analito objetivo, basada en la secuencia de colores. La tabla muestra N objetivos de proteína por nombre, un número (1 a 10,000) de base 10 correspondiente, un número de base M (p. ej., base 4 con 7 dígitos que se muestran aquí) y una secuencia de colores. La secuencia de colores es el orden y el tipo de señal detectada (rojo, azul, verde, amarillo) que se emitió para un analito en particular. La clave proporciona un número de base M correspondiente (p. ej., base 4, 7 dígitos) y la identidad del analito objetivo que se corresponde a cada secuencia de colores. En consecuencia, el cálculo en base 4 permite una secuencia de colores ordenada de 7 señales y la identificación de más de 10,000 analitos objetivo diferentes, cada uno con su propia secuencia de colores de identificación.
Tabla 6. Clave de objetivos proteicos por nombre, número de base 10, número de base M y secuencia de color
Figure imgf000016_0002
El método incluye los siguientes pasos para marcar grupos de sondas para contar N tipos diferentes de analitos objetivo en un sustrato, utilizando sondas etiquetadas con fluorescencia de X colores diferentes:
1. Numere una lista de los N objetivos (o sus sondas) utilizando números de base X.
2. Asocie etiquetas fluorescentes con dígitos base-X de 0 a X - 1. (Por ejemplo, 0, 1, 2, 3 corresponden a rojo, azul, verde, amarillo).
3. Encuentre C tal que XC > n
4. Se necesitan al menos C grupos de sondas para identificar los N objetivos. Marque los grupos de sondas C mediante un índice k = 1 a C.
5. En el késimo grupo de sondas, marque cada sonda con una etiqueta fluorescente del color que corresponda al késimo dígito de base-X del número de base-X que identifica el objetivo de la sonda en la lista creada en el Paso 1.
Por ejemplo, si uno tiene N = 10,000 analitos objetivo y cuatro etiquetas fluorescentes, se puede elegir una base 4. Los 4 colores de etiqueta fluorescente designados con los números 0, 1, 2 y 3, respectivamente. Por ejemplo, los números 0, 1, 2, 3 corresponden a rojo, azul, verde y amarillo.
Cuando se elige la base 4, cada color fluorescente está representado por 2 bits (0 y 1, donde 0 = sin señal y 1 = señal presente), y hay 7 colores que se utilizan como código para identificar un analito objetivo. Por ejemplo, la proteína A puede identificarse con el código "1221133" que representa la combinación de colores y el orden de "azul, verde, verde, azul, azul, amarillo, amarillo". Para los 7 colores posibles, hay un total de 14 bits de información para el analito objetivo (7x2 = 14 bits).
A continuación, se elige C tal que 4C > 10,000. En este caso, C puede ser 7, de modo que haya 7 grupos de sondas para identificar 10,000 objetivos (47 = 16.384, que es mayor que 10,000). Una secuencia de colores de longitud C significa que se tienen que construir C grupos de sondas diferentes. Los 7 grupos de sondas están marcados de k=1 a 7. Luego, cada sonda se marca con una etiqueta fluorescente que corresponde a la base k-ésima y al dígito X. Por ejemplo, la tercera sonda en el código "1221133" será la 3a base-4ésimo dígito, y corresponde al verde.
C. Cuantificación de sondas detectadas ópticamente
Después del proceso de detección, se cuentan las señales de cada grupo de sondas y se puede registrar la presencia o ausencia de una señal y el color de la señal, para cada posición en el sustrato.
A partir de las señales detectables, se obtienen K bits de información en cada uno de M ciclos para los N analitos objetivo distintos. Los K bits de información se utilizan para determinar L bits de información totales, de modo que K x M = L bits de información y L > log2 (N). Los L bits de información se utilizan para determinar la identidad (y presencia) de N analitos objetivo distintos. Si solo se realiza un ciclo (M = 1), entonces K x 1 = L. Sin embargo, se pueden realizar múltiples ciclos (M > 1) para generar más bits totales de información L por analito. Cada ciclo subsiguiente proporciona información de señal óptica adicional que se utiliza para identificar el analito objetivo.
En la práctica, se producen errores en las señales y esto confunde la precisión de la identificación de los analitos objetivo. Por ejemplo, las sondas pueden vincular los objetivos incorrectos (p. ej., falsos positivos) o fallar al vincular los objetivos correctos (p. ej., falsos negativos). Se proporcionan métodos, como se describe a continuación, para tener en cuenta los errores en la detección de señales ópticas y eléctricas.
III. Métodos de detección eléctrica
En otros aspectos que no forman parte de la invención, se utilizan métodos de detección eléctrica, para detectar la presencia de analitos objetivo en un sustrato. Los analitos objetivo se etiquetan con regiones de cola de oligonucleótidos y las etiquetas de oligonucleótidos se detectan utilizando transistores de efecto de campo sensibles a iones (ISFET, o un sensor de pH), que mide las concentraciones de iones de hidrógeno en solución. Los ISFET se describen con más detalle en la Patente de EE.UU. 7,948,015, presentada el 14 de diciembre de 2007, de Rothberg et al., y Publicación de EE. UU. No. 2010/0301398, presentada el 29 de mayo de 2009, de Rothberg et al.
Los ISFET presentan un sistema de detección eléctrica sensible y específico para la identificación y caracterización de analitos. En una realización, los métodos de detección eléctrica divulgados en este documento se llevan a cabo mediante un ordenador (por ejemplo, un procesador). La concentración iónica de una solución se puede convertir en un potencial eléctrico logarítmico mediante un electrodo de un ISFET, y la señal de salida eléctrica se puede detectar y medir.
Los ISFET se han utilizado previamente para facilitar la secuenciación del ADN. Durante la conversión enzimática de ADN monocatenario en ADN bicatenario, se liberan iones de hidrógeno a medida que se añade cada nucleótido a la molécula de ADN. Un ISFET detecta estos iones de hidrógeno liberados y puede determinar cuándo se ha agregado un nucleótido a la molécula de ADN. Al sincronizar la incorporación de los nucleósido trifosfatos (dATP, dCTP, dGTP y dTTP), también se puede determinar la secuencia de ADN. Por ejemplo, si no se detecta una señal de salida eléctrica cuando la plantilla de ADN monocatenario se expone a dATP, pero se detecta una señal de salida eléctrica en presencia de dGTP, la secuencia de ADN se compone de una base citosina complementaria en la posición en cuestión.
Como se describe en este documento, se usa un ISFET para detectar una región de cola de una sonda y después identificar el analito objetivo correspondiente. Por ejemplo, un analito objetivo se puede inmovilizar en un sustrato, tal como un chip de circuito integrado que contiene uno o más ISFET. Cuando se agrega la sonda correspondiente (por ejemplo, el aptámero y la región de cola) y se une específicamente al analito objetivo, se agregan nucleótidos y enzimas (polimerasa) para la transcripción de la región de cola. El ISFET detecta la liberación de iones de hidrógeno como señales de salida eléctrica y mide el cambio en la concentración de iones cuando los dNTP se incorporan en la región de cola. La cantidad de iones hidrógeno liberados corresponde a las longitudes y las paradas de la región de cola, y esta información sobre las regiones de cola se puede utilizar para diferenciar entre varias etiquetas.
El tipo más simple de región de cola es uno compuesto completamente por una región base homopolimérica. En este caso, hay cuatro regiones de cola posibles: una cola poli-A, una cola poli-C, una cola poli-G y una cola poli-T. Sin embargo, a menudo es deseable tener una gran diversidad en las regiones de cola.
Un método para generar diversidad en las regiones de cola consiste en proporcionar bases de parada dentro de una región base homopolimérica de una región de cola. Una base de parada es una porción de una región de cola que comprende al menos un nucleótido adyacente a una región base homopolimérica, de modo que el al menos un nucleótido está compuesto por una base que es distinta de las bases dentro de la región base homopolimérica. En una realización, la base de parada es un nucleótido. En otras realizaciones, la base de parada comprende una pluralidad de nucleótidos. Generalmente, la base de parada está flanqueada por dos regiones base homopoliméricas. En una realización, las dos regiones base homopoliméricas que flanquean una base de parada están compuestas por la misma base. En otra realización, las dos regiones base homopoliméricas están compuestas por dos bases diferentes. En otra realización, la región de cola contiene más de una base de parada.
En un ejemplo, un ISFET puede detectar un número umbral mínimo de 100 iones de hidrógeno. El Analito 1 objetivo se une a una composición con una región de cola compuesta por una cola poli-A de 100 nucleótidos, seguida de una base de citosina, seguida de otra cola poli-A de 100 nucleótidos, para una región de cola con una longitud total de 201 nucleótidos. El analito 2 objetivo se une a una composición con una región de cola compuesta por una cola poli-A de 200 nucleótidos. Tras la adición de dTTP y en condiciones propicias para la síntesis de polinucleótidos, la síntesis en la región de cola asociada con el Analito 1 objetivo liberará 100 iones de hidrógeno, que se pueden distinguir de la síntesis de polinucleótidos en la región de cola asociada con el Analito 2 objetivo, que liberará 200 iones de hidrogeno El ISFET detectará una señal de salida eléctrica diferente para cada región de cola. Además, si se agregan dGTP, seguidos de más dTTPs, la región de cola asociada con el Analito 1 objetivo liberará uno, después 100 iones de hidrógeno más, debido a la síntesis adicional de polinucleótidos. Las distintas señales de salida eléctrica generadas a partir de la adición de trifosfatos de nucleósidos específicos con base en composiciones de la región de cola, permiten que el ISFET detecte iones de hidrógeno de cada una de las regiones de cola, y esa información se puede usar para identificar las regiones de cola y sus analitos objetivo correspondientes.
Se pueden usar diversas longitudes de las regiones base homopoliméricas, bases de parada y combinaciones de las mismas, para etiquetar de manera única cada analito en una muestra. En la solicitud provisional de EE. UU. No.
61/868,988 se describen la descripción adicional sobre la detección eléctrica de aptámeros y regiones de cola, para identificar analitos objetivo en un sustrato.
Como se describe adicionalmente en el presente documento, los anticuerpos pueden usarse como sondas en el método de detección eléctrica descrito anteriormente. Los anticuerpos pueden ser anticuerpos primarios o secundarios que se unen a través de una región conectora a una región de cola de oligonucleótido, que actúa como etiqueta. Los ejemplos de dichas sondas se muestran en las FIG. 2, 5 y 6.
Estos métodos de detección eléctrica se pueden utilizar para la detección simultánea de cientos (o incluso miles) de analitos objetivo distintos. Cada analito objetivo se puede asociar con un identificador digital, de modo que el número de identificadores digitales distintos es proporcional al número de analitos objetivo distintos en una muestra. El identificador puede estar representado por un número de bits de información digital y está codificado dentro de un conjunto ordenado de región de cola. Cada región de cola en un conjunto ordenado de región de cola se hace secuencialmente para unirse específicamente a una región conectora de una región de sonda, que está unida específicamente al analito objetivo. Alternativamente, si las regiones de cola están unidas covalentemente a sus regiones de sonda correspondientes, cada región de cola en un conjunto ordenado de región de cola se hace secuencialmente para unirse específicamente a un analito objetivo.
En un aspecto descrito en el presente documento, un ciclo está representado por una unión y eliminación de una región de cola a una región enlazadora, de modo que ocurre la síntesis de polinucleótidos y libera iones hidrógeno, que se detectan como una señal de salida eléctrica. Por lo tanto, el número de ciclos para la identificación de un analito objetivo es igual al número de regiones de cola en un conjunto ordenado de región de cola. El número de regiones de cola en un conjunto ordenado de región de cola depende del número de analitos objetivo a identificar, así como del número total de bits de información a generar. En otra realización, un ciclo está representado por una región de cola unida covalentemente a una región de sonda que se une específicamente y se separa del analito objetivo.
La señal de salida eléctrica detectada de cada ciclo se digitaliza en bits de información, de modo que después de que se hayan realizado todos los ciclos para unir cada región de cola a su correspondiente región del enlazador, los bits totales de información digital obtenida se pueden usar para identificar y caracterizar el analito objetivo en cuestión. El número total de bits depende de una cantidad de bits de identificación para la identificación del analito objetivo, más una cantidad de bits para la corrección de errores. El número de bits para la corrección de errores se selecciona con base en la robustez y precisión deseadas de la señal de salida eléctrica. Generalmente, el número de bits de corrección de errores será 2 o 3 veces el número de bits de identificación.
IV. Decodificación del orden y la identidad de los analitos detectados
Las sondas utilizadas para la detección de los analitos se introducen en el sustrato de forma ordenada en cada ciclo. Se genera una clave que codifica información sobre el orden de las sondas para cada analito objetivo. Las señales detectadas para cada analito se pueden digitalizar en bits de información. El orden de las señales proporciona un código para identificar cada analito, que se puede codificar en bits de información.
En un ejemplo para detección óptica de analitos, utilizando 1 bit de información, cada analito está asociado con un conjunto ordenado de sondas. La Tabla 7 a continuación ilustra que cada analito objetivo está asociado con un orden predeterminado de un conjunto de sondas introducidas durante 7 ciclos, y el orden de las señales emitidas desde el conjunto ordenado de sondas se usa como código para identificar el analito objetivo. Por ejemplo, para la glicoproteína ácida alfa-1, el código de identificación es un conjunto ordenado de sondas de seis señales rojas (R) seguidas de una señal final azul (B). Cuando se recibe un conjunto de señales para un analito objetivo que lee "RRRRRRB", la clave se utiliza para encontrar una coincidencia entre el código de identificación de un orden para las sondas y las señales obtenidas del analito. En consecuencia, el código se usa para determinar que el analito objetivo es la glicoproteína ácida alfa-1.
Tabla 7. Clave para los analitos objetivo basada en un conjunto ordenado de sondas durante 7 ciclos y el código de identificación correspondiente
Figure imgf000019_0001
Como se describe en este documento, en algunos aspectos, el usuario de un kit que comprende el conjunto ordenado de sondas y las instrucciones para usar la sonda no tiene acceso al código, de modo que no puede hacer coincidir el conjunto ordenado de señales con el analito objetivo correspondiente. En un aspecto descrito en este documento, el kit no incluye la clave para decodificar los resultados, y el usuario envía los datos a un tercero para que los procese usando el código. En otro aspecto descrito en el presente documento, la clave con códigos de identificación se proporciona a un usuario del kit, y el usuario puede descifrar el conjunto ordenado de señales para el analito objetivo.
En un segundo ejemplo, cada color (señal fluorescente) puede representarse mediante una secuencia de 2 bits y una secuencia de 2 colores puede representarse mediante un símbolo de datos de 4 bits. La Tabla 8 proporciona un ejemplo de cuatro colores (rojo, azul, verde y amarillo) y sus valores de bits correspondientes. Por ejemplo, una secuencia de colores "BGGBBYY" para un analito en particular puede codificarse en 14 bits como 01101001011111 de acuerdo con el esquema de bits que se muestra en la Tabla 8.
Tabla 8. Asignaciones de 2 bits para marcadores fluorescentes
Figure imgf000019_0002
El orden de las sondas puede ser diferente para cada analito para cada ciclo nuevo (cuando un ciclo incluye múltiples pasos) o para cada conjunto de ciclos. La clave utilizada para identificar un analito en un conjunto de ciclos no tiene que volver a utilizarse en un segundo ensayo. Los códigos de los analitos objetivo se pueden modificar para cada ensayo.
En algunos aspectos descritos en el presente documento, el orden predeterminado del conjunto ordenado de sondas se elige aleatoriamente. En otras realizaciones, el orden predeterminado no es aleatorio. En uno de los aspectos descritos en el presente documento, el software de ordenador se utiliza para especificar el orden.
V. Métodos de corrección de errores
En los métodos de detección óptica y eléctrica descritos anteriormente, pueden ocurrir errores en la unión y/o detección de señales. En algunos casos, la rata de error puede llegar a uno de cada cinco (por ejemplo, una de cada cinco señales fluorescentes es incorrecta). Esto equivale a un error en cada secuencia de cinco ciclos. Las ratas de error reales pueden no ser tan altas como el 20 %, pero es posible que las ratas de error sean de un pequeño porcentaje. En general, la rata de error depende de muchos factores, incluido el tipo de analitos en la muestra y el tipo de sondas utilizadas. En un método de detección eléctrica, por ejemplo, es posible que una región de cola no se una correctamente a la región de sonda correspondiente en un aptámero durante un ciclo. En un método de detección óptica, es posible que una sonda de anticuerpos no se una a su objetivo o que se una al objetivo equivocado.
Se generan ciclos adicionales para dar cuenta de errores en las señales detectadas y para obtener bits adicionales de información, como bits de paridad. Los bits adicionales de información se utilizan para corregir errores utilizando un código de corrección de errores. En una realización, el código de corrección de errores es un código Reed-Solomon, que es un código cíclico no binario utilizado para detectar y corregir errores en un sistema. En otras realizaciones, se pueden usar varios otros códigos de corrección de errores. Otros códigos de corrección de errores incluyen, por ejemplo, códigos de bloque, códigos de convolución, códigos Golay, códigos Hamming, códigos BCH, códigos An , códigos Reed-Muller, códigos Goppa, códigos Hadamard, códigos Walsh, códigos Hagelbarger, códigos polares, códigos de repetición, códigos de repetición acumulada, códigos de borrado, códigos en línea, códigos de grupo, códigos de expansión, códigos de peso constante, códigos de tornado, códigos de verificación de paridad de baja densidad, códigos de distancia máxima, códigos de error de explosión, códigos de transformación luby, códigos de fuente y códigos de ave rapaz. Ver Error Control Coding, 2a edición, S. Lin y DJ Costello, Prentice Hall, Nueva York, 2004. A continuación también se proporcionan ejemplos que demuestran el método de corrección de errores mediante la adición de ciclos y la obtención de bits adicionales de información.
Un ejemplo de un código Reed-Solomon incluye un código RS(15,9) con símbolos de 4 bits, donde n = 15, k = 9, s = 4, t = 3 y n = 2s — 1 y k = n-2t, siendo "n" el número de símbolos, "k" el número de símbolos de datos, "s" el tamaño de cada símbolo en bits y "t" el número de errores que se puede corregir, siendo "2t" el número de símbolos de paridad. Hay nueve símbolos de datos (k = 9) y seis símbolos de paridad (2t = 6). Si se utilizan números de base X y X = 4, cada color fluorescente se representa mediante dos bits (0 y 1). Un par de colores puede representarse mediante un símbolo de cuatro bits que incluye dos bits altos y dos bits bajos.
La FIG. 11 ilustra la estructura de ejemplo RS(15,9). Dado que se eligió la base 4, se utilizan siete grupos de sondas, o una secuencia de siete colores, para identificar cada analito objetivo. Esta secuencia está representada por 3 A, símbolos de 4 bits. Los 5 A símbolos de datos restantes se establecen en cero. A continuación, un codificador Reed-Solomon RS(15,9) genera los seis símbolos de paridad, representados por 12 grupos de sondas adicionales. Por lo tanto, se requiere un total de 19 grupos de sondas (7 12) para obtener la corrección de errores para t = 3 símbolos.
Se han realizado simulaciones de Monte Carlo del rendimiento del código de corrección de errores, asumiendo siete grupos de sondas, para identificar hasta 16,384 objetivos distintos. Usando estas simulaciones, se determinó la rata de error bruto máxima permisible (asociada con la identificación de un marcador fluorescente) para lograr una rata de error corregido de 10'5,para diferentes números de bits de paridad. La Tabla 10A a continuación ilustra estos hallazgos.
Tabla 10A: Ratas de error
Figure imgf000020_0001
En algunas realizaciones, se genera una clave que incluye los bits de información esperados, asociados con un analito (por ejemplo, el orden esperado de sondas y tipos de señales para el analito). Estos bits de información esperados para un analito particular se comparan con los L bits de información reales que se obtienen del analito objetivo. Usando el enfoque de Reed-Solomon, se puede tolerar una permisibilidad de hasta t errores en la comparación de los bits de información esperados y los L bits de información reales.
En algunas realizaciones, se usa un decodificador Reed-Solomon para comparar la secuencia de señal esperada, con una secuencia de señal observada de una sonda particular. Por ejemplo, se pueden usar siete grupos de sondas para identificar un analito objetivo, siendo la secuencia de colores esperada BGGBBYY, representada por 14 bits. Entonces se pueden usar grupos de paridad adicionales para la corrección de errores. Por ejemplo, pueden usarse seis símbolos de paridad de 4 bits. Luego, como se muestra a continuación en la Tabla 10B, la secuencia de señal esperada se compara con la secuencia de señal observada, y se genera una secuencia de señal decodificada a partir de la comparación.
Tabla 10B.
Figure imgf000020_0002
La secuencia de señales observada tiene 2 errores en una secuencia ordenada de 19 señales. Cuando la secuencia de sonda recibida es decodificada por un decodificador Reed-Solomon, se recupera la secuencia de sonda original transmitida. La secuencia señal esperada es la secuencia diseñada para identificar un tipo de analito. La secuencia de señal observada es la secuencia de señales fluorescentes recibidas en un lugar particular sobre un sustrato sólido. La secuencia decodificada es la secuencia recuperada después de la decodificación por un decodificador de código de corrección de errores.
En otra realización, usando detección eléctrica de analitos, las sondas y los bits de información seleccionados usados en el método de detección eléctrica, siguen cálculos de corrección de errores, como se muestra en la Tabla 11 a continuación. En el Ejemplo 1, se eligen 3 bits de ID, lo que corresponde a un total de 8 analitos objetivo y 8 números de ID (23 = 8). Además, el factor de error se calcula como el número de bits de error dividido por el número de bits de ID. Aquí, el número de bits utilizados para la corrección de errores en este ejemplo es 9 (3x3 = 9), y el factor de error sería 3 (9/3 = 3). El total de bits por ejecución es 12 (suma de 3 bits de ID y 9 bits de corrección de errores). El número de bits por ciclo se puede elegir como 3 y el número de sondas por ciclo se determina como 8 (23 = 8). A continuación, se calcula que el número de ciclos es 4 con base en el número de bits, el factor de error y los bits por ciclo. La ecuación utilizada es ((bits x (1 factor de error)/bits por ciclo). Aquí, el cálculo es (3 x (1+ 3))/ 3) = 4 ciclos. En este ejemplo, se utiliza una parada por etiqueta eléctrica. El número de sondas detectables se puede aumentar con base en la selección de bits más altos, como se muestra en los ejemplos 2 a 5 de la Tabla 11.
Tabla 11. Resumen de ensayos de ejemplo utilizando diferentes números de bits, número de objetivos, número de sondas, ciclos y tipos de parada
Figure imgf000021_0001
En la solicitud provisional de EE. UU. No. 61/868,988se encuentra una descripción adicional sobre los métodos de detección eléctrica.
VI. Rango dinámico
Las concentraciones de analitos tales como las proteínas en muestras tales como el suero humano pueden variar por factores de más de 1010. Los rangos dinámicos de concentraciones probables para proteínas particulares son generalmente más pequeños. Por ejemplo, la ferritina normalmente se encuentra entre 104-105 pg/ml en suero humano. La mayoría de las concentraciones de proteínas no varían en más de un factor de 103 de una muestra de suero humano a otra.
Debido a que es difícil detectar marcas fluorescentes correspondientes a los analitos objetivo en un amplio rango dinámico de concentraciones, un sustrato que contiene analitos objetivo puede dividirse en regiones de concentración. Por ejemplo, la FIG. 12A muestra un sustrato de ejemplo que se ha dividido en regiones "ALTO", "MEDIO" y "BAJO". Los mismos analitos objetivo pueden distribuirse a través de cada una de las tres regiones. Sin embargo, los analitos objetivo se diluyen en diferentes muestras de concentración, antes de la distribución: una muestra en cada caso de alta concentración (ALTA), concentración media (MED) y concentración baja (BAJA). En una realización, los analitos objetivo en la región "ALTA" del sustrato se distribuyen a una concentración de alrededor de 1 proteína por micrómetro cuadrado, los analitos objetivo en la región "MED" se distribuyen a alrededor de 102 proteínas por micrómetro cuadrado, y los analitos objetivo en la región "BAJA" se distribuyen alrededor de 104 proteínas por micrómetro cuadrado. En una realización adicional, las diluciones se ajustan de manera que la densidad de marcas fluorescentes en cada región de concentración, sea de alrededor de una etiqueta por 10-25 píxeles en una imagen del sustrato.
La FIG. 12B es un gráfico que muestra un ejemplo de rangos de abundancia de analitos objetivo de una muestra, ubicados en diferentes regiones de concentración (Baja, Media y Alta) de un sustrato. La FIG. 12C también es un gráfico que muestra rangos de abundancia de analitos objetivo, con una cuarta región de concentración: "Raro." Los rangos de abundancia superpuestos demuestran que ciertos analitos objetivo pueden detectarse en más de una región de concentración. Estos gráficos (FIGs. 12B y 12C) se generaron a partir de simulaciones realizadas en el Ejemplo 5 (abajo).
En una realización, los analitos objetivo particulares dentro de una muestra pueden separarse de la muestra, para aumentar aún más el rango dinámico. Por ejemplo, en una muestra de suero humano, puede ser deseable eliminar la albúmina, una proteína muy abundante. Se puede utilizar cualquier técnica de separación, incluida la cromatografía líquida de alta resolución.
Una vez las diferentes diluciones de las muestras del analito objetivo se han unido al sustrato, se pueden aplicar sondas para unirse selectivamente a los analitos objetivo. En una realización, las sondas se pueden preparar en concentraciones variables para que se unan selectivamente a los analitos objetivo de abundancia media en la región "MED" del sustrato.
Ejemplos
A continuación se muestran ejemplos de realizaciones específicas para llevar a cabo la presente invención.
La práctica de la presente invención empleará, a menos que se indique de otro modo, métodos convencionales de química de proteínas, bioquímica, técnicas de ADN recombinante y farmacología, dentro de la destreza de la técnica. Tales técnicas se explican completamente en la literatura. Véase, por ejemplo, TE Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); Alabama Lehninger, Biochemistry (Worth Publishers, Inc., adición actual); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2a edición, 1989)); Methods In Enzymology (S. Colowick y N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18.a edición (Easton, Pensilvania: Mack Publishing Company, 1990); Carey y Sundberg A 3a ed. (Plenum Press) Vols A y B (1992).
Ejemplo 1: Ensayo de detección óptica para múltiples analitos usando una etiqueta fluorescente individual, un solo paso, conteo oscuro y 1 bit por ciclo
En un ejemplo, el método se realiza usando los siguientes parámetros: Etiqueta fluorescente individual (color único), paso único, conteo oscuro y 1 bit por ciclo. La FIG. 9 ilustra este ejemplo donde la densidad de la superficie fluorescente es menor que la densidad de la superficie de la proteína depositada. La figura muestra cuatro tipos diferentes de proteínas objetivo mezcladas con otras proteínas no objetivo depositadas aleatoriamente en la superficie.
La Tabla 12 a continuación muestra cómo se puede obtener un total de cuatro bits de información usando cuatro ciclos de hibridación y eliminación, de manera que hay un paso por ciclo. Las señales obtenidas de los cuatro ciclos se digitalizan en bits de información.
Como se ilustra en la FIG. 13, se introducen sondas para el Analito A en el Ciclo 1, y la presencia del analito se indica con un "1". En el Ciclo 2, las sondas para el Analito A no se agregan y el analito no se detecta, lo que se indica con un "0". Después de cuatro ciclos, el Analito A se puede asociar con un código binario de "1010". En un sistema de base 2, el código se representa como "1010". En un sistema de base 10, el mismo código se representa como "10" (p. ej., (23 x 1) (22 x 0) (21 x 1) (20 x 0) = 10).
En el primer ciclo, solo se incluyen en el grupo de sondas las sondas de anticuerpos para los objetivos A y B. El sistema de formación de imágenes mide una imagen de color individual para el primer ciclo, donde las moléculas A y B emiten fluorescencia, pero C y D están oscuras (sin sondas ni señal). Las sondas para los objetivos A y B se eliminan. Para el segundo ciclo, las sondas de anticuerpos para los objetivos C y D se introducen y se toman imágenes, y después se eliminan las sondas de anticuerpos para C y D. Para el tercer ciclo, se introducen y se obtienen imágenes de las sondas de anticuerpos de los objetivos A y C. A continuación, se eliminan las sondas de anticuerpos para los objetivos A y C. Para el cuarto ciclo, se introducen sondas de anticuerpos para los objetivos B y D, y se obtienen imágenes de las moléculas fluorescentes. Después de obtener imágenes de múltiples ciclos, se determina el ID (código de señales fluorescentes) para la molécula objetivo en cada posición. Solo son necesarios 2 ciclos para la identificación de 4 moléculas. En algunas realizaciones, se pueden usar ciclos adicionales para la información de corrección de errores, que se describe a continuación, o para identificar más de 4 moléculas.
Tabla 12. Etiqueta fluorescente individual, paso único, conteo oscuro y 1 bit por ciclo
Figure imgf000023_0001
Ejemplo 2: Ensayo de detección óptica para múltiples analitos usando color individual, cuatro pasos por ciclo, paso oscuro sin contar y 2 bits por ciclo
En otro ejemplo, se utilizan los siguientes parámetros: Color individual, cuatro pasos por ciclo, paso oscuro no contado y 2 bits por ciclo.
En la Fig. 14, se muestran cuatro pasos para un ciclo individual. El primer paso incluye sondas para el analito A objetivo. Las sondas para el objetivo A se hibridan y se obtienen imágenes de las señales detectables. Por ejemplo, las sondas comprenden una molécula fluorescente verde y emiten un color verde. Las sondas para el objetivo A no se eliminan del sustrato en este ejemplo. En el paso 2, las sondas para el objetivo B se hibridan y las sondas para el objetivo B tienen el mismo color fluorescente que las sondas para el objetivo A. Se detectan las señales adicionales para el objetivo B (fluorescentes verdes) y se obtienen imágenes para ambas señales para los objetivos A y B. Las sondas para A y B no se eliminan del sustrato.
En el paso 3, se introducen las sondas para el objetivo C y se hibridan con el objetivo C. Las sondas para el objetivo C emiten el mismo color fluorescente que los objetivos A y B. Se obtienen imágenes de las señales emitidas por las sondas para los objetivos A, B y C. En el paso 4, las sondas para el objetivo D se hibridan y se obtienen imágenes de las señales emitidas por los objetivos A, B, C y D. Finalmente, se eliminan todas las sondas y se completa el primer ciclo.
Se pueden realizar múltiples ciclos para aumentar el número de objetivos que se van a cuantificar. No es necesario tener sondas para cada objetivo en cada paso, y se pueden observar muchas más de cuatro moléculas.
La Tabla 13 a continuación muestra cómo las señales obtenidas de un ciclo con cuatro pasos se digitalizan y representan como dos bits de información por ciclo. Durante el período de cuatro ciclos, se puede obtener un total de 8 bits de información por analito. La Tabla 14 proporciona la clave para la salida digital para cuatro pasos en un ciclo.
Tabla 13: Color individual, cuatro pasos, oscuro no contado, 2 bits por ciclo
Figure imgf000024_0001
Figure imgf000024_0002
Tabla 14; Clave para ensavp dd eiemr]o _2
Figure imgf000024_0003
Es posible utilizar múltiples fluorescentes en los analitos secundarios, en lugar de realizar hibridaciones sucesivas para lograr más bits de información por ciclo. Por ejemplo, cuatro colores de etiquetas fluorescentes en anticuerpos secundarios permitirían un paso de hibridación y un paso de eliminación por ciclo, para lograr dos bits de información por ciclo.
Una combinación de uso de múltiples colores y también realización de múltiples pasos de hibridación por ciclo podría aumentar el número de bits medibles por ciclo. Por ejemplo, el uso de un sistema de formación de imágenes de cuatro colores y realización de 4 pasos de hibridación por ciclo, permitiría lograr hasta cuatro bits de información por ciclo.
Ejemplo 3: Ensayo de detección óptica para múltiples analitos utilizando cinco colores, tres pasos por ciclo, recuento de pasos oscuros, cuatro bits por ciclo
En otro ejemplo, se utilizan los siguientes parámetros: Cinco colores, tres pasos por ciclo, paso oscuro contado, cuatro bits por ciclo.
Las siguientes tablas ilustran un ensayo con un sistema de cinco colores con 3 pasos de hibridación por ciclo. Es posible un total de 16 niveles o, de modo equivalente, cuatro bits de información por ciclo, si la ausencia de cualquier señal se considera un nivel (es decir, ciclo oscuro contado). La Tabla 16 proporciona una clave para el código ID de cada analito.
Figure imgf000025_0001
Figure imgf000025_0004
Figure imgf000025_0005
Figure imgf000025_0002
Figure imgf000025_0006
La Tabla 17 a continuación muestra el número de bits por ciclo para una hibridación multicolor de varios pasos para detección óptica, con y sin ausencia de señal considerada como un nivel (ciclo oscuro contado/ciclo oscuro no contado).
Tabla 17: Número de bits por ciclo para la hibridación multicolor de varios pasos para la detección óptica
Figure imgf000025_0003
Figure imgf000026_0001
Ejemplo 4: Demostración de hibridación y eliminación de sonda de ADN y objetivo a nivel masivo
Los ácidos nucleicos se usaron para demostrar ciclos de hibridación de sonda APTIQ/objetivo y de eliminación a granel. Los oligonucleótidos (Tabla 18) se adquirieron de IDT Integrated DNA Technologies (Coralville, Iowa). Los oligonucleótidos se disolvieron en agua de calidad molecular a una concentración final de 100 pM y se almacenaron a -20 °C.
Tabla 18: Secuencias de Oligonucleótido y Sonda
Figure imgf000026_0002
Figure imgf000027_0001
Se imprimieron oligonucleótidos con enlazadores C6-amino en microarreglos en Arraylt (Sunnyvale, California). A menos que se especifique de otro modo, todos los reactivos y equipos utilizados en estos Ejemplos se adquirieron de Arraylt. Los oligonucleótidos se imprimieron a una concentración final de 50 pM en amortiguador IX MSP (Cat ID: MSP) en SuperEpoxy 2 Microarray Substrates (Cat ID: SME2), en NanoPrint Microarrayer usando SMP3 Microarray Printing Pin. Los microarreglos impresos se secaron durante la noche.
Antes de su uso, un portaobjetos de sustrato se bloqueó durante 1.5 horas en Blockit Blocking Buffer (Cat ID: BKT) a temperatura ambiente con agitación suave a 350 rpm, seguido de lavado 3 veces, 1 minuto a la vez, con amortiguadores de lavado 1, 2, 3 a IX (Cat ID: WB1, w B2, WB3) en una placa de Petri cuadrada, volumen de 30 ml a 350 RMP en órbita de 2 mm. A continuación, el portaobjetos se secó por centrifugación durante 10 segundos con una Microarray Centrifuge (Cat ID: MHC110).
Una junta (Cat ID: GAHC4x24) se bloqueó en el amortiguador de bloqueo Blockit durante al menos 1 hora, se enjuagó con agua destilada y se secó con una toallita Microarray Cleanroom (Cat ID: MCW), y se cargó en la tapa del casete (Cat ID: AHC4x24). Se usó amortiguador de hibridación Hybit (Cat ID: HHS2) para la hibridación en IX. Las sondas marcadas con Cy3 o Cy5 (Tabla 18) (correspondientes al color R-rojo o G-verde, respectivamente) se mezclaron en los grupos de sondas en amortiguador de hibridación 1x. Se cargaron 75 pl de grupos de sondas de hibridación en el microarreglo y se incubaron durante 15 minutos a 37 °C, RMP 350 en la estación Arrayit Array Plate Hyb (ID de Cat: MMHS110V).
Se añadieron 100 ul de amortiguador de lavado (a 37 °C) 1 a cada pozo y después se incubaron durante 1 minuto a RMP 350. A continuación, se extrajo el amortiguador de lavado expulsándolo a los residuos. El amortiguador 1 de lavado se usó dos veces más, el amortiguador 2 de lavado se usó tres veces y después el amortiguador 3 de lavado se usó tres veces.
El portaobjetos se retiró de la junta, se sumergió en el amortiguador de lavado 3 en un recipiente y se secó por centrifugación en la Microarray Centrifuge. El portaobjetos se escaneó en un escáner Axon 4200A con configuración de PMT250 para los láseres 532 y 635. El portaobjetos se incubó con las manchas hacia arriba en una placa de Petri cuadrada que contenía 30 ml de Stripping Buffer A a 350 RMP durante 10 minutos. Se eliminó el amortiguador Stripping Buffer A e inmediatamente se añadieron 30 ml de amortiguador Stripping Buffer B. El procedimiento se repitió con el amortiguador Stripping Buffer B y el amortiguador Stripping Buffer C. El portaobjetos se secó en la centrífuga de microarreglos y se preparó para el siguiente ciclo de hibridación. El portaobjetos se escaneó después de la eliminación para confirmar la eficacia de la eliminación.
La FIG. 15 ilustra los resultados del barrido: se identificaron tres objetivos de oligonucleótido (B1, B2 y B3) mediante sondeo de unión y eliminación durante 6 ciclos. La secuencia de colores de cada objetivo de oligonucleótido se identificó correctamente.
Ejemplo 5: Uso de ADN para demostrar el conteo de moléculas individuales
Se describe un método para la identificación y cuantificación de moléculas individuales. Los oligonucleótidos (Tabla 19) se adquirieron de IDT Integrated DNA Technologies. Los oligonucleótidos se disolvieron en agua de calidad molecular a una concentración final de 100 uM y se almacenaron a -20 °C.
Tabla 19: Secuencias de Oligonucleótido y Sonda
Figure imgf000027_0002
Figure imgf000028_0001
Los portaobjetos de silicio se compraron en University Wafer (Boston, MA), se cortaron en cubitos (American Precisión Dicing Inc., San José, California) y se recubrieron con sustrato SuperEpoxy (Arraylt). Los chips de silicio monocristalino se prepararon como portaobjetos de sustrato de 25 mm * 75 mm. El grosor de los chips de silicio utilizados fue de 500 |jm, 675 |jm y 1000 jm . Se hizo crecer un óxido térmico en los chips de silicio de 100 nm y después se cortó en cubitos en portaobjetos.
Se incubó un portaobjetos en una solución de 4 oligonucleótidos de ADN (Tabla 19), terminando cada oligonucleótido en una molécula C6. Las secuencias de los 4 oligonucleótidos fueron A, B, C y D correspondientes a los genes que codifican para KRAS, EGFR, BRAF y P53. Los 4 oligonucleótidos con enlazador C6-amino se mezclaron a 100 nM por oligonucleótido en solución de micromanchado 1x (Cat ID: MSS, Arraylt) y después se incubaron en el portaobjetos de silicio recubierto con epoxi, en un recipiente a temperatura ambiente durante la noche. Durante la incubación, una reacción entre el revestimiento de epoxi y los oligonucleótidos C6 unió covalentemente el ADN monocatenario a la superficie. Luego, el portaobjetos se lavó con agua de calidad molecular durante 5 minutos, 3 veces, seguido de una incubación en solución de bloqueo Arraylt Blocklt durante 1 hora a temperatura ambiente con agitación suave a 350 rpm, seguido de un lavado 3 veces durante 1 minuto cada vez con amortiguadores de lavado 1,2, 3 a IX en una placa de Petri cuadrada, volumen de 30 ml a 350 RMP en órbita de 2 mm. El portaobjetos se secó por centrifugación durante 10 segundos con Microarray Centrifuge.
El chip se fabricó con pegamento hasta dar un biochip que constaba de 3 partes, un chip de silicio, un marco de observación y un cubreobjetos de vidrio de 170 jm de espesor. El cubreobjetos (Nexterion, Tempe, AZ) se pegó sobre el portaobjetos de silicio con pegamento Bostik mezclado con perlas de 50 uM (Gelest, Morrisville, PA) en un dispositivo desarrollado internamente. El pegamento y las perlas se empaquetaron en una jeringa de 3 cc (Hamilton Company, Reno, NV) y se centrifugaron en una centrífuga EFD ProcessMate (Nordson, Westlake, OH) y después se entregaron mediante un dispensador de pegamento Nordson EFD Ultimus I.
Las sondas marcadas con Cy3 o Cy5 (Tabla 19) se mezclaron en los grupos de sondas en amortiguador de hibridación 1xHybIt. La solución de hibridación del conjunto No. 1 se entregó en el biochip y se incubó durante 15 minutos a temperatura ambiente. Después, el chip se lavó con los amortiguadores de lavado 1,2 y 3 (ArrayIt), 8 veces con cada amortiguador. Se agregó glicerol al 15 % en 1xSSPE (NaCl 150 mM, NaH2PO4 10 mM, ImMEDTA) al chip antes de la toma de imágenes. Los grupos de sondas sucesivos de las sondas 1, 2, 3, 4 se hibridaron y se eliminaron. Después de cada paso de hibridación, un sistema de formación de imágenes tomó imágenes de 12 regiones del portaobjetos, cada región de 100 jm * 100 jm . La cámara utilizada fue una Hamamatsu Orca 4.0 con un sistema de aumento de 40X, usando la pieza Olympus # UAPON40XW
Después de la formación de imágenes, el chip se enjuagó con agua de calidad molecular y después se eliminó en el amortiguador de eliminación A, B, C (ArrayIt), 8 veces cada amortiguador. Se añadió glicerol al 15 % en 1xSSPE al chip, antes de obtener la imagen. Después del ciclo 1, que incluye el conjunto # 1 de sondas de hibridación, formación de imágenes, eliminación, formación de imágenes, el ciclo 2 comienza con la hibridación con el conjunto # 2 de sondas.
Los datos se tomaron en dos portaobjetos (portaobjetos #177 y # 179, FIG. 16A), cada portaobjeto contiene doce campos. Cada campo era de 100 jm * 100 jm . Se utilizó un sistema de formación de imágenes de dos colores con filtros CY3 y CY5. Para cada portaobjeto, se recopilaron al menos 12-14 ciclos de datos, y el análisis utilizó de 9 a 10 ciclos de datos. El levantamiento del mapa de la ID de identificación del objetivo a la secuencia de colores se ilustra en la Tabla 19. En la Fig. 16A, cada color se asigna a una secuencia tal que una sonda está marcada con CY5 o CY3, correspondientes respectivamente al color R (rojo) o G (verde), que se asigna a 1 o 0 adquiriéndose 1 bit de información por ciclo (FIG. 16B). Para este caso, el esquema de corrección de errores fue conservador y requirió cero errores por objetivo, definiéndose un error como una identificación positiva en una secuencia donde no se esperaba. Se permitieron hasta cinco secuencias perdidas por molécula. Las secuencias faltantes son casos en los que una molécula no se identifica en un ciclo. Estos no se clasifican como errores.
Los portaobjetos # 177 y # 179 se midieron en condiciones similares. Se midió una pequeña porción de cada portaobjeto (medir el portaobjeto completa es una implementación de escala y automatización). La FIG. 16A muestra el número de moléculas en cada campo con el número de cada gen que se identificó. Los porcentajes de moléculas identificadas fueron del 12% al 13%.
La FIG. 17 ilustra una imagen tomada con el generador de imágenes prototipo de sondas de ADN de fluorescentes individuales que se han hibridado con los oligonudeótidos objetivo de ADN unidos covalentemente a la superficie. Entre el 10 % y el 15 % de las moléculas identificadas tenían múltiples fluorescentes por mancha debido a la agregación que se produjo durante la unión de la muestra.
La FIG. 18 ilustra ejemplos representativos de identificación de cada uno de los cuatro objetivos del portaobjeto # 177 (FIG. 16A). Cada punto en el círculo está alineado para centrarse en el objetivo. Los objetivos se identifican con una sola detección de fluorescente. Aproximadamente entre el 10 % y el 15 % de los objetivos de la imagen eran especies moleculares agrupadas, en las que se unía más de un fluorescente. La inspección de los datos muestra que para ambos experimentos, se observaron mayores niveles de P53 y KRAS que BRAF y EGFR. El número total de moléculas identificadas fue inferior a 2000 en ambos casos, lo que demuestra la alta sensibilidad potencial del método para detectar e identificar un bajo número de moléculas.
Ejemplo 6: Demostración de hibridación y eliminación de sonda peptídica y objetivo a nivel masivo
Se usaron péptidos para demostrar los ciclos de unión y eliminación de la sonda APTIQ/objetivo a nivel masivo. El péptido MUC1 (Secuencia: APDTRPAPG) se adquirió de American Peptide (Sunnyvale, California). El MUC1 se disolvió a 1 mg/ml en amortiguador 1 de impresión de péptido 1x (Cat ID: PEP, ArrayIt). El péptido MUC16 a 0.2 mg/ml, anticuerpos monoclonales contra anti-MUC1 C595 de ratón [Cat ID: NCRC48] y anti-MUC16 de conejo Cat ID : EPSISR23] se adquirieron de Abcam (Cambridge, MA). Los siguientes anticuerpos secundarios también se adquirieron de Abcam: IgG Cy3 cabra anti-ratón (Cat ID: ab97035), IgG Cy3 cabra anti-conejo (Cat ID: ab6939), IgG Cy5 cabra anti-ratón (Cat ID: ab97037), IgG Cy5 cabra anti-conejo (ID de gato: ab6564).
Los péptidos se imprimieron en microarreglos en ArrayIt (Sunnyvale, California). El péptido MUC1 se imprimió a una concentración final de 0.5 mg/ml y MUC16 a 0.1 mg/ml en amortiguador 2 de impresión de péptido 1x (Cat ID: PEP, ArrayIt) en sustratos SuperEpoxy 2 Microarray en un NanoPrint Microarrayer usando SMP3 Microarray Printing Pin. Los microarreglos impresos se secaron durante la noche.
Antes de su uso, el portaobjetos se bloqueó durante 1.5 horas en Blockit Plus Blocking Buffer (Cat ID: BKTP, ArrayIt) a temperatura ambiente con agitación suave a 350 rpm, seguido de lavado 3 veces de 1 minuto cada una con PBS 1x en una placa de Petri cuadrada, volumen de 30 ml a 350 RMP en órbita de 2 mm. El portaobjetos se secó por centrifugación durante 10 segundos con la centrífuga ArrayIt Microarray.
Los anticuerpos primarios anti-MUC1 y anti-MUC 16 se diluyeron 250 veces en amortiguador 1xPBS (NaCl 137 mM; KCl 2.7 mM; Na2HPO4 10 mM; KH2PO42 mM, pH 7.4). Los anticuerpos secundarios se diluyeron 10000 veces en 1xPBS. Los anticuerpos marcados con Cy3 o Cy5 se mezclaron en los 2 grupos en PBS 1x: Grupo #1: anti-ratón Cy3 y anti-conejo Cy5; Grupo #2: anti-conejo Cy5 y anti-conejo Cy3.
Se añadieron al portaobjetos 5 ml de la mezcla de grupos de sondas primarias, y se incubaron durante 1 hora a temperatura ambiente en un recipiente. Después, el portaobjetos se lavó con 1xPBS, 3 veces, 5 minutos cada vez, con agitación suave a 450 rpm.
Se añadió el conjunto de anticuerpos secundarios # 1 al portaobjetos y se incubó durante 1 hora a temperatura ambiente. Después, el portaobjetos se lavó con 1xPBS, 3 veces, 5 minutos cada vez, con agitación suave a 450 rpm. El portaobjetos se retiró del recipiente y se secó en la Microarray Centrifuge. El portaobjetos se escaneó en Axon 4200A con ajustes en PMT250 para los láseres 532 y 635.
El portaobjetos se incubó con las manchas hacia arriba en una placa de Petri cuadrada que contenía 5 ml de amortiguador Stripping Buffer (Cat ID: 21028, Fisher Scientific, Rockford, IL) a 300 RPM durante 1 hora. Después se lavó el portaobjetos con agua destilada 3 veces, durante 5 minutos cada vez. El portaobjetos se secó en la centrífuga de microarreglos y después se preparó para el siguiente ciclo de unión y eliminación de anticuerpos. El portaobjetos se escaneó después de la eliminación, para asegurarse de que la eliminación fuera eficiente.
La FIG. 19 ilustra los resultados del barrido: se identificaron dos objetivos de oligonucleótido (MUC1 y MUC16) mediante sondeo de unión y eliminación durante 4 ciclos. La secuencia de colores de cada objetivo de oligonucleótido se identificó correctamente.
Ejemplo 7: Uso de péptidos para demostrar el conteo de moléculas individuales
La preparación de péptidos se realizó usando la misma técnica que en el Ejemplo 4. El péptido MUC1 (20 ng/ml) y MUC 16 (4 ng/ml) se diluyeron en amortiguador 2 de impresión de péptidos ArrayIt 1x (ArrayIt, Sunnyvale, California) y después se incubaron en un portaobjetos de silicio en un recipiente a temperatura ambiente durante la noche. Después, el portaobjetos se lavó con agua de calidad molecular durante 5 minutos, 3 veces, seguido de una incubación en ArrayIt BlockIt más solución de bloqueo durante 1 hora a temperatura ambiente con agitación suave a 300 rpm. Posteriormente, el chip se lavó con agua de calidad molecular durante 5 minutos, 3 veces. El portaobjetos se secó por centrifugación en una centrífuga de alta velocidad para microarreglos. A continuación, se construyó el portaobjetos en biochip siguiendo los mismos procedimientos que antes.
Los anticuerpos primarios se diluyen 250 veces en IxPBS. Los anticuerpos secundarios se diluyen 10,000 veces en IxPBS. Se administró una mezcla de anticuerpos primarios contra MUC1 y MUC16 en el biochip y se incubó durante 60 minutos a temperatura ambiente. Luego, el chip se lavó con 8x con 1xPBS. Se administró una mezcla de anticuerpos secundarios (ya sea el conjunto # 1 que contenía Cy3 anti-ratón y Cy5 anti-conejo o el conjunto # 2 que contenía Cy5 anti-conejo y Cy3 anti-conejo) en el biochip y se incubó durante 60 minutos a temperatura ambiente. A continuación, el chip se lavó con lavado 8x con 1xPBS. Se añadió glicerol al 15 % en 1xSSPE al chip, antes de obtener la imagen.
La FIG. 20 muestra una imagen de péptidos de molécula individual, de modo que los anticuerpos (CY5 y CY3) conjugados se unieron a péptidos aislados que, a su vez, se unieron covalentemente a la superficie del chip. Se pueden unir múltiples fluorescentes a un anticuerpo dado, lo que crea una dispersión en la intensidad de cada molécula observada. Se midió que estas moléculas eran algo más brillantes que las mediciones de una molécula individual de ADN, en las que se conjugó un fluorescente individual a cada sonda de ADN. Se realizaron un total de seis ciclos de dos proteínas en modo de molécula individual. Las moléculas se unieron y eliminaron con alto rendimiento. Se pueden usar técnicas similares para escalar el sistema a muchas más proteínas y objetivos de ADN/ARN.
Después de la formación de imágenes, el biochip se enjuagó con agua de calidad molecular y después se eliminó en el amortiguador de extracción (Cat ID: 21028, Fisher Scientific, Rockford, IL) durante 1 hora seguido de lavado 8x con 1xPBS. Se añadió glicerol al 15% en 1xSSPE al biochip, antes de la toma de imágenes. Después del ciclo 1, que incluye el conjunto # 1 de sondas de hibridación, formación de imágenes, eliminación, formación de imágenes, el ciclo 2 comenzó con la hibridación con el conjunto # 2 de sondas.
Ejemplo 8: Cuantificación del proteoma de plasma humano
Se creó un modelo de sistema para demostrar la viabilidad de medir la concentración de las aproximadamente 10,000 proteínas en el proteoma del plasma humano, en 12 intervalos logarítmicos de rango dinámico, mediante la identificación de molécula individual con la codificación de corrección de errores Reed-Solomon. Para este modelo, las proteínas del proteoma plasmático se dividieron en tres regiones de concentración, como se muestra en la FIG.
12B, denominadas regiones de baja, media y alta concentración. Teóricamente, el rango total de concentraciones de proteína en el proteoma plasmático humano es de más de 10 intervalos logarítmicos de rango dinámico, pero la concentración de cada proteína no varía más que unos pocos intervalos logarítmicos. La FIG. 12B representa regiones de concentración superpuestas. Para cada una de las regiones, se seleccionan sondas para proteínas que se espera que se encuentren dentro de esa región particular, pero que no excedan la concentración máxima permisible para esa región. Se puede lograr una mayor superposición agregando otro rango de concentración, como se muestra en la FIG.
12C, con la contrapartida de que se usa una mayor área del chip de sustrato.
Los datos utilizados en el modelo provienen de la base de datos UniProt (uniprot.org, archivo FASTA para el organismo 9606), "Toward a Human Blood Serum Proteome", Joshua Adkins y otros, "The Human Plasma Proteome", N. Leigh Anderson et al. y "A High-Confidence Human Plasma Proteome Reference Set with Estimated Concentrations in PeptideAtlas", T. Farrah et al. Debido a que no todas las proteínas en la base de datos UniProt están asociadas con una concentración publicada, se asignaron concentraciones aleatorias sin cambiar las bien conocidas concentraciones de proteínas altamente abundantes o la concentración total. La FIG. 21 muestra un gráfico de probabilidad de las concentraciones estimadas. Las concentraciones entre 105 y 1011 pg/ml utilizan los valores publicados. Se utilizaron todos los valores publicados que se encuentran en el rango inferior. Las concentraciones de proteína restantes se estimaron utilizando una aproximación logarítmica normal, con una distribución gaussiana estimada en un espacio logarítmico normal de 6 órdenes de magnitud desde 10'1 pg/ml a 104 pg/ml.
La FIG. 22 enumera valores estimados específicos para cada una de las regiones de abundancia utilizadas. Para cada región de abundancia, se asumió la misma densidad de proteína objetivo (dTP) de 1.5 proteínas objetivo por pm2. Sin embargo, en la región de baja abundancia, el número de proteínas de la región de alta abundancia por número de proteínas objetivo (rHT) fue de 25,000 a 1, y de 250 a 1 en la región de abundancia media. El número de proteínas de alta abundancia por píxel (rHP) osciló entre 1,000 y 0.04. El número de píxeles por proteína objetivo fue constante para cada una de las tres regiones.
Para el modelo, se asume un sistema de formación de imágenes de cuatro colores, que proporciona 2 bits de información por ciclo. La FIG. 23 muestra cómo se esperaría que se viera una imagen simulada, para cualquiera de los colores en cualquiera de los rangos de abundancia, excepto en el caso de la albúmina en el rango de alta abundancia, cuando en un momento dado se espera que la mitad de las moléculas objetivo tenga el mismo color. Un campo es la región de formación de imagen de la cámara para una exposición dada, en este caso se asume una cámara de 2,000 por 2,000 píxeles con un aumento de 40X, que da píxeles de 163 nm. Se requiere un total de 2,500 campos (nF) para la región de baja abundancia, pero solo se requieren 250 campos en cada caso para las regiones de abundancia media y alta.
Con el modelo del sistema optimizado, se determinó que la región de más baja abundancia interrogaría a 9,575 proteínas de 9,719 o el 98.5 % del proteoma. En el otro extremo, la región de alta abundancia interroga solo al 2.9% superior del proteoma. Esto se debe a que solo hay un pequeño porcentaje de las proteínas en el proteoma plasmático, que compone la región de alta abundancia. Los rangos de concentración medibles varían dependiendo de la región de concentración. La región de concentración de baja abundancia mide concentraciones entre 30 fg/ml y 300 ng/ml. La región de concentración de abundancia media mide concentraciones entre 82 pg/ml y 85 ug/ml. La región de concentración de alta abundancia mide concentraciones entre 20 ng/ml y 100 mg/ml. El área de chip total requerida para esta medida es de 320 mm2, o un chip con dimensiones de 18 mm * 18 mm.
Se realizó un análisis para determinar la eficacia de la corrección de errores de Reed Solomon en la medición del proteoma plasmático, en 12 intervalos logarítmicos de rango dinámico. Hay una rata de error intrínseco para cada ciclo de medición para cada molécula contada. Dado que cada molécula se extiende sobre un portaobjetos (particularmente significativo para las moléculas de baja abundancia), habrá otras moléculas cercanas que no deberían reaccionar de forma cruzada con las sondas, pero aún lo hacen. Un sistema robusto permitirá que esto ocurra y será capaz de corregir estos errores y dar la identificación correcta de una molécula. La rata a la que ocurre la unión incorrecta por molécula por ciclo es la rata de error bruto. La rata de error del sistema es la rata de error de identificación por molécula, después de que se haya realizado la corrección.
La FIG. 24 ilustra un gráfico de la rata de error esperada del sistema frente a la rata de error bruto, para casos que varían tasas de error bruto y números variables de ciclos de formación de imágenes. Los datos para el gráfico se generaron utilizando una simulación de Monte Carlo en la que se simuló una gran cantidad de configuraciones del sistema. Para identificar 16,384 proteínas, se requiere un total de 7 ciclos de datos para un sistema de cuatro colores (47 = 16,384). La rata de error máxima permisible se calcula dividiendo la cantidad permisible de errores del sistema por el número de moléculas identificadas. En este caso, para un promedio de un error por proteína, el número de errores permisible es 16,384. El número de moléculas identificadas es 4.0 * 108 (2,500 campos * 1.6 * 105 moléculas por campo) con una rata de error permisible calculada en 4.1 * 10-5.
La codificación Reed Solomon requiere ciclos de paridad para mejorar la rata de error bruto. Suponiendo un sistema Reed Solomon sobre un campo de Galois de 4 (mm = 4), cada símbolo (o palabra) es un símbolo de 4 bits que se puede representar mediante dos símbolos de 2 bits (es decir, 2 ciclos de un sistema de 4 colores que obtiene 2 bits por ciclo). Para un sistema Reed Solomon, la longitud del símbolo (o palabra clave) es nn = 2mm-1, o 15 símbolos de 4 bits, o equivalentemente 30 símbolos de 2 bits. Esto significa que se pueden procesar hasta 30 ciclos mediante un sistema de fluídica/formación de imágenes de cuatro colores. El número de errores que se pueden corregir es de 3, 4 o 5 por objetivo, lo que corresponde a tt = {3, 4 o 5} símbolos de paridad. Se requieren cuatro ciclos de formación de imágenes por ciclo de paridad. Esto da un total de 7 ciclos de datos para la ID y 12, 16 o 20 ciclos de formación de imágenes para la corrección de errores. Esto significa que el número total de ciclos necesarios para identificar 16,384 proteínas simultáneas es de 19, 23 y 27 ciclos para 3, 4 y 5 errores permisibles por molécula. Como se calculó previamente, la rata máxima de error del sistema de 4.1 * 10-5 permite un error por proteína. Si se permiten más errores por proteína, la rata máxima de error del sistema puede disminuir proporcionalmente.
La FIG. 24 muestra las figuras de la rata de error bruto frente a la rata de error del sistema. Para 19 ciclos de formación de imágenes, la rata de error bruto máxima permisible es del 3 %, para 23 ciclos, la rata de error bruto máxima permisible es del 6 % y para 27 ciclos, la rata de error bruto máxima permisible es del 13 %. Se espera que la rata de error bruto sea inferior al 5 %, aunque para todas las proteínas excepto las más raras, las ratas de error bruto de hasta el 20 % parecen estar bien dentro del rango aceptable de esta tecnología.
Dado que el número máximo de ciclos permisible es de 30 ciclos, se podrían incluir más ciclos de datos. En particular, si se incluyeran tres ciclos de datos más, la cantidad de objetivos identificables aumentaría en 4 A 3, o 64 veces, lo que daría como resultado un máximo de objetivos identificables posibles de 1,048,576, un número superior al que permitirán las concentraciones de sonda realistas. Sin embargo, esto ilustra que la técnica es escalable a un número arbitrariamente grande de moléculas, limitado solo por la biología.
Resumen
Algunas partes de esta descripción describen las realizaciones de la invención en términos de algoritmos y representaciones simbólicas de operaciones sobre información. Estas descripciones y representaciones algorítmicas son comúnmente utilizadas por los expertos en las técnicas de procesamiento de datos para transmitir la esencia de su trabajo de manera efectiva a otros expertos en la materia. Estas operaciones, si bien se describen funcional, computacional o lógicamente, se entiende que se implementan mediante programas de ordenador o circuitos eléctricos equivalentes, microcódigo o similares. Además, también ha resultado conveniente, en ocasiones, referirse a estos arreglos de operaciones como módulos, sin pérdida de generalidad. Las operaciones descritas y sus módulos asociados pueden incorporarse en software, firmware, hardware o cualquier combinación de los mismos.
Cualquiera de los pasos, operaciones o procesos descritos en este documento se puede realizar o implementar con uno o más módulos de hardware o software, solos o en combinación con otros dispositivos. En una realización, un módulo de software se implementa con un producto de programa de ordenador que comprende un medio legible por ordenador que contiene un código de programa de ordenador, que puede ser ejecutado por un procesador de ordenador para realizar cualquiera o todos los pasos, operaciones o procesos descritos.
Las realizaciones de la invención también pueden referirse a un aparato para realizar las operaciones de este documento. Este aparato puede construirse especialmente para los fines requeridos, y/o puede comprender un dispositivo informático de uso general activado o reconfigurado selectivamente por un programa informático almacenado en el ordenador. Tal programa de ordenador puede almacenarse en un medio de almacenamiento legible por ordenador, tangible y no transitorio, o cualquier tipo de medio adecuado para almacenar instrucciones electrónicas, que puede estar acoplado a un bus de sistema de ordenador. Además, cualquier sistema informático al que se haga referencia en la especificación puede incluir un solo procesador o puede ser una arquitectura que emplee diseños de múltiples procesadores, para aumentar la capacidad informática.
Las realizaciones de la invención también pueden referirse a un producto que se produce mediante un proceso informático descrito en este documento. Dicho producto puede comprender información resultante de un proceso informático, donde la información se almacena en un medio de almacenamiento legible por ordenador, tangible y no transitorio, y puede incluir cualquier realización de un producto de programa de ordenador u otra combinación de datos descrita en este documento.

Claims (14)

REIVINDICACIONES
1. Un método para detectar una pluralidad de analitos en una muestra biológica, en donde cada analito objetivo distinto, de N analitos objetivo distintos, se inmoviliza sobre un sustrato sólido en una ubicación que está espacialmente separada de cualquier otro analito objetivo distinto, de los N analitos objetivo distintos, comprendiendo el método: seleccionar conjuntos de sondas etiquetadas con fluorescencia, que comprenden X colores distintos, en donde cada una de dichas sondas está marcada de manera detectable, de tal manera que una sonda está configurada para detectar un analito objetivo distinto;
realizar al menos M ciclos de detección de molécula individual, comprendiendo cada ciclo uno o más pasos; en donde cada paso comprende la unión selectiva entre las sondas y distintos analitos objetivo y detección de señales; en donde cada ciclo comprende además la eliminación de las sondas del sustrato;
detectar, a partir de cada uno de dichos al menos M ciclos, la presencia o ausencia de una pluralidad de señales desde dichas ubicaciones espacialmente separadas de dicho sustrato; y
determinar, a partir de dicha pluralidad de señales, información sobre la presencia o ausencia de uno o más de dichos X colores para cada uno de los N analitos objetivo distintos, en cada uno de los pasos del ciclo;
y codificar dicha información en al menos K bits de información, usando un código de corrección de errores, combinando dichos K bits de información en L = K x M bits de información total de modo que L bits de información describan la presencia o ausencia de uno o más de dichos N analitos objetivo distintos;
en donde K, M y X se eligen de modo que XM>N, L> Log2 (N); y
en donde dichos M ciclos comprenden uno o más ciclos adicionales para tener en cuenta los errores en las señales detectadas, generando bits de información adicionales en comparación con el número mínimo de bits de información necesarios para identificar dichos N analitos distintos.
2. El método de la reivindicación 1, en donde se genera una señal detectable a través de la unión de la sonda individual al analito objetivo distinto individual.
3. El método de la reivindicación 1, que comprende además digitalizar dicha pluralidad de señales, para expandir un rango dinámico de detección de dicha pluralidad de señales.
4. El método de la reivindicación 1, en donde dichos al menos K bits de información comprenden información sobre la ausencia de una señal para uno de dichos N analitos objetivo distintos.
5. El método de la reivindicación 1, en donde dicha sonda comprende un aptámero.
6. El método de la reivindicación 5, en donde dicho aptámero comprende una región base homopolimérica.
7. El método de la reivindicación 1, en donde dicha pluralidad de analitos comprende una proteína, un aptámero peptídico, o una molécula de ácido nucleico, o
en donde dicha detección de dichos al menos M ciclos de una presencia o una ausencia de una pluralidad de señales comprende detectar ópticamente dicha pluralidad de señales, o
en donde dicha detección, a partir de dichos al menos M ciclos, de una presencia o una ausencia de una pluralidad de señales, comprende detectar eléctricamente dicha pluralidad de señales.
8. El método de la reivindicación 1, en donde los bits adicionales de información generados para dar cuenta de los errores, son bits de paridad.
9. El método de la reivindicación 1, en donde dicho algoritmo de corrección de errores comprende el uso de un código Reed-Solomon.
10. El método de la reivindicación 1, en donde dichos N analitos objetivo distintos están presentes en una muestra, y en donde la muestra se divide en una pluralidad de alícuotas que se diluyen a una pluralidad de diluciones finales distintas, estando inmovilizada cada una de dicha pluralidad de alícuotas en una sección distinta del sustrato.
11. El método de la reivindicación 10, en donde una concentración de uno de los N analitos objetivo distintos se determina contando las apariciones del analito objetivo dentro de una de las secciones distintas y ajustando el recuento de acuerdo con la dilución de la alícuota respectiva.
12. Un kit para detectar una pluralidad de analitos utilizando la detección de molécula individual, que comprende: conjuntos de sondas etiquetadas con fluorescencia que comprenden X colores distintos, en donde cada una de dichas sondas está marcada de manera detectable, de manera que una sonda está configurada para detectar un analito objetivo distinto; y un soporte de datos que almacena un programa para llevar a cabo el método de la reivindicación 1.
13. El kit de la reivindicación 12, en donde se genera una señal detectable a través de la unión de la sonda individual al analito objetivo distinto individual.
14. El método de la reivindicación 1 o el kit de la reivindicación 12, en donde dichas una o más sondas comprenden un anticuerpo.
ES13855452T 2012-11-19 2013-11-19 Análisis digital de analitos moleculares mediante detección de molécula única Active ES2905265T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261728067P 2012-11-19 2012-11-19
US201361869020P 2013-08-22 2013-08-22
PCT/US2013/070797 WO2014078855A1 (en) 2012-11-19 2013-11-19 Digital analysis of molecular analytes using single molecule detection

Publications (1)

Publication Number Publication Date
ES2905265T3 true ES2905265T3 (es) 2022-04-07

Family

ID=50731772

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13855452T Active ES2905265T3 (es) 2012-11-19 2013-11-19 Análisis digital de analitos moleculares mediante detección de molécula única

Country Status (13)

Country Link
US (4) US20150330974A1 (es)
EP (2) EP4012716A1 (es)
JP (1) JP6395718B2 (es)
KR (1) KR102061257B1 (es)
CN (1) CN105264532B (es)
AU (1) AU2013344340B2 (es)
CA (1) CA2891939C (es)
DK (1) DK2920725T3 (es)
ES (1) ES2905265T3 (es)
HU (1) HUE058723T2 (es)
MX (2) MX2015006219A (es)
RU (1) RU2670133C2 (es)
WO (1) WO2014078855A1 (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2015006219A (es) 2012-11-19 2015-11-13 Apton Biosystems Inc Analisis digital de analitos moleculares usando deteccion de molecula individual.
US10829816B2 (en) 2012-11-19 2020-11-10 Apton Biosystems, Inc. Methods of analyte detection
US10378053B2 (en) 2017-03-17 2019-08-13 Apton Biosystems, Inc. Sequencing and high resolution imaging
CN105637126B (zh) 2013-08-22 2022-09-23 雅普顿生物***公司 使用电方法的分子分析物的数字分析
US10872679B2 (en) 2014-07-17 2020-12-22 California Institute Of Technology Multiplex analysis of molecules in single cells by image correlation
US20170141793A1 (en) * 2015-11-13 2017-05-18 Microsoft Technology Licensing, Llc Error correction for nucleotide data stores
JP2020514746A (ja) 2016-12-01 2020-05-21 ノーティラス バイオテクノロジー インコーポレイテッド タンパク質をアッセイする方法
US20200140933A1 (en) * 2017-03-23 2020-05-07 Apton Biosystems, Inc. Polymorphism detection with increased accuracy
CN110546482B (zh) 2017-03-31 2023-08-15 蒂艾克斯科弗有限公司 红外光谱学***
CN111566261A (zh) 2017-08-18 2020-08-21 诺迪勒思生物科技公司 选择结合试剂的方法
US11721412B2 (en) 2017-10-23 2023-08-08 Nautilus Subsidiary, Inc. Methods for identifying a protein in a sample of unknown proteins
EP4372383A2 (en) * 2017-10-23 2024-05-22 Nautilus Subsidiary, Inc. Methods and systems for protein identification
MX2020006803A (es) 2017-12-29 2020-10-28 Nautilus Biotechnology Inc Estrategias de descodificacion para identificacion de proteinas.
WO2019148001A1 (en) * 2018-01-25 2019-08-01 Apton Biosystems, Inc. Methods and composition for high throughput single molecule protein detection systems
AU2019247841B2 (en) 2018-04-04 2023-02-09 Nautilus Subsidiary, Inc. Methods of generating nanoarrays and microarrays
JP2022501026A (ja) * 2018-09-19 2022-01-06 アプトン バイオシステムズ インコーポレイテッド 高密度に詰め込まれた分析物の層および検出方法
WO2020106889A1 (en) 2018-11-20 2020-05-28 Nautilus Biotechnology, Inc. Design and selection of affinity reagents
GB2603051B (en) 2020-01-30 2023-04-26 Prognomiq Inc Lung biomarkers and methods of use thereof
EP4244382A1 (en) 2020-11-11 2023-09-20 Nautilus Subsidiary, Inc. Affinity reagents having enhanced binding and detection characteristics
US12007397B2 (en) 2021-09-13 2024-06-11 PrognomIQ, Inc. Enhanced detection and quantitation of biomolecules
WO2023243922A1 (ko) * 2022-06-15 2023-12-21 주식회사 씨젠 기술 문서를 생성하는 방법 및 장치

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5302509A (en) 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
DE4497968T1 (de) 1993-10-20 1996-12-05 Cambridge Imaging Ltd Abbildungsverfahren und Abbildungseinrichtung
US7569341B2 (en) 1994-01-31 2009-08-04 Trustees Of Boston University Nucleic acid directed immobilization arrays and methods of assembly
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US6214987B1 (en) 1994-09-02 2001-04-10 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent formation of phosphodiester bonds using protected nucleotides
US6232465B1 (en) 1994-09-02 2001-05-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US6654505B2 (en) 1994-10-13 2003-11-25 Lynx Therapeutics, Inc. System and apparatus for sequential processing of analytes
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
US5853993A (en) * 1996-10-21 1998-12-29 Hewlett-Packard Company Signal enhancement method and kit
US7060431B2 (en) * 1998-06-24 2006-06-13 Illumina, Inc. Method of making and decoding of array sensors with microspheres
CA2342767C (en) * 1998-09-03 2009-11-03 Trellis Bioinformatics, Inc. Multihued labels
AU3372800A (en) 1999-02-23 2000-09-14 Caliper Technologies Corporation Manipulation of microparticles in microfluidic systems
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6376191B1 (en) 2000-03-22 2002-04-23 Mergen, Ltd. Microarray-based analysis of polynucleotide sequence variations
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
KR100917731B1 (ko) 2001-05-11 2009-09-15 파나소닉 주식회사 생체분자 기판 및 그것을 이용한 검사 및 진단의 방법 및장치
US6636623B2 (en) * 2001-08-10 2003-10-21 Visiongate, Inc. Optical projection imaging system and method for automatically detecting cells with molecular marker compartmentalization associated with malignancy and disease
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
WO2004061446A1 (en) 2002-12-18 2004-07-22 Aclara Biosciences, Inc. Single cell analysis of membrane molecules
CN101410530B (zh) 2003-04-18 2013-03-27 贝克顿·迪金森公司 免疫-扩增
US20050250094A1 (en) 2003-05-30 2005-11-10 Nanosphere, Inc. Method for detecting analytes based on evanescent illumination and scatter-based detection of nanoparticle probe complexes
CN1584592A (zh) * 2003-08-22 2005-02-23 中国科学院上海原子核研究所 免疫微阵列蛋白质芯片
US20050049796A1 (en) * 2003-09-03 2005-03-03 Webb Peter G. Methods for encoding non-biological information on microarrays
US20050153320A1 (en) 2003-11-06 2005-07-14 Herron James N. Single base extension
WO2006014392A1 (en) 2004-07-02 2006-02-09 The General Hospital Corporation Endoscopic imaging probe comprising dual clad fibre
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
DK2620510T4 (da) 2005-06-15 2020-03-30 Complete Genomics Inc Enkeltmolekyle-arrays til genetisk og kemisk analyse
US20090081688A1 (en) 2005-06-20 2009-03-26 Advanced Cell Diagnostics Methods of detecting nucleic acids in individual cells and of identifying rare cells from large heterogeneous cell populations
US20070121196A1 (en) 2005-09-29 2007-05-31 The General Hospital Corporation Method and apparatus for method for viewing and analyzing of one or more biological samples with progressively increasing resolutions
US7960104B2 (en) 2005-10-07 2011-06-14 Callida Genomics, Inc. Self-assembled single molecule arrays and uses thereof
ES2961309T3 (es) 2006-02-22 2024-03-11 Dexcom Inc Sensor de analito
WO2008033167A2 (en) 2006-03-28 2008-03-20 Inanovate, Inc. Nano-particle biochip substrates
US20090317810A1 (en) 2006-04-17 2009-12-24 Epigenomics Ag Methods and nucleic acids for the detection of colorectal cell proliferative disorders
US7839507B2 (en) 2006-06-28 2010-11-23 Applied Biosystems, Llc Minimizing effects of dye crosstalk
US7838302B2 (en) 2006-08-07 2010-11-23 President And Fellows Of Harvard College Sub-diffraction limit image resolution and other imaging techniques
WO2008076406A2 (en) 2006-12-14 2008-06-26 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
CA2676570C (en) 2007-01-26 2016-05-03 Illumina, Inc. Nucleic acid sequencing system and method
EP2251435B1 (en) 2007-03-02 2013-10-16 DNA Electronics Ltd Sensing apparatus for monitoring nucleic acid amplification, using an ion-sensitive field effect transistor (ISFET) for pH sensing
US7769548B2 (en) 2007-05-10 2010-08-03 Illumina, Inc. Microarray analytical data stitching system and method
US9551026B2 (en) 2007-12-03 2017-01-24 Complete Genomincs, Inc. Method for nucleic acid detection using voltage enhancement
WO2009097626A2 (en) 2008-02-03 2009-08-06 Helicos Biosciences Corporation Paired-end reads in sequencing by synthesis
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9524369B2 (en) 2009-06-15 2016-12-20 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
CN102858995B (zh) 2009-09-10 2016-10-26 森特瑞隆技术控股公司 靶向测序方法
US8900850B2 (en) 2009-09-17 2014-12-02 Michael J. Lane Lateral flow based methods and assays for rapid and inexpensive diagnostic tests
US8914312B2 (en) 2009-09-24 2014-12-16 Commonwealth Scientific And Industrial Research Organisation Method of contaminant prediction
CA2775613C (en) 2009-10-13 2018-06-12 Nanostring Technologies, Inc. Protein detection via nanoreporters
US8965076B2 (en) 2010-01-13 2015-02-24 Illumina, Inc. Data processing system and methods
US8774494B2 (en) 2010-04-30 2014-07-08 Complete Genomics, Inc. Method and system for accurate alignment and registration of array for DNA sequencing
CN101865843B (zh) * 2010-05-04 2012-05-23 中国科学院深圳先进技术研究院 多组分生物标识物的检测方法
US8465922B2 (en) 2010-08-26 2013-06-18 Pacific Biosciences Of California, Inc. Methods and systems for monitoring reactions
US9671344B2 (en) 2010-08-31 2017-06-06 Complete Genomics, Inc. High-density biochemical array chips with asynchronous tracks for alignment correction by moiré averaging
US8175452B1 (en) 2010-10-26 2012-05-08 Complete Genomics, Inc. Method and system for imaging high density biochemical arrays with sub-pixel alignment
CA2833165A1 (en) 2011-04-14 2012-10-18 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
GB201108678D0 (en) 2011-05-24 2011-07-06 Olink Ab Multiplexed proximity ligation assay
US9001231B2 (en) 2011-06-03 2015-04-07 Rambus Inc. Image acquisition using oversampled one-bit poisson statistics
AU2012272161B2 (en) 2011-06-21 2015-12-24 Illumina Cambridge Limited Methods and systems for data analysis
US20130265459A1 (en) 2011-06-28 2013-10-10 Pelican Imaging Corporation Optical arrangements for use with an array camera
US10704164B2 (en) 2011-08-31 2020-07-07 Life Technologies Corporation Methods, systems, computer readable media, and kits for sample identification
WO2014015269A1 (en) 2012-07-19 2014-01-23 Ariosa Diagnostics, Inc. Multiplexed sequential ligation-based detection of genetic variants
US10829816B2 (en) 2012-11-19 2020-11-10 Apton Biosystems, Inc. Methods of analyte detection
US10378053B2 (en) 2017-03-17 2019-08-13 Apton Biosystems, Inc. Sequencing and high resolution imaging
MX2015006219A (es) * 2012-11-19 2015-11-13 Apton Biosystems Inc Analisis digital de analitos moleculares usando deteccion de molecula individual.
JP2014164004A (ja) 2013-02-22 2014-09-08 Hitachi High-Technologies Corp 蛍光顕微鏡
US9193998B2 (en) 2013-03-15 2015-11-24 Illumina, Inc. Super resolution imaging
US9708658B2 (en) 2013-03-19 2017-07-18 New England Biolabs, Inc. Enrichment of target sequences
KR20220029760A (ko) 2013-04-30 2022-03-08 캘리포니아 인스티튜트 오브 테크놀로지 순차적 하이브리드화 바코딩에 의한 분자의 멀티플렉스 표지화
US10510435B2 (en) 2013-04-30 2019-12-17 California Institute Of Technology Error correction of multiplex imaging analysis by sequential hybridization
CN105637126B (zh) 2013-08-22 2022-09-23 雅普顿生物***公司 使用电方法的分子分析物的数字分析
EP3175023A4 (en) 2014-07-30 2018-03-07 President and Fellows of Harvard College Systems and methods for determining nucleic acids
CN104372093B (zh) 2014-11-10 2016-09-21 博奥生物集团有限公司 一种基于高通量测序的snp检测方法
CN107735497B (zh) 2015-02-18 2021-08-20 卓异生物公司 用于单分子检测的测定及其应用
CN107532205B (zh) 2015-03-31 2021-06-08 伊卢米纳剑桥有限公司 模板的表面连环化
EP3370667A1 (en) 2015-11-04 2018-09-12 The Procter and Gamble Company Thin and flexible absorbent articles
US11098304B2 (en) 2015-11-04 2021-08-24 Atreca, Inc. Combinatorial sets of nucleic acid barcodes for analysis of nucleic acids associated with single cells
CN108495938B (zh) 2016-01-12 2023-07-14 生物辐射实验室股份有限公司 利用相位移区块合成条码化序列及其用途
WO2017161251A1 (en) 2016-03-17 2017-09-21 President And Fellows Of Harvard College Methods for detecting and identifying genomic nucleic acids
US11512344B2 (en) 2016-05-10 2022-11-29 Arizona Board Of Regents On Behalf Of Arizona State University Consecutive hybridization for multiplexed analysis of biological samples
US20190284552A1 (en) 2016-05-26 2019-09-19 Singular Bio, Inc. Arrays for Single Molecule Detection and Uses Thereof
WO2017223041A1 (en) 2016-06-21 2017-12-28 Illumina, Inc. Super-resolution microscopy
GB201701296D0 (en) 2017-01-26 2017-03-15 Univ College Cork - Nat Univ Of Ireland Smart coded access optical sensor
JP7144457B2 (ja) 2017-03-03 2022-09-29 アプトン バイオシステムズ インコーポレイテッド 加速度追跡による高速走査システム
US20200140933A1 (en) 2017-03-23 2020-05-07 Apton Biosystems, Inc. Polymorphism detection with increased accuracy
US20200217850A1 (en) 2017-09-15 2020-07-09 Apton Biosystems, Inc. Heterogeneous single cell profiling using molecular barcoding
CA3067144C (en) 2018-03-09 2023-09-05 Illumina Cambridge Limited Generalized stochastic super-resolution sequencing

Also Published As

Publication number Publication date
HUE058723T2 (hu) 2022-09-28
EP2920725B1 (en) 2021-11-10
JP6395718B2 (ja) 2018-09-26
DK2920725T3 (da) 2022-02-07
CN105264532B (zh) 2019-02-26
US20150330974A1 (en) 2015-11-19
EP4012716A1 (en) 2022-06-15
JP2016502079A (ja) 2016-01-21
AU2013344340A1 (en) 2015-07-02
CA2891939A1 (en) 2014-05-22
EP2920725A1 (en) 2015-09-23
US11650202B2 (en) 2023-05-16
KR102061257B1 (ko) 2019-12-31
AU2013344340B2 (en) 2019-09-19
EP2920725A4 (en) 2016-08-31
MX2022002931A (es) 2022-04-06
US20240069012A1 (en) 2024-02-29
CA2891939C (en) 2020-10-27
CN105264532A (zh) 2016-01-20
MX2015006219A (es) 2015-11-13
US20210072233A1 (en) 2021-03-11
US20220214335A1 (en) 2022-07-07
RU2670133C2 (ru) 2018-10-18
WO2014078855A1 (en) 2014-05-22
KR20150095691A (ko) 2015-08-21
RU2015123570A (ru) 2017-01-10

Similar Documents

Publication Publication Date Title
ES2905265T3 (es) Análisis digital de analitos moleculares mediante detección de molécula única
US10829816B2 (en) Methods of analyte detection
US20240003892A1 (en) Heterogeneous single cell profiling using molecular barcoding
JP7295092B2 (ja) 結合試薬を選択する方法
ES2901952T3 (es) Métodos de ensayo mejorados
Lakshmipriya et al. Generation of anti-influenza aptamers using the systematic evolution of ligands by exponential enrichment for sensing applications
AU2024202653A1 (en) Decoding approaches for protein identification
US11435356B2 (en) Digital analysis of molecular analytes using electrical methods
Tessler Digital protein analysis: Technologies for protein diagnostics and proteomics through single-molecule detection
Petersson et al. Miniaturization of multiplexed planar recombinant antibody arrays for serum protein profiling
Gu Selection and Binding Validation of Aptamers against Nucleocapsid Protein of SARS-COV-2 Using Capillary Electrophoresis
Boulgakov Two technologies for single-molecule proteomics, three technologies for image analysis