ES2632538T3 - Métodos para el estudio y análisis genético de poblaciones - Google Patents

Métodos para el estudio y análisis genético de poblaciones Download PDF

Info

Publication number
ES2632538T3
ES2632538T3 ES10012384.3T ES10012384T ES2632538T3 ES 2632538 T3 ES2632538 T3 ES 2632538T3 ES 10012384 T ES10012384 T ES 10012384T ES 2632538 T3 ES2632538 T3 ES 2632538T3
Authority
ES
Spain
Prior art keywords
sample
rrna
marker
markers
microbial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES10012384.3T
Other languages
English (en)
Inventor
Matthew Ashby
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taxon Biosciences Inc
Original Assignee
Taxon Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taxon Biosciences Inc filed Critical Taxon Biosciences Inc
Application granted granted Critical
Publication of ES2632538T3 publication Critical patent/ES2632538T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/21Hydrocarbon

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

1. Un método para la construcción de una base de datos de perfiles de diversidad de marcadores (PDM) que comprende las etapas de: a) secuenciar una pluralidad de marcadores de ARNr de una muestra, en el que dicha muestra comprende una población microbiana, y en el que cada marcador de ARNr comprende una secuencia polimórfica del gen del ARNr microbiano y en el que la pluralidad de marcadores de ARNr proporciona una representación exacta de la población microbiana de dicha muestra; b) determinar la abundancia, en dicha muestra, de cada una de dicha pluralidad de marcadores de ARNr; c) transducir la abundancia de cada marcador de ARNr en una señal de salida eléctrica; d) almacenar dichas señales de salida eléctrica producidas en la etapa c) en una estructura de datos matricial y asociar, en dicha estructura, cada señal de salida con la secuencia correspondiente del marcador de ARNr cuya abundancia se convirtió en una señal de salida; e) proporcionar las abundancias de uno o más parámetros de muestra que están asociados a dicha muestra; f) transducir las abundancias de cada parámetro de muestra en una señal de salida eléctrica; g) almacenar dichas señales de salida eléctrica producidas en la etapa f) en una estructura de datos matricial y asociar en dicha estructura cada señal de salida con el parámetro de muestra cuya abundancia se convirtió en una señal de salida; h) diseñar como PDM las señales de salida eléctrica producidas en la etapa c) correspondientes a la pluralidad de abundancias de marcadores de ARNr y las señales de salida eléctrica producidas en la etapa f) correspondientes a la una o más abundancias de parámetros de muestra; y i) repetir las etapas a-h para una pluralidad de muestras distintas, y diseñar, como base de datos PDM, la pluralidad de PDM almacenados en dicha estructura de datos.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Metodos para el estudio y analisis genetico de poblaciones Campo tecnico de la invencion
La presente invencion se refiere a metodos para realizar estudios de la diversidad genetica de una poblacion. La invencion tambien se refiere a metodos para realizar analisis geneticos de una poblacion. Adicionalmente, la invencion se refiere a metodos para la creacion de bases de datos que comprenden la informacion del estudio y las bases de datos creadas por estos metodos. La invencion tambien se refiere a metodos para analizar la informacion para correlacionar la presencia de marcadores de acido nucleico con parametros deseados en una muestra. Estos metodos se aplican en los campos de exploracion geoqufmica, agricultura, biorremediacion, analisis ambiental, microbiologfa clfnica, ciencia forense y medicina.
Antecedentes de la invencion
Anteriormente los microbios se han utilizado como biosensores para identificar productos qufmicos en el ambiente. Por ejemplo, los microbios se han utilizado como biosensores para detectar la presencia de nitratros (Larsen, L. H. et al, 1997, A microscale NO3 biosensor for environmental applications. Anal. Chem. 69: 3527-3531), metales (Virta M. et al, 1998, Bioluminescence- based metal detectors. Methods Mol. Biol. 102: 219-229) y de diversos hidrocarburos (Sticher P. et al., 1997, Development and characterization of a whole-cell bioluminescent sensor for bioavailable middle-chain alkanes in contaminated groundwater samples. Appl. Environ. Microbial. 63(10): 4053-4060). Sin embargo, en estos ejemplos, los microbios indicadores no son especies naturales, sino mas bien el producto de manipulaciones recombinantes disenadas para aplicaciones especfficas. Estas modificaciones implican el acoplamiento de la maquinaria detectora de nutrientes de cepas bacterianas bien caracterizadas con genes indicadores para ayudar a la identificacion. Sin embargo, esta estrategia esta limitada por la diversidad metabolica de algunas cepas bacterianas bien caracterizadas. En cambio, el gran y diverso grupo de microbios en el medio representa una fuente de biosensores para una serie mas grande de aplicaciones que las actualmente existentes. Por tanto, hay una necesidad de identificar y utilizar otros microbios, especialmente los encontrados in situ, como biosensores.
Los microbios tambien tienen un importante impacto sobre la salud y la medicina. Se han realizado estimaciones de que puede haber diez veces el numero de celulas microbianas asociadas con el cuerpo humano en comparacion con las celulas humanas. Muchas poblaciones de celulas microbianas que estan asociadas al cuerpo humano desempenan una funcion beneficiosa en el mantenimiento de la salud. Por ejemplo, la microflora intestinal es importante para realizar una digestion y absorcion de nutrientes adecuadas y para la produccion de determinados factores, incluyendo algunas vitaminas. En general, el sistema inmunitario humano puede mantener el control de las poblaciones bacterianas del cuerpo humano y prevenir el crecimiento excesivo de poblaciones microbianas beneficiosas e infeccion por poblaciones microbianas perjudiciales. No obstante, la lista de enfermedades humanas que actualmente se atribuye a patogenos microbianos esta aumentando. Sin embargo, casi toda la informacion con respecto a las relaciones ente los microbios y las enfermedades humanas, se ha incrementado a partir de estrategias que requieren el cultivo de especies microbianas.
Dos ejemplos de enfermedades en las que se identificaron agentes causantes a traves de metodos moleculares incluyen, la angiomatosis bacilar (Relman, D. A. et al., 1990, New Engl. J. Med. 323: 1573) y la enfermedad de Whipple (Wilson, K. H. et al., 1991, Lancet 338: 474). Ademas, los aspectos centrales de la ateroesclerosis son coherentes con la inflamacion que se produce debido a infeccion. Se han identificado secuencias de ADN de Chlamydia en lesiones ateroescleroticas, lo cual ha llevado a sugerir que este organismo desempena una funcion en la enfermedad.
Ademas, con la llegada de cepas de bacterias resistentes a bacterias, las infecciones bacterianas se han convertido en un problema para la salud. Ademas, las infecciones microbianas causadas por bacterias u hongos que normalmente no infectan a seres humanos, pueden ser un problema en individuos inmunocomprometidos. Adicionalmente, los individuos de pafses en vfas de desarrollo que pueden estar mal nutridos o que carecen de instalaciones sanitarias adecuadas, tambien pueden soportar una gran carga de bacterias oportunistas, muchas de las cuales pueden causar afecciones y enfermedades. En la medicina veterinaria, el ganado que vive en dependencias cercanas tambien puede ser presa de infecciones causadas por diversos tipos de microbios diferentes. Por tanto, hay una necesidad de desarrollar metodos de identificacion sensibles de muchos tipos de microbios diferentes sin tener que cultivarlos primero para tratar o prevenir infecciones microbianas en seres humanos y otros animales.
Tambien son un componente importante los ensayos de contaminacion microbiana para analizar productos alimentarios. Una gran cantidad de tipos de microbios diferentes puede contaminar los alimentos de seres humanos o animales. Por tanto, la capacidad de analizar la contaminacion de los alimentos de una manera rapida y eficaz es crftica para conservar seguros los alimentos. Sin embargo, muchos de los microbios responsables, causantes de afecciones en seres humanos y animales, son diffciles de aislar o identificar.
5
10
15
20
25
30
35
40
45
50
55
60
65
Tambien se utilizan ensayos de poblaciones microbianas en campos tales como ciencia forense. En los ultimos diez a veinte anos, los cientfficos han determinado que las poblaciones microbianas cambian cuando el organismo empieza a descomponerse, y han comenzado a identificar determinadas especies microbianas que son indicativas de descomposicion (Lawrence Osborne, Crime-Scene Forensics; Dead Men Talking, New York Times, 3 de diciembre de 2000). Sin embargo, solo se han identificado algunas especies microbianas que pueden ser utiles en estos analisis.
El problema de determinar la diversidad genetica no esta limitado a las poblaciones microbianas. La diversidad de los anticuerpos es crftica para una respuesta inmunitaria apropiada. Durante la proliferacion de celulas B, se genera diversidad de anticuerpos en las cadenas pesada y ligera de la inmunoglobulina por mecanismos que incluyen genes variables (V) de lfnea germinal multiple, recombinacion de segmentos genicos V con segmentos genicos de union (J) (recombinacion V-J) y recombinacion de segmentos genicos V con segmentos genicos D y segmentos genicos J (recombinacion V-D-J) asf como imprecisiones recombinatorias. Ademas, mutaciones puntuales somaticas que se producen durante toda la vida del individuo, tambien conducen a la diversidad de anticuerpos. Por tanto, puede generarse un enorme numero de genes de anticuerpos diferentes que codifican anticuerpos con especificidad exquisita. La diversidad de receptores de celulas T (RCT) se genera de una manera similar a traves de recombinacion entre numerosos segmentos V, D y J e imprecisiones recombinatorias. Se ha estimado que pueden constituirse 1014 cadenas V 6, mas de 1013 cadenas p y mas de 1012 formas de cadenas Va (Roitt, I. et al., Immunology, 3a Ed., 1993, paginas 5.1 - 5.14). Un conocimiento de la diversidad de los anticuerpos o de los TCR en un individuo particular serfa util para el diagnostico de enfermedades, tal como una enfermedad autoinmunitaria, o para un posible tratamiento.
La identificacion de microbios, especialmente microbios del suelo, se ha basado tradicionalmente en metodos dependientes de cultivo, por lo cual la deteccion de una especie microbiana depende de la capacidad de encontrar condiciones de laboratorio que sustenten su crecimiento. Para esto, en el comercio se han desarrollado placas de 96 pocillos, para identificar microbios con diferentes requisitos metabolicos. Por ejemplo, las placas BioLog incorporan 96 formulaciones de medios diferentes en los pocillos de una placa de 96 pocillos. A pesar de estos esfuerzos, actualmente se acepta que mucho menos del 1 % de los microbios puede propagarse en condiciones de laboratorio (Amann, R. I. et al., 1995. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59: 143-169).
El amplio interes en genomica ha creado mucha tecnologfa nueva, excitante, para la cuantificacion en paralelo de miles de secuencias distintas de acido nucleico de manera simultanea. Aunque aun en panales, estas tecnologfas han proporcionado un profundo conocimiento sin precedentes en la biologfa. Hasta ahora, estas tecnologfas se han utilizado predominantemente en aplicaciones farmaceuticas y agrfcolas. El perfil de expresion del genoma ha obtenido una aceptacion general en la biologfa y es posible que comience a ser habitual en todas las instituciones academicas, de biotecnologfa y farmaceuticas, en el siglo 21. Por ejemplo, el Analisis en Serie de la Expresion Genica (SAGE, Serial Analysis of Gene Expression) es un metodo independiente de la hibridacion disenado para cuantificar cambios en la expresion genica (Velculescu, V. E. et al., 1995, Serial analysis of gene expression. Science 270: 484-487 y patente de Estados Unidos 5.866.330). Sin embargo, el SAGE solo mide niveles de ARN de tejidos u organismos y no es adecuado para examinar la diversidad genetica.
El amplio interes en genomica tambien ha conducido al desarrollo de muchas tecnologfas para el analisis rapido de decenas de miles de secuencias de acido nucleico. Una tecnologfa de este tipo es la microplaca (chip) de ADN. Aunque esta estrategia se ha utilizado como un diagnostico para diferenciar entre varias especies del genero Mycobacterium (Troesch, A., et al., 1999, Mycobacterium species identification and rifampin resistance testing with high-density DNA probe arrays. J. Clin. Microbiol. 37: 49-55), tiene utilidad limitada para un estudio microbiano ambiental por dos razones. La primera de ellas es que la secuencia de los ADN diana a analizar debe conocerse para sintetizar las sondas complementarias en la microplaca. Sin embargo, la inmensa mayorfa de los microbios ambientales no se han caracterizado. En segundo lugar, las microplacas de ADN se basan en la hibridacion de acidos nucleicos que esta sometida a hibridacion cruzada a partir de moleculas de ADN con secuencia similar. Sin embargo, el poder resolutivo de una estrategia basada en hibridacion es limitado porque se deben identificar regiones de ADN que no se hibriden en cruzado, lo que puede ser diffcil para especies microbianas relacionadas.
Las tecnologfas genomicas y bioinformaticas soportan mucho potencial desaprovechado para su aplicacion en otras areas de biologfa, especialmente en el campo de la microbiologfa. Sin embargo, hasta ahora no ha habido ningun metodo para determinar de un modo rapido y facil la diversidad genomica de una poblacion, tal como una poblacion microbiana o de virus. Ademas, no ha habido ningun metodo para determinar facilmente la diversidad de anticuerpos o RCT de una poblacion de celulas B o T, respectivamente. Por tanto, aun persiste la necesidad de desarrollar dichos metodos en estas areas.
En “La caracterizacion de genes de ARNr 16S de comunidades microbianas de campos petrolfferos indica la presencia de diversas bacterias reductoras de sulfato, fermentativas y oxidadoras de sulfuro" de Gerrit Voordouw et al. se desvela la caracterizacion de bacterias de campos petrolfferos, clonando y secuenciando genes de ARNr 16S amplificados por PCR para detectar una bacteria determinada.
5
10
15
20
25
30
35
40
45
50
55
60
65
En Proyecto de bases de datos de ribosomas de Niels Larsen et al. se desvela una base de datos curada que ofrece datos de ribosomas junto con programas y servicios relacionados. La oferta incluye alineaciones filogeneticamente ordenadas de secuencias de ARN ribosomico (ARNr), arboles filogeneticos derivados, diagramas de estructura secundaria de ARNr y diversos paqueteas informaticos para manipular, analizar y presentar alineaciones y arboles.
En “ Determinacion de la diversidad microbiana en muestras ambientales: fallos de analisis de ARNr basados en PCR” de Friedrich v. Wintzingerode et al. se desvelan aspectos especfficos de conjuntos de muestras, lisis celular, extraccion de acido nucleico, amplificacion por PCR, separacion de ADN amplificado, aplicacion de sondas nucleicas y analisis de datos.
En “Filogenia de las principales secuencias bacterianas de ARNr 16S en suelos de pastizales de Drentse A (Paises Bajos” de Andreas Felske et al. se desvela la investigacion de principales bacterias en suelos de turba, de pastizales acidos en los Paises Bajos, por aislamiento de ribosomas, electroforesis en gel con gradiente de temperatura, hibridacion, clonacion y secuenciacion utilizando ARNr para clasificar y cuantificar las bacterias mas activas.
En “Frecuencia de formacion de moleculas quimericas como consecuencia de coamplificacion PCT de genes de ARNr 16S de genomas bacterianos mixtos” de Grace C. Y. Wang y Yue Wang se desvela un metodo para cuantificar la frecuencia de la formacion de moleculas quimericas, en el que los ADN genomicos mixtos de ocho especies de actinomiceto cuyas secuencias de ARNr 16S se han determinado se utilizaron para la coamplificacion por PCR de genes de ARNr 16S. Una gran cantidad de ADN ribosomico 16S clonado se examino por analisis de secuencias y se identificaron moleculas quimericas por alineamiento de secuencias multiples con especies de referencia.
En “Analisis en Serie de la Expresion Genica” de Victor E. Velculescu et al. se desvela un metodo denominado analisis en serie de la expresion genica (SAGE), que permite analizar, de un modo cuantitativo y simultaneo, una gran cantidad de transcritos. El SAGE podria proporcionar medios ampliamente aplicables para catalogar y comparar cuantitativamente genes expresados en una variedad de estados normales, de desarrollo y con enfermedad.
Breve sumario de la invencion
La presente invencion resuelve este problema proporcionando metodos para determinar rapidamente la diversidad de una poblacion microbiana.
La presente invencion tambien proporciona un metodo para construir una base de datos de perfiles de diversidad de marcadores (PDM marker diversity profile) que comprende las etapas de: a) secuenciar una pluralidad de marcadores de ARNr de una muestra, en el que dicha muestra comprende una poblacion microbiana, y en el que cada marcador de ARNr comprende una secuencia polimorfica del gen del ARNr microbiano y en el que la pluralidad de marcadores de ARNr proporciona una representacion exacta de la poblacion microbiana de dicha muestra; b) determinar la abundancia, en dicha muestra, de cada una de dicha pluralidad de marcadores de ARNr; c) transducir la abundancia de cada marcador de ARNr en una senal de salida electrica; d) almacenar dichas senales de salida electrica producidas en la etapa c) en una estructura de datos matricial y asociar en dicha estructura cada senal de salida con la secuencia correspondiente del marcador de ARNr cuya abundancia se convirtio en una senal de salida; e) proporcionar las abundancias de uno o mas parametros de muestra que estan asociados a dicha muestra; f) transducir las abundancias de cada parametro de muestra en una senal de salida electrica; g) almacenar dichas senales de salida electrica producidas en la etapa f) en una estructura de datos matricial y asociar en dicha estructura cada senal de salida con el parametro de muestra cuya abundancia se convirtio en una senal de salida; h) disenar como PDM las senales de salida electrica producidas en la etapa c) correspondientes a la pluralidad de abundancias de marcadores de ARNr y las senales de salida electrica producidas en la etapa f) correspondientes a la una o mas abundancias de parametros de muestra; y i) repetir las etapas a-h para una pluralidad de muestras distintas, y disenar como base de datos PDM la pluralidad de PDM almacenados en dicha estructura de datos.
En una realizacion, dicha abundancia de marcador de ARNr es una abundancia relativa a la abundancia total de la pluralidad de marcadores de ARNr en la muestra.
En una realizacion, dicho gen de ARNr microbiano es un gen de ARNr 16S.
En una realizacion, dicha secuencia polimorfica del gen de ARNr microbiano es de la region intergenica entre un gen de ARNr 16S y un gen de ARNr 23S.
En una realizacion, la muestra se selecciona del grupo constituido por : una muestra de suelo, una muestra de roca, una muestra de agua, una muestra de aire, una muestra de hidrocarburo, una muestra de petroleo y una muestra de biopelicula.
En una realizacion, la muestra se obtiene del grupo constituido por: petroleo, hidrocarburos, un deposito de aceite, un deposito de gas, suelo, roca, agua, aire, una construccion y una carretera. En una realizacion, el parametro de muestra se selecciona del grupo constituido por: petroleo, hidrocarburos, aceite, gas, un compuesto inorganico, un
5
10
15
20
25
30
35
40
45
50
55
60
65
mineral, pH, temperatura y salinidad.
En una realizacion, la muestra se obtiene del grupo constituido por: un ser humano, una planta, un animal, un producto alimentario, un cultivo celular y un cultivo tisular.
En una realizacion, el parametro de muestra se selecciona del grupo constituido por: una patologfa aguda, una patologfa cronica, un estado fisiologico y una fase de desarrollo.
En una realizacion, el parametro de muestra es el tiempo, y en el que la pluralidad de muestras comprende una evolucion temporal.
En una realizacion, la pluralidad de muestras comprende una evolucion temporal util para supervisar esfuerzos de remediacion ambiental o la produccion de campos petrolfferos.
En una realizacion, se construye una base de datos PDM de acuerdo con el metodo de una cualquiera de las reivindicaciones 1 a 10.
Breve descripcion de los dibujos
La Figura 1 muestra una representacion de un gen de ADNr 16S de bacterias que ilustra regiones polimorficas (mostradas como bandas oscuras) y regiones constantes (mostradas como bandas claras).
La Figura 2 muestra una representacion esquematica del metodo de analisis en serie de ADN ribosomico (SARD, Serial Analysis Ribosomal ADN) para aislar etiquetas de secuencia polimorficas de ADNr bacteriano.
La Figura 3 muestra diversos miembros representativos del dominio Bacteria con sus relaciones taxonomicas.
La Figura 4 muestra diversos miembros representativos del dominio Arquea con sus relaciones taxonomicas.
La Figura 5 muestra ejemplos de dispersogramas de correlacion entre marcadores. Cada punto representa una sola poblacion de muestra.
La Figura 6 muestra ejemplos de diversos dispersogramas entre parametros y marcadores. Cada punto representa una sola poblacion de muestra.
Las Figuras 7A, 7B y 7C muestran dispersogramas que comparan los perfiles del perfil de diversidad de marcadores (PDM). Cada punto representa un marcador. Fig. 7A: correlacion significativa con todos los marcadores dentro del PDM. Fig. 7B: no se encuentra correlacion utilizando todos los marcadores dentro del PDM. Fig. 7C: misma grafica que B excepto que se encuentra correlacion significativa utilizando un subconjunto de marcadores.
La Figura 8 muestra un esquema para la generacion de una base de datos matricial de perfiles de diversidad de marcadores. La primera etapa 100 implica asignar a N un valor entero de 1 que corresponde a la primera estructura de datos del PDM. La segunda etapa 105 implica agrupar marcadores polimorficos de una muestra. En la presente solicitud se describen ejemplos de metodos para agrupar dichos marcadores y se incluye, pero sin limitacion, SARD (Figura 2, Tablas I y II) o recopilacion masiva de etiquetas (Tabla III). La siguiente etapa 110 implica detectar los marcadores polimorficos. Los ejemplos de metodos para detectar marcadores polimorficos descritos anteriormente incluyen analisis de secuencia de ADN de etiquetas SARD y analisis MALDI-TOF de etiquetas masivo, respectivamente. Esta etapa de deteccion incluye detectar la presencia y la abundancia de cada marcador en la muestra. La siguiente etapa 115 implica la conversion o la transduccion de PDM en una salida de serial electrica. Generalmente, este proceso es una conversion electronica lineal de los datos en una serial digital. La etapa 120 implica detectar parametros que estan asociados a la muestra N. La etapa 125 implica la transduccion de los datos de los parametros de la muestra, que pueden incluir, sin limitacion, parametros tales como pH, tamano del grano, analisis elemental y/o analisis organico, en una salida de senal electrica en forma de una salida digital. La etapa 130 implica el almacenamiento, en la memoria de un ordenador, de la senal de salida de cada PDM en una estructura de datos matricial y asociarla con parametros de muestra. La siguiente etapa es un bloque de toma de decisiones 135 en el que si no se han completado todas las estructuras de los datos, la rutina avanza a la etapa 140 en la que N esta incrementado y las etapas 105-130 generadoras de estructuras de datos se repiten para el perfil de diversidad del marcador n +1.
Una vez completadas todas las estructuras de los datos, la rutina avanza a la etapa 145 para formar la base de datos PDM de estructuras de n datos. Cada marcador se asigna un unico identificador junto con su abundancia relativa en la poblacion. Esta informacion tambien esta opcionalmente indexada con otros parametros conocidos que estan asociados a la muestra que incluyen, por ejemplo, el tiempo, los datos, la altura y la localizacion geografica. Estas senales se digitalizan y se almacenan en la memoria de un ordenador.
La Figura 9 muestra un esquema de las etapas implicadas en la determinacion de parametros asociados con un PDM. Se crea un perfil de diversidad de marcadores 200 para una muestra. El perfil de diversidad de marcadores se somete a una funcion de comparacion 205 que compara el perfil con perfiles de diversidad de marcadores residentes en la base de datos. La etapa 210 es un bloque de toma de decisiones en el que se realiza una pregunta de si el nuevo perfil de diversidad de marcadores es igual a un perfil de diversidad de marcadores residente en la base de datos. Si la pregunta retorna a “Si” el nuevo perfil de diversidad de marcadores se deduce 215 que comparte los mismos parametros que los del perfil de diversidad de marcadores residente. Dado que los parametros asociados al perfil de diversidad de marcadores residente estan caracterizados, los parametros asociados al nuevo perfil de diversidad marcadores se identifican.
5
10
15
20
25
30
35
40
45
50
55
60
65
Si la pregunta en el bloque de toma de decisiones 210 retorna a “No” la rutina avanza al bloque de toma de decisiones 220 que pregunta si el nuevo perfil de diversidad de marcadores es un subconjunto de un perfil residente en la base de datos. Si la pregunta retorna a “No” los parametros permanecen indefinidos 225. Si la pregunta retorna a “Si” la rutina avanza a la etapa 230. La etapa 230 es una etapa opcional para determinar la correlacion entre miembros del subconjunto comun de marcadores y puede o bien realizarse para cada nuevo perfil o puede preguntarse a una tabla matricial de valores precalculados de perfiles existentes. Dichos valores generalmente se mantendrfan en una base de datos relacional. Si esta etapa no se realiza todos los marcadores comunes se analizan en grupos de marcadores individuales y se tratan como grupos correlacionados 255. Y la correlacion de marcadores se realiza entre los subconjuntos comunes de marcadores, la rutina avanza al bloque de toma de decisiones 235 que pregunta si todos los marcadores comunes estan correlacionados. Si la pregunta retorna a “Si” los marcadores estan correlacionados con los parametros 240 residentes en la base de datos. Si ningun marcador esta correlacionado con un parametro, el parametro o los parametros permanecen indefinidos 245 mientras que si los marcadores estan correlacionados con un parametro, el parametro se deduce que esta asociado con el perfil de diversidad de marcadores 250. Si la pregunta del bloque de toma de decisiones 235 retorna a “No”, los marcadores comunes se clasifican en grupos de marcadores correlacionados 255. El primer grupo marcador correlacionado N 260 se somete a un bloque de toma de decisiones 265 que pregunta si ente grupo los marcadores estan correlacionados con un parametro. Un “No” determina que los parametros permanecen indefinidos. Si el marcador o los marcadores estan correlacionados con un parametro, se deduce que el parametro esta asociado con el perfil de diversidad de marcadores. Las etapas 260-275 se repiten en las etapas 280-295 para para cada grupo de marcadores correlacionado. Los grupos de marcadores correlacionados pueden comprender un solo marcador o varios marcadores. El nivel de confianza en la deduccion de que un parametro esta asociado con un perfil de diversidad de marcadores se determina a traves del nivel de correlacion entre el marcador o marcadores y el parametro. Por lo tanto, se espera que los conjuntos de marcadores correlacionados sean indicadores mas fuertes que cualquier parametro determinado.
La Figura 10 muestra un esquema para la generacion de una base de datos matricial de perfil de diversidad de marcadores. La primera etapa 300 implica asignar a N un valor entero de 1 que corresponde a la primera estructura de datos PDM. La segunda etapa 305 implica agrupar marcadores polimorficos de una muestra. En la presente solicitud se describen ejemplos de metodos para agrupar dichos marcadores e incluyen, pero sin limitacion, SARD (Figura 2, Tablas I y II) o recopilacion masiva de etiquetas (Tabla III). La siguiente etapa 310 implica detectar los marcadores polimorficos. Los ejemplos de metodos para detectar marcadores polimorficos descritos anteriormente incluyen analisis de secuencia de ADN de etiquetas SARD y analisis MALDI-TOF de etiquetas masivo respectivamente. La siguiente etapa implica la conversion o transduccion del PDM en una salida de serial electrica. Generalmente, este proceso es una conversion electronica lineal de los datos en una serial digital. La etapa 320 implica almacenar en la memoria de un ordenador la serial de salida de cada PDM en una estructura de datos matricial asociando cada PDM a una coordenada geografica tal como longitud y latitud. La siguiente etapa es un bloque de toma decisiones 325 en el que si no se han completado todas las estructuras de datos, la rutina avanza a la etapa 330 en la que N se incrementa y las etapas 305-320 generadoras de estructuras de datos se repiten para el perfil de diversidad de marcadores n +1. Una vez que todas las estructuras de datos estan completadas, la rutina avanza a la etapa 335 para formar la base de datos PDM de N estructuras de datos. Cada marcador se asigna a un unico identificador y se indexa con su abundancia relativa en la poblacion. Estas senales se digitalizan y se almacenan en la memoria de un ordenador.
La Figura 11 muestra un esquema de mapas de aplicaciones utilizando perfiles de diversidad de marcadores. Los datos de los perfiles de diversidad de marcadores 400 pueden procesarse de diversas maneras para crear mapas que proporcionen informacion ambiental significativa. En un ejemplo 405, cada perfil de diversidad de marcadores en una base de datos, puede correlacionarse por pares con cada uno de los otros perfiles de diversidad de marcadores, para crear una matriz de correlacion. Anexando estos datos con las coordenadas geograficas de cada muestra 410, puede construirse un mapa que refleje los valores de correlacion de sitios de muestras ffsicamente adyacentes. Preferentemente los valores de correlacion se codificaran con colores que reflejen el nivel de correlacion. El color se selecciona de un espectro de color de referencia que esta indexado con valores de correlacion entre 0-1.
Los perfiles de diversidad de marcadores 400 tambien pueden procesarse en mapas al nivel de marcador individual o de grupo de marcadores correlacionado. Esta estrategia es preferible ya que los subconjuntos de marcadores probablemente se correlacionen con un menor numero de parametros asociados a la muestra. Cada marcador en una base de datos de perfil de diversidad de marcadores se correlaciona por pares con cada uno de los otros marcadores en la base de datos para crear una matriz de correlacion 415. La base de datos original puede estar compuesta por perfiles de diversidad de marcadores de una sola area geografica o de diversas areas geografica. En la etapa 420, los marcadores de un area geografica se clasifican en grupos basandose en su nivel de correlacion. En la etapa 425, la representacion relativa del grupo marcador correlacionado N se determina junto con sus coordenadas geograficas para cada perfil de diversidad de marcadores en un area geografica. Se construye un mapa 430 en el que la abundancia relativa de cada grupo marcador correlacionado se codifica con un color con sus coordenadas geograficas. Las etapas 425 y 430 se repiten como en 435 y 440 para cada grupo de marcadores correlacionado.
La Figura 12 muestra oligonucleotidos utiles para la amplificacion de moleculas de acido nucleico para analisis en serie de ADN ribosomico, SARD.
La Figura 13 muestra el uso de la estrategia SARD para Eubacteria. La secuencia con doble subrayado y la secuencia con subrayado ondulado representan las etiquetas de secuencia para los dos grupos y la secuencia
5
10
15
20
25
30
35
40
45
50
55
60
65
con subrayado sencillo define el sitio de reconocimiento Bpm\.
La Figura 14 es una representacion grafica de un analisis SARD de una poblacion definida.
La Figura 15 muestra la secuencia de etiquetas SARD identificadas de la muestra Wy-1. El numero entre parentesis indica el numero de etiquetas que tienen esa secuencia.
La Figura 16 muestra etiquetas SARD identificadas de la muestra Wy-2. El numero entre parentesis indica el numero de etiquetas que tienen esa secuencia.
La Figura 17 es una representacion grafica del numero y abundancia de etiquetas SARD. El panel superior muestra el perfil de diversidad de etiquetas SARD de la muestra Wy-1 y el panel inferior muestra el perfil de diversidad de etiquetas SARD de la muestra Wy-2.
Descripcion detallada de la invencion
El grado de diversidad de los microbios en nuestro ambiente se ha reconocido solo recientemente. Con la llegada de la reaccion en cadena de la polimerasa (PCR) y del analisis de secuencia de ADN ribosomico (ADNr) de subunidad pequena, los investigadores han podido detectar y realizar analisis filogeneticos en microbios individuales sin tener que cultivar primero los microbios de interes. Esta estrategia filogenetica molecular ha cambiado significativamente nuestra perspectiva de la evolucion y de la diversidad microbiana (Woese, C. R, 1987, Bacterial evolution. Microbiol Rev. 51 (2): 221-71; Pace, N. R, 1997, A molecular view of microbial diversity and the biosphere. Science. 276 (5313): 734-40). Por ejemplo, ahora se piensa que las primeras formas de vida habfan utilizado compuestos inorganicos para la nutricion en lugar de compuestos basados en carbono organico. Ademas, ahora se sabe que la inmensa proporcion de diversidad biologica se debe a especies microbianas. Se han realizado estimaciones de que puede haber mas de diez mil especies distintas de microbios en un solo gramo de suelo. Las Figuras 3 y 4 muestran algunos de los miembros representativos de los dominios Bacteria y Archaea, respectivamente, que pueden encontrarse en muestras ambientales.
Los microbios residen practicamente en todos los nichos, incluyendo ambientes extremos con temperaturas entre - 6,67 y 121,11 °C (20 y 250 °F). Los microbios se han aislado incluso de depositos de petroleo con un profundidad de mas de 1,61 km (1 milla) por debajo de la superficie terrestre (Jeanthon, C. et al., 1995, Thermotoga subterranea sp. nov., a new thermophilic bacterium isolated from a continental oil reservoir. Arch. Microbiol. 164: 91-97). Para prevalecer en dichas condiciones diversas, los microbios han realizado adaptaciones notables y han adquirido la capacidad de utilizar fuentes inusuales de carbono y minerales inusuales que estan inmediatamente disponibles. Estas adaptaciones fisiologicas y metabolicas que permiten a algunos microbios residir en un nicho particular tambien pueden limitar su distribucion a dichas areas. Se conocen bien numerosos ejemplos de parametros ambientales que conducen a restricciones de distribucion microbiana y normalmente estan estipuladas por un programa metabolico especffico de especie (por ejemplo, naturaleza estricta de la fuente de carbono, nitrogeno y energfa).
Los microbios que tienen requisitos de nutrientes muy definidos probablemente tienen una distribucion restringida en el entorno. Por tanto, la dependencia de los microbios sobre la presencia de una fuente particular para proliferar puede servir como la base para un ensayo para identificar la presencia y caracterizar la distribucion de diversas caracterfsticas en el medio, caracterfsticas tales como biologicas, qufmicas y geoqufmicas. En otras palabras, los microbios pueden funcionar como biosensores ambientales.
En un aspecto de la presente invencion, la capacidad de los microbios para funcionar como biosensores ambientales se utiliza para identificar estados ambientales particulares. En una realizacion preferida, se utiliza un perfil de una poblacion microbiana para identificar uno o mas parametros de un estado ambiental particular. En una realizacion mas preferida, se utiliza un perfil de poblacion microbiana para identificar areas que probablemente tienen reservas minerales y/o petrolfferas. En otra realizacion preferida, en ciencia forense se utiliza un perfil de poblacion microbiana para identificar la descomposicion de un cuerpo o para asociar un individuo con otro individuo, o con un objeto o con una localizacion. En otra realizacion aun preferida, para identificar contaminacion microbiana de productos alimentarios de seres humanos y animales se utiliza un perfil de poblacion microbiana. En otra realizacion aun preferida, el perfil se utiliza para diagnosticar enfermedades humanas o animales.
Definiciones
A menos que se defina de otra manera, todos los terminos tecnicos y cientfficos utilizados en el presente documento tienen el significado que normalmente entiende un experto habitual en la tecnica a la que pertenece la presente invencion. La realizacion practica de la presente invencion emplea, a menos que se indique de otra manera, tecnicas de qufmica, biologfa molecular, microbiologfa, ADN recombinante, genetica e inmunologfa convencionales. Vease, por ejemplo, Maniatis et al., 1982; Sambrook et al., 1989; Ausubel et al., 1992; Glover, 1985; Anand, 1992; Guthrie y Fink, 1991.
Un microbio se define como cualquier organismo que sea de los dominios Bacteria, Eucaria o Arquea. Los microbios incluyen, sin limitacion bacterias, hongos, nematodos, protozoos, arqueobacterias, algas, dinoflagelados, mohos, bacteriofagos, micoplasma, virus y viroides.
Un marcador es una secuencia de ADN que puede utilizarse para diferenciar o identificar un gen, un genoma o un
5
10
15
20
25
30
35
40
45
50
55
60
65
organismo particular de otro. En una realizacion, puede generarse un marcador mediante uno de los metodos descritos en el presente documento. Un marcador representa uno de un numero limitado de especies taxonomicas o genes. En una realizacion preferida, un marcador representa una sola especie taxonomica o un gen. En una realizacion, el marcador representa una sola especie microbiana. En otra realizacion, el marcador representa una sola especie o tipo de virus. En otra realizacion, el marcador representa una sola inmunoglobulina o dominio variable de TCR.
Un perfil de diversidad de marcadores (PDM) es un conjunto de datos que se obtiene de cada muestra poblacional y que contiene una coleccion de marcadores. En una realizacion preferida, el PDM tambien comprende otra informacion, incluyendo todos los parametros conocidos asociados a una muestra poblacional particular. Dichos parametros que se relacionan con muestras ambientales pueden incluir componentes inorganicos (obtenidos a traves de analisis de adsorcion atomica), componentes organicos (obtenidos a traves GC-MS o LC-MS), analisis de tamano de grano, pH y salinidad. Los parametros que se relacionan con muestras medicas pueden incluir, pero sin limitacion, un historial medico completo del donante. En una realizacion preferida, los marcadores se obtienen por analisis en serie de ADN ribosomico, SARD.
Metodos para el analisis genetico de poblaciones
Los ribosomas, que contienen numerosas protefnas ribosomicas y tres moleculas de ARN ribosomico (ARNr), son un componente clave de la sfntesis de protefnas. El ARNr de subunidad 16S, que esta codificado por el gen de ADNr 16S, ha sido el centro de gran atencion en estudios filogeneticos microbianos. La secuencia de ADNr 16S esta muy conservada entre los grupos taxonomicos, incluso tambien posee regiones que son muy polimorficas (Figura 1). Ademas, se piensa que la velocidad de cambio en la secuencia de ARN ha sido relativamente constante a lo largo del tiempo evolutivo, lo que permite a los cientfficos determinar la relacion relativa de los diferentes organismos.
Los analisis microbianos moleculares tfpicos implican la utilizacion de regiones muy conservadas del ADNr 16S para amplificar el gen de aproximadamente 1.500 pb. La secuencia del producto amplificado por PCR se determina y se compara con la de otras secuencias de ADNr conocidas. Aunque esta estrategia es muy informativa, no permite estudiar rapidamente una comunidad microbiana ambiental.
La presente invencion proporciona metodos para calcular rapida y facilmente la diversidad genetica de una poblacion. Los metodos utilizan tecnologfa genomica independiente de hibridacion para superar los problemas de determinacion de la diversidad genetica identificados anteriormente. Este metodo puede utilizarse para cualquier poblacion de celulas, virus u organismos que comprendan al menos una molecula de ADN que comprenda regiones de alta conservacion de secuencia intercaladas con secuencias polimorficas, en el que las secuencias polimorficas pueden utilizarse para diferenciar diferentes miembros de la poblacion de interes. Un aspecto de la presente invencion describe un metodo (SARD) que puede capturar una region polimorfica disenada de una molecula de ADN determinada presente en los miembros de una comunidad microbiana. En una realizacion preferida, la molecula de ADN es una molecula de ADNr 16S. En otra realizacion, la molecula de ADN es la region intergenica entre los genes de ADNr 16S y 23S.
El metodo puede realizarse de la siguiente manera (vease la Figura 2):
Etapa 1. Preparacion de muestras y amplificacion de ADN por PCR
Las muestras pueden obtenerse de cualquier organismo o region que se desee. Para los analisis microbianos ambientales, pueden obtenerse muestras de, sin limitacion, construcciones, carreteras, suelo, rocas, plantas, animales, cultivos celulares o tisulares, desechos organicos, aire o agua. Para analisis microbianos medicos, las muestras pueden obtenerse de, sin limitacion, seres humanos, animales, parasitos, agua, suelo, aire y productos alimentarios. Para analisis de virus, las muestras pueden obtenerse de, sin limitacion, reservas de cultivos de virus, seres humanos, animales, plantas, cultivos celulares o tisulares y microbios. Para analisis de inmunoglobulina o TCR, las muestras pueden obtenerse de, sin limitacion, seres humanos, animales o cultivos celulares o tisulares. Las moleculas de ADN de la muestra de interes pueden aislarse mediante cualquier metodo conocido en la tecnica. Vease, por ejemplo, Sambrook et al., 1989 y Ausubel et al., 1992. En una realizacion preferida, el ADN se obtiene como describen Yeates et al., "Methods for Microbiological DNA Extraction from Soil for PCR Amplification," Biological Procedures Online, volumen 1, 14 de mayo de 1998, disponible en
www.science.uwaterloo.ca/bpo: Liu et al., Applied and Environmental Microbiology (1997) 63: 4516-4522; y Tsai et al., Applied and Environmental Microbiology (1992) 58: 2292-2295. Las moleculas de ADN no tienen que estar completamente purificadas sino que solamente requieren aislarse en el punto en el que pueda realizarse la PCR.
Los microbios ambientales a menudo existen en biopelfculas (Costerton, JW., et al., 1999, Bacterial biofilms: a common cause of persistent infections. Science 284(5418): 1318-1322) o en estrecha asociacion con superficies solidas. El ADN microbiano de una muestra de interes se afsla mediante cualquiera de los diversos metodos que conocen ampliamente los expertos en la tecnica y que se describen en la bibliograffa (Gillan, D.C. et al., 1998, Genetic diversity of the biofilm covering Montacuta ferruginosa (Mollusca, bivalvia) as evaluated by denaturing gradient gel electrophoresis analysis and cloning of PCR-amplified gene fragments coding for 16S rRNA Appl.
5
10
15
20
25
30
35
40
45
50
55
60
Environ. Microbial. 64(9): 3464-72).
Las muestras pueden enriquecerse selectivamente antes de aislarse mediante cualquier metodo conocido en la tecnica. En una realizacion, para una poblacion de microbios que se sabe o que se sospecha que se alimenta de una fuente de hidrocarburo, tal como propano, el hidrocarburo puede anadirse al medio en el cual viven los microbios durante un periodo de tiempo antes que estos se recojan. En otra realizacion, puede cultivarse una poblacion de virus en celulas antes de aislarse. En una realizacion adicional, las celulas B y T pueden expandirse en el cultivo antes del aislamiento. Puede ser mas facil obtener suficientes cantidades de muestra si una poblacion se expande antes del aislamiento. Sin embargo, esto debe ponderarse frente a la posibilidad de que la expansion altere la proporcion de los diferentes miembros de la poblacion entre si.
En general, los cebadores utilizados para la amplificacion se disenan para hibridarse con una region del ADN que esta muy conservada entre los miembros de la poblacion. Ademas, los cebadores deben flanquear una region polimorfica cuya secuencia parcial debe proporcionar informacion de diagnostico con respecto a la diversidad genetica de la poblacion. Por ejemplo, para el gen de ADNr 16S, se disenan cebadores que se hibridan con una region muy conservada del gen de ADNr 16S que flanquea una region polimorfica (vease la Figura 2). En un gen de inmunoglobulina, se disenan cebadores que se hibridan con una region del ADN de la celula B que flanquea el sitio de recombinacion V-J. Como alternativa, pueden disenarse cebadores que se unan a las regiones relativamente constantes dentro de determinadas regiones del gen de V-J que flanquea una region polimorfica. Vease Roitt et al., Immunology, 3a Ed., 1993, pags. 5.2-5.14, que muestra regiones de variabilidad y conservacion dentro de los genes de inmunoglobulina y TCR. Despues de las ensenanzas de la memoria descriptiva, un experto habitual en la materia reconocera que en el diseno de cebadores, pueden utilizarse otros genes que tengan regiones que esten muy conservadas entre miembros de la poblacion y que flanqueen regiones polimorficas.
Los cebadores tambien pueden disenarse para que flanqueen una region de ADN que comprenda un sitio de restriccion para una enzima de restriccion. En una realizacion preferida, la enzima de restriccion es una enzima de cuatro pares de bases, tal como AluI, que corta en un sitio de reconocimiento (vease la Figura 2). Adicionalmente, el sitio de restriccion debe estar cerca del gen de interes pero no en la region polimorfica del mismo. En una realizacion preferida, el sitio de restriccion debe ser uno que este presente en el gen de interes en gran parte de las especies o genes conocidos.
Puede utilizarse un solo conjunto de cebadores o multiples conjuntos de cebadores. Se puede utilizar un solo conjunto de cebadores si se sabe que la region de ADN a la cual se uniran los cebadores esta muy conservada. Como alternativa, si se sabe que hay alguna variacion en la region conservada, pueden utilizarse multiples conjuntos de cebadores para unirse a la region de ADN conservada. El uso de multiples conjuntos de cebadores puede ser util para identificar mas miembros de una poblacion, especialmente aquellos miembros de la poblacion que exhiben menos identidad de secuencia en las areas conservadas de una secuencia de acido nucleico. En una realizacion puede utilizarse de cuatro a diez conjuntos de cebadores para identificar miembros de una poblacion. Como alternativa, los cebadores utilizados pueden ser degenerados, de tal manera que diferentes moleculas dentro de una poblacion de cebadores incluiran una base diferente en uno o mas sitios especfficos en el cebador. Por ejemplo, un cebador puede tener un sitio que tenga citosina o timidina. El proposito de construir cebadores degenerados es aumentar el numero de diferentes moleculas de ADN que se hibriden con un cebador particular. En la tecnica se conocen bien metodos de construccion de cebadores degenerados.
Los cebadores utilizados en esta etapa, y en etapas posteriores, generalmente tienen una longitud suficiente para promover una hibridacion especffica con una secuencia de ADN. Los cebadores generalmente tienen una longitud de al menos 12 bases, mas preferentemente de al menos 15 bases, incluso mas preferentemente de al menos 18 bases. Los cebadores pueden tener una longitud de hasta 60 bases, aunque normalmente la mayorfa tienen 40 bases de longitud. Los cebadores pueden incluir tanto bases que se encuentran de manera natural en el ADN, tales como adenina, guanina, citosina y timidina, como tambien pueden incluir nucleotidos que no se encuentran normalmente en el ADN, tal como inosina.
Uno de los cebadores (el cebador “aguas arriba”) debe modificarse para incorporar una fraccion que pueda utilizarse para unir el producto de la PCR a un soporte solido. El cebador aguas arriba se define como el cebador que se localiza en el lado opuesto de la region polimorfica de interes relativa al sitio de restriccion de cuatro bases flanqueante. En la tecnica se conocen diversas fracciones de union diferentes. En una realizacion preferida, la fraccion es biotina. En otra realizacion preferida, la fraccion es digoxigenina o seis histidinas.
La PCR se realiza utilizando los cebadores para amplificar una subregion que contenga un sitio polimorfico de interes. En la tecnica se conocen bien metodos para realizar la PCR. En una realizacion, los productos de la PCR se normalizan o se sustraen por metodos conocidos en la tecnica para reducir la representacion de las secuencias dominantes. En Sambrook et al., 1989, Ausubel et al., 1992 Glover, 1985; Anand, 1992 se describen metodos ejemplares.
5
10
15
20
25
30
35
40
45
50
55
60
65
Etapa II. Digestion del fragmento amplificado y union a un soporte solido.
El fragmento amplificado se corta con la enzima de restriccion como se ha indicado en la etapa I. En esta etapa puede utilizarse cualquier enzima de restriccion siempre que corte en un sitio inmediatamente adyacente a la secuencia polimorfica. En una realizacion preferida, la enzima es una enzima de restriccion de cuatro bases. En la tecnica se conocen bien ejemplos de enzimas de restriccion de cuatro bases e incluyen muchas que estan disponibles en el comercio. Vease, por ejemplo, New England Biolabs Catalog 2000. Como ejemplos de enzimas de restriccion de cuatro bases se incluyen, sin limitacion, AluI, Bsh1236[, Dpnl, Hpall, Mbol, MspI, Pall (un isosquizomero de Haelll), Rsal, Sau3AI y Taql. Despues de la restriccion, el fragmento de ADN se une a un soporte solido. En la tecnica se conocen bien numerosos soportes solidos para inmovilizar ADN. Como ejemplos se incluyen, sin limitacion, perlas de estreptavidina, que podrfan unirse a un producto de PCR marcado con biotina, y perlas de anti-digoxigenina, que podrfan unirse a un producto de PCR marcado con digoxigenina y perlas conjugadas con nfquel, que podrfan unirse a un producto marcado con seis histidinas. En una realizacion preferida, se utilizan perlas de estreptavidina (Figura 2).
Dado que la posicion de la etiqueta de SARD (analisis en serie de ADN ribosomico) la dictamina el primer sitio de reconocimiento de la enzima de restriccion, distal al cebador biotinilado utilizado en la reaccion de PCR inicial, puede haber casos en los que el primer sitio de reconocimiento de la enzima de restriccion se localice dentro de una region conservada del gen de interes. En general, esto no supone un problema porque aunque las etiquetas de la region conservada puede que no sean informativas, la mayorfa de las etiquetas procedentes de SARD seran de una region polimorfica y seran informativas. Sin embargo, si se desea disminuir el numero de etiquetas que contengan informacion de una region conservada de un gen en lugar de una region polimorfica, despues de la restriccion se pueden purificar los productos de la PCR deseados. En una realizacion preferida, esto puede llevarse a cabo purificando en gel aquellos productos de la PCR que tengan el tamano esperado.
Etapa Ill. Digestion del producto de amplificacion y ligamiento a enlazadores.
Los productos inmovilizados se dividen en dos grupos y los enlazadores se unen a los productos inmovilizados de cada grupo. Cada enlazador es una molecula de ADN sintetica bicatenaria (doble cadena) que comprende una secuencia de ADN especffica. Ambos enlazadores incorporan un sitio de enzima de restriccion de tipo IIS. En una realizacion preferida, los dos enlazadores incorporan el mismo sitio de enzima de restriccion de tipo IlS. Cada uno de los dos enlazadores tambien comprende una secuencia de ADN que se hibrida especfficamente con un cebador. En una realizacion, los enlazadores son identicos entre sf y se hibridan con el mismo cebador. En una realizacion preferida, los enlazadores son diferentes entre sf de tal manera que cada uno se hibrida con un cebador diferente.
El enlazador bicatenario se liga al producto de PCR inmovilizado. El enlazador puede incorporar el sitio de enzima de restriccion de tipo IIS o puede incorporar solo una parte del sitio. En este caso, el enlazador se disenara de tal manera que el ligamiento del enlazador con el ADN restringido reconstituya el sitio de restriccion de tipo IIS. En una realizacion preferida, el enlazador incorpora un sitio Bpml. El ligamiento de enlazador es muy conocido y puede realizarse mediante cualquier metodo conocido en la tecnica. Despues del ligamiento, el producto PCR inmovilizado se afsla de los enlazadores libres mediante cualquier metodo conocido en la tecnica. Vease, por ejemplo, Velcelescu et al., Science 270: 484-487, 1995; Powell, Nucleic Acids Research 14: 3445-3446, 1998; Sambrook et al., pags. F.8- F.10, 1989.
Las enzimas de escision de tipo IIS escinden a una distancia definida de hasta 20 pares de bases, alejada de sus sitios de reconocimiento asimetricos. Las enzimas de restriccion de tipo IIS que se encuentran disponibles en el comercio incluyen enzimas que dejan salientes en 5' y las que dejan salientes en 3' como productos de ADN bicatenarios. Algunas enzimas de la primera clase incluyen: BsrnFI (10/14), Bst71l (8/12) y Fokl (9/13), indicando el numero entre parentesis la posicion de escision en la misma cadena de ADN que la de la posicion de la secuencia de reconocimiento/escision en la cadena de ADN complementaria. Las enzimas de la segunda clase incluyen: BpmI (16/14), Bsgl (16/14), Eco57l (16/14) y Gsul (16/14). El saliente en 3' dejado por estas enzimas debe retirarse para un ligamiento romo (etapa IV). Por lo tanto, las enzimas que escinden en las posiciones 16/14 dan como resultado una etiqueta de 14 pares de bases. Otras enzimas que cortan en una posicion mas distal pueden crear una etiqueta mas grande. Por ejemplo, Mmel (20/18) deja un saliente en 3', pero no esta disponible en el comercio (Tucholski, J. et al., 1995, Mmel, a class-IIS restriction endonuclease: purification and characterization. Gene 157: 87-92).
Etapa IV. Digestion del producto con la enzima de restriccion de Tipo IIS
El producto se digiere con la enzima de restriccion de Tipo IIS apropiada para liberar un fragmento de ADN de la perla de anclaje y producir un fragmento de ADN hfbrido corto que contenga una parte de la region polimorfica del ADN de interes (la etiqueta) y el ADN enlazador. Despues de la digestion, el ADN debe rellenarse o digerirse para crear extremos romos. Si la enzima de restriccion del Tipo IIS produce un saliente en 3', el fragmento se digiere con ADN polimerasa de T4 ADN para retirar el saliente en 3'. Si la enzima de restriccion de Tipo IIS produce un saliente en 5', el saliente debe rellenarse utilizando desoxinucleotidos apropiados y el fragmento Klenow de la ADN polimerasa I. El fragmento de ADN se separa del resto del producto PCR inmovilizado. En una realizacion preferida, los dos grupos de productos de PCR inmovilizados se digieren con Bpml para liberar los marcadores polimorficos y
5
10
15
20
25
30
35
40
45
50
55
60
65
se digieren con ADN polimerasa de T4 para crear extremos romos (Fig. 2).
Etapa V. Ligamiento de etiquetas y amplificacidn por PCR de las dietiquetas resultantes
Utilizando metodos muy conocidos en la tecnica las etiquetas se ligan entre si por extremos romos para formar dietiquetas. Vease, por ejemplo, Sambrook et al., 1989; Velcelescu et al., Science 270:484-487, 1995. Posteriormente, las dietiquetas se amplifican por PCR utilizando cebadores que son exclusivos para los enlazadores utilizados en la Etapa III. En una realizacion preferida, los cebadores son diferentes entre si, si los enlazadores utilizados en la Etapa III eran diferentes entre si. Como alternativa, los cebadores pueden ser iguales si los enlazadores utilizados en la Etapa III eran identicos entre si. El numero de reacciones de amplificacion por PCR variara dependiendo de la cantidad de ADN presente en el material de partida. Si hay una gran cantidad de ADN, entonces unicamente se requiere una amplificacion PCR en esta etapa, en la que cada reaccion comprende aproximadamente 15-30 ciclos. Si la cantidad de ADN inicial es baja, entonces en esta esta etapa puede requerirse mas de una reaccion de amplificacion PCR.
Etapa VI. Escision de las Dietiquetas y Ligamiento para formar Concatameros de Dietiquetas.
Las dietiquetas se escinden con la enzima de restriccion de cuatro bases utilizada en la Etapa II. Despues, los productos se ligan para crear concatameros de dietiquetas. En una realizacion, los concatameros de dietiquetas varfan de 2 a 200 dietiquetas. En una realizacion mas preferida, el concatamero comprende 20-50 etiquetas polimorficas. El concatamero puede secuenciarse directamente, o puede clonarse en un vector de secuenciacion. Utilizando un secuenciador de ADN capilar de 96 canales, en un dfa pueden analizarse facilmente unas 12.000 etiquetas. Como alternativa, los concatameros pueden secuenciarse manualmente.
Metodos para analizar datos de marcadores
La invencion se refiere a metodos para analizar la diversidad genetica de una poblacion en una muestra. Cada poblacion que se analiza tendra su propio conjunto de organismos o genes diferentes El conjunto de datos que se captura de cada muestra debe recapitular la estructura genetica en un formato de estudio que incluya un marcador para cada gen u organismo y la abundancia relativa de cada gen u organismo en la poblacion en su totalidad. Los marcadores para una poblacion particular a partir de perfiles de diversidad de marcadores (PDM), pueden introducirse en una base de datos. Vease, por ejemplo, la Fig. 8 que muestra un esquema para la generacion de dicha base de datos. El metodo a traves del cual se capturan los datos no es crftico siempre que produzca una representacion exacta de cada poblacion.
En un aspecto del metodo, los PDM se introducen en una base de datos. En una realizacion preferida, la base de datos se mantiene en una forma legible por ordenador, tal como un disquete, o un disquete no extrafble, o un servidor en red, o en una pagina Web. Sin embargo, el metodo mediante el cual se capturan los datos no es crftico siempre que se produzca una representacion exacta de cada comunidad microbiana.
Los sistemas de inteligencia artificial (IA) pueden ejecutar muchas funciones de gestion y analisis de datos Los ejemplos de sistemas IA incluyen sistemas expertos y redes neuronales. Los sistemas expertos analizan datos de acuerdo con una base de conocimiento junto con una base de datos residente. Las redes neuronales estan constituidas por unidades de procesamiento interconectadas que pueden interpretar multiples senales de entrada y generar una sola senal de salida. Los sistemas IA se adaptan perfectamente para analizar sistemas biologicos complejos que incluyen poblaciones utilizando protocolos de deduccion.
Un marcador puede correlacionarse con una condicion particular o con otro marcador. Vease, por ejemplo, la Fig. 9 para un esquema de las etapas implicadas en la determinacion de parametros particulares asociados con un PDM y la Fig. 10, que muestra un esquema de generacion de una base de datos matricial de diversidad de marcadores. Una condicion o estado puede ser una condicion ambiental, tal como pH, temperatura, salinidad, o la presencia o la ausencia de un compuesto organico o inorganico, tal como hidrocarburos, nitratos o depositos minerales. Una condicion puede ser una condicion fisiologica o medica, tal como una patologfa aguda o cronica, un estado fisiologico, una fase de desarrollo o puede estar asociada a un tejido o fluido corporal particular. Junto con los PDM tambien puede grabarse informacion con respecto a todos los parametros conocidos asociados a las muestras.
Cada perfil de diversidad de marcadores (PDM) esta compuesto por marcadores que representan un pequeno numero de especies o genes, mas preferentemente una especie o un gen. Por ejemplo, en el caso del Ejemplo1, cada marcador comprenderfa una secuencia de ADNr 16S polimorfica de 12 pares de bases. Dichos parametros que estan relacionados con muestras ambientales pueden incluir componentes inorganicos (obtenidos a traves de analisis de adsorcion atomica), componentes organicos (obtenidos a traves de GC-MS o LC-MS), analisis de tamano de grano, pH y salinidad. Los parametros que estan relacionados con muestras medicas incluirfan, pero sin limitacion, una historial medico completo del donante. Vease, por ejemplo, la Fig. 11, que muestra un esquema para aplicaciones de mapeo utilizando perfiles de diversidad de marcadores.
En otro aspecto de la invencion, los PDM se recogen durante una evolucion temporal, y cada momento es uno de los
5
10
15
20
25
30
35
40
45
50
55
60
65
parametros incluidos. Las evoluciones temporales pueden ser utiles para rastrear cambios con el tiempo para una amplia variedad de indicaciones. Por ejemplo, las evoluciones temporales pueden ser utiles para rastrear la progresion de una enfermedad, durante esfuerzos de remediacion ambiental y durante la produccion de campos petrolfferos.
En otro aspecto de la invencion, los PDM se recogen durante una evolucion temporal, y cada momento es uno de los parametros incluidos. Las evoluciones temporales pueden ser utiles para rastrear cambios con el tiempo para una amplia variedad de indicaciones. Por ejemplo, las evoluciones temporales pueden ser utiles para rastrear la progresion de una enfermedad, durante esfuerzos de remediacion ambiental y durante la produccion de campos petrolfferos.
En otro aspecto de la invencion, los PDM se recogen en diversas localizaciones distintas, tal como en diversas localizaciones geograficas o en diversos tejidos corporales. La comparacion de los PDM recopilados de diversas localizaciones distintas es util para diferenciar cambios entre estas diversas localizaciones, lo cual puede ser indicativo de condiciones ambientales o patologfas particulares.
La comparacion de perfiles de diversidad de marcadores puede revelar tendencias en poblaciones ya sea relativas al tiempo o a una localizacion geografica. En este primer caso, las comparaciones de poblaciones microbianas pueden resolver informacion espacial sobre el ambiente que de otra manera no podrfan detectarse. Como ejemplos de dicha informacion se incluyen patrones de migracion de agua, de compuestos organicos y de minerales. Por ejemplo, los depositos placeres de minerales estan causados por la accion tanto del agua como del viento haciendo que los minerales migren desde un deposito de lodo a una localizacion unicamente para depositarse en otra localizacion. La migracion de dichos minerales puede conducir a una traza detectable sobre las poblaciones microbianas en la trayectoria de migracion. Tambien pueden detectarse atributos ffsicos del entorno, tales como estructuras, formaciones y lfneas de falla. Normalmente se entiende que las fallas ofrecen una via de migracion vertical significativa para gases, tales como metano, que se sabe los microbios utilizan diferencialmente. Combinando los datos PDM con coordenadas geograficas, tales como altura, longitud y latitud, que pueden obtenerse facilmente con dispositivos de sistema de posicionamiento global, es posible crear mapas que delimiten la distribucion de diversos microbios en el entorno.
Los analisis de correlacion entre un marcador y todos los marcadores restantes en la base de datos, revelaran pares de marcadores con propensidad a coincidir. Este proceso puede repetirse de una manera repetitiva en todos los marcadores para producir una matriz de coeficientes de correlacion entre todos los marcadores observados. La Fig. 5 muestra un dispersograma de dos pares de marcadores, presentando uno de los pares un alto grado de correlacion. Esta estrategia tambien puede utilizarse para crear un dendrograma que refleje el nivel de correlacion relativo entre cada marcador. Por lo tanto, en cualquier nivel de correlacion seleccionado, todos los marcadores observados pueden dividirse en grupos en los que los marcadores de cada grupo comparten el mismo nivel de correlacion con cada otro miembro del grupo. Si se selecciona un valor alto de coeficiente de correlacion (p, ej., 0,8), los marcadores de cada grupo podrfan, en la mayorfa de los casos, encontrarse en la misma muestra. Por lo tanto, este ejercicio dividira una poblacion determinada en grupos de genes u organismos que tengan una propensidad a localizarse conjuntamente entre sf. En una realizacion preferida, el ejercicio dividira una comunidad microbiana en grupos de microbios que tengan una propensidad a localizarse conjuntamente.
Los analisis de correlacion entre un marcador (variable 1) y un parametro de muestra (variable 2) identificaran marcadores cuya presencia a menudo, o invariablemente, coincida con un componente presente en las muestras. En La Fig. 6 se muestran algunos tipos de relaciones entre marcadores y componentes de muestra (o parametros). Un fuerte valor de correlacion entre un marcador y un parametro de muestra permitira realizar predicciones sobre la abundancia de cualquier variable (marcador o parametro de muestra) siempre que se conozca una las variables.
En algunos casos, un marcador no sera especffico para una sola especie o gen. Por ejemplo, la secuencia etiqueta que se identificarfa por la estrategia representada en el Ejemplo 1 identificarfa Denitrobacter permanens y Legionella anisa. En los casos en los que se encuentra una correlacion significativa entre un marcador y un parametro de muestra de interes, la accion preferida es utilizar la informacion de secuencia de etiqueta para identificar la secuencia genica completa. Despues la secuencia puede utilizarse para identificar las secuencias y para identificar sondas especfficas de especie para verificar la correlacion. Esto puede realizarse utilizando metodos conocidos en la tecnica, tales como mediante PCR o mediante hibridacion a moleculas de ADN aisladas de la muestra de interes, seguido de secuenciacion o de otros metodos de analisis.
Las sondas especfficas de especie, que se identifican de marcadores con una fuerte correlacion con un parametro de muestra de interes, pueden utilizarse despues como un diagnostico, o para prospectar el parametro de interes. Dichos ensayos estarfan basados preferentemente en PCR y serfan muy sensibles, rapidos y asequibles. En una realizacion preferida, un marcador identificado por estos metodos puede utilizarse como una sonda de hibridacion para identificar un trozo de ADN mas grande del cual procede este marcador. La secuencia de la molecula de ADN mas grande puede despues utilizarse para disenar cebadores que se hibriden especfficamente con la molecula de ADN de interes y que pueden utilizarse para amplificar especfficamente la molecula de ADN por PCR. Como alternativa, se puede utilizar un ensayo basado en hibridacion utilizando una sonda que se una especfficamente a la
5
10
15
20
25
30
35
40
45
50
55
60
molecula de ADN de interes. El uso de cebadores o de sondas es especialmente util para determinar rapidamente si una gran cantidad de muestras contiene la molecula de ADN que se correlaciona con el parametro de interes.
En una realizacion preferida, se identifica un marcador que se correlaciona con un parametro deseado. El marcador puede identificarse utilizando SARD, o puede identificarse utilizando otro metodo, tal como polimorfismos de longitud de fragmentos de restriccion (RFLP, del ingles Restriction Fragment Length Polymorphism) o polimorfismos de longitud de fragmentos de restriccion terminales (T-RFLP, del ingles Terminal Restriction Fragment Length Polymorphism, Liu et al., Applied and Environmental Microbiology 63:4516-4522, 1997). Para identificar diferencias de tamano.puede utilizarse un metodo tal como electroforesis en gel con gradiente desnaturalizante (DGGE, del ingles Denaturing gradient gel electrophoresis). En una realizacion preferida, para identificar el marcador se utiliza SARD. Otras muestras se exploran para determinar si tienen el marcador de interes. En una realizacion preferida, la exploracion utilizada es PCR o hibridacion, mas preferentemente es PCR. En una realizacion aun mas preferida, el marcador se correlaciona con la presencia de reservas minerales o petrolfferas.
El analisis de correlacion entre los PDM (PDMn, variable 1; PDMn+1, variable 2) puede revelar las similitudes relativas entre muestras. Se espera que muestras tomadas del mismo individuo o de sitios ambientales proximos, que tienen similar composicion, muestren un fuerte coeficiente correlacion (Fig. 7A). Sin embargo, se espera que las muestras que comparten solo un parametro, o solo algunos parametros en comun, no muestren una correlacion significativa cuando se consideran todos los marcadores (Fig. 7B). Incorporando el conocimiento aprendido de las correlaciones entre Marcadores y entre Marcador/Parametro, los PDM pueden compararse utilizando en el analisis marcadores individuales o preferentemente, subconjuntos de marcadores correlacionados (Fig. 7C). Esta estrategia puede eliminar mucha interferencia y permite identificar relaciones ocultas.
El analisis de correlacion puede realizarse mediante cualquier metodo o calculo conocido en la tecnica. El analisis de correlacion para r y r2 puede realizarse como describe M. J. Schmidt en Understanding and Using Statistics, 1975 (D.C. Health and Company), pags. 131-147. El grado de correlacion para r puede definirse de la siguiente manera:
1
0 Perfecto
0
8-0 99 Alto
0
5-0 7 Moderado
0
3-0 4 B aj o
0
1-0, 2 I n significante
En una realizacion, la correlacion entre los dos marcadores o entre un marcador y un parametro es al menos baja (r es de 0,3 a 0,4). En una realizacion preferida, la correlacion es al menos moderada (r es de 0,5 a 0,7). En una realizacion mas preferida, la correlacion es alta (r es de 0,8 a 0,99).
Con el desarrollo de numerosas tecnologfas genomicas para analizar conjuntos complejos de acidos nucleicos, se tiene la oportunidad de comenzar a catalogar el reservorio de la diversidad microbiana, y por tanto, metabolica. Dado que la proliferacion de un microbio en una localizacion determinada dependera de la presencia de los nutrientes metabolicos necesarios, la informacion como la abundancia de ese microbio puede servir como un biosensor para un conjunto de parametros determinado. Cuando se considera como un conjunto, la estructura de la comunidad microbiana en una determinada localizacion, contendra un potencial biosensor intrfnseco para una amplia serie de parametros. La fiabilidad predictiva de los datos de una comunidad microbiana completa tambien aumentara significativamente. Por ejemplo, si un microbio determinado estuviese presente en el 50 % de las muestras de suelo extrafdas por encima de los depositos de petroleo y no se encontrase en ningun otro lugar, entonces la presencia de diez de dichos microbios podrfa crear un valor predictivo con una precision de 99,9 %.
Aplicaciones de la invencion
Exploracion Geoquimica y Mineral
Los metodos descritos en la presente invencion tienen diversos beneficios sobre las tecnologfas existentes. Por ejemplo, en el campo de la exploracion geoquimica, analisis basados en ADNr genomico posiblemente podran resolver un amplio conjunto de parametros geoqufmicos de interes con respecto a las industrias del petroleo y minera. Actualmente, se requieren muchas tecnologfas diferentes para medir estos parametros. Dado que esta invencion se basa en una medicion universal, la deteccion de acido nucleico, esta puede reducir enormemente la instrumentacion y los costes externalizacion de muestras.
Los depositos de aceite y gas se localizan muy cerca de la superficie de la tierra a profundidades que varfan desde unos 30,4 cm (100 pies) a mas de 3048 ms (10.000 pies). Cuando se forma el aceite, este experimenta una migracion en la que se produce una de dos cosas. El aceite puede continuar migrando hasta que finalmente alcanza la superficie, donde se evapora con el tiempo. Como alternativa esta migracion puede bloquearse mediante una estructura impermeable, denominada "trampa". Los metodos geoffsicos (tales como metodos sfsmicos tridimensionales) para la exploracion de petroleo se basan en el hallazgo de estas estructuras trampa con la esperanza de que contengan aceite.
5
10
15
20
25
30
35
40
45
50
55
60
65
El aceite crudo esta constituido por una diversidad de longitudes de cadena de hidrocarburo. Los hidrocarburos mas ligeros (en particular, metano, etano, propano y butano) a menudo pueden difundirse a traves de las estructuras trampa y, como resultado de los gradientes de presion, experimentar una migracion vertical hacia la superficie. Determinados microbios presentes en la superficie o en la capa de la superficie pueden utilizar estos hidrocarburos en migracion, lo que ocasionalmente produce cambios mineralogicos que son detectables en la superficie. Por tanto, cabe esperar que estos hidrocarburos en migracion afecten a las poblaciones microbianas, de tal manera que la capacidad de determinar la diversidad genetica de una poblacion microbiana puede revelar firmas microbianas que sean indicativas de la presencia de aceite.
Avances recientes en microflufdica en la industria genomica han dado como resultado el desarrollo de instrumentos que pueden detectar acidos nucleicos especfficos en pocos minutos. La utilizacion de dichos instrumentos permitira realizar en el campo mediciones de diversos parametros. En cambio, los ensayos qufmicos convencionales requieren analisis de laboratorio e interpretacion.
Se han creado biosensores con capacidad de detectar hidrocarburos que estan presentes al nivel de deteccion, o por debajo de este, de instrumentacion analftica de tipo GC-MS sofisticada (Sticher, P. et al., 1997, Development and characterization of a wholecell bioluminescent sensor for bioavailable middle-chain alkanes in contaminated groundwater samples. Appl Environ Microbiol. 63:4053-4060). Sticher et al. demostraron que utilizando un solo gen indicador en un microbio modificado geneticamente que comprende un gen indicador, se podfan detectar cambios extremadamente pequenos en su ambiente en respuesta a un tratamiento agudo con un hidrocarburo particular. La presente invencion puede documentar el efecto sobre una poblacion que comprende miles de microbios durante el tiempo geologico y por tanto tiene la posibilidad de ser mas sensible que los instrumentos analfticos actuales.
La presente invencion tambien puede utilizarse para crear un estudio de entidades biologicas que este limitado solo por el requisito previo de que estas entidades contengan acidos nucleicos que esten dispuestos en regiones que estan conservadas y en regiones que sean polimorficas cuando se comparan con secuencias de organismos relacionados. Mas adelante se describen algunos ejemplos adicionales de la aplicacion de la presente invencion.
Desarrollo de depositos de aceite y gas
Ademas de la aplicacion de la presente invencion en la exploracion del petroleo, la presente invencion tambien puede utilizarse en el desarrollo de depositos de aceite y gas. Diversas propiedades de depositos de aceite que afectan directamente a la viabilidad comercial de los depositos las modulan, a un determinado nivel, los microbios. Algunas veces hay sulfuro de hidrogeno en el aceite crudo y puede convertir, de otra manera, el aceite 'dulce' en aceite 'avinagrado'. Ademas de su efecto corrosivo sobre el equipo del campo petrolffero, el H2S tambien plantea un riesgo para los trabajadores y reduce significativamente el valor de un deposito de aceite debido a que para eliminar el gas debe instalarse una planta de lavado. Los niveles de H2S pueden cambiar durante el desarrollo de un deposito y ahora se piense que es el resultado de bacterias reductoras de sulfato (Leu, J.-Y. et al., 1999, 1999, The same species of sulphate-reducing Desulfomicrobium occur in different oil field environments in the north sea. Lett. Appl. Microbiol. 29(4):246-252). Identificando la presencia de microbios que pueden conducir a la produccion de H2S, la valoracion de nuevos depositos y las estrategias de desarrollo resultantes podrfa volverse mas eficaces.
El aceite crudo y el gas natural estan compuestos por una mezcla compleja de hidrocarburos que incluyen hidrocarburos de cadena lineal de longitudes generalmente comprendidas entre 2 y 40 atomos de carbono. Los hidrocarburos de longitud de cadena mas corta son mas valiosos (p, ej., gasolina, C4-C). En algunos depositos de aceite, los hidrocarburos mas ligeros se extraen selectivamente durante o antes del desarrollo del deposito. Se sospechaba que los microbios desempenaban una funcion en este proceso ya que los hidrocarburos de longitud de cadena mas corta estan mas biodisponibles. La presente invencion puede identificar microbios que estan implicados en este proceso y por lo tanto puede hacer predicciones en cuanto a la susceptibilidad de determinados depositos del empobrecimiento de dichos hidrocarburos de cadena corta. La presente invencion tambien permite identificar microbios capaces de acortar los hidrocarburos de cadena larga aumentando por lo tanto el valor de los depositos existentes.
Deteccion de insectos y parasitos
El significativo impacto negativo que los insectos pueden tener sobre la agricultura es muy conocido. Los insectos tambien sirven como vectores para la transmision de muchos microbios causantes de enfermedades. Se han descrito numerosas relaciones entre insectos y microbios. Por ejemplo, el genero de bacterias Wolbachia se encuentra asociado con muchas especies de hormigas y se ha observado que altera la determinacion del sexo y la fecundidad en el hospedador (Wenseleers, T. et al., 1998, Widespread occurrence of the micro-organism Wolbachia in ants. Proc. R Soc. Lond. B. Biol. Sci. 265(1404):1447-52). Ademas, en las hormigas se han identificado muchas especies de bacterias endosimbioticas intracelulares (Schroder, D. et al., 1996, Intracellular endosymbiotic bacteria of Camponotus species (carpenter ants): systematics, evolution and ultrastructural characterization. Mol. Microbiol. 21:479-89). Probablemente, la mayorfa de los insectos, si no todos, tienen relaciones fntimas, especfficas de especie, con microbios, lo que podrfa representar un talon de Aquiles para el control de poblaciones de insectos. La invencion descrita en esta solicitud proporcionarfa un medio para identificar microbios que modulen el bienestar de
5
10
15
20
25
30
35
40
45
50
55
60
65
una especie de insecto determinada.
Posiblemente, la identificacion de microbios que estan especfficamente asociados a un insecto determinado, tambien podrfa servir como una base para un ensayo muy sensible para determinar la presencia del insecto. Por ejemplo, los metodos actuales para identificar la presencia de termitas en estructuras de madera se basan en inspeccion visual y no son muy adecuados. Un ensayo para detectar la presencia de un microbio asociado a termitas que se base en amplificacion por PCR serfa tanto muy sensible como no invasivo.
Adicionalmente, la capacidad de crear inventarios exhaustivos de diversidad microbiana tiene diversas aplicaciones en lo que respecta a ecologfa microbiana que podrfa ser util en la industria agrfcola. Por ejemplo, la industria agrfcola utiliza enormes cantidades de pesticidas para prevenir profilacticamente la perdida de cultivos. La presente invencion proporciona la capacidad de realizar estudios exhaustivos de poblaciones microbianas y puede conducir a predicciones tales como la susceptibilidad de un campo determinado contra fitopatogenos particulares. Este conocimiento conducirfa a mejorar las estrategias de las aplicaciones pesticidas.
Adicionalmente, el estudio de la diversidad microbiana en un entorno, tal como un campo agrfcola en diversos momentos del ano, revelarfa los cambios dinamicos que se producen en las poblaciones microbianas como resultado de fluctuaciones estacionales (temperatura y humedad), aplicacion de pesticidas y proliferacion de determinados organismos.
La comparacion de los perfiles de diversidad extrafdos del mismo sitio o de un sitio similar en diferentes momentos revelarfa interacciones entre especies en una poblacion. Estas interacciones productivas pueden manifestarse en sf mismas bien en el aumento o disminucion en la representacion de un marcador relativo a la disminucion o aumento en la representacion de un segundo marcador, respectivamente.
Dicha informacion proporcionarfa una advertencia temprana de la proliferacion de especies de plagas, asf como la identificacion de especies que son patogenas contra especies de plagas. Esos organismos patogenos pueden tener valor bien como un agente biologico para controlar la proliferacion de especies de plagas y/o como una fuente para genes o compuestos que actuarfan como pesticidas. Este fenomeno no esta limitado a interacciones entre microbios. Los huevos, asf como las fases larvarias de los insectos, probablemente interaccionan con los microbios del suelo y crean un impacto detectable sobre las poblaciones microbianas. Un ejemplo de tal organismo es Bacillus thuringiensis, que en sf mismo se utiliza normalmente en la agricultura organica como un agente insecticida. El gen responsable de esta actividad insecticida (toxina Bt) se ha utilizado en gran medida para crear plantas transgenicas con resistencia al ataque causado por insectos.
Biorremediacion
Se ha realizado una cantidad de esfuerzo considerable en el desarrollo de metodos para la eliminacion, basada en microbios, de productos qufmicos del medio. Dichos productos qufmicos incluyen metales pesados, aromaticos polinucleares (PNA “polynuclear aromatics”), aromaticos halogenados, aceite crudo y diversos otros compuestos organicos tales como MTBE. Las consideraciones reguladas para la eliminacion de microorganismos en el medio han redirigido esfuerzos hacia la identificacion y aumento del crecimiento de organismos endemicos que tienen la capacidad de metabolizar o eliminar del medio compuestos de interes.
La presente invencion puede facilitar esfuerzos de biorremediacion en dos sentidos. En primer lugar, pueden
identificarse organismos en un lugar determinado que previamente se haya demostrado que pueden eliminar
compuestos de interes o que tengan una probabilidad significativa de tener la capacidad de metabolizar los
compuestos relevantes basandose en su coincidencia en el medio con los productos qufmicos en numerosos
escenarios geologicos. En segundo lugar, la presente invencion puede identificar tendencias de tipos de suelos y especies microbianas particulares. En este caso, las correlaciones que se extraen desde las bases de datos entre la distribucion microbiana y los tipos de suelo pueden combinarse con la base del conocimiento de geoqufmica existente. Por ejemplo, el Servicio Geologico de los Estados Unidos, USGS, proporciona muchos mapas disponibles al publico que describen numerosos parametros geoqufmicos y geoffsicos. Las extrapolaciones de la distribucion de las especies microbianas pueden realizarse a nivel regional, y posiblemente mundial. Estas distribuciones microbianas extrapoladas pueden servir como base para regfmenes de tratamiento especfficos de sitio para aumentar el crecimiento de determinadas especies relevantes sin realizar primero un estudio microbiano.
Ciencia forense
La presente invencion, particularmente el analisis SARD, tambien puede utilizarse en aplicaciones forenses. En los ultimos diez a veinte anos se han enfocado estudios sobre los cambios que se producen en el cuerpo de una persona o de un animal despues de su muerte. Muchos de estos cambios implican cambios en las poblaciones microbianas que aparecen durante la descomposicion del organismo. Los cambios en dichas poblaciones microbianas se han correlacionado con el tiempo que transcurre desde que una persona muere y con las condiciones que el cuerpo experimenta despues de la muerte, por ejemplo, calor, exposicion solar, inhumacion parcial o completa, exposicion a la lluvia, etc. Los analisis SARD permitirfan a los cientfficos forenses determinar de
5
10
15
20
25
30
35
40
45
50
55
60
65
un modo rapido y exacto el tamano y los tipos de las poblaciones microbianas, que a su vez pueden utilizarse para determinar tiempos mas precisos de muerte asf como las condiciones a las que el cuerpo ha estado expuesto.
Otras aplicaciones
Esta estrategia puede utilizarse para cualquier region polimorfica en un genoma microbiano. Este metodo tampoco requiere limitarse a genes. La secuencia de ADN de regiones intergenicas de genomas no esta bajo un alto nivel de presion selectiva y por tanto, representa una secuencia de ADN muy polimorfica. Un ejemplo de dicha region es la region intergenica entre las regiones que codifican las subunidades de ADNr grande (23S) y pequena (16S). Los metodos descritos anteriormente pueden utilizarse para diferenciar miembros de una poblacion basandose en diferencias de tamano de la region intergenica entre los genes de ADNr 16S-23S o 23S-5S. La region espaciadora entre estos genes se ha descubierto que es hipervariable en poblaciones microbianas. En el caso de la region intergenica 16S-23S, el tamano del espaciador vana entre aproximadamente 200-1500 pares de bases dependiendo de la presencia o de la ausencia de diversos genes de ARNt. (Nour M. 1998, 16S-23S and 23S-5S intergenic spacer regions of lactobacilli: nucleotide sequence, secondary structure and comparative analysis, Res. Microbial. 149(6):433-448; Berthier F. et al., 1998, Rapid species identification within two groups of closely related lactobacilli using PCR primers that target the 16S/23S rRNA spacer region, FEMSMicrobiol Lett. 161(1 ):97-106; Tilsala- Timisjarvi A. et al., 1997, Development of oligonucleotide primers from the 16S-23S rRNA intergenic sequences for identifying different dairy and probiotic lactic acid bacteria by PCR Int. J. Food Microbial. 35(1):49-56). Estos dos genes de ADNr se transcriben en el mismo operon. Por lo tanto, las regiones conservadas de la secuencia codificante de ADNr de estas subunidades pueden utilizarse para amplificar las regiones intergenicas.
Para que la presente invencion pueda entenderse mejor, se exponen los siguientes ejemplos. La finalidad de estos ejemplos es unicamente ilustrativa y en ningun caso deben considerarse como limitantes del alcance de la invencion.
EJEMPLO 1
Analisis en serie de etiquetas polimorficas de ADNr del dominio Eubacteria
Se obtuvo una muestra que comprendfa bacterias ambientales y se extrajo ADN total de la muestra. Para amplificar el ADN, se realizo PCR mezclando tampon de reaccion Advantage2 5 pl 10X (Clontech), los dNTP 2,5 pl, cebadores TX9/TX16 5 pl, 8 pM, 50 ng de ADN de muestra, Taq polimerasa Advantage2 0,5 pl (Clontech) y agua hasta 50 pl. El cebador TX9 se marco con biotina. Los cebadores se muestran en la Fig. 12 y en la Fig. 13 se muestra una estrategia general de este ejemplo. Despues, la mezcla de reaccion se sometio a PCR con las siguientes condiciones:
a) 94 °C durante 5 minutos;
b) 94 °C durante 1 minuto, 10 segundos;
c) 55 °C durante 50 segundos;
d) 68 °C durante 1 minuto;
e) repetir las etapas (b) a (d) 20 veces; y
f) 68 °C durante 2 minutos.
El producto de la PCR, de aproximadamente 600 pares de bases, se purifico en gel utilizando agarosa al 1 % y un kit Qiaquick (Qiagen) de acuerdo con las instrucciones del fabricante. El ADN se eluyo con Tris-EDTA (TE; Tris 10 mM pH 8; EDTA 1 mM) 50 pl. Para restringir el ADN amplificado, se anadio tampon n.° 2 New England Biolabs (NEB n.° 2) 10X para llevar la concentracion del tampon a 1X y se anadieron 25 unidades de Alul. La mezcla de reaccion se incubo durante 2 horas a 37 °C; se anadieron 25 unidades MAS de Alul y la mezcla de reaccion se incubo durante una hora mas seguido de inactivacion de la enzima a 65 °C durante 20 minutos.
Para inmovilizar en una perla el fragmento de ADN restringido, se anadio el mismo volumen de tampon BW 2X (2X BW = Tris 10 mM, pH 7,5; EDTA 1 mM; NaCl 2 M) a la mezcla de reaccion, seguido de la adicion de perlas de Estreptavidina (SA) M-280 (Dynal) lavadas 50 pl. La mezcla de reaccion se incubo durante 20 minutos a temperature ambiente. Despues, las perlas se lavaron dos veces en BW 1X y dos veces en tampon de lavado (Tris 10 mM, pH 8, MgSO4 10 mM; NaCl 50 mM). Durante la ultima etapa de lavado, las perlas se dividieron en dos grupos.
Para anadir los enlazadores al ADN inmovilizado, un grupo de perlas se resuspendio en 4 pl de enlazador TX-12/13 10 pM (una molecula de ADN bicatenario que comprende los cebadores TX-012 y TX-013) para formar el grupo A, mientras que el otro grupo (grupo B) se resuspendio en 4 pl de enlazador TX-14/15 10 pM (una molecula de ADN bicatenario que comprende los cebadores TX-014 y TX-015) al que se anadio el otro grupo. Se anadieron 36 pl de mezcla de ligasa de T4 (tampon ligasa 10X, 4 pl; agua 32 pl, ligasa T4 0,2 pl [400 U]) a la mezcla de enlazador/perla y la mezcla se incubo durante una noche a 16 °C.
La molecula de ADN unida a las perlas de estreptavidina se incubo despues con Bpml, que reconoce su secuencia de restriccion espedfica (GAGGTC) en la molecula de ADN. Bpml escinde el ADN de tal manera que libera la perla de estreptavidina de la molecula de ADN e incorpora una parte de la region polimorfica de la primera molecula de
5
10
15
20
25
30
35
40
45
50
55
60
65
ADN amplificada. Las perlas se lavaron dos veces con 0,5 ml cada vez con 1 x BW y dos veces con tampon de lavado. Las perlas se resuspendieron en una mezcla de BpmI 10 pl (10 X NEB n.° 3 1 ml [New England Biolabs], albumina de suero bovino 1 pg/pl 1 pl, agua 8 pl y BpmI 1 pl [New England Biolabs])). La mezcla de reaccion se incubo a 37 °C durante 2 horas y despues a 65 °C para inactivar la enzima. El sobrenadante que contenfa las etiquetas de ADN se aislo despues.
Para eliminar el saliente 3' de las etiquetas de ADN y hacer romos los extremos, al sobrenadante (10 pl) en hielo se le anadio la mezcla de polimerasa de T4 10 pl (1 pl 10X NEB n.° 2; DNTP 4 mM 0,5 pl, agua 8,5 pl y polimerasa de T4 0,33 pl [1 U, New England Biolabs]). La reaccion se incubo a 12 °C durante 20 minutos y a 65 °C durante 20 minutos para inactivar la polimerasa. Para formar dietiquetas, se combinaron el grupo A y el grupo B para dar un volumen total de 40 pl. Se anadieron 4 pl de ATPr 10 mM y 0,2 pl de ADN ligasa de T4 (400 u) y la reaccion se incubo desde 4 horas hasta toda la noche a 16 °C.
Como una etapa de amplificacion intermedia, las dietiquetas se amplificaron despues en una reaccion PCR 300 pl (tampon Taq Advantage2 10X 30 pl, dNTP 4 mM 15 pl; mezcla de cebadores TX111/TX12130 30 pl 8 pM; Taq polimerasa Advantage2 3 pl; molde de dietiqueta 3 pl; agua 219 pl). La mezcla de reaccion de 300 pl se dividio en tres reacciones de 100 pl y se amplifico utilizando las siguientes condiciones:
a) 94 °C durante 5 minutos;
b) 94 °C durante 30 segundos;
c) 56 °C durante 30 segundos;
d) 68 °C durante 40 segundos;
e) repetir las etapas (b) a (d) durante 15 ciclos; y
f) 68 °C durante 2 minutos.
Despues de la amplificacion, se anadieron tres volumenes (900 pl) de tampon QG (Qiagen) y un volumen (300 pl) de isopropanol, la mezcla se unio a una columna de espfn de extraccion en gel (Qiagen) y el aDn se eluyo con TE 50 pl
El ADN amplificado se sometio despues a electroforesis en gel de poliacrilamida no desnaturalizante (PAGE; Novex 1 mm 10 % gel TBS-PAGE). El gel se tino con bromuro de etidio 5 pg/ml, las dietiquetas de aproximadamente 106 pares de bases se escindieron del gel, el gel escindido se fragmento y se anadieron 0,3 ml de TE al gel y se incubo a 65 °C durante 30 minutos. La mezcla de gel/TE se transfirio a una columna de espfn miniprep (Qiagen) y el eluato que contenfa las dietiquetas amplificadas se recogio (molde de dietiqueta). El ADN amplificado se denomino molde de dietiqueta P300.
Para determinar el numero optimo de ciclos PCR para la amplificacion a gran escala (titulacion del ciclo PCR), se mezclaron 6,4 pl de molde de dietiqueta P300 con 8 pl de tampon Taq Advantage2 10X, dNTP 4 pl 4 mM, cebadores TX111/TX121 8 pl, Taq polimerasa Advantage2 0,8 pl y agua 52,8 pl. La mezcla de reaccion se dividio en tres reacciones de 25 pl y se amplifico durante 6, 8 o 10 ciclos utilizando las condiciones PCR descritas anteriormente para la etapa de amplificacion intermedia. Despues de la amplificacion, los productos de ADN se desalinizaron y purificaron utilizando una Columna de espfn de Extraccion en Gel de Qiagen como se describe anteriormente excepto que se unicamente se utilizaron 75 pl de tampon QG y 25 pl de isopropanol, y los productos de ADN se eluyeron con 20 pl de TE. El numero de ciclos que dio lugar a la dietiqueta mas larga de 106 pares de bases se produjo sin ninguna mancha vertical detectable por analisis TBS-PAGE al 10 % que se utilizo para la amplificacion a gran escala.
Para la amplificacion de dietiquetas a gran escala, se mezclaron 180 pl de tampon Taq Advantage2 10X, dNTP 90 pl 4 mM, mezcla de TX111/TX121 180 pl 8 pM, 18 pl de Taq polimerasa Advantage2, 144 pl de molde de dietiqueta P300 y 11881 pl de agua conjuntamente y despues se dividio en 18 reacciones de 100 pl. La PCR se realizo como se ha descrito en lfneas anteriores utilizando el numero de ciclos que se determino para la etapa de titulacion anterior. Las reacciones de la PCR se desalinizaron anadiendo tres volumenes de tampon QG y un volumen de isopropanol a las reacciones y se pasaron a traves de un total de cuatro columnas de espfn de extraccion en gel de Qiagen. Cada columna se eluyo con 50pl de TE. Las muestras se sometieron a PAGE preparativa no desnaturalizante (Novex 1,5 mm 10 % TBS-PAGE). Las bandas de ADN se tineron y se escindieron como se ha indicado anteriormente y se dividieron en tres tubos. La poliacrilamida se fragmento y se eluyo utilizando TE como se ha descrito anteriormente y el ADN se purifico pasando el contenido de la mezcla gel/TE a traves de una columna Miniprep Spin Plasmid Qiagen como se ha descrito anteriormente.
Para precipitar el ADN, se anadieron 1 pl de glicogeno, 150 pl de acetato de amonio 10M y 1125 pl de etanol a cada eluato de aproximadamente 300 pl. La mezcla se incubo a -80 °C durante 20 minutos y se microcentrifugo a 13000 rpm a 4 °C durante 15 minutos. El sedimento se lavo con etanol al 70 % 1 ml y se seco a 37 °C durante 5 minutos.
Los sedimentos de ADN se resuspendieron en mezcla de AluI 150 pl (15 pl de NEB n.° 2, 135 pl de agua y 15 pl de AluI [150 U]). La mezcla de reaccion se incubo a 37 °C durante 2 horas. Se anadieron 150 pl de tampon BW 2X y la muestra se transfirio a un nuevo tubo que contenfa 150 perlas SA compactadas. Las perlas se incubaron con la
5
10
15
20
25
30
35
40
45
50
mezcla de ADN durante 30 minutos a temperature ambiente y las perlas se sedimentaron magneticamente. El sobrenadante se retiro, se extrajo con fenol/cloroformo/alcohol isoamflico 250 pl y la fase acuosa se precipito con acetato de amonio 150 pl 10M y etanol 1125 pl durante una noche a -80 °C. El ADN se centrifugo a 13000 rpm a 4 °C durante 15 minutos, el sedimento se lavo con etanol al 70 % y se seco. Esta etapa elimina cualquier enlazador libre que pueda haber, asf como cualquier producto de ADN incompletamente digerido que aun permaneciese unido a los enlazadores marcados con biotina.
Para concatenar las dietiquetas, el sedimento de ADN se resuspendio en mezcla de ligasa 10 pl (tampon ligasa 10X 1 pl; agua 9 pl y T4 ligasa 1 pl [100 U]) y se incubo a 16 °C durante 30 minutos. El ADN se precipito anadiendo 40 pl de TE, 25 pl de acetato de amonio 10M y etanol 180 pl. El ADN se precipito durante 15 minutos a -80 °C y se centrifugo, se lavo y seco como se ha indicado anteriormente.
Las dietiquetas concatenadas se purificaron, resuspendiendo el sobrenadante en tampon de carga TBE 1X y sometiendo la muestra a PAGE no desnaturalizante (TBE-PAGE al 8 %). El area entre 0,5 a 1,2 kb se escindio y el ADN se eluyo del gel en TE 300 pl como se ha descrito anteriormente. El ADN se precipito utilizando glicogeno 1 pl, acetato de amonio 150 pl 10M y 1125 pl de etanol. El ADN se precipito, se centrifugo, se lavo y se seco como se ha indicado anteriormente.
Las dietiquetas concatenadas se clonaron en pUC19 resuspendiendo el sedimento de ADN en pUC19 (ADN plasmfdico, aproximadamente 100 ng) cortado con Smal 3 pl y anadiendo mezcla de T4 ligasa 7 pl (tampon ligasa 10X 1 pl, agua 6 pl y T4 ligasa 0,2 pl [400 U]). La mezcla de plasmido/dietiqueta se incubo durante 2 horas a 16 °C y se utilizo 1 pl de la mezcla para transformar celulas DH10B qmmicamente competentes 100 pl. Los transformantes resistentes a amp se exploraron por PCR utilizando, como cebadores de la PCR, pUC/m13 directo/inverso de 17 meros. Despues, se secuenciaron los transformantes que contenfan las dietiquetas concatemerizadas.
Ejemplo 2
Analisis SARD de una poblacion definida
Se realizo SARD esencialmente como se describe en el Ejemplo 1. En este ejemplo, se mezclaron muestras de ADN genomico bacteriano disponibles en el comercio, a la misma concentracion (peso/volumen). Las muestras de ADN bacteriano utilizadas incluyeron Bacillus subtilis, Clostridium perfringens, Escherchia coli, Lactococcus lactis y Streptomyces coelicolor. Se mezclaron los mismos volumenes de las muestras de ADN (ADN genomico total) a una concentracion de 50 nD/pl, cada uno. El Cuadro I muestra el tamano de los genomas de cada especie bacteriana, el numero de copias de ADNr 16S por genoma y el porcentaje molar de copias de 16S por cada especie bacteriana en la muestra de ADN total.
Cuadro I
Bacteria
Genoma (Mb) Copias de 16S/Genoma % Molar
B. subtilis
4,2 10 17,2
C. perfringens
4,4 10 16,4
E. coli
4,6 7 11,0
L. lactics
2,4 10 30,7
S. coelicolor
8,0 6 5,4
Despues del SARD, se secuenciaron 120 etiquetas. El Cuadro II muestra el numero y el porcentaje de etiquetas esperado en comparacion con el numero y el porcentaje de etiquetas observado para la poblacion. Vease tambien la Fig. 14.
Cuadro II
Bacteria
Numero de etiquetas esperado Numero de etiquetas observado Porcentaje de etiquetas esperado Porcentaje de etiquetas observado
B. subtilis
21 44 17,2 % 36,7 %
C. perfringens
20 18 16,4 % 15,0 %
E. coli
13 8 11,0 % 6,7 %
L. lactis
37 35 30,7 % 29,2 %
S. coelicolor
6 6 5,4 % 5,0 %
Cada uno de los genes de ADNr de estas especies produjo una etiqueta SARD que era diferenciable de los otros miembros del conjunto. Como puede observarse, se encontraron aproximadamente el doble de etiquetas que correspondfan al ADNr de 16S de B. subtilis en comparacion con lo esperado, basandose en el porcentaje molar de ADNr 16S de B. subtilis. La observacion de que B. subtilis parecfa ser dos veces mas abundante que lo esperado ya se habfa descrito anteriormente. Farrelly et al. (Farrelly, V. F. et al., 1995, Effect of genome size and rrn gene copy number on PCR amplification of 16S rRNA genes from a mixture of bacterial species. Appl. Environ. Microbiol. 61(7): 2798-2801) describieron resultados similares cuando se amplificaba por PCR el gen de ADNr 16S de poblaciones
5
10
15
20
25
30
35
40
45
50
55
60
65
mixtas de ADN genomico. Llegaron a la conclusion de que este fenomeno era el resultado de la organizacion en tandem de los operones rrn en el genoma de B. subtilis donde genes de ADNr multiples pueden amplificarse como un solo producto. Las etiquetas restantes se descubrieron a abundancias proximas a los valores esperados (desviacion < 40 %).
Ejemplo 3
Analisis SARD de diversidad bacteriana ambiental
Para demostrar que el metodo SARD podia utilizarse para estudiar la diversidad bacteriana ambiental, se extrajo ADN total de dos muestras de suelo (Wy-1 y Wy-2) tomadas del Centro Rocky Mountain Oilfield Testing (RMOTC, Casper, Wyoming) en octubre del 2000. Las muestras se recogieron a una distancia de aproximadamente 8,05 km (0,5 millas) y a una profundidad de 0,36-0,46 m (14-18 pulgadas). Las muestras ambientales de ADN se sometieron a analisis SARD como se describe en el Ejemplo 1. En un analisis preliminar, se identificaron 148 etiquetas de la muestra Wy-1 y 234 etiquetas de la muestra Wy-2 (Figuras 15 y 16, respectivamente).
En la muestra Wy-1, se identificaron 58 etiquetas distintas y la abundancia de cada etiqueta variaba. La etiqueta mas abundante (ATGGCTGTCGTCAGCT) constituia aproximadamente el 34 % de la poblacion. Esta secuencia de etiqueta era identica a la de muchas secuencias bacterianas del GenBank y su posicion dentro del gen de ADNr 16S indica que se localizada en una region conservada localizada distal al sitio de restriccion AluI dirigido. En otras palabras, la contribucion del gen, o de los genes, de 16S en esta etiqueta no contenia el sitio AluI conservado. Dado que la posicion de etiqueta SARD la dictamina el primer sitio AluI distal al cebador marcado con biotina utilizado en la reaccion de PCR inicial, es probable que el primer sitio AluI en el gen o genes 16S contribuyentes se localice aguas abajo dentro de una region conservada. Para disminuir el numero de etiquetas que no contienen el sitio AluI conservado cerca de la region polimorfica, se puede purificar en gel los productos de la PCR de aproximadamente 100 pares de bases despues de la primera etapa de restriccion con AluI. Sin embargo, esto puede dar como resultado la perdida de alguna informacion. No obstante, el 39 % de las etiquetas (58/148) en este conjunto era diferente entre si. Veanse las Figuras 15 y 17.
Se descubrio que la muestra Wy-2 contenia 79 etiquetas diferentes de un total de 234 que se examinaron. Por tanto, el 34 % de las etiquetas (79/234) en este conjunto eran diferentes entre si. Veanse las Figuras 16 y 17. Como ocurrfa en el caso de la muestra Wy-1, la etiqueta ATGGCTGTCGTCAGCT, que representa una secuencia conservada en un gen de ADN 16S, era mas abundante y constituia aproximadamente el 30 % de la poblacion.
La combinacion de etiquetas de los dos conjuntos revela un total de 105 etiquetas diferentes de un total de 382 etiquetas. Por tanto, 26 de 58 etiquetas diferentes (45 %) en la muestra Wy-1 no estaban presentes en la muestra Wy-2. Del mismo modo, 47 de 79 etiquetas diferentes (59 %) en la muestra Wy-2 no estaban presentes en Wy-1. Las etiquetas que solo se encontraban en una de las muestras eran candidatas para bacterias con un valor indicador para diversos parametros asociados con cada muestra. Sin embargo, en este analisis preliminar no se intento obtener todas las etiquetas presentes en las dos muestras, por lo que no se puede llegar a la conclusion de que alguna o la mayorfa de las etiquetas encontradas en una muestra no esten presentes en la otra muestra. Por tanto, no se puede llegar a la conclusion de que en estas dos muestras haya etiquetas que sean indicadores para varios parametros asociados con cada muestra. No obstante, un analisis completo de estas muestras puede proporcionar dichos indicadores.
Ejemplo 4
Analisis en serie de etiquetas polimorficas de ADNr del dominio Arquea
El metodo descrito en el Ejemplo 1 tambien puede aplicarse para el dominio Arquea. El dominio Arquea esta constituido por dos reinos conocidos, Euriarqueota y Crenarqueota (Pace, N. R. 1997, A molecular view of microbial diversity and the biosphere. Science 276: 734-740). Para estudiar estos dos dominios puede utilizarse un conjunto de oligonucleotidos y de enzimas de restriccion.
En este ejemplo, se disenaron los siguientes oligonucleotidos: 5' biotina-
TA(CT)T(CT)CCCA(GA)GCGG(CT)(GCT)(GC)(GA)CTT(AGCT)-3' que corresponde a la posicion 817-838 del gen de ADNr 16S de Methanococcus jannaschii (numero de registro del GenBank M59126) y (5'- GGTG(TGC)CA(GC)C(CA)GCCGCGGTAA(TC)ACC(AGCT)-3' que corresponde a la posicion 457-481 del gen de ADNr 16S de Methanococcus jannaschii.
En este ejemplo, se utilizo un sitio Bfal (CTAG) que corresponde a la posicion 768-771 del gen de ADNr 16S de Methanococcus jannaschii. Este sitio flanquea inmediatamente una region polimorfica.
El metodo SARD se ensayo por ordenador utilizando 17 representantes del dominio Arquea (Figura 4). Quince de las etiquetas SARD que pudieron identificarse eran todas exclusivas para este conjunto (Tabla II). Dos especies del genero Methanobacterium no posefan ningun sitio BjaI en la region que podrfa amplificarse y por lo tanto no
5
10
15
20
25
30
35
40
45
50
55
60
65
producirfa ninguna etiqueta.
Ejemplo 5
Estudio de regiones de ADNr polimorficas amplificadas por PCR
Los cebadores oligonucleotfdicos que son complementarios a regiones conservadas que flanquean inmediatamente una region polimorfica pueden utilizarse para amplificar las secuencias de ADN polimorficas. Las secuencias de cebadores oligonucleotfdicos pueden incluir sitios de restriccion existentes o introducidos que permiten la clonacion subsecuencia en un vector bacteriano. Utilizando o introduciendo diferentes sitios de restriccion en cada cebador, los productos de la PCR digeridos por enzimas de restriccion pueden concatemerizarse de una manera unidireccional antes de la clonacion. Esta etapa permitirfa realizar un analisis de secuencias en serie de multiples regiones polimorficas a partir de un solo producto recombinante.
Ejemplo 6
Estudio de productos de traduccion de regiones polimorficas de ADNr 16S
Las regiones polimorficas de ADNr 16S tambien pueden investigarse identificando en paralelo los productos de traduccion de una region polimorfica determinada. Podrfan disenarse oligonucleotidos de tal manera que pudieran servir para amplificar una region polimorfica. El cebador en 5' tambien podrfa incluir un sitio de union a la polimerasa de T7 u otro sitio de union a la polimerasa, una secuencia consenso Kozak, un codon ATG iniciador y un epftopo para facilitar la purificacion. Como ejemplos de epftopos se incluyen hemaglutinina (HA), myc, Flag o polihistidina. Despues de la amplificacion, los productos se someten a transcripcion/traduccion in vitro para producir los productos peptfdicos. Estos peptidos se purifican del extracto celular y se analizan por espectrometrfa de masas. Este tipo de una estrategia se ha aplicado para la identificacion de mutaciones en el gen de BRCA1 (Garvin, A M. et al., 2000 MALDI-TOF based mutation detection using tagged in vitro synthesized peptides. Nature Biotechnol. 18: 95-97).
Aunque este proceso no proporciona rapidamente informacion de secuencia de ADN a partir de la cual deducir la taxonomfa, permitirfa la creacion de perfiles de diversidad microbiana constituidos por 'etiquetas de masa'. Estas etiquetas de masa podrfan utilizarse para identificar correlaciones entre etiquetas especfficas y diversos parametros de muestra. Para ensayar el contenido de la informacion de esta estrategia, se tradujo por ordenador una region polimorfica de los genes de ADNr 16S de las especies de la Figura 3. De las 34 regiones polimorficas examinadas, 32 produjeron una etiqueta con una masa unica en este conjunto (Tabla III).
Otra estrategia para traducir las regiones polimorficas amplificadas podrfa ser clonar y expresar las secuencias en celulas completas. Por ejemplo, podrfan disenarse oligonucleotidos para amplificar regiones polimorficas que incluyesen secuencias en los extremos 5' que permitiesen la clonacion por recombinacion homologa en levaduras. Estas secuencias podrfan clonarse en un casete de expresion para crear una fusion entre una protefna secretada, tal como factor alfa o invertasa, y un epftopo para facilitar la purificacion y la secuencia de aminoacidos traducida o de la region polimorfica de ADNr. La recombinacion homologa en levaduras es bastante solida y puede permitir facilmente el aislamiento de 103-104 recombinantes independientes en una sola placa de transformacion. Los productos secretados pueden aislarse del medio e identificarse por espectrometrfa de masas.
Ejemplo 7
Hibridacion de ADNr microbiano con oligonucleotidos inmovilizados
Una complicacion con el uso de sondas oligonucleotfdicas cortas en micromatrices de ADN es la inestabilidad de los duplex de oligonucleotidos cortos. Una posible solucion a este problema es sintetizar sondas que incluyan secuencias degeneradas para alojar secuencias desconocidas. La longitud de oligonucleotidos la dictamina el numero de degeneraciones, o de permutaciones por secuencia, que han de incluirse. Por ejemplo, un oligonucleotido nonamerico completamente degenerado requiere 49 o 262.144 secuencias oligonucleotfdicas diferentes. La hibridacion eficiente de oligonucleotidos nonamericos no es posible utilizando condiciones estandar. Una solucion ha sido incorporar una etapa de ligamiento en la hibridacion de una secuencia diana con una sonda oligonucleotfdica nonamerica (Gunderson, K. L. et al., 1998, Mutation detection by ligation to complete n-mer DNA arrays. Genome Res. 8: 1142-1153).
Otra solucion serfa aumentar de un modo eficaz la longitud del oligonucleotido incluyendo en el cebador nucleotidos que no sean degenerados. Esta estrategia podrfa aplicarse a un estudio de una comunidad microbiana construyendo sondas oligonucleotfdicas que estan compuestas por una region constante que corresponde a una region bien conservada de un gen de ADNr 16S junto con una secuencia degenerada que corresponde a la region polimorfica flanqueante.
Un ejemplo de dicha coleccion de oligonucleotidos degenerados para el dominio Bacteria podrfa incluir permutaciones del siguiente cebador: 5'-AACGAGCGCAACCNNNNNNNNN-3', donde N indica cualquier nucleotido
en esa posicion. Esta secuencia corresponde a la posicion 1101-1122 del gen de ADNr 16S de E. coli (numero de registro del GenBank E05133). Como alternativa, podrfan disenarse cebadores de tal manera que estuviesen compuestos por una mezcla de posiciones semidegeneradas (por ejemplo, A o G) y posiciones degeneradas (por ejemplo, A, G, C o T), de secuencia constante.
5
Especie
Desulfurobacterium thenvoiithotrophum Aquificales OPS132 no cultivada Bacteroides caccae Actinomyces bovis Actinomyces meyeri Denitrobacterium detoxiflcans Bacteria BPCI10 GNS no cultivada Bacteria GCA004 GNS no cultivada Bacteria GCA112 GNS no cultivada Acetobacter aceti Glnconobacter asati Burkholderia sp. 1B1 Denitrobacter permamns
Desulfobacter cun/atus Desulfobulbits sp. BG25 Legionella anisa
Cion SB-1 mineralizante de benceno
Escherichia coli
Tabla I*
N.° de registro del GenBank AJ001049 AF027104 XB3951 X81061 X82451 AF079507 AF154084 AF154104 AF154100 AF127399 AB024492 X92188 Y12639 M34413 U85473 X73394 AF029039 B05133
Secuencia de etiqueta GTCAGTTGCCGAAGCT GTCCGTGCCGTAAGCT
TTTCCGCGCCGTAGCT
TTTCTGCGCCGTAGCT
CCTCCGCGCCGCAGCT
CCCGGTAGTCCTAGCT
CATCGGTGCCGCAGCT
CGGCGGTGCCGTAGCT
ACTCAGTGTCGTAGCT
ACTCAGTGTCGAAGCT
CCTTAGTAACGAAGCT
CTGCTGTGCCNAAGCT
CCTCTGTGTCGCAGCT
CGXGGCTTCCGGAGCT
i\j
i\j
Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-2 no cultivada Acidobacterium Sub. Div-2 no cultivada Acidobacterium Sub. Div-3 no cultivada Acidobacterium Sub. Div-3 no cultivada Acidobacterium Sub. Div-3 no cultivada Acidobacterium Sub. Div-3 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada Acidobacterium Sub. Div-1 no cultivada
X68464
273363
Z73365
Z73368
Z73364
U68659
D2617X
X97101
X97098
AF04764S
AF05054B
U68612
Y07646
X97097
X68466
X68463
U68648
X684G7
AFQ13515
AF027004
CCGCCGTGCCGAAGCT
CGGCTGTGCCGAAGCT
CCACTGTGCCGTAGCT
CTGCTGTGCCGCAGCT
CTGCCGXGCCGGAGCT
CCAATGTGCCGGAGCT
CCGTCGTGCCGTAGCT
CCGTCGTGTCGTAGCT
CTGCCGTGTCGAAGCT
CTCCCGTGTCGAAGCT
CCGCCGTGCCGGAGCT
C TGAGGAACGAAAGC T
GTGTCGTCCCGGAGCT
GGGCTGTGCCGAAGCT
GGTCGGTGCCGGAGCT
GGTCGGTGCCAGAGCT
GGTTCGTGCCGGAGCT
TGTCTGTGCCGGAGCT
TATCCGTGCCGGAGCT
GGTCGGTGCCGGAGCT
Posicion
814-829
810-825
1021-1036
834-849
828-843
788- 803 765-780 824-839 826-841
782- 797
783- 798 837-852
789- 804 861-876 854-869
790- 805 1029-1044 848-863
813-828 521-536 521-536 521-536 521-536 319-334 779-794 687-702
798- 813 779-794
316- 331 226-241 830-845 804 819 796-811 796-811
317- 332 796-811
799- 814 778-793
Las secuencias mostradas en negrita con sombra indican que no son unicas para este conjunto.
Especie
Tabla II
N.° de registro del GenBank
Secuencia de etiqueta
Posicion
Crenarqueota
Aeropyrum pernix
D83259 CTAGGGGGCGGGAG 614-627
Desulfurococcus mobiles
M36474 CTAGGTGTTGGGTG 856-869
Staphylothermus marinus
X99560 CTAGGTGTTGGGCG 770-783
Metallosphaera sedula
X90481 CTAGGTGTCGCGTA 756-769
Sulfolobus acidocaldarius
D14053 CTAGGTGTCGAGTA 785-798
Sulfolobus metallicus
D85519 CTAGGTGTCACGTG 744-757
Caldivirga maquilingensis
AB013926 CTAGCTGTTGGGTG 773-786
Pyrobaculum islandicum
L07511 CTAGCTGTCGGCCG 781-794
Euriarqueota
Archaeoglohus fulgidus
X05567 CTAGGTGTCACCGA 780-793
Archaeoglobus veneficus
Y10011 CTAGGTGTCACCGG 758-771
Haloarcula japonica
D28872 CTAGGTGTGGCGTA 762-775
Halococcus morrhuae
D11106 CTAGGTGTGGCGTT 765-778
Methanococcus jannaschii
M59126 CTAGGTGTCGCGTC 768-781
Methanobacterium bryantii
AF028688 Ninguna
Methanobacterium subterraneum
X99045 Ninguna
Pyrococcus abyssi
Z70246 CTAGGTGTCGGGCG 767-780
Picrophilus oshimae
X84901 CTAGCTGTAAACTC 742-755
Tabla III
Especie N.° de registro del GenBank
Secuencia peptfdica P.M. Posicion
Desulfurobacterium
AJ001049 RAQPLSLVASG* 1097,40 1079-1136
thermolithotrophum Aquificales OPS132 no cultivada
AF027104 RAQPLSCVTSG* 1117,40 1074-1131
Bacteroides caccae
X83951 RAQPLSSVTNRSC* 1417,70 1069-1126
Actinomyces bovis
X81061 RAQPLSRVASTLWWGLAGD 2083,60 1088-1145
Actinomyces meyeri
X82451 RAQPLPYVASTLWWGLVGD 2128,60 1082-1139
Denitrobacterium detoxiflcans
AF079507 RAQPLPHVASIRLGTHGG 1866,50 1039-1094
Bacteria BPCI10 GNS no cultivada
AF154084 RAQPLLYVIRVIPD 1652,10 1074-1116
Bacteria GCA004 GNS no cultivada
AF154104 RAQPSLYVTRIIRD 1687,10 1080-1122
Bacteria GCA112 GNS no cultivada
AF154100 RAQPSPYVIRVIRD 1669,00 1082-1124
Acetobacter aceti
AF127399 RAQPLSLVASMFGWAL* 1746,30 1038-1095
Glnconobacter asati
AB024492 RAQPLSLVASTFRWAL* 1815,30 1034-1092
Burkholderia sp. 1B1
X92188 RAQPLSLVATQEHSRET 1922,20 1094-1144
Denitrobacter permamns
Y12639 RAQPLPLVATFSWAL* 1669,10 1077-1131
Desulfobacter curvatus
M34413 RAQPLSLVASTLCGNSNET 1960,40 1116-1172
Desulfobulbits sp. BG25
U85473 RAQPLPLVASSSAGHSKGT 1863,40 1114-1170
Legionella anisa
X73394 RAQPLSLVAST* 1141,40 1078-1135
Clon SB-1 mineralizante de benceno
AF029039 RAQPLPLVANRSSWGL* 1764,20 1077-1134
Escherichia coli
E05133 RAQPLSFVASGPAGNSKET 1916,30 1103-1159
Acidobacterium Sub. Div-1 no cultivada
Z73363 RAQPLSLVASGSSRAL* 1612,10 775-832
Acidobacterium Sub. Div-1 no cultivada
Z73365 RAQPLSSVAIGSSRATLAK 1912,50 777-835
Acidobacterium Sub. Div-1 no cultivada
Z73368 RAQPLFASCHH* 1933,50 779-835
Acidobacterium Sub. Div-1 no cultivada
Z73364 RAQPLFAQLPSFSWALCRN 2204,80 778-835
Acidobacterium Sub. Div-1 no cultivada
U68659 RAQPLLPXAII* 1218,70 573-630
Acidobacterium Sub. Div-1 no cultivada
D26171 RAQPLLPVATI* 1177,50 1035-1090
Acidobacterium Sub. Div-1 no cultivada
X97101 RAQPLSPVAII* 1163,50 943-998
Acidobacterium Sub. Div-1 no cultivada
X97098 RAQPLSSVATI* 1141,40 1054-1109
Acidobacterium Sub. Div-1 no cultivada
AP047646 RAQPLFLVATI* 1227,60 1035-1090
Acidobacterium Sub. Div-1 no cultivada
AF050548 RAQPSSLVANTLW* 1441,70 572-629
Acidobacterium Sub. Div-2 no cultivada
U68612 RAQPLUVVATRKRELYVD 2150,60 577-630
Acidobacterium Sub. Div-2 no cultivada
Y07646 RAQPLHWATPQGGTLRG 1857,30 1085-1140
Acidobacterium Sub. Div-3 no cultivada
X97097 RAQPSSLVANPQGKH P KGT 1972,40 1060-1116
Acidobacterium Sub. Div-3 no cultivada
U68648 RARPLSCVAII* 1197,70 574-629
Acidobacterium Sub. Div-3 no cultivada
AF013515 RAQPLSCVANPQGCTLRR 1969,50 1057-1112
Acidobacterium Sub. Div-3 no cultivada
AF027004 RAQPSPCVATPPRAGALSGD 1950,40 1036-1096
* Indica que en la secuencia polimorfica se encontro un codon de terminacion en marco

Claims (12)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un metodo para la construccion de una base de datos de perfiles de diversidad de marcadores (PDM) que comprende las etapas de:
    a) secuenciar una pluralidad de marcadores de ARNr de una muestra, en el que dicha muestra comprende una poblacion microbiana, y en el que cada marcador de ARNr comprende una secuencia polimorfica del gen del ARNr microbiano y en el que la pluralidad de marcadores de ARNr proporciona una representacion exacta de la poblacion microbiana de dicha muestra;
    b) determinar la abundancia, en dicha muestra, de cada una de dicha pluralidad de marcadores de ARNr;
    c) transducir la abundancia de cada marcador de ARNr en una senal de salida electrica;
    d) almacenar dichas senales de salida electrica producidas en la etapa c) en una estructura de datos matricial y asociar, en dicha estructura, cada senal de salida con la secuencia correspondiente del marcador de ARNr cuya abundancia se convirtio en una senal de salida;
    e) proporcionar las abundancias de uno o mas parametros de muestra que estan asociados a dicha muestra;
    f) transducir las abundancias de cada parametro de muestra en una senal de salida electrica;
    g) almacenar dichas senales de salida electrica producidas en la etapa f) en una estructura de datos matricial y asociar en dicha estructura cada senal de salida con el parametro de muestra cuya abundancia se convirtio en una senal de salida;
    h) disenar como PDM las senales de salida electrica producidas en la etapa c) correspondientes a la pluralidad de abundancias de marcadores de ARNr y las senales de salida electrica producidas en la etapa f) correspondientes a la una o mas abundancias de parametros de muestra; y
    i) repetir las etapas a-h para una pluralidad de muestras distintas, y disenar, como base de datos PDM, la pluralidad de PDM almacenados en dicha estructura de datos.
  2. 2. El metodo de acuerdo con la reivindicacion 1, en el que dicha abundancia de marcadores de ARNr es una abundancia relativa a la abundancia total de la pluralidad de marcadores de ARNr en la muestra.
  3. 3. El metodo de acuerdo con la reivindicacion 1 o 2, en el que dicho gen de ARNr microbiano es un gen de ARNr 16S.
  4. 4. El metodo de acuerdo con la reivindicacion 1 o 2, en el que dicha secuencia polimorfica del gen de ARNr microbiano es de la region intergenica entre un gen de ARNr 16S y un gen de ARNr 23S.
  5. 5. El metodo de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en el que la muestra se selecciona del grupo constituido por: una muestra de suelo, una muestra de roca, una muestra de agua, una muestra de aire, una muestra de hidrocarburo, una muestra de petroleo y una muestra de biopelfcula.
  6. 6. El metodo de acuerdo con una cualquiera de las reivindicaciones 1 a 5, en el que la muestra se obtiene del grupo constituido por: petroleo, hidrocarburos, un deposito de aceite, un deposito de gas, suelo, roca, agua, aire, una construccion y una carretera.
  7. 7. El metodo de acuerdo con la reivindicacion 6, en el que el parametro de muestra se selecciona del grupo constituido por: petroleo, hidrocarburos, aceite, gas, un compuesto inorganico, un mineral, pH, temperatura y salinidad.
  8. 8. El metodo de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en el que la muestra se obtiene del grupo constituido por: un ser humano, una planta, un animal, un producto alimentario, un cultivo celular y un cultivo tisular.
  9. 9. El metodo de acuerdo con la reivindicacion 8, en el que el parametro de muestra se selecciona del grupo constituido por: una patologfa aguda, una patologfa cronica, un estado fisiologico y una fase de desarrollo.
  10. 10. El metodo de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en el que el parametro de muestra es el tiempo, y en el que la pluralidad de muestras comprende una evolucion temporal.
  11. 11. El metodo de acuerdo con la reivindicacion 10, en el que la pluralidad de muestras comprende una evolucion temporal util para supervisar esfuerzos de remediacion ambiental o la produccion de campos petrolfferos.
  12. 12. Una base de datos de PDM construida y almacenada en la memoria de un ordenador de acuerdo con el metodo de una cualquiera de las reivindicaciones 1 a 11.
ES10012384.3T 2000-04-10 2001-04-10 Métodos para el estudio y análisis genético de poblaciones Expired - Lifetime ES2632538T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US19606300P 2000-04-10 2000-04-10
US196063P 2000-04-10
US19625800P 2000-04-11 2000-04-11
US196258P 2000-04-11

Publications (1)

Publication Number Publication Date
ES2632538T3 true ES2632538T3 (es) 2017-09-14

Family

ID=26891630

Family Applications (1)

Application Number Title Priority Date Filing Date
ES10012384.3T Expired - Lifetime ES2632538T3 (es) 2000-04-10 2001-04-10 Métodos para el estudio y análisis genético de poblaciones

Country Status (7)

Country Link
US (8) US6613520B2 (es)
EP (4) EP2278030B1 (es)
AU (1) AU2001253310A1 (es)
CA (1) CA2405629C (es)
DK (3) DK2278029T3 (es)
ES (1) ES2632538T3 (es)
WO (1) WO2001077392A2 (es)

Families Citing this family (205)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110166040A1 (en) * 1997-09-05 2011-07-07 Ibis Biosciences, Inc. Compositions for use in identification of strains of e. coli o157:h7
AU2001253310A1 (en) 2000-04-10 2001-10-23 Matthew Ashby Methods for the survey and genetic analysis of populations
WO2002010438A2 (en) * 2000-07-28 2002-02-07 The Johns Hopkins University Serial analysis of transcript expression using long tags
US7054828B2 (en) * 2000-12-20 2006-05-30 International Business Machines Corporation Computer method for using sample data to predict future population and domain behaviors
US7666588B2 (en) 2001-03-02 2010-02-23 Ibis Biosciences, Inc. Methods for rapid forensic analysis of mitochondrial DNA and characterization of mitochondrial DNA heteroplasmy
US7226739B2 (en) 2001-03-02 2007-06-05 Isis Pharmaceuticals, Inc Methods for rapid detection and identification of bioagents in epidemiological and forensic investigations
US20030027135A1 (en) 2001-03-02 2003-02-06 Ecker David J. Method for rapid detection and identification of bioagents
US20040121309A1 (en) 2002-12-06 2004-06-24 Ecker David J. Methods for rapid detection and identification of bioagents in blood, bodily fluids, and bodily tissues
US7718354B2 (en) 2001-03-02 2010-05-18 Ibis Biosciences, Inc. Methods for rapid identification of pathogens in humans and animals
US8073627B2 (en) 2001-06-26 2011-12-06 Ibis Biosciences, Inc. System for indentification of pathogens
US7217510B2 (en) 2001-06-26 2007-05-15 Isis Pharmaceuticals, Inc. Methods for providing bacterial bioagent characterizing information
CA2478722A1 (en) * 2002-03-05 2003-09-12 Solexa Limited Methods for detecting genome-wide sequence variations associated with a phenotype
US7323306B2 (en) * 2002-04-01 2008-01-29 Brookhaven Science Associates, Llc Genome signature tags
US7135310B2 (en) * 2002-04-24 2006-11-14 The Regents Of The University Of California Method to amplify variable sequences without imposing primer sequences
US8383342B2 (en) 2002-04-24 2013-02-26 The University Of North Carolina At Greensboro Compositions, products, methods and systems to monitor water and other ecosystems
US9126165B1 (en) 2002-04-24 2015-09-08 The University Of North Carolina At Greensboro Nucleic acid arrays to monitor water and other ecosystems
US8048623B1 (en) 2002-04-24 2011-11-01 The University Of North Carolina At Greensboro Compositions, products, methods and systems to monitor water and other ecosystems
US20040161767A1 (en) * 2002-06-28 2004-08-19 Baldwin Brett R. Detection and quantification of aromatic oxygenase genes by real-time PCR
GB0220798D0 (en) * 2002-09-06 2002-10-16 Statoil Asa Identification tool for hydrocarbon zones
EP1578399A4 (en) 2002-12-06 2007-11-28 Isis Pharmaceuticals Inc METHODS FOR RAPID IDENTIFICATION OF PATHOGENS IN HUMANS AND BEETS
NL1022152C2 (nl) * 2002-12-12 2004-06-18 Tno Procescontrole gebaseerd op analyse van microbiele populaties.
US20040177011A1 (en) * 2003-03-06 2004-09-09 Ramsay Jimmie A. Food contamination tracking system
US20100022414A1 (en) 2008-07-18 2010-01-28 Raindance Technologies, Inc. Droplet Libraries
ATE432996T1 (de) * 2003-04-14 2009-06-15 Bedrijfslaboratorium Voor Gron Verfahren zur bestimmung des bodenzustands
US8046171B2 (en) 2003-04-18 2011-10-25 Ibis Biosciences, Inc. Methods and apparatus for genetic evaluation
US8057993B2 (en) 2003-04-26 2011-11-15 Ibis Biosciences, Inc. Methods for identification of coronaviruses
US8158354B2 (en) 2003-05-13 2012-04-17 Ibis Biosciences, Inc. Methods for rapid purification of nucleic acids for subsequent analysis by mass spectrometry by solution capture
US7964343B2 (en) 2003-05-13 2011-06-21 Ibis Biosciences, Inc. Method for rapid purification of nucleic acids for subsequent analysis by mass spectrometry by solution capture
US20050026188A1 (en) * 2003-05-30 2005-02-03 Van Kessel Andrew G. Methods of identifying, characterizing and comparing organism communities
US7205111B2 (en) * 2003-07-24 2007-04-17 Marshfield Clinic Rapid identification of bacteria from positive blood cultures
US20100129811A1 (en) * 2003-09-11 2010-05-27 Ibis Biosciences, Inc. Compositions for use in identification of pseudomonas aeruginosa
US8546082B2 (en) 2003-09-11 2013-10-01 Ibis Biosciences, Inc. Methods for identification of sepsis-causing bacteria
US8097416B2 (en) 2003-09-11 2012-01-17 Ibis Biosciences, Inc. Methods for identification of sepsis-causing bacteria
US20120122101A1 (en) 2003-09-11 2012-05-17 Rangarajan Sampath Compositions for use in identification of bacteria
US8222005B2 (en) * 2003-09-17 2012-07-17 Agency For Science, Technology And Research Method for gene identification signature (GIS) analysis
US8163895B2 (en) 2003-12-05 2012-04-24 Ibis Biosciences, Inc. Compositions for use in identification of orthopoxviruses
US7666592B2 (en) 2004-02-18 2010-02-23 Ibis Biosciences, Inc. Methods for concurrent identification and quantification of an unknown bioagent
US8119336B2 (en) 2004-03-03 2012-02-21 Ibis Biosciences, Inc. Compositions for use in identification of alphaviruses
WO2005117270A2 (en) 2004-05-24 2005-12-08 Isis Pharmaceuticals, Inc. Mass spectrometry with selective ion filtration by digital thresholding
US20050266411A1 (en) 2004-05-25 2005-12-01 Hofstadler Steven A Methods for rapid forensic analysis of mitochondrial DNA
US7811753B2 (en) 2004-07-14 2010-10-12 Ibis Biosciences, Inc. Methods for repairing degraded DNA
US8084207B2 (en) 2005-03-03 2011-12-27 Ibis Bioscience, Inc. Compositions for use in identification of papillomavirus
CA2600184A1 (en) 2005-03-03 2006-09-08 Isis Pharmaceuticals, Inc. Compositions for use in identification of adventitious viruses
DK2620510T4 (da) 2005-06-15 2020-03-30 Complete Genomics Inc Enkeltmolekyle-arrays til genetisk og kemisk analyse
AU2006272776B2 (en) 2005-07-21 2012-01-19 Ibis Biosciences, Inc. Methods for rapid identification and quantitation of nucleic acid variants
GB0525523D0 (en) * 2005-12-15 2006-01-25 Macaulay Land Use Res Inst Genetic process
EP2010679A2 (en) 2006-04-06 2009-01-07 Ibis Biosciences, Inc. Compositions for the use in identification of fungi
US20080003142A1 (en) 2006-05-11 2008-01-03 Link Darren R Microfluidic devices
US20080124707A1 (en) * 2006-06-09 2008-05-29 Agency For Science, Technology And Research Nucleic acid concatenation
US9149473B2 (en) 2006-09-14 2015-10-06 Ibis Biosciences, Inc. Targeted whole genome amplification method for identification of pathogens
EP2099935B1 (en) * 2006-11-30 2014-02-26 The Regents Of The University Of California Array for detecting microbes
US8772046B2 (en) 2007-02-06 2014-07-08 Brandeis University Manipulation of fluids and reactions in microfluidic systems
EP2126132B1 (en) 2007-02-23 2013-03-20 Ibis Biosciences, Inc. Methods for rapid foresnsic dna analysis
WO2008130623A1 (en) 2007-04-19 2008-10-30 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
US20080281819A1 (en) * 2007-05-10 2008-11-13 The Research Foundation Of State University Of New York Non-random control data set generation for facilitating genomic data processing
WO2009023358A2 (en) * 2007-05-25 2009-02-19 Ibis Biosciences, Inc. Compositions for use in identification of strains of hepatitis c virus
US9598724B2 (en) 2007-06-01 2017-03-21 Ibis Biosciences, Inc. Methods and compositions for multiple displacement amplification of nucleic acids
WO2009038840A2 (en) * 2007-06-14 2009-03-26 Ibis Biosciences, Inc. Compositions for use in identification of adventitious contaminant viruses
GB2451287A (en) * 2007-07-26 2009-01-28 Envirogene Ltd Identification of hydrocarbon deposits through detection of a microbial polynucleotide
US8592150B2 (en) 2007-12-05 2013-11-26 Complete Genomics, Inc. Methods and compositions for long fragment read sequencing
US20110097704A1 (en) * 2008-01-29 2011-04-28 Ibis Biosciences, Inc. Compositions for use in identification of picornaviruses
US9074244B2 (en) * 2008-03-11 2015-07-07 Affymetrix, Inc. Array-based translocation and rearrangement assays
US20110177515A1 (en) * 2008-05-30 2011-07-21 Ibis Biosciences, Inc. Compositions for use in identification of francisella
US20110151437A1 (en) * 2008-06-02 2011-06-23 Ibis Biosciences, Inc. Compositions for use in identification of adventitious viruses
US12038438B2 (en) 2008-07-18 2024-07-16 Bio-Rad Laboratories, Inc. Enzyme quantification
CA2735250A1 (en) * 2008-07-30 2010-02-04 Nippon Steel Kankyo Engineering Co., Ltd. Universal nucleic acid probe set and method for utilization thereof
EP2349549B1 (en) 2008-09-16 2012-07-18 Ibis Biosciences, Inc. Mixing cartridges, mixing stations, and related kits, and system
EP2344893B1 (en) 2008-09-16 2014-10-15 Ibis Biosciences, Inc. Microplate handling systems and methods
EP2347254A2 (en) 2008-09-16 2011-07-27 Ibis Biosciences, Inc. Sample processing units, systems, and related methods
WO2010039755A1 (en) * 2008-10-02 2010-04-08 Ibis Biosciences, Inc. Compositions for use in identification of members of the bacterial genus mycoplasma
US20110200985A1 (en) * 2008-10-02 2011-08-18 Rangarajan Sampath Compositions for use in identification of herpesviruses
US20110183345A1 (en) * 2008-10-03 2011-07-28 Ibis Biosciences, Inc. Compositions for use in identification of streptococcus pneumoniae
US20110183346A1 (en) * 2008-10-03 2011-07-28 Ibis Biosciences, Inc. Compositions for use in identification of neisseria, chlamydia, and/or chlamydophila bacteria
US20110183343A1 (en) * 2008-10-03 2011-07-28 Rangarajan Sampath Compositions for use in identification of members of the bacterial class alphaproteobacter
WO2010039763A2 (en) * 2008-10-03 2010-04-08 Ibis Biosciences, Inc. Compositions for use in identification of antibiotic-resistant bacteria
US20110183344A1 (en) * 2008-10-03 2011-07-28 Rangarajan Sampath Compositions for use in identification of clostridium difficile
EP2396803A4 (en) 2009-02-12 2016-10-26 Ibis Biosciences Inc IONIZATION PROBE ASSEMBLIES
WO2010104798A1 (en) 2009-03-08 2010-09-16 Ibis Biosciences, Inc. Bioagent detection methods
WO2010114842A1 (en) 2009-03-30 2010-10-07 Ibis Biosciences, Inc. Bioagent detection systems, devices, and methods
WO2011008972A1 (en) 2009-07-17 2011-01-20 Ibis Biosciences, Inc. Systems for bioagent identification
WO2011008971A1 (en) 2009-07-17 2011-01-20 Ibis Biosciences, Inc. Lift and mount apparatus
WO2011014811A1 (en) 2009-07-31 2011-02-03 Ibis Biosciences, Inc. Capture primers and capture sequence linked solid supports for molecular diagnostic tests
WO2011017656A2 (en) 2009-08-06 2011-02-10 Ibis Biosciences, Inc. Non-mass determined base compositions for nucleic acid detection
US20110065111A1 (en) * 2009-08-31 2011-03-17 Ibis Biosciences, Inc. Compositions For Use In Genotyping Of Klebsiella Pneumoniae
ES2628739T3 (es) 2009-10-15 2017-08-03 Ibis Biosciences, Inc. Amplificación por desplazamiento múltiple
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9399797B2 (en) 2010-02-12 2016-07-26 Raindance Technologies, Inc. Digital analyte analysis
EP3392349A1 (en) 2010-02-12 2018-10-24 Raindance Technologies, Inc. Digital analyte analysis
US9758840B2 (en) * 2010-03-14 2017-09-12 Ibis Biosciences, Inc. Parasite detection via endosymbiont detection
WO2011159919A2 (en) 2010-06-16 2011-12-22 Conocophillips Company In situ methanogenesis modeling and risk analysis
WO2012016215A2 (en) * 2010-07-30 2012-02-02 Taxon Biosciences, Inc. Microbial bioindicators of hydrocarbons in water and in marine sediments and methods for making and using them
EP2614160B1 (en) 2010-09-10 2016-04-06 Bio-Rad Laboratories, Inc. Detection of rna-interacting regions in dna
CN103249844B (zh) 2010-10-14 2015-06-24 瑞昂尼克公司 目标核酸多标靶定量鉴定
EP2675913B1 (en) 2011-02-15 2016-12-14 Bio-Rad Laboratories, Inc. Detecting methylation in a subpopulation of genomic dna
EP2675819B1 (en) 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
DE202012013668U1 (de) 2011-06-02 2019-04-18 Raindance Technologies, Inc. Enzymquantifizierung
US8658430B2 (en) 2011-07-20 2014-02-25 Raindance Technologies, Inc. Manipulating droplet size
KR20140066782A (ko) * 2011-09-29 2014-06-02 루미넥스 코포레이션 가수분해 프로브
EP2776667B1 (en) 2011-11-11 2022-03-02 ExxonMobil Upstream Research Company Method and system for reservoir surveillance utilizing clumped isotope and noble gas data
US10330659B2 (en) 2011-11-11 2019-06-25 Exxonmobil Upstream Research Company Method for determining the location, size, and fluid composition of a subsurface hydrocarbon accumulation
CN102492022B (zh) * 2011-12-08 2013-05-29 重庆大学 一种新型抗老年痴呆症先导化合物
CA2860771C (en) * 2012-02-06 2018-10-23 Exxonmobil Upstream Research Company Method to determine location, size and in situ conditions in hydrocarbon reservoir with ecology, geochemistry, and biomarkers
EP3495817A1 (en) * 2012-02-10 2019-06-12 Raindance Technologies, Inc. Molecular diagnostic screening assay
US10941396B2 (en) 2012-02-27 2021-03-09 Becton, Dickinson And Company Compositions and kits for molecular counting
WO2013129457A1 (ja) * 2012-02-27 2013-09-06 東レ株式会社 核酸の検出方法
ES2632602T3 (es) 2012-06-28 2017-09-14 Taxon Biosciences, Inc. Métodos de fabricación o creación de un consorcio microbiano sintético identificado mediante análisis computacional de secuencias de amplicones
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
EP4397767A3 (en) 2012-08-14 2024-07-31 10X Genomics, Inc. Microcapsule compositions and methods
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2894694C (en) 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3998342A1 (en) 2013-02-08 2022-05-18 10X Genomics, Inc. Partitioning and processing of analytes and other species
US20140272959A1 (en) * 2013-03-14 2014-09-18 President And Fellows Of Harvard College Methods of Hybridizing Probes to Genomic DNA
ES2711168T3 (es) 2013-08-28 2019-04-30 Becton Dickinson Co Análisis masivo en paralelo de células individuales
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
JP2017504307A (ja) 2013-10-07 2017-02-09 セルラー リサーチ, インコーポレイテッド アレイ上のフィーチャーをデジタルカウントするための方法およびシステム
US20160273027A1 (en) * 2013-11-26 2016-09-22 Bio-Rad Laboratories, Inc. Methods for detecting nucleic acids proximity
US9944977B2 (en) 2013-12-12 2018-04-17 Raindance Technologies, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
RU2634793C1 (ru) 2014-03-07 2017-11-03 Эксонмобил Апстрим Рисерч Компани Способ разведки и система для обнаружения углеводородов по водяному столбу
WO2015147370A1 (en) * 2014-03-28 2015-10-01 Seegene, Inc. Detection of target nucleic acid sequences using different detection temperatures
EP3126524B1 (en) * 2014-04-04 2020-07-22 Affymetrix, Inc. Improved compositions and methods for molecular inversion probe assays
BR112016023625A2 (pt) 2014-04-10 2018-06-26 10X Genomics, Inc. dispositivos fluídicos, sistemas e métodos para encapsular e particionar reagentes, e aplicações dos mesmos
WO2015200893A2 (en) 2014-06-26 2015-12-30 10X Genomics, Inc. Methods of analyzing nucleic acids from individual cells or cell populations
EP3172337B1 (en) * 2014-07-23 2020-04-01 CONGEN Biotechnologie GmbH Method for the detection of sepsis
GB201413718D0 (en) * 2014-08-01 2014-09-17 Olink Ab Method for selecting a target nucleic acid sequence
US10094815B2 (en) 2014-09-18 2018-10-09 Exxonmobil Upstream Research Company Method to enhance exploration, development and production of hydrocarbons using multiply substituted isotopologue geochemistry, basin modeling and molecular kinetics
WO2016043982A1 (en) 2014-09-18 2016-03-24 Exxonmobil Upstream Research Company Method to determine the presence of source rocks and the timing and extent of hydrocarbon generation for exploration, production and development of hydrocarbons
EP3195022B1 (en) 2014-09-18 2020-04-29 Exxonmobil Upstream Research Company Method to enhance exploration, development and production of hydrocarbons using multiply substituted isotopologue geochemistry, basin modeling and molecular kinetics
US10494923B2 (en) 2014-09-18 2019-12-03 Exxonmobil Upstream Research Company Method to perform hydrocarbon system analysis for exploration, production and development of hydrocarbons
EP3193615A1 (en) 2014-09-19 2017-07-26 Taxon Biosciences, Inc. Plant growth-promoting microbes, compositions, and uses
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
KR102321863B1 (ko) 2015-01-12 2021-11-08 10엑스 제노믹스, 인크. 핵산 시퀀싱 라이브러리의 제조 방법 및 시스템 및 이를 이용하여 제조한 라이브러리
EP3250716B1 (en) * 2015-01-30 2021-07-07 President and Fellows of Harvard College Microscope-free imaging
EP3254100B1 (en) 2015-02-03 2020-02-19 Exxonmobil Upstream Research Company Applications of advanced isotope geochemistry of hydrocarbons and inert gases to petroleum production engineering
US10533414B2 (en) 2015-02-03 2020-01-14 Michael Lawson Applications of advanced isotope geochemistry of hydrocarbons and inert gases to petroleum production engineering
ES2975332T3 (es) 2015-02-19 2024-07-04 Becton Dickinson Co Análisis unicelular de alto rendimiento que combina información proteómica y genómica
EP4286516A3 (en) 2015-02-24 2024-03-06 10X Genomics, Inc. Partition processing methods and systems
ES2836802T3 (es) 2015-02-27 2021-06-28 Becton Dickinson Co Códigos de barras moleculares espacialmente direccionables
US11237146B2 (en) 2015-03-02 2022-02-01 Exxonmobil Upstream Research Company Field deployable system to measure clumped isotopes
EP3277843A2 (en) 2015-03-30 2018-02-07 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
US20160299129A1 (en) * 2015-04-07 2016-10-13 Xiaolei Qiu Ultra Sensitive and Specific Multiplex Biosensor System Based on Multiple Cooperative Interactions
WO2016172373A1 (en) * 2015-04-23 2016-10-27 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US11124823B2 (en) 2015-06-01 2021-09-21 Becton, Dickinson And Company Methods for RNA quantification
US9938558B2 (en) 2015-06-25 2018-04-10 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing microorganism strains from complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
WO2018126026A1 (en) 2016-12-28 2018-07-05 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing complete microorganism strains in complex heterogeneous communities, determining functional relationships and interactions thereof, and identifying and synthesizing bioreactive modificators based thereon
AU2016282996A1 (en) 2015-06-25 2018-01-18 Ascus Biosciences, Inc. Methods, apparatuses, and systems for analyzing microorganism strains from complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
US10851399B2 (en) 2015-06-25 2020-12-01 Native Microbials, Inc. Methods, apparatuses, and systems for microorganism strain analysis of complex heterogeneous communities, predicting and identifying functional relationships and interactions thereof, and selecting and synthesizing microbial ensembles based thereon
CN106435744B (zh) 2015-08-13 2022-02-01 生捷科技控股公司 使用y-接头和消失限制位点的文库构建
WO2017044574A1 (en) 2015-09-11 2017-03-16 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
CN108350499B (zh) * 2015-11-19 2022-05-13 10X基因组学有限公司 可转化标记组合物、方法及结合其的过程
JP6703824B2 (ja) * 2015-11-30 2020-06-03 シスメックス株式会社 細胞選択方法、細胞検出方法、細胞選択装置、および細胞検出装置
DK3882357T3 (da) 2015-12-04 2022-08-29 10X Genomics Inc Fremgangsmåder og sammensætninger til analyse af nukleinsyrer
EP3400285A4 (en) 2016-01-07 2019-09-18 Ascus Biosciences, Inc. METHOD FOR IMPROVING MILK PRODUCTION BY ADMINISTERING MICROBIAL CONSORTIA
US10822643B2 (en) 2016-05-02 2020-11-03 Cellular Research, Inc. Accurate molecular barcoding
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
EP4407625A2 (en) 2016-05-26 2024-07-31 Becton, Dickinson and Company Molecular label counting adjustment methods
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10724108B2 (en) 2016-05-31 2020-07-28 Exxonmobil Upstream Research Company Methods for isolating nucleic acids from samples
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CN107507823B (zh) * 2016-06-14 2022-12-20 三星电子株式会社 半导体封装和用于制造半导体封装的方法
WO2018005522A1 (en) 2016-07-01 2018-01-04 Exxonmobil Upstream Research Company Methods for identifying hydrocarbon reservoirs
US10132144B2 (en) 2016-09-02 2018-11-20 Exxonmobil Upstream Research Company Geochemical methods for monitoring and evaluating microbial enhanced recovery operations
CN109923213B (zh) 2016-09-20 2023-02-28 哈佛学院院长及董事 分子验证***
KR102522023B1 (ko) 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
US11015154B2 (en) 2016-11-09 2021-05-25 The Regents Of The University Of California Methods for identifying interactions amongst microorganisms
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
JP2020503048A (ja) 2016-12-28 2020-01-30 アスカス バイオサイエンシーズ, インコーポレイテッド トレーサー分析論による複雑な不均一コミュニティの微生物株の解析、その機能的関連性及び相互作用の決定、ならびに微生物アンサンブル(投与される微生物アンサンブル及び接種される微生物アンサンブルを含む)の合成、のための方法、装置、及びシステム
WO2018132610A1 (en) 2017-01-13 2018-07-19 Cellular Research, Inc. Hydrophilic coating of fluidic channels
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
US11044924B2 (en) 2017-04-28 2021-06-29 Native Microbials, Inc. Methods for supporting grain intensive and or energy intensive diets in ruminants by administration of a synthetic bioensemble of microbes or purified strains therefor
SG11201901822QA (en) 2017-05-26 2019-03-28 10X Genomics Inc Single cell analysis of transposase accessible chromatin
US20180340169A1 (en) 2017-05-26 2018-11-29 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CN110719959B (zh) 2017-06-05 2021-08-06 贝克顿迪金森公司 针对单细胞的样品索引
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
US11946095B2 (en) 2017-12-19 2024-04-02 Becton, Dickinson And Company Particles associated with oligonucleotides
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
US11649478B2 (en) * 2018-05-21 2023-05-16 ExxonMobil Technology and Engineering Company Identification of hot environments using biomarkers from cold-shock proteins of thermophilic and hyperthermophilic microorganisms
CN108866170A (zh) * 2018-07-13 2018-11-23 北京出入境检验检疫局检验检疫技术中心 一种基于pcr-dgge技术的沙门氏菌分型方法
EP3861134A1 (en) 2018-10-01 2021-08-11 Becton, Dickinson and Company Determining 5' transcript sequences
CN112969789A (zh) 2018-11-08 2021-06-15 贝克顿迪金森公司 使用随机引发的单细胞全转录组分析
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
CN113574178A (zh) 2019-01-23 2021-10-29 贝克顿迪金森公司 与抗体关联的寡核苷酸
WO2020214642A1 (en) 2019-04-19 2020-10-22 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
WO2021016239A1 (en) 2019-07-22 2021-01-28 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
EP4150118A1 (en) 2020-05-14 2023-03-22 Becton Dickinson and Company Primers for immune repertoire profiling
CN111705141B (zh) * 2020-06-29 2023-04-28 福州海关技术中心 一种荧光定量pcr检测鉴定乳状耳形螺的方法
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US11739443B2 (en) 2020-11-20 2023-08-29 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
US11668847B2 (en) 2021-01-04 2023-06-06 Saudi Arabian Oil Company Generating synthetic geological formation images based on rock fragment images
CN114015794B (zh) * 2022-01-06 2022-03-25 山东省中地易采石油技术有限责任公司 一种基于地质微生物群落特征的产液剖面图的构建方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5055397A (en) 1987-12-17 1991-10-08 Atlantic Richfield Company Geomicrobiological methods of ore and petroleum exploration
US5093236A (en) 1988-09-14 1992-03-03 Genecor International, Inc. Microbiological oil prospecting
US5700636A (en) * 1990-10-19 1997-12-23 Becton Dickinson And Company Methods for selectively detecting microorganisms associated with vaginal infections in complex biological samples
US5695937A (en) 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5866330A (en) 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5981190A (en) * 1997-01-08 1999-11-09 Ontogeny, Inc. Analysis of gene expression, methods and reagents therefor
AU2001253310A1 (en) 2000-04-10 2001-10-23 Matthew Ashby Methods for the survey and genetic analysis of populations

Also Published As

Publication number Publication date
CA2405629C (en) 2016-11-22
EP2278030B1 (en) 2017-05-24
AU2001253310A1 (en) 2001-10-23
US20150205915A1 (en) 2015-07-23
US20140011692A1 (en) 2014-01-09
US20130030714A1 (en) 2013-01-31
US20140011687A1 (en) 2014-01-09
EP2278029A3 (en) 2011-02-23
DK2278029T3 (en) 2016-10-03
US8476016B2 (en) 2013-07-02
US20130030712A1 (en) 2013-01-31
US20020065609A1 (en) 2002-05-30
DK2206791T3 (en) 2016-10-24
US6613520B2 (en) 2003-09-02
EP2278029A2 (en) 2011-01-26
EP2206791A3 (en) 2010-08-04
EP1313879A2 (en) 2003-05-28
WO2001077392B1 (en) 2003-07-03
DK2278030T3 (en) 2017-07-24
WO2001077392A3 (en) 2003-03-13
EP2278030A2 (en) 2011-01-26
US20040110183A1 (en) 2004-06-10
US8071295B2 (en) 2011-12-06
EP2278029B1 (en) 2016-07-13
CA2405629A1 (en) 2001-10-18
US20110251983A1 (en) 2011-10-13
EP2206791A2 (en) 2010-07-14
EP2206791B1 (en) 2016-07-13
WO2001077392A2 (en) 2001-10-18
EP2278030A3 (en) 2011-02-23

Similar Documents

Publication Publication Date Title
ES2632538T3 (es) Métodos para el estudio y análisis genético de poblaciones
Kirk et al. Methods of studying soil microbial diversity
Tiedje et al. Opening the black box of soil microbial diversity
Rastogi et al. Molecular techniques to assess microbial community structure, function, and dynamics in the environment
Widmer Genetic heterogeneity and PCR detection of Cryptosporidium parvum
Jiang et al. Portable platform for rapid in-field identification of human fecal pollution in water
Li et al. Complete genome sequence of a benzo [a] pyrene-degrading bacterium Altererythrobacter epoxidivorans CGMCC 1.7731 T
Lima-Junior et al. Characterization of mycobacteria and mycobacteriophages isolated from compost at the São Paulo Zoo Park Foundation in Brazil and creation of the new mycobacteriophage Cluster U
Boukhdoud et al. First DNA sequence reference library for mammals and plants of the Eastern Mediterranean Region
Björkholm et al. Genomics and proteomics converge on Helicobacter pylori
Petrisor et al. Microbial forensics
Ball et al. Microbial techniques for environmental forensics
Kushwaha et al. Advanced tools to assess microbial diversity and their functions in restoration of degraded ecosystems
Sehgal et al. Omic Technologies and Cold Adaptations
Rajeev et al. Culture-Dependent and-Independent Strategies in Bacterial Diversity Appraisal
Ablola et al. The Role of Molecular Systematics in Microbiological Research and Public Health: A Systematic Review
Ahmad et al. Deriving Microbial Community Fingerprints From Environmental Samples Using Advanced Molecular Fingerprinting Techniques
Roy et al. Microbial Metagenomics Developments for Environmental and Public Health Monitoring
Van Rossum Metagenomic analysis of river microbial communities
Krishna et al. Major Singh4 1Institute of Environment and Sustainable Development, Banaras Hindu University, Varanasi, India, 2Division of Vegetable Improvement, ICAR-Indian Institute of Vegetable Research, Varanasi, India, 3ICAR-National Bureau of Agriculturally Important
Ryan Microbial source tracking of human and animal waste pollution of diverse watersheds and of urban drainage systems using molecular methods
Hamm Bacterial community ecology and fate in integrated livestock production systems
Rich Joint Program in Oceanography/Applied Ocean Science and Engineering
Waters Investigation of DNA Profiling Methods for Forensic Examination of Soil Evidence
Surridge et al. The Environment and the Tools in Rhizo-and Bioremediation of Contaminated Soil