BR112019012958A2 - métodos e sistemas para análise de moléculas de ácido nucleico - Google Patents

métodos e sistemas para análise de moléculas de ácido nucleico Download PDF

Info

Publication number
BR112019012958A2
BR112019012958A2 BR112019012958A BR112019012958A BR112019012958A2 BR 112019012958 A2 BR112019012958 A2 BR 112019012958A2 BR 112019012958 A BR112019012958 A BR 112019012958A BR 112019012958 A BR112019012958 A BR 112019012958A BR 112019012958 A2 BR112019012958 A2 BR 112019012958A2
Authority
BR
Brazil
Prior art keywords
nucleic acid
dna
nucleic acids
molecules
population
Prior art date
Application number
BR112019012958A
Other languages
English (en)
Inventor
Diana Abdueva
Helmy Eltoukhy
Andrew Kennedy
Stefanie Ann Ward Mortimer
Matthew Schultz
Amirali Talasaz
Original Assignee
Guardant Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guardant Health Inc filed Critical Guardant Health Inc
Publication of BR112019012958A2 publication Critical patent/BR112019012958A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/107RNA dependent DNA polymerase,(i.e. reverse transcriptase)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/161Modifications characterised by incorporating target specific and non-target specific sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/131Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/514Detection characterised by immobilisation to a surface characterised by the use of the arrayed oligonucleotides as identifier tags, e.g. universal addressable array, anti-tag or tag complement array
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

a invenção proporciona métodos para processamento de populações de ácido nucleico contendo formas diferentes (por exemplo, rna e dna, de cadeia única ou de cadeia dupla), e/ou extensões de modificação (por exemplo, metilação de citosina, associação com proteínas). estes métodos acomodam formas múltiplas e/ou modificações de ácido nucleico em uma amostra, tal que a informação de sequência pode ser obtida de formas múltiplas. os métodos também preservam a identidade de formas múltiplas ou estados modificados através de processamento e análise, tal que a análise de sequência pode ser combinada com análise epigenética.

Description

Relatório Descritivo da Patente de Invenção para “MÉTODOS E SISTEMAS PARA ANÁLISE DE MOLÉCULAS DE ÁCIDO NUCLEICO”.
REFERÊNCIA À PEDIDOS DE PATENTE RELACIONADOS [0001] Este pedido reivindica o benefício das datas de prioridade dos Pedidos de Patente Provisório dos Estados Unidos 62/438.240, depositado em 2 de dezembro de 2016; 62/512.936, depositado em 31 de maio de 2017, e 62/550.540, depositado em 25 de agosto de 2017, todos dos quais são incorporados por referência aqui em sua totalidade.
ANTECEDENTES [0002] O câncer é uma causa maior de doença ao redor do mundo. Cada ano, dez milhões de pessoas são diagnosticadas com câncer ao redor do mundo, e mais do que metade eventualmente morrem de câncer. Em muitos países, o câncer se classifica como a segunda causa mais comum de morte em seguida às doenças cardiovasculares. A detecção precoce é associada com resultados melhorados para muitos cânceres.
[0003] O câncer pode ser causado pelo acúmulo de variações genéticas dentro de células normais individuais, pelo menos algumas das quais resultam em divisão de célula impropriamente regulada. Tais variações comumente incluem variações de número de cópia (CNVs), variações de nucleotídeo único (SNVs), fusões de gene, inserções e/ou anulações (indels), variações epigenéticas incluem 5-metilação de citosina (5-metilcitosina) e associação de DNA com cromatina e fatores de transcrição.
[0004] Os cânceres são frequentemente detectados por biópsias de tumores, seguido por análise de células, marcadores, ou DNA extraído de células. Mas mais recentemente tem sido proposto que os
Petição 870190078052, de 12/08/2019, pág. 6/238
2/194 cânceres podem também serem detectados de ácidos nucleicos de célula livre em fluidos corpóreos, tais como sangue ou urina. Tais testes apresentam a vantagem que eles são não-invasivos, e podem ser realizados sem identificação de células de câncer suspeitas na biópsia. Contudo, tais testes são complicados pela fato que a quantidade de ácidos nucleicos nos fluidos corpóreos é muito baixa, e quais ácidos nucleicos que estão presentes são heterogêneos na forma (por exemplo, RNA e DNA, de cadeia única e de cadeia dupla, e vários estados de modificação de pós-replicação e associação com proteínas, tais como histonas).
[0005] É desejável aumentar a sensibilidade dos ensaios de biópsia de líquido, enquanto que reduz-se a perda de circulação de ácido nucleico (material original), ou dados no processo.
RESUMO [0006] A revelação proporciona métodos, composições e sistemas para análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única. Em algumas concretizações, o método compreende (a) ligar pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico de etiqueta para distinguir as formas entre si, (b) amplificar as formas de ácido nucleico, pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiqueta de ácido nucleico ligada, se presentes, são amplificados, para produzir ácidos nucleicos amplificados, dos quais aqueles amplificados a partir da pelo menos uma forma são etiquetados; (c) ensaiar dado de sequência dos ácidos nucleicos amplificados, pelo menos alguns dos quais são etiquetados; e (d) decodificar moléculas de ácido nucleico de etiqueta dos ácidos nucleicos amplificados para reveler as formas de ácidos nucleicos na população proporcionando um modelo original
Petição 870190078052, de 12/08/2019, pág. 7/238
3/194 para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado.
[0007] Em algumas concretizações, o método compreende adicionalmente enriquecer pelo menos uma das formas relativas a uma ou mais das outras formas. Em algumas concretizações, pelo menos 70% das moléculas de cada forma de ácido nucleico na população são amplificadas na etapa (b). Em algumas concretizações, pelo menos três formas de ácido nucleico estão presentes na população, e pelo menos duas das formas são ligadas à formas diferentes de ácido nucleico de etiqueta distinguindo cada das três formas entre si. Em algumas concretizações, cada das pelo menos três formas de ácido nucleico na população é ligada a uma etiqueta diferente. Em algumas concretizações, cada molécula da mesma forma é ligada a uma etiqueta compreendendo a mesma identificação de etiqueta de informação (por exemplo, uma etiqueta com a mesma ou compreendendo a mesma sequência). Em algumas concretizações, moléculas da mesma forma são ligadas a tipos diferentes de etiquetas. Em algumas concretizações, a etapa (a) compreende: submeter a população a transcrição reversa com um primer etiquetado, no qual o primer etiquetado é incorporado no cDNA gerado do RNA na população. Em algumas concretizações, a transcrição reversa é específica de sequência. Em algumas concretizações, a transcrição reversa é aleatória. Em algumas concretizações, o método adicionalmente compreende degradar RNA duplexado ao cDNA. Em algumas concretizações, o método adicionalmente compreende separar DNA de cadeia única do DNA de cadeia dupla, e ligando etiquetas de ácido nucleico ao DNA de cadeia dupla. Em algumas concretizações, o DNA de cadeia única é separado por hibridização a uma ou mais sondas de captura. Em algumas concretizações, o método adicionalmente compreende diferencialmente etiquetação de DNA de cadeia única com uma etiqueta de cadeia úni
Petição 870190078052, de 12/08/2019, pág. 8/238
4/194 ca usando uma ligase que funciona em ácidos nucleicos de cadeia única, e DNA de cadeia dupla com adaptadores de cadeia dupla usando ligase que funciona em ácidos nucleicos de cadeia dupla. Em algumas concretizações, o método adicionalmente compreende antes do ensaio, reunir ácidos nucleicos etiquetados compreendendo formas diferentes de ácido nucleico. Em algumas concretizações, o método adicionalmente compreende analisar as reuniões de DNA repartido separadamente em ensaios individuais. Os ensaios podem ser os mesmos, substancialmente similares, equivalentes, ou diferentes. [0008] Em qualquer dos métodos acima, o dado de sequência pode indicar presença de uma variante somática ou variante de linha germinal, ou uma variação de número de cópia, ou uma variação de nucleotídeo único, ou um indel, ou fusão de gene.
[0009] A revelação proporciona adicionalmente um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação. Em alguns exemplos, a revelação proporciona métodos para classificação de características (por exemplo, 5’ metilcitosina) associadas com uma doença. O método compreende contatar a população de ácido nucleico com um agente (tal como um domínio ou proteína de ligação de metil) que preferencialmente se liga à ácidos nucleicos que suportam a modificação; separar uma primeira reunião de ácidos nucleicos ligados ao agente de uma segunda reunião de ácidos nucleicos não-ligados ao agente, no qual a primeira reunião de ácidos nucleicos são sobrerrepresentados para a modificação, e os ácidos nucleicos na segunda reunião são subrepresentados para a modificação; ligar os ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião para produzir uma população de ácidos nucleicos etiquetados; amplificar os ácidos nucleicos etiquetados, no qual os
Petição 870190078052, de 12/08/2019, pág. 9/238
5/194 ácidos nudeicos e as etiquetas ligadas são amplificadas; ensaiar dado de sequência dos ácidos nudeicos amplificados e etiquetas Hgadas; decodificar as etiquetas para revelar se os ácidos nudeicos para qual o dado de sequência foi ensaiado foram amplificados de modelos na primeira ou segunda reunião.
[0010] Em algumas concretizações, a modificação é ligação de ácidos nudeicos a uma proteína. Em algumas concretizações, a proteína é uma histona ou fator de transcrição. Em algumas concretizações, a modificação do ácido nucleico é uma modificação de pós-replicação a um nucleotídeo. Em algumas concretizações, a modificação de pósreplicação é 5-metilcitosina, e a extensão de ligação do agente de captura para ácidos nudeicos aumenta com a extensão de 5metildtosinas no ácido nucleico. Em algumas concretizações, a modificação de pós-replicação é 5-hidroximetilcitosina, e a extensão de ligação do agente para ácido nucleico aumenta com a extensão de 5hidroximetilcitosina no ácido nucleico. Em algumas concretizações, a modificação de pós-replicação é 5-formilcitosina ou 5-carboxilcitosina, e a extensão de ligação do agente aumenta com a extensão de 5formilcitosina ou 5-carboxilcitosina no ácido nucleico. Em algumas concretizações, a modificação de pós-replicação é N6-metiladenina. Em algumas concretizações, o método adicionalmente compreende lavagem dos ácidos nudeicos ligados ao agente, e coleta da lavagem como uma terceira reunião incluindo ácidos nudeicos com a modificação de pós replicação a uma extensão intermediária relativa à primeira e segunda reuniões. Alguns métodos adicionalmente compreendem, antes do ensaio, reunir ácidos nudeicos etiquetados a partir das primeira e segunda reuniões. Em algumas concretizações, o agente compreende um domínio de ligação de metil ou domínio de ligação de metil-CpG (MBD). O MBD pode ser uma proteína, um anticorpo, ou qualquer outro agente capaz de se ligar especificamente à modifica
Petição 870190078052, de 12/08/2019, pág. 10/238
6/194 ções de interesse. De preferência, o MBD adicionalmente compreende esferas magnéticas, estreptavidina, ou outros domínios de ligação para realização de uma etapa de separação de afinidade.
[0011] A revelação proporciona adicionalmente um método para analisar uma população de ácido nucleico na qual pelo menos alguns dos ácidos nucleicos incluem um ou mais resíduo de citosina modificados. O método compreende ligar frações de captura, por exemplo, biotina, à ácidos nucleicos na população para servir como modelos para amplificação; realizar uma tração de amplificação para produzir produtos de amplificação dos modelos; separar os modelos ligados às frações de captura dos produtos de amplificação; ensaiar dado de sequência dos modelos ligados às frações de captura por sequenciamento de bissulfeto; e ensaiar dado de sequência dos produtos de amplificação.
[0012] Em algumas concretizações, as frações de captura compreendem biotina. Em algumas concretizações, a separação é realizada por contato dos modelos com esferas de estreptavidina. Em algumas concretizações, os resíduos de citosina modificados são 5metilcitosina, 5-hidroximetil citosina, 5-formil citosina, ou 5carboxilcitosina. Em algumas concretizações, as frações de captura compreendem biotina ligada à etiquetas de ácido nucleico incluindo um ou mais resíduos modificados. Em algumas concretizações, as frações de captura são ligadas à ácido nucleico na população, via uma ligação de divagem. Em algumas concretizações, a ligação de divagem é uma ligação fotodivável. Em algumas concretizações, a ligação clivável compreende um uracil nucleotídeo.
[0013] A revelação proporciona adicionalmente um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de 5-metildtosina. O método compreende (a) contatar a população de ácido nucleico com um agente
Petição 870190078052, de 12/08/2019, pág. 11/238
7/194 que preferencialmente se liga à ácidos nucleicos 5-metilatados; (b) separar uma primeira reunião de ácidos nucleicos ligados ao agente de uma segunda reunião de ácidos nucleicos não-ligados ao agente, no qual as primeiras reuniões de ácidos nucleicos são sobrerrepresentadas por 5~metilcitosina, e os ácidos nucleicos na segunda reunião são subrrepresentados por 5-metilação; (c) ligar os ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião, no qual as etiquetas de ácido nucleico ligadas a ácidos nucleicos na primeira reunião compreendem uma fração de captura (por exemplo, biotina); (d) amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas são amplificados; (e) separar ácidos nucleicos amplificados que suportam a fração de captura dos ácidos nucleicos amplificados que não suportam a fração de captura; e (f) ensaiar dado de sequência dos ácidos nucleicos amplificados separados.
[0014] A revelação proporciona adicionalmente um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação, compreendendo: contatar os ácidos nucleicos na população com adaptadores para produzir uma população de ácidos nucleicos flanqueados por adaptadores compreendendo locais de ligação de primer; amplificar os ácidos nucleicos flanqueados por adaptadores iniciados a partir dos locais de ligação de primer; contatar os ácidos nucleicos amplificados com um agente que preferencialmente se ligam à ácidos nucleicos que suportam a modificação; separar uma primeira reunião de ácidos nucleicos ligados ao agente de uma segunda reunião de ácidos nucleicos nãoligados ao agente, no qual a primeira reunião de ácidos nucleicos são sobrerrepresentados para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação; realizar
Petição 870190078052, de 12/08/2019, pág. 12/238
8/194 uma segunda etapa de amplificação de ácidos nucleicos nas primeira e segunda reuniões; e ensaiar dado de sequência dos ácidos nucleicos amplificados nas primeira e segunda reuniões. A amplificação de cada reunião pode ocorrer separadamente em vasos de reação diferentes. O uso de etiquetas específicas de reunião permite reunião subsequente dos amplicons antes do sequenciamento.
[0015] A revelação proporciona adicionalmente um método de análise de uma população de ácido nucleico em que pelo menos alguns dos ácidos nucleicos incluem um ou mais resíduo de citosina modificados, compreendendo contatar a população de ácido nucleico com adaptadores compreendendo um local de ligação de primer compreendendo peio menos uma citosina modificada para formar ácidos nucleicos fianqueados pelos adaptadores; amplificar os ácidos nucleicos flanqueados pelos adaptadores iniciados a partir dos locais de ligação de primer nos adaptadores que flanqueiam um ácido nucleico; dividir os ácidos nucleicos amplificados em primeira e segunda alíquotas; ensaiar o dado de sequência nos ácidos nucleicos da primeira alíquota; contatar os ácidos nucleicos da segunda alíquota com bissulfito, que converte citosinas não-modificadas (C’s) em uracis (U’s); amplificar os ácidos nucleicos resultantes do tratamento com bissulfito iniciados a partir dos locais de ligação de primer que flanqueiam os ácidos nucleicos, no qual U's introduzidos pelo tratamento com bissulfito são convertidos em T!s; ensaiar dado de sequência nos ácidos nucleicos amplificados a partir da segunda alíquota; comparar o dado de sequência dos ácidos nucleicos nas primeira e segunda alíquotas para identificar quais nucleotídeos na população de ácido nucleico eram citosinas modificadas.
[0016] Em qualquer dos métodos acima, a população de ácido nucleico pode ser de uma amostra de fluido corpóreo, tal como sangue, soro, ou plasma. Em algumas concretizações, a população de ácido
Petição 870190078052, de 12/08/2019, pág. 13/238
9/194 nucleico é uma população de ácido nucleico livre de célula. Em algumas concretizações, a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer.
[0017] Em um aspecto aqui proporcionado, é um método de análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionada de DNA de cadeia dupla, DNA de cadeia única e RNA de cadeia única, o método, no qual cada das pelo menos duas formas compreende uma pluralidade de moléculas, compreendendo: ligar pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico de etiqueta para distinguir as formas entre si, amplificar as formas do ácido nucleico, pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiqueta de ácido nucleico ligada, são amplificados, para produzir ácidos nucleicos amplificados, dos quais aqueles amplificados a partir da pelo menos uma forma são etiquetados; ensaiar dado de sequência dos ácidos nucleicos amplificados pelo menos alguns dos quais são etiquetados; no qual o ensaio obtém informação de sequência suficiente para decodificar as moléculas de ácido nucleico de etiqueta dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado. Em uma concretização, o método adicionalmente compreende a etapa de decodificação das moléculas de ácido nucleico de etiqueta dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população proporcionando um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado. Em outra concretização, o método adicionalmente compreende enriquecer pelo menos uma das formas relativas a uma ou mais das outras formas.
Petição 870190078052, de 12/08/2019, pág. 14/238
10/194
Em outra concretização, pelo menos 70% das moléculas de cada forma de ácido nucleico na população são amplificadas. Em outra concretização, pelo menos três formas de ácido nucleico estão presentes na população, e pelo menos duas das formas são ligadas à diferentes formas de ácido nucleico de etiqueta que distinguem cada das três forms entre si. Em outra concretização, cada das pelo menos três forms de ácido nucleico na população é ligada à uma etiqueta diferente. Em outra concretização, cada molécula da mesma forma é ligada à uma etiqueta compreendendo a mesma informação de etiqueta. Em outra concretização, moléculas da mesma forma são ligadas à tipos diferentes de etiquetas. Em outra concretização, o método adicionalmente compreende submeter a população à transcrição reversa com um primer etiquetado, no qual o primer etiquetado é incorporado no cDNA gerado do RNA na população. Em outra concretização, a transcrição reversa é específica de sequência. Em outra concretização na qual a transcrição reversa é aleatória. Em outra concretização, o método adicionalmente compreende degrader o RNA duplexado ao cDNA. Em outra concretização, o método adicionalmente compreende separar DNA de cadeia única do DNA de cadeia dupla, e ligar etiqueta de ácido nucleicos ao DNA de cadeia dupla. Em outra concretização, o DNA de cadeia única é separado por hibridização a uma ou mais sondas de captura. Em outra concretização, o método adicionalmente compreende circularizer o DNA de cadeia única com uma circligase, e ligar etiquetas de ácido nucleico ao DNA de cadeia dupla. Em outra concretização, o método compreende, antes do ensaio, reunir ácidos nucleicos etiquetados compreendendo formas diferentes de ácido nucleico. Em outra concretização, a população de ácido nucleico é de uma amostra de fluido corpóreo. Em outra concretização, a amostra de fluido corpóreo é sangue, soro, ou plasma. Em outra concretização, a população de ácido nucleico é uma população de ácido nucleico livre
Petição 870190078052, de 12/08/2019, pág. 15/238
11/194 de célula. Em outra concretização, a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer. Em outra concretização, o dado de sequência indica presença de uma variante somática ou variante de linha germinal. Em outra concretização, o dado de sequência indica presença de uma variação de número de cópia. Em outra concretização, o dado de sequência indica presença de uma variação de nucieotídeo único (SNV), indel, ou fusão de gene. Em outra concretização, o dado de sequência indica presença de uma variação de nucieotídeo único (SNV), indel, ou fusão de gene.
[0018] Em outro aspecto, é aqui proporcionado um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação, compreendendo: contatar a população de ácido nucleico com um agente que preferencialmente se liga à ácidos nucleicos que suportam a modificação, separação de uma primeira reunião de ácidos nucleicos ligados ao agente de uma segunda reunião de ácidos nucleicos não-ligados ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação; ligar os ácidos nucleicos na primeira reunião e/ou na segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião para produzir uma população de ácidos nucleicos etiquetados; amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas são amplificados; e, ensaiar dado de sequência dos ácidos nucleicos amplificados e etiquetas ligadas; no qual o ensaio obtém dado de sequência para decodificação das etiquetas para revelar se os ácidos nucleicos para qual dado de sequência foi ensaiado foram amplificados de modelos na primeira ou na segunda reunião. Em uma concretização, o método compreende a etapa de decodificação das etiquetas para revelar se os ácidos nuclei
Petição 870190078052, de 12/08/2019, pág. 16/238
12/194 cos para qual dado de sequência foi ensaiado foram amplificados de modelos na primeira ou na segunda reunião. Em outra concretização, a modificação é ligar os ácidos nucleicos à uma proteína. Em outra concretização, a proteína é uma histona, ou fator de transcrição. Em outra concretização, a modificação é uma modificação de pósreplicação à um nucleotídeo. Em outra concretização, a modificação de pós-replicação é 5-metil-citosina, e a extensão de ligação do agente para ácidos nucleicos aumenta com a extensão de 5-metil-citosinas nos ácidos nucleicos. Em outra concretização, a modificação de pósreplicação é 5-hidroximetil-citosina, e a extensão de ligação do agente para ácido nucleico aumenta com a extensão de 5-hidroximetil-citosina no ácido nucleico. Em outra concretização, a modificação de pósreplicação é 5-formil-citosina ou 5-carboxil-citosina, e a extensão de ligação do agente aumenta com a extensão de 5~formil~citosina, ou 5carboxil-citosina, no ácido nucleico. Em outra concretização, o método adicionalmente compreende lavagem dos ácidos nucleicos ligados ao agente, e coleta da lavagem como uma terceira reunião incluindo ácidos nucleicos com a modificação de pós replicação em uma extensão intermediária relativa às primeira e segunda reuniões. Em outra concretização, o método compreende, antes do ensaio, reunir ácidos nucleicos etiquetados das primeira e segunda reuniões. Em outra concretização, o agente é esferas magnéticas de domínio de ligação de 5metil. Em outra concretização, a população de ácido nucleico é de uma amostra de fluido corpóreo. Em outra concretização, a amostra de fluido corpóreo é sangue, soro, ou plasma. Em outra concretização, a população de ácido nucleico é uma população de ácido nucleico livre de célula. Em outra concretização, a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer. Em outra concretização, o dado de sequência indica presença de uma variante somática, ou variante de linha germinal. Em outra concretização, o dado de sequên
Petição 870190078052, de 12/08/2019, pág. 17/238
13/194 cia indica presença de uma variação de número de cópia. Em outra concretização, o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene.
[0019] Em outro aspecto, é aqui proporcionado um método de análise de uma população de ácido nucleico na qual pelo menos alguns dos ácidos nudeicos incluem um ou mais resíduos de citosina modificados, compreendendo ligar frações de captura à ácidos nudeicos na população, cujos ácidos nudeicos servem como modelos para amplificação; realizar uma reação de amplificação para produzir produtos de amplificação dos modelos; separar os modelos ligados para capturar etiquetas de produtos de amplificação; ensaiar dado de sequência dos modelos ligados para capturar etiquetas por sequenciamento de bissulfito; e ensaiar dado de sequência dos produtos de amplificação. Em uma concretização, as frações de captura compreendem biotina. Em outra concretização, a separação é realizada por contato dos modelos com esferas de estreptavidina. Em outra concretização, os resíduos de citosina modificados são 5-metil-citosina, 5-hidroximetil citosina, 5formil citosina, ou 5-carboxil citosina. Em outra concretização, as frações de captura compreendem biotina ligada às etiquetas de ácido nucleico incluindo um ou mais resíduos modificados. Em outra concretização, as frações de captura são ligadas à ácido nucleico na população, via uma ligação clivável. Em outra concretização, a ligação clivável é uma ligação fotoclivável. Em outra concretização, a ligação clivável compreende um nucleotídeo uracil. Em outra concretização, a população de ácido nucleico é de uma amostra de fluido corpóreo. Em outra concretização, a amostra de fluido corpóreo é sangue, soro, ou plasma. Em outra concretização, a população de ácido nucleico é uma população de ácido nucleico livre de célula. Em outra concretização, a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer. Em outra concretização, o dado de sequência indica presença
Petição 870190078052, de 12/08/2019, pág. 18/238
14/194 de uma variante somática, ou variante de linha germinal. Em outra concretização, o dado de sequência indica presença de uma variação de número de cópia. Em outra concretização, o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene.
[0020] Em outro aspecto, é aqui proporcionado um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de 5-metiylação, compreendendo: contatar a população de ácido nucleico com um agente que preferencialmente se liga à ácidos nucleicos 5-metllatados; separar uma primeira reunião de ácidos nucleicos ligados ao agente de uma segunda reunião de ácidos nucleicos não-ligados ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para 5-metilação, e os ácidos nucleicos na segunda reunião são subrrepresentados para 5-metilação; ligar os ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião, no qual as etiquetas de ácido nucleico ligadas aos ácidos nucleicos na primeira reunião compreendem uma fração de captura (por exemplo, biotina); amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas são amplificados; separar ácidos nucleicos amplificados que suportam a fração de captura dos ácidos nucleicos amplificados que não suportam a fração de captura; e ensaiar dado de sequência dos ácidos nucleicos amplificados separados.
[0021] Em outro aspecto, é aqui proporcionado um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação, compreendendo: contatar os ácidos nucleicos na população com adaptadores para produzir uma população de ácidos nucleicos flanqueados pelos adaptadores compreendendo locais de ligação de primer; amplificar os ácidos
Petição 870190078052, de 12/08/2019, pág. 19/238
15/194 nucleicos flanqueados pelos adaptadores iniciados dos locais de ligação de primer; contatar os ácidos nucleicos amplificados com um agente que preferencialmente se liga à ácidos nucleicos que suportam a modificação; separar uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos não-ligada ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação; realizar amplificações paralelas de ácidos nucleicos etiquetados nas primeira e segunda reuniões; e ensaiar dado de sequência dos ácidos nucleicos amplificados nas primeira e segunda reuniões. Em outra concretização, os adaptadores são adaptadores de grampo de cabelo.
[0022] Em outro aspecto, é aqui proporcionado um método de análise de uma população de ácido nucleico na qual pelo menos alguns dos ácidos nucleicos incluem um ou mais resíduos de citosina modificados, compreendendo contatar a população de ácido nucleico com adaptadores compreendendo um local de ligação de primer compreendendo uma citosina modificada para formar ácidos nucleicos flanqueados por adaptadores; amplificar os ácidos nucleicos flanqueados pelos adaptadores iniciados dos locais de ligação de primer nos adaptadores que flanqueiam um ácido nucleico; dividir os ácidos nucleicos amplificados nas primeira e segunda alíquotas; ensaiar dado de sequência nos ácidos nucleicos da primeira alíquota; contatar os ácidos nucleicos da segunda alíquota com bissulfito, que converte Cs a U não-modlficados; amplificar os ácidos nucleicos resultantes do tratamento com bissulfito iniciado dos locais de ligação de primer que flanqueiam os ácidos nucleicos, no qual U's introduzidos pelo tratamento com bissulfito são convertidos a Ts; e, ensaiar dado de sequência dos ácidos nucleicos amplificados a partir da segunda alíquota; no qual o ensaio produz dado de sequência que pode ser usado para comparar
Petição 870190078052, de 12/08/2019, pág. 20/238
16/194 o dado de sequência dos ácidos nucieicos na primeira e segunda alíquota para identificar quais nucleotídeos na população de ácido nucleico eram citosinas modificadas. Em uma concretização, o método compreende comparar o dado de sequência dos ácidos nucieicos na primeira e segunda alíquota para identificar quais nucleotídeos na população de ácido nucleico geram citosinas modificadas. Em outra concretização, os adaptadores são adaptadores de grampo de cabelo. [0023] Em outro aspecto, é aqui proporcionado um método, compreendendo: fracionar fisicamente moléculas de DNA de uma amostra humana para gerar duas ou mais divisões; aplicar etiquetas moleculares diferenciais e adaptadores de capacitação de NSG para cada das duas ou mais divisões para gerar divisões etiquetadas moleculares; ensaiar as divisões etiquetadas moleculares em um instrumento de NGS para gerar dado de sequência para desconvolução da amostra nas moléculas que foram diferencialmente divididas. Em uma concretização, o método adicionalmente compreende analisar o dado de sequência por desconvolução da amostra nas moléculas que foram diferencialmente divididas. Em outra concretização, as moléculas de DNA são de plasma de sangue extraído. Em outra concretização, o fracionamento físico compreende o fracionamento de moléculas baseadas em vários graus de metilação. Em outra concretização, vários graus de metilação compreendem hipermetilação e hipometilação. Em outra concretização, fracionar fisicamente compreende fracionar com esferas de proteína de domínio de ligação de metil (“MBD”) para estratificar em vários graus de metilação. Em outra concretização, as etiquetas moleculares diferenciais são conjuntos diferentes de etiquetas moleculares correspondentes a uma divisão de MBD. Em outra concretização, o fracionamento físico compreende separar moléculas de DNA usando imunoprecipitação. Em outra concretização, o método adicíonalmente compreende recombinar duas ou mais frações etiquetadas molecula
Petição 870190078052, de 12/08/2019, pág. 21/238
17/194 res das frações etiquetadas moleculares geradas. Em outra concretização, o método adicionalmente compreende enriquecer as frações etiquetadas moleculares recombinadas ou grupos. Em outra concretização, a uma ou mais características é metilação. Em outra concretização, o fracionamento compreende separar ácidos nucleicos metilatados de ácidos nucleicos não-metilatados usando proteínas compreendendo um domínio de ligação de metil para gerar grupos de moléculas de ácido nucleico compreendendo graus variantes de metilação. Em outra concretização, um dos grupos compreende DNA hipermetilatado. Em outra concretização, pelo menos um grupo é caracterizado por um grau de metilação. Em outra concretização, o fracionamento compreende isolar ácidos nucleicos ligados à proteína. Em outra concretização, o isolamento compreende imunoprecipitaçâo.
[0024] Em outro aspecto, é aqui proporcionado um método para identificação de etiqueta molecular de MBD-bibliotecas fracionadas de esfera através de NGS, compreendendo: fracionamento físico de uma amostra de DNA extraída usando um kit de domínio de ligação de metil proteína-purificação de esfera, economizando todas as eluições para processamento à jusante; aplicação paralela de etiquetas moleculares diferenciais e sequências de adaptador de capacitação de NSG a cada fração ou grupo; recombinar todas as frações etiquetadas moleculares ou grupos, e subsequente amplificação usando sequências de primer de DNA específica de adaptador; (d) enriquecimento/hibridização de biblioteca recombinada e amplificada total, direcionar regiões genômicas de interesse; re-ampllficação da biblioteca de DNA total enriquecida, anexar uma etiqueta de amostra; e reunir amostras diferentes, e ensaiá-las em multiplex em um instrumento de NGS; no qual dado de sequência de NGS produzido pelo instrumento proporciona sequência das etiquetas moleculares sendo usadas para identificar moléculas únicas, e dado de sequência para desconvolução
Petição 870190078052, de 12/08/2019, pág. 22/238
18/194 da amostra em moléculas que foram diferencialmente divididas por MBD. Em uma concretização, o método compreende realizar análise de dados de NGS, com as etiquetas moleculares sendo usadas para identificar moléculas únicas, também desconvolução da amostra em moléculas que foram diferencialmente divididas por MBD. Em outra concretização, o fracionamento compreende fracionamento físico. Em outra concretização, a população de moléculas de ácido nucleico é dividida baseado em uma ou mais características selecionadas a partir do grupo consistindo de: estado de metilação, estado de giicosilação, modificação de histona, comprimento e posição de partida/parada. Em outra concretização, o método adicionalmente compreende reunir as moléculas de ácido nucleico. Em outra concretização, o fracionamento compreende fracionamento baseado em uma diferença em um perfil de mono-nucleosomal. Em outra concretização, o fracionamento é capaz de gerar perfis mononucleosomal diferentes para pelo menos um grupo de moléculas de ácido nucleico quando comparado a um normal. Em outra concretização, o método adicionalmente compreende fracionamento de pelo menos um grupo de moléculas de ácido nucleico baseado em uma característica diferente. Em outra concretização, a análise compreende, em um ou mais locais, comparar uma primeira característica correspondente a um primeiro grupo de moléculas de ácido nucleico a uma segunda característica correspondente a um segundo grupo de moléculas de ácido nucleico. Em outra concretização, as moléculas de ácido nucleico estão circulando o DNA do tumor. Em outra concretização, as moléculas de ácido nucleico são DNA de célula livre (“cada”). Em outra concretização, as etiquetas são usadas para distinguir moléculas diferentes da mesma amostra. Em outra concretização, a uma ou mais característica é um marcador de câncer.
[0025] Em outro aspecto, é aqui proporcionado um método compreendendo: proporcionar uma população de moléculas de ácido nu
Petição 870190078052, de 12/08/2019, pág. 23/238
19/194 cleico obtida de uma amostra corpórea de um indivíduo; fracionar a população de moléculas de ácido nucleico baseado em uma ou mais características para gerar uma pluralidade de grupos de moléculas de ácido nucleico, etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características; sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; conter dado suficiente para gerar informação relativa sobre posicionamento de nucleossomo, modificação de nucleossomo, ou DNA de ligação-interação de proteína para cada da pluralidade de grupos de moléculas de ácido nucleico. Em uma concretização, o método adicionalmente compreende analisar as leituras de sequência para gerar informação relativa sobre posicionamento de nucleossomo, modificação de nucleossomo, ou ligação de DNA-interação de proteína para cada da pluralidade de grupos de moléculas de ácido nucleico. Em outra concretização, o método adicionalmente compreende usar um classificador treinado para classificar o indivíduo baseado na uma ou mais características. Em outra concretização, a uma ou mais características compreende uma característica quantitativa das leituras mapeadas. Em outra concretização, o fracionamento compreende fracionamento físico. Em outra concretização, o método adicionalmente compreende reunir as moléculas de ácido nucleico. Em outra concretização, o fracionamento compreende fracionamento baseado em uma diferença em um perfil mono-nucleossomai. Em outra concretização, o fracionamento é capaz de gerar perfis mononucleossomal diferentes para pelo menos um grupo de moléculas de ácido nucleico quando comparados a um normal. Em outra concretização, o método adicionalmente compreende o fracionamento de pelo menos um grupo de moléculas de ácido nucleico baseado em uma característica diferente. Em outra concretização, a análise compreen
Petição 870190078052, de 12/08/2019, pág. 24/238
20/194 de, em um ou mais tocais, comparar uma primeira característica correspondente a um primeiro grupo de moléculas de ácido nucleico a uma segunda característica correspondente a um segundo grupo de moléculas de ácido nucleico. Em outra concretização, a análise compreende analisar uma característica da uma ou mais características em um grupo relativo a uma amostra normal em um ou mais locais. Em outra concretização, a uma ou mais características são selecionadas a partir do grupo consistindo de: uma frequência denominada de base em uma posição de base na sequência de referência, um número de moléculas que mapeiam para uma base ou sequência na sequência de referência, um número de moléculas tendo um local de partida que mapeia para uma posição de base na sequência de referência, e um número de moléculas tendo um local de parada que mapeia para uma porção de base na sequência de referência, e um comprimento de uma molécula que mapeia para um local na sequência de referência. Em outra concretização, o método adicionalmente compreende usar um classificador treinado para classificar o indivíduo baseado na uma ou mais características. Em outra concretização, o classificador treinado classifica a uma ou mais características conforme associadas com um tecido no indivíduo. Em outra concretização, o classificador treinado classifica a uma ou mais características conforme associadas com um tipo de câncer no indivíduo. Em outra concretização, a uma ou mais características são indicativas de expressão de gene ou estado de uma doença. Em outra concretização, as moléculas de ácido nucleico estão circulando o DNA do tumor. Em outra concretização, as moléculas de ácido nucleico são DNA de célula livre (“cfDNA”). Em outra concretização, as etiquetas são usadas para distinguir moléculas diferentes na mesma amostra. Em outra concretização, a uma ou mais características é um marcador de câncer.
[0026] Em outro aspecto, é aqui proporcionado um método, com
Petição 870190078052, de 12/08/2019, pág. 25/238
21/194 preendendo: proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo; fracionamento da população de moléculas de ácido nucleico baseado no estado de metilação para gerar uma pluralidade de grupos de moléculas de ácido nucleico; etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características; sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; e analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou a DNA-interação de proteína. Em outra concretização, o método adicionalmente compreende usar um classificador treinado para classificar o indivíduo baseado na uma ou mais características. Em outra concretização, a uma ou mais características compreendem uma característica quantitativa das leituras mapeadas. Em outra concretização, o fracionamento compreende fracionamento físico. Em outra concretização, o método adicionalmente compreende reunir as moléculas de ácido nucleico. Em outra concretização, o fracionamento compreende fracionamento baseado em uma diferença em um perfil mono-nucleossomal. Em outra concretização, o fracionamento é capaz de gerar perfis mononucleossomal diferentes para pelo menos um grupo de moléculas de ácido nucleico quando comparado a um normal. Em outra concretização, o método adicionalmente compreende o fracionamento de pelo menos um grupo de moléculas de ácido nucleico baseado em uma característica diferente. Em outra concretização, a análise compreende, em um ou mais locais, comparar uma primeira característica correspondente a um primeiro grupo de moléculas de ácido nucleico a uma segunda característica
Petição 870190078052, de 12/08/2019, pág. 26/238
22/194 correspondente a um segundo grupo de moléculas de ácido nucleico. Em outra concretização, a análise compreende analisar uma característica da uma ou mais características em um grupo relativo a uma amostra normal em um ou mais locais. Em outra concretização, a uma ou mais características são selecionadas a partir do grupo consistindo de: uma frequência denominada de base em uma porção de base na sequência de referência, um número de moléculas que mapeiam em uma base ou sequência na sequência de referência, um número de moléculas tendo um local de partida que mapeia para uma porção de base na sequência de referência, e um número de moléculas tendo um local de parada que mapeia para uma porção de base na sequência de referência, e um comprimento de uma molécula que mapeia para um local na sequência de referência. Em outra concretização, o método adicionalmente compreende usar um classificador treinado para classificar o indivíduo baseado na uma ou mais características. Em outra concretização, o classificador treinado classifica a uma ou mais características conforme associadas com um tecido no indivíduo. Em outra concretização, o classificador treinado classifica a uma ou mais características conforme associadas com um tipo de câncer no indivíduo. Em outra concretização, a uma ou mais características são indicativas de expressão de gene ou estado de uma doença. Em outra concretização, as moléculas de ácido nucleico estão circulando o DNA do tumor. Em outra concretização, as moléculas de ácido nucleico são DNA de célula livre (“cfDNA”). Em outra concretização, as etiquetas são usadas para distinguir moléculas diferentes na mesma amostra. Em outra concretização, a um ou mais característica é um marcador de câncer.
[0027] Em outro aspecto, é aqui proporcionado um método, compreendendo: proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo; fracionar a
Petição 870190078052, de 12/08/2019, pág. 27/238
23/194 população de moléculas de ácido nucleico para gerar uma pluralidade de grupos de moléculas de ácido nucleico compreendendo ácidos nucleicos de célula livre ligados à proteína: etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseados na uma ou mais características; e sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; no qual a informação de sequência obtida é suficiente para mapeamento das leituras de sequência em um ou mais locais em uma sequência de referência; e para análise das leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou a DNA-interação de proteína. Em uma concretização, o método adicionalmente compreende mapear as leituras de sequência em um ou mais locais em uma sequência de referência; e analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou a DNA-interação de proteína. Em outra concretização, o método adicionalmente compreende usar um classificador treinado para classificar o indivíduo baseado na uma ou mais características. Em outra concretização, a uma ou mais características compreendem uma característica quantitativa das leituras mapeadas. Em outra concretização, o fracionamento compreende fracionamento físico. Em outra concretização, a população de moléculas de ácido nucleico é dividida baseado na uma ou mais características selecionadas a partir do grupo consistindo de: estado de metilação, estado de glicosilação modificação de histona, comprimento e posição de partida/parada. Em outra concretização, o método adicional
Petição 870190078052, de 12/08/2019, pág. 28/238
24/194 mente compreende reunir as moléculas de ácido nucleico. Em outra concretização, a uma ou mais características é metilação. Em outra concretização, o fracionamento compreende separar ácidos nucleicos metilatados de ácidos nucleicos não-metilatados usando proteínas compreendendo um domínio de ligação de metil para gerar grupos de moléculas de ácido nucleico compreendendo graus variantes de metilação. Em outra concretização, um dos grupos compreende DNA hipermetilatado. Em outra concretização, pelo menos um grupo é caracterizado por um grau de metilação. Em outra concretização, o fracionamento compreende separar moléculas de DNA de cadeia única e/ou moléculas de DNA de cadeia dupla. Em outra concretização, as moléculas de DNA de cadeia dupla são separadas usando adaptadores de grampo de cabelo. Em outra concretização, o fracionamento compreende isolar ácidos nucleicos ligados por proteína. Em outra concretização, o fracionamento compreende fracionamento baseado em uma diferença em um perfil mono-nucleossomal. Em outra concretização, o fracionamento é capaz de gerar perfis mononucleossomal diferentes para pelo menos um grupo de moléculas de ácido nucleico quando comparados a um normal. Em outra concretização, o isolamento compreende imunoprecipitação. Em outra concretização, o método adicionalmente compreende fracionar pelo menos um grupo de moléculas de ácido nucleico baseado em uma característica diferente. Em outra concretização, a análise compreende, em um ou mais locais, comparar uma primeira característica correspondente a um primeiro grupo de moléculas de ácido nucleico a uma segunda característica correspondente a um segundo grupo de moléculas de ácido nucleico. Em outra concretização, a análise compreende analisar uma característica da uma ou mais características em um grupo relativo a uma amostra normal em um ou mais locais. Em outra concretização, a uma ou mais características são selecionadas a partir do grupo consistindo de: uma
Petição 870190078052, de 12/08/2019, pág. 29/238
25/194 frequência denominada de base em uma porção de base na sequência de referência, um número de moléculas que mapeiam a uma base ou sequência na sequência de referência, um número de moléculas tendo um local de partida que mapeia para uma porção de base na sequência de referência, e um número de moléculas tendo um local de parada que mapeia para uma porção de base na sequência de referência, e um comprimento de uma molécula que mapeia para um local na sequência de referência. Em outra concretização, o método adicionalmente compreende usar um classificador treinado para classificar o indivíduo baseado na uma ou mais características. Em outra concretização, o classificador treinado classifica a uma ou mais características conforme associadas com um tecido no indivíduo. Em outra concretização, o classificador treinado classifica a uma ou mais características conforme associadas com um tipo de câncer no indivíduo. Em outra concretização, a uma ou mais características são indicativas de expressão de gene ou estado de uma doença. Em outra concretização, as moléculas de ácido nucleico estão circulando o DNA do tumor. Em outra concretização, as moléculas de ácido nucleico são DNA livre de célula (“cfDNA”). Em outra concretização, as etiquetas são usadas para distinguir moléculas diferentes na mesma amostra.
[0028] Em outro aspecto, é aqui proporcionado um método compreendendo: proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo; fracionar a população de moléculas de ácido nucleico baseado na uma ou mais características para gerar uma pluralidade de grupos de moléculas de ácido nucleico; etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características; sequenciar a pluralidade de grupos de moléculas de ácido nucieico para gerar leituras de sequência;, no qual a informação
Petição 870190078052, de 12/08/2019, pág. 30/238
26/194 de sequência obtida é suficiente para mapear as leituras de sequência em um ou mais locais em uma sequência de referência; e analisar as leituras de sequências para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características não são capazes de detecção em uma reunião de leituras de sequência a partir da pluralidade de grupos. Em uma concretização, o método adicionalmente compreende mapear as leituras de sequência em um ou mais locais em uma sequência de referência: e analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características não são capazes de detecção em uma reunião de leituras de sequência a partir da pluralidade de grupos. Em outra concretização, o fracionamento compreende fracionamento físico.
[0029] Em outro aspecto, é aqui proporcionado um método, compreendendo: proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo; fracionar a população de moléculas de ácido nucleico baseado na uma ou mais características para gerar pluralidade de grupos de moléculas de ácido nucleico, no qual as moléculas de ácido nucleico de cada da pluralidade de grupos compreendem identificadores distintos; reunir a pluralidade de grupos de moléculas de ácido nucleico; sequenciar a pluralidade de grupos reunidos de moléculas de ácido nucleico para gerar pluralidade de conjuntos de leituras de sequência; e fracionar as leituras de sequência baseado nos identificadores.
[0030] Em outro aspecto é aqui proporcionada uma composição, compreendendo uma reunião de moléculas de ácido nucleico compreendendo moléculas de ácido nucleico diferentemente etiquetadas, no qual a reunião compreende uma pluralidade de conjuntos de moléculas de ácido nucleico que são diferentemente etiquetadas baseado na
Petição 870190078052, de 12/08/2019, pág. 31/238
27/194 uma ou mais características selecionadas a partir do grupo consistindo de: estado de metilação, estado de glicosllação, modificação de histona, comprimento e posição de partida/parada, no qual a reunião é derivada de uma amostra biológica. Em uma concretização, a pluralidade de conjuntos é qualquer de 2, 3, 4, 5 ou mais do que 5.
[0031] Em outro aspecto, é aqui proporcionado um método, compreendendo: fracionamento de uma população de moléculas de ácido nucleico em uma pluralidade de grupos, a pluralidade de grupos compreendendo ácidos nucleicos que diferem por uma característica; etiquetar os ácidos nucleicos em cada da pluralidade de grupos com um conjunto de etiquetas que distingue os ácidos nucleicos em cada da pluralidade de grupos para produzir uma população de ácidos nucleicos etiquetados, no qual cada dos ácidos nucleicos etiquetados compreende uma ou mais etiquetas; sequenciar a população de ácidos nucleicos etiquetados para gerar leituras de sequência; usar a uma ou mais etiquetas para agrupar cada grupo de leituras de sequência; e analisar as leituras de sequência para detectar um sinal em pelo menos um dos grupos relativos a uma amostra normal em um classificador. Em uma concretização, o método adicionalmente compreende normalizar o sinal em pelo menos um dos grupos contra outro grupo, ou uma sequência de genoma total.
[0032] Em outro aspecto, é aqui proporcionado um método compreendendo: proporcionar uma população de DNA de célula livre de uma amostra biológica; fracionar a população de DNA de célula livre baseado em uma característica que está presente em níveis diferentes em DNA de célula livre derivado de células cancerosas comparadas à células não-cancerosas, desse modo, gerando subpopulações de DNA de célula livre; amplificação de pelo menos uma das subpopulações de DNA de célula livre; e, sequenciar pelo menos uma das subpopulações amplificadas de DNA de célula livre. Em uma concretização, a
Petição 870190078052, de 12/08/2019, pág. 32/238
28/194 característica é: o nível de metilação do DNA de célula livre; o nível de glicosilação do DNA de célula livre; o comprimento dos fragmentos do DNA de célula livre; ou a presença de quebras de cadeia única no DNA de célula livre.
[0033] Em outro aspecto, é aqui proporcionado um método compreendendo: proporcionar uma população de DNA de célula livre de uma amostra biológica; fracionar a população de DNA de célula livre baseado no nível de metilação do DNA de célula livre, desse modo, gerando subpopulações de DNA de célula livre; amplificar pelo menos uma das subpopulações de DNA de célula livre; e, sequenciar pelo menos uma das subpopulações amplificadas de DNA de célula livre.
[0034] Em outro aspecto, é aqui proporcionado um método para determinar o estado de metilação de DNA de célula livre compreendendo: proporcionar uma população de DNA de célula livre de uma amostra biológica; fracionar a população de DNA de célula livre baseado no nível de metilação do DNA de célula livre, gerando, desse modo, subpopulações de DNA de célula livre; sequenciar pelo menos uma subpopulação de DNA de célula livre, gerando, desse modo, leituras de sequência; e, determinação de um estado de metilação para cada DNA de célula livre dependendo da subpopulação das correspondentes leituras de sequência ocorra.
[0035] Em outro aspecto, é aqui proporcionado um método de classificação de um indivíduo, no qual o método compreende: proporcionar uma população de DNA de célula livre de uma amostra biológica a partir do indivíduo; fracionar a população de DNA de célula livre baseado no nível de metilação do DNA de célula livre, gerando, desse modo, subpopulações de DNA de célula livre; sequenciar as subpopulações de DNA de célula livre, gerando, desse modo, leituras de sequência; e, usar um classificador treinado para classificar o indivíduo dependendo de quais leituras de sequência ocorrem naquela subpopu
Petição 870190078052, de 12/08/2019, pág. 33/238
29/194 lação. Em outra concretização, a população de DNA de célula livre é fracionada por uma ou mais características que proporcionam uma diferença em sinal entre estados saudáveis e estados adoentados. Em outra concretização, a população de DNA de célula livre é fracionada baseado no nível de metilação do DNA de célula livre. Em outra concretização, determinar o padrão de fragmentação do DNA de célula livre adicionalmente compreende analisar o número de leituras de sequência que mapeiam para cada porção de base no genoma de referência. Em outra concretização, o método adicionalmente compreende determinar o padrão de fragmentação do DNA de célula livre em cada subpopulação por análise do número de leituras de sequência que mapeiam para cada porção de base no -genoma de referência.
[0036] Em outro aspecto, é aqui proporcionado um método para analisar o padrão de fragmentação de DNA de célula livre compreendendo: proporcionar uma população de DNA de célula livre de uma amostra biológica; fracionar a população de DNA de célula livre, gerando, desse modo, subpopulações de DNA de célula livre; sequenciar pelo menos uma subpopulação de DNA de célula livre, gerando, desse modo, leituras de sequência; alinhar as leituras de sequência a um genoma de referência; e, determinar o padrão de fragmentação do DNA de célula livre em cada subpopulação por análise de qualquer número do: comprimento de cada leitura de sequência que mapela para cada porção de base no genoma de referência; número de leituras de sequência que mapeiam para a porção de base no genoma de referência como uma função do comprimento das leituras de sequência; número de leituras de sequência que começam em cada porção de base no genoma de referência; ou, número de leituras de sequência que terminam em cada porção de base no genoma de referência. Em outra concretização, a uma ou mais características compreendem uma modificação química selecionada a partir do grupo consistindo de: metilaPetição 870190078052, de 12/08/2019, pág. 34/238
30/194 ção, hidroximetilação, formilação, acetilação, e glicosilação.
[0037] Qualquer dos métodos aqui descritos no qual uma proporção de DNA:esfera é 1:100.
[0038] Qualquer dos métodos aqui descritos no qual uma proporção de DNA:esfera é 1:50 [0039] Qualquer dos métodos aqui descritos no qual uma proporção de DNA:esfera é 1:20 [0040] Em um aspecto, é aqui proporcionado o uso de fracionamento físico baseado no grau de metilação de DNA durante análise de DNA do tumor circulante (ctDNA) para determinar expressão de gene ou estado de doença.
[0041] Em um aspecto, é aqui proporcionado o uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA durante análise de ctDNA.
[0042] Em um aspecto, é aqui proporcionado o uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA.
[0043] Em um aspecto, é aqui proporcionado o uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA antes do sequenciamento e opcional análise à jusante.
[0044] Em um aspecto, é aqui proporcionado o uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA para rotulação/etiquetamento diferencial. Em uma concretização, o padrão de fragmentação diferencial é indicativo de expressão de gene ou estado de doença. Em outra concretização, o padrão de fragmentação diferencial é caracterizado por uma ou mais diferenças relativas a um normal selecionada a partir do grupo consistindo de: comprimento de
Petição 870190078052, de 12/08/2019, pág. 35/238
31/194 cada leitura de sequência que mapeia para cada porção de base no genoma de referência; número de leituras de sequência que mapeia para a porção de base no genoma de referência como uma função de comprimento das leituras de sequência; número de leituras de sequência começando em cada porção de base no genoma de referência; e número de leituras de sequência terminando em cada porção de base no genoma de referência.
[0045] Em um aspecto, é aqui proporcionado o uso de fracionamento baseado em um padrão de fragmentação diferencial durante análise de ctDNA. Em uma concretização, o padrão de fragmentação diferencial é indicativo de expressão de gene ou estado de doença. Em outra concretização, o padrão de fragmentação diferencial é caracterizado por uma ou mais diferenças relativas a uma normal selecionada a partir do grupo consistindo de: comprimento de cada leitura de sequência que mapeia para cada porção de base no genoma de referência; número de leituras de sequência que mapeiam para a porção de base no genoma de referência como uma função de comprimento das leituras de sequência; número de leituras de sequência que começam em cada porção de base no genoma de referência; e número de leituras de sequência que terminam em cada porção de base no genoma de referência.
[0046] Em um aspecto, é aqui proporcionado o uso de um padrão de fragmentação diferencial para divisão de ctDNA. Em uma concretização, o padrão de fragmentação diferencial é indicativo de expressão de gene ou estado de doença. Em outra concretização, o padrão de fragmentação diferencial é caracterizado por uma ou mais diferenças relativas a uma normal selecionada a partir do grupo consistindo de: comprimento de cada leitura de sequência que mapeia para cada porção de base no genoma de referência; número de leituras de sequência que mapeiam para a porção de base no genoma de referência co
Petição 870190078052, de 12/08/2019, pág. 36/238
32/194 mo uma função de comprimento das leituras de sequência; número de leituras de sequência que começam em cada porção de base no genoma de referência; e número de leituras de sequência que terminam em cada porção de base no genoma de referência.
[0047] Em um aspecto, é aqui proporcionado o uso de um padrão de fragmentação diferencial para divisão de ctDNA antes do sequenciamento e opcional análise à jusante. Em uma concretização, o padrão de fragmentação diferencial é indicativo de expressão de gene ou estado de doença. Em outra concretização, o padrão de fragmentação diferencial é caracterizado por uma ou mais diferenças relativas a uma normal selecionada a partir do grupo consistindo de: comprimento de cada leitura de sequência que mapeia para cada porção de base no genoma de referência; número de leituras de sequência que mapeiam para a porção de base no genoma de referência como uma função de comprimento das leituras de sequência; número de leituras de sequência que começam em cada porção de base no genoma de referência; e número de leituras de sequência que terminam em cada porção de base no genoma de referência.
[0048] Em um aspecto, é aqui proporcionado o uso de um padrão de fragmentação diferencial para divisão de ctDNA para rotulação/etiquetamento diferencial.
[0049] Em um aspecto, é aqui proporcionado o uso de etiquetação molecular diferencial de moléculas de DNA divididas por domínio de ligação molecular (MBD)-esferas para estratificar em vários graus de metilação de DNA, que são, em seguida, quantificados pelo sequenciamento de próxima geração (NGS).
[0050] Em um aspecto, é aqui proporcionado um método de análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, o método, no qual cada
Petição 870190078052, de 12/08/2019, pág. 37/238
33/194 das pelo menos duas formas compreende uma pluralidade de moléculas, compreendendo: ligar pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico de etiqueta para distinguir as formas entre si; amplificar as formas de ácido nucleico, pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiqueta de ácido nucleico ligada, são amplificados, para produzir ácidos nucleicos amplificados, dos quais aqueles amplificados da pelo menos uma forma são etiquetados; e, sequenciar uma pluralidade do ácido nucleico amplificado que foi ligado às etiquetas, no qual o dado de sequência é suficiente para ser decodificado para revelar as formas dos ácidos nucleicos na população antes da ligação à pelo menos uma etiqueta. Em uma concretização, a etiqueta molecular compreende um ou uma pluralidade de códigos de barras de ácido nucleico. Em outra concretização, a reunião de moléculas de ácido nucleico etiquetadas, uma combinação de qualquer dois códigos de barra em um conjunto tem sequências combinadas diferentes do que uma combinação de qualquer dois códigos de barras em qualquer outro conjunto.
[0051] Em outro aspecto, é aqui proporcionada uma reunião de moléculas de ácido nucleico etiquetadas, cada molécula de ácido nucleico na reunião compreendendo uma etiqueta molecular selecionada de um de uma pluralidade de conjuntos de etiqueta, cada conjunto de etiqueta compreendendo uma pluralidade de etiquetas diferentes, no qual as etiquetas em qualquer um conjunto são distintas das etiquetas em qualquer outro conjunto, e no qual cada conjunto de etiqueta contém informação (i) indicando uma característica da molécula a qual ela é fixada da molécula de origem da qual a molécula é derivada e (ii) que, sozinha ou em combinação com a informação a partir da molécula para qual ela é fixada, unicamente distingue a molécula para qual ela é fixada de outras moléculas etiquetadas com etiquetas do mesmo
Petição 870190078052, de 12/08/2019, pág. 38/238
34/194 conjunto de etiqueta. Em uma concretização, a etiqueta molecular compreende dois códigos de barras de ácido nucleico, fixados em extremidades opostas da molécula. Em outra concretização, os códigos de barras estão entre 10 e 30 nucleotídeos de comprimento.
[0052] Em outro aspecto, é aqui proporcionado um sistema compreendendo: um sequenciador de ácido nucleico; um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e, um ligação de dado que conecta comunicativamente o sequenciador de ácido nucleico e o dispositivo de processamento digital; no qual o dispositivo de processamento digital adicionalmente compreende Instruções executáveis para criar uma aplicação para análise de um população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de: DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, cada das pelo menos duas formas compreendendo uma pluralidade de moléculas, a aplicação compreendendo: um módulo de software que recebe dado de sequência a partir do sequenciador de ácido nucleico, via a ligação de dados, o dado de sequência de ácidos nucleicos amplificados pelo menos alguns dos quais são etiquetados, o dado de sequência gerado por ligação de pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico etiquetado para distinguir as formas entre si, amplificar as formas de ácido nucleico pelo menos um dos quais é ligado a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiquetas de ácido nucleico ligadas são amplificados para produzir ácidos nucleicos amplificados dos quais aqueles amplificados da pelo menos uma forma são etiquetados; e, um módulo de software que ensaia o dado de sequência dos ácidos nucleicos amplificados por obtenção de informação de sequência suficiente para decodificar as moléculas de ácido nucleico etiquetadas dos ácidos nucleicos amplifi
Petição 870190078052, de 12/08/2019, pág. 39/238
35/194 cados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual o dado de sequência foi ensaiado. Em uma concretização, a aplicação adicionalmente compreende um módulo de software que decodifica as moléculas de ácido nucleico etiquetadas dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual o dado de sequência foi ensaiado. Em outra concretização, a aplicação adicionalmente compreende um módulo de software que transmite um resultado do ensaio, via uma rede de comunicações.
[0053] Em outro aspecto, é aqui proporcionado um sistema compreendendo: um instrumento de sequenciamento de próxima geração (NGS); um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e, uma ligação de dados que conecta comunicativamente o instrumento de NGS e o dispositivo de processamento digital; no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação compreendendo: um módulo de software para receber dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado pelo fracionamento fisicamente de moléculas de DNA de uma amostra humana para gerar duas ou mais divisões, aplicar etiquetas moleculares diferenciais e adaptadores de capacitação de NSG a cada das duas ou mais divisões para gerar divisões etiquetadas moleculares, e ensaiar as divisões etiquetadas moleculares com o instrumento de NGS; um módulo de software para geração de dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente divididas; e, um módulo de softwa
Petição 870190078052, de 12/08/2019, pág. 40/238
36/194 re pata análise do dado de sequência por desconvolução da amostra em moléculas que foram diferencialmente divididas. Em uma concretização, a aplicação adicionalmente compreende um módulo de software que transmite um resultado do ensaio, via uma rede de comunicações.
[0054] Em outro aspecto, é aqui proporcionado um sistema compreendendo: um instrumento de sequenciamento de próxima geração (NGS); um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e, uma ligação de dados que conecta comunicativamente o instrumento de NGS e o dispositivo de processamento digital; no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis por o pelo menos um processador para criar uma aplicação para identificação de etiqueta molecular de MBD-bibliotecas fracionadas de esfera compreendendo: um módulo de software configurado para receber dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado por fracionamento fisicamente de uma amostra de DNA extraída usando um kit de proteína de domínio de ligação de metila-purificação de esfera, economizando todas as eluições para processamento à jusante; condução de aplicação paralela de etiquetas moleculares diferenciais e sequências de adaptador de capacitação de NSG para cada fração ou grupo; re-combinação de todas frações etiquetadas moleculares ou grupos, e subsequente amplificação usando sequências de primer de DNA específica de adaptador; condução de enriquecimento/hibridização de biblioteca total recombinada e amplificada, direcionamento de regiões genômicas de interesse; re-amplificação da biblioteca de DNA total enriquecida, anexação de uma etiqueta de amostra; reunião de amostras diferentes; e ensaio dos mesmos em multiplex no instrumento de NGS; no qual da
Petição 870190078052, de 12/08/2019, pág. 41/238
37/194 do de sequência de NGS produzido pelo instrumento proporciona sequência das etiquetas moleculares sendo usadas para identificar moléculas únicas, e dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente MBD-divididas e, um módulo de software configurado para realizar análise do dado de sequência por uso das etiquetas moleculares para identificar moléculas únicas e desconvolução da amostra em moléculas que foram diferenciadas MBD-divididas. Em uma concretização, a aplicação adicionalmente compreende um módulo de software configurado para transmitir um resultado da análise, via uma rede de comunicações.
[0055] O resumo proporcionado acima é uma lista exemplar de concretizações, e não é previsto para ser uma lista completa de concretizações.
INCORPORAÇÃO POR REFERÊNCIA [0056] Todas as publicações, patentes, e pedidos de patente mencionados neste relatório descritivo são aqui incorporados por referência à mesma extensão como se cada publicação individual, patente, ou pedido de patente fosse especificamente e individualmente indicado para serem incorporados por referência.
BREVE DESCRIÇÃO DAS FIGURAS [0057] A Fig. 1 mostra um esquema exemplar para divisão de RNA, DNA de cadeia única, e DNA de cadeia dupla.
[0058] A Fig. 2 mostra um esquema exemplar adicional para divisão de RNA, DNA de cadeia única, e DNA de cadeia dupla.
[0059] A Fig. 3 mostra um esquema para análise de DNA contendo extensões variantes de representação de 5-metil citosina.
[0060] A Fig. 4 mostra um esquema para sequenciamento de bissulfito de DNA metilatado.
[0061] A Fig. 5 mostra um esquema adicional para análise de DNA contendo extensões variantes de representação de 5-metil citosina.
Petição 870190078052, de 12/08/2019, pág. 42/238
38/194 [0062] A Fig. 6 mostra um esquema adicional para sequenciamento de bissulfito de DNA metilatado.
[0063] A Fig. 7 mostra uma visão geral de etiquetamento diferencial.
[0064] A Fig. 8 mostra uma visão geral de metodologia de divisão.
[0065] A Fig. 9 mostra uma visão geral da metodologia.
[0066] A Fig. 10 mostra um exemplo de uso de análise de dados fragmentômicos em moléculas de ácido nucleico fracionadas. A posição genômica é mostrada no eixo X, comprimento de fragmento no eixo Y, e cobertura ou cópias no eixo Z, e regiões correspondentes de hipo- ou hiper-metilação elevada são indicadas.
[0067] A Fig. 11 mostra o perfil de metilação de amostras normais e amostras de câncer de pulmão.
[0068] As Fig. 12A, Fig. 12B, e Fig. 12C mostram o perfil de metilação usando sequenciamento de genoma total. A Fig. 12A mostra a posição ao longo de uma região de 600 bp no local de partida de transcrição (TSS) no eixo X, e frequência de locais de hipermetilação ao longo do eixo Y. A Fig. 12B mostra a posição ao iongo de uma região de 600 bp no iocal de partida de transcrição (TSS) no eixo X, e frequência de locais de hipometilação ao longo do eixo Y. A Fig.12C mostra percentagem de hipermetilação no eixo X, e comprimento de fragmento no eixo Y.
[0069] As Fig. 13A e Fig. 13B mostram perfil de metilação de MOB3A e WDR88. A Fig. 13A mostra a posição genômica de gene de MOB3A no eixo X, e comprimento de fragmento para moléculas de ácido nucleico de grupos fracionados separados é indicado por linhas separadas. Os grupos fracionados incluem grupos hipermetilatado, hipometilatado, hipermetilatado misturado com hipometilatado (hiper + hipo), e um grupo não-fracionado (nenhum MBD) para comparação.
[0070] As Fig. 14A e Fig. 14B mostram perfil de metilação de gru
Petição 870190078052, de 12/08/2019, pág. 43/238
39/194 pos fracionados e não-fracionados. A Fig. 14 A mostra um mapa de calor com cobertura de grupo não-fracionado (nenhum MBD), e de divisões de mistura após fracionamento respectivamente no eixo X e eixo Y.
[0071] A Fig. 15 mostra organização de nucleossomo para amostras fracionadas e não-fracionadas.
[0072] A Fig. 16 mostra validação de sinal de MBD.
[0073] A Fig. 17 exibe estatísticas sobre a associação de regiões genômicas de entrada ao TSS de todos os genes putativamente regulados pelas regiões genômicas. O eixo X indica a distância para TSS em kilo bases (kb), enquanto que o eixo Y indica associação de gene de região em percentagem (%). Acima de cada barra no gráfico, um número absoluto de itens sendo contado é listado. Regiões genômicas de primeiro plano, representadas pela barra escura, foram selecionadas de um supercomputo de regiões genômicas de fundo, indicadas pela barra clara. As regiões genômicas de fundo foram elementos repetitivos que foram cooptados em papéis funcionais selecionados de todos os elementos repetitivos no genoma.
[0074] As Fig. 18A e Fig. 18B mostram perfil de metilação de gene de AP3D1. A Fig. 18A mostra a posição genômica de gene de AP3D1 no eixo X, e cobertura de leituras para moléculas de ácido nucleico de grupos diferentes indicados por linhas separadas. Os grupos incluem grupos fracionados, tal como grupo hipermetilatado, hipometilatado, e de grupo não-fracionado (nenhum MBD) para comparação. TSS é mostrado como linha vertical na parte intermediária de mapas de calor com uma seta indicando direção de transcrição. A Fig.18B mostra percentagem de hipermetilação no eixo X e comprimento de fragmento no eixo Y. Por exemplo, na Fig. 18B, a percentagem de metilação em uma amostra de ácido nucleico não-fracionada pode ser cerca de 65%, conforme indicado pela linha tracejada vermelha.
Petição 870190078052, de 12/08/2019, pág. 44/238
40/194 [0075] As Fig. 19A e Fig. 19B mostram perfil de metilação de gene de DNMT1. A Fig. 19A mostra a posição genômica de gene de DNMT1 no eixo X, e cobertura de leituras para moléculas de ácido nucleico de grupos diferentes é indicada por linhas separadas. Os grupos incluem grupos fracionados, tal como grupo hipermetilatado, hipometilatado, e de grupo não-fracionado (nenhum MBD) para comparação. TSS é mostrado como linha vertical na parte intermediária de mapas de calor com uma seta indicando direção de transcrição. A Fig. 19B mostra percentagem de hipermetilação no eixo X e comprimento de fragmento no eixo Y.
[0076] A Fig. 20 mostra o procedimento para fracionamento baseado no isolamento de moléculas de ácido nucleico [0077] A Fig. 21 mostra o fracionamento de moléculas de ácido nucleico em ssDNA e dsDNA. O eixo X mostra duas réplicas técnicas de duas amostras com variação de DNA de entrada (200 ng e 500 ng). O eixo Y mostra número de cópia de moléculas alvos usando amplificação de PCR quantitativa. A figura mostra determinação quantitativa de sequência alvo em cada grupo de cfDNA fracionado.
[0078] A Fig. 22 mostra rendimento de PCR após fracionamento de moléculas de ácido nucleico em ssDNA e dsDNA. O eixo X mostra entrada de cfDNA (200 ng e 500 ng) em duas réplicas técnicas, enquanto que o eixo Y mostra rendimento de PCR em pmol.
[0079] A Fig. 23 mostra perfil de metilação de região promotora usando sequenciamento de genoma total.
[0080] A Fig. 24 proporciona três exemplos de estratégias para etiquetamento de moléculas de ácido nucleico divididas ou fracionadas usando proteínas de domínio de ligação de metil (divisão de MBD).
[0081] As Fig. 25A e Fig. 25B mostram comparação entre a cobertura para amostras de MBD e não-MBD em ensaio de sequenciamento direcionado.
Petição 870190078052, de 12/08/2019, pág. 45/238
41/194 [0082] As Fig. 26A e Fig. 26B mostram a cobertura para os genes no painel usando 15 ng de entrada de cfDNA e duas amostras clinicas (PowerpoolVI e PowerpoolV2).
[0083] As Fig. 27A e Fig. 27B mostram a cobertura para os genes no painel usando 150 ng de entrada de cfDNA e duas amostras clinicas (PowerpoolVI e PowerpoolV2).
[0084] As Fig. 28A, Fig. 28B e Fig. 28C mostram especificidade e sensibilidade de detecção de variante ou mutação para os genes no painel usando 15 ng de entrada de cfDNA.
[0085] As Fig. 29A, Fig. 29B e Fig. 29C mostram especificidade e sensibilidade de detecção de variante ou mutação para os genes no painel usando 150 ng de entrada de cfDNA.
[0086] A Fig. 30 mostra a correlação entre os níveis de metilação de cobertura conforme medidos pelo sequenciamento de bissulfito de genoma total (WGBS) e divisão de MBD.
[0087] As Fig. 31A e Fig. 31B mostram sensibilidade (Fig. 31 A) e especificidade (Fig. 31B) de detecção de DNA metilatado usando divisão de MBD (eixo Y), e usando o ensaio de sequenciamento de bissulfito de genoma total (WGBS, eixo X).
[0088] A Figura 32 mostra uma concretização de um dispositivo de processamento digital.
[0089] A Figura 33 mostra uma concretização de um sistema de provisão de aplicação.
[0090] A Figura 34 mostra uma concretização de um sistema de provisão de aplicação empregando uma arquitetura à base de nuvem.
DESCRIÇÃO DETALHADA [0091] O termo “DNA de Célula Livre” e “População de DNA de Célula Livre”, conforme aqui usado, se refere ao DNA que foi originalmente encontrado em uma célula ou células em um organismo biológico complexo grande, por exemplo, um mamífero, e foi liberado a partir
Petição 870190078052, de 12/08/2019, pág. 46/238
42/194 da célula em um fluido líquido encontrado no organismo, por exemplo, plasma de sangue, linfa, fluído cérebro-esplnhal, urina, no qual o DNA pode ser obtido por obtenção de uma amostra do fluido sem a necessidade de realizar uma etapa de lise de célula in vitro.
[0092] Geral [0093] A presente revelação proporciona numerosos métodos, reagentes, composições, e sistemas para análise de material genômico complexo, enquanto que reduz ou elimina perda de informação de característica molecular (por exemplo, tipos epigenéticos ou outros tipos de estrutural) que está inlcialmente presente no material genômico complexo. Em algumas concretizações, etiquetas moleculares podem ser usadas para rastrear formas diferentes de ácidos nucleicos e enumerar tais formas diferentes para a proposta de determinar modificações genéticas (por exemplo, SNVs, indels, fusões de gene e variação de número de cópias). Em algumas concretizações, os métodos aqui descritos são usados para detectar, analisar ou monitorar uma condição, tal como câncer em um indivíduo, ou estado de um feto. Em algumas concretizações, o indivíduo não está grávido.
[0094] A revelação proporciona métodos para processamento de população de ácido nucleicos contendo formas diferentes. Conforme aqui usado, formas diferentes de ácidos nucleicos possuem características diferentes. Por exemplo, e sem limitação, RNA e DNA são formas que diferem baseadas na identidade de açúcar. Ácidos nucleicos de cadeia única (ss) e de cadeia dupla (ds) diferem no número de cadeias. As moléculas de ácidos nucleicos podem diferir baseado nas características epigenéticas, tal como 5-metilcitosina ou associação com proteínas, tais como histonas. Os ácidos nucleicos podem possuir sequências de nucleotídeo diferentes, por exemplo, genes específicos ou locais genéticos. Características podem diferir em termos de grau.
[0095] Por exemplo, as moléculas de DNA podem diferir em sua
Petição 870190078052, de 12/08/2019, pág. 47/238
43/194 extensão de modificação epigenética. Extensão de modificação pode se referir a um número de eventos de modificação ao qual uma molécula foi submetida, tal como número de grupos de metilação (extensão de metilação), ou outras mudanças epigenéticas. Por exemplo, DNA metilatado pode ser hipometilatado ou hipermetilatado. Formas podem ser caracterizadas por combinações de características, por exemplo, não-metilatada de cadeia única ou metilatada de cadeia dupla. O fracionamento de moléculas baseado em uma ou uma combinação de características pode ser útil para análise multi-dimensional de moléculas simples. Estes métodos acomodam múltiplas formas e/ou modificações de ácido nucleico em uma amostra, tal que informação de sequência pode ser obtida para formas múltiplas. Os métodos também preservam a identidade das formas múltiplas iniciais ou estados modificados através de processamento e análise, tal que a análise de sequências de base nucleicas podem ser combinadas com análise epigenética. Alguns métodos envolvem separação, etiquetamento e reunião subsequente de formas diferentes ou estados de modificação, reduzindo o número de etapas de processamento requeridas para analisar formas múltiplas presentes em uma amostra. A análise de formas múltiplas de ácido nucleico em amostras proporciona maior informação em parte porque existem mais moléculas para analisar (que podem ser significantes quando quantidades totais muito baixas de ácido nucleico são disponíveis), mas também porque as formas diferentes ou estados de modificação podem proporcionar informação diferente (por exemplo, uma mutação pode estar presente somente no RNA), e porque tipos diferentes de informação (por exemplo, genética e epigenética) podem estar correlacionadas entre si, desse modo, produzindo maior precisão, certeza, ou resultando na descoberta de novas correlações com uma condição médica.
[0096] O dinucleotídeo CpG é subrrepresentado no genoma hu
Petição 870190078052, de 12/08/2019, pág. 48/238
44/194 mano normal, com a maioria de sequências de dinucleotídeo CpG sendo transcricionalmente inerte (por exemplo, regiões heterocromáticas de DNA em partes pericentroméricas do cromossomo e em elementos de repetição) e metilatado. Contudo, muitas ilhas de CpG são protegidas de tal metilação especialmente ao redor dos locais de partida de transcrição (TSS).
[0097] O câncer pode ser indicado por variações epigenéticas, tal como metilação. Exemplos de mudanças de metilação no câncer incluem ganhos locais de metilação de DNA nas ilhas de CpG no local de partida de transcrição (TSS) de genes envolvidos no controle de crescimento normal, reparo de DNA, regulação de ciclo de célula, e/ou diferenciação de célula. Esta hipermetilação pode estar associada com uma perda aberrante de capacidade transcricional de genes envolvidos, e ocorre pelo menos tão frequentemente quanto mutações e anulações de ponto como uma causa de expressão de gene alterada. O perfil de metilação do DNA pode ser usado para detectar regiões com extensões de metilação diferentes (“diferencialmente regiões metilatadas” ou “DMRs”) do genoma que são alteradas durante desenvolvimento, ou que são perturbadas pela doença, por exemplo, câncer ou qualquer doença associada ao câncer. O genoma de células de câncer abriga desequilíbrio nos padrões acima de metilação de DNA, e, portanto, em acondicionamento funcional do DNA. As anormalidades de organização de cromatina são, portanto, acopladas com mudanças de metilação, e podem contribuir para perfilação de câncer intensificada quando analisadas juntamente. Combinando divisão de MBD com dados fragmentômicos, tais como posições de partida e parada mapeadas de fragmento (correlacionadas com posições de nucleossomo), comprimento de fragmento e ocupação de nucleossomo associada, podem ser usados para análise de estrutura de cromatina em estudos de hipermetilação com o objetivo de aperfeiçoar a taxa de detecção de
Petição 870190078052, de 12/08/2019, pág. 49/238
45/194 biomarcador.
[0098] O perfil de metilação pode envolver determinar padrões de metilação através de regiões diferentes do genoma. Por exemplo, após divisão das moléculas baseado na extensão de metilação (por exemplo, número relativo se locais de metilatado por molécula) e sequenciamento, as sequências de moléculas nas divisões diferentes podem ser mapeadas para um genoma de referência. Isto pode mostrar regiões do genoma que, comparadas com outras regiões, são mais altamente metilatadas ou são menos altamente metilatadas. Desse modo, regiões genômicas, em contraste às moléculas individuais, podem diferir em sua extensão de metilação.
[0099] Uma característica de moléculas de ácido nucleico pode ser uma modificação, que pode incluir várias modificações químicas ou modificações de proteína (isto é, modificações epigenéticas). Exemplos não-limitantes de modificação química podem incluir, mas não são limitados a modificações de DNA covalentes, incluindo metilação de DNA. Em algumas concretizações, a metilação de DNA compreende adição de um grupo metil a uma citosina em um local de CpG (uma citosina seguida por uma guanina em uma sequência de ácido nucleico). Em algumas concretizações, a metilação de DNA compreende adição de um grupo metil à adenina, tal como em N6-metiladenina. Em algumas concretizações, a metilação de DNA é 5-metilação (modificação do 5° carbono dos 6 anéis de carbono de citosina). Em algumas concretizações, 5-metilação compreende adição de um grupo metil à posição 5C da citosina para criar 5-metilcitosina (m5c). Em algumas concretizações, metilação compreende um derivado de m5c. Derivados de m5c incluem, mas não são limitados a, 5-hidroximetilcitosina (5-hmC), 5-formilcitosina (5-fC), e 5-carboxilcitosina (5-caC). Em algumas concretizações, metilação de DNA é metilação 3C (modificação do 3o carbono dos 6 anéis de carbono de citosina). Em algumas con
Petição 870190078052, de 12/08/2019, pág. 50/238
46/194 cretizações, metilaçâo 3C compreende adição de um grupo metil para a posição 3C da citosina para gerar 3-metilcitosina (3mC). A metilaçâo pode também ocorrer em locais de não CpG, por exemplo, a metilaçâo pode ocorrer em um local de CpA, CpT, ou CpC. A metilaçâo de DNA pode mudar a atividade da região de DNA metilatado. Por exemplo, quando o DNA em uma região promotora é metilatado, transcrição do gene pode ser reprimida. A metilaçâo de DNA é crítica para desenvolvimento normal, e anormalidade na metilaçâo pode romper regulação epigenética. O rompimento, por exemplo, repressão, na regulação epigenética, pode causar doenças, tal como câncer. A metilaçâo do promotor no DNA pode ser indicativa de câncer.
[00100] As modificações de proteína incluem ligação aos componentes de cromatina, particularmente histonas, incluindo formas modificadas destas, e ligação à outras proteínas, tais como proteínas envolvidas em replicação ou transcrição. A revelação proporciona métodos de processamento e análise de ácidos nucleicos com extensões diferentes de modificação, tal que a natureza de sua modificação originai está correlacionada com uma etiqueta de ácido nucleico, e pode ser decodificada por sequenciamento da etiqueta quando ácidos nucleicos são analisados. A variação genética de modificações de amostra ácido nucleico pode, em seguida, estar associada com a extensão de modificação (variação epigenética) daquele ácido nucleico na amostra original.
[00101] Conforme aqui usado, os termos “fracionamento” e “divisão” se referem a separação de moléculas baseada em característica diferentes. As moléculas de ácido nucleico em uma amostra podem ser fracionadas baseado em uma ou mais características. O fracionamento pode incluir dividir fisicamente as moléculas de ácido nucleico em subconjuntos ou grupos baseados na presença ou ausência de uma característica genômica. O fracionamento pode incluir dividir fisica
Petição 870190078052, de 12/08/2019, pág. 51/238
47/194 mente as moléculas de ácido nucleico em grupos de divisão baseados no grau ao qual uma característica genômica está presente. Uma amostra pode ser fracionada ou dividida em um ou mais divisões de grupos baseadas em uma característica que é indicativa de expressão de gene diferencial, ou um estado de doença. Uma amostra pode ser fracionada baseada em uma característica, ou combinação desta que proporciona uma diferença no sinal entre um estado normal e estado adoentado durante análise de ácidos nucleicos, por exemplo, DNA de célula livre (“cfDNA”), não-cfDNA, DNA de tumor, DNA de tumor circulante (“ctDNA”) e ácidos nucleicos de célula livre (“cfNA”).
[00102] A presente revelação proporciona métodos e sistemas para analisar eficientemente moléculas de ácido nucleico. Os métodos podem incluir fracionamento das moléculas de ácido nucleico em divisões diferentes baseado em uma ou uma pluralidade de características, seguido por sequenciamento (sozinho ou junto), e análise das moléculas de ácido nucleico em cada divisão. Em alguns casos, as divisões de moléculas de ácido nucleico são amplificadas antes de e/ou após sequenciamento. Os métodos podem ser usados em várias aplicações, tais como prognose, diagnose e/ou para monitoramento de uma doença.
[00103] As moléculas de ácido nucleico podem ser caracterizadas por qualquer de uma ou mais características. Uma característica das moléculas de ácido nucleico pode incluir isolamento, regiões de ligação de proteína, comprimento do ácido nucleico, posição de partida/parada, modificações químicas, ou modificações de proteína. O isolamento de moléculas de ácido nucleico pode incluir moléculas de cadeia única (por exemplo, ssDNA ou RNA), ou moléculas de cadeia dupla (por exemplo, dsDNA).
[00104] Uma característica genômica de moléculas de ácido nucleico pode ser uma modificação, que pode incluir várias modificações
Petição 870190078052, de 12/08/2019, pág. 52/238
48/194 químicas. Como exemplos não-limitantes, uma modificação química pode incluir modificação de DNA covalente, tal como metilação de DNA (5mC), hidroxilmetilação (5hmC), formilmetilação (5fC), carboxilmetilação (5CaC), N6-metiladenina, ou glicosilaçâo. Metilação de DNA inclui adição de grupos metil ao DNA (por exemplo, CpG), e pode mudar a expressão de região de DNA metilatado. Por exemplo, quando o DNA em uma região promotora é metilatado, a transcrição do gene pode ser reprimida. A metilação de DNA é crítica para desenvolvimento normal, e anormalidade na metilação pode romper a regulação epigenética. O rompimento, por exemplo, repressão, na regulação epigenética, pode causar doenças, tal como câncer. A metilação promotora no DNA pode ser indicativa de câncer.
[00105] Como um exemplo não-limitante, benefícios de métodos envolvendo divisão de RNA de cadeia única e/ou DNA, bem como DNA de cadeia dupla para caracterizar uma amostra, incluem:
[00106] Suporte adicional para células de SNV, CNV, e indel de ssDNA e moléculas de RNA em adição ao dsDNA;
[00107] A identificação mais fácil (direcionamento) de fusões de genes em RNA conforme comparada ao DNA porque pontos de quebra variáveis em DNA intrônico produzem junções exon-exon definidas no RNA;
[00108] A identificação ou níveis de expressão diferenciais de RNA mensageiro (mRNA), microRNA (miRNA), e RNA de não-codificação longo (IncRNA) pode ser característica de muitos estados de doenças. A confirmação e suporte adicional de assinaturas de expressão encontrados nas mudanças de posicionamento nucleossomal dentro das populações de DNA do tumor circulante (ctDNA) comparadas ao DNA de célula livre saudável (cfDNA) de leucócitos que podem ser importantes na detecção precoce de câncer. Adicionalmente, cfDNA derivado de leucócito e mudanças de expressão de cfRNA podem também serem
Petição 870190078052, de 12/08/2019, pág. 53/238
49/194 indicativos de resposta imune à doença.
[00109] Evidência de moléculas instáveis. Captura de DNA de tumor circulante mais curto (ctDNA) — estudos de DNA de célula livre verificaram que o comprimento de DNA do tumor (ctDNA) pode ser significantemente mais curto do que o DNA normal. Alguma evidência indica que estas sequências mais curtas são instáveis, e podem estar presentes como ssDNA. Estas podem também proporcionar informação nas mudanças de ligação de fator de transcrição no ctDNA comparado ao cfDNA que pode ser importante na detecção precoce de câncer. Similarmente, o cfDNA pode também ser indicativo de resposta de doença; e [00110] Captura de DNA danificado/degradado que pode ser clinicamente relevante e que contém regiões “com folga” de cadeia única. [00111] A análise de formas múltiplas de ácidos nucleicos em uma amostra pode ocorrer por, por exemplo, etiquetar diferencialmente formas diferentes de ácidos nucleicos e/ou formas de divisão diferentes de ácidos nucleicos antes do sequenciamento.
[00112] Formas de ácido nucleico diferentes diferenciais em uma amostra [00113] Amostras de ácidos nucleicos, tais como ácidos nucleicos de céluia livre em fluidos corpóreos, frequentemente contém ácidos nucleicos em formas múltiplas, incluindo DNA de cadeia única e DNA de cadeia dupla e RNA de cadeia única. Devido à quantidade total de ácidos nucleicos em tais amostras poder ser baixa, e devido às formas diferentes de ácidos nucleicos tendo característica diferentes e/ou modificações poderem produzir informação diferente relacionada à amostra, são aqui proporcionados métodos de análise de 2, 3 ou todas tais formas.
[00114] A preparação e análise de múltiplas formas são mais eficientes se pelo menos algumas das etapas podem ser realizadas em
Petição 870190078052, de 12/08/2019, pág. 54/238
50/194 paralelo. A informação determinada de tais amostras é mais informativa se a informação de sequência de um ácido nucleico particular após processamento pode estar correlacionada com a forma original do ácido nucleico na amostra. Por exemplo, se uma SNV é determinada em um ácido nucleico particular após processamento, ela pode ser determinada se aquele ácido nucleico foi derivado de RNA, DNA de cadeia única ou DNA de cadeia dupla na amostra original.
[00115] A identificação das formas diferentes de ácido nucleico em uma amostra pode ser alcançada por etiquetamento diferencial das formas diferentes de ácido nucleico na amostra antes das formas terem sido alteradas em um modo que ofusca sua forma original, tal como por síntese de segunda cadeia ou amplificação. Desse modo, em um ácido nucleico incluindo formas múltiplas, pelo menos uma forma é ligada a uma etiqueta de ácido nucleico para distinguir de uma ou mais outras formas presentes na amostra. Em uma amostra contendo três formas de ácido nucleico, tal como DNA de cadeia única, RNA de cadeia única, e DNA de cadeia dupla, as três formas podem ser distinguidas por etiquetaçâo diferencialmente de pelo menos duas das formas, ou por etiquetaçâo diferencialmente de todas as três. As etiquetas ligadas às moléculas de ácido nucleico da mesma forma podem ser as mesmas ou diferentes entre si. Mas se diferentes entre si, as etiquetas podem, em algumas concretizações, terem parte de seu código em comum de modo a identificar as moléculas as quais eles são fixados como sendo de uma forma particular. Por exemplo, moléculas nucleicas de uma forma particular podem suportar códigos da forma A1, A2, A3, A4 e assim por diante, e aquelas de uma forma diferente B1, B2, B3, B4 e assim por diante. Tal sistema de codificação permite distinção ambas entre as formas e moléculas dentro de uma forma. Estratégias exemplares para etiquetar diferencialmente moléculas de ácido nucleico tendo característica diferentes, por exemplo, grau de
Petição 870190078052, de 12/08/2019, pág. 55/238
51/194 metilação conforme determinado usando proteínas de domínio de ligação de metil, são proporcionadas na Fig. 24 (descrita abaixo).
[00116] Após etiquetamento diferenciai de uma, algumas, ou todas as formas de ácido nucleico em uma amostra com etiquetas de ácido nucleico, as formas podem ser amplificadas tal que as etiquetas de ácido nucleico são amplificadas juntas com as formas na amostra original. Os ácidos nucleicos amplificados podem, em seguida, serem submetidos à análise de sequência para parte de leitura ou toda da sequência dos ácidos nucleicos originalmente nas amostras, bem como aquela das etiquetas de ácido nucleico ligadas. As sequências das etiquetas podem, em seguida, serem decodificadas para indicar a forma de um ácido nucleico na amostra original. As sequências de formas diferentes podem, em seguida, serem comparadas para ver se uma variação genética é encontrada predominantemente ou exclusivamente somente em certa(s) forma(s) de ácido nucleico, ou ocorre com cerca da mesma frequência independentemente da forma original. Alguma ou todas das etapas após etiquetamento diferencial de formas diferentes, particularmente amplificação e sequenciamento, podem ser realizadas com ácidos nucleicos das formas diferentes reunidas. Tais métodos, de preferência, resultam em amplificação e sequenciamento de pelo menos 40, 50, 60, 70, 80, 90 ou 95% de moléculas de ácido nucleico de duas, três ou mais formas presentes em uma amostra.
[00117] Ácidos nucleicos de cadeia dupla podem ser diferencialmente etiquetados por ligação a pelo menos adaptadores de cadeia dupla parcialmente. Tipicamente, os ácidos nucleicos de cadeia dupla são ligados a tais adaptadores e ambas as extremidades. Qualquer ou ambos de tais adaptadores podem incluir uma etiqueta de ácido nucleico. Se dois adaptadores cada tendo uma etiqueta são ligados às respectivas extremidades de um ácido nucleico, a combinação de eti
Petição 870190078052, de 12/08/2019, pág. 56/238
52/194 queta pode funcionar como um identificador. O DNA de cadeia única ou moléculas de RNA não se ligam a uma extensão significante às extremidades de cadeia dupla dos adaptadores, e assim não recebem uma etiqueta de ácido nucleico. Os adaptadores de cadeia dupla podem ser totalmente de cadeia dupla ou parcialmente de cadeia dupla, conforme é o caso para adaptadores em forma de Y, ou adaptadores de grampo de cabelo. Sequências exemplares para adaptadores em forma de Y são mostradas abaixo.
[00118] Adaptador Universal [00119] Adaptador universal [00120] SEQ ID No. 1:
[00121] 5’AATGATACGGCGACCACCGAGATCTACACTCTTTCCC TACACGACGCTCTTCCGATCT-3’ (SEQ ID NO:1) [00122] Etiqueta do Adaptador [00123] SEQ ID No. 2:
[00124] 5’GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNN NNNATCTCGTATGCCGTCTTCTGCTTG-3’ (SEQ ID NO:2) [00125] Uma versão truncada destas sequências de adaptador foi descrita por Rohland et al., Genome Res. 2012 May; 22(5): 939-946. [00126] Devido aos adaptadores em forma de Y terem extremidades de cadeia única, eles podem necessitar de serem evitados (por exemplo, por separação de DNA de cadeia única com uma sonda que não se liga aos adaptadores em forma de Y), ou protegidos se uma etapa subsequente é para ser realizada de separar ácidos nucleicos de amostra de cadeia única de outras ácidos nucleicos de amostra.
[00127] As moléculas de RNA podem ser diferencialmente etiquetadas com uma etiqueta de ácido nucleico em virtude de ser a única forma de molécula em uma amostra na qual uma transcriptase reversa com polimerase do DNA dependente do RNA pode atuar. A etiqueta de ácido nucleico pode ser introduzida como uma 5' etiqueta de um
Petição 870190078052, de 12/08/2019, pág. 57/238
53/194 primer usado para iniciar transcrição reversa. Transcrição reversa pode ser aleatória ou específica de sequência. Após transcrição reversa, a cadeia de RNA original pode ser degradada, seguido por síntese de uma segunda cadeia de DNA complementar. O agora DNA de cadeia dupla pode ser de extremidade cega, se necessário, e unido aos adaptadores de modo similar às moléculas de DNA de cadeia dupla já presentes na amostra. Alternativamente, moléculas híbridas de RNA/DNA podem ser diretamente unidas aos adaptadores.
[00128] As moléculas de DNA de cadeia única podem ser fracionadas de moléculas de DNA de cadeia dupla por tratamento com uma ligase intramolecular. Em algumas concretizações, a ligase intramolecular é CircLigase™ ssDNA Ligase para etiquetar diferencialmente ssDNA com uma 3’ etiqueta. ssDNA é desfosforilatada na extremidade 5’ antes do tratamento com a ligase intramolecular para impedir circularização de ssDNA. Em um exemplo, a ligase usada para fixar etiquetas ao DNA de cadeia única é CircLigase™ ssDNA Ligase. CircLigase™ ssDNA Ligase é ligase dependente de ATP termoestável. A segunda síntese de cadeia pode ocorrer por vários mecanismos incluindo ligação de DNA de cadeia única em uma extremidade a um oligonucleotideo (por exemplo, com T4 RNA ligase) para proporcionar um local de ligação de primer, hibridização de DNA de cadeia única para oligonucleotídeos complementares que servem como primeres para se extender baseado na sequência de modelo que eles são hibridizados a, ou hibridização a oligonucleotídeos aleatórios, que, do mesmo modo, servem como primeres para extensão baseado na sequência de modelo que eles são hibridizados. Um método usa uma ligase de cadeia única para anexar um oligonucleotídeo com uma extremidade 3’ extensível e nos membros de biblioteca de DNA de cadeia única (ver Gansauge & Meyer, Nature Protocols 8, 737 (2013)). A segunda cadeia de DNA é enchida no uso do adaptador como um local de ligação
Petição 870190078052, de 12/08/2019, pág. 58/238
54/194 de primer. Uma etapa de fosforilaçâo de 5’DNA e ligação padrão (dsDNA) é, em seguida, realizada para adicionar um adaptador à extremidade 5' das moléculas de biblioteca.
[00129] Em outro método, etapas a partir da metodologia NEBDirect comercialmente disponível podem ser incluídas no método, as moléculas de DNA de cadeia única são hibridizadas a um primer específico de sequência para segunda síntese de cadeia, seguida por reparo terninai, e ligação para flanqueamento de adaptadores (ver neb.com/nebnext-direct/nebnext-direct-for-etiqueta-enrichment). A segunda cadeia de DNA contendo o primer é degradada de modo que ela não é sequenciada. Outro método usa primeres aleatórios tendo sequências de adaptador em suas extremidades 5' e bases aleatórias na extremidade 3'. Existem usualmente 6 bases aleatórias, mas podem ser entre 4 e 9 bases longas. Esta abordagem é particularmente susceptível para baixa entrada/amplificação de célula única para RNAseq ou Sequenciamento de Blssulfito (Smallwood et al., Nat. Methods 2014 Aug; 11(8):817-820).
[00130] ssDNA pode ser seletivamente capturado por sondas de ácido nucleico (NA), por omissão de etapa de desnaturação padrão antes da hibridização. Os híbridos ssDNA-sondas podem ser isolados a partir da população de cfNA (ácidos nucleicos de célula livre) por métodos convencionais (por exemplo, sondas de DNA/RNA biotlnilatadas, capturadas por magnetos de esfera de estreptavidina). As sequências de sonda podem ser específicas de alvo e as mesmas como um painel com um fluxo de operação de dsDNA, um subconjunto daquele fluxo de operação, ou diferente (por exemplo, direcionamento de fusões de RNA em junções exon-exon, sequências de DNA de 'ponto quente'). Todo ácido nucleico de cadeia única (ssNA) pode ser capturado nesta etapa, em uma maneira agonística de sequência por utilização de sondas com 'bases de nucleotídeo universal', tais como
Petição 870190078052, de 12/08/2019, pág. 59/238
55/194 deoxiinosina, 3-nitropirrole, e 5-nitroindole.
[00131] A Fig. 1 mostra um esquema exemplar para separação de formas de ácido nucleico. A porção superior da figura mostra uma amostra incluindo DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única. O RNA é reverso transcrito com uma sequência específica ou polyT primer aleatório com um 5' RNA-identificação de etiqueta de ácido nucleico. Após síntese de uma cadeia de DNA complementar, o modelo de RNA é degradado com RNase H ou NaOH ou depleção ribossomal por hibridização seletiva. A amostra é, em seguida, tratada com sondas de captura (que podem ser sequência específica ou agnóstica) sem desnaturação da amostra. Estas sondas hibridizam para moléculas de cadeia única removendo as moléculas de cadeia única da amostra. As moléculas de DNA de cadeia dupla na amostra neste exemplo são, em seguida, cortadas na extremidade e ligadas aos adaptadores incluindo etiquetas de ácido nucleico. Neste exemplo, os adaptadores são em forma de Y, e a porção de braço de cadeia dupla do Y é ligada às moléculas de DNA. Entretanto, os ácidos nucleicos de cadeia única separados são processados pelo protocolo de DNA ou protocolo de NEBdirect, conforme discutido acima, incluindo fixação de etiquetas.
[00132] A Fig. 2 mostra um esquema exemplar adicional começando com uma amostra incluindo DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, com um fluxo de operação simplificado, muito notavelmente obviando uma etapa de fosforilação de 5’DNA. O DNA de cadeia dupla na amostra é primeiro ligado aos adaptadores de grampo de cabelo incluindo etiquetas de ácido nucleico. A amostra é, em seguida, 5’DNA des-fosforilatada, e o RNA é, em seguida, convertido a cDNA, e também ligado a etiquetas diferentes. O DNA de cadeia única é, em seguida, processado similarmente como na Fig. 1. Em algumas concretizações, os adaptadores de grampo de cabelo podem
Petição 870190078052, de 12/08/2019, pág. 60/238
56/194 ser clivados em duas cadeias antes da amplificação de biblioteca. [00133] A Fig. 7 ilustra uma concretização de etiquetamento diferencial. Na etapa 701, uma população de ácidos nucleicos é obtida. Os ácidos nucleicos podem ser ácidos nudeicos circulantes (cNA) tais como de uma amostra de biópsia líquida (soro, plasma ou sangue). Na etapa 702, uma primeira forma de ácido nucleico é diferencialmente etiquetado para formar uma mistura (703) de uma primeira forma de ácido nucleico etiquetada, e uma segunda forma de ácido nucleico não-etiquetada. Subsequentemente, na etapa 704, a segunda forma de ácidos nucleicos (ou áddos nudeicos residuais) é etiquetada com etiquetas diferentes. O método acima pode incluir 2 ou mais etapas de etiquetamento diferencial diferentes (702) antes da etapa 704. Após etiquetamento das duas ou mais formas de áddos nucleicos na população, as formas diferentes podem ser, em algumas concretizações, divididas. Se as formas diferentes são divididas, os ácidos nucleicos diferencialmente etiquetados podem, em seguida, serem reunidos juntos antes do sequenciamento ou, sequenciados separadamente. De preferência, o etiquetamento diferencial de formas diferentes de ácidos nudeicos ocorre em um tubo ou volume de reação, e a totalidade de moléculas etiquetadas é sequenciada (sem divisão). As leituras obtidas do sequenciamento podem ser usadas para análise a ser realizada nas leituras derivadas de formas diferentes de ácidos nudeicos, bem como a amostra coletiva de ácido nucleico.
[00134] Em algumas concretizações, a primeira forma de ácidos nucleicos que é diferencialmente etiquetada é dsDNA, e o etiquetamento diferencial é realizado por fixação aos dsDNA adaptadores de cadeia dupla compreendendo um primeiro conjunto de etiquetas. ssDNA (áddos nudeicos residuais) é, em seguida, etiquetado com um conjunto diferente de etiquetas (segundo conjunto de etiquetas).
[00135] Em algumas concretizações, a primeira forma de ácidos nu
Petição 870190078052, de 12/08/2019, pág. 61/238
57/194 cleicos que é diferencialmente etiquetada é DNA de regiões de cromatina abertas, e o etiquetamento é realizado por contato da população de ácidos nucleicos com atividade de transposase mediada por Tn5. [00136] Em algumas concretizações, a primeira forma de ácidos nucleicos que é diferencialmente etiquetada é ácidos nucleicos de cadeia dupla, e o etiquetamento é realizado por fixação de adaptadores de grampo de cabelo aos ácidos nucleicos de cadeia dupla.
[00137] Divisão de ácidos nucleicos com extensões diferentes de modificação [00138] Em certas concretizações aqui descritas, uma população de formas diferentes de ácidos nucleicos pode ser dividida baseado na uma ou mais características dos ácidos nucleicos antes do etiquetamento e sequenciamento. Por divisão de uma população heterogênea de ácido nucleico, pode-se aumentar sinais raros, por exemplo, por enriquecimento de moléculas de ácido nucleico raras que são mais prevalentes em uma fração (ou divisão) da população. Por exemplo, uma variação genética presente no RNA, mas menos (ou não) no DNA, pode ser detectada pela divisão de RNA do DNA. Similarmente, uma variação genética presente em DNA hipermetilatado, mas menos (ou não) em DNA hipometilatado, pode ser mais facilmente detectada por divisão de uma amostra nas moléculas de ácido nucleico hlpermetilatadas e hipo-metllatadas. Por análise de frações múltiplas de uma amostra, uma análise multi-dimensional de uma molécula única pode ser realizada e, consequentemente, maior sensibilidade pode ser alcançada.
[00139] Em alguns exemplos, uma amostra heterogênea de ácido nucleico é dividida em duas ou mais divisões (por exemplo, pelo menos 3, 4, 5, 6 ou 7 divisões). Em algumas concretizações, cada divisão é diferencialmente etiquetada. Divisões etiquetadas são, em seguida, reunidas juntas para preparação de amostra coletiva e/ou sequencla
Petição 870190078052, de 12/08/2019, pág. 62/238
58/194 mento. As etapas de divisão-etiquetamento-reunião podem ocorrer mais do que uma vez, com cada etapa de divisão ocorrendo baseada em uma característica diferente (exemplos aqui providos), e etiquetada usando etiquetas diferenciais que são distinguidas de outras divisões e meios de divisão.
[00140] Exemplos de características que podem ser usados para divisão incluem, comprimento de sequência, nível de metilação, ligação de nucleossomo, desajustamento de sequência, imunoprecipitação, e/ou proteínas que se ligam a DNA. Divisões resultantes podem incluir uma ou mais das seguintes formas de ácido nucleico: ácidos ribonucleicos (RNA), DNA de cadeia única (ssDNA), DNA de cadeia dupla (dsDNA), fragmentos de DNA mais curtos, e fragmentos de DNA mais longos. Em algumas concretizações, uma população heterogênea de ácidos nudeicos é dividida em moléculas de ácido nucleico associadas com nucleossomos e moléculas de ácido nucleico destituídas de nucleossomos. Alternativamente ou adicionalmente, uma população heterogênea de ácidos nudeicos é dividida em RNA e DNA. Alternativamente ou adicionalmente, uma população heterogênea de ácidos nudeicos pode ser dividida em DNA de cadeia única (ssDNA) e DNA de cadeia dupla (dsDNA). Alternativamente ou adicionalmente, uma população heterogênea de ácidos nudeicos pode ser dividida em ácidos nudeicos com uma ou mais modificações epigenéticas, e sem a uma ou mais modificações epigenéticas. Exemplos de modificações epigenéticas incluem presença ou ausência de metilação; nível de metilação, tipo de metilação (5’ citosina); e associação e nível de associação com uma ou mais proteínas, tais como histonas. Alternativamente, ou adicionalmente, uma população heterogênea de ácidos nudeicos pode ser dividida baseado no comprimento de ácidos nudeicos (por exemplo, moléculas de até 160 bp, e moléculas tendo um comprimento de mais do que 160 bp).
Petição 870190078052, de 12/08/2019, pág. 63/238
59/194 [00141] Em alguns exemplos, cada divisão (representativa de uma forma diferente de ácido nucleico) é diferencialmente etiquetada, e as divisões são reunidas juntas antes do sequenciamento. Em outros exemplos, as formas diferentes são separadamente sequenciadas.
[00142] A Fig. 8 ilustra uma concretização da revelação. Uma população de ácidos nucleicos diferentes (801) é dividida (802) em duas ou mais divisões diferentes (803 a, b). Cada divisão (803 a, b) é representativa de uma forma diferente de ácido nucleico. Cada divisão é distintamente etiquetada (804). Os ácidos nucleicos etiquetados são reunidos juntos (807) antes do sequenciamento (808). Leituras são analisadas, in silico. Etiquetas são usadas para ciassificar leituras de divisões diferentes. Análise para detectar variantes genéticas pode ser realizada em um nível de divisão-por-divisâo, bem como nível total de população de ácido nucleico. Por exemplo, análise pode incluir anáiise in silico para determinar variantes genéticas, tais como CNV, SNV, indel, fusão em ácidos nucleicos em cada divisão. Em alguns exemplos, análise in silico pode incluir determinar estrutura de cromatina. Por exemplo, cobertura ou número de cópia de leituras de sequência podem ser usados para determinar posicionamento de nucleossomo na cromatina. Cobertura mais alta pode se correlacionar com ocupação mais aita de nucleossomo na região genômica, enquanto que cobertura mais baixa pode se correlacionar com ocupação mais baixa de nucleossomo, ou região exaurida de nucleossomo (NDR).
[00143] Amostras podem incluir ácidos nucleicos que variam em modificações incluindo modificações de pós-replicação para nucleotídeos e ligação, usualmente não-covalentemente, a uma ou mais proteínas.
[00144] Em uma concretização, a população de ácidos nucleicos é uma obtida de uma amostra de soro, plasma ou sangue de um indivíduo suspeito de ter câncer ou previamente diagnosticado com câncer.
Petição 870190078052, de 12/08/2019, pág. 64/238
60/194
Os ácidos nucleicos incluem um tendo níveis variantes de metilação. A metilação pode ocorrer de qualquer uma ou mais modificações de pósreplicação ou transcricional. Modificações de pós-replicação incluem modificações do nucleotídeo citosina, particularmente, 5-metilcitosina, 5~hidroximetilcitosina, 5~formilcitosina e 5~carboxilcitosina.
[00145] A divisão dos ácidos nucleicos é realizada por contato dos ácidos nucleicos com um domínio de ligação de metilação (“MBD”) de uma proteína de ligação de metilação (“MBP”). O MBD se liga a 5metilcitosina (5mC). O MBD é acoplado à esferas paramagnéticas, tais como Dynabeads® M-280 Streptavidin, via um ligador de biotina. A divisão em frações com extensões de metilação diferentes pode ser realizada por frações de eluição por aumento da concentração de NaCI.
[00146] Em geral, a eluição é uma função de número de locais metilatados por molécula, com moléculas tendo mais metilação que elui sob concentrações de sal aumentadas. Para eluir o DNA em populações distintas baseadas na extensão de metilação, pode-se usar uma série de tampões de eluição de concentração aumentada de NaCI. A concentração de sal pode variar de cerca de 100nm a cerca de 2500 mM de NaCI. Em uma concretização, o processo resulta em três (3) divisões. As moléculas são contatadas com uma solução em uma primeira concentração de sal, e compreendendo uma molécula compreendendo um domínio de ligação de metil, cuja molécula pode ser fixada à uma fração de captura, tal como estreptavidina. Na primeira concentração de sal, uma população de moléculas se ligará ao MBD, e uma população permanecerá não-ligada. A população não-ligada pode ser separada como uma população “hipometilatada”. Por exemplo, uma primeira divisão representativa da forma hipometilatada de DNA é aquela que permanece não-ligada a uma baixa concentração de sal, por exemplo, 160 nM. Uma segunda divisão representativa de DNA
Petição 870190078052, de 12/08/2019, pág. 65/238
61/194 metilatado intermediário é eluída usando uma concentração de sal intermediária, por exemplo, entre concentração de 100 mM e 2000 mM. Esta é também separada da amostra. Uma terceira divisão representativa de forma hipermetiiatada de DNA é eluída usando uma alta concentração de sal, por exemplo, pelo menos cerca de 2000 nM.
[00147] Cada divisão é diferencialmente etiquetada. Etiquetas podem ser moléculas, tais como ácidos nucleicos, contendo informação que indica uma característica da molécula com a qual a etiqueta é associada. Por exemplo, as moléculas podem suportar uma etiqueta de amostra (que distingue moléculas em uma amostra daquelas em uma amostra diferente), uma etiqueta de divisão (que distingue moléculas em uma divisão daquela em uma divisão diferente), ou uma etiqueta molecular (que distingue moléculas diferentes de uma outra (em ambos cenários de etiquetamento únicos e não-únicos). Em certas concretizações, uma etiqueta pode compreender um ou uma combinação de códigos de barras. Conforme aqui usado, o termo “código de barras” se refere a uma molécula de ácido nucleico tendo uma sequência de nucleotídeo particular, ou à própria sequência de nucleotídeo, dependendo do contexto. Um código de barras pode ter, por exemplo, entre 10 e 100 nucleotídeos. Uma coleta de códigos de barras pode ter sequências degeneradas, ou pode ter sequências tendo uma certa distância de Hamming, conforme desejado para a proposta específica. Desse modo, por exemplo, um índice de amostra, índice de divisão, ou índice molecular, podem ser compreendidos de um código de barras, ou uma combinação de dois códigos de barras, cada fixado à extremidades diferentes de uma molécula.
[00148] As etiquetas podem ser usadas para etiquetar as divisões de população de polinucleotídeo individual de modo a correlacionar a etiqueta (ou etiquetas) com uma divisão específica. Em algumas concretizações, uma única etiqueta pode ser usada para etiquetar uma
Petição 870190078052, de 12/08/2019, pág. 66/238
62/194 divisão específica. Em algumas concretizações, etiquetas múltiplas diferentes podem ser usadas para etiquetar uma divisão específica. Em concretizações empregando etiquetas múltiplas diferentes para etiquetar uma divisão específica, o conjunto de etiquetas usado para etiquetar uma divisão pode ser prontamente diferenciado do conjunto de etiquetas usado para etiquetar outras divisões. Em algumas concretizações, as etiquetas podem ter funções adicionais, por exemplo, as etiquetas podem ser usadas para indexar fontes de amostra, ou usadas como identificadores moleculares únicos (que podem ser usados para aperfeiçoar a qualidade de dado de sequenciamento por diferenciação de erros de sequenciamento de mutações). Similarmente, em algumas concretizações, as etiquetas podem ter funções adicionais, por exemplo, as etiquetas podem ser usadas para indexar fontes de amostra, ou usadas como identificadores moleculares não-únicos (que podem ser usados para aperfeiçoar a qualidade de dado de sequenciamento por diferenciação de erros de sequenciamento de mutações). [00149] Em uma concretização, o etiquetamento de divisão compreende moléculas alvos em cada divisão com o equivalente de uma etiqueta de amostra. Após re-combinação de divisões e moléculas de sequenciamento, as etiquetas de amostra identificam a divisão de fonte. Em outra concretização, divisões diferentes são etiquetadas com conjuntos diferentes de etiquetas moleculares, por exemplo, compreendidas de um par de códigos de barras. Desse modo, cada código de barras molecular indica a divisão de fonte, bem como sendo útil para distinguir moléculas dentro de uma divisão. Por exemplo, um primeiro conjunto de 35 códigos de barras pode ser usado para etiquetar moléculas em uma primeira divisão, enquanto que um segundo conjunto de 35 códigos de barras pode ser usado moléculas alvos em uma segunda divisão.
[00150] Enquanto que etiquetas podem ser fixadas às moléculas já
Petição 870190078052, de 12/08/2019, pág. 67/238
63/194 divididas baseado em uma ou mais características, as moléculas etiquetadas finais na biblioteca pode não mais possuir estas características. Por exemplo, enquanto que moléculas de DNA de cadeia única podem ser divididas e etiquetadas, as moléculas etiquetadas finais na biblioteca são prováveis de serem de cadeia dupla. Similarmente, enquanto que o RNA pode ser submetido à divisão, na biblioteca final, moléculas etiquetadas derivadas destas moléculas de RNA são prováveis de serem DNA. Consequentemente, a etiqueta fixada à molécula na biblioteca tipicamente indica a característica da “molécula de origem” da qual a última molécula etiquetada é derivada, não necessariamente para característica da própria molécula etiquetada.
[00151] Por exemplo, códigos de barras 1, 2, 3, 4, etc. são usados para etiqueta e moléculas alvos na primeira divisão; códigos de barras A, B, C, D, etc. são usados para etiqueta e moléculas alvos na segunda divisão; e códigos de barras a, b, c, d, etc. são usados para etiqueta e moléculas alvos na terceira divisão. Diferencialmente divisões etiquetadas podem ser reunidas antes do sequenciamento. Diferencialmente divisões etiquetadas podem ser separadamente sequenciadas ou sequenciadas juntas concorrentemente, por exemplo, na mesma célula de fluxo de um sequenciador Illumina.
[00152] Após sequenciamento, leituras são analisadas para detectar variantes genéticas que podem ser realizadas em um nível de divisãopor-divisão, bem como nível total de população de ácido nucleico. Etiquetas são usadas para classificar leituras de divisões diferentes. A análise pode incluir análise in silico para determinar variantes genéticas e estrutura de cromatina usando informação de sequência, comprimento de coordenadas genômicas, e cobertura ou número de cópia. A cobertura mais alta pode se correlacionar com ocupação mais alta de nucleossomo em região genômica, enquanto que cobertura mais baixa pode se correlacionar com ocupação mais baixa de nucleossoPetição 870190078052, de 12/08/2019, pág. 68/238
64/194 mo, ou região exaurida de nucleossomo (NDR).
[00153] Em algumas concretizações, os ácidos nucleicos na população original podem ser DNA e/ou RNA, de cadeia única, e/ou de cadeia dupla. O posicionamento baseado em cadeia única v. sem cadeia dupla, pode ser acompanhado por, por exemplo, usando sondas de captura etiquetadas para divisão de ssDNA, e usando adaptadores de cadeia dupla para divisão dsDNA. A divisão baseada na composição de RNA v. DNA inclui, mas não é limitada a usar adaptadores de cadeia dupla para divisão de dsDNA, e usar transcrição reversa com ou sem sondas de captura para divisão de adaptadores de cadeia dupla RNA.
[00154] Os agentes de afinidade podem ser anticorpos com a especificidade desejada, padrões de ligação natural, ou variantes destes (Bock et al., Nat Biotech 28: 1106-1114 (2010); Song et al., Nat Biotech 29, 68-72 (2011)), ou peptídeos artificiais selecionados, por exemplo, por phage mostrador para ter especificidade para uma dada etiqueta.
[00155] Exemplos de frações de captura contemplados aqui Incluem domínio de ligação de metil (MBDs) e proteínas de ligação de metil (MBPs). Exemplos de MBPs aqui contempladas incluem, mas não são limitadas a:
[00156] MeCP2 é uma proteína preferencialmente de ligação a 5metil-citosina sobre citosina não-modificada.
[00157] RPL26, PRP8 e a proteína de reparo de desequiparação de DNA MHS6 preferencialmente se ligam a 5-hidroximetil-citosina sobre citosina não-modificada.
[00158] FOXK1, FOXK2, FOXP1, FOXP4 e FOXI3, de preferência, se liga a 5-formil-citosina sobre citosina não-modificada (lurlaro et al., Genome Biol. 14, R119 (2013)).
[00159] Anticorpos específicos para uma ou mais bases de nucleoPetição 870190078052, de 12/08/2019, pág. 69/238
65/194 tídeo metilatado.
[00160] Do mesmo modo, a divisão de formas diferentes de ácidos nucleicos pode ser realizada usando proteínas de ligação de histona que podem separar ácidos nucleicos ligados a histonas de ácidos nucleicos livres ou não-ligados. Exemplos de proteínas de ligação de histona que podem ser usadas nos métodos aqui revelados incluem RBBP4, RbAp48 e peptídeos de domínio de SANT.
[00161] Embora para alguns agentes de afinidade e modificações, ligação ao agente pode ocorrer em uma essencialmente toda ou nenhuma maneira dependendo de se um ácido nucleico suporta uma modificação, a separação pode ser de um grau. Em tais exemplos, ácidos nucleicos sobrerrepresentados em uma modificação se ligam ao agente a uma maior extensão que os ácidos nucleicos subrrepresentados na modificação. Alternativamente, ácidos nucleicos tendo modificações podem se ligar em toda ou nenhuma maneira. Mas, em seguida, vários níveis de modificações podem ser sequencialmente eluídos a partir do agente de ligação.
[00162] Por exemplo, em algumas concretizações, a divisão pode ser binária, ou baseada no grau/nível de modificações. Por exemplo, todos os fragmentos metilatados podem ser divididos de fragmentos não-metilatados usando proteínas de domínio de ligação de metil (por exemplo, Kit MethylMinder DNA methylated Enrichment (ThermoFisher Scientific). Subsequentemente, divisão adicional pode envolver eluição de fragmentos tendo níveis diferentes de metilação por ajuste da concentração de sal em uma solução com o domínio de ligação de metil e fragmentos ligados. À medida que a concentração de sal aumenta, os fragmentos tendo maior nível de mutilações são eluídos.
[00163] Em alguns exemplos, as divisões finais são representativas de ácidos nucleicos tendo extensões diferentes de modificações (sobrerrepresentativas ou subrrepresentativas de modificações). Sobrer
Petição 870190078052, de 12/08/2019, pág. 70/238
66/194 representação e subrrepresentaçâo podem ser definidos pelo número de modificações surgidas por um ácido nucleico relativas ao número médio de modificações por cadeia em uma população. Por exemplo, se o número médio de resíduos de 5-metilcitosina em ácido nucleico em uma amostra é 2, um ácido nucleico incluindo mais do que resíduos de 5-metilcitosina é sobrerrepresentado nesta modificação, e um ácido nucleico com 1 ou zero resíduo de 5-metilcitosina é subrrepresentado. O efeito da separação de afinidade é enriquecer os ácidos nucleicos sobrerrepresentados em uma modificação em uma fase ligada, e para ácidos nucleicos subrrepresentados em uma modificação em uma fase não-ligada (isto é, em solução). Os ácidos nucleicos na fase ligada podem ser eluídos antes do subsequente processamento. [00164] Quando usando o Kit MethylMiner DNA methylated Enrichment Kit (ThermoFisher Scientific), vários níveis de metilação podem ser divididos usando eluições sequenciais. Por exemplo, uma divisão hipometilatada (nenhuma metilação) pode ser separada de uma divisão metilatada por contato da população de ácido nucleico com a MBD a partir do kit, que é fixada à esferas magnéticas. As esferas são usadas para separar os ácidos nucleicos metilatados dos ácidos nucleicos não-metilatados. Subsequentemente, uma ou mais etapas de eluição são realizadas sequencialmente para eluir ácidos nucleicos tendo níveis diferentes de metilação. Por exemplo, um primeiro conjunto de ácidos nucleicos metilatados pode ser eluído a uma concentração de sal de 160 mM, ou mais alta, por exemplo, pelo menos 200 mM, 300 mM, 400 mM, 500 mM, 600 mM, 700 mM, 800 mM, 900 mM, 1000 mM, ou 2000 mM. Após tais ácidos nucleicos metilatados serem eluídos, separação magnética é uma vez novamente usada para separar nível mais alto de ácidos nucleicos metilatados daqueles com nível mais baixo de metilação. As etapas de eluição e separação magnética podem repetirem-se para criar várias divisões, tais como uma divisão
Petição 870190078052, de 12/08/2019, pág. 71/238
67/194 hipometilatada (representativa de nenhuma metilação), uma divisão metilatada (representativa de baixo nível de metilação), e um divisão hiper metiiatada (representativa de alto nível de metilação).
[00165] Em alguns métodos, os ácidos nucleicos ligados a um agente usado para separação de afinidade são submetidos a uma etapa de lavagem. A etapa de lavagem lava ácidos nucleicos fracamente ligados ao agente de afinidade. Tais ácidos nucleicos podem ser enriquecidos em ácidos nucleicos tendo a modificação à uma extensão próxima à média ou mediana (isto é, intermediária entre ácidos nucleicos remanescentes ligados à fase sólida, e ácidos nucleicos não se ligando à fase sólida em contato inicial da amostra com o agente).
[00166] A separação de afinidade resulta em pelo menos duas, e, às vezes, três ou mais divisões de ácidos nucleicos com extensões diferentes de uma modificação. Enquanto que as divisões são ainda separadas, os ácidos nucleicos de pelo menos uma divisão, e usualmente duas ou três (ou mais) divisões são ligadas às etiquetas de ácido nucleico, usualmente proporcionam como componentes de adaptadores, com os ácidos nucleicos em divisões diferentes que recebem etiquetas diferentes que distinguem membros de uma divisão de outro. As etiquetas ligadas às moléculas de ácido nucleico da mesma divisão podem ser as mesmas ou diferentes de uma outra. Mas se diferente de uma outra, as etiquetas podem ter parte de seu código em comum, de modo a identificar as moléculas as quais elas são fixadas como sendo de uma divisão particular.
[00167] A Fig. 3 mostra um esquema exemplar. A amostra inclui ácidos nucleicos com extensões diferentes de metilação, alguns dos quais também têm variações genéticas. As amostras são contatadas com esferas magnéticas ligadas a um reagente de afinidade preferencialmente ligando a 5-metilcitosina sobre citosina. A purificação de afinidade resulta em duas divisões de ácidos nucleicos. A divisão na es
Petição 870190078052, de 12/08/2019, pág. 72/238
68/194 querda da figura representa ácidos nucleicos que se ligam aos reagentes de afinidade, e é enriquecida em ácidos nudeicos sobrerrepresentados em 5-metilcitosina. A divisão na direita representa ácidos nucleicos que não se ligam ao reagente de afinidade, e é enriquecida em áddos nudeicos carecendo ou subrrepresentados em 5-metilcitosina. As duas divisões são, em seguida, fixadas aos adaptadores em forma de Y incluindo etiquetas de ácido nucleicos diferenciais e amplificados. Os áddos nudeicos amplificados são, em seguida, ensaiados para dado de sequência, a sequência de ácido nucleico de amostra indicando variações genéticas, e a sequência de etiquetas indicando que divisão de uma amostra ácido nucleico dividida em, desse modo, indicando uma extensão de modificação.
[00168] A Fig. 24 proporciona um exemplo ilustrativo de abordagens de divisão e etiquetamento de MBD. No fluxo de operação (1), um conjunto de etiquetas moleculares (por exemplo, 35x35 etiquetas) pode ser aplicado à toda amostra antes da divisão. Após divisão, neste exemplo, para formas hiper- e hipo-metilatadas, as moléculas em cada divisão são opcionalmente amplificadas e, em seguida, independentemente sequenciadas. No fluxo de operação (2), as moléculas em uma amostra são divididas, por exemplo, baseadas nas características de metilação. Cada divisão é separadamente etiquetada, amplificada, e sequenciada. No fluxo de operação (3), as moléculas em cada de uma pluralidade de amostras são submetidas a divisão, etiquetadas com etiquetas específicas de divisão, reunidas, e amplificadas. As moléculas em cada amostra são, em seguida, providas com uma etiqueta de amostra, para desconvolucionar a amostra da qual elas se originam.
[00169] Em algumas concretizações, as moléculas de ácido nucleico podem ser fracionadas em divisões diferentes baseadas nas moléculas de ácido nucleico que são ligadas à uma proteína especifica, ou
Petição 870190078052, de 12/08/2019, pág. 73/238
69/194 a fragmento desta, e aquelas que não são ligadas àquela proteína específica, ou fragmento desta. As moléculas de ácido nucleico podem ser fracionadas baseado na ligação de proteína de DNA. Os complexos de proteína-DNA podem ser fracionados baseado em uma propriedade específica de uma proteína. Exemplos de tais propriedades incluem vários epítopos, modificações (por exemplo, metilação ou acetilação de histona), ou atividade enzimática. Exemplos de proteínas que podem se ligar ao DNA e servem como uma base para fracionamento podem incluir, mas não são limitados a proteína A e proteína G. Qualquer método adequado pode ser usado para fracionar as moléculas de ácido nucleico baseado nas regiões de ligação de proteína. Exemplos de métodos usados para fracionar moléculas de ácido nucleico baseado nas regiões de ligação de proteína incluem, mas não são limitados a, SDS-PAGE, precipitação de imuno-cromatina (ChIP), cromatografia de heparina, e fracionamento de fluxo de campo assimétrico (AF4).
[00170] Determinação de padrão de 5-metilcitosina de ácidos nucleicos [00171] O sequenciamento à base de bissulfito e variantes deste proporciona um meio de determinar o padrão de metilação de um ácido nucleico. Em algumas concretizações, a determinação do padrão de metilação compreende distinguir 5-metilcitosina (5mC) de citosina não-metilatada. Em algumas concretizações, a determinação do padrão de metilação compreende distinguir N6-metiladenina de adenina não-metilatada. Em algumas concretizações, a determinação do padrão de metilação compreende distinguir 5-hidroxlmetilcitosína (5hmC), 5-formilcitosina (5fC), e 5-carboxilcitosina (5caC) de citosina nãometilatada. Exemplos de sequenciamento de bissulfito incluem, mas não são limitados a sequenciamento de bissulfito oxidatívo (OX-BSseq), sequenciamento de bissulfito auxiliado por Tet (TAB-seq), e sequenciamento de bissulfito reduzido (redBS-seq).
Petição 870190078052, de 12/08/2019, pág. 74/238
70/194 [00172] O sequenciamento de bissulfito oxidativo (OX-BS-seq) é usado para distinguir entre 5mC e 5hmC, por primeira conversão do 5hmC a 5fC, e, em seguida, procedendo com sequenciamento de bissulfito, conforme anteriormente descrito. O sequenciamento de bissulfito auxiliado por Tet (TAB-seq) pode também ser usado para distinguir 5mc e 5hmC. No TAB-seq, 5hmC é protegido por glicosilação. Uma enzima de Tet é, em seguida, usada para converter 5mC a 5caC antes de proceder com sequenciamento de bissulfito, conforme anteriormente descrito. O sequenciamento de bissulfito reduzido é usado para distinguir 5fC de citosina modificada.
[00173] Geralmente, no sequenciamento de bissulfito, uma amostra de ácido nucleico é dividida em duas alíquotas, e uma alíquota é tratada com bissulfito. O bissulfito converte citosina nativa e certos nucleotídeos de citosina modificada (por exemplo, 5-formilcitosina ou 5carboxilcitosina) em uracil, pelo que outra citosina modificada (por exemplo, 5- metilcitoslna, 5-hidroxilmetilcistoslna) não são convertidas. A comparação de sequências de ácido nucleico de moléculas a partir das duas alíquotas indica que as citosinas foram e não foram convertidas a uracis. Consequentemente, as citosinas que foram e não foram modificadas podem ser determinadas. A divisão inicial da amostra em duas alíquotas é desvantajosa para amostras contendo somente quantidades pequenas de ácidos nucleicos, e/ou compostas de origens de célula/tecido heterogêneas, tais como fluidos corpóreos contendo DNA de célula livre.
[00174] A presente revelação proporciona métodos que permitem sequenciamento de bissulfito e variantes deste. Estes métodos operam por ligação de ácidos nucleicos em uma população à uma fração de captura, isto é, uma etiqueta que pode ser capturada ou frações de captura imobilizadas incluem, sem limitação, biotina, avidina, estreptavidina, um ácido nucleico compreendendo a uma sequência de nucleo
Petição 870190078052, de 12/08/2019, pág. 75/238
71/194 tídeo particular, uma hapteno reconhecido por um anticorpo, e partículas magneticamente atraíveis. A fração de extração pode ser um membro de um par de ligação, tal como biotina/estreptavidina, ou hapteno/anticorpo. Em algumas concretizações, uma fração de captura que é fixada a um analito é capturada por seu par de ligação que que é fixado a uma fração isolável, tal como uma partícula magneticamente atraível, ou uma partícula maior que pode ser sedimentada através de centrifugação. A fração de captura pode ser qualquer tipo de molécula que permite separação de afinidade de ácidos nucleicos que suportam a fração de captura de ácidos nucleicos que carecem da fração de captura. Frações de captura exemplares são biotina que permitem separação de afinidade por ligação a estreptavidina ligada ou ligável a uma fase sólida, ou um oligonucleotídeo, que permite separação de afinidade através de ligação a um oligonucleotídeo complementar ligado ou ligável a uma fase sólida. Após ligação de frações de captura aos ácidos nucleicos de amostra, os ácidos nucleicos de amostra servem como modelos para amplificação. Após amplificação, os modelos originais permanecem ligados às frações de captura, mas amplicons não são ligados às frações de captura.
[00175] A fração de captura pode ser ligada à ácidos nucleicos de amostra como um componente de um adaptador, que pode também proporcionar amplificação e/ou sequenciamento de locais de ligação de primer. Em alguns métodos, os ácidos nucleicos de amostra são ligados aos adaptadores e ambas as extremidades, com ambos adaptadores suportam uma fração de captura. De preferência, quaisquer resíduos de citosina nos adaptadores são modificados, tal como por 5 metilcitosina, para proteger contra a ação de bissulfito. Em alguns exemplos, as frações de captura são ligadas aos modelos originais por uma ligação clivável (por exemplo, destiobiotina fotoclivável-resíduos de TEG ou uracil cliváveis com enzima USER™, Chem. Commun.
Petição 870190078052, de 12/08/2019, pág. 76/238
72/194 (Camb). 2015 Feb 21; 51(15): 3266-3269), em cujo caso as frações de captura podem, se desejado, serem removidas.
[00176] Os amplicons são desnaturados e contatados com um reagente de afinidade para a captura da etiqueta. Os modelos originais se ligam ao reagente de afinidade pelo que as moléculas de ácido nucleico resultam da não amplificação. Desse modo, os modelos originais podem ser separados das moléculas de ácido nucleico resultantes da amplificação.
[00177] Após separação ou divisão, as respectivas populações de ácidos nucleicos (isto é, modelos originais e produtos de amplificação) podem ser submetidas ao tratamento com bissulfito com a população de modelo original que recebe tratamento com bissulfito e os produtos de amplificação não. Alternativamente, os produtos de amplificação podem ser submetidos ao tratamento com bissulfito, e a população de modelo original não. Após tal tratamento, as respectivas populações podem ser amplificadas (que no caso da população de modelo original converte uracis a timinas). As populações podem também serem submetidas à hlbridização de sonda de biotlna para enriquecimento. As respectivas populações são, em seguida, analisadas, e as sequências comparadas para determinar que citosinas foram 5-metilatadas (ou 5hidroxilmetilatadas) no original. A detecção de um nucleotídeo T na população modelo (correspondente a uma citosina não-metilatada convertida em uracil), e um nucleotídeo C na correspondente posição da população amplificada, indicam um C não-modificado. A presença de Cs em posições correspondentes do modelo original e populações amplificadas indica um C modificado na amostra original.
[00178] Em algumas concretizações, um método usa preparação de biblioteca de NGS de DNA-seq sequencial e bissulfito-seq (BlS-seq) de etiqueta molecular das bibliotecas de DNA (ver FIG. 4). Este processo é realizado por etiquetação de adaptadores (por exemplo, biotiPetição 870190078052, de 12/08/2019, pág. 77/238
73/194 na), amplificação de DNA-seq de biblioteca total, recuperação de molécula de origem (por exemplo, esfera de estreptavidina retirada), conversão de bissulfito e BIS-seq. Em algumas concretizações, o método identifica 5-metiicitosina com resolução de base única, através de amplificação preparativa de NGS sequencial de moléculas de biblioteca de origem com e sem tratamento com bissulfito. Isto pode ser alcançado por modificação dos adaptadores de NGS 5-metilatados (adaptadores direcionais; em forma de Y/forcado com substituição de 5metilcitosina) usados em BIS-seq com uma etiqueta (por exemplo, biotina) em uma das duas cadeias adaptadoras. As moléculas de DNA de amostra são ligadas ao adaptador, e amplificadas (por exemplo, por PCR). Como somente as moléculas de origem terão uma extremidade adaptadora etiquetada, elas podem ser seletivamente recuperadas de sua progenia amplificada por métodos de captura específicos de etiqueta (por exemplo, estreptavidina-esferas magnéticas). À medida que as moléculas de origem retêm marcas de 5-metilação, a conversão de bissulfito na biblioteca capturada produzirá resolução de base única de 5-estado de metilação após BIS-seq, retenção de informação molecular a correspondente DNA-seq. Em algumas concretizações, a biblioteca tratada com o bissulfito pode ser combinada com uma biblioteca não-tratada antes do enriquecimento/NGS por adição de uma sequência de DNA de etiqueta de amostra em fluxo de operação de NGS multiplexado padrão. Como com fluxos de operação de BIS-seq, análise de bioinformática pode ser efetuada para aiinhamento genômico e identificação de base 5-metilatada. Em suma, este método proporciona a capacidade de recuperar seletivamente as moléculas ligadas de origem, que transportam marcas de 5-metilcitosina, após amplificação da biblioteca, desse modo, permitindo processamento paralelo para bissulfito convertido em DNA. Isto supera a natureza destrutiva de tratamento com bissulfito na qualidade/sensibilidade da informação de
Petição 870190078052, de 12/08/2019, pág. 78/238
74/194
DNA-seq extraída de um fluxo de operação. Com este método, as moléculas de DNA de origem ligadas recuperadas (via adaptadores etiquetados) permitem amplificação da biblioteca de DNA complete e aplicação paralela de tratamentos que induzem modificações de DNA epigênicas. A presente revelação discute o uso de métodos de BISseq para identificar citosina 5-metilação (5-metilcitosina), mas este não deve ser limitante. Variantes de BIS-seq foram desenvolvidas para identificar citosinas hidroximetilatadas (5hmC; OX- BS~seq, TAB-seq), formilcitosina (5fC; redBS-seq) e carboxilcitosinas. Estas metodologias podem ser implementadas com a preparação de biblioteca sequencial/paralela aqui descrita.
[00179] Métodos Alternativos de Análise de Ácido Nucleico Modificado [00180] A revelação proporciona métodos alternativos para analisar ácidos nucleicos modificados (por exemplo, metilatados, ligados a histonas e outras modificações acima discutidas). Em alguns tais métodos, uma população de ácidos nucleicos suportando a modificação à extensões diferentes (por exemplo, 0, 1, 2, 3, 4, 5 ou mais grupos metil por molécula de ácido nucleico) é contatada com adaptadores antes do fracionamento da população dependendo da extensão da modificação. Os adaptadores se fixam a, ou uma extremidade, ou ambas extremidades de moléculas de ácido nucleico na população. De preferência, os adaptadores incluem etiquetas diferentes de números suficientes que o número de combinações de etiquetas resulta em uma baixa probabilidade, por exemplo, 95, 99 ou 99,9% de dois ácidos nucleicos com os mesmos pontos de partida e de parada que recebem a mesma combinação de etiquetas. Após fixação dos adaptadores, os ácidos nucleicos são amplificados de primeres que se ligam aos locais de ligação de primer no interior dos adaptadores. Os adaptadores, se suportando a mesma ou etiquetas diferentes, podem incluir o mesmo
Petição 870190078052, de 12/08/2019, pág. 79/238
75/194 ou locais de ligação de primer diferentes, mas, de preferência, os adaptadores incluem o mesmo local de ligação de primer. Após amplificação, os ácidos nucleicos são contatados com um agente que, de preferência, se liga aos ácidos nucleicos que suportam a modificação (tal como os anteriormente descritos tais agentes). Os ácidos nucleicos são separados em pelo menos duas divisões que diferem na extensão para qual os ácidos nucleicos suportam a modificação de ligação aos agentes. Por exemplo, se o agente tem afinidade para ácidos nucleicos suportando a modificação, os ácidos nucleicos sobrerrepresentados na modificação (comparados com representação média na população) preferencialmente se ligam ao agente, pelo que os ácidos nucleicos subrrepresentados para a modificação não se ligam ou são mais facilmente eluídos a partir do agente. Após separação, as divisões diferentes podem, em seguida, serem submetidas a etapas de processamento adicionais, que tipicamente incluem amplificação adicional, e análise de sequência, em paralelo, mas separadamente. Dado de sequência das divisões diferentes pode, em seguida, ser comparado.
[00181] Um esquema exemplar para realização de tal separação é mostrado na Fig. 5. Os ácidos nucleicos são ligados em ambas extremidades aos adaptadores em forma de Y incluindo locais de ligação de primer e etiquetas. As moléculas são amplificadas. As moléculas amplificadas são, em seguida, fracionadas por contato com um anticorpo preferencialmente se ligando a 5-metilcitosina para produzir duas divisões. Uma divisão inclui moléculas originais que carecem de metilação e cópias de amplificação tendo metilação perdida. A outra divisão inclui moléculas de DNA originais com metilação. As duas divisões são, em seguida, processadas e sequenciadas separadamente com amplificação adicional da divisão metilatada. O dado de sequência das duas divisões pode, em seguida, ser comparado. Neste exem
Petição 870190078052, de 12/08/2019, pág. 80/238
76/194 pio, etiquetas não são usadas para distinguir entre DNA metiiatada e DNA não-metilatado, mas preferivelmente, para distinguir entre moléculas diferentes dentro destas divisões, de modo que pode-se determinar se leituras com os mesmos pontos de partira e de parada são baseadas na mesma ou moléculas diferentes.
[00182] A revelação proporciona métodos adicionais para analisar uma população de ácido nucleico em que pelo menos alguns dos ácidos nucleicos incluem um ou mais resíduos de citosina modificados, tal como 5-metilcitosina, e qualquer das outras modificações descritas anteriormente. Nestes métodos, a população de ácidos nucleicos é contatada com adaptadores incluindo um ou mais resíduos de citosina modificados na posição 5C, tal como 5-metilcitosina. De preferência, todos os resíduos de citosina em tais adaptadores são também modificados, ou todas tais citosinas em uma região de ligação de primer dos adaptadores são modificadas. Os adaptadores se fixam à ambas extremidades de moléculas de ácido nucleico na população. De preferência, os adaptadores incluem etiquetas diferentes de números suficientes que o número de combinações de etiquetas resultam em uma baixa probabilidade, por exemplo, 95, 99 ou 99,9% de dois ácidos nucleicos com os mesmos pontos de partida e parada que recebem a mesma combinação de etiquetas. Os locais de ligação de primer em tais adaptadores podem ser os mesmos ou diferentes, mas são, de preferência, os mesmos. Após fixação dos adaptadores, os ácidos nucleicos são amplificados de primeres que se ligam aos locais de ligação de primer dos adaptadores. Os ácidos nucleicos amplificados são divididos em primeira e segunda alíquotas. A primeira alíquota é ensaiada para dado de sequência com ou sem processamento adicional. O dado de sequência nas moléculas na primeira alíquota é, desse modo, determinado indiferente do estado de metilação inicial das moléculas de ácido nucleico. As moléculas de ácido nucleico na segunda alí
Petição 870190078052, de 12/08/2019, pág. 81/238
77/194 quota são tratadas com bissulfito. Este tratamento converte citosinas não-modificadas em uracis. Os ácidos nudeicos tratados com bissulfito são, em seguida, submetidos à amplificação iniciada pelos primeres aos locais de ligação de primer originais dos adaptadores ligados ao ácido nucleico. Somente as moléculas de ácido nucleico originalmente Hgadas aos adaptadores (conforme distintas dos produtos de amplificação destes) são agora amplificáveis porque estes ácidos nudeicos retêm citosinas nos locais de ligação de primer dos adaptadores, pelo que os produtos de amplificação têm perdido a metilação destes resíduos de citosina, que suportaram conversão em uracis no tratamento com bissulfito. Desse modo, somente moléculas originais nas populações, pelo menos alguns dos quais são metilatados, suportam amplificação. Após amplificação, estes ácidos nudeicos são submetidos a análise de sequência. A comparação de sequências determinadas a partir da primeira e segunda alíquotas pode indicar, entre outras coisas, que citosinas na população de ácido nucleico foram submetidas à metilação.
[00183] Um esquema exemplar para estas análises é mostrado na Fig. 6. O DNA metilatado é Hgado aos adaptadores em forma de Y em ambas extremidades incluindo locais de ligação de primer e etiquetas. As citosinas nos adaptadores são 5-metilatadas. A metilação dos primeres servem para proteger os locais de ligação de primer em uma subsequente etapa de bissulfito. Após fixação dos adaptadores, as moléculas de DNA sâo amplificadas. O produto de amplificação é dividido em duas alíquotas para sequenciamento com e sem tratamento com bissulfito. A alíquota não submetida à sequenciamento de bissulfito pode ser submetida à análise de sequência com ou sem processamento adicional. A outra alíquota é tratada com bissulfito, que converte citosinas não-metilatadas em uracis. Somente locais de ligação de primer protegidos por metilação de citosinas podem suportar amplifi
Petição 870190078052, de 12/08/2019, pág. 82/238
78/194 cação quando contatados com primeres específicos para locais de ligação de primer originais. Desse modo, somente moléculas originais e não cópias a partir da primeira amplificação são submetidas à amplificação adicional. As moléculas amplificadas adicionais são, em seguida, submetidas à análise de sequência. As sequências podem, em seguida, serem comparadas a partir das duas alíquotas. Como na Fig. 5, as etiquetas de ácido nucleico nos adaptadores não são usadas para distinguir entre DNA metilatado e DNA não-metilatado, mas para distinguir moléculas de ácido nucleico dentro da mesma divisão.
[00184] Características Gerais dos Métodos [00185] Amostras [00186] A amostra pode ser qualquer amostra biológica isolada de um indivíduo. Uma amostra pode ser uma amostra corpórea. As amostras podem incluir tecidos corpóreos, tais como tumores sólidos conhecidos ou suspeitos, sangue total, plaquetas, soro, plasma, fezes, células de sangue vermelhas, células de sangue brancas, ou leucócitos, células endoteliais, biópsias de tecido, fluido cérebro-espinhal, fluido sinovial, fluido linfático, fluido de ascite, fluido intersticiai ou extracelular, o fluido em espaços entre células, incluindo fluido crevicular gengival, medula óssea, efusões pleurais, fluido cerebroespinhal, saliva, muco, escarro, esperma, suor, urina. As amostras são, de preferência, fluidos corpóreos, particularmente sangue e frações deste, e urina. Uma amostra pode ser na forma originalmente isolada de um indivíduo, ou pode ter sido submetida a processamento adicionai para remover ou adicionar componentes, tal como células, ou enriquecer um componente relativo a outro. Desse modo, um fluido corpóreo preferido para análise é plasma ou soro contendo ácidos nucleicos de célula livre. Uma amostra pode ser isolada ou obtida de um indivíduo, e transportada para um local de análise de amostra. A amostra pode ser preservada e carregada a uma temperatura desejável, por exemplo,
Petição 870190078052, de 12/08/2019, pág. 83/238
79/194 temperatura ambiente, 4°C, -20°C, e/ou -80°C. Uma amostra pode ser isolada ou obtida de um indivíduo no local da análise da amostra. O indivíduo pode ser um humano, um mamífero, um animal, um animal de companhia, um animal de serviço, ou um animal de estimação. O indivíduo pode ter um câncer. O indivíduo pode não ter câncer ou um sintoma de câncer detectável. O indivíduo pode ter sido tratado com uma ou mais terapia de câncer, por exemplo, qualquer uma ou mais de quimioterapias, anticorpos, vacinas, ou biológicos. O indivíduo pode estar em remissão. O indivíduo pode ou não pode ser diagnosticado de ser susceptível a câncer ou qualquer mutação/distúrblo genético associado a câncer.
[00187] O volume de plasma pode depender da profundidade de leitura desejada para regiões sequenciadas. Volumes exemplares são 0,4-40 ml, 5-20 ml, 10-20 ml. Por exemplo, o volume pode ser 0,5 mL, 1 mL, 5 mL 10 mL, 20 mL, 30 mL, ou 40 mL. Um volume de plasma amostrado pode ser 5 a 20 mL.
[00188] Uma amostra pode compreender várias quantidades de ácido nucleico que contêm genomas equivalentes. Por exemplo, uma amostra de cerca de 30 ng de DNA pode conter cerca de 10.000 (104) genoma humano haploide equivalentes e, no caso de cfDNA, cerca de 200 bilhões (2x1011) de moléculas de polinucleotídeo individuais. Similarmente, uma amostra de cerca de 100 ng de DNA pode conter cerca de 30.000 genoma humano haploide equivalentes e, no caso de cfDNA, cerca de 600 bilhões de moléculas individuais.
[00189] Uma amostra pode compreender ácidos nucleicos de fontes diferentes, por exemplo, de células e livre de célula do mesmo indivíduo, de células e livre de célula de indivíduos diferentes. Uma amostra pode compreender ácidos nucleicos que transportam mutações. Por exemplo, uma amostra pode compreender DNA que transporta mutações de linha germinal e/ou mutações somáticas. Mutações de linha
Petição 870190078052, de 12/08/2019, pág. 84/238
80/194 germinal se referem às mutações existentes em DNA de linha germinal de um indivíduo. Mutações somáticas se referem a mutações que se originam em células somáticas de um indivíduo, por exemplo, células de câncer. Uma amostra pode compreender DNA que transporta mutações associadas a câncer (por exemplo, mutações somáticas associadas a câncer). Uma amostra pode compreender uma variante epigenética (isto é, uma modificação química ou modificação de proteína), na qual a variante epigenética associada com a presença de uma variante genética, tal como uma mutação associada à câncer. Em algumas concretizações, a amostra compreende uma variante epigenética associada com a presença de uma variante genética, na qual a amostra não compreende a variante genética.
[00190] Quantidades exemplares de ácidos nucleicos de células livre em uma amostra antes da amplificação variam de cerca de 1 pg a cerca de 1 pg, por exemplo, 1 pg a 200 ng, 1 ng a 100 ng, 10 ng a 1000 ng. Por exemplo, a quantidade pode ser até cerca de 600 ng, até cerca de 500 ng, até cerca de 400 ng, até cerca de 300 ng, até cerca de 200 ng, até cerca de 100 ng, até cerca de 50 ng, ou até cerca de 20 ng de moléculas de ácido nucleico de célula livre. A quantidade pode ser pelo menos 1 fg, pelo menos 10 fg, pelo menos 100 fg, pelo menos 1 pg, pelo menos 10 pg, pelo menos 100 pg, pelo menos 1 ng, pelo menos 10 ng, pelo menos 100 ng, pelo menos 150 ng, ou pelo menos 200 ng de moléculas de ácido nucleico de célula livre. A quantidade pode ser até 1 femtograma (fg), 10 fg, 100 fg, 1 picograma (pg), 10 pg, 100 pg, 1 ng, 10 ng, 100 ng, 150 ng, ou 200 ng de moléculas de ácido nucleico de célula livre. O método pode compreender obtenção de 1 femtograma (fg) a 200 ng.
[00191] Os ácidos nucleicos de célula livre são ácidos nucleicos não contidos ou, de outro modo, ligados a uma célula ou, em outras palavras, ácidos nucleicos remanescentes em uma amostra após remoção
Petição 870190078052, de 12/08/2019, pág. 85/238
81/194 de células intactas. Os ácidos nucleicos de célula livre incluem DNA, RNA, e híbridos destes, incluindo DNA genômico, DNA mitocondrial, siRNA, miRNA, RNA circulante (cRNA), tRNA, rRNA, RNA nucleolar pequeno (snoRNA), RNA de Piwi-interaçâo (piRNA), RNA de nãocodificação longo (ncRNA longo), ou fragmentos de qualquer destes. Os ácidos nucleicos de célula livre podem ser de cadeia dupla, de cadeia única, ou um híbrido destes. Um ácido nucleico de célula livre pode ser liberado no fluido corpóreo através de secreção ou processos de morte de célula, por exemplo, necrose celular e apoptose. Alguns ácidos nucleicos de célula livre são liberados no fluido corpóreo de células de câncer, por exemplo, DNA de tumor circulante, (ctDNA). Outros sâo liberados de células saudáveis. Em algumas concretizações, cfDNA é um DNA fetal de célula livre (cffDNA). Em algumas concretizações, os ácidos nucleicos de célula livre são produzidos por células de tumor. Em algumas concretizações, os ácidos nucleicos de célula livre são produzidos por uma mistura de células de tumor e células de não-tumor.
[00192] Os ácidos nucleicos de célula livre têm uma distribuição de tamanho exemplar de cerca de 100-500 nucleotídeos, com moléculas de 110 a cerca de 230 nucleotídeos representando cerca de 90% de moléculas, com um modo de cerca de 168 nucleotídeos, e um segundo pico menor em uma faixa entre 240 a 440 nucleotídeos.
[00193] Os ácidos nucleicos de célula livre podem ser isolados de fluidos corpóreos através de uma etapa de fracionamento ou divisão em que os ácidos nucleicos de célula livre, conforme encontrados em solução, são separados de células de intacto e outros componentes não-solúveis do fluido corpóreo. A divisão pode incluir técnicas tais como centrifugação ou filtração. Alternativamente, as células nos fluidos corpóreos podem ser lisadas e de célula livre, e ácidos nucleicos celulares processados juntos. Geralmente, após adição de tampões e
Petição 870190078052, de 12/08/2019, pág. 86/238
82/194 etapas de lavagem, os ácidos nucleicos podem ser precipitados com um álcool. Etapas de limpeza adicionais podem ser usadas tais como colunas à base de silica para remover contaminantes ou sais. Ácidos nucleicos transportadores de volume não-específicos, tais como Cot-1 DNA, DNA ou proteína para sequenciamento de bissulfito, hibridização, e/ou ligação, podem ser adicionados através de toda a reação para otimizar certos aspectos do procedimento, tal como rendimento. [00194] Após tal processamento, as amostras podem incluir várias formas de ácido nucleico incluindo DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única. Em algumas concretizações, DNA e RNA de cadeia única podem ser convertidos à formas de cadeia dupla de nodo que eles são incluídos em subsequente processamento e etapas de análise.
[00195] Ligação de Moléculas de DNA aos Adaptadores [00196] As moléculas de DNA de cadeia dupla em uma amostra, e RNA de cadeia única, ou moléculas de DNA convertidas à moléculas de DNA de cadeia dupla, podem ser ligadas aos adaptadores em, ou uma extremidade, ou ambas extremidades. Tipicamente, moléculas de cadeia dupla são de extremidade cega por tratamento com uma polimerase com uma 5s-3' polimerase e uma 3'~5' exonuclease (ou função de leitura de prova), na presença de todos os quatro nucleotídeos de cadeia. Fragmentos grandes de Klenow e T4 polimerase são exemplos de polimerase adequada. As moléculas de DNA de extremidade cega podem ser ligadas com pelo menos adaptador parcialmente de cadeia dupla (por exemplo, um adaptador em forma de sino ou em forma de Y). Altemativamente, nucleotídeos complementares podem ser adicionados às extremidades cegas de ácidos nucleicos de amostra e adaptadores para facilitar ligação. Aqui contempladas são ambas ligações de extremidade cega e ligação de extremidade adesiva. Na ligação de extremidade cega, ambas as moléculas de ácido nucleico e as etique
Petição 870190078052, de 12/08/2019, pág. 87/238
83/194 tas do adaptador têm extremidades cegas. Na ligação de extremidade adesiva, tipicamente, as moléculas de ácido nucleico suportam uma saliência “A”, e os adaptadores suportam uma saliência “T”.
[00197] Amplificação [00198] Os ácidos nucleicos de amostra flanqueados pelos adaptadores podem ser amplificados por PCR e outros métodos de amplificação. A amplificação é tipicamente iniciada por primeres que se ligam aos locais de ligação de primer em adaptadores que flanqueiam uma molécula de DNA a ser amplificada. Os métodos de amplificação podem envolver ciclos de desnaturação, recozimento e extensão, resultante de termociclagem, ou podem ser isotermais como na amplificação mediada por transcrição. Outros métodos de amplificação incluem a reação de cadeia de ligase, amplificação de deslocamento de cadeia, amplificação à base de sequência de ácido nucleico, e replicação à base de sequência auto-sustentada.
[00199] De preferência, os presentes métodos realizam ‘ligações de T/A’ dsDNA com adaptadores com cauda T e cauda C, que resultam em amplificação de pelo menos 50, 60, 70 ou 80% de ácidos nucleicos de cadeia dupla antes da ligação aos adaptadores. De preferência, os presentes métodos aumentam a quantidade ou número de moléculas amplificadas relativos aos métodos de controle realizados com adaptadores de cauda T sozinhos por pelo menos 10, 15 ou 20%.
[00200] Etiquetas [00201] As etiquetas compreendendo códigos de barras podem ser incorporadas em ou, de outro modo, unidas aos adaptadores. As etiquetas podem ser incorporadas por ligação, sobrepondo PCR de extensão entre outros métodos.
[00202] Estratégias de Etiquetamento Molecular [00203] O etiquetamento molecular se refere a uma prática de etiquetamento que permite diferenciar moléculas das quais leituras de
Petição 870190078052, de 12/08/2019, pág. 88/238
84/194 sequência se originam. As estratégias de etiquetamento podem ser divididas em estratégias de etiquetamento único e etiquetamento nãoúnico. No etiquetamento único, todas ou substancialmente todas das moléculas em uma amostra suportam uma etiqueta diferente, de modo que leituras podem ser atribuídas às moléculas originais baseada na informação de etiqueta sozinha. As etiquetas usadas em tais métodos são às vezes referidas como “etiquetas únicas”. Em etiquetamento não-único, moléculas diferentes na mesma amostra podem suportar a mesma etiqueta, de modo que outra informação em adição à informação de etiqueta é usada para atribuir uma leitura de sequência a uma molécula original. Tal informação pode incluir coordenada de partida e de parada, coordenada a qual a molécula mapeia, coordenada de partida ou parada sozinha, etc. As etiquetas usadas em tais métodos são às vezes referidas como “etiquetas não-únicas”. Consequentemente, não é necessário etiquetar unicamente toda molécula em uma amostra. Isto serve para etiquetar unicamente moléculas que caem dentro de uma classe identificável dentro de uma amostra. Desse modo, as moléculas em famílias identificáveis diferentes podem suportar a mesma etiqueta sem perda de informação sobre a identidade da molécula etiquetada.
[00204] Em certas concretizações de etiquetamento não-único, o número de etiquetas diferentes usadas pode ser suficiente que existe uma probabilidade muito alta (por exemplo, pelo menos 99%, pelo menos 99,9%, pelo menos 99,99%, ou pelo menos 99,999%, que todas as moléculas de um grupo particular suportam uma etiqueta diferente. É para ser notado que quando códigos de barras são usados como etiquetas, e quando códigos de barras são fixados, por exemplo, aleatoriamente, a ambas extremidades de uma molécula, a combinação de códigos de barras, juntas, podem constituir uma etiqueta. Este número, em termo, é uma função do número de moléculas que caem
Petição 870190078052, de 12/08/2019, pág. 89/238
85/194 nas células. Por exemplo, a classe pode ser todas moléculas que mapeiam à mesma posição de partida-parada em um genoma de referência. A classe pode ser todas moléculas que mapeiam através de um local genético particular, por exemplo, uma base particular, ou uma região particular (por exemplo, até 100 bases, ou um gene ou um exon de um gene). Em certas concretizações, o número de etiquetas diferentes usadas para identificar unicamente um número de moléculas, z, em uma classe, pode ser entre qualquer de 2*z, 3*z, 4*z, 5*z, 6*z, 7*z, 8*z, 9*z, 10*z, 11 *z, 12*z, 13*z, 14*z, 15*z, I6*z, 17*z, 18*z, 19*z, 20*z ou 100*z (por exemplo, limite inferior), e qualquer de !00.000*z, 10.000*z, 1000*z ou 100*z (por exemplo, limite superior).
[00205] Por exemplo, em uma amostra de cerca de 5 ng a 30 ng de DNA de célula livre, espera-se ao redor de 3000 moléculas para mapear a uma coordenada de nucleotídeo particular, e entre cerca de 3 e 10 moléculas tendo qualquer coordenada de partida para compartilhar a mesma coordenada de parada. Consequentemente, cerca de 50 a cerca de 50.000 etiquetas diferentes (por exemplo, entre cerca de 6 e 220 combinações de código de barras) podem ser suficientes para etiquetar unicamente tais moléculas. Para etiquetar unicamente todas 3000 moléculas que mapeiam através de uma coordenada de nucleotídeo, cerca de 1 milhão a cerca de 20 milhões de etiquetas diferentes seriam requeridas.
[00206] Geralmente, a atribuição de etiquetas códigos de barras únicas ou não-únicas em reações segue métodos e sistemas descritas pelos pedidos de patente dos Estados Unidos 20010053519, 20030152490, 20110160078, e Patente dos Estados Unidos. No. 6.582.908 e Patente dos Estados Unidos. No. 7.537.898 e Patente dos Estados Unidos No. 9.598.731. As etiquetas podem ser ligadas aos ácidos nucleicos de amostra aleatoriamente ou não-aleatoriamente.
[00207] Em algumas concretizações, os ácidos nucleicos etiqueta
Petição 870190078052, de 12/08/2019, pág. 90/238
86/194 dos sâo sequenciados após carregamento em uma placa de mlcrocavidade. A placa de microcavidade pode ter 96, 384, ou 1536 micro cavidades. Em alguns casos, elas são introduzidas em uma proporção esperada de etiquetas únicas para microcavidades. Por exemplo, as etiquetas únicas podem ser carregadas de modo que mais do que cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50.000, 100.000, 500.000, 1.000.000, 10.000.000, 50.000.000 ou 1.000.000.000 de etiquetas únicas são carregadas por amostra de genoma. Em alguns casos, as etiquetas únicas podem ser carregadas de modo que menos do que cerca de 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50.000. 100.000. 500.000. 1.000.000. 10.000.000. 50.000.000 ou 1.000.000.000 de etiquetas únicas são carregadas por amostra de genoma. Em alguns casos, o número médio de etiquetas únicas carregadas por genoma de amostra é menos do que, ou mais do que, cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 500, 1000, 5000, 10000, 50.000. 100.000. 500.000. 1.000.000. 10.000.000. 50.000.000 ou 1.000.000.000 de etiquetas únicas por amostra de genoma.
[00208] Um formato preferido usa 20-50 códigos de barras de etiqueta diferentes ligados a ambas extremidades de ácidos nucleico de etiquetas. Por exemplo, 35 códigos de barras de etiqueta diferentes ligados a ambas extremidades de moléculas alvos que criam 35 x 35 permutações, que igualam 1225 para 35 códigos de barras de etiqueta. Tais números de etiquetas são suficientes de modo que moléculas diferentes tendo os mesmos pontos de partida e de parada têm uma alta probabilidade (por exemplo, pelo menos 94%, 99,5%, 99,99%, 99,999%) de receber combinações diferentes de etiquetas. Outras combinações de códigos de barras incluem qualquer número entre 10 e 500, por exemplo, cerca de 15x15, cerca de 35x35, cerca de 75x75, cerca de 100x100, cerca de 250x250, cerca de 500x500.
Petição 870190078052, de 12/08/2019, pág. 91/238
87/194 [00209] Em alguns casos, etiquetas únicas podem ser predeterminadas ou oligonucleotídeos de sequência aleatória ou semialeatória. Em outros casos, uma pluralidade de códigos de barras pode ser usada tal que códigos de barras não são necessariamente únicos entre si na pluralidade. Neste exemplo, códigos de barras podem ser ligados às moléculas individuais, tal que a combinação do código de barras e a sequência pode ser ligada para criar uma sequência única que pode ser individualmente rastreada. Conforme aqui descrito, a detecção de códigos de barras não-únicos em combinação com dado de sequência das porções de começo (partida) e final (parada) de leituras de sequência, pode permitir atribuição de uma identidade única para uma molécula particular. O comprimento ou número de pares de base, de uma leitura de sequência individual, pode também ser usado para atribuir uma identidade única a tal molécula. Conforme aqui descrito, fragmentos de uma cadeia única de ácido nucleico tendo sido atribuídos a uma identidade única, podem, desse modo, permitir subsequente identificação de fragmentos a partir da cadeia de origem.
[00210] Enriquecimento de alvo [00211] Em certas concretizações, os ácidos nucleicos em uma amostra podem ser submetidos a enriquecimento de alvo, em que moléculas tendo sequências de etiqueta são capturadas para análise subsequente. O enriquecimento de alvo pode envolver uso de um conjunto de iscas compreendendo iscas de oligonucleotídeo etiquetadas com uma fração de captura, tal como biotina. As sondas podem ter sequências selecionadas para revestir através de um painel de regiões, tais como genes. Em algumas concretizações, um conjunto de isca pode ter uma concentração relativa mais alta para mais especificamente sequências desejadas de interesse. Tais conjuntos de iscas são combinados com uma amostra sob condições que permitem hibridização das moléculas alvos com as iscas. Em seguida, as moléculas
Petição 870190078052, de 12/08/2019, pág. 92/238
88/194 capturadas são isoladas usando a fração de captura. Por exemplo, uma fração de captura de biotina por estreptavidina à base de esfera. Tais métodos são adicionalmente descritos em, por exemplo, USSN 15/426.668, depositado em 7 de fevereiro de 2017 (Patente dos Estados Unidos 9.850.523, publicada em 26 de dezembro de 2017).
[00212] Sequenciamento [00213] Os ácidos nucleicos de amostra flanqueados por adaptadores com ou sem amplificação anterior podem ser submetidos a sequenciamento. Os métodos de sequenciamento incluem, por exemplo, sequenciamento de Sanger, sequenciamento de alta produção, piro sequenciamento, sequenciamento-por-síntese, sequenciamento de molécula única, sequenciamento de nano poro, sequenciamento de semicondutor, sequenciamento-por-ligação, sequenciamento-porhibridização, RNA-Seq (Illumina), Expressão de gene digital (Helicos), Sequenciamento de próxima geração (NGS), Sequenciamento de Molécula Única por Síntese (SMSS) (Helicos), sequenciamento masslvamente paralelo, Matriz de Molécula Única Clonal (Solexa), sequenciamento de shotgun, Ion Torrent, Oxford Nanopore, Roche Genia, sequenciamento de Maxim-Gilbert, sequenciamento de primer walking, usando PacBio, SOLiD, Ion Torrent, ou plataformas de Nanopore. As reações de sequenciamento podem ser realizadas em uma variedade de unidades de processamento de amostra, que podem ser de raias múltiplas, canais múltiplos, cavidades múltiplas, ou outros meios de processamento de conjuntos de amostra múltipla substancialmente simultaneamente. A unidade de processamento de amostra pode também incluir câmaras de amostra múltiplas para capacitar processamento de operações múltiplas simultaneamente.
[00214] As reações de sequenciamento podem ser realizadas em uma ou mais formas de ácidos nucleicos, pelo menos uma das quais é conhecida por conter marcadores de câncer, ou outra doença. As rea
Petição 870190078052, de 12/08/2019, pág. 93/238
89/194 ções de sequenciamento podem também ser realizadas em quaisquer fragmentos de ácido nucleico presentes na amostra. As reações de sequência podem proporcionar cobertura de sequência do genoma de pelo menos 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 99,9% ou 100%. Em outros casos, a cobertura de sequência do genoma pode ser menos do que 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, 99.9% ou 100%. A cobertura de sequência pode ser realizada em pelo menos 5, 10, 20, 70, 100, 200 ou 500 genes diferentes, ou, no máximo, 5000, 2500, 1000, 500 ou 100 genes diferentes.
[00215] As reações de sequenciamento simultâneas podem ser realizadas usando sequenciamento multiplex. Em alguns casos, os ácidos nucleicos de célula livre podem ser sequenciados com pelo menos 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 100.000 reações de sequenciamento. Em outros casos os ácidos nucleicos de célula livre podem ser sequenciados com menos do que 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 100.000 reações de sequenciamento. As reações de sequenciamento podem ser realizadas sequencialmente ou simultaneamente. Análise de dados subsequente pode ser realizada no todo ou parte das reações de sequenciamento. Em alguns casos, análise de dados pode ser realizada em pelo menos 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 100.000 reações de sequenciamento. Em outros casos, análise de dados pode ser realizada em menos do que 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 50000, 100.000 reações de sequenciamento. Uma profundidade de leitura exemplar é 1000-50000 leituras por local (base).
[00216] Análise [00217] Os presentes métodos podem ser usados para diagnosticar presença de condições, particularmente câncer, em um indivíduo, para
Petição 870190078052, de 12/08/2019, pág. 94/238
90/194 caracterizar condições (por exemplo, estágio de câncer ou determinação da heterogeneidade de um câncer), monitorar resposta ao tratamento de uma condição, efetuar risco de prognóstico de desenvolvimento de uma condição ou subsequente curso de uma condição. A presente revelação pode também ser útil na determinação da eficácia de uma opção de tratamento particular. As opções de tratamento bem sucedidas podem aumentar a quantidade de variação de número de cópia ou mutações raras detectadas no sangue do indivíduo se o tratamento é bem sucedido à medida que mais cânceres podem matar e eliminar DNA. Em outros exemplos, isto não pode ocorrer. Em outro exemplo, talvez certas opções de tratamento podem ser correlacionadas com perfis genéticos de cânceres com o tempo. Esta correlação pode ser útil na seleção de uma terapia. Adicionalmente, se um câncer é observado para estar em remissão após tratamento, os presentes métodos podem ser usados para monitorar doença residual ou recorrência de doença.
[00218] Os tipos e número de cânceres que podem ser detectados podem incluir cânceres de sangue, cânceres de cérebro, cânceres de pulmão, cânceres de pele, cânceres de nariz, cânceres de garganta, cânceres de fígado, cânceres de osso, linfomas, cânceres de pancreáticos, cânceres de pele, cânceres de intestino, cânceres retais, cânceres de tiroide, cânceres de bexiga, cânceres de rim, cânceres de boca, cânceres de estômago, tumores de estado sólido, tumores heterogêneos, tumores homogêneos, e similares. Tipo e/ou estágio de câncer podem ser detectados de variações genéticas incluindo mutações, mutações raras, indels, variações de número de cópia, transversões, translocações, inversão, anulações, aneuploidia, aneuploidia parcial, poliploidia, instabilidade cromossomal, alterações de estrutura cromossomal, fusões de gene, fusões de cromossomo, truncamentos de gene, amplificação de gene, duplicações de gene, lesões cromosso
Petição 870190078052, de 12/08/2019, pág. 95/238
91/194 mais, lesões de DNA, mudanças anormais em modificações químicas de ácido nucleico, mudanças anormais em padrões epigenéticos, e mudanças anormais em ácido nucleico 5-metilcitosina.
[00219] Os dados genéticos podem também serem usados para caracterização de uma forma específica de câncer. Os cânceres são frequentemente heterogêneos em ambas composição e estágio. Os dados de perfil genético podem permitir caracterização de subtipos específicos de câncer que podem ser importantes no diagnóstico ou tratamento daquele subtipo específico. Esta informação pode também proporcionar a um indivíduo ou médico indícios relacionados ao prognóstico de um tipo específico de câncer e permitir, ou que um indivíduo ou médico se adapte às opções de tratamento de acordo com o progresso da doença. Alguns cânceres podem progredir para se tornarem mais agressivos e geneticamente instáveis. Outros cânceres podem permanecer benignos, inativos ou latentes. O sistema e métodos desta revelação podem ser úteis na determinação da progressão da doença. [00220] As presentes análises são também úteis na determinação da eficácia de uma opção de tratamento particular. As opções de tratamento bem sucedidas podem aumentar a quantidade de variação de número de cópia ou mutações raras detectadas no sangue do indivíduo se o tratamento é bem sucedido à medida que mais cânceres podem matar e eliminar DNA. Em outros exemplos, isto pode não ocorrer. Em outro exemplo, talvez certas opções de tratamento podem estar correlacionadas com perfis genéticos de cânceres com o tempo. Esta correlação pode ser útil na seleção de uma terapia. Adicionalmente, se um câncer é observado estar em remissão após tratamento, os presentes métodos podem ser usados para monitorar doença residual ou recorrência de doença.
[00221] Os presentes métodos podem também serem usados para detecção de variações genéticas em condições outras do que câncer.
Petição 870190078052, de 12/08/2019, pág. 96/238
92/194
Células imunes, tais como células B, podem suportar expressão clonal rápida após a presença de certas doenças. As expansões clonais podem ser monitoradas usando detecção de variação de número de cópia e certos estados imunes podem ser monitorados. Neste exemplo, análise da variação de número de cópia pode ser realizada com o tempo para produzir um perfil de como uma doença particular pode estar progredindo. A variação de número de cópia ou mesmo detecção de mutação rara pode ser usada para determinar como uma população de patógenos está mudando durante o curso de infecção. Isto pode ser particularmente importante durante infecções crônicas, tais como HIV/AIDS, ou infecções de Hepatite, pelo que os vírus podem mudar o estado de ciclo de vida e/ou mudar em formas mais virulentas durante o curso de infecção. Os presentes métodos podem ser usados para determinar ou perfilar atividades de rejeição do corpo do hospedeiro, à medida que as células imunes tentam destruir o tecido transplantado para monitorar o estado de tecido transplantado, bem como alterando o curso de tratamento ou prevenção de rejeição.
[00222] Ainda, os métodos da revelação podem ser usados para caracterizar a heterogeneldade de uma condição anormal em um indivíduo. Tais métodos podem incluir, por exemplo, geração de um perfil genético de polínucleotídeos extracelulares derivados do indivíduo, no qual o perfil genético compreende uma pluralidade de dados resultantes de variação de número de cópia e análise de mutação rara. Em algumas concretizações, uma condição anormal é câncer. Em algumas concretizações, a condição anormal pode ser uma resultando em uma população genômica heterogênea. No exemplo de câncer, alguns tumores são conhecidos por compreenderem células de tumor em estágios diferentes do câncer. Em outros exemplos, a heterogeneldade pode compreender focos múltiplos de doença. Novamente, no exemplo de câncer, pode existir focos de tumor múltiplos, talvez onde um ou
Petição 870190078052, de 12/08/2019, pág. 97/238
93/194 mais focos são o resultado de metastases que tenha difundido de um local primário.
[00223] Os presentes métodos podem ser usados para gerar ou perfilar, impressão digital ou conjunto de dados que é um somatório de informação genérica derivada de células diferentes em uma doença heterogênea. Este conjunto de dados pode compreender variação de número de cópia e análises de mutação sozinhas ou em combinação.
[00224] Os presentes métodos podem ser usados para diagnosticar, prognosticar, monitorar ou observar cânceres, ou outras doenças. Em algumas concretizações, os métodos aqui não envolvem a diagnosticação, prognosticação ou monitoramento de um feto, e como tal, não são direcionados a teste pré-natal não-invasivo. Em outras concretizações, estas metodologias podem ser empregadas em um indivíduo grávido para diagnosticar, prognosticar, monitorar ou observar cânceres ou outras doenças em um indivíduo ainda por nascer cujo DNA e outros polinucleotídeos podem co-circularem com moléculas maternais.
[00225] Um método exemplar para identificação de etiqueta molecular de bibliotecas divididas de esfera à base de MBD através de NGS é conforme segue:
[00226] Divisão física de uma amostra de DNA extraída (por exemplo, DNA de plasma de sangue extraído de uma amostra humana) usando um kit de domínio de ligação de metil proteína-purificação de esfera, economizando todas as eluições do processo para processamento à jusante.
[00227] Aplicação paralela de etiquetas moleculares diferenciais e sequências de adaptador de capacitação de NSG a cada divisão. Por exemplo, a metilaçâo residual hipermetilatada ('lavagem'), e divisões hipometilatadas são ligadas com NGS-adaptadores com etiquetas moleculares.
Petição 870190078052, de 12/08/2019, pág. 98/238
94/194 [00228] Re-combinação de todas as divisões etiquetadas moleculares, e subsequente amplificação usando sequências de primer de DNA específica de adaptador.
[00229] Enriquecimento/hibridização de bibliotecas totais recombinadas e amplificadas, etiquetamento de regiões genômicas de interesse (por exemplo, variantes genéticas específicas de câncer, e regiões diferencialmente metilatadas).
[00230] Re-amplificação da biblioteca de DNA total enriquecida, anexando uma etiqueta de amostra. Amostras diferentes são reunidas, e ensaiadas em multiplex em um Instrumento de NGS.
[00231] Análise bioinformática de dados de NGS, com as etiquetas moleculares sendo usadas para identificar moléculas únicas, bem como desconvolução da amostra em moléculas que foram diferencialmente MBD-dividida. Esta análise pode produzir informação na 5metilcitosina relativa para regiões genômicas, concorrente com sequenciamento genético/detecção de variante, padrões.
[00232] Modos de praticar a revelação [00233] A presente revelação proporciona um método de compreender divisão de populações de ácido nucleico de célula livre (cfNA) em divisões que compartilham uma ou mais características similares.
[00234] Os métodos da presente revelação podem ser realizados para dividir ácidos nucleicos de cadeia única (ssNA; ssDNA, RNA) e dsDNA, pelo que moléculas de dsDNA são preparadas através de preparação de biblioteca padrão, e ssNA são preparados em um fluxo de operação de preparação de biblioteca adjunta que converte ssNAs em uma forma alterada com enriquecimento, sequenciamento (por exemplo, NGS), e análise, enquanto que retendo informação a cerca do tipo de biomolécula que se origina (isto é, RNA, ssDNA, dsDNA).
[00235] As abordagens na preparação de biblioteca inclusiva de cfNA podem envolver (a) conversão de RNA em um ssDNA identificá
Petição 870190078052, de 12/08/2019, pág. 99/238
95/194 vel, e (b) divisão de ssDNA e moléculas de dsDNA para preparação de biblioteca de NGS paralela, (c) seguido por (opcional) enriquecimento de alvo, (d) NGS e análise de dados à jusante para identificar tipo de molécula com sequência (ver FIG. 1).
[00236] Em algumas concretizações, ligação de adaptador de NGS específica de dsDNA da população de cfNA pode ser realizada antes do etiquetamento molecular de RNA, ligação específica, conversão de cDNA, e preparação de biblioteca de NGS. Metodologia de sequenciamento simultâneo, em que dsDNA, em seguida, RNA, é sequencialmente ligado para criação de biblioteca de NGS, sem divisão, podem ser aplicados à amostras de cfNA, conforme mostrado na Fig. 2.
[00237] Em algumas concretizações, ligação de plataforma usa adaptadores em forma de Y ou ‘forcados’ que produzem moléculas de ds-cf-DNA ligadas com ssDNA de extremidades 5' e 3’. Estas extremidades podem ser fracamente Hgadas pelo RNA Hgase (ou Circligase™ll) em sequenciamento simultâneo ou metodologias de preparação de biblioteca de ssDNA tradicional. Por alteração das extremidades dos adaptadores em forma de Y a grampos de cabelo ou bolhas, as moléculas de cf-dsM DNA ligadas não mais têm extremidades de ssDNA, e não são um substrato para subsequente ligação de ssNA em sequenciamento simultâneo/preparação de biblioteca de DNA tradicional. Desse modo, reinventando os adaptadores de NGS para conter extremidades de ssDNA não livres capacita a preparação de biblioteca de RNA e ssDNA em adição a um fluxo de operação de dsDNA, sem divisão de tipos de molécula.
[00238] Os métodos da presente revelação podem ser realizados em uma população de cfNA com enzimas de transcrição reversa usando gene primeres de DNA específicos/aleatórios/polyT com uma cauda de etiquetamento molecular, subsequentemente removendo o RNA por hidrólise de RNase H ou NaOH, produzindo um ssDNA eti
Petição 870190078052, de 12/08/2019, pág. 100/238
96/194 quetado (cDNA) para substituir cada molécula de RNA. Metodologias adicionais conhecidas àqueles técnicos no assunto podem ser empregadas para remover sequências de RNA indesejadas, tais como depleção de RNA ribossomal por hibridização seletiva.
[00239] ssDNA pode ser seletivamente capturado por sondas de NA, por omissão de etapa de desnaturação padrão antes da hibridização. Os híbridos de sondas de ssDNA podem ser isolados a partir da população de cfNA por métodos conhecidos na técnica (por exemplo, sondas de DNA/RNA biotinilatadas, capturadas por magnetos de estreptavidina-esfera). As sequências de sonda podem ser específicas de etiqueta, e as mesmas como um painel com um fluxo de operação de dsDNA, um subconjunto daquele fluxo de operação, ou diferentes (por exemplo, fusões de RNA de etiquetação em junções exon-exon, sequências de DNA de 'ponto quente'). Além disso, todo ssNA pode ser capturado nesta etapa, em uma maneira agonística de sequência por utilização de sondas com 'bases de nucleotideo universais', tais como deoxiinosina, 3-nitropirrole, e 5~nitroindole.
[00240] Em adição às variações genéticas tais como SNV, indels, fusões de gene, e CNV, identificadas por sequenciamento de DNA, variações epigenéticas (tais como 5-metilcitosina, metilação de histona, posicionamento de nucleossomo, e expressão de RNA micro e longa de não-codificação), podem conduzir a ou serem envolvidos em progressão de doença, tal como câncer. Medições de alto rendimento de marcadores epigenéticos requerem técnicas de biologia molecular intrincadas, desenvolvidas especificamente para cada tipo de marca epigenética. Como tal, projetos de sequenciamento epigenético são tipicamente paralelos de sequenciamento de DNA (genético), e requerem grandes quantidades de entrada. Diferentemente formulado, detecção de biomarcador de multi-analito é efetuada com destruição de amostra.
Petição 870190078052, de 12/08/2019, pág. 101/238
97/194 [00241] Ambos sequenciamento genético (DNA) e sequenciamento epigenético de DNA de célula livre têm valor diagnóstico para teste pré-natal não-invasivo (NIPT) e monitoramento/detecção de câncer. Em ambas aplicações, a quantidade de material genético é limitante e identificação de eventos moleculares raros é primordial. Desse modo, com as metodologias atuais, a realização de sequenciamento epigenético resulta em uma redução na sensibilidade na detecção de variantes genéticas, à medida que cada tipo de marcador requer uma amostra dedicada.
[00242] A presente revelação proporciona métodos de obtenção de informação no processo epigenético de DNA 5-metilcitosina, mas a metodologia de divisão com etiquetas moleculares esboçada para 5metilcitosina também pode ser aplicada a outros mecanismos epigenéticos. Similarmente, etiquetamento e recuperação de NGS-moléculas de DNA de origem ligadas a adaptador, conforme esboçado na presente revelação para identificação de 5-metilcitosina (5mC), também pode ser usado para identificar outras marcas de modificação de DNA epigenéticos (por exemplo, hidroximetilatado, formil, e carboxil; 5hmC, 5fC, e 5caC, respectivamente).
[00243] Com relação a 5~metilcitosina, sequenciamento de bissulfito tem sido a abordagem mais popular, capaz de resolver bases de 5metilcitosina com resolução de base única. Este método envolve um tratamento químico (bissulfito) que atua em todas as bases de citosina, convertendo-as a um uracil, a menos que elas sejam 5-metilatado ou 5-hidroxilmetilatado. Sequenciamento após tratamento com bissulfito resultará em resíduos de citosinas 5-metilatadas e citosinas 5hidroxilmetilatadas detectadas como citosina, enquanto que citosinas não-metilatadas, citosinas 5-formilmetilatada, e citosinas 5carboxilmetilatadas são detectadas como timina. Variações de sequenciamento de bissulfito, anteriormente descritas, podem adlcional
Petição 870190078052, de 12/08/2019, pág. 102/238
98/194 mente distinguir entre 5mC, 5hmC, 5fC, e 5caC. A principal limitação desta abordagem é que a maioria do material genérico é perdido. O tratamento severo com bissulfito degrada <99% do DNA de entrada, desse modo reduzindo a complexidade molecular da amostra e o limite alcançável de detecção. Técnicas de amplificação de DNA de biologia molecular presentes (por exemplo, PCR, LAMP, RCA) são agnósticas ao 5-estado de metilaçâo de citosina, e, desse modo, marcas de 5metilação são perdidas com amplificação. Isto é extremamente indesejável em aplicações de biópsia de líquido. Em adição, com bibliotecas de DNA convertidas em bissulfito que detectam variantes somáticas tomam-se mais desafiantes (por exemplo, diferenciação de um C->T SNV de uma citosina não-metilatada). Desse modo, DNA tratado com bissulfito nâo é usado para detecção de variante genética em aplicações de biópsia de líquido. A realização de análise de 5-metilcitosina e variante genética chamando em DNA requer que a amostra seja dividida, que reduz entrada/sensibilidade de detecção em cada fluxo de operação, e impede identificação de ambas informação e variantes genéticas de 5-metilcitosina em uma molécula única.
[00244] Em certas concretizações, ácidos nucleicos são divididos baseados nas diferenças de metilação. Formas de “hipermetilação” e “hipometilação” de ácidos nucleicos podem ser definidas como moléculas que caem acima e abaixo, respectivamente, um grau particular de metilação diferenciada pelo método de divisão particular usado. Por exemplo, o método de divisão pode selecionar moléculas tendo pelo menos 2, pelo menos 3, pelo menos 4, pelo menos 5, ou pelo menos 6 nucleotídeos metilatados. Extensão de metilação se refere a número de nucleotídeos metilatados em um fragmento de ácido nucleico. Identificação de moléculas de DNA que são relativamente “hipermetilatadas” em uma mostra de DNA pode ser alcançada por captura de moléculas que se ligam a uma proteína de domínio de ligação de metil
Petição 870190078052, de 12/08/2019, pág. 103/238
99/194 (MBD), ou um fragmento ou variante desta. O MBD pode também ser referido como um domínio de ligação de MetU-CpG. A proteína de MBD pode ser complexada com esferas magnéticas. Em algumas concretizações, uma proteína que se liga ao MBD é MECP2, MBD1, MBD2, MBD3, MBD4, ou um fragmento ou variante destes. Embora os locais de 5-metilação sejam não diretamente indicados com este método (nenhuma conversão de bissulfito), análise de bioinformática de sobreposição de fragmentos hipermetilatados pode determinar local(is) específico(s) de 5-metilcitosina. O problema principal deste método é que por sequenciamento somente da divisão hipermetilatada, a maioria de genoma humano que é não-metilatado (-80-97% por massa) não é sequenciada, que impedes/limita a identificação de variantes genéticas (por exemplo, SNV, indels, e CNVs), à medida que estes são regiões de baixa cobertura, ou não apresentam no todo na divisão hipermetilatada.
[00245] A presente revelação proporciona métodos para obtenção de dados de 5~metilcitosina e para obtenção de dados de sequenciamento para detecção de variante genética rara na mesma amostra de entrada baixa (por exemplo, fluxo de operação de biópsia de líquido). Por exemplo, uma abordagem compreendendo fracionamento e etiquetamento de MBD é não-destrutiva à ácidos nucleicos na amostra, e preserva complexidade de genoma após amplificação. Em adição, abordagens de fracionamento-etiquetamento (por exemplo, fracionamento e etiquetamento de MBD) podem recombinar diferencialmente moléculas de ácido nucleico divididas para assegurar preservação de complexidade de genoma e capacitar detecção de biomarcador de multi-analito (variante genética e epigenética). Por contraste, outras abordagens podem ser destrutivas à moléculas de ácido nucleico em uma amostra. Estas outras abordagens podem incluir sequenciamento de bissulfito, digestão de enzima de restrição sensível à metil, e enri
Petição 870190078052, de 12/08/2019, pág. 104/238
100/194 quecimento de MBD em casos onde somente uma fração ou grupo de moléculas de ácido nucleico é analisada (por exemplo, moléculas de ácido nucleico hipermetllatadas). Por exemplo, sequenclamento de bissulfito cria dano físico às moléculas de ácido nucleico. Digestão de enzima de restrição sensível à metil reduz a complexidade de genoma por destruição de uma fração não-metilatada, deixando somente ácidos nucleicos metilatados intactos. O enriquecimento de MBD, em exemplos onde somente moléculas de ácido nucleico ligadas a MBD são analisados, pode similarmente ser usado para isolar somente uma fração única de ácidos nucleicos em uma amostra. Abordagens analisam somente uma fração única de moléculas de ácido nucleico destroem informação sobre moléculas de ácido nucleico presentes em uma porção não-enriquecida.
[00246] Os métodos aqui proporcionados para obter dados de 5metilcitosina (ou outros dados de estado de metilação) podem ser praticados em combinação com os métodos acima descritos para obtenção de ácido nucleico de cadeia única e informação de ácido nucleico de cadeia dupla. Em algumas concretizações, os métodos aqui quantificam % de DNA hipermetilatado por etiquetar diferencialmente moléculas de DNA que foram divididas por esferas de MBD a vários graus de metilação. (Ver Fig. 3). Neste método, todos os eluentes de protocolo de divisão de MBD podem ser recuperados, e um NGS-biblioteca preparada com conjuntos diferentes de etiquetas moleculares correspondem a sua divisão de MBD. Desse modo, o processo de divisão de MBD reduz a perda de material presente com tratamento com bissulfito típico. À medida que as divisões ligadas podem ser re-combínadas antes da amplificação/enriquecimento/NGS, existe defeito mínimo para sequenciamentos fluxo de operação de DNA. O MBD se liga ao DNA de cadeia dupla (dsDNA), e, desse modo, divisão de MBD retém a natureza de cadeia dupla de DNA de amostra, permitindo etiquetamento
Petição 870190078052, de 12/08/2019, pág. 105/238
101/194 molecular de cadeia dupla por metodologias de sequenciamento de DNA sensíveis.
[00247] Em um fluxo de operação de NSG de etiqueta molecular dividida de MBD, as etiquetas moleculares podem servir para duas propostas — identificação de moléculas de DNA únicas a partir da amostra (por combinação de etiqueta e coordenadas genômicas de início/fim), e indicando o nível relativo de 5-metilcitosina da molécula. Etiquetas moleculares podem ser usadas para identificar e contar moléculas de ácido nucleico únicas. Esta informação pode ser usada para calcular desequilíbrios de amplificação. Etiquetas moleculares podem permitir que a complexidade original da amostra seja discernida. O etiquetamento molecular pode ser usado para identificar e contar moléculas de ácido nucleico em uma mesmo quando existe amplificação não-uniforme. A metodologia acima descreve divisão física por grau de 5-metilcitosina, aplicação de etiquetas moleculares diferenciais, recombinar biblioteca, enriquecimento, NGS e desconvolução de bioinformática de cada divisão originária de molécula, concorrente com DNA-seq, utilizados para sequenciamento genético/detecção de variante. A metodologia é extensível à caracterização de outras interações por substituição da divisão de proteína de ligação de metilação (MBD) com elementos de ligação de DNA e proteína diferentes que retêm a natureza de cadeia dupla das moléculas de DNA. Por exemplo, anticorpos de histonas, histonas modificadas, e fatores de transcrição usados em vários protocolos de imunoprecipitação podem substituir a divisão de MBD para gerar informação relativa sobre posicionamento de nucleossomo, modificação de nucleossomo, e ligação de fator de transcrição associada com toda molécula de DNA em uma amostra através do uso de conjuntos diferenciais de etiquetas moleculares.
[00248] Análise de dados [00249] Um desafio maior enfrentado pela análise de metilação de
Petição 870190078052, de 12/08/2019, pág. 106/238
102/194 câncer em biópsia de líquido é a heterogeneidade do tipo de célula. Em adição à heterogeneidade do câncer inerente e bem documentada, o DNA de célula livre no plasma representa tipo de morte de célula misturada que é predominantemente não relacionado ao câncer. Por exemplo, a morte celular pode ser em um órgão não-maligno, linhagem hematopoiética fisiológica. Adicionado a esta complexidade está que mesmo células não-cancerosas no componente estromal são muito distintas, por exemplo, células vasculares e endotelial de linfóides e pericitos, células imunes tais como macrófagos, leucócitos e linfócitos, fibroblastos estromais, miofibroblastos, células mioepiteliais, bem como células adiposas, células endócrinas, células nervosas, e outros elementos celulares e de tecido que têm origens de desenvolvimento diferentes. Portanto, em algumas concretizações, o ajuste para mudanças na composição de tipo de célula é efetuado quando da análise e interpretação de descobertas de biópsia de líquido.
[00250] A conduta de análise pode envolver as seguintes etapas: [00251] uma resolução de ocupação [00252] Localização de díades, atribuindo estringência [00253] Ajuste do modelo de mistura Gaussiano dentro de elementos genômicos individuais através de todo genoma [00254] Desconvolução de linhagens de célula no nível do gene.
[00255] Como um exemplo ilustrativo, perfil de enriquecimento de início de fragmento de cfDNA pode ser separadamente determinado em amostras de divisões individuais. Por exemplo, as amostras divididas podem compreender hiper, hipo, ou intermediário DNA metilatado. O perfil de enriquecimento de início de fragmento de cfDNA determinado pode ser usado para estabelecer ocupação nucleossomal dentro de/elementos regulatórios relevantes, por exemplo, TSS, região intensificadora, elementos intergênicos distais. Para cada divisão, os picos de ocupação, por exemplo, díade, podem ser determinados, e sua es
Petição 870190078052, de 12/08/2019, pág. 107/238
103/194 tringência pode ser atribuída. Um perfil cônico associado com um estado de célula observado em amostras de plasma saudáveis pode ser estabelecido por determinação do perfil de enriquecimento de início de fragmento de cfDNA e localização das díades em um grande controle não-maligno (por exemplo, uma amostra de um indivíduo saudável, ou uma pluralidade de indivíduos saudáveis). Para qualquer amostra, o modelo de mistura Gaussiano pode ser ajustado usando o perfil cônico conforme definido acima para produzir ocupação residual correspondente a um estado de cromatina maligna (não-canônica) observado nas amostras divididas, desse modo, determinando picos e perfis de fragmento de cfDNA não-canônicos. Os picos e perfis de fragmento de cfDNA não-canônicos podem ser associados com estado de cromatina maligna em câncer em cada amostra dividida. A regulação biológica por metilação pode ser mediada por um único CpG, ou por um grupo de CpGs em proximidade entre si. Portanto, análise regional de metilação de DNA oferece uma visão mais compreensiva e sistemática de dados de metilação. Tipicamente, a informação de metilação é resumida sobre janelas de azulejaçâo, ou sobre um conjunto de regiões pré-definldas (promotores, ilhas de CpG, introns, e assim por diante). [00256] A organização do nucleossomo pode ser determinada por duas métricas independentes, tais como ocupação de nucleossomo e posicionamento de nucleossomo. Ocupação de nucleossomo pode ser compreendida como a probabilidade de um nucleossomo estar presente sobre uma região genômica específica dentro de uma população de células. Ocupação de nucleossomo pode ser medida em experimentos à base de sequenciamento como cobertura (número leituras de sequenciamento Unhadas mapeadas para a região genômica. O posicionamento de nucleossomo pode ser a probabilidade de um ponto de referência de nucleossomo (por exemplo, um díade) estar em uma coordenada genômica específica relativa às coordenadas circundantes.
Petição 870190078052, de 12/08/2019, pág. 108/238
104/194
Conforme mostrado na Fig. 9, bom posicionamento de nucleossomo pode ser biologicamente interpretado como um díade de nucleossomo que ocorre na mesma coordenada genômica toda vez que está presente. O pobre posicionamento pode ser interpretado como uma díade de nucleossomo que ocupa uma faixa de posições dentro da mesma pegada geral de um nucleossomo total. Em um exemplo, amostras de 8 indivíduos com câncer de pulmão foram usadas para determinar centros das díades. O posicionamento de nucleossomo e ocupação de nucleossomo foram determinados. Por exemplo, alta ocupação e bom posicionamento podem ser indicados quando cobertura é > 0,5 Quantile (Qu) e largura de pico é < 0,5 Qu. Em alguns exemplos, a distância entre centros de díade em amostras fracionadas (tais como frações hiper-/hipometilatadas) pode ser comparada com não-fracionadas (nenhum MBD). Em alguns casos, centros de díade, bem como estruturas de cromatina adjacentes podem ser solucionadas por atribuição de centros de díades para todos os picos com ocupação de todos os picos com cobertura de ocupação acima de 5% através do genoma. A cobertura de ocupação pode ser 15%, 20%, 25% ou 30%. A cobertura de ocupação pode ser atribuída usando abordagens de aprendizagem de máquina por determinação de localização de pico, largura, comprimento, centro e resolução de largura. Isto proporciona uma resolução empírica de arquitetura de cromatina para DNA de plasma.
[00257] Um aumento na cobertura de leituras de sequência pode estar correlacionado com maior ocupação de nucleossomo. Ainda, a ocupação de nucleossomo pode ser inversamente relacionada à região exaurida de nucleossomo (NDR). O aumento na ocupação de nucleossomo pode indicar estrutura de cromatina alternada, tal como cromatina mais compactada. A cromatina compactada pode ser indicativa de regulação descendente de expressão de gene que pode perturbar o funcionamento da célula normal. A perturbação no funcionaPetição 870190078052, de 12/08/2019, pág. 109/238
105/194 mento de célula normal pode servir como uma indicação de doenças, tal como câncer.
[00258] O DNA de célula livre compreende sinal de uma população heterogênea de células (por exemplo, morte, maligna, não-maligna, etc.). A população heterogênea de células pode ter ácidos nucleicos com estados de cromatina múltiplos. Em alguns exemplos, os estados de cromatina múltiplos podem incluir estados diferentes de ocupação de nucleossomo, tais como nucleossomos bem posicionados ou disperses (“difusos”). Os nucleossomos bem posicionados mostram maior cobertura, enquanto que os nucleossomos difusos mostram menor cobertura de leituras de sequência. Baseado na cobertura de leituras de sequência, a ocupação de nucleossomo através da cromatina pode ser solucionada.
[00259] “Desconvolução” pode se referir ao processo de decomposição de picos de ocupação de fragmento de DNA de célula livre que sobrepõe entre si, desse modo, extraindo informação sobre o “pico oculto”. Desconvolução de picos de ocupação de nucleossomo pode ser alcançada por divisão de MBD. A divisão de ácidos nucleicos em divisões hipermetllatadas e hipometilatadas pode produzir dois picos distintos, pico 1 e pico 2. Contudo, quando os ácidos nucleicos não são fracionados, um pico contínuo pode ser obtido, e desconvolução de pico associado à malignidade 1 de pico de não-malignldade 2 podem não serem viáveis.
[00260] Díades podem ser regiões de DNA ocupadas pelo centro do nucleossomo. Díades podem estar localizadas em amostras divididas. Em alguns casos, ácidos nucleicos são divididos em fração hiper- e hipo- metilatada. O posicionamento ou localização de díade pode ser realizada usando método de referência livre ou método à base de referência. O método de referência livre pode incluir combinação in siiico de ambas hiper e hipo divisões para determinar posição de díade sub
Petição 870190078052, de 12/08/2019, pág. 110/238
106/194 jacente, desse modo, determinando mapa de díade. Em alguns casos, dados de sequenciamento de divisões hiper- e hipo-metíiatadas são combinados para determinar ocupação de nucleossomo, e são comparados entre as divisões, por exemplo, combina sinal de todas as divisões, e detectam picos de ocupação, em seguida, comparam localizações daqueles vistos em hiper vs hipo. Método à base de referência pode incluir análise independente de divisões. Por exemplo, ocupação de nucleossomo para frações hiper e hipometilatadas são determinadas. A ocupação de nucleossomo para cada divisão em um primeiro experimento pode ser usada para correspondente divisão em subsequente^) experimento(s), onde a mesma parte 1 é feita independentemente em um grande conjunto de amostras (padrão WGS seria suficiente, visto que informação à base de divisão não é usada, e informação é combinada para aperfeiçoar resolução de pico), e o mapa de picos de ocupação é armazenado como uma “referência” contra cada uma divisão única (ou ambas) pode ser comparada.
[00261] Assinaturas de fragmento baseadas em dados fraqmentômicos [00262] Métodos de exame de dados de fragmentome são descritos em, por exemplo, publicação U.S. 2016/0201142 (Lo), WO 2016/015058 (Shendure), e PCT/US17/40986, depositados em 6 de julho de 2017 (“Methods For Fragmentome Profiling Of Cell-Free Nucleic Acids”), todos aqui incorporados por referência. Dados fragmentômicos se referem a dado de sequência obtido por análise de fragmentos de ácido nucleico. Por exemplo, o dado de sequência pode incluir comprimento de fragmento (em pares de base), coordenadas genômicas (por exemplo, localizações de partida e parada no genoma de referência), cobertura (por exemplo, número de cópias), ou informação de sequência (por exemplo, bases A, G, C, T). Dados fragmentômicos se referem a informação de sequência de partidas e pa
Petição 870190078052, de 12/08/2019, pág. 111/238
107/194 radas de fragmento e ocupação associada em DNA de célula livre correspondente ao enriquecimento de conteúdo protegido de DNA de célula livre observado no sangue ou plasma.
[00263] Por exemplo, pode-se determinar, em uma amostra, o número de moléculas de cfDNA tendo seu mapeamento de ponto central para coordenadas de nucleotídeo particulares através do genoma, ou uma porção de etiqueta deste. Em um indivíduo saudável, isto tipicamente produziría um gráfico de onda em que os picos do gráfico representam posições de nucleossomo (por exemplo, onde DNA celular não está cllvando durante conversão a cfDNA), e as calhas representam posições inter-nucleossomo (por exemplo, em que muitas moléculas são cllvadas e, consequentemente, poucas moléculas são centradas). A distância entre picos representa díades de nucleossomo. Em células malignas, as posições de nucleossomos podem se alterar, por exemplo, como uma função da metilação. Neste caso, espera-se uma alteração nas posições de picos e calhas no gráfico. Tais alterações podem ser mais facilmente detectadas por divisão de moléculas baseadas nas características diferentes, e examinando distribuição de fragmento para cada divisão. O dado de fragmento pode ser adicionalmente analisado em uma ou uma pluralidade de mais dimensões. Por exemplo, em qualquer coordenada, o número de moléculas que mapeia a mesma pode ser adicionalmente diferenciado baseado no tamanho do fragmento. Em um gráfico baseado em tal dado, uma terceira dimensão “Z”, representa tamanho do fragmento. Assim, por exemplo, em um gráfico bidimensional, o eixo X representa coordenada genômica e o eixo Y representa número de moléculas mapeiam para a coordenada. Em um gráfico tridimensional, o eixo X representa coordenada genômica, a dimensão Z representa comprimento de fragmento, e o eixo Y representa número de moléculas de cada mapeamento de tamanho para a coordenada. Tal gráfico tridimensional pode ser
Petição 870190078052, de 12/08/2019, pág. 112/238
108/194 representado como um mapa de calor bidimensional, em que os eixos X e Z são exibidos nas duas dimensões, e o valor no eixo Y é representado por, por exemplo, intensidade de color (por exemplo, mais escuro representando maiores valores), ou “picante” de cor (por exemplo, azul representando valores mais baixos e vermelho representando valores mais altos). Tal dado pode ser minado para determinar característica de padrões de posição de nucleossomo de um estado sendo examinado, tal como presença ou ausência de câncer, tipo de câncer, grau de metástase, etc.
[00264] Coortes de indivíduos podem todos terem uma característica compartilhada. Esta característica compartilhada pode ser selecionada a partir do grupo consistindo de: um tipo de tumor, uma condição inflamatória, uma condição apoptótica, uma condição necrótica, uma recorrência de tumor, e resistência a um tratamento. Em alguns exemplos, um coorte compreende indivíduos tendo um tipo específico de câncer (por exemplo, mama, coloretal, pancreático, próstata, melanoma, pulmão ou fígado). Para obter a assinatura de nucleossomo de um câncer, um indivíduo que sofre de câncer proporciona uma amostra de sangue. DNA de célula livre é obtido a partir da amostra d34e sangue. O DNA de célula livre é sequenciado (ou com ou sem enriquecimento seletivo de um conjunto de regiões a partir do genoma). Informação de sequência na forma de leituras de sequência a partir das reações de sequenciamento são mapeadas ao genoma de referência humano. Em algumas concretizações, moléculas são colapsadas em leituras de molécula únicas ou antes ou após a operação de mapeamento.
[00265] Desde que os fragmentos de DNA de célula livre em uma dada amostra representem uma mistura de células das quais o DNA de célula livre surge, a ocupação nucleossomal diferencial de cada tipo de célula pode resultar em uma contribuição em direção ao modelo matemático representativo de uma dada amostra de DNA de célula
Petição 870190078052, de 12/08/2019, pág. 113/238
109/194 livre. Por exemplo, uma distribuição de comprimentos de fragmento pode ter surgido devido à proteção nucleossomal diferencial através de tipos de célula diferentes, ou através de células de tumor vs. células de não-tumor. Este método pode ser usado para desenvolver um conjunto de avaliações clinicamente úteis baseado na análise uniparamétrica, multi-paramétrica, e/ou estatística de dado de sequência. [00266] Moléculas de ácido nucleico em uma amostra podem ser fracionadas baseado em uma ou mais características. Fracionamento pode incluir moléculas de ácido nucleico que se dividem clinicamente em subconjuntos ou grupos baseados na presença ou ausência de uma característica genômica. Fracionamento pode incluir moléculas de ácido nucleico que se dividem clinicamente em grupos baseados no grau ao qual uma característica genômica está presente. Uma amostra pode ser fracionada ou dividida em um ou mais grupos baseados em uma característica que é indicativa de expressão de gene diferencial, ou um estado de doença. Uma amostra pode ser fracionada baseado em uma característica que proporciona uma diferença no sinal entre um estado normal e estado adoentado durante análise de ácidos nucleicos, por exemplo, cfDNA, não-cfDNA, DNA de tumor, DNA de tumor circulante (ctDNA).
[00267] Dados fragmentômicos podem ser usados para inferir variantes genéticas. Variantes genéticas incluem variação de número de cópia (CNV), inserção e/anulação (indel), variação de nucleotídeo único (SNV), e/ou fusão de gene. Dados fragmentômicos podem ser usados para inferirem variantes epigenéticas, tais como variantes indicativas de câncer. Uma ou mais variantes genéticas em cada grupo fracionado ou dividido e/ou ácidos nucieicos não-fracionados podem ser determinados. O fracionamento ou divisão pode ser realizado baseado em pelo menos uma das várias características incluindo, mas não são limitados a estado de metilaçâo, tamanho, comprimento, e ligação de
Petição 870190078052, de 12/08/2019, pág. 114/238
110/194 transcrição de ácidos nudeicos. Variantes genéticas determinadas nos grupos fracionados ou divididos podem ser comparadas entre si, e/ou com ácidos nudeicos não-fracionados que podem ou não podem possuir as mesmas características. Ácidos nudeicos fracionados ou divididos podem ser recombinados e os dados fragmentômicos podem ser comparados com ácidos nudeicos não-fracionados, e/ou ácidos nudeicos que não possuem as mesmas características como os ácidos nudeicos fracionados ou divididos para determinar uma presença de variantes genéticas.
[00268] Modelos podem ser usados em uma configuração de painel para enriquecer seletivamente regiões (por exemplo, regiões associadas ao perfil fragmentome) e assegurar um alto número de leituras que abrangem uma mutação particular, eventos centrados de cromatina importantes similares à locais de partida de transcrição (TSSs), regiões promotoras, locais de junção, e regiões intrônicas, podem também serem consideradas.
[00269] Em um exemplo, diferenças em perfis de fragmentome são encontradas em ou próximas às junções (ou limites) de introns e exons. Identificação de uma ou mais mutações somáticas pode estar correlacionada com um ou mais modelos multi-paramétricos ou uniparamétricos para revelar localizações genômicas onde fragmentos de cfDNA são distribuídas. Esta análise de correlação pode revelar uma ou mais junções de intron-exon onde rompimentos de perfil de fragmentome são mais pronunciados.
[00270] Como outro exemplo, hipermetilação na amostra pode ser observada em regiões mais distantes de TSS. O enriquecimento de regiões hipermetilatadas pode ser observado em uma distância entre 0 kb e 5 kb, 5 kb e 50 kb, e/ou 50 kb e 500 kb a partir do TSS. O enriquecimento de regiões hipermetilatadas pode ser observado entre 5 kb e 50 kb a partir do TSS. O enriquecimento de regiões hipermetilatadas
Petição 870190078052, de 12/08/2019, pág. 115/238
111/194 pode ser observado menos do que 5 kb, 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, e/ou 500 kb a partir do TSS. O enriquecimento de regiões hipermetilatadas pode ser observado mais do que 5 kb, 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 50 kb, 100 kb, 200 kb, 300 kb, 400 kb, e/ou 500 kb a partir do TSS. A posição e enriquecimento de hipermetilação pode variar entre DNA obtido de um indivíduo normal ou saudável (DNA normal) e DNA obtido de um indivíduo adoentado. Por exemplo, DNA de um indivíduo suspeito de ter ou tendo câncer de pulmão (DNA de câncer de pulmão) pode mostrar enriquecimento de distância mais distante hipermetilatada de localizações canônicas em TSS e nucleossomos bem posicionados em ocupação de fração hipermetilatada da vizinhança de região promotora (Fig. 17). Por exemplo, ácidos nucleicos nãofracionados (nenhum MBD) de um paciente com câncer de pulmão foram usados para sequenciamento. Baseado no dado fragmentômico, tal como localização genômica, centros de díade de nucleossomo foram determinados para as leituras de sequência. Ainda baseado no dado fragmentômico, leituras de sequência que têm cobertura menor do que ou igual a 5%, ou cobertura menor do que ou igual a 95% foram adicionalmente analisadas. Ferramentas de anotação de gene, tal como Enriquecimento de Regiões Genômicas de Ferramenta de Anotações (GREAT) foram usadas para atribuir funcionalidade para um conjunto de regiões genômicas baseados nos genes mais próximos. A distância entre leituras de sequência e seus genes putativamente regulados foram determinadas (Fig. 17). As distâncias foram divididas em quatro depósitos separados: um de 0 a 5 kb, outro de 5 kb a 50 kb, um terceiro de 50 kb a 500 kb, e um depósito final de todas as associações acima de 500 kb. Para precisão, os depósitos são [0, 5 kb], [5 kb, 50 kb], [50 kb, 500 kb], [500 kb, Infinity], No gráfico, todas as associações precisamente em 0 (isto é, no TSS) foram divididas uniforme
Petição 870190078052, de 12/08/2019, pág. 116/238
112/194 mente entre os depósitos [--5 kb, 0] e [0, 5 kb], Usando este método, hipermetilação na amostra foi observada em regiões mais distantes de TSS em ambas regiões genômicas antecedentes (por exemplo, todos os nucleossomos) e as regiões genômicas de primeiro plano (por exemplo, nucleossomos metilatados). Por exemplo, enriquecimento de regiões hipermetilatadas foi observado entre depósito [5 kb, 50 kb], [00271] A assinatura de fragmentome pode auxiliar na determinação da ocupação de nucleossomo, posicionamento de nucleossomo, pausa de RNA Polimerase II, hipersensibilidade de DNase específica de morte de célula, e condensação de cromatina durante morte da célula. Tal assinatura pode também proporcionar percepção em liberação e tráfego de fragmentos de célula. Por exemplo, a liberação de fragmentos de célula pode envolver fragmentação de DNA efetuada por caspase-ativada DNase (CAD) em células que morrem por apoptose, mas também pode ser efetuada por lisossomal DNase II após as células mortas são fagocitosadas, resultando em mapas de divagem diferentes.
[00272] Mapas de divisão de genoma podem ser construídos por identificação ampla de genoma de estados de cromatina diferenciais em condições malignas vs não-malignas associadas com propriedades antes mencionadas de cromatina via agregação de janelas significantes em regiões de interesse. Tais regiões de interesse são geralmente referidas como mapas de divisão de genoma.
[00273] Fradonamento baseado no estado de metilação [00274] As moléculas de ácido nucleico em uma amostra podem ser fracionadas baseadas na característica de 5-metilcitosina. O DNA pode ser metilatado em citosinas tais como em regiões de dinucleotídeo de GpG. Metilação de DNA junto com complexos de histona pode influenciar no acondicionamento de DNA em cromatina também regulação epigenética de expressão de gene. Alterações epigenéticas po
Petição 870190078052, de 12/08/2019, pág. 117/238
113/194 dem desempenhar um papel crucial em várias doenças, tal como em todas as etapas de progressão de câncer, iniciação de câncer de estágio primário ou anterior, câncer decorrido ou metastático. Por exemplo, hipermetilação de uma região normalmente hipometilatada, tal como local de partida de transcrição (TSS) de genes envolvidos em crescimento normal, reparo de DNA, regulação de ciclo de célula, e diferenciação de célula, pode ser indicativa de câncer. A hipermetilação pode alterar expressão de gene por repressão de transcrição. Em alguns casos, hipermetilação pode reduzir e/ou reprimir expressão de gene. Por exemplo, hipermetilação pode reduzir e/ou reprimir expressão de um repressor de oncogene. Em alguns casos, hipermetilação pode amentar e/ou promover expressão de gene. Por exemplo, hipermetilação de um supressor pode resultar em expressão de gene aumentada e/ou promovida de um respondedor à jusante, por exemplo, uma oncogene que é normalmente suprimida pelo supressor.
[00275] Baseado no estado de metilação de DNA, as moléculas de ácido nucleico em uma amostra podem ser fracionadas em grupos diferentes que podem enriquecer moléculas de ácido nucleico com estado de metilação similar usando procedimentos experimentais. Por exemplo, uma proteína de domínio de ligação de metil (MBD) pode ser usada para purificar afinidade das moléculas de ácido nucleico com estado similar de metilação, tal como hipermetilação, hipometllação e metilação residual. Em outro exemplo, um anticorpo específico para 5metil-citosina pode ser usado para imunoprecipitar as moléculas de ácido nucleico com níveis similares de metilação. Em outro exemplo, métodos à base de bissulfito podem ser empregados para enriquecer seletivamente moléculas de ácido nucleico altamente metilatadas. Em ainda outro exemplo, uma enzima de restrição sensível a metilação pode ser usada para enriquecer seletivamente moléculas de ácido nucleico altamente metilatadas.
Petição 870190078052, de 12/08/2019, pág. 118/238
114/194 [00276] Após fracionamento usando uma das características, as moléculas de ácido nucleico em cada grupo podem ser sequenciadas para gerar leituras de sequência. As leituras de sequência podem ser mapeadas para um genoma de referência. O mapeamento pode gerar informação de sequência. Informação de sequência pode ser analisada para determinar variações genéticas, incluindo, por exemplo, variantes únicas de nucleotídeo, variação de número de cópias, indels, ou fusões. Em exemplos onde DNA de célula livre é ensaiado usando os métodos aqui revelados pode gerar dado fragmentômico, que pode variar entre grupos de moléculas de ácido nucleico fraclonadas. O dado fragmentômico pode incluir coordenadas genômicas, tamanho, cobertura ou informação de sequência. A revelação proporciona métodos para integração do dado fragmentômico com leituras de sequência de cada das divisões. Tal integração pode ser útil na detecção precisa e rápida de biomarcadores indicativos de um estado de doença.
[00277] Os métodos aqui descritos podem ser usados para enriquecer moléculas de ácido nucleico in silico baseada no dado fragmentômico. Por exemplo, moléculas de ácido nucleico não-fracionadas (nenhum MBD) de um paciente com câncer de pulmão podem ser usadas para sequenciamento. Em outro exemplo, fracionamento pode ser alcançado baseado em uma diferença em um perfil mono-nucleossomal ou um perfil dinucleossomal sozinho ou em combinação com outras características tais como tamanho e/ou estado de metilação. O perfil mono-nucleossomal pode se referir à cobertura ou contagens de fragmentos que são aproximadamente de comprimento requerido para envolver ao redor de um único nucleossomo (por exemplo, cerca de 146 bp). O perfil dinucleossomal pode se referir à cobertura ou contagens de fragmentos que são aproximadamente de comprimento requerido para envolver ao redor de um único nucleossomo duas vezes (por exemplo, cerca de 292 bp).
Petição 870190078052, de 12/08/2019, pág. 119/238
115/194 [00278] Análise de Dados [00279] Em certas concretizações, dados de classes diferentes de indivíduos, por exemplo, câncer/iivre de câncer, tipo de câncer 1/ tipo de câncer 2, podem ser usados para treinar um algoritmo de aprendizagem de máquina para classificar uma amostra como pertencente a uma das classes. O termo “algoritmo de aprendizagem de máquina, conforme aqui usado, se refere a um algoritmo, executado por computador, que automatiza construção de modelo analítico, por exemplo, para agrupamento, classificação ou reconhecimento padrão. Algoritmo de aprendizagem de máquinas pode ser supervisionado ou nãosupervisionado. Algoritmos de aprendizagem incluem, por exemplo, redes neurais artificiais (por exemplo, redes de propagação posterior), análise discriminante (por exemplo, classificador de Bayesian ou análise de Fischer), máquinas de vetor de suporte, árvores de decisão (por exemplo, processos de divisão recursivos tais como CART - árvores de classificação e de regressão), florestas aleatórias), classificadores lineares (por exemplo, regressão linear múltipla (MLR), regressão de mínimos quadrados parcial (PLS) e regressão de componentes principal (PCR)), agrupamento hierárquico e análise de agrupamento. Um conjunto de dados em que um algoritmo de aprendizagem de máquina aprende pode ser referido como “dados de treinamento”.
[00280] O termo “classificador”, conforme aqui usado, se refere a código de computador de algoritmo que, recebe, como entrada, dado de teste e produz, como saída, uma classificação do dado de entrada como pertencente a uma ou outra classe.
[00281] O termo “conjunto de dados”, conforme aqui usado, de refere a uma coleção de valores que caracterizam elementos de um sistema. Um sistema pode ser, por exemplo, cfDNA de uma amostra biológica. Elementos de tal sistema pode ser locai genético. Exemplos de um conjunto de dados (ou “conjunto de dados”) incluem valores indiPetição 870190078052, de 12/08/2019, pág. 120/238
116/194 cando uma medida quantitativa de uma característica selecionada de:
(i) mapeamento de sequência de DNA para um local genético, (ii) sequência de DNA começando em um local genético, (iii) sequência de DNA terminando em um local genético; (iv) uma proteção dinucleossoma! ou proteção mononucleossomal de uma sequência de DNA; (v) sequência de DNA localizada em um intron ou exon de um genoma de referência; (vi) uma distribuição de tamanho de sequências de DNA tendo uma ou mais características; (vii) uma distribuição de comprimento de sequências de DNA tendo uma ou mais características, etc. [00282] O termo “valor,” conforme aqui usado, se refere a uma entrada em um conjunto de dados pode ser nada que caracterize a característica a qual o valor se refere. Isto inclui, sem limitação, números, palavras ou frases, símbolos (por exemplo, + ou -), ou graus.
[00283] Dispositivo de processamento digital [00284] Em algumas concretizações, os métodos aqui descritos utilizam um dispositivo de processamento digital. Em concretizações adicionais, o dispositivo de processamento digital inclui uma ou mais unidades de processamento central de hardware (CPUs), ou unidades de processamento de gráficos de proposta geral (GPGPUs) que efetuam as funções do dispositivo. Em concretizações ainda adicionais, o dispositivo de processamento digital adicionalmente compreende um sistema de operação configurado para realizar instruções executáveis. Em algumas concretizações, o dispositivo de processamento digital é opcionalmente conectado a uma rede de computador. Em concretizações adicionais, o dispositivo de processamento digital é opcionalmente conectado à Internet tal que ele acessa a World Wide Web. Em ainda outras concretizações, o dispositivo de processamento digital é opcionalmente conectado à uma infraestrutura de computação de nuvem. Em outras concretizações, o dispositivo de processamento digital é opcionalmente conectado a uma intranet. Em outras concretizações, o
Petição 870190078052, de 12/08/2019, pág. 121/238
117/194 dispositivo de processamento digital é opcionalmente conectado a um dispositivo de armazenagem de dados.
[00285] De acordo com a descrição aqui, dispositivos de processamento digital adequados incluem, por meio de exemplos nãolimitantes, computadores servidores, computadores desktop, computadores laptop, computadores notebook, computadores portáteis, aparelhos de Internet, smartphones móveis, e computadores tablet.
[00286] Em algumas concretizações, o dispositivo de processamento digital inclui um sistema de operação configurado para realizar instruções executáveis. O sistema de operação é, por exemplo, software, incluindo programas e dados, que controlam o hardware do dispositivo, e proporciona serviços para execução de aplicações. Aqueles técnicos no assunto reconhecerão que sistemas de operação de servidor adequados incluem, por meio de exemplos não-limltantes, FreeBSD, OpenBSD, NetBSD®, Linux, Apple® Mac OS X Server®, Oracle® Solaris®, Windows Server®, e Novell® NetWare®. Aqueles técnicos no assunto reconhecerão que sistemas de operação de computador pessoal adequados incluem, por meio de exemplos não-limitantes, sistemas de operação similares a Microsoft® Windows®, Apple® Mac OS X®, UNIX®, e UNIX, tal como GNU/Linux®. Em algumas concretizações, o sistema de operação é provido por computação de nuvem. Aqueles técnicos no assunto também reconhecerão que sistema de operação de smart phone móvel adequado incluem, por meio de exemplos não-limitantes, Nokia® Symbian® OS, Apple® iOS®, Research In Motion® BlackBerry OS®, Google® Android®, Microsoft® Windows Phone® OS, Microsoft® Windows Mobile® OS, Linux®, e Palm® WebOS®.
[00287] Em algumas concretizações, o device inclui um dispositivo de armazenagem e/ou memória. O dispositivo de armazenagem e/ou memória é um ou mais aparelhos físicos usados para armazenar da
Petição 870190078052, de 12/08/2019, pág. 122/238
118/194 dos ou programa em uma base temporária ou permanente. Em algumas concretizações, o dispositivo é de memória volátil e requer energia para manter informação armazenada. Em algumas concretizações, o dispositivo é de memória não-volátil, e retém informação armazenada quando o dispositivo de processamento digital não é energizado. Em concretizações adicionais, a memória não-volátil compreende memória instantânea. Em algumas concretizações, a memória nãovolátil compreende memória de acesso aleatória dinâmica (DRAM). Em algumas concretizações, a memória não-voiátil compreende memória de acesso aleatória ferroelétríca (FRAM). Em algumas concretizações, a memória não-volátil compreende memória de acesso aleatória de mudança de fase (PRAM). Em outras concretizações, o dispositivo é um dispositivo de armazenagem incluindo, por meio de exemplos não-limitantes, CD-ROMs, DVDs, dispositivos de memória instantânea, acionadores de disco magnético, acionadores de fita magnética, acionadores de disco ótico, e computação de nevem à base de armazenagem. Em concretizações adicionais, o dispositivo de armazenagem e/ou de memória é uma combinação de dispositivos tais como aqui revelados.
[00288] Em algumas concretizações, o dispositivo de processamento digital inclui um mostrador para enviar informação visual a um usuário. Em algumas concretizações, o mostrador é um mostrador de cristal liquido (LCD). Em concretizações adicionais, o mostrador é um mostrador de cristal líquido de transistor de película delgada (TFTLCD). Em algumas concretizações, o mostrador é um mostrador de diodo de emissão de luz orgânico (OLED). Em várias concretizações adicionais, um mostrador de OLED é um mostrador de matriz passiva OLED (PMOLED) ou de matriz ativa OLED (AMOLED). Em algumas concretizações, o mostrador é um mostrador de plasma. Em outras concretizações, o mostrador é um projetor de vídeo. Em ainda outras
Petição 870190078052, de 12/08/2019, pág. 123/238
119/194 concretizações, o mostrador é um mostrador montado superior em comunicação com o dispositivo de processamento digital, tal como um fone VR. Em concretizações adicionais, fones de VR adequados incluem, por meio de exemplos nâo-limitantes, HTC Vive, Oculus Rift, Samsung Gear VR, Microsoft HoloLens, Razer OSVR, FOVE VR, Zeiss VR One, Avegant Glyph, Freefly VR headset, e similares. Em ainda concretizações adicionais, o mostrador é uma combinação de dispositivos tais como aqueles aqui revelados.
[00289] Em algumas concretizações, o dispositivo de processamento digital inclui um dispositivo de entrada para receber informação de um usuário. Em algumas concretizações, o dispositivo de entrada é um teclado. Em algumas concretizações, o dispositivo de entrada é um dispositivo de apontamento incluindo, por meio de exemplos nãolimitantes, um mouse, trackball, track pad, joystick, controlador de game, ou stylus. Em algumas concretizações, o dispositivo de entrada é uma tela de toque ou uma tela de multi-toque. Em outras concretizações, o dispositivo de entrada é um microfone para capturar voz ou outra entrada de som. Em outras concretizações, o dispositivo de entrada é uma câmera de vídeo ou outro sensor para capturar entrada de movimento ou entrada visual. Em concretizações adicionais, o dispositivo de entrada é um Kinect, Leap Motion, ou similares. Em ainda outras concretizações, o dispositivo de entrada é uma combinação de dispositivos tais como aqueles aqui revelados.
[00290] Referindo-se à Fig. 32, em uma concretização particular, um dispositivo de processamento digital exemplar 101 é programado ou, de outro modo, configurado para analisar, ensaiar, decodificar e/ou desconvolucionar sequência e/ou dados de etiqueta. Na concretização, o dispositivo de processamento digital 101 inclui uma unidade de processamento central (CPU, também “processador” e “processador de computador” aqui) 105, que pode ser um processador de núcleo
Petição 870190078052, de 12/08/2019, pág. 124/238
120/194 único ou de multi núcleo, ou uma pluralidade de processadores para processamento paralelo. O dispositivo de processamento digital 101 também inclui memória ou localização de memória 110 (por exemplo, memória de acesso aleatório, memória de apenas leitura, memória instantânea), unidade de armazenagem eletrônica 115 (por exemplo, disco rígido), interface de comunicação 120 (por exemplo, adaptador de rede) para comunicação com um ou mais outros sistemas, e dispositivos periféricos 125, tal como cache, outra memória, adaptadores de mostrador de armazenagem de dados e/ou adaptadores de mostrador eletrônicos. A memória 110, unidade de armazenagem 115, interface 120 e dispositivos periféricos 125 estão em comunicação com a CPU 105 através de uma barra de comunicação (linhas sólidas), tal como uma placa mãe. A unidade de armazenagem 115 pode ser uma unidade de armazenagem de dados (ou repositório de dados) para armazenagem de dados. O dispositivo de processamento digital 101 pode ser operantemente acoplado a uma rede de computador (“rede”) 130 com o auxílio da interface de comunicação 120. A rede 130 pode ser a Internet, uma internet e/ou extranet, ou uma intranet e/ou extranet que está em comunicação com a Internet. A rede 130 em alguns casos é uma rede de telecomunicação e/ou rede de dados. A rede 130 pode incluir um ou mais servidores de computador, que podem capacitar computação distribuída, tal como computação de nuvem. A rede 130, em alguns casos, com o auxílio do dispositivo 101, pode implementar ponto a ponto, que pode capacitar os dispositivos a acoplarem ao dispositivo 101 para se comportar como um cliente ou um servidor.
[00291] Continuando a se referir à Fig. 32, a CPU 105 pode executar uma sequência de instruções legíveis por máquina, que pode ser concretizada em um programa ou software. As instruções podem ser armazenadas em uma localização de memória, tal como a memória
110. As instruções podem ser direcionadas à CPU 105, que pode sub
Petição 870190078052, de 12/08/2019, pág. 125/238
121/194 sequentemente programar ou, de outro modo, configurar a CPU 105 para implementar os métodos da presente revelação. Exemplos de operações realizadas pela CPU 105 podem incluir buscar, decodificar, executar, e responder. A CPU 105 pode ser parte de um circuito, tal como um circuito integrado. Um ou mais outros componentes do dispositivo 101 podem ser incluídos no circuito. Em alguns casos, o circuito é um circuito Integrado de aplicação específica (ASIC), ou uma série de porta programável de campo (FPGA).
[00292] Continuando a se referir à Fig. 32, a unidade de armazenagem 115 pode armazenar arquivos, tais como drivers, bibliotecas e programas salvos. A unidade de armazenagem 115 pode armazenar dados do usuário, por exemplo, preferências do usuário e programas do usuário. O dispositivo de processamento digital 101, em alguns casos, pode incluir uma ou mais unidades de armazenagem de dados adicionais que são externas, tal como localizadas em um servidor remoto que está em comunicação através de uma intranet ou à Internet.
[00293] Continuando a se referir à Fig. 32, o dispositivo de processamento digital 101 pode se comunicar com um ou mais sistemas de computador remoto através da rede 130. Por exemplo, o dispositivo 101 pode se comunicar com um sistema de computador remoto de um usuário. Exemplos de sistemas de computador remoto incluem computadores pessoais (por exemplo, PC portátil), PCs slate ou tablet (por exemplo, Apple® iPad, Samsung® Galaxy Tab, e Microsoft® Surface®), e smartphones (por exemplo, Apple® iPhone ou Androidenabled device).
[00294] Métodos conforme aqui descrito podem ser pelo menos parcialmente implementados por meio de código executável por máquina (por exemplo, processador de computador) armazenado em uma localização de armazenagem eletrônica do dispositivo de processamento digital 101, tal como, por exemplo, na memória 110, ou uni
Petição 870190078052, de 12/08/2019, pág. 126/238
122/194 dade de armazenagem eletrônica 115. O código executável por máquina, ou código legível por máquina pode ser provido na forma de software. Durante uso, o código pode ser executado pelo processador 105. Em alguns casos, o código pode ser recuperado da unidade de armazenagem 115, e armazenado na memória 110 para pronto acesso pelo processador 105. Em algumas situações, a unidade de armazenagem eletrônica 115 pode ser excluída, e instruções executáveis por máquina são armazenadas na memória 110.
[00295] Meio de armazenagem legível por computador não» transitório [00296] Em algumas concretizações, os métodos aqui revelados utilizam um ou mais meios de armazenagem iegíveis por computador não-transitórios codificados com um programa incluindo instruções executáveis por um sistema de operação de um dispositivo de processamento digital opcionalmente em rede. Em concretizações adicionais, um meio de armazenagem legível por computador é um componente tangível de um dispositivo de processamento digital. Em ainda outras concretizações, um meio de armazenagem legível por computador é opcionalmente removível de um dispositivo de processamento digital. Em algumas concretizações, um meio de armazenagem legível por computador inclui, por meio de exemplos não-limitantes, CD-ROMs, DVDs, dispositivos de memória instantânea, memória de estado sólido, drives de disco magnético, drives de fita magnética, drives de disco ótico, sistemas e serviços de computação de nuvem, e similares. Em alguns casos, o programa e instruções são permanentemente, substancialmente permanentemente, semi-permanentemente, ou nãotransitoriamente codificados no meio.
[00297] Instruções executáveis [00298] Em algumas concretizações, os métodos aqui revelados utilizam instruções que são executáveis por um dispositivo de proces
Petição 870190078052, de 12/08/2019, pág. 127/238
123/194 sarnento digital, na forma de pelo menos um programa de computador. Por exemplo, um programa de computador inclui uma sequência de instruções, executáveis na CPU do dispositivo de processamento digital, escritas para realizar uma tarefa especificada. Instruções legíveis por computador podem ser implementadas como módulos de programas, tais como funções, objetivos, Aplicação de Interfaces de Programação (APIs), estruturas de dados, e similares, que realizam tarefas particulares ou implementam tipos de dados abstratos particulares. À luz da revelação aqui provida, aqueles técnicos no assunto reconhecerão que um programa de computador pode ser escrito em várias versões de várias linguagens.
[00299] A funcionalidade das instruções legíveis por computador pode ser combinada ou distribuída conforme desejado em vários ambientes. Em algumas concretizações, um programa de computador compreende uma sequência de instruções. Em algumas concretizações, um programa de computador compreende uma pluralidade de sequências de instruções. Em algumas concretizações, um programa de computador é provido de uma localização. Em outras concretizações, um programa de computador é provido de uma pluralidade de localizações. Em várias concretizações, um programa de computador inclui um ou mais módulos de software. Em várias concretizações, um programa de computador inclui, em parte ou no todo, uma ou mais aplicações da web, uma ou mais aplicações móveis, uma ou mais aplicações independentes, um ou mais conectores de navegador da web, extensões, add-ins, ou add-ons, ou combinações destes.
[00300] Aplicação de web [00301] Em algumas concretizações, um programa de computador compreende uma aplicação de web. À luz da revelação aqui provida, aqueles técnicos no assunto reconhecerão que uma aplicação de web, em várias concretizações, utilizam uma ou mais estruturas de softwa
Petição 870190078052, de 12/08/2019, pág. 128/238
124/194 re, e um ou mais sistemas de base de dados. Em algumas concretizações, uma aplicação de web é criada após uma estrutura de software, tais como Microsoft® .NET ou Ruby on Rails (RoR). Em algumas concretizações, uma aplicação de web utiliza um ou mais sistemas de base de dados incluindo, por meio de exemplos não-limitantes, objeto relacionai, não-relacional, orientado, associativo, e sistemas de base de dados XML Em concretizações adicionais, sistemas de base de dados relacionais adequados incluem, por meio de exemplos nãolimitantes, Microsoft® SQL Server, mySQL™, e Oracle®. Aqueles técnicos no assunto também reconhecerão que uma aplicação de web, em várias concretizações, é escrita em uma ou mais versões de uma ou mais linguagens. A aplicação de web pode ser escrita em uma ou mais linguagens marcadas, linguagens de definição de apresentação, linguagens de script do lado do cliente, linguagens de codificação do lado do servidor, linguagens de consulta de base de dados, ou combinações destes. Em algumas concretizações, uma aplicação de web é escrita a alguma extensão em uma linguagem marcada tal como Hypertext Markup Language (HTML), Extensible Hypertext Markup Language (XHTML), ou extensible Markup Language (XML). Em algumas concretizações, uma aplicação de web é escrita a alguma extensão em uma linguagem de definição de apresentação, tal como Cascading Style Sheets (CSS). Em algumas concretizações, uma aplicação de web é escrita a alguma extensão em linguagem de script do lado do cliente, tal como Asynchronous Javascript e XML (AJAX), Flash® Actionscript, Javascript, ou Silverlight®. Em algumas concretizações, uma aplicação de web é escrita a alguma extensão em uma linguagem de codificação do lado do servidor tal como Active Server Pages (ASP), ColdFusion®, Perl, Java™, JavaServer Pages (JSP), Hypertext Preprocessor (PHP), Python™, Ruby, Tel, Smalltalk, WebDNA®, ou Groovy. Em algumas concretizações, uma aplicação de web
Petição 870190078052, de 12/08/2019, pág. 129/238
125/194 é escrita a alguma extensão em uma linguagem de consulta de base de dados tal como Structured Query Language (SQL). Em algumas concretizações, uma aplicação de web integra produtos de servidor de empresa tal como IBM® Lotus Domino®. Em algumas concretizações, uma aplicação de web inclui um elemento de reprodução de mídia. Em várias outras concretizações, um elemento de reprodução de mídia utiliza uma ou mais de muitas tecnologias de multimedia adequadas incluindo, por meio de exemplos não-limitantes, Adobe® Flash®, HTML 5, Apple® QuickTime®, Microsoft® Silverlight®, Java™, e Unity®.
[00302] Referindo-se à Fig. 33, em uma concretização particular, um sistema de provisão de aplicação compreende uma ou mais bases de dados 200 acessadas por um sistema de controle de base de dados relacionais (RDBMS) 210. RDBMSs adequados incluem Firebird, MySQL, PostgreSQL, SQLite, Oracle Database, Microsoft SQL Server, IBM DB2, IBM Informix, SAP Sybase, Teradata, e similares. Nesta concretização, o sistema de provisão de aplicação adicionalmente compreende um ou mais servidores de aplicação 220 (tais como servidores Java, servidores .NET, servidores PHP, e similares), e um ou mais servidores de web 230 (tal como Apache, IIS, GWS e similares). O(s) servidor(es) de web opcionalmente expõe(m) um ou mais serviços da web, via interfaces de programação de aplicação de app (APIs) 240, via uma rede, tal como a Internet, o sistema proporciona interfaces do usuário à base de navegador e/ou nativa móvel.
[00303] Referindo-se à Fig. 34, em uma concretização particular, um sistema de provisão de aplicação alternativamente tem uma arquitetura à base de nuvem distribuída 300, e compreende recursos de servidor da web de auto escala elasticamente carregada 310 e recursos de servidor de aplicação 320 também bases de dados sincronamente replicados 330.
Petição 870190078052, de 12/08/2019, pág. 130/238
126/194 [00304] Aplicação móvel [00305] Em algumas concretizações, um programa de computador compreende uma aplicação móvel provida a um dispositivo de processamento digital móvel. Em algumas concretizações, a aplicação móvel é provida em um dispositivo de processamento digital móvel no momento que ela é manufaturada. Em outras concretizações, a aplicação móvel é provida em um dispositivo de processamento digital móvel, via a rede de computador aqui descrita.
[00306] Em vista da revelação aqui provida, uma aplicação móvel é criada por técnicas conhecidas àqueles técnicos no assunto usando hardware, linguagens, e ambientes de desenvolvimento conhecidos na técnica. Aqueles técnicos no assunto reconhecerão que aplicações móveis são escritas em várias linguagens. Linguagens de programação adequadas incluem, por meio de exemplos não-limitantes, C, C++, C#, Objective-C, Java™, Javascript, Pascal, Object Pascal, Python™, Ruby, VB.NET, WML, e XHTML/HTML com ou sem CSS, ou combinações destes.
[00307] Ambientes de desenvolvimento de aplicação móvel adequados são disponíveis de várias fontes. Ambientes de desenvolvimento comercialmente disponíveis incluem, por meio de exemplos não-limitantes, AirplaySDK, alcheMo, Appcelerator®, Celsius, Bedrock, Flash Lite, .NET Compact Framework, Rhomobile, e WorkLight Mobile Platform. Outros ambientes de desenvolvimento são disponíveis sem custo incluindo, por meio de exemplos não-limitantes, Lazarus, MobiFlex, MoSync, e PhoneGap. Também, produtores de dispositivo móvel distribuem kits desenvolvedores de software incluindo, por meio de exemplos não-limitantes, iPhone e iPad (iOS) SDK, Android™ SDK, BlackBerry® SDK, BREW SDK, Palm® OS SDK, Symbian SDK, webOS SDK, e Windows® Mobile SDK.
[00308] Aqueles técnicos no assunto reconhecerão que vários fó
Petição 870190078052, de 12/08/2019, pág. 131/238
127/194 runs comerciais são disponíveis para distribuição de aplicações móveis incluindo, por meio de exemplos não-Hmitantes, Apple® App Store, Google® Play, Chrome WebStore, BlackBerry® App World, App Store for Palm devices, App Catalog for webOS, Windows® Marketplace for Mobile, Ovi Store for Nokia® devices, Samsung® Apps, e Nintendo® DSi Shop.
[00309] ÂpHcação independente [00310] Em algumas concretizações, um programa de computador inclui uma aplicação independente, que é um programa que é operado como um processo de computador independente, não um add-on a um processo existente, por exemplo, não uma plug-in. Aqueles técnicos no assunto reconhecerão que aplicações independentes são frequentemente compiladas. Um compilador é um programa de computador(es) que transforma código de fonte escrito em uma linguagem de programação em código de objeto binário, tal como linguagem de montagem ou código de máquina. Linguagens de programação compilada adequadas incluem, por meio de exemplos não-limitantes, C, C++, Objective-C, COBOL, Delphi, Eiffel, Java™, Lisp, Python™, Visual Basic, e VB .NET, ou combinações destes. A compilação é frequentemente realizada, pelo menos em parte, para criar um programa executável. Em algumas concretizações, um programa de computador inclui uma ou mais aplicações compiladas executáveis.
[00311 ] Módulos de software [00312] Em algumas concretizações, os métodos aqui revelados utilizam software, servidor, e/ou módulos de base de dados. Em vista da revelação aqui provida, módulos de software são criados por técnicas conhecidas àqueles técnicos no assunto usando máquinas, software, e linguagens conhecidas na técnica. Os módulos de software aqui revelados são implementados em uma multiplicidade de modos. Em várias concretizações, um módulo de software compreende um
Petição 870190078052, de 12/08/2019, pág. 132/238
128/194 arquivo, uma seção de código, um objeto de programação, uma estrutura de programação, ou combinações destes. Em várias concretizações adicionais, um módulo de software compreende uma pluralidade de arquivos, uma pluralidade de seções de código, uma pluralidade de objetos de programação, uma pluralidade de estruturas de programação, ou combinações destes. Em várias concretizações, o um ou mais módulos de software compreendem, por meio de exemplos nãolimitantes, uma aplicação de web, uma aplicação móvel, e uma aplicação independente. Em algumas concretizações, os módulos de software estão em um programa de computador ou aplicação. Em outras concretizações, os módulos de software estão em mais do que um programa de computador ou aplicação. Em algumas concretizações, os módulos de software são hospedados em uma máquina. Em outras concretizações, os módulos de software são hospedados em mais do que uma máquina. Em concretizações adicionais, os módulos de software são hospedados em plataformas de computação de nuvem. Em algumas concretizações, os módulos de software são hospedados em uma ou mais máquinas em uma localização. Em outras concretizações, os módulos de software são hospedados em uma ou mais máquinas em mais do que uma localização.
[00313] Bases de dados [00314] Em algumas concretizações, os métodos aqui revelados utilizam uma ou mais bases de dados. Em vista da revelação aqui provida, aqueles técnicos no assunto reconhecerão que muitas bases de dados são adequadas para armazenagem e recuperação do paciente, sequência, etiqueta, codificar/decodificar, variante genética, e informação da doença. Em várias concretizações, bases de dados adequadas incluem, por meio de exemplos não-limitantes, bases de dados relacionais, bases de dados não-relacionais, bases de dados orientadas por objeto, bases de dados de objeto, bases de dados de modelo de rela
Petição 870190078052, de 12/08/2019, pág. 133/238
129/194 cionamento de entidade, bases de dados associativas, e bases de dados XML. Exemplos não-limitantes adicionais incluem SQL, PostgreSQL, MySQL, Oracle, DB2, e Sybase. Em algumas concretizações, a base de dados é à nase de internet. Em concretizações adicionais, uma base de dados é à base da web. Em concretizações ainda adicionais, uma base de dados é à base de computação de nuvem. Em outras concretizações, uma base de dados é baseada em um ou mais dispositivos de armazenagem de computador local.
[00315] Em um aspecto, é aqui proporcionado um sistema compreendendo um computador compreendendo um processador e memória de computador, no qual o computador está em comunicação com uma rede de comunicações, e no qual a memória do computador compreende código que, quando executado pelo processador, (1) recebe dado de sequência em memória de computador a partir da rede de comunicações: (2) determina se uma variante genética no dado de sequência representa um mutante de linha germinal ou um mutante de célula somática, usando os métodos aqui descritos; e (3) reporta, sobre a rede de comunicações, a determinação.
[00316] A rede de comunicações pode ser qualquer rede disponível que se conecta à internet. A rede de comunicações pode utilizar, por exemplo, uma rede de transmissão de alta velocidade incluindo, sem limitação, Broadband over Powerlines (BPL), Cable Modem, Digital Subscriber Line (DSL), Fiber, Satellite, e Wireless.
[00317] Em um aspecto, é aqui proporcionado um sistema compreendendo: uma rede de área local; um ou mais sequenciadores de DNA compreendendo memória de computador configurada para armazenar dado de sequência de DNA que são conectados à rede de área local; um computador de bioinformática compreendendo uma memória de computador e um processador, cujo computador é conectado à rede de área local; no qual o computador adlcionalmente compreende códi
Petição 870190078052, de 12/08/2019, pág. 134/238
130/194 go que, quando executado, copia dado de sequência de DNA armazenado em um sequenciador de DNA, escreve o dado copiado para memória no computador de bioinformática, e realiza etapas conforme aqui descritas.
[00318] Também aqui providos são numerosos sistemas para implementar os métodos descritos. Em algumas concretizações, os sistemas compreendem um sequenciador de ácido nucleico, incluindo sequenciadores de DNA de próxima geração, o sequenciador está em comunicação de dados com um dispositivo de processamento digital, no qual os dados recebidos por um módulo de software ou módulos no dispositivo de processamento digital são gerados pelo sequenciador quando o sequenciador obtém informação de sequência de DNA de sequência de DNA dividida e etiquetada que foi dividida e etiquetada pelos métodos individuais. O sequenciador e o dispositivo de processamento digital não necessitam estarem localizados próximos entre si, e, em algumas concretizações, podem ser separados por grandes distâncias físicas, provido que comunicação de dados adequada existe entre os componentes do sistema. As concretizações de sistema específicas descritas abaixo são exemplares da maior variedade de sistemas providos pela invenção. Será compreendido por aqueles técnicos no assunto que o método aqui descrito que compreende etapa de análise de dados pode ser prontamente implementado através dos sistemas aqui revelados, no qual um módulo de software ou módulos em um dispositivo de processamento digital é usado para analisar dado de sequência obtido pelo sequenciamento de populações de ácido nucleicos etiquetados produzidos por métodos individuais.
[00319] Uma concretização é um sistema compreendendo:
[00320] um sequenciador de ácido nucleico: um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis,
Petição 870190078052, de 12/08/2019, pág. 135/238
131/194 e uma memória; e uma ligação de dados comunicativamente conectando o sequenciador de ácido nucleico e o dispositivo de processamento digitai; no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação para análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de: DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, cada das pelo menos duas formas compreendendo uma pluralidade de moléculas, a aplicação compreendendo: (i) um módulo de software que recebe dado de sequência a partir do sequenciador de ácido nucleico, via a ligação de dados, o dado de sequência de ácidos nucleicos amplificados pelo menos alguns dos quais são etiquetados, o dado de sequência gerado por ligação de pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico etiquetado para distinguir as formas entre si, amplificar as formas de ácido nucleico pelo menos um do qual é ligado a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiqueta de ácido nucleicos ligada são amplificados para produzir ácidos nucleicos amplificados dos quais aqueles amplificados de pelo menos uma forma são etiquetados; e (li) um módulo de software que ensaia o dado de sequência dos ácidos nucleicos amplificados por obtenção de informação de sequência suficiente para decodificar as moléculas de ácido nucleico etiquetadas dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual o dado de sequência foi ensaiado. Em outra concretização, o sistema adicionalmente compreende um módulo de software que decodifica as moléculas de ácido nucleico etiquetadas dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplifi
Petição 870190078052, de 12/08/2019, pág. 136/238
132/194 cados ligados às moléculas de ácido nucleico de etiqueta para qual o dado de sequência foi ensaiado. Em outra concretização de um sistema, a aplicação adicionalmente compreende um módulo de software que transmite um resultado do ensaio, via uma rede de comunicações. [00321] Outra concretização é um sistema compreendendo: um instrumento de sequenciamento de próxima geração (NGS); um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória: e uma ligação de dados comunicativamente conectando o Instrumento de NGS e o dispositivo de processamento digital; no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação compreendendo: (i) um módulo de software para receber dado de sequência a partir do Instrumento de NGS, via a ligação de dados, o dado de sequência gerado por fradonamento fisicamente das moléculas de DNA de uma amostra humana para gerar duas ou mais divisões, aplicar etiquetas moleculares diferenciais e adaptadores de capacitação de NSG para cada das duas ou mais divisões para gerar divisões etiquetadas moleculares, e ensaiar as divisões etiquetadas moleculares com o instrumento de NGS; (ii) um módulo de software para gerar dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente divididas; e (iii) um módulo de software para analisar o dado de sequência por desconvolução da amostra em moléculas que foram diferencialmente divididas. Em outra concretização de um sistema, o sistema adicionalmente compreende um módulo de software que transmite um resultado do ensaio, via uma rede de comunicações.
[00322] Outra concretização é um sistema compreendendo: um instrumento de sequenciamento de próxima geração (NGS); um dispositivo de processamento digital compreendendo pelo menos um proces
Petição 870190078052, de 12/08/2019, pág. 137/238
133/194 sador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e uma ligação de dados comunicativamente conectando o instrumento de NGS e o dispositivo de processamento digital; no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis por o pelo menos um processador para criar uma aplicação para identificação de etiqueta molecular de MBD-bibliotecas fracionadas de esfera compreendendo: um módulo de software configurado para receber dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado por fracionamento fisicamente de uma amostra de DNA extraída usando um kit de purificação de esfera-proteína de domínio de ligação de metil, economizando todas as eluições para processamento à jusante; conduzir aplicação paralela de etiquetas moleculares diferenciais e sequências de adaptador de capacitação de NSG para cada fração ou grupo; re-combinar todas as frações etiquetadas moleculares ou grupos, e subsequente amplificação usando sequências de primer de DNA específica de adaptador; condução de enriquecimento/hibridização de biblioteca total recombinada e amplificada de etiquetação de regiões genômicas de interesse; re-amplificação da biblioteca de DNA total enriquecida, anexando uma etiqueta de amostra; reunião de diferentes amostras; e ensaio dos mesmos em multiplex no instrumento de NGS; no qual dado de sequência de NGS produzido pelo instrumento proporciona sequência das etiquetas moleculares sendo usada para identificar moléculas únicas, e dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente MBD-dividido: e (ii) um módulo de software configurado para realizar análise do dado de sequência por uso das etiquetas moleculares para identificar moléculas únicas e desconvolução da amostra em moléculas que foram diferencialmente MBD-dividido. Outra concretização é um sistema no qual a aplicação adicionalmente
Petição 870190078052, de 12/08/2019, pág. 138/238
134/194 compreende um módulo de software configurado para transmitir um resultado da análise, via uma rede de comunicações.
[00323] Outra concretização é um sistema compreendendo: (a) um instrumento de sequenciamento de próxima geração (NGS), (b) um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e (c) uma ligação de dados comunicativamente conectando o instrumento de NGS e o dispositivo de processamento digital; no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação compreendendo: I) um módulo de software para receber dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado carregado com ácidos nucieicos etiquetados preparados por contato da população de ácido nucleico com um agente que preferencialmente se liga à ácidos nucleicos que suportam a modificação, separação de uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos não-ligada ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação; ligação dos ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião para produzir uma população de ácidos nucleicos etiquetados; amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas, são amplificados; e ensaiar as divisões etiquetadas moleculares com o instrumento de NGS; ii) um módulo de software para geração de dado de sequência para decodificação da etiqueta; e iii) um módulo de software para análise do dado de sequência para decodificar a etiquetas para revelar se os ácidos nucleicos para qual dado de sequência foi
Petição 870190078052, de 12/08/2019, pág. 139/238
135/194 ensaiado foram amplificados de modelos na primeira ou na segunda reunião. Outra concretização é um sistema compreendendo adicionalmente um módulo de software que transmite um resultado do ensaio, via uma rede de cominações.
[00324] Exemplos:
[00325] Exemplo 1: Procedimento experimental para fracionamento à base de domínio de ligação de metil (MBD) [00326] Coleta de amostra [00327] Amostras, tal como sangue, soro ou plasma, de indivíduos com câncer de pulmão (por exemplo, NSCLC) foram selecionadas do repositório Guardant Health que mostrou teor de DNA de tumor de alta circulação (ctDNA) conforme determinado pelo ensaio GUARDANT360™. DNA de célula livre (cfDNA) de doadores normais saudáveis foi extraído de plasma isolado de sangue, conforme anteriormente descrito (Lanman et al., Analytical e validação clínica de um painel de sequenciamento digital para avaliação altamente precisa, quantitativa, de DNA de tumor circulante de célula livte, PLoS ONE 10(10): e0140712 (2015)).
[00328] Extração de cfDNA [00329] A amostra foi submetida a digestão de proteinase K. O DNA foi precipitado com isopropanol. O DNA foi capturado em uma coluna de purificação de DNA (por exemplo, um Kit QIAamp DNA Blood Mini) e eluído em 100 μΙ de solução. Os DNAs abaixo de 500 bp foram selecionados com captura de esfera magnética Ampure SPRI (PEG/salt). A produção resultante foi suspensa em 30 μ! de H2O. A distribuição de tamanho foi verificada (pico maior-166 nucleotídeos; pico menor -330 nucleotídeos), e quantificada. Em geral, 5 ng de DNA extraído contém aproximadamente 1700 equivalentes de genoma haplóide (“HGE”). A correlação geral entre a quantidade de DNA e HGE foi listada conforme segue: 3 pg de DNA-1 HGE; 3 ng de DNA=1K HGE; 3 ng de
Petição 870190078052, de 12/08/2019, pág. 140/238
136/194
DNA-1M HGE; 10 pg de DNA=3 HE; 10 ng de DNA-3K HGE; 10 ng de DNA-3M HGE.
[00330] Fracionamento de DNA [00331] O DNA foi fracionado em frações múltiplas (ou divisões). cfDNA (10~150ng) foi fracionado em frações hipermetilatadas, intermediárias metilatadas e hipometilatadas usando o protocolo de enriquecimento de afinidade de MethylMiner™ (Thermo Fisher Scientific, Cat # ME10025), exceto que condições de reação foram modificadas usando 300mM de incubação de NaCI e tampão de lavagem, e protocolo para uma entrada de DNA de micrograma foi escalada para entradas de DNA de sub-micrograma.
[00332] Preparação de esfera [00333] Lavagem da Estreptavidina Dynabeads® M-280: A Estreptavidina Dynabeads® M-280 foi lavada usando um tampão de lavagem contendo 300 mlVI de NaCI antes do acoplamento com o MBD-Biotin Proteína. O estoque de Estreptavidina Dynabeads® M-280 foi resuspenso para obter uma supensão homogênea. Para cada micrograma de DNA de entrada, 10 μΙ de esferas foram adicionados a um tubo de microcentrífuga livre de DNase de 1,7 ml. O volume de esfera foi trazido para 100 μΙ com 1X Bind / Wash Buffer. O tubo foi colocado em um suporte magnético por 1 minuto para concentrar todas das esferas na parede interna do tubo antes do líquido ser removido e descartado. O tubo foi removido do suporte magnético e um volume igual (por exemplo, cerca de 100-250 μΙ) de IXBind / Wash Buffer foi adicionado para resuspender as esferas. As esferas resuspensas foram concentradas e lavadas por uma vez mais antes do procedimento do acoplamento da MBD-Biotina Proteína às esferas.
[00334] Acoplamento Dynabeads® M-280 Estreptavidina com o MBD-Biotina Proteína: Para cada micrograma de DNA de entrada, 7 μΙ (3,5 pig) de MBD-Biotina Proteína foram adicionados a um tubo de
Petição 870190078052, de 12/08/2019, pág. 141/238
137/194 microcentrífuga livre de DNase de 1,7 ml. O volume de esfera foi trazido para 100 pl com IXBind / Wash Buffer contendo 300 mM de NaCI. O MBD-Biotina Proteína foi diluído e transferido para o tubo de esferas resuspensas a partir da lavagem de esfera inicial. A mistura esferaproteína foi misturada em um misturador rotativo à temperatura ambiente por 1 horas, antes de proceder à lavagem das esferas de MBD. [00335] Lavagem das esferas de MBD: As esferas de MBD no tubo foram concentradas por colocação do tubo em um suporte magnético por 1 minuto. O líquido foi removido e descartado. As esferas foram resuspensas com 100-250 pl de IXBind /Wash Buffer contendo 300 mM de NaCI e misturadas em um misturador rotativo à temperatura ambiente por 5 minutos. As esferas foram concentradas, lavadas, e resuspensas, conforme descrito acima por duas mais vezes. O tubo foi, em seguida, colocado no suporte magnético por 1 minuto, e o líquido foi cuidadosamente removido e descartado. As esferas foram resuspensas com 100-250 pl de IXBind /Wash Buffer contendo 300 mM de NaCI antes da captura de DNA de metilação.
[00336] Captura de DNA metilatado fragmentado no MBDesferas e incubação do MBD-esferas com DNA fragmentado: Em geral, o DNA de entrada pode variar de 5 ng-1 pg. A reação de controle tipicamente usa 1 pg de K-562 DNA. À um clean tubo de micro centrífuga livre de DNase de 1,7 ml limpo, 20 pl de 5X Wash / Bind Buffer contendo 300 mM de NaCI foram adicionados. Um DNA de amostra fragmentado, por exemplo, 5 ng-1 pg, foi adicionado ao tubo e o volume final foi trazido a 100 pl com água livre de DNase. A mistura de DNA/Tampão foi transferida para o tubo contendo o MBD-esferas e misturada em um misturador rotativo por 1 hora à temperatura ambiente. Alternativamente, a mistura pode ser misturada durante a noite a 4°C.
[00337] Coleta de DNA não-capturado a partir da solução de es
Petição 870190078052, de 12/08/2019, pág. 142/238
138/194 fera: O DNA não-capturado/ não-metilatado foi coletado do DNA e mistura de MBD-esferas. O tubo contendo uma mistura de DNA e MBD-esferas foi colocado no suporte magnético por 1 minuto para concentrar as esferas, e o líquido sobrenadante foi removido e salvo em um tubo de micro centrífuga livre de DNase limpo. Este líquido sobrenadante salvo é o sobrenadante de DNA não-capturado, e pode ser armazenado em gelo. As esferas foram lavadas com 200 μΙ de IxBind / Wash Buffer contendo 300 mM de NaCI em um misturador rotativo por 3 minutos. As esferas foram concentradas conforme descrito acima, e o líquido sobrenadante contendo o DNA não-capturado/ nãometilatado / hipometilatado foi removido, salvo e armazenado em gelo, conforme descrito acima. As esferas foram lavadas, misturadas, concentradas com o sobrenadante removido e salvo por uma mais vezes para coletar duas frações de lavagem. Cada fração de lavagem foi armazenada em gelo. As frações de lavagem podem ser reunidas juntas e etiquetadas consequentemente.
[00338] Eluição do DNÃ capturado: O DNA capturado foi eluído usando um tampão de eluição contendo 2000 mM de NaCI. As esferas foram resuspensas em 200 μΙ de tampão de eluição (2000 mM de NaCI). As esferas foram incubadas em um misturador rotativo por 3 minutos, e colocadas no suporte magnético por 1 minuto para concentrar todas das esferas, e o líquido contendo DNA capturado/hipermetilatado foi removido e salvo em um tubo de micro centrífuga livre de DNase limpo. A primeira fração salva de DNA capturado / DNA metilatado foi armazenada em gelo. As esferas foram resuspensas e incubadas uma mais vez, e o líquido contendo DNA capturado / DNA metilatado foi removido e salvo em um segundo tubo limpo. A primeira e segunda coleta de DNA capturado / DNA metilatado foram reunidas e armazenadas em gelo.
[00339] Preparação de DNA fraclonado de metilaçâo para análl·
Petição 870190078052, de 12/08/2019, pág. 143/238
139/194 se: cfDNA dividido, DNA hiper metilatado, metilatado intermediário e não-metilatado foi purificado, por exemplo, por limpeza de esfera SPRI (Ampure XP, Beckman Coulter), subsequentemente preparado para ligação (usando NEBNext® Ultra™ End Repair/dA-Tailing Module), em seguida, ligado com adaptadores de dsDNA em forma de Y modificados contendo códigos de barras moleculares não-aleatórios conforme descrito em Lanman et ah, 2015. As divisões de cfDNA hipermetilatado, metilatado intermediário e hipometilatado foram ligadas com 11, 12, e 12 adaptadores de código de barra molecular não-aleatórios distintos, respectlvamente. Moléculas de cfDNA divididas ligadas para cada amostra foram novamente purificadas com esferas SPRI (Ampure XP) em seguida, re-combinadas em uma reação de PCR com oligos universais para todas moléculas ligadas a adaptador (NEBNext Ultra II™ Q5 master mix), amplificando todas moléculas de cfDNA de uma amostra juntas. Bibliotecas de DNA amplificadas foram novamente purificadas usando esferas SPRI (Ampure XP), na preparação para enriquecimento de alvo ou sequenciamento de genoma total (WGS) usando técnicas de preparação padrões.
[00340] Captura e enriquecimento de alvo: As amostras de DNA podem ser enriquecidas usando protocolos comercialmente disponíveis, por exemplo, SureSelectXT Target Enrichment System for Illumina Multiplexed Sequencing.
[00341] Exemplo 3: Perfil de metilação de CDKN2A [00342] O perfil de metilação de DNA em conjunto com dados fragmentômicos foi usada para capturar diferencialmente regiões metilatadas (DMR) em gene CDKN2A. O gene CDKN2A é urn gene supressor de tumor que codifica proteínas p16INK4A e p14ARF, evoluídas em regulação de ciclo de célula. Uma amostra de cfDNA foi fracionada em divisões hipometilatadas e hipermetilatadas usando MBD-purificação de afinidade. Após fracionamento, as moléculas de ácido nucleico em
Petição 870190078052, de 12/08/2019, pág. 144/238
140/194 cada grupo foram sequenciadas para gerar leituras de sequência. As leituras de sequência quando mapeadas a um genoma de referência proporcionam dados fragmentômicos que foram, em seguida, combinadas com leituras de sequência de cada das divisões fracionadas (Fig. 10). O gene CDKN2A mostrou um aumento global na cobertura da divisão hipometilatada comparado à divisão hipermetilatada.
[00343] Exemplo 4: Perfis de metilação de amostras normal e de câncer de pulmão [00344] Conforme mostrado na Fig. 11, o processo de divisão de MBD foi aplicado a quarto amostras de cfDNA de doadores saudáveis (Norm13893, Norm13959, Norm13961, Norm13962) e duas amostras de cfDNA de pacientes de câncer de pulmão com alta % de ctDNA (LungAI 345402, LungA0516902), com quantidade de entrada variante (10 - 150ng de cfDNA) e réplicas (por exemplo, 3 réplicas). As amostras foram agrupadas hierarquicamente pela percentagem de DNA hipermetilatado através de todos os locais genômicos etiquetados no painel. A percentagem de DNA hipermetilatado pode ser determinada por divisão do número de fragmentos de DNA hipermetilatado de célula livre por número total de fragmentos de DNA de célula livre observados através de todas as divisões. O painel é um painel de gene personalizado que cobre cerca de 30 kb de região genômica. O painel também tem sensibilidade mais alta para detecção de cânceres diferentes, tal como câncer de pulmão, câncer coloretal, etc. As amostras de doadores saudáveis foram agrupadas separadamente a partir das amostras de pacientes de câncer de pulmão. As amostras individuais de câncer de pulmão têm perfis de metilação distintos que foram adicionalmente agrupados separadamente (isto é, réplicas de cada amostra de câncer de pulmão são corretamente identificadas e agrupadas juntas). Ver, por exemplo, WO 2017/181146, 19 de outubro de 2017.
[00345] Exemplo 5: Perfil de metilação usando sequenciamento
Petição 870190078052, de 12/08/2019, pág. 145/238
141/194 de genoma total [00346] O perfil de metilação de DNA foi integrado com dados fragmentômicos para determinar padrões de fragmentação anormais e, consequentemente, estrutura de cromatina alterada em uma amostra clínica (Fig. 12A, Fig. 12B, e Fig. 12C). Moléculas de ácido nucleico foram derivadas de pacientes de câncer de pulmão. As moléculas de ácido nucleico foram fracionadas usando MBD-purificação de afinidade em divisões hipometilatadas e hipermetilatadas. Após fracionamento, as moléculas de ácido nucleico em cada divisão foram sequenciadas para gerar leituras de sequência. As leituras de sequência quando mapeadas para um genoma de referência proporcionam dados fragmentômicos. Os dados fragmentômicos, tais como posição genômica, comprimento de fragmento e cobertura, foi combinado com as leituras de sequência de cada divisão. Conforme mostrado na Fig. 12A e Fig. 12B, uma região de 600 bp no local de partida de transcrição (TSS) é um eixo X e frequência ou cobertura é indicado no eixo Y. A Fig.12C mostra fração de fragmentos hipermetilatadosquando comparada a fragmentos totais no eixo X e frequência no eixo Y. Por exemplo, na Fig. 12C, a fração de fragmentos hipermetilatados entre fragmentos totais é cerca de 0,2 (isto é, cerca de 20%).
[00347] Exemplo 6: Perfil de metilação de MOB3A e WDR88 [00348] O perfil de metilação de DNA foi integrado com dados fragmentômicos para determinar diferenças em regulações epigenéticas (Fig. 13A e Fig. 13B). As moléculas de ácido nucleico foram fracionadas usando MBD-purificação de afinidade em divisões hipometilatadas e hipermetilatadas. Após fracionamento, as moléculas de ácido nucleico em cada divisão foram sequenciadas para gerar leituras de sequência. As leituras de sequência quando mapeadas a um genoma de referência proporcionam dados fragmentômicos. Os dados fragmentômicos, tal como posição genômica e cobertura, foi combinado
Petição 870190078052, de 12/08/2019, pág. 146/238
142/194 com leituras de sequência de cada do grupo fracionado.
[00349] O gene MOB3A pode ter funções bioquímicas desconhecidas, e pode ser implicado em sustentação de proliferação e crescimento de tumor. Mapas de calor, como na fig. 13A, mostram mais cobertura para local de partida próximo hipermetilatado comparado a local de partida próximo hipometílatado de TSS nas amostras de indivíduos saudáveis. O exemplo proporciona uma aplicação de grupos fracionados de combinação com dados fragmentômicos para detectar marcadores em TSS de genes que podem ser indicativos de câncer. Estes dados mostram que grupos fracionados (ou divisões), hipermetilatados e hipometilatados, proporcionam melhor resolução para discernimento de estado de metilação através de uma região genômica, tal como TSS. Conforme descrito acima, a cobertura em grupos fracionados mostra diferenças em estado de metilação através de TSS. O exemplo proporciona uma aplicação de fracionamento de moléculas de ácido nucleico para proporcionar melhor resolução de estado de metilação através de um gene.
[00350] O gene WDR88 pode ser implicado em regulação de ciclo de célula, apoptose e autofagia. Mapas de calor mostram mais cobertura para local de partida próximo hipermetilatado comparado a local de partida próximo hipometílatado de TSS (Fig. 13B) nas amostras de indivíduos saudáveis. Ainda, a Fig. 13B mostra que grupos fracionados, hipermetilatados e hipometilatados, proporcionam melhor regulação para discernimento de estado de metilação através de uma região genômica, tal como TSS. Conforme descrito acima, a cobertura em grupos fracionados mostra diferenças em estado de metilação através de TSS. O exemplo proporciona uma aplicação de fracionamento de moléculas de ácido nucleico para proporcionar melhor resolução de estado de metilação através de um gene.
[00351] Exemplo 7: Perffl de metilação de divisões recombinaPetição 870190078052, de 12/08/2019, pág. 147/238
143/194 das e amostra não-fracionada [00352] A Fig. 14A mostra um mapa de calor com cobertura de grupo não-fracionado (nenhum MBD) e divisões recombinadas após MBD-divisâo de afinidade (MBD total), respectivamente no eixo X e eixo Y. As divisões foram recombinadas in silico após divisão em divisões hiper e hipo-metilatadas para formar “hiper + hipo” ou “MBD total”. O mapa de calor mostra uma correlação linear entre a cobertura para nenhum MBD e MDB total. A correlação linear indica cobertura similar e pode proporcionar resolução similar de estado de metilação através de um local genômico. O nível de resolução obtido por nenhum MBD e/ou MBD total pode não ser suficiente para distinguir diferenças no estado de metilação através de um local, mostrando uma vantagem inesperada de divisão baseada na afinidade do MBD.
[00353] A Fig. 14B mostra um gráfico de MVA de mapa de calor com MBD total. O eixo X mostra fragmentos médios em MBD total (divisões recombinadas hiper e hipometilatadas) como (a+b)/2, onde a = MBD total e b ™ nenhum MBD.
[00354] Exemplo 8: Organização de nucleossomo entre divisões recombinadas (MBD total) e amostra não-fracionada [00355] Conforme mostrado na Fig. 15, diferenças nas distâncias entre centros de ocupação de nucleossomo para o MBD total (in silico divisões recombinadas hiper e hipometilatadas) e nenhum BD (nãofracionado) amostras através de uma região genômica foram plotadas no eixo X. Diferenças na distribuição de distâncias entre centros de ocupação de nucleossomo para amostras de MBD total e nenhum MBD através de uma região genômica foram plotadas no eixo Y, conforme indicado por “densidade”. As amostras de MBD total foram preparadas por recombinação das divisões hiper e hipometilatadas in silico. Estes resultados mostram que a divisão de MBD não afeta ocupação nucleossomal.
Petição 870190078052, de 12/08/2019, pág. 148/238
144/194 [00356] Exemplo 9: Validação de sinal de MBD [00357] Amostras divididas de MDB foram usadas para discernir ocupação nucleossomal em amostras saudáveis e de câncer. Neste exemplo, amostras de sangue de seis pacientes de câncer de pulmão e três adultos saudáveis não-malignos foram obtidas. Ácidos nucleicos de célula livre das amostras foram extraídos e divididos usando MBDpurificação de afinidade em divisões hiper e hipo-metilatadas. As amostras de ácido nucleico foram sequenciadas usando sequenciamento de genoma total. A percentagem de fragmentos hipermetilatados para cada divisão e para todas as amostras foram determinadas. A Fig. 16 mostra sinal de MBD em divisões hiper e hipo-metilatadas de pacientes de câncer de pulmão (linhas 1 e 2 do topo) e de adultos saudáveis (linhas 3 e 4). Conforme mostrado na Fig. 16, fragmentos de DNA de célula livre de pacientes de câncer de pulmão mostram enriquecimento de regiões intragênicas distais em divisão hipermetilatada (LungSigHyper) quando comparada com a divisão hipermetilatada de indivíduo saudáveis. Em adição, a distribuição de características no topo 5% de percentagem mais alta de 'picos hipermetilatados (LungSigHyper) e picos hlpometilatados (LungSigHypo) mostra enriquecimento significante de picos hlpometilatados em todos os exons além do exon 1 (Fig. 16, linhas 1 e 2).
[00358] Exemplo 10: Perfil de metilação de AP3D1 gene [00359] Os métodos aqui descritos foram usados para prognóstico de câncer de pulmão. Em um experimento, uma amostra com moléculas de ácido nucleico de um paciente de câncer de pulmão foi fracionada em divisões hipometilatadas e hipermetilatadas usando MBDpurificaçâo de afinidade. Como um controle, uma amostra nâo foi dividida (nenhum MBD). As amostras foram sequenciadas usando sequenciamento de genoma total.
[00360] O gene AP3D1 pode codificar subunidade de complexo de
Petição 870190078052, de 12/08/2019, pág. 149/238
145/194
AP-3 delta-1 que pode ser implicada em transporte de organela. Os mapas de calor mostram mais cobertura para divisão hipermetilatada comparada a divisão hipometilatada e/ou nenhum MBD próximo ao TSS (Fig. 18A). A divisão hipermetilatada mostrou uma cobertura mais forte e/ou uma cobertura mais localizada do que o grupo de nenhum MBD. Conforme mostrado no mapa de calor, a divisão hipermetilatada tem uma cobertura mais localizada forte próxima ao TSS, enquanto que o grupo de nenhum MBD tem uma cobertura similar através da região genômica. A percentagem média de hipermetilação foi também determinada conforme indicado pela linha vermelha na Fig. 18B. O exemplo pode proporcionar uma aplicação de fracionamento de moléculas de ácido nucleico para proporcionar melhor resolução de estado de metilação através de um gene. Estes resultados mostram que o gene AP3D1 é hipermetilatado especialmente próximo ao TSS (Fig. 18A) e que o gene de AP31 é hipermetilatado (> 60% conforme mostrado na Fig. 18B). A desregulação de gene de AP3D1 pode ser envolvida em causar câncer de pulmão. Desse modo, este exemplo pode proporcionar uma aplicação para este método no prognóstico de câncer de pulmão por monitoramento de perfil de metilação de um indivíduo.
[00361] Exemplo 11: Perfil de metilação de gene DNMT1 [00362] Em outro exemplo, o perfil de metilação de gene DNMT1 foi examinado. O gene DNMT1 codifica uma enzima que catalisa a transferência de grupos metil para dinucleotídeos de CpG específicos em DNA. DNMT1 foi implicado na manutenção de metilação de DNA para assegurar a fidelidade de replicação de padrões epigenéticos hereditários. Padrões de metilação aberrantes podem ser associados com cânceres e anormalidades de desenvolvimento.
[00363] Os mapas de calor para hipermetilatado, hipometiiatado e nenhum MBD são mostrados com relação ao TSS (Fig. 19A). A divisão
Petição 870190078052, de 12/08/2019, pág. 150/238
146/194 hipermetilatada mostrou uma cobertura mais forte e/ou uma cobertura mais localizada do que o grupo de nenhum MBD. A divisão hipermetilatada tem uma cobertura localizada e uma cobertura mais forte próxima ao TSS, enquanto que nenhum grupo de MBD tem cobertura similar através do gene. A percentagem média de hipermetilação foi também determinada conforme indicado pela linha vermelha na Fig. 19B para ser cerca de 75%. Estes resultados mostram que o gene DNMT1 é hipermetilatado especialmente próximo ao TSS (Fig. 19A), e que o gene DNMT1 é hipermetilatado (cerca de 75% conforme mostrado na Fig. 19B). Padrões de metilação aberrantes juntos com mudanças na estrutura da cromatina podem resultar em desregulação de DNMT1 que pode estar envolvida em causar câncer de pulmão. Desse modo, este exemplo pode proporcionar uma aplicação para este método no prognóstico de câncer de pulmão por monitoramento do perfil de metilação de um indivíduo. O exemplo pode também proporcionar uma aplicação de fracionamento de moléculas de ácido nucleico para proporcionar melhor resolução de estado de metilação através de um gene.
[00364] Exemplo 12: Fracionamento de histona modificada [00365] Este exemplo demonstra divisão usando abordagem de histona modificada. O DNA é dividido baseado na modificação de histona. Brevemente, esferas de agarose são bloqueadas com BSA e, após lavagem, as esferas são pré-incubadas com anticorpos contra o H3K9me3 e H4K20me3 (Millipore, Temecula, CA, USA) por 4 h a 4°C. Subsequentemente, 200 μΙ de plasma é diluído em 800 μΙ do tampão de diluição de divisão e é, em seguida, adicionado às esferas de agarose pelotadas que foram pré-incubadas com anticorpos. Após durante a noite de incubação a 4°C, as esferas são lavadas com baixo sal, alto sal, LiCI e tampões Tris/EDTA. Finalmente, a cromatina é eluída por incubação das esferas a 65°C, e as proteínas são removidas por tra
Petição 870190078052, de 12/08/2019, pág. 151/238
147/194 tamento com proteinase K. O DNA dividido é, em seguida, purificado usando um kit de purificação apropriado e armazenado a -“20°C.
[00366] Exemplo 13: Fradonamento baseado em regiões ligadas de proteína [00367] Este exemplo demonstra a abordagem de divisão usando uma região à base de proteína. O DNA é dividido baseado nas diferenças na ligação à proteína A. As moléculas de ácido nucleico em uma amostra podem também serem fracionadas baseado em regiões de ligação de proteína. Por exemplo, as moléculas de ácido nucleico podem ser fracionadas em grupos diferentes baseado nas moléculas de ácido nucleico que são ligadas a uma proteína específica, e aqueles que não são ligados àquela proteína específica. As moléculas de ácido nucleico podem ser fracionadas baseado na ligação de DNAproteína. Complexos de proteína-DNA podem ser fracionados baseado em uma propriedade específica de uma proteína. Exemplos de tais propriedades incluem vários epítopos, modificações (por exemplo, metilação ou acetilação de histona), ou atividade enzimática. Exemplos de proteínas que podem se ligar a DNA e servem como uma base para fradonamento podem incluir, por exemplo, proteína A ou proteína
G. Procedimentos experimentais, tal como precipitação de Cromatinaimuno, são usados para fracionar as moléculas de ácido nucleico baseado nas regiões de ligação de proteína A.
[00368] Exemplo 14: Fradonamento baseado em Hidroximetilação [00369] Este exemplo demonstra divisão usando abordagem de histona modificada. O DNA é dividido baseado em hidroximetilação. Brevemente, bases 5-hmC-modificadas são glicosilatadas in vitro. Glicosilação específica de 5-hmC é efetuada pelo seguinte protocolo da enzima 5-hmC Glicosiltransferase altamente ativa de Zymo Research (zymoresearch, com/epigenetics/dna-hidroximetilaçâo/5-hmc
Petição 870190078052, de 12/08/2019, pág. 152/238
148/194 glicosiltransferase). J-Binding Protein-1 (JBP-1) se liga especificamente ao DNA glicosiiatado com alta afinidade, permitindo que níveis de 5hmC sejam determinados por enriquecimento à base de JBP-1. Adicionalmente, glicosilação de 5-hmC altera a digestão de DNA por várias enzimas de restrição, e, portanto, padrões de digestão de DNA 5-hmC~ glicosiiatado podem ser usados para avaliar estado de hidroximetilação de DNA.
[00370] Exemplo 15: Fracionamento baseado em isolamento de moléculas de ácido nucleico [00371] As moléculas de ácido nucleico em uma amostra são fracionadas baseado no isolamento. Por exemplo, os ssDNA e dsDNA são fracionados em dois grupos. Estes grupos são submetidos a um ensaio de sequenciamento, ou Individualmente ou simultaneamente. Uma amostra de ácido nucleico tendo ambos ssDNA e dsDNA são fracionados por não sujeição da amostra a uma etapa de desnaturação durante fracionamento. A etapa de desnaturação converte o dsDNA em ssDNA, e não permite fracionamento das moléculas de ácido nucleico baseado em isolamento.
[00372] Exemplo 16: Divisão molecular de ssDNA e dsDNA com protocolo de captura de alvo de pré-amplificação modificado (NEBNext Direct) [00373] Uma nova metodologia de captura híbrida, em que um protocolo de sequenciamento de alvo de captura híbrido de préamplificação (por exemplo, NEBNext Direct HotSpot Cancer Panel), foi aplicado a uma mostra de DNA de célula livre (cfDNA) sem desnaturação de DNA, capturando moléculas de ssDNA(Fig. 18). A fração nãoligada contendo moléculas de dsDNA foi isolada, desnaturada a ssDNA, e aplicada ao protocolo de captura.
[00374] O protocolo de sequenciamento de captura híbrido de préamplificação usado foi o NEBNext Direct HotSpot Cancer Panel, con
Petição 870190078052, de 12/08/2019, pág. 153/238
149/194 tendo iscas para 190 alvos de câncer comum de 50 genes, envolvendo aproximadamente 40 kb de sequência, e incluindo acima de 18.000 características COSMIC (NEBNext Direct HotSpot Cancer Panel; neb.com/products/e7000-nebnext-direct-cancer-hotspot-panel). Brevemente, a abordagem de enriquecimento de alvo de NEBNext Direct hibridiza rapidamente amostras de DNA para iscas de oligonucleotídeo biotinilatado, que definem a extremidade 3'de cada alvo de interesse. Os híbridos de alvo de isca foram ligados às esferas de estreptavidina, e reações enzimáticas foram usadas para remover sequência de alvo 37 Prep de biblioteca subsequente converte os alvos em bibliotecas compatíveis com Illumina que incluem “tagsand” molecular de um código de barras da amostra. O uso do kit permite captura de todas as moléculas de ssDNA e dsDNA em uma amostra por desnaturação da amostra de DNA antes da hibridização com iscas.
[00375] Uma amostra de cfDNA contendo ssDNA e dscfDNA foi submetida a protocolo de captura de alvo omitindo a etapa de desnaturar dsDNA antecipado. As moléculas de ssDNA capturadas foram preparadas por NGS por protocolo NEBNext (coluna esquerda na Fig.20), enquanto que o sobrenadante a partir da captura foi aplicado a um segundo protocolo de captura de alvo, com etapa de desnaturar dsDNA antecipado padrão e, subsequentemente preparada por NGS (colina direita na Fig. 20). CfDNA extraído de plasma foi quantificado por medição à base de eletroforese. Um equivalente de volume de amostra para 200 ng ou 500 ng foi aplicado ao ensaio NEBNExt Direct HotSpot Cancer Panel, omitindo a etapa de desnaturação de DNA, tal que somente moléculas de ssDNA hibridizam para as iscas. O sobrenadante da captura, contendo moléculas de dsDNA e moléculas de ssDNA não-direcionadas foi retido e submetido a uma segunda captura de alvo (Figura 20). Ambas bibliotecas de ssDNA e dsDNA foram preparadas separadamente por NGS, com tages de códigos de barra de
Petição 870190078052, de 12/08/2019, pág. 154/238
150/194 amostra que são identificadas em análise de bioinformática à judante. Ambas bibliotecas preparadas de ssDNA e dsDNA foram sequenciadas em uma Illumina NextSeq 500 (2 x 75 extremidades emparelhadas) e o número total de moléculas alvos (correspondente a iscas 40kb) foi computado (Fig. 1).
[00376] Uma amostra de DNA de célula livre (cfDNA) com ambos DNA de célula livre de cadeia única (ss-cfDNA) e o DNA de célula livre de cadeia dupla (ds~cfDNA) foi fracionada em grupos de ss-cfDNA e ds-cfDNA, respectivamente, usando método descrito acima (Fig. 20). Em duas das amostras sequenciadas, a biblioteca de ssDNA contém -80% do dsDNA (moléculas alvos, primeiro 200 ng e segundo 500 ng de entrada de cfDNA). O segundo 200 ng de cfDNA falha em produzir ambas bibliotecas de ssDNA e dsDNA, e indica um provável erro no processamento da amostra à jusante do processo de divisão de ssDNA/dsDNA, enquanto que o primeiro 500 ng de entrada de cfDNA produz biblioteca de dsDNA significante somente, que sugere que a quantidade relativa de ssDNA e dsDNA em uma amostra de cfDNA foi variável. As moléculas alvos foram computadas conforme definido pelo pacote Picard do Broad Institute (Picard metrics; broadinstitute.github.io/picard/picard-metric-definitions.html). O PCR produzido para este experimento foi mostrado na Fig. 20. Um rendimento relativo de PCR produzido para rendimento de ssDNA/PCR para dsDNA, foi determinado para estar entre 20% e 75% para todas as quatro amostras.
[00377] Exemplo 17: Detecção de mutação somática sensitiva retida com método de divisão de metilação à base de MBD [00378] Reunião e coleta de amostra [00379] Amostras foram selecionadas do repositório Guardant Health que mostraram alto rendimento de cfDNA. Amostras clínicas foram preparadas por mistura de 96 amostras em iguais volumes. Isto
Petição 870190078052, de 12/08/2019, pág. 155/238
151/194 serve como um material de teste para sensibilidade de ensaio para detecção de mutação, à medida que reuniões contém mutações de genoma de referência a <0,02% a 100%. Duas amostras clínicas diferentes (PowerpoolVI e PowerpoolV2) com amostras de componente único foram preparadas.
[00380] Divisão de DNA [00381] Powerpool cfDNA foi dividido em frações múltiplas. cfDNA (15 ou 150 ng) foi dividido em frações hipermetilatadas, metilatadas intermediárias e hipometilatadas usando o protocolo de enriquecimento de afinidade MethylMiner™ (Thermo Fisher Scientific, Cat # ME10025), exceto que condições de reação foram modificadas usando 300 mM de NaCI de incubação e tampão de lavagem, e protocolo para um micrograma de entrada de DNA foi escalado linearmente para submicrograma de entradas de DNA.
[00382] Preparação de esfera [00383] Lavagem de Dynabeads® M-280 Estreptavidina [00384] As Dynabeads® M-280 Estreptavidina foram lavadas usando IXBind / Wash Buffer (contendo 160 mM de NaCI) antes do acoplamento com a MBD-Biotina Proteína. Brevemente, o estoque de Dynabeds® M-280 Estreptavidina foi resuspenso para obter uma suspensão homogênea. Para cada micrograma de DNA de entrada, 10 μί de esferas foram adicionados a um tubo de micro centrífuga livre de DNase de 1,7 ml. O volume de esfera foi trazido para 100 μΙ com IXBind / Wash Buffer. O tubo foi colocado em um suporte magnético por 1 minuto para concentrar todas das esferas na parede interna do tubo antes do líquido ser removido e descartado. O tubo foi removido do suporte magnético, e um igual volume (por exemplo, cerca de 100250 μΙ) de IXBind / Wash Buffer foi adicionado para resuspender as esferas. As esferas resuspensas foram concentradas e lavadas por uma vez mais antes de proceder ao acoplamento do MBD-Biotina ProPetição 870190078052, de 12/08/2019, pág. 156/238
152/194 teína às esferas.
[00385] Acoplamento de Dynabeads® M-280 Estreptavidina com o MBD-Biotina Proteína [00386] Para cada micrograma de DNA de entrada, 7 μ! (3,5 pg) de MBD-Biotina Proteína foram adicionados a um tubo de micro centrifuga livre de DNase de 1,7 ml. O volume de esfera foi trazido para 100 pl com IXBind / Wash Buffer contendo 300 mM de NaCI. O MBD-Biotina Proteína foi diluído e transferido ao tubo de esferas resuspensas a partir da lavagem de esfera inicial. A mistura de esfera-proteína foi misturada em um misturador rotativo à temperatura ambiente por 1 hora, antes de proceder à lavagem do MBD-esferas.
[00387] Lavagem do MBD-esferas [00388] O tubo contendo o MBD-esferas foi concentrado por colocação do MBD-esferas em um suporte magnético por 1 minuto. O líquido foi removido e descartado. As esferas foram resuspensas com 100-250 pl de IXBind /Wash Buffer contendo 160 mM de NaCI e misturadas em um misturador rotativo à temperatura ambiente por 5 minutos. As esferas foram concentradas, lavadas, e resuspensas conforme descrito acima por duas mais vezes. O tubo foi em seguida colocado no suporte magnético por 1 minuto, e o líquido foi cuidadosamente removido e descartado. As esferas foram resuspensas com 10 pl de tampão de captura 1X DNA (contendo 300 mM de NaCI) por cada pl de esferas de estreptavidina usadas.
[00389] Captura de DNA metilatado fragmentado no MBDesferas [00390] Incubação de MBD-esferas com DNA fragmentado [00391] Em geral, o DNA de entrada pode variar de 5 ng-1 pg. A reação de controle tipicamente usa 1 pg de K-562 DNA. À um tubo de micro centrífuga livre de DNase limpo de 1,7 ml ou tubo de PCR, um DNA de amostra fragmentado, por exemplo, 5 ng-1 pg, foi adicionado
Petição 870190078052, de 12/08/2019, pág. 157/238
153/194 ao tubo, com um igual volume de 2xDNA de tampão de captura (contendo 300mM de NaCI), e o volume final foi trazido a 100 ou 200 μΙ com 1xDNA tampão de captura. A mistura de DNA / Buffer foi transferida para o tubo contendo o MBD-esferas e misturada em um misturador rotativo por 1 hora à temperatura ambiente. Alternativamente, a mistura pode ser misturada durante a noite a 4°C.
[00392] Coleta de DNA não-capturado a partir da solução de esfera [00393] O DNA não-capturado / DNA não-metilatado foi coletado a partir da mistura de DNA e MBD-esferas. Brevemente, o tubo contendo uma mistura de DNA e MBD-esferas foi colocado no suporte magnético por 1 minuto para concentrar todas das esferas, e o líquido so~ brenadante foi removido e salvo em um tubo de micro centrífuga livre de DNase limpo. Este líquido sobrenadante salvo é o sobrenadante de DNA não-capturado / fração de DNA não-metilatado, e pode ser armazenado em gelo. As esferas foram lavadas com 200 μ! de 1X DNA Capture Buffer contendo 300 mM de NaCI em um misturador rotativo por 3 minutos. As esferas foram concentradas conforme descrito acima, e o líquido sobrenadante contendo o DNA não-capturado / DNA não-metilatado / DNA hipometílatado foi removido, salvo e armazenado em gelo conforme descrito acima. As esferas foram lavadas, misturadas, concentradas com o sobrenadante removido e salvo por uma mais vezes para coletar duas frações de lavagem. Cada fração de lavagem foi armazenada em gelo. As frações de lavagem podem ser reunidas juntas e etiquetadas consequentemente.
[00394] Eluição do DNA capturado [00395] O DNA capturado foi eluído usando um tampão de eluição contendo 2000 mM de NaCI. As esferas foram resuspensas em 200 μΙ de tampão de eluição (2000 mM NaCI). As esferas foram incubadas em um misturador rotativo por 3 minutos, e colocadas no suporte
Petição 870190078052, de 12/08/2019, pág. 158/238
154/194 magnético por 1 minuto para concentrar todas das esferas, e o liquido contendo DNA capturado / DNA hipermetilatado foi removido e salvo em um tubo de micro centrífuga livre de DNase limpo. A primeira fração salva foi armazenada em gelo. As esferas foram resuspensas e incubadas uma mais vezes, e o líquido contendo DNA capturado / DNA metilatado foi removido e salvo em um segundo tubo limpo. A primeira e segunda coleta de DNA capturado / DNA hipermetilatado foram reunidas e armazenadas em gelo. Alternativamente, eluições múltiplas com concentração aumentada de NaCI podem ser realizadas para divisão adicional do DNA em fração com metilaçâo de DNA aumentada.
[00396] Preparação de DNA fraclonado de metilaçâo para análise [00397] cfDNA dividido, DNA metilatado, DNA metilatado intermediário e DNA não-metilatado foi purificado, por exemplo, por limpeza de esfera de SPRI (Ampure XP, Beckman Coulter), subsequentemente preparado para ligação (usando NEBNext® Ultra™ End Repair/dATailing Module), em seguida ligado com adaptadores de dsDNA em forma de Y modificado contendo códigos de barras moleculares nãoaleatórios, conforme descrito em Lanman et al., 2015. As divisões de cfDNA hipermetilatado, metilatado intermediário e hipometilatado foram ligadas com 11, 12, e 12 adaptadores de códigos de barras moleculares não-aleatórios distintos, respectivamente. Moléculas de cfDNA divididas ligadas para cada amostra foram novamente purificadas com esferas SPRI (Ampure XP), em seguida re-combinadas em uma reação de PCR com oligos universais para todas as moléculas ligadas de adaptador (NEBNext Ultra II™ Q5 master mix), amplificando todas as moléculas de cfDNA de uma amostra juntas. As bibliotecas de DNA amplificadas foram novamente purificadas usando esferas SPRI (Ampure XP), na preparação para enriquecimento de alvo por captura híPetição 870190078052, de 12/08/2019, pág. 159/238
155/194 brida (Agilent SureSelect 30kb panel; ‘panel’).
[00398] A preparação de DNA nâo-dividido para análise [00399] cfDNA Powerpool (10 ou 150 ng) foi preparado para ligação (usando NEBNext® Ultra™ End Repair/dA-Tailing Module), em seguida ligado com adaptadores de dsDNA em forma de Y modificado contendo códigos de barra moleculares não-aleatórios conforme descrito em Lanman et al., 2015. O cfDNA foi ligado com 35 adaptadores de códigos de barra não-aleatórios distintos. Moléculas de cfDNA ligadas para cada amostra foram novamente purificadas com esferas SPRI (Ampure XP), em seguida colocadas em reação de PCR com oligos universais para todas moléculas ligadas por adaptador (NEBNext Ultra II™ Q5 master mix), amplificando todas as moléculas de cfDNA de uma amostra juntas. As bibliotecas de DNA amplificadas foram novamente purificadas usando esferas SPRI (Ampure XP), na preparação para enriquecimento de alvo por captura híbrida (Agilent SureSelect 30kb panel; ‘panei’).
[00400] A revelação proporciona métodos para processamento da população de ácido nucleicos contendo formas diferentes (por exemplo, RNA e DNA, de cadeia única ou de cadeia dupla), e/ou extensões de modificação (por exemplo, metilação de citosina, associação com proteínas). Estes métodos acomodam formas múltiplas e/ou modificações de ácido nucleico em uma amostra, tal que informação de sequência pode ser obtida para formas múltiplas. Os métodos também preservam a identidade de formas múltiplas ou estados modificados através de processamento e análise, tal que análise de sequência pode ser combinada com análise epigenética.
[00401] Análise de dados [00402] Bibliotecas de DNA de amostras diferentes foram reunidas e sequenciadas em uma Illumina HiSeq2500, 2x150 sequenciamento terminal emparelhado. Processamento de bioinformática foi efetuado
Petição 870190078052, de 12/08/2019, pág. 160/238
156/194 como por o protocolo padrão de GUARDANT360™ conforme descrito em Lanman et al, 2015 e em qualquer lugar aqui. Para MBD-amostras divididas, adicionalmente os códigos de barra moleculares foram usados para identificar o MBD-divisão em que o DNA foi fracionado (hipermetilatado, metilatado intermediário, e hipometllatado). Em cada local genômico direcionado pelo painel, as moléculas alinhadas que foram hipermetilatadas, metilatadas intermediárias e hipometilatadas foi totalizado. A % de hipermetilatado foi definida a um dado local à medida que a fração de moléculas totais que abrangem o local são hipermetilatadas. Para ambas amostras de MBD-dividida e DNA nãodividido, em regiões direcionadas, fração de alelo mutante (MAF) a partir do genoma de referência foi denominada usando variante proprietária Guardant Health chamando software.
[00403] Exemplo 18: Comparação entre a cobertura para amostras de MBD e amostras de nâo-MBD no ensaio de sequenciamento direcionado [00404] Neste exemplo, as amostras foram processadas conforme descrito no Exemplo 17. Amostras clínicas diferentes (PowerpoolVI e PowerpoolV2) de cfDNA foram ensaiadas no ensaio de sequenciamento direcionado com e sem o MBD-divisão, ‘MBD’ e ‘não MBD’, em triplicatas respectivamente. As moléculas únicas sequenciadas em cada posição genômica direcionada para os genes a partir do painel foram comparadas no MBD e Não MBD para PowerpoolVI a 15 ng (Fig. 25A) e 150 ng (Fig. 25B) de entrada de ensaio. O painel é um painel de gene personalizado que cobre cerca de 30 kb região genômica. O painel também tem sensibilidade mais alta para detecção de cânceres diferentes, tal como câncer de pulmão, câncer coloretal, etc. A Fig. 25A e Fig. 25B mostram recuperação de alta eficiência de moléculas em ensaio de sequenciamento direcionado foi retido com aplicação de MBD-divisão. As contagens de molécula de ensaio de sequenciamento
Petição 870190078052, de 12/08/2019, pág. 161/238
157/194 direcionado de powerpoolVI (a) 15ng e (b) 150ng input, ou operam com (eixo Y) ou sem MBD-divisão. Uma correlação linear é observada entre o MBD para contagens de molécula de não MBD ou cobertura, indicando que o MBD-divisão não proporciona a recuperação do ensaio.
[00405] As contagens de molécula ou cobertura para os genes a partir do painel foram comparadas entre as amostras de não MBD e MBD. As amostras de MBD e não MBD foram preparadas usando 15 ng de cfDNA de entrada extraído de duas amostras clínicas (Fig. 26APowerpoolVI e Fig. 26B - PowerpoolV2), ou usando 150 ng de cfDNA de entrada extraído de duas amostras clínicas (Fig. 27A - PowerpoolV1; Fig. 27B - PowerpoolV2). O eixo X para o gráfico na esquerda representa contagens de molécula ou cobertura, o eixo X para o gráfico no centro representa mutante confirmado com ambas leituras terminais emparelhadas (sobreposição de cadeia dupla; DSO) e o eixo X para o gráfico na esquerda representa contagens de molécula para qual ambas cadeias de DNA são sequenciadas (suporte de cadeia dupla; DS). Uma forte correlação entre amostras de MBD e nâo-MBD para contagens de molécula, DSO e DS mostram que amostras de MBD podem capturar muitas das moléculas (-94% como na Fig. 26A, -8085% como na Fig. 26B e Fig. 27A e -90% como na Fig. 27B) quando comparada a não-MBD. Nenhuma inclinação posicionai em cobertura molecular, bem como outra variante importante denominando métricas (DSO, DS) através do painel.
[00406] Exemplo 19: Sensibilidade e especificidade de detecção de variante em amostras de MBD e não MBD [00407] Neste exemplo, as amostras foram processadas conforme descrito no Exemplo 17. Para medir o impacto na detecção de variante ou mutação na sensibilidade e especificidade, a fração de alelo mutante (MAF) entre as amostras de MBD (eixo Y) e não-MBD (eixo X) fo
Petição 870190078052, de 12/08/2019, pág. 162/238
158/194 ram comparadas para os genes no painel usando 15 ng de cfDNA de entrada. Faixas de MAF diferentes são plotadas no eixo X, por exemplo, 0-100% (Fig. 28A), 0-5% (Fig. 28B) e 0-0,5% (Fig. 28C). Os valores de MAF são de amostras de triplicates de MBD e não MBD. MAFs determinados para amostras de MBD estavam de acordo com MAFs determinados para amostras de Não MBD. MAFs entre MBD e nãoMBD mostram uma correlação linear para o PowerpoolVI com 15 ng de entrada input (Fig. 28A; 0-100%) e a um limite inferior de detecção (Fig. 28B; 0-5%). MAFs entre MBD e não MBD não se correlacionam bem abaixo do limite de detecção (Fig. 28C; 0- 0,5% de MAF). Similarmente, amostras de MBD e não MBD mostram acordo em MAFs com 150 ng de entrada de cfDNA (Fig. 29A e Fig. 29B) de PowerpoolVI , mas não existe um forte acordo na faixa de 0-0,5% (Fig. 29C).
[00408] Exemplo 20: Perfil de metilação de região promotora usando sequenciamento de genoma total [00409] Amostras moleculares divididas podem intensificar a análise de arquitetura de genoma tal como ocupação e detecção de DNA de célula livre de câncer. Por exemplo, eventos de hipermetilação de transcrição relevante podem ser detectados por levar a ocupação de fragmento de DNA de célula livre em conta quando da análise das regiões promotoras de genes de supressão de tumor que são usualmente direcionados por câncer via sllenciamento de gene acionado por metilação. Pode-se co~examinar o sinal de ocupação de fragmento de DNA de célula livre e fração hipermetilatada em divisões diferentes de MBD para validar a viabilidade de descoberta acionada por MBD de eventos de hipermetilação de transcrição relevantes e silenciamento de gene em amostras de câncer.
[00410] Conforme o exemplo ilustrativo, pode-se usar dados de código de gene publicamente disponíveis (v26lift37) para produzir percentagem de hipermetilatado (número de fragmentos em divisão hi
Petição 870190078052, de 12/08/2019, pág. 163/238
159/194 permetilatada/número total de fragmentos em todas as divisões de MBD) em regiões de TSS de todos genes de código de gene dentro do coorte disponível de adultos saudáveis não-malignos. O sinal de ocupação de fragmento de DNA de célula livre pode ser agregado através de um coorte de adultos saudáveis não-malignos. Todos TSSs podem ser depositados baseado na percentagem de fração hipermetilatada observada em ensaio de divisão de MBD. A ocupação de fragmento em coorte de WSG não-MBD em cada depósito pode ser examinada. A Fig. 23 mostra correlação de expressão de gene e estado de metilação. Mostrado é a ocupação de WGS no perfil do promotor versus a percentagem de metilação de MBD. Conforme visto na Fig. 23, DNA hipometilatado (0-0,1% hiper) tem baixa cobertura de ocupação de fragmento na vizinhança de TSS, enquanto que DNA hipermetilatado (10-50% hiper ou > 50% hiper) tem alta cobertura de ocupação de fragmento e NDR distinto na vizinhança de TSS. Em alguns casos, a cobertura de ocupação de fragmento de DNA hipometilatado é usada para normalizar profundidade de sequência e/ou mapeabilidade de sequências. A percentagem de fragmentos de ácido nucleico hipermetilatado ou hipometilatado pode ser determinada por divisão do número de fragmentos de célula livre hipermetilatados ou hlpometilatados pelo número total de fragmentos de DNA de célula livre observado através de todas as divisões.
[00411] Exemplo 21: Comparação entre os níveis de metilação nas amostras de MBD e as amostras de sequenciamento de bissulfito de genoma total (WGBS) [00412] Para avaliar os níveis de metilação dos fragmentos em várias divisões preparadas por uso do protocolo de MBD, uma amostra bem caracterizada, NA12878 (catalog.coriell.org/0/Sections/Search/Sample_Detail.aspx?Ref™GM12878), foi usada. A amostra foi dividida em porção hiper-, hipo- e intermediá
Petição 870190078052, de 12/08/2019, pág. 164/238
160/194 ria metilatada, seguido por recombinação das divisões in silico (amostra de MBD), conforme descrito no Exemplo 1. A amostra de MBD foi comparada a um conjunto de dados de metilação padrão publicamente disponível (basespaceJllumina.com/data central (HiSeq 4000: TruSeq DNA Methylation (NA12878, 1x151), que utiliza sequenciamento de bissulfito de genoma total (WGBS). WGBS interroga o estado de metilação de citosinas individuais. A Fig. 31 mostra a correlação do nível de metilação médio conforme medido por WGBS (eixo X) e MBD (eixo Y) em janelas de 160 bp. O nível de metilação de MDB foi computado por divisão do número de leituras na divisão hipermetilatada que cai naquela janela dividido pelo número total de leituras nas divisões hiper e hipo-metilatadas. O nível de metilação de WGBS foi computado por divisão do número de bases metilatadas pelo número de bases metilatadas e não-metilatadas na janela. Este experimento foi efetuado por várias proporções de esfera diferentes, que afetam a divisão de fragmentos metilatados. Poucas esferas restringem a divisão hipermetilatada a fragmentos altamente metilatados (isto é, torna o ensaio mais específico para metilação), e mais esferas diminuem a quantidade de metilação necessária para obter um fragmento na hiper divisão (isto é, toma o ensaio mais sensível à metilação). Empiricamente, a proporção de DNA de entrada: esferas de 1:50 foi verificada se correlacionar entre os fragmentos divididos e seus níveis de metilação. Estes resultados indicam que a divisão de MBD não reflete precisamente o estado de metilação subjacente das amostras.
[00413] Nesta análise, o efeito do número de locais de CG em um fragmento naquela divisão de fragmento foi determinado. Os fragmentos que são publicamente disponíveis com conjunto de dados de metilação padrão (NA12878; mesmo como na análise anterior) que indica altamente hiper- ou hipometilatado (nível de metilação de sequenciamento de bissulfito de genoma total >90% ou <10%, conforme calcula
Petição 870190078052, de 12/08/2019, pág. 165/238
161/194 do na análise prévia) foram selecionados para análise. Estes fragmentos foram estratificados pelo número de locais de CG que eles continham. Fragmentos altamente metilatados com 3 ou mais locais de CG terminam na divisão hipermetilatada, indicando que o ensaio é sensível à pequenas quantidades de metilação (FIG. 31A). Inversamente, fragmentos destituídos de metilação foram divididos predominantemente na divisão hipometilatada indiferente do número de locais de CG no fragmento, indicando que o ensaio tem um alto grau de especificidade (FIG. 31B).
[00414] Enquanto que concretizações preferidas da presente revelação foram mostradas e descritas aqui, será óbvio àqueles técnicos no assunto que tais concretizações são providas por meio de exemplo somente. Numerosas variações, mudanças, e substituições ocorrerão àqueles técnicos no assunto sem fugir da revelação. Deve ser compreendido que várias alternativas às concretizações da revelação aqui descritas podem ser empregadas na prática da revelação. É pretendido que as seguintes reivindicações definam o escopo da revelação, e que métodos e estruturas dentro do escopo destas reivindicações e suas equivalentes sejam, desse modo, cobertos.
[00415] ALGUMAS CONCRETIZAÇÕES DA INVENÇÃO.
[00416] Proporcionadas abaixo são algumas concretizações da invenção providas no formato de reivindicação de patente.
1. Um método de análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, o método, no qual cada das pelo menos duas formas compreende uma pluralidade de moléculas, compreendendo:
(a) ligar pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico de etiqueta para distinguir as formas entre si,
Petição 870190078052, de 12/08/2019, pág. 166/238
162/194 (b) amplificar as formas de ácido nucleico pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiqueta de ácido nucleico ligada, são amplificados, para produzir ácidos nucleicos amplificados, dos quais aqueles amplificados a partir de pelo menos uma forma são etiquetados;
(c) ensaiar dado de sequência dos ácidos nucleicos amplificados pelo menos alguns dos quais são etiquetados; no qual o ensaio obtém informação de sequência suficiente para decodificar as moléculas de ácido nucleico de etiqueta dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado.
1A. O método, de acordo com a reivindicação 1, compreendendo adicionalmente a etapa de decodificar as moléculas de ácido nucleico de etiqueta dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado.
2. O método, de acordo com a reivindicação 1, compreendendo adlcionalmente enriquecer pelo menos uma das formas relativas a uma ou mais das outras formas.
3. O método, de acordo com a reivindicação 1, no qual pelo menos 70% das moléculas de cada forma de ácido nucleico na população são amplificados na etapa (b).
4. O método, de acordo com a reivindicação 1, no qual pelo menos três formas de ácido nucleico estão presentes na população, e pelo menos duas das formas são ligadas a diferentes formas de
Petição 870190078052, de 12/08/2019, pág. 167/238
163/194 ácido nucleico de etiqueta que distinguem cada das três formas entre si.
5. O método, de acordo com a reivindicação 4, no qual cada das pelo menos três formas de ácido nucleico na população é ligada a uma etiqueta diferente.
6. O método, de acordo com a reivindicação 1, no qual cada molécula da mesma forma é ligada a uma etiqueta compreendendo a mesma identificação de informação de etiqueta.
7. O método, de acordo com a reivindicação 1, no qual moléculas da mesma forma são ligadas à tipos diferentes de etiquetas.
8. O método, de acordo com a reivindicação 1, no qual a etapa (a) compreendendo: submeter a população à transcrição reversa com um primer etiquetado, no qual o primer etiquetado é incorporado no cDNA gerado de RNA na população.
9. O método, de acordo com a reivindicação 8, no qual a transcrição reversa é específica de sequência.
10. O método, de acordo com a reivindicação 8, no qual a transcrição reversa é aleatória.
11. O método, de acordo com a reivindicação 8, compreendendo adicionalmente degradar RNA duplexado ao cDNA.
12. O método, de acordo com a reivindicação 4, compreendendo adicionalmente separar DNA de cadeia única de DNA de cadeia dupla, e ligar etiqueta de ácido nucleicos ao DNA de cadeia dupla.
13. O método, de acordo com a reivindicação 12, no qual o DNA de cadeia única é separado por hibridização a uma ou mais sondas de captura.
14. O método, de acordo com a reivindicação 4, compreendendo adicionalmente circularizar DNA de cadeia única com uma clrcligase, e ligar etiqueta de ácido nucleicos ao DNA de cadeia dupla.
Petição 870190078052, de 12/08/2019, pág. 168/238
164/194
15. O método, de acordo com a reivindicação 1, compreendendo, antes do ensaio, reunir ácidos nudeicos etiquetados compreendendo formas diferentes de ácido nucleico.
16. O método, de acordo com qualquer uma das reivindicações precedentes, no qual a população de ácido nucleico é de uma amostra de fluido corpóreo.
17. O método, de acordo com a reivindicação 16, no qual a amostra de fluido corpóreo é sangue, soro, ou plasma.
18. O método, de acordo com a reivindicação 1, no qual a população de ácido nucleico é uma população de ácido nucleico livre de célula.
19. O método, de acordo com a reivindicação 17, no qual a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer.
20. O método, de acordo com as reivindicações 1-19, no qual o dado de sequência indica presença de uma variante somática ou variante de linha germinal.
21. O método, de acordo com as reivindicações 1-20, no qual o dado de sequência indica presença de uma variação de número de cópia.
22. O método, de acordo com as reivindicações 1-21, no qual o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene.
23. Um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação, compreendendo:
contatar a população de ácido nucleico com um agente que preferencialmente se liga à ácidos nucleicos suportando a modificação,
Petição 870190078052, de 12/08/2019, pág. 169/238
165/194 separar uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos não-ligada ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação;
ligar os ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião para produzir uma população de ácidos nucleicos etiquetados;
amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas são amplificados;
ensaiar dado de sequência dos ácidos nucleicos amplificados e etiquetas ligadas; no qual o ensaio obtém dado de sequência para decodificação das etiquetas para revelar se os ácidos nucleicos para qual dado de sequência foi ensaiado foram amplificados de modelos na primeira ou na segunda reunião.
23A. O método, de acordo com a reivindicação 23, compreendendo a etapa de decodificar as etiquetas para revelar se os ácidos nucleicos para qual dado de sequência foi ensaiado foram amplificados de modelos na primeira ou na segunda reunião.
24. O método, de acordo com a reivindicação 23, no qual a modificação é ligação de ácidos nucleicos à uma proteína.
25. O método, de acordo com a reivindicação 23, no qual a proteína é uma histona ou fator de transcrição.
26. O método, de acordo com a reivindicação 23, no qual a modificação é uma modificação de pós-replicação à um nucleotideo.
27. O método, de acordo com a reivindicação 26, no qual a modificação de pós-replicação é 5-metil-citosina, e a extensão de
Petição 870190078052, de 12/08/2019, pág. 170/238
166/194 ligação do agente à ácidos nucleicos aumenta com a extensão de 5metll-citosinas no ácido nucleico.
28. O método, de acordo com a reivindicação 26, no qual a modificação de pós-replicação é 5-hidroximetil-citosina, e a extensão de ligação do agente à ácido nucleico aumenta com a extensão de 5hidroximetil-citosina no ácido nucleico.
29. O método, de acordo com a reivindicação 26, no qual a modificação de pós-replicação é 5-formil-citosina, ou 5-carboxilcitosina, e a extensão de ligação do agente aumenta com a extensão de 5-formil-citosina, ou 5-carboxil-citoslna no ácido nucleico.
30. O método, de acordo com a reivindicação 23, compreendendo adicionalmente lavagem dos ácidos nucleicos ligados ao agente, e coleta da lavagem como uma terceira reunião incluindo ácidos nucleicos com a modificação de pós replicação à uma extensão intermediária relativa às primeira e segunda reuniões.
31. O método, de acordo com a reivindicação 23, compreendendo, antes do ensaio, reunião dos ácidos nucleicos etiquetados a partir das primeira e segunda reuniões.
32. O método, de acordo com a reivindicação 23, no qual o agente é esferas magnéticas de domínio de ligação de 5-metil.
33. O método, de acordo com qualquer uma das reivindicações precedentes, no qual a população de ácido nucleico é de uma amostra de fluido corpóreo.
34. O método, de acordo com a reivindicação 33, no qual a amostra de fluido corpóreo é sangue, soro, ou plasma.
35. O método, de acordo com a reivindicação 23, no qual a população de ácido nucleico é uma população de ácido nucleico livre de célula.
Petição 870190078052, de 12/08/2019, pág. 171/238
167/194
36. O método, de acordo com a reivindicação 33, no qual a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer.
37. O método, de acordo com as reivindicações 23-36, no qual o dado de sequência indica presença de uma variante somática, ou variante de iinha germinal.
38. O método, de acordo com as reivindicações 23-37, no qual o dado de sequência indica presença de uma variação de número de cópia.
39. O método de qualquer 23-38, no qual o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene.
40. Um método de análise de uma população de ácido nucleico em que pelo menos alguns dos ácidos nucleicos incluem um ou mais resíduo de citosina modificados, compreendendo ligar frações de captura à ácidos nucleicos na população, cujos ácidos nucleicos servem como modelos para amplificação;
realizar uma reação de amplificação para produzir produtos de amplificação a partir dos modelos;
separar os modelos ligados para capturar etiquetas de produtos de amplificação;
ensaiar dado de sequência dos modelos ligados para capturar etiquetas por sequenciamento de bissulfito; e ensaiar dado de sequência dos produtos de amplificação.
41. O método, de acordo com a reivindicação 40, no qual as frações de captura compreendem biotina.
42. O método, de acordo com a reivindicação 41, no qual a separação é realizada por contato dos modelos com esferas de estreptavidina.
Petição 870190078052, de 12/08/2019, pág. 172/238
168/194
43. O método, de acordo com a reivindicação 40, no qual os resíduos de cítosina modificados são 5-metil-citosina, 5-hidroximetil citosina, 5-formil citosina, ou 5-carboxil citosina.
44. O método, de acordo com a reivindicação 40, no qual as frações de captura compreendem biotina ligada à etiquetas de ácido nucleico incluindo um ou mais resíduos modificados.
45. O método, de acordo com a reivindicação 40, no qual as frações de captura são ligadas ao ácido nucleico na população, via uma ligação clivável.
46. O método, de acordo com a reivindicação 45, no qual a ligação clivável é uma ligação fotoclivável.
47. O método, de acordo com a reivindicação 45, no qual a ligação clivável compreende um uracil nucleotídeo.
48. O método, de acordo com qualquer uma das reivindicações precedentes, no qual a população de ácido nucleico é de uma amostra de fluido corpóreo.
49. O método, de acordo com a reivindicação 48, no qual a amostra de fluido corpóreo é sangue, soro, ou plasma.
50. O método, de acordo com a reivindicação 40, no qual a população de ácido nucleico é uma população de ácido nucleico livre de célula.
51. O método, de acordo com a reivindicação 48, no qual a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer.
52. O método, de acordo com qualquer uma das reivindicações precedentes, no qual o dado de sequência indica presença de uma variante somática, ou variante de linha germinal.
53. O método, de acordo com qualquer uma das reivindicações precedentes, no qual o dado de sequência indica presença de uma variação de número de cópia.
Petição 870190078052, de 12/08/2019, pág. 173/238
169/194
54. O método, de acordo com qualquer uma das reivindicações precedentes, no qual o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene.
55. Um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de 5-metilação, compreendendo:
(a) contatar a população de ácido nucleico com um agente que preferencialmente se liga à 5~ácidos nucleicos metilatados;
(b) separar uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos nãoligada ao agente, no qual a primeira reunião de ácidos nucleicos são sobrerrepresentada para 5-metilação, e os ácidos nucleicos na segunda reunião são subrrepresentados para 5-metilação;
(c) ligar os ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião, no qual a etiqueta de ácido nucleicos ligada à ácidos nucleicos na primeira reunião compreende uma fração de captura (por exemplo, biotina);
(d) amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas são amplificados;
(e) separar ácidos nucleicos amplificados que suportam a fração de captura de ácidos nucleicos amplificados que não suportam a fração de captura; e (f) ensaiar dado de sequência dos ácidos nucleicos amplificados separados.
Petição 870190078052, de 12/08/2019, pág. 174/238
170/194
56. Um método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação, compreendendo:
contatar os ácidos nucleicos na população com adaptadores para produzir uma população de ácidos nucleicos flanqueados pelos adaptadores compreendendo locais de ligação de primer;
amplificar os ácidos nucleicos flanqueados por adaptadores iniciados a partir dos locais de ligação de primer;
contatar os ácidos nucleicos amplificados com um agente que preferencialmente se liga à ácidos nucleicos que suportam a modificação, separar uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos não-ligada ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação;
realizar amplificações paralelas de ácidos nucleicos etiquetados nas primeira e segunda reuniões;
ensaiar dado de sequência dos ácidos nucleicos amplificados nas primeira e segunda reuniões.
57. Um método de análise de uma população de ácido nucleico em que pelo menos alguns dos ácidos nucleicos incluem um ou mais resíduos de citosina modificados, compreendendo contatar a população de ácido nucleico com adaptadores compreendendo um local de ligação de primer compreendendo uma citosina modificada para formar ácidos nucleicos flanqueados por adaptadores;
Petição 870190078052, de 12/08/2019, pág. 175/238
171/194 amplificar os ácidos nucleicos flanqueados por adaptadores iniciados a partir dos locais de ligação de primer nos adaptadores que flanqueiam um ácido nucleico:
dividir os ácidos nucleicos amplificados em primeira e segunda alíquotas;
ensaiar dado de sequência nos ácidos nucleicos da primeira alíquota;
contatar os ácidos nucleicos da segunda alíquota com bissulfito, que converte C's não-modificados em U;
amplificar os ácidos nucleicos resultantes do tratamento com bissulfito iniciado a partir dos locais de ligação de primer que flanqueiam os ácidos nucleicos, no qual U's introduzidos por tratamento com bissulfito são convertidos a Ts, ensaiar dado de sequência nos ácidos nucleicos amplificados a partir da segunda alíquota;
comparar o dado de sequência dos ácidos nucleicos na primeira e segunda alíquotas para identificar quais nucleotídeos na população de ácido nucleico foram citosinas modificadas.
58. O método, de acordo com a reivindicação 56 ou 57, no qual os adaptadores são adaptadores de grampo de cabelo.
59. Um método, compreendendo:
(a) fracionar fisicamente moléculas de DNA de uma amostra humana para gerar duas ou mais divisões;
(b) aplicar etiquetas moleculares diferenciais e adaptadores de capacitação de NSG para cada das duas ou mais divisões para gerar divisões etiquetadas moleculares;
Petição 870190078052, de 12/08/2019, pág. 176/238
172/194 (c) ensaiar as divisões etiquetadas moleculares em um instrumento de NGS para gerar dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente divididas.
60. O método, de acordo com a reivindicação 59, compreendendo adicionalmente analisar o dado de sequência por desconvolução da amostra em moléculas que foram diferencialmente divididas.
61. O método, de acordo com a reivindicação 59, no qual as moléculas de DNAs são de plasma de sangue extraído.
62. O método, de acordo com a reivindicação 59, no qual o fracionamento físico compreende fracionamento de moléculas baseado em vários graus de metilação.
63. O método, de acordo com a reivindicação 61, no qual vários graus de metilação compreendem hipermetilação e hipometilação.
64. O método, de acordo com a reivindicação 59, no qual fracionamento físico compreende fracionamento com proteína de domínio de ligação de metil (“MBD”)~esferas para estratificar em vários graus de metilação.
65. O método, de acordo com a reivindicação 59, no qual as etiquetas moleculares diferenciais são conjuntos diferentes de etiquetas moleculares correspondentes a uma divisão de MBD.
66. O método, de acordo com a reivindicação 59, no qual o fracionamento físico compreende separar moléculas de DNA usando imunoprecipitação.
67. O método, de acordo com a reivindicação 59, compreendendo adicionalmente re-combinar duas ou mais frações etiquetadas moleculares das frações etiquetadas moleculares geradas.
68. O método, de acordo com a reivindicação 66, compreendendo adicionalmente enriquecer as frações etiquetadas moleculares recombinadas ou grupos.
Petição 870190078052, de 12/08/2019, pág. 177/238
173/194
69. Um método para identificação de etiqueta molecular de MBD-bibliotecas fracionadas de esfera através de NGS, compreendendo:
(a) fracionamento físico de uma amostra de DNA extraída usando um kit de purificação de proteína de domínio de ligação de metil-esfera, economizando todas as eluições para processamento á jusante;
(b) aplicação paralela de etiquetas moleculares diferenciais e sequências de adaptador de capacitação de NSG para cada fração ou grupo;
(c) re-combinar todas as frações etiquetadas moleculares ou grupos, e subsequente amplificação usando sequências de primer de DNA específica de adaptador;
(d) enriquecimento/hibridização de bibliotecas totais recombinadas e amplificadas, etiquetando regiões genômicas de interesse;
(e) re-amplificação da biblioteca de DNA total enriquecido, anexando uma etiqueta de amostra;
(f) reunião de amostras diferentes, e ensaiando as mesmas em multiplex em um instrumento de NGS; no qual dado de sequência de NGS produzido pelo instrumento proporciona sequência das etiquetas moleculares sendo usadas para identificar moléculas únicas, e dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente MBD divididas.
69A. O método, de acordo com a reivindicação 69, compreendendo realizar análise de dados de NGS, com as etiquetas moleculares sendo usadas para identificar moléculas únicas, bem como des
Petição 870190078052, de 12/08/2019, pág. 178/238
174/194 convoluçâo da amostra em moléculas que foram diferencialmente MBD divididass.
70. Um método, compreendendo:
(a) proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo;
(b) fracionar a população de moléculas de ácido nucleico baseada em uma ou mais características para gerar uma pluralidade de grupos de moléculas de ácido nucleico, (c) etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características;
(d) sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; contendo dados suficientes para gerar informação relativa sobre posicionamento de nucleossomo, modificação de nucleossomo, ou ligação de DNA-interação de proteína para cada da pluralidade de grupos de moléculas de ácido nucleico.
70A O método, de acordo com a reivindicação 70, compreendendo adicionalmente analisar as leituras de sequência para gerar informação relativa sobre posicionamento de nucleossomo, modificação de nucleossomo, ou ligação de DNA-interação de proteína para cada da pluralidade de grupos de moléculas de ácido nucleico.
71. Um método, compreendendo:
(a) proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo;
(b) fracionar a população de moléculas de ácido nucleico baseado no estado de metilação para gerar uma pluralidade de grupos de moléculas de ácido nucleico;
Petição 870190078052, de 12/08/2019, pág. 179/238
175/194 (c) etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características;
(d) sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; no qual as leituras de sequenciamento são suficientes para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou uma interação de proteína de DNA.
A. O método, de acordo com a reivindicação 71, compreendendo analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou uma interação de proteína de DNA.
72. Um método, compreendendo:
proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo;
(a) fracionar a população de moléculas de ácido nucleico para gerar a pluralidade de grupos de moléculas de ácido nucleico compreendendo ácidos nucleicos de célula livre ligados à proteína;
(b) etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características;
(c) sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; no qual a informação de sequência obtida é suficiente para mapear as leituras de sequência
Petição 870190078052, de 12/08/2019, pág. 180/238
176/194 em um ou mais locais em uma sequência de referência; e para analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é Indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou uma interação de proteína de DNA.
72A. O método, de acordo com a reivindicação 72, compreendendo adicionalmente mapear as leituras de sequência em um ou mais locais em uma sequência de referência; e analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características é indicativa de posicionamento de nucleossomo, modificação de nucleossomo, ou uma interação de proteína de DNA.
73. Um método, compreendendo:
proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo;
(a) fracionar a população de moléculas de ácido nucleico baseado em uma ou mais características para gerar a pluralidade de grupos de moléculas de ácido nucleico;
(b) etiquetar diferencialmente moléculas de ácido nucleico na pluralidade de grupos para distinguir as moléculas de ácido nucleico em cada da pluralidade de grupos entre si baseado na uma ou mais características;
(c) sequenciar a pluralidade de grupos de moléculas de ácido nucleico para gerar leituras de sequência; no qual a informação de sequência obtida é suficiente para mapear as leituras de sequência em um ou mais locais em uma sequência de referência; e analisar as leituras de sequências para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características não são capazes
Petição 870190078052, de 12/08/2019, pág. 181/238
177/194 de detecção em uma reunião de leituras de sequência a partir da pluralidade de grupos.
73A. O método, de acordo com as reivindicações 73, compreendendo adicionalmente mapear as leituras de sequência em um ou mais locais em uma sequência de referência; e analisar as leituras de sequência para detectar uma ou mais características em uma da pluralidade de grupos de moléculas de ácido nucleico, no qual a uma ou mais características não são capazes de detecção em uma reunião de leituras de sequência a partir da pluralidade de grupos.
74. O método, de acordo com qualquer uma das reivindicações 70-72, no qual a uma ou mais características compreende uma característica quantitativa das leituras mapeadas.
75. O método, de acordo com qualquer uma das reivindicações 69-73, no qual o fracionamento compreende fracionamento físico.
76. O método, de acordo com a reivindicação 69 ou 72, no qual a população de moléculas de ácido nucleico é dividida baseado em uma ou mais características selecionadas a partir do grupo consistindo de: estado de metilação, estado de glicosilação, modificação de histona, comprimento e posição de partida/parada.
77. O método, de acordo com qualquer uma das reivindicações 69-72, compreendendo adicionalmente reunir as moléculas de ácido nucleico de (b).
78. O método, de acordo com a reivindicação 69 ou 72, no qual a uma ou mais características é metilação.
79. O método, de acordo com a reivindicação 77, no qual fracionamento compreende separar ácidos nucleicos metilatados de ácidos nucleicos não-metilatados usando proteínas compreendendo um domínio de ligação de metil para gerar grupos de moléculas de ácido nucleico compreendendo graus variantes de metilação.
Petição 870190078052, de 12/08/2019, pág. 182/238
178/194
80. O método, de acordo com a reivindicação 78, no qual um dos grupos compreende DNA hipermetilatado.
81. O método, de acordo com a reivindicação 78, no qual pelo menos um grupo é caracterizado por um grau de metilação.
82. O método, de acordo com a reivindicação 72, no qual fracionamento compreende separar moléculas de DNA de cadeia única e/ou moléculas de DNA de cadeia dupla.
83. O método, de acordo com a reivindicação 81, no qual as moléculas de DNA de cadeia dupla são separadas usando adaptadores de grampo de cabelo.
84. O método, de acordo com a reivindicação 69 ou 72, no qual fracionamento compreende isolar ácidos nudeicos ligados por proteína.
85. O método, de acordo com qualquer uma das reivindicações 69-72, no qual fracionamento compreende fracionamento baseado em uma diferença em um perfil mono-nudeossomal.
86. O método, de acordo com qualquer uma das reivindicações 69-72, no qual fracionamento é capaz de gerar perfis mononucleossomais diferentes para pelo menos um grupo de moléculas de ácido nucleico quando comparados a um normal.
87. O método, de acordo com a reivindicação 85, no qual o isolamento compreende imunoprecipitação.
88. O método, de acordo com qualquer uma das reivindicações 69-72, compreendendo adicionalmente fracionar pelo menos um grupo de moléculas de ácido nucleico baseado em uma característica diferente.
89. O método, de acordo com qualquer uma das reivindicações 69-72, no qual a análise compreende, em um ou mais locais, comparar uma primeira característica correspondente a um primeiro
Petição 870190078052, de 12/08/2019, pág. 183/238
179/194 grupo de moléculas de ácido nucleico à uma segunda característica correspondente a um segundo grupo de moléculas de ácido nucleico.
90. O método, de acordo com qualquer uma das reivindicações 70-72, no qual a análise compreende analisar uma característica da uma ou mais características em um grupo relativo a uma amostra normal em um ou mais locais.
91. O método, de acordo com qualquer uma das reivindicações 70-72, no qual a uma ou mais características são selecionadas a partir do grupo consistindo de: uma frequência denominada de base em uma porção de base na sequência de referência, um número de moléculas que mapeiam para uma base ou sequência na sequência de referência, um número de moléculas tendo um local de partida que mapeia para uma porção de base na sequência de referência, e um número de moléculas tendo um local de parada que mapeia para uma porção de base na sequência de referência, e um comprimento de uma molécula que mapeia a um local na sequência de referência.
92. O método, de acordo com qualquer uma das reivindicações 70-72, compreendendo adicionalmente (f) usar um classificador treinado para classificar o Indivíduo baseado na uma ou mais características.
93. O método, de acordo com a reivindicação 91, no qual o classificador treinado classifica a uma ou mais características conforme associadas com um tecido no indivíduo.
94. O método, de acordo com a reivindicação 91, no qual o classificador treinado classifica a uma ou mais características conforme associadas com um tipo de câncer no indivíduo.
95. O método, de acordo com as reivindicações 70-72, no qual a uma ou mais características são indicativas de expressão de gene ou estado de uma doença.
Petição 870190078052, de 12/08/2019, pág. 184/238
180/194
96. O método, de acordo com qualquer uma das reivindicações 69-72, no qual as moléculas de ácido nucleico estão circulando o DNA do tumor.
97. O método, de acordo com qualquer uma das reivindicações 69-72, no qual as moléculas de ácido nucleico são DNA de célula livre (“cfDNA”).
98. O método, de acordo com qualquer uma das reivindicações 69-71, no qual a uma ou mais características é um marcador de câncer.
99. O método, de acordo com qualquer uma das reivindicações 69-72, no qual as etiquetas são usadas para distinguir moléculas diferentes na mesma amostra.
100. Um método, compreendendo:
(a) proporcionar uma população de moléculas de ácido nucleico obtidas de uma amostra corpórea de um indivíduo;
(b) fracionar a população de moléculas de ácido nucleico baseado em uma ou mais características para gerar pluralidade de grupos de moléculas de ácido nucleico, no qual as moléculas de ácido nucleico de cada da pluralidade de grupos compreendem identificadores distintos;
(c) reunir a pluralidade de grupos de moléculas de ácido nucleico;
(d) sequenciar a pluralidade de grupos reunida de moléculas de ácido nucleico para gerar pluralidade de conjuntos de leituras de sequência; e (e) fracionar as leituras de sequência baseado nos identificadores.
101. Uma composição, compreendendo uma reunião de moléculas de ácido nucleico compreendendo moléculas de ácido nucleico diferentemente etiquetadas, no qual a reunião compreende uma
Petição 870190078052, de 12/08/2019, pág. 185/238
181/194 pluralidade de conjuntos de moléculas de ácido nucleico que são diferentemente etiquetadas baseado em uma ou mais características selecionadas a partir do grupo consistindo de: estado de metilação, estado de glicosilação, modificação de histona, comprimento e posição de partida/parada, no qual a reunião é derivada de uma amostra biológica.
102. A composição, de acordo com a reivindicação 101, no qual a pluralidade de conjuntos é qualquer de 2, 3, 4, 5 ou mais do que
5.
103. Um método, compreendendo:
(a) fracionar uma população de moléculas de ácido nucleico em uma pluralidade de grupos, a pluralidade de grupos compreendendo ácidos nucleicos que diferem por uma característica;
(b) etiquetamento dos ácidos nucleicos em cada da pluralidade de grupos com um conjunto de etiquetas que distinguem os ácidos nucleicos em cada da pluralidade de grupos para produzir uma população de ácidos nucleicos etiquetados, no qual cada dos ácidos nucleicos etiquetados compreende uma ou mais etiquetas;
(c) sequenciamento da população de ácidos nucleicos etiquetados para gerar leituras de sequência, no qual as leituras de sequência permitem uso da uma ou mais etiquetas para agrupar cada grupo de leituras de sequência; e analisar as leituras de sequência para detectar um sinal em pelo menos um dos grupos relativos a uma amostra normal ou um classificador.
103A. O método, de acordo com a reivindicação 103, compreendendo adicionalmente usar a uma ou mais etiquetas para agrupar cada grupo de leituras de sequência; e analisar as leituras de sequência para detectar um signal em pelo menos um dos grupos relativos a uma amostra normal ou um classificador.
Petição 870190078052, de 12/08/2019, pág. 186/238
182/194
104. O método, de acordo com a reivindicação 102, compreendendo adicionalmente normalizar o sinal em pelo menos um dos grupos contra outro grupo, ou uma sequência de genoma total.
105. Um método compreendendo:
i. proporcionar uma população de DNA de célula livre de uma amostra biológica:
ii. fracionar a população de DNA de célula livre baseado em uma característica que está presente em níveis diferentes em DNA de célula livre derivado de células cancerosas comparados a células não-cancerosas, gerando, desse modo, subpopulações de DNA de célula livre;
iii. amplificar pelo menos uma das subpopulações de DNA de célula livre; e iv. sequenciar pelo menos uma das subpopulações amplificadas de DNA de célula livre.
106. O método, de acordo com a reivindicação 104, no qual
a característica é:
i. il. iii. o nível de metilação do DNA de célula livre; o nível de glicosilação do DNA de célula livre; o comprimento dos fragmentos de DNA de célula livre;
ou
iv. a presença de quebras de cadeia única no DNA de cé-
lula livre.
107. Um método, compreendendo:
I. proporcionar uma população de DNA de célula livre de uma amostra biológica;
ii. fracionar a população de DNA de célula livre baseado no nível de metilação do DNA de célula livre, desse modo, gerando subpopulações de DNA de célula livre;
Petição 870190078052, de 12/08/2019, pág. 187/238
183/194 íií. amplificar pelo menos uma das subpopulações de DNA de célula livre; e iv. sequenciar pelo menos uma das subpopulações amplificadas de DNA de célula livre.
108. Um método para determinar o estado de metilação de DNA de célula livre compreendendo:
i. proporcionar uma população de DNA de célula livre de uma amostra biológica;
ii. fracionar a população de DNA de célula livre baseado no nível de metilaçâo de DNA de célula livre, desse modo, gerando subpopulações de DNA de célula livre;
m. sequenciar pelo menos uma subpopulação de DNA de célula livre, desse modo, gerando leituras de sequência:
iv. atribuir um estado de metilaçâo a cada DNA de célula livre dependendo da subpopulação das correspondentes leituras de sequência que ocorre.
109. Um método de classificação de um indivíduo no qual o método compreende:
i. proporcionar uma população de DNA de célula livre de uma amostra biológica a partir do indivíduo;
ii. fracionar a população de DNA de célula livre baseado no nível de metilaçâo do DNA de célula livre, gerando, desse modo, subpopulações de DNA de célula livre;
iii. sequenciar as subpopulações de DNA de célula livre, gerando, desse modo, leituras de sequência; e iv. usar um classificador treinado para classificar o indivíduo, dependendo de quais leituras de sequência ocorrem na subpopulação.
Petição 870190078052, de 12/08/2019, pág. 188/238
184/194
110. Um método para analisar o padrão de fragmentação de DNA de célula livre compreendendo:
i. proporcionar uma população de DNA de célula livre de uma amostra biológica;
ii. fracionar a população de DNA de célula livre, gerando, desse modo, subpopulações de DNA de célula livre;
iii. sequenciar pelo menos uma subpopulação de DNA de célula livre, gerando, desse modo, leituras de sequência;
iv. alinhar as leituras de sequência a um genoma de referência; e
v. determinar o padrão de fragmentação do DNA de célula livre em cada subpopulação por análise de qualquer número do:
a. comprimento de cada leitura de sequência que mapeia para cada porção de base no genoma de referência;
b. número de leituras de sequência que mapeiam para a porção de base no genoma de referência como uma função de comprimento das leituras de sequência;
c. número de leituras de sequência que começam em cada porção de base no genoma de referência; ou
d. número de leituras de sequência que terminam em cada porção de base no genoma de referência.
111.0 método, de acordo com a reivindicação 109, no qual a população de DNA de célula livre é fracionada por uma ou mais características que proporciona uma diferença no sinal entre estados saudáveis e adoentados.
112. O método, de acordo com a reivindicação 110, no qual a uma ou mais características compreendem uma modificação química selecionada a partir do grupo consistindo de: metilação, hidroximetilação, formilação, acetilação, e glicosilação.
Petição 870190078052, de 12/08/2019, pág. 189/238
185/194
113. O método, de acordo com qualquer uma das reivindicações precedentes, no qual uma proporção de DNA:esfera é 1:100.
114. O método, de acordo com qualquer uma das reivindicações precedentes, no qual a proporção de DNA:esfera é 1:50
115. O método, de acordo com qualquer uma das reivindicações precedentes, no qual a proporção de DNA:esfera é 1:20
116. O método, de acordo com a reivindicação 109, no qual a população de DNA de célula livre é fracionado baseado no nível de metilação do DNA de célula livre.
117. O método, de acordo com a reivindicação 109, no qual a determinação do padrão de fragmentação do DNA de célula livre adicionalmente compreende analisar o número de leituras de sequência que mapeiam para cada porção de base no genoma de referência.
118. O método, de acordo com a reivindicação 109, compreendendo adicionalmente determinar o padrão de fragmentação do DNA de célula livre em cada subpopulação por análise do número de leituras de sequência que mapeiam para cada porção de base no genoma de referência.
119. O uso de fracionamento físico baseado no grau de metilação de DNA durante análise de DNA de tumor circulante (ctDNA) para determinar expressão de gene ou estado de doença.
120. O uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA durante análise de ctDNA.
121. O uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA.
122. O uso de uma característica que proporciona uma diferença em sinal entre um estado normal e um estado adoentado para
Petição 870190078052, de 12/08/2019, pág. 190/238
186/194 dividir fisicamente ctDNA antes do sequenciamento e opcional análise à jusante.
123. O uso de uma característica que proporciona uma diferença em sinal entre um estado normal e estado adoentado para dividir fisicamente ctDNA para rotulação/etiquetamento diferencial.
124. O uso de fracionamento baseado em um padrão de fragmentação diferencial durante análise de ctDNA.
125. O uso de um padrão de fragmentação diferencial para divisão de ctDNA.
126. O uso de um padrão de fragmentação diferencial para divisão de ctDNA antes do sequenciamento e opcional análise à jusante.
127. O uso de um padrão de fragmentação diferencial para divisão de ctDNA para rotulação/etiquetamento diferencial.
128. O uso de acordo com as reivindicações 123-126, no qual o padrão de fragmentação diferencial é indicativo de expressão de gene ou estado de doença.
129. O uso de acordo com as reivindicações 123-126, no qual o padrão de fragmentação diferencial é caracterizado por uma ou mais diferenças relativas a uma normal selecionada a partir do grupo consistindo de:
(a) comprimento de cada leitura de sequência que mapeia para cada porção de base no genoma de referência;
(b) número de leituras de sequência que mapeiam para a porção de base no genoma de referência como uma função de comprimento das leituras de sequência;
(c) número de leituras de sequência que começam em cada porção de base no genoma de referência; e
Petição 870190078052, de 12/08/2019, pág. 191/238
187/194 (d) número de leituras de sequência que terminam em cada porção de base no genoma de referência.
130. Uso de etiquetação molecular diferencial de moléculas de DNA divididas por domínio de ligação molecular (MBD)-esferas para estratificarem vários graus de metilação de DNA, que são em seguida quantificados por sequenciamento de próxima geração (NGS).
131. Um método de análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, o método, no qual cada das pelo menos duas formas compreende uma pluralidade de moléculas, compreendendo:
(a) ligar pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico de etiqueta para distinguir as formas entre si, (b) amplificar as formas de ácido nucleico, pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiqueta de ácido nucleico ligada, são amplificados, para produzir ácidos nucleicos amplificados, dos quais aqueles amplificados a partir de pelo menos uma forma são etiquetados;
(c) sequenciamento de uma pluralidade do ácido nucleico amplificado que foi ligado às etiquetas, no qual o dado de sequência é suficiente para ser codificado para real as formas dos ácidos nucleicos na população antes da ligação à pelo menos uma etiqueta.
132. Uma reunião de moléculas de ácido nucleico etiquetadas, cada molécula de ácido nucleico na reunião compreendendo uma etiqueta molecular selecionada de uma de uma pluralidade de conjuntos de etiqueta, cada conjunto de etiqueta compreendendo uma pluralidade de etiquetas diferentes, no qual as etiquetas em qualquer um
Petição 870190078052, de 12/08/2019, pág. 192/238
188/194 conjunto são distintas das etiquetas em qualquer outro conjunto, e no qual cada conjunto de etiqueta contém informação (I) indicando uma característica da molécula a qual ela é fixada, ou da molécula de origem da qual a molécula é derivada e (ii) que, sozinha ou em combinação com informação da molécula a qual ela é fixada, unicamente distingue a molécula a qual ela é fixada de outras moléculas etiquetadas com etiquetas do mesmo conjunto de etiqueta.
133. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 132, no qual a etiqueta molecular compreende um ou uma pluralidade de códigos de barras de ácido nucleico.
134. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 133, no qual a etiqueta molecular compreende dois códigos de barras de ácido nucleico, fixados em extremidades opostas da molécula.
135. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 134, no qual uma combinação de qualquer dois códigos de barras em um conjunto tem sequências combinadas diferentes do que uma combinação de qualquer dois códigos de barras em qualquer outro conjunto.
136. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 133, no qual os códigos de barras são entre 10 e 30 nucleotídeos de comprimento.
137. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 132, no qual cada conjunto de etiqueta compreende uma pluralidade de etiquetas diferentes suficientes para unicamente moléculas alvos etiquetadas pelo conjunto de etiqueta, e tendo as mesmas coordenadas de Início-parada, ou tendo a mesma sequência de nucleotídeo, ou mapeando para a mesma coordenada genômica.
Petição 870190078052, de 12/08/2019, pág. 193/238
189/194
138. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 132, no qual a pluralidade de conjuntos de etiqueta é 2, 3, 4, 5, 6 ou mais do que 6.
139. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 132, no qual a reunião compreende moléculas tendo sequências etiquetadas de DNA com etiquetas de um conjunto de etiqueta, e moléculas tendo sequências etiquetadas de cDNA com etiquetas de outro conjunto de etiqueta.
140. A reunião de moléculas de ácido nucleico etiquetadas, de acordo com a reivindicação 132, no qual as características das moléculas indicadas pelo conjunto de etiquetas inclui um ou mais de: DNA, RNA, cadeia única, cadeia dupla, metilatado, não-metilatado, extensão de metilação, ou combinações dos antes mencionados.
141. Um sistema compreendendo:
um sequenciador de ácido nucleico;
um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e uma ligação de dados comunicativamente conectando o sequenciador de ácido nucleico e o dispositivo de processamento digital;
no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação para analisar uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de: DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, cada das pelo menos duas formas compreendendo uma pluralidade de moléculas, a aplicação compreendendo:
Petição 870190078052, de 12/08/2019, pág. 194/238
190/194 um módulo de software recebendo dado de sequência a partir do sequenciador de ácido nucleico, via a ligação de dados, o dado de sequência de ácidos nucleicos amplificados pelo menos algumns dos quais são etiquetados, o dado de sequência gerado por ligação de pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico etiquetado para distinguir as formas entre si, amplificando as formas de ácido nucleico pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nucleicos e etiquetas de ácido nucleico ligadas são amplificados para produzir ácidos nucleicos amplificados dos quais aqueles amplificados da pelo menos uma forma são etiquetados; e um módulo de software que ensaia o dado de sequência dos ácidos nucleicos amplificados por obtenção de informação de sequência suficiente para decodificar as moléculas de ácido nucleico etiquetadas dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população que proporciona um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado.
142. O sistema, de acordo com a reivindicação 141, no qual a aplicação adicionalmente compreende um módulo de software que decodifica as moléculas de ácido nucleico etiquetadas dos ácidos nucleicos amplificados para revelar as formas de ácidos nucleicos na população proporcionando um modelo original para os ácidos nucleicos amplificados ligados às moléculas de ácido nucleico de etiqueta para qual dado de sequência foi ensaiado.
143. O sistema, de acordo com a reivindicação 141, no qual a aplicação adicionalmente compreende um módulo de software que transmite um resultado do ensaio, via uma rede de comunicações.
144. Um sistema compreendendo:
Petição 870190078052, de 12/08/2019, pág. 195/238
191/194 um instrumento de sequenciamento de próxima geração (NGS);
um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memária; e uma ligação de dados comunicativamente conectando o instrumento de NGS e o dispositivo de processamento digital:
no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação compreendendo:
um módulo de software para receber dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado pelo fracionamento fisicamente de moléculas de DNA de uma amostra humana para gerar duas ou mais divisões, aplicando etiquetas moleculares diferenciais e adaptadores de capacitação de NSG a cada das duas ou mais divisões para gerar divisões etiquetadas moleculares, e ensaio das divisões etiquetadas moleculares com o instrumento de NGS;
um módulo de software para geração de dado de sequência para desconvolução da amostra em moléculas que foram diferencialmente divididas; e um módulo de software para análise do dado de sequência por desconvolução da amostra em moléculas que foram diferencialmente divididas.
145. O sistema, de acordo com a reivindicação 144, no qual a aplicação adicionalmente compreende um módulo de software que transmite um resultado do ensaio, via uma rede de comunicações.
146. Um sistema compreendendo:
Petição 870190078052, de 12/08/2019, pág. 196/238
192/194 um instrumento de sequenciamento de próxima geração (NGS);
um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e uma ligação de dados comunicativamente conectando o instrumento de NGS e o dispositivo de processamento digital;
no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis por o pelo menos um processador para criar uma aplicação para identificação de etiqueta molecular de MBD-bibliotecas fracionadas de esfera compreendendo:
um módulo de software configurado para receber dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado por fracionamento fisicamente de uma amostra de DNA extraída usando um kit de proteína de domínio de ligação de metil-purificação de esfera, economizando todas as eluições para processamento à jusante; condução de aplicação paralela de etiquetas moleculares diferenciais e sequências de adaptador de capacitação de NSG para cada fração ou grupo; re~combinação de todas frações etiquetadas moleculares ou grupos, e subsequente amplificação usando sequências de primer de DNA específica de adaptador; condução de enriquecimento/hibridização de bibliotecas totais recombinadas e amplificadas, etiquetação de regiões genômicas de interesse; re-amplificação da biblioteca de DNA total enriquecida, anexação de um etiqueta de amostra; reunião de amostras diferentes; e ensaio das mesmas em multiplex no instrumento de NGS; no qual dado de sequência de NGS produzido pelo Instrumento proporciona sequência das etiquetas moleculares sendo usadas para identificar mo
Petição 870190078052, de 12/08/2019, pág. 197/238
193/194 léculas únicas, e dado de sequência para desconvolução da amostra nas moléculas que foram diferencialmente MBD divididas; e um módulo de software configurado para realizar análise do dado de sequência por uso das etiquetas moleculares para identificar moléculas únicas, e desconvolução da amostra em moléculas que foram diferencialmente MBD divididas.
147. O sistema, de acordo com a reivindicação 146, no qual a aplicação adicionalmente compreende um módulo de software configurado para transmitir um resultado da análise, via uma rede de comunicações.
148. Um sistema compreendendo:
a) um instrumemto de sequenciamento de próxima geração (NGS)
b) um dispositivo de processamento digital compreendendo pelo menos um processador, um sistema de operação configurado para realizar instruções executáveis, e uma memória; e
c) uma ligação de dados comunicativamente conectando o instrumento de NGS e o dispositivo de processamento digital;
no qual o dispositivo de processamento digital adicionalmente compreende instruções executáveis para criar uma aplicação compreendendo:
i) um módulo de software para recebimento de dado de sequência a partir do instrumento de NGS, via a ligação de dados, o dado de sequência gerado carregado com ácidos nucleicos etiquetados preparados por contato da população de ácido nucleico com um agente que preferencialmente se liga à ácidos nucleicos suportando a modificação, separação de uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos nãoligada ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segun
Petição 870190078052, de 12/08/2019, pág. 198/238
194/194 da reunião são subrrepresentados para a modificação; ligação dos ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucieicos na primeira reunião e na segunda reunião para produzir uma população de ácidos nucleicos etiquetados; amplificação dos ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas iigadas são amplificados; e ensaio das divisões etiquetadas moleculares com o instrumento de NGS;
ii) um módulo de software para geração de dado de sequência para decodificação da etiqueta; e iii) um módulo de software para análise do dado de sequência para decodificar as etiquetas para revelar se os ácidos nucleicos para qual dado de sequência foi ensaiado foram amplificados de modelos na primeira ou na segunda reunião.
149. O sistema, de acordo com a reivindicação 148, compreendendo adicionalmente um módulo de software que transmite um resultado do ensaio, via uma rede de comuncações.

Claims (41)

  1. REIVINDICAÇÕES
    1. Método de análise de uma população de ácido nucleico compreendendo pelo menos duas formas de ácido nucleico selecionadas de DNA de cadeia dupla, DNA de cadeia única, e RNA de cadeia única, o método, no qual cada das pelo menos duas formas compreende uma pluralidade de moléculas, caracterizado pelo fato de compreender:
    (a) ligação de pelo menos uma das formas de ácido nucleico com pelo menos um ácido nucleico de etiqueta para distinguir as formas entre si, (b) amplificar as formas de ácido nucleico, pelo menos uma das quais é ligada a pelo menos uma etiqueta de ácido nucleico, no qual os ácidos nudeicos e etiqueta de ácido nucleico ligada, são amplificados, para produzir ácidos nudeicos amplificados, dos quais aqueles amplificados a partir da pelo menos uma forma são etiquetados;
    (c) ensaiar dado de sequência dos ácidos nudeicos amplificados, pelo menos alguns dos quais são etiquetados; no qual o ensaio obtém informação de sequência suficiente para decodificar as moléculas de ácido nucleico de etiqueta dos ácidos nudeicos amplificados para revelar as formas de ácidos nudeicos na população, proporcionando um modelo original para os ácidos nudeicos amplificados ligados a moléculas de ácido nucleico de etiqueta para qual dados de sequência foram ensaiados.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de compreender adicionalmente a etapa de decodificar as moléculas de ácido nucleico de etiqueta dos ácidos nudeicos amplificados para revelar as formas de ácidos nudeicos na população que proporciona um modelo original para os ácidos nudeicos amplificados
    Petição 870190057556, de 21/06/2019, pág. 12/49
    2/7 ligados às moléculas de ácido nucleico de etiqueta para quais dados de sequência foram ensaiados.
  3. 3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de compreender adicionalmente enriquecer pelo menos uma das formas relativas a uma ou mais das outras formas.
  4. 4. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que pelo menos 70% das moléculas de cada forma de ácido nucleico na população são amplificadas na etapa (b).
  5. 5. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que pelo menos três formas de ácido nucleico estão presentes na população, e pelo menos duas das formas são ligadas a formas de ácido nucleico de etiqueta diferentes que distinguem cada das três formas entre si.
  6. 6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que cada das pelo menos três formas de ácido nucleico na população é ligada a uma etiqueta diferente.
  7. 7. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que cada molécula da mesma forma é ligada a uma etiqueta compreendendo a mesma etiqueta de identificação.
  8. 8. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que moléculas da mesma forma são ligadas a tipos diferentes de etiquetas.
  9. 9. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a etapa (a) compreende: submeter a população à transcrição reversa com um primer etiquetado, no qual o primer etiquetado é incorporado no cDNA gerado de RNA na população.
  10. 10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que a transcrição reversa é específica de sequência.
  11. 11. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que a transcrição reversa é aleatória.
    Petição 870190057556, de 21/06/2019, pág. 13/49
    3/7
  12. 12. Método, de acordo com a reivindicação 9, caracterizado pelo fato de compreender adicionalmente degradar RNA duplexado ao cDNA.
  13. 13. Método, de acordo com a reivindicação 5, caracterizado pelo fato de compreender adicionalmente separar o DNA de cadeia única do DNA de cadeia dupla, e ligar a etiqueta de ácido nucleicos ao DNA de cadeia dupla.
  14. 14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que o DNA de cadeia única é separado por hibridização a uma ou mais sondas de captura.
  15. 15. Método, de acordo com a reivindicação 5, caracterizado pelo fato de compreender adicionalmente circularizar o DNA de cadeia única com uma circligase, e ligar etiquetas de ácido nucleico ao DNA de cadeia dupla.
  16. 16. Método, de acordo com a reivindicação 1, caracterizado pelo fato de compreender, antes do ensaio, reunir ácidos nucleicos etiquetados compreendendo formas diferentes de ácido nucleico.
  17. 17. Método, de acordo com a reivindicações 1-16, caracterizado pelo fato de que a população de ácido nucleico é de uma amostra de fluido corpóreo.
  18. 18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que a amostra de fluido corpóreo é sangue, soro, ou plasma.
  19. 19. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a população de ácido nucleico é uma população de ácido nucleico livre de célula.
  20. 20. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer.
    Petição 870190057556, de 21/06/2019, pág. 14/49
    4/7
  21. 21. Método, de acordo com as reivindicações 1-20, caracterizado pelo fato de que o dado de sequência indica presença de uma variante somática ou variante de linha germinal.
  22. 22. Método, de acordo com as reivindicações 1-21, caracterizado pelo fato de que o dado de sequência indica presença de uma variação de número de cópia.
  23. 23. Método, de acordo com as reivindicações 1-22, caracterizado pelo fato de que o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene.
  24. 24. Método de análise de uma população de ácido nucleico compreendendo ácidos nucleicos com extensões diferentes de modificação, caracterizado pelo fato de compreender:
    contatar a população de ácido nucleico com um agente que preferencialmente se liga aos ácidos nucleicos que suportam modificação, separar uma primeira reunião de ácidos nucleicos ligada ao agente de uma segunda reunião de ácidos nucleicos não-ligada ao agente, no qual a primeira reunião de ácidos nucleicos é sobrerrepresentada para a modificação, e os ácidos nucleicos na segunda reunião são subrrepresentados para a modificação;
    ligar os ácidos nucleicos na primeira reunião e/ou segunda reunião a uma ou mais etiquetas de ácido nucleico que distinguem os ácidos nucleicos na primeira reunião e na segunda reunião para produzir uma população de ácidos nucleicos etiquetados;
    amplificar os ácidos nucleicos etiquetados, no qual os ácidos nucleicos e as etiquetas ligadas são amplificados;
    ensaiar dado de sequência dos ácidos nucleicos amplificados e etiquetas ligadas; no qual o ensaio obtém dado de sequência para decodificar as etiquetas para revelar se os ácidos nucleicos para
    Petição 870190057556, de 21/06/2019, pág. 15/49
    5/7 os quais dados de sequência foram ensaiados foram amplificados de modelos na primeira ou na segunda reunião.
  25. 25. Método, de acordo com a reivindicação 24, caracterizado pelo fato de compreender a etapa de decodificar as etiquetas para revelar se os ácidos nucleicos para quais os dados de sequência foram ensaiados foram amplificados de modelos na primeira ou na segunda reunião.
  26. 26. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que a modificação é ligação de ácidos nucleicos a uma proteína.
  27. 27. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que a proteína é uma histona ou fator de transcrição.
  28. 28. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que a modificação é uma modificação de pósreplicação a um nucleotídeo.
  29. 29. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a modificação de pós-replicação é 5-metilcitosina, e a extensão de ligação do agente para ácidos nucleicos aumenta com a extensão de 5-metil-citosinas no ácido nucleico.
  30. 30. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a modificação de pós-replicação é 5hidroximetil-citosina, e a extensão de ligação do agente para ácido nucleico aumenta com a extensão de 5-hidroximetil-citosina no ácido nucleico.
  31. 31. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a modificação de pós-replicação é 5~formil~ citosina ou 5-carboxil-citosina, e a extensão de ligação do agente aumenta com a extensão de 5-formil-cltosina ou 5-carboxil-cytosina no ácido nucleico.
    Petição 870190057556, de 21/06/2019, pág. 16/49
    6/7
  32. 32. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de compreender adicionalmente lavagem de ácidos nucleicos ligados ao agente, e coleta da lavagem à medida que a terceira reunião incluindo ácidos nucleicos com a modificação de pós replicação em uma extensão intermediária relativa à primeira e segunda reuniões.
  33. 33. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de compreender, antes do ensaio, reunir ácidos nucleicos etiquetados das primeira e segunda reuniões.
  34. 34. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que o agente é 5-meti-esferas magnéticas de domínio de ligação.
  35. 35. Método, de acordo com as reivindicações 24-34, caracterizado pelo fato de que a população de ácido nucleico é de uma amostra de fluido corpóreo.
  36. 36. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que a amostra de fluido corpóreo é sangue, soro, ou plasma.
  37. 37. Método, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que a população de ácido nucleico é uma população de ácido nucleico livre de célula.
  38. 38. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que a amostra de fluido corpóreo é de um indivíduo suspeito de possuir um câncer.
  39. 39. Método, de acordo com as reivindicações 25-38, caracterizado pelo fato de que o dado de sequência indica presença de uma variante somática ou variante de linha germinal.
  40. 40. Método, de acordo com as reivindicações 25-39, caracterizado pelo fato de que o dado de sequência indica presença de uma variação de número de cópia.
    Petição 870190057556, de 21/06/2019, pág. 17/49
    ΊΠ
  41. 41. Método, de acordo com qualquer uma das reivindicações 25-39, caracterizado pelo fato de que o dado de sequência indica presença de uma variação de nucleotídeo único (SNV), indel, ou fusão de gene, iv) ácidos nucleicos, no qual os ácidos nucleicos e as etiquetas ligadas, são amplificados; e ensaio das partições etiquetadas moleculares com o instrumento de NGS;
    v) um módulo de software para geração de dado de sequência para decodificar a etiqueta; e vi) um módulo de software para análise do dado de sequência para decodificar as etiquetas para revelar se os ácidos nucleicos para quais dados de sequência foram ensaiados foram amplificados de modelos na primeira ou na segunda reuniões.
BR112019012958A 2016-12-22 2017-12-22 métodos e sistemas para análise de moléculas de ácido nucleico BR112019012958A2 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662438240P 2016-12-22 2016-12-22
US201762512936P 2017-05-31 2017-05-31
US201762550540P 2017-08-25 2017-08-25
PCT/US2017/068329 WO2018119452A2 (en) 2016-12-22 2017-12-22 Methods and systems for analyzing nucleic acid molecules

Publications (1)

Publication Number Publication Date
BR112019012958A2 true BR112019012958A2 (pt) 2019-11-26

Family

ID=61006366

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019012958A BR112019012958A2 (pt) 2016-12-22 2017-12-22 métodos e sistemas para análise de moléculas de ácido nucleico

Country Status (11)

Country Link
US (2) US11519019B2 (pt)
EP (1) EP3559270A2 (pt)
JP (2) JP7300989B2 (pt)
KR (1) KR20190095410A (pt)
CN (1) CN110325650A (pt)
AU (1) AU2017382439A1 (pt)
BR (1) BR112019012958A2 (pt)
CA (1) CA3046007A1 (pt)
IL (2) IL302912A (pt)
MX (1) MX2019007444A (pt)
WO (1) WO2018119452A2 (pt)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9476095B2 (en) 2011-04-15 2016-10-25 The Johns Hopkins University Safe sequencing system
GB2504240B (en) 2012-02-27 2015-05-27 Cellular Res Inc Compositions and kits for molecular counting of nucleic acids
EP3447495B2 (en) 2012-10-29 2024-03-13 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
JP6545682B2 (ja) 2013-08-28 2019-07-17 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 大規模並列単一細胞分析
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
KR102522023B1 (ko) 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
US10697008B2 (en) 2017-04-12 2020-06-30 Karius, Inc. Sample preparation methods, systems and compositions
EP3665308A1 (en) 2017-08-07 2020-06-17 The Johns Hopkins University Methods and materials for assessing and treating cancer
DE202019005627U1 (de) 2018-04-02 2021-05-31 Grail, Inc. Methylierungsmarker und gezielte Methylierungssondenpanels
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
SG11202100344WA (en) 2018-07-23 2021-02-25 Guardant Health Inc Methods and systems for adjusting tumor mutational burden by tumor fraction and coverage
US20200113505A1 (en) 2018-10-11 2020-04-16 Seno Medical Instruments, Inc. Optoacoustic image analysis method and system for automatically estimating lesion traits
CN113286881A (zh) 2018-09-27 2021-08-20 格里尔公司 甲基化标记和标靶甲基化探针板
WO2020072380A1 (en) 2018-10-01 2020-04-09 Cellular Research, Inc. Determining 5' transcript sequences
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
CN113195717A (zh) 2018-12-13 2021-07-30 贝克顿迪金森公司 单细胞全转录组分析中的选择性延伸
CN113454218A (zh) * 2018-12-20 2021-09-28 夸登特健康公司 用于改进核酸分子的回收的方法、组合物和***
US11661631B2 (en) 2019-01-23 2023-05-30 Becton, Dickinson And Company Oligonucleotides associated with antibodies
PL3914736T3 (pl) * 2019-01-25 2024-06-17 Grail, Llc Wykrywanie nowotworu, tkanki pochodzenia nowotworowego i/lub typu komórek nowotworowych
JP2022519045A (ja) * 2019-01-31 2022-03-18 ガーダント ヘルス, インコーポレイテッド 無細胞dnaを単離するための組成物および方法
WO2020176659A1 (en) 2019-02-27 2020-09-03 Guardant Health, Inc. Methods and systems for determining the cellular origin of cell-free dna
WO2020229437A1 (en) * 2019-05-14 2020-11-19 F. Hoffmann-La Roche Ag Devices and methods for sample analysis
US11939636B2 (en) 2019-05-31 2024-03-26 Guardant Health, Inc. Methods and systems for improving patient monitoring after surgery
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
CN114269917A (zh) * 2019-08-19 2022-04-01 豪夫迈·罗氏有限公司 用于测序的dna和rna的单管制备
CN114616343A (zh) 2019-09-30 2022-06-10 夸登特健康公司 用于在甲基化分区测定中分析无细胞dna的组合物和方法
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
EP4065725A1 (en) * 2019-11-26 2022-10-05 Guardant Health, Inc. Methods, compositions and systems for improving the binding of methylated polynucleotides
WO2021127208A1 (en) * 2019-12-20 2021-06-24 Accuragen Holdings Limited Methods and systems for disease detection
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
GB202000747D0 (en) * 2020-01-17 2020-03-04 Institute Of Cancer Res Monitoring tumour evolution
US20210407623A1 (en) * 2020-03-31 2021-12-30 Guardant Health, Inc. Determining tumor fraction for a sample based on methyl binding domain calibration data
WO2021222828A1 (en) 2020-04-30 2021-11-04 Guardant Health, Inc. Methods for sequence determination using partitioned nucleic acids
CA3177706A1 (en) * 2020-05-12 2021-11-18 Maximilian Diehn System and method for gene expression and tissue of origin inference from cell-free dna
WO2021231455A1 (en) * 2020-05-13 2021-11-18 Accuragen Holdings Limited Cell-free dna size detection
US11661625B2 (en) 2020-05-14 2023-05-30 Becton, Dickinson And Company Primers for immune repertoire profiling
US20220025468A1 (en) 2020-05-14 2022-01-27 Guardant Health, Inc. Homologous recombination repair deficiency detection
WO2021236993A1 (en) * 2020-05-22 2021-11-25 Bloodq, Inc. Methods for characterizing cell-free nucleic acid fragments
US11530453B2 (en) 2020-06-30 2022-12-20 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
WO2023282916A1 (en) 2021-07-09 2023-01-12 Guardant Health, Inc. Methods of detecting genomic rearrangements using cell free nucleic acids
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
CN111826430A (zh) * 2020-07-24 2020-10-27 扬州大学 一种研究鸡PGCs中lncRNA和组蛋白甲基化酶共调控靶基因的方法
US11946044B2 (en) * 2020-07-30 2024-04-02 Guardant Health, Inc. Methods for isolating cell-free DNA
JP2023540221A (ja) 2020-08-25 2023-09-22 ガーダント ヘルス, インコーポレイテッド バリアントの起源を予測するための方法およびシステム
US20220154285A1 (en) 2020-09-30 2022-05-19 Guardant Health, Inc. Analysis of methylated dna comprising methylation-sensitive or methylation-dependent restrictions
WO2022087309A1 (en) 2020-10-23 2022-04-28 Guardant Health, Inc. Compositions and methods for analyzing dna using partitioning and base conversion
CN116438316A (zh) 2020-11-17 2023-07-14 贝克顿迪金森公司 用于肿瘤学诊断的无细胞核酸和单细胞组合分析
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
EP4251765A1 (en) 2020-11-30 2023-10-04 Guardant Health, Inc. Compositions and methods for enriching methylated polynucleotides
WO2022140629A1 (en) * 2020-12-23 2022-06-30 Guardant Health, Inc. Methods and systems for analyzing methylated polynucleotides
WO2022174109A1 (en) 2021-02-12 2022-08-18 Guardant Health, Inc. Methods and compositions for detecting nucleic acid variants
AU2022231055A1 (en) 2021-03-05 2023-09-14 Guardant Health, Inc. Methods and related aspects for analyzing molecular response
WO2022187867A1 (en) * 2021-03-05 2022-09-09 The Trustees Of Columbia University In The City Of New York Methods to analyze methylomes in tumor and plasma cell-free dna
WO2022192189A1 (en) * 2021-03-09 2022-09-15 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
JP2024512372A (ja) 2021-03-09 2024-03-19 ガーダント ヘルス, インコーポレイテッド オフターゲットポリヌクレオチド配列決定データに基づく腫瘍の存在の検出
EP4314329A1 (en) 2021-03-25 2024-02-07 Guardant Health, Inc. Methods and compositions for quantifying immune cell dna
WO2022226389A1 (en) * 2021-04-23 2022-10-27 The Translational Genomics Research Institute Analysis of fragment ends in dna
EP4348249A1 (en) 2021-05-28 2024-04-10 Guardant Health, Inc. Compositions and methods for assaying circulating molecules
WO2022271730A1 (en) 2021-06-21 2022-12-29 Guardant Health, Inc. Methods and compositions for copy-number informed tissue-of-origin analysis
EP4370711A1 (en) * 2021-07-12 2024-05-22 The Trustees of the University of Pennsylvania Modified adapters for enzymatic dna deamination and methods of use thereof for epigenetic sequencing of free and immobilized dna
WO2023056065A1 (en) 2021-09-30 2023-04-06 Guardant Health, Inc. Compositions and methods for synthesis and use of probes targeting nucleic acid rearrangements
WO2023081722A2 (en) 2021-11-02 2023-05-11 Guardant Health, Inc. Quality control method
WO2023086967A1 (en) 2021-11-12 2023-05-19 Guardant Health, Inc. Method of analysis of methylated dna-binding proteins
WO2023122623A1 (en) 2021-12-21 2023-06-29 Guardant Health, Inc. Methods and systems for combinatorial chromatin-ip sequencing
WO2023122740A1 (en) 2021-12-23 2023-06-29 Guardant Health, Inc. Compositions and methods for detection of metastasis
WO2023197004A1 (en) 2022-04-07 2023-10-12 Guardant Health, Inc. Detecting the presence of a tumor based on methylation status of cell-free nucleic acid molecules
WO2024006908A1 (en) 2022-06-30 2024-01-04 Guardant Health, Inc. Enrichment of aberrantly methylated dna
WO2024020573A1 (en) 2022-07-21 2024-01-25 Guardant Health, Inc. Methods for detection and reduction of sample preparation-induced methylation artifacts
WO2024040006A2 (en) * 2022-08-15 2024-02-22 Bioscreening & Diagnostics Llc Ai and ml-based system to predict cancer from epigenetic data
WO2024059840A1 (en) 2022-09-16 2024-03-21 Guardant Health, Inc. Compositions and methods for analyzing soluble proteins
WO2024073508A2 (en) 2022-09-27 2024-04-04 Guardant Health, Inc. Methods and compositions for quantifying immune cell dna
WO2024107599A1 (en) 2022-11-15 2024-05-23 Guardant Health, Inc. Method of predicting non-small cell lung cancer (nsclc) patient drug response or time until death or cancer progression from circulating tumor dna (ctdna) utilizing signals from both baseline ctdna level and longitudinal change of ctdna level over time
WO2024137682A1 (en) 2022-12-21 2024-06-27 Guardant Health, Inc. Detecting homologous recombination deficiences based on methylation status of cell-free nucleic acid molecules
WO2024137880A2 (en) 2022-12-22 2024-06-27 Guardant Health, Inc. Methods involving methylation preserving amplification with error correction
WO2024138180A2 (en) 2022-12-22 2024-06-27 Guardant Health, Inc. Integrated targeted and whole genome somatic and dna methylation sequencing workflows

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
JP4106026B2 (ja) 2001-11-28 2008-06-25 アプレラ コーポレイション 選択的な核酸の単離方法および組成物
US8962247B2 (en) * 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2010037001A2 (en) * 2008-09-26 2010-04-01 Immune Disease Institute, Inc. Selective oxidation of 5-methylcytosine by tet-family proteins
US20130157266A1 (en) * 2009-03-15 2013-06-20 Ribomed Biotechnologies, Inc. Abscription based molecular detection of dna methylation
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
ES2669214T3 (es) * 2011-12-13 2018-05-24 Oslo Universitetssykehus Hf Procedimientos y kits para la detección de estado de metilación
ES2828661T3 (es) * 2012-03-20 2021-05-27 Univ Washington Through Its Center For Commercialization Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
EP2859139B1 (en) * 2012-06-06 2018-08-01 The Trustees Of Princeton University Dna barcoding of designer mononucleosome and chromatin array libraries for the profiling of chromatin readers, writers, erasers, and modulators thereof
CN110872617A (zh) * 2012-09-04 2020-03-10 夸登特健康公司 检测稀有突变和拷贝数变异的***和方法
WO2014152155A1 (en) 2013-03-14 2014-09-25 The Broad Institute, Inc. Massively multiplexed rna sequencing
WO2014167564A1 (en) * 2013-04-08 2014-10-16 Carmel-Haifa University Economic Corporation Ltd. Sept4/ARTS AS A TUMOR SUPPRESSOR IN THE DIAGNOSIS, PROGNOSIS AND TREATMENT OF HEPATIC DISORDERS
EP2805769A1 (en) * 2013-05-24 2014-11-26 European Molecular Biology Laboratory Methods for nano-scale single cell analysis
AU2014340239B2 (en) 2013-10-21 2019-11-28 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
EP4306659A3 (en) 2014-04-14 2024-03-27 Yissum Research and Development Company of the Hebrew University of Jerusalem Ltd. A method and kit for determining the tissue or cell origin of dna
KR102441391B1 (ko) 2014-07-25 2022-09-07 유니버시티 오브 워싱톤 무세포 dna를 생성하는 조직 및/또는 세포 유형을 결정하는 방법 및 이를 사용하여 질환 또는 장애를 확인하는 방법
WO2016040901A1 (en) 2014-09-12 2016-03-17 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acids
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US9984201B2 (en) * 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
WO2017181161A1 (en) * 2016-04-15 2017-10-19 Predicine, Inc. Systems and methods for detecting genetic alterations
CA3021735A1 (en) * 2016-04-19 2017-10-26 President And Fellows Of Harvard College Immobilization-based systems and methods for genetic analysis and other applications
CN109415763A (zh) 2016-05-03 2019-03-01 大学健康网络 捕获无细胞的甲基化dna的方法及其用途
US10144962B2 (en) * 2016-06-30 2018-12-04 Grail, Inc. Differential tagging of RNA for preparation of a cell-free DNA/RNA sequencing library
ES2967443T3 (es) 2016-07-06 2024-04-30 Guardant Health Inc Procedimientos de perfilado de fragmentoma de ácidos nucleicos sin células
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
CN111094590A (zh) 2017-07-12 2020-05-01 大学健康网络 使用甲基化组分析进行癌症检测和分类

Also Published As

Publication number Publication date
KR20190095410A (ko) 2019-08-14
WO2018119452A2 (en) 2018-06-28
JP7300989B2 (ja) 2023-06-30
AU2017382439A1 (en) 2019-06-20
JP2020504606A (ja) 2020-02-13
US20190390253A1 (en) 2019-12-26
IL302912A (en) 2023-07-01
MX2019007444A (es) 2019-08-16
EP3559270A2 (en) 2019-10-30
US11519019B2 (en) 2022-12-06
IL267424A (en) 2019-08-29
US20230332206A1 (en) 2023-10-19
CA3046007A1 (en) 2018-06-28
JP2023089062A (ja) 2023-06-27
CN110325650A (zh) 2019-10-11
WO2018119452A3 (en) 2018-08-09
US11952616B2 (en) 2024-04-09

Similar Documents

Publication Publication Date Title
US11952616B2 (en) Methods and systems for analyzing nucleic acid molecules
RU2760913C2 (ru) Способы выявления рака легкого
JP6743268B2 (ja) 合成核酸スパイクイン
US20200248272A1 (en) Compositions and methods for isolating cell-free dna
KR102628878B1 (ko) 메틸롬 분석을 이용한 암 검출 및 분류
KR102412442B1 (ko) 보존된 샘플로부터의 장범위 링키지 정보의 회수
JP2020527340A (ja) セルフリーdna中のdnaメチル化を評価するための方法およびシステム
EP4041919A1 (en) Compositions and methods for analyzing cell-free dna in methylation partitioning assays
TW202102687A (zh) 確定循環核酸之線性及環狀形式
US20220340979A1 (en) Use of cell free bacterial nucleic acids for detection of cancer
JP2024056984A (ja) エピジェネティック区画アッセイを較正するための方法、組成物およびシステム
CN111032868A (zh) 用于评估无细胞dna中的dna甲基化的方法和***
JP2023502752A (ja) メチル化ポリヌクレオチドの結合を改善するための方法、組成物およびシステム
JP2023524681A (ja) 分配された核酸を使用した配列決定のための方法
JP2024512372A (ja) オフターゲットポリヌクレオチド配列決定データに基づく腫瘍の存在の検出
Neiman Methods for deep examination of DNA

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]