BR112018074572B1 - Métodos de identificação de nucleotídeos e para calibrar um instrumento de sequenciamento, meio de armazenamento legível em computador não transitório, dispositivo e instrumento de sequenciamento - Google Patents

Métodos de identificação de nucleotídeos e para calibrar um instrumento de sequenciamento, meio de armazenamento legível em computador não transitório, dispositivo e instrumento de sequenciamento Download PDF

Info

Publication number
BR112018074572B1
BR112018074572B1 BR112018074572-3A BR112018074572A BR112018074572B1 BR 112018074572 B1 BR112018074572 B1 BR 112018074572B1 BR 112018074572 A BR112018074572 A BR 112018074572A BR 112018074572 B1 BR112018074572 B1 BR 112018074572B1
Authority
BR
Brazil
Prior art keywords
light
nucleotide incorporation
characteristic
points
fact
Prior art date
Application number
BR112018074572-3A
Other languages
English (en)
Other versions
BR112018074572A2 (pt
Inventor
Jonathan M. Rothberg
Craig Wenger
Mel Davey
Keith G. Fife
Jimmy Jia
Brian Reed
Brett J. Gyarfas
Original Assignee
Quantum-Si Incorporated
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantum-Si Incorporated filed Critical Quantum-Si Incorporated
Publication of BR112018074572A2 publication Critical patent/BR112018074572A2/pt
Publication of BR112018074572B1 publication Critical patent/BR112018074572B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6428Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
    • G01N2021/6439Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/6408Fluorescence; Phosphorescence with measurement of decay time, time resolved fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/645Specially adapted constructive features of fluorimeters
    • G01N21/6452Individual samples arranged in a regular 2D-array, e.g. multiwell plates
    • G01N21/6454Individual samples arranged in a regular 2D-array, e.g. multiwell plates using an integrated detector array
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N21/645Specially adapted constructive features of fluorimeters
    • G01N21/648Specially adapted constructive features of fluorimeters using evanescent coupling or surface plasmon coupling for the excitation of fluorescence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • General Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Optics & Photonics (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Burglar Alarm Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Sistema e métodos para identificar nucleotídeos com base em dados adquiridos a partir de um sensor durante o sequenciamento de ácidos nucleicos. O método pode incluir obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos, uma característica temporal da luz e uma característica de intensidade da luz. A característica temporal representa uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação. O método pode ainda incluir agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos. Os pontos individuais podem representar pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente. O método pode ainda incluir atribuir os grupos de pontos a nucleotídeos individuais.

Description

PEDIDOS RELACIONADOS
[001] O presente pedido reivindica prioridade ao Pedido de Patente Provisória dos Estados Unidos 62/343.997, intitulado "PULSE CALLER AND BASE CALLER", depositado em 1° de junho de 2016, o qual é aqui incorporado por referência na íntegra.
ANTECEDENTES
[002] O sequenciamento de ácidos nucleicos (por exemplo, ácido desoxirribonucleico (DNA), ácido ribonucleico (RNA)) inclui a identificação individual de nucleotídeos em um ácido nucleico alvo. Alguns métodos de sequenciamento de ácidos nucleicos incluem a identificação de nucleotídeos individuais, uma vez que são incorporados na fita de ácidos nucleicos complementar aos ácidos nucleicos alvo. A série de nucleotídeos para a cadeia complementar identificada durante o processo de sequenciamento pode, então, permitir a identificação da sequência de nucleotídeos para a fita de ácidos nucleicos alvo.
SUMÁRIO
[003] Algumas modalidades se referem a um método que inclui receber primeira informação sobre intervalo de tempo (time-bin) em relação aos tempos nos quais um primeiro marcador luminescente emite luz em resposta a excitações do primeiro marcador luminescente, calcular a primeira informação sobre intensidade da luz com base na primeira informação sobre intervalo de tempo, receber segunda informação sobre intervalo de tempo em relação aos tempos nos quais um segundo marcador luminescente emite luz em resposta a excitações do segundo marcador luminescente, calcular segunda a informação sobre intensidade da luz com base na segunda informação sobre intervalo de tempo e calcular os tempos nos quais ocorrem eventos de incorporação de nucleotídeos usando as primeira e segunda informações sobre intensidade da luz.
[004] O cálculo dos tempos nos quais ocorrem os eventos de incorporação de nucleotídeos pode ser realizado usando um algoritmo de identificação de pulsos. O algoritmo de identificação de pulsos pode incluir um algoritmo de pontos de mudança, um algoritmo de média/mediana e variância em execução ou um algoritmo de máquinas de estado. O cálculo da informação sobre a primeira intensidade da luz pode incluir a soma da primeira informação sobre intervalo de tempo e o cálculo da informação sobre a segunda intensidade da luz pode incluir a soma da segunda informação sobre intervalo de tempo.
[005] Algumas modalidades se referem a um método que inclui receber a primeira informação sobre intervalo de tempo em relação aos tempos nos quais um primeiro marcador luminescente emite a primeira luz em resposta a excitações do primeiro marcador luminescente e calcular uma primeira característica temporal da primeira luz com base na primeira informação sobre intervalo de tempo. A característica temporal pode representar uma velocidade de declínio de uma probabilidade de emissão de fótons pelo primeiro marcador luminescente após excitação. O método pode ainda incluir receber uma segunda informação sobre intervalo de tempo em relação a tempos nos quais um segundo marcador luminescente emite uma segunda luz em resposta a excitações do segundo marcador luminescente e calcular uma segunda característica temporal da segunda luz com base na segunda informação sobre intervalo de tempo. A segunda característica temporal pode representar uma velocidade de declínio de uma probabilidade de emissão de fótons pelo segundo marcador luminescente após excitação. O método pode ainda incluir calcular os tempos nos quais ocorrem eventos de incorporação de nucleotídeos usando as primeira e segunda características temporais.
[006] O cálculo dos tempos nos quais ocorrem os eventos de incorporação de nucleotídeos pode ser realizado usando um algoritmo de identificação de pulsos. O algoritmo de identificação de pulsos pode incluir um algoritmo de pontos de mudança (change-point), um algoritmo de média/mediana e variância em execução ou um algoritmo de máquinas de estado (state machine).
[007] Algumas modalidades se referem a um método que inclui determinar uma ou mais características temporais que representam uma velocidade de declínio de uma probabilidade de emissão de fótons por um ou mais marcadores luminescentes após os tempos de excitação e calcular tempos nos quais ocorrem eventos de incorporação de nucleotídeos usando pelo menos uma característica temporal.
[008] O cálculo dos tempos nos quais ocorrem os eventos de incorporação de nucleotídeos também pode ser realizado usando uma intensidade da luz emitida por um ou mais marcadores luminescentes.
[009] Algumas modalidades se referem a um método que inclui receber informação sobre intervalo de tempo em relação aos tempos nos quais um marcador luminescente emite luz em resposta a excitações do marcador luminescente, calcular a informação sobre intensidade da luz com base na informação sobre intervalo de tempo e calcular um tempo no qual pelo menos um evento de incorporação de nucleotídeos ocorre usando a informação sobre intensidade da luz.
[0010] O tempo no qual pelo menos um evento de incorporação de nucleotídeos ocorre também pode ser calculado usando uma característica temporal da luz.
[0011] Algumas modalidades se referem a um método de identificação de nucleotídeos que inclui obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz. O método pode ainda incluir agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente e atribuir os grupos de pontos a nucleotídeos individuais.
[0012] A característica temporal pode incluir uma durabilidade de luminância ou uma proporção de fótons detectados em diferentes intervalos de tempo. O agrupamento dos pontos pode ser realizado por um algoritmo de agrupamento. O algoritmo de agrupamento pode executar agrupamento k-médias, em que k é maior do que ou igual a quatro. Os grupos individuais de pontos podem ser atribuídos a nucleotídeos individuais com base nas características de emissão de luz predeterminadas dos marcadores luminescentes.
[0013] Algumas modalidades se referem a um método de calibração de um instrumento de sequenciamento, o método incluindo obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz. O método pode ainda incluir agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente, atribuir grupos individuais de pontos a nucleotídeos individuais, determinar um ou mais critérios que distinguem os grupos de pontos e armazenar o um ou mais critérios.
[0014] O um ou mais critérios podem incluir um ou mais limites entre os grupos de pontos. O um ou mais critérios podem incluir centroides dos grupos de pontos. O um ou mais critérios podem ser armazenados na memória não volátil. O agrupamento dos pontos pode incluir executar um algoritmo de agrupamento sobre os pontos.
[0015] Algumas modalidades se referem a um método de identificação de nucleotídeos, o método incluindo obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz. O método pode ainda incluir atribuir os nucleotídeos aos eventos de incorporação aos nucleotídeos, avaliar a característica temporal e a característica de intensidade levando em consideração os critérios armazenados para um instrumento de sequenciamento que distinguem as características da luz para os marcadores luminescentes.
[0016] Os critérios armazenados podem incluir um ou mais limites entre as características dos marcadores luminescentes para diferentes nucleotídeos. A atribuição dos eventos de incorporação de nucleotídeos pode incluir comparar um ponto que representa a característica temporal e a característica de intensidade com um ou mais limites. O um ou mais critérios armazenados podem incluir centroides de grupos de pontos, cada grupo correspondendo a um respectivo nucleotídeo. A atribuição dos eventos de incorporação de nucleotídeos pode incluir determinar as distâncias entre um ponto que representa a característica temporal e a característica de intensidade para um evento de incorporação aos centroides e atribuir o evento de incorporação de nucleotídeos a um nucleotídeo com um centroide mais próximo do ponto. Os critérios armazenados podem ser critérios de calibração armazenados em uma memória não volátil.
[0017] Algumas modalidades se referem a um método de identificação de nucleotídeos que inclui obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma segunda característica da luz. O método pode ainda incluir agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente e atribuir os grupos de pontos a nucleotídeos individuais.
[0018] Algumas modalidades se referem a um método de calibração de um instrumento de sequenciamento que inclui obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma segunda característica da luz. O método pode ainda incluir agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente, atribuir grupos individuais de pontos a nucleotídeos individuais, determinar um ou mais critérios que distinguem os grupos de pontos e armazenar o um ou mais critérios.
[0019] Algumas modalidades se referem a um método de identificação de nucleotídeos que inclui obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz. O método pode ainda incluir atribuir os nucleotídeos aos eventos de incorporação aos nucleotídeos, avaliar a característica temporal e a segunda característica levando em consideração os critérios armazenados para um instrumento de sequenciamento que distinguem as características da luz para os marcadores luminescentes.
[0020] Algumas modalidades se referem a um método que inclui obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz. O método pode ainda incluir determinar um ou mais critérios que distinguem grupos de pontos que representam as características dos eventos de incorporação de nucleotídeos, os pontos individuais representando a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente.
[0021] O método pode ainda incluir atribuir os grupos aos respectivos nucleotídeos para produzir atribuições de nucleotídeos para os grupos. O método pode ainda incluir atribuir os pontos aos nucleotídeos com base em um ou mais critérios e nas atribuições de nucleotídeos para os grupos.
[0022] Algumas modalidades se referem a um método que inclui obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos. As características podem incluir, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma segunda característica da luz. O método pode ainda incluir determinar um ou mais critérios que distinguem grupos de pontos que representam as características dos eventos de incorporação de nucleotídeos, os pontos individuais representando a característica temporal e a segunda característica para um evento de incorporação de nucleotídeos correspondente.
[0023] Algumas modalidades se referem a um meio de armazenamento legível em computador não transitório que tem, armazenado no mesmo, instruções as quais, quando executadas por um processador, executam qualquer um dos métodos descritos aqui.
[0024] Algumas modalidades se referem a um dispositivo que inclui um processador configurado para executar qualquer um dos métodos descritos aqui.
[0025] Algumas modalidades se referem a um instrumento de sequenciamento que inclui um fotodetector configurado para receber luz proveniente de marcadores luminescentes durante uma reação de sequenciamento em um processador configurado para executar qualquer um dos métodos descritos aqui.
BREVE DESCRIÇÃO DOS DESENHOS
[0026] Vários aspectos e modalidades da aplicação serão descritos com referência às figuras a seguir. Será apreciado que as figuras não estão necessariamente desenhadas em escala. Os itens que aparecem nas várias figuras são indicados pelo mesmo número de referência em todas as figuras nas quais eles aparecem.
[0027] A Figura 1A é um fluxograma de um algoritmo implementado por um chamador de pulsos de acordo com algumas modalidades.
[0028] A Figura 1B é um gráfico da probabilidade de emissão de fótons ao longo do tempo após excitação e distribuição do número de fótons em intervalos de tempo detectados por um fotodetector de acordo com algumas modalidades.
[0029] A Figura 1C é um fluxograma de um método para determiner eventos de incorporação de nucleotídeos usando parâmetro(s) temporal(ais) da luz emitida de acordo com algumas modalidades.
[0030] A Figura 1D é um fluxograma de um método para determiner eventos de incorporação de nucleotídeos usando intensidade(s) e característica(s) temporal(is) da luz emitida de acordo com algumas modalidades
[0031] A Figura 2 é um gráfico da intensidade da luz detectada por um fotodetector ao longo do tempo durante o sequenciamento de um ácido nucleico de acordo com algumas modalidades.
[0032] A Figura 2-1A é uma representação em diagrama de blocos de um dispositivo que pode ser usado para análise rápida e móvel de amostras biológicas e químicas de acordo com algumas modalidades.
[0033] A Figura 2-1B é um diagrama de blocos de um dispositivo e um instrumento integrados de acordo com algumas modalidades.
[0034] A Figura 3 é um fluxograma de um algoritmo implementado por um chamador (caller) de base de acordo com algumas modalidades.
[0035] A Figura 3-1A é um esquema de um dispositivo integrado de acordo com algumas modalidades.
[0036] A Figura 3-1B é um esquema do acoplamento de energia de excitação para cavidades de amostra em uma linha de pixels e energia de emissão de cada amostra bem direcionada para sensores de acordo com algumas modalidades.
[0037] A Figura 4 é um gráfico da proporção de intensidade em função do intervalo de tempo como um parâmetro temporal para eventos de incorporação de nucleotídeos que mostra agrupamentos de pontos para diferentes nucleotídeos de acordo com algumas modalidades.
[0038] A Figura 5 é um gráfico que mostra os limites e as posições dos centroides para os agrupamentos mostrados na Figura 4 de acordo com algumas modalidades.
[0039] A Figura 6 é um fluxograma de um algoritmo implementado por um chamador de base para identificar nucleotídeos com base em um ou mais critérios de calibração de acordo com algumas modalidades.
[0040] A Figura 7 é um gráfico da intensidade em função do parâmetro temporal que ilustra as distâncias relativas de um ponto que corresponde a um evento de incorporação de nucleotídeos para as posições dos centroides para diferentes nucleotídeos de acordo com algumas modalidades.
[0041] A Figura 8 é um diagrama de blocos de um dispositivo de computação ilustrativo que pode ser usado na implementação de algumas modalidades da tecnologia descrita aqui.
DESCRIÇÃO DETALHADA
[0042] As técnicas descritas aqui se referem ao sequenciamento de ácidos nucleicos, tais como DNA e RNA e, em particular, a técnicas de identificação de nucleotídeos com base em dados obtidos a partir de um sensor. O sequenciamento de ácidos nucleicos permite a determinação da ordem e posição dos nucleotídeos em um ácido nucleico alvo. Alguns métodos de sequenciamento de ácido nucleico se baseiam em sequenciamento por síntese, na qual a identidade de um nucleotídeo é determinada à medida que o nucleotídeo é incorporado em uma fita sintetizada de ácido nucleico que é complementar ao ácido nucleico alvo. Durante sequenciamento, uma enzima de polimerização (por exemplo, DNA polimerase) pode se acoplar (por exemplo, ligar) a um local inicial de uma molécula de ácido nucleico alvo e adicionar ou incorporar nucleotídeos ao iniciador através da ação da enzima de polimerização, o que pode ser, em geral, denominado como uma reação de extensão de iniciador.
[0043] Cada nucleotídeo pode ser associado a uma molécula luminescente (por exemplo, fluoroforo) que emite luz em resposta à excitação e a qual é usada para marcar cada tipo de nucleotídeo para discriminar dentre os diferentes tipos de nucleotídeos. Por exemplo, um conjunto de quatro marcadores pode ser usado para marcar as nucleobases presentes no DNA, de modo que cada marcador do conjunto esteja associado a uma nucleobase diferente, por exemplo, um primeiro marcador estando associado à adenina (A), um segundo marcador estando associado à citosina (C), um terceiro marcador estando associado à guanina (G) e um quarto marcador estando associado à timina (T). Um marcador pode ser acoplado a um nucleotídeo através de ligação do marcador ao nucleotídeo, direta ou indiretamente, por meio de uma molécula ligante.
[0044] À medida que a reação de extensão do iniciador ocorre, um nucleotídeo e seus respectivos marcadores luminescentes são retidos pela enzima de polimerização durante a incorporação do nucleotídeo no ácido nucleico complementar sintetizado. O marcador luminescente pode ser excitado por pulsos de luz durante o período em que o nucleotídeo é incorporado no ácido nucleico sintetizado e emite luz característica do marcador. Em algumas modalidades, o marcador é ligado, direta ou indiretamente através de uma molécula ligante, a um fosfato terminal de um nucleotídeo, de modo que o marcador seja solto ou liberado do nucleotídeo através da ação da enzima de polimerização durante a incorporação do nucleotídeo (por exemplo, clivagem de uma ligação de fosfato). A detecção e análise da luz emitida pelo marcador luminescente em resposta à excitação pode permitir a identificação do nucleotídeo que foi incorporado. À medida que a reação de extensão do iniciador ocorre, a excitação, a detecção e a análise são realizadas para cada nucleotídeo subsequente adicionado ao ácido nucleico sintetizado. A sequência do ácido nucleico alvo pode ser determinada a partir da sequência complementar do ácido nucleico sintetizado.
[0045] A luz emitida pelo marcador luminescente pode ter várias características que podem ser usadas para distinguir o marcador de outros marcadores e, assim, identificar um nucleotídeo. Estas características incluem intensidade (por exemplo, a probabilidade de emissão de luz), uma característica temporal (por exemplo, taxa de declínio da probabilidade de emissão de fótons após excitação, duração do pulso para incorporação e/ou duração entre pulsos antes e/ou após a incorporação), uma característica espectral (por exemplo, comprimento(s) de onda da luz emitida) ou qualquer combinação dos mesmos. A luz emitida pelo marcador luminescente pode ser detectada por um fotodetector que pode detectar uma ou mais destas características. Um exemplo de um fotodetector adequado é descrito no Pedido de Patente dos Estados Unidos 14/821.656, intitulado " INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS", o qual é aqui incorporado por referência na íntegra. Conforme descrito aqui, o fotodetector pode ter a capacidade de detectar os tempos de chegada dos fótons, o que pode permitir determinar as características temporais da luz emitida pelos marcadores. A detecção de características temporais da luz emitida pode permitir a discriminação entre marcadores que emitem luz com diferentes características temporais. Um exemplo de uma característica temporal é a durabilidade da luminância. Uma molécula luminescente, tal como um fluoroforo, pode emitir fótons em resposta à excitação. A probabilidade de que a molécula luminescente emita um fóton diminui com o tempo após a ocorrência da excitação. A taxa de declínio na probabilidade pode ser exponencial. A "durabilidade " é característica da rapidez com a qual a probabilidade decai ao longo do tempo. Diz-se que um declínio rápido tem uma durabilidade curta, enquanto que um declínio lento tem uma durabilidade longa. A detecção de características temporais da luz emitida por moléculas luminescentes pode permitir distinguir moléculas luminescentes que têm durabilidades diferentes. Marcar diferentes nucleotídeos com moléculas luminescentes com diferentes durabilidades pode permitir a distinção entre os nucleotídeos com base em uma característica temporal da luz detectada.
[0046] O fotodetector descrito no Pedido de Patente dos Estados Unidos 14/821.656 pode detectar o tempo de chegada dos fótons com resolução de nanossegundos ou picossegundos e pode retardar a chegada dos fótons incidentes. Uma vez que a emissão de fótons é probabilística, o marcador pode ser excitado várias vezes e pode-se calcular o intervalo de tempo de qualquer emissão de fótons resultante. Realizar tal medição várias vezes permite preencher um histograma de tempos nos quais os fótons chegaram após um evento de excitação. Esta informação pode ser analisada para calcular uma característica temporal da luz emitida, o que pode permitir distinguir o marcador de outro marcador com base na característica temporal.
[0047] As técnicas descritas aqui podem analisar um fluxo de dados de um fotodetector para sequenciar o ácido nucleico com base nas características da luz detectada. Estas técnicas podem ser implementadas por um "chamador de pulsos" e um "chamador de base", os quais podem ser módulos de software e/ou hardware de um instrumento de sequenciamento ou outro dispositivo. Em geral, um chamador de pulsos analisa o fluxo de dados para identificar intervalos de tempo no qual ocorrem pulsos de luminescência a partir do marcador, significando que um nucleotídeo conjugado com corante é incorporado na cadeia de oligonucleotídeos pela polimerase. Um "chamador de base" analisa as características da luz detectada durante os intervalos de tempo identificados pelo chamador para determinar ou "chamar" a identidade dos nucleotídeos.
[0048] A Figura 1 A mostra um fluxograma de um algoritmo que pode ser implementado pelo chamador de pulsos. Na etapa S1, a intensidade da luz recebida em função do tempo é calculada. Conforme discutido acima, o fotodetector pode sincronizar a chegada de fótons incidentes a partir de um marcador em resposta à exposição do marcador a uma fonte de excitação (por exemplo, por um pulso de laser). Um marcador pode ser repetidamente excitado e o intervalo de tempo da chegada de fótons incidentes a partir do marcador pode ser calculada. Por exemplo, durante um período de medição de 10 ms, os pulsos de excitação do laser podem ser emitidos em uma frequência de 100 MHz para excitar o marcador. O marcador pode emitir um fóton com baixa probabilidade (por exemplo, 1 emissão de fótons em 10.000 excitações). Se o marcador for excitado várias vezes (por exemplo, 1 milhão de vezes) dentro de um período de 10 ms, aproximadamente 100 fótons podem ser recebidos. Em alguns casos, um marcador pode não ficar excitado após exposição a uma fonte de excitação e não emitir um fóton após um evento de excitação, o que pode contribuir para a baixa probabilidade de emissão. Conforme discutido acima, os intervalos de tempo de chegada dos fótons incidentes em relação à excitação podem ser calculados. O fotodetector pode fornecer sinais que representam o número de fótons em cada intervalo de tempo.
[0049] A Figura 1B é um exemplo no qual um fotodetector calcula o intervalo de tempo da chegada de fótons incidentes em oito intervalos de tempo. Uma vez, conforme discutido acima, que a probabilidade de emissão de fótons decai ao longo do tempo, os intervalos de tempo anteriores têm mais fótons do que os intervalos de tempo posteriores. Ao excitar repetidamente o marcador e detectar a periodicidade dos fótons emitidos, pode ser preenchido um histograma que aproxima o declínio na probabilidade de emissão de fótons ao longo do tempo, conforme mostrado na Figura 1B.
[0050] A intensidade da luz recebida durante o período de medição (por exemplo, 10 ms) pode ser calculada pelo chamador de pulsos ao somar os valores que representam o número de fótons recebidos em cada intervalo de tempo. Por exemplo, se o fotodetector calcula a chegada de fótons incidentes em oito intervalos, conforme mostrado na Figura 1B, o número de fótons recebidos nos oito intervalos de tempo é somado para determinar a intensidade. No entanto, qualquer número de intervalos de tempo pode ser usado. Se o fotodetector tem dois intervalos de tempo, os valores que representam o número de fótons recebidos em ambos os intervalos de tempo são somados para determinar a intensidade. Por exemplo, se o primeiro intervalo de tempo tiver 100 fótons e o segundo intervalo de tempo tiver 50 fótons, estes valores podem ser somados para determinar uma intensidade de 150 fótons. Alternativamente, pode existir um intervalo de tempo separado para medir a intensidade total do fóton.
[0051] A determinação da intensidade da luz recebida pode ser realizada para períodos de medição subsequentes no fluxo de dados do fotodetector. Por exemplo, se o fotodetector realiza medições em períodos de 10 ms, a intensidade pode ser determinada para cada período de medição ao somar os intervalos de tempo em cada período de 10 ms. Como um resultado, os dados que representam a intensidade da luz recebida ao longo do tempo podem ser determinados.
[0052] A Figura 2 mostra vários minutos de um traço exemplificativo que representa a intensidade da luz recebida em função do tempo. Uma vez que há uma linha de base e uma variância significativa no traço e pulsos verdadeiros muitas vezes têm uma baixa relação sinal-ruído, a identificação de pulsos que correspondem a eventos de incorporação pode ser um desafio. Na etapa S2, é executado um algoritmo de localização de pulsos nos dados de intensidade em função do tempo para identificar os tempos quando disparos de luz são emitidos, os quais correspondem aos eventos de incorporação.
[0053] Para o algoritmo de localização de pulsos, uma abordagem adequada é executar um algoritmo de pontos de mudança nos dados do traço que determina quando ocorrem mudanças na média e na variância do sinal, por exemplo, quando se muda de um segundo plano (por exemplo, entre pulsos) para sinalizar (isto é, pulso) e vice-versa. Após cada ponto de mudança ser identificado, um limiar separa as regiões entre pulsos (regiões entre os pulsos) das regiões de pulso com base no nível de pontos de mudança (por exemplo, intensidade). Este limite pode ser determinado manualmente, com o uso de um histograma, estimativa de densidade do kernel ou agrupamento de K-média.
[0054] Outra abordagem adequada é analisar a média/mediana e a variância do traço e, então, definir pulsos como aumentos de um determinado número de desvios padrão ou mais acima da média/mediana.
[0055] Ainda outra abordagem adequada é usar uma máquina de estados, a qual está em um estado de pulso ou entre pulsos, e é considerada como alternando entre os dois. Os limiares definem transições entre os dois estados.
[0056] Em algumas modalidades, pode ocorrer uma filtragem adicional de pulsos chamados, tal como remoção de pulsos que não satisfaçam um limiar de duração mínimo ou máximo (uma vez que pulsos muito curtos e pulsos muito longos frequentemente são falsos positivos).
[0057] As duas últimas abordagens têm um benefício adicional pelo fato de que podem ser operadas nos dados à medida que eles são adquiridos, enquanto que o algoritmo de pontos de mudança pode precisar de todos os dados para poder operar.
[0058] São descritas acima técnicas para identificar pulsos que correspondem a eventos de incorporação de nucleotídeos com base na intensidade da luz emitida. No entanto, outras características da luz emitida podem ser usadas para identificar pulsos além de ou como uma alternativa à intensidade. Em algumas modalidades, os pulsos podem ser identificados com base na(s) característica (s) temporal(ais) da luz emitida além de ou como uma alternativa à intensidade de uso. Diferentes nucleotídeos podem ser marcados com moléculas que emitem luz com diferentes características temporais e as características temporais podem ser analisadas para determinar quando os eventos de incorporação começam e terminam. Por exemplo, diferentes marcadores luminescentes podem ter diferentes "durabilidades" ou taxas nas quais a probabilidade de emissão de fótons em resposta à excitação decai ao longo do tempo. Uma mudança na durabilidade medida pode indicar o início ou o fim de um evento de incorporação.
[0059] A Figura 1C mostra um fluxograma de um método que usa parâmetro(s) temporal(is) para determinar quando ocorrem pulsos que correspondem a eventos de incorporação. Na etapa S3, o(s) parâmetro(s) temporal(ais) para a luz emitida durante os eventos de incorporação é/são determinado(s). Por exemplo, conforme discutido abaixo, as características temporais podem ser determinadas com base nas informações sobre o intervalo de tempo (isto é, informações sobre ou com base em um ou mais intervalos de tempo). Em algumas modalidades, as característica(s) temporal(is) pode(m) ser determinada(s) pelo chamador de base e fornecida(s) ao chamador de pulsos. Na etapa S4, um algoritmo de localização de pulsos pode ser executado em dados que representam o parâmetro temporal ao longo do tempo. O algoritmo de localização de pulsos pode operar de maneira similar àquela discutida acima em relação à intensidade.
[0060] Em algumas modalidades, tanto a intensidade como a(s) característica(s) temporal(ais) podem ser usadas para identificar os tempos nos quais ocorrem os eventos de incorporação. Como um exemplo, mudanças em uma característica temporal podem ser usadas para refinar a identificação de pulsos com base na intensidade. A Figura 1D mostra um fluxograma de tal método. Na etapa S1, podem ser obtidas intensidades de luz para cada evento de incorporação. As intensidades podem ser calculadas ao somar os intervalos de tempo em cada conjunto de intervalos de tempo, conforme discutido acima. No entanto, as intensidades não precisam ser obtidas pela soma dos intervalos de tempo e podem ser medidas e/ou determinadas de maneira diferente. Na etapa S2, é executado um algoritmo de localização de pulsos nos dados de intensidade em função do tempo para identificar os tempos nos quais os disparos de luz são emitidos, os quais correspondem aos eventos de incorporação. Na etapa S3, o(s) parâmetro(s) temporal(is) para a luz emitida durante os eventos de incorporação é/são determinado(s). Na etapa S5, os pulsos identificados na etapa S2 podem ser avaliados e possivelmente refinados com base no(s) parâmetro(s) temporal(ais). Por exemplo, se um pulso longo for identificado (por exemplo, tendo um comprimento maior do que uma quantidade limite), o(s) parâmetro(s) temporal(is) da luz emitida durante o pulso pode(m) ser avaliado(s). Se o parâmetro temporal mudar significativamente durante o pulso (por exemplo, mudanças em mais de uma quantidade limite ou uma quantidade que pode indicar um nucleotídeo diferente), a chamada de pulso inicial pode ser revisada para identificar dois pulsos separados, em vez de um pulso longo. O tempo no qual a mudança no parâmetro temporal ocorre pode corresponder a um limite temporal entre os dois pulsos. Se o parâmetro temporal não mudar significativamente durante o pulso (por exemplo, não muda ou muda em uma quantidade relativamente pequena), a chamada de pulso inicial pode ser mantida inalterada. Consequentemente, os resultados da chamada de pulso inicial com base na intensidade podem ser avaliados e/ou refinados usando os parâmetros temporais.
[0061] Em algumas modalidades, a chamada de pulso inicial pode ser realizada usando parâmetros temporais e os pulsos podem ser refinados usando a informação sobre intensidade.
[0062] Como um resultado da execução do algoritmo de localização de pulsos, o chamador identifica os tempos nos quais ocorrem os pulsos que correspondem aos eventos de incorporação. Para cada pulso, o chamador pode identificar o tempo inicial e o tempo final, o tempo inicial e a duração ou o tempo final e a duração. Os tempos nos quais tais pulsos ocorrem podem ser analisados para identificar o marcador luminescente e, assim, seu nucleotídeo associado.
[0063] Após chamar o chamador em um fluxo de dados do fotodetector, o chamador de base pode ser chamado para analisar uma ou mais características da luz para cada evento de incorporação. O chamador de pulsos pode passar os tempos nos quais os pulsos ocorrem para o chamador de base. Opcionalmente, o chamador de pulsos pode passar informações adicionais para o chamador de base, tais como informações sobre o número de fótons recebidos em cada intervalo de tempo, a intensidade calculada para cada período de medição ou qualquer outra informação adequada.
[0064] A Figura 3 mostra um fluxograma de um algoritmo que pode ser implementado pelo chamador de base para identificar nucleotídeos e/ou que pode ser usado para calibrar o instrumento de sequenciamento.
[0065] Na etapa S11, podem ser obtidas as intensidades para cada evento de incorporação. As intensidades podem ser calculadas ao somar os intervalos de tempo em cada conjunto de intervalos de tempo, conforme discutido acima. Alternativamente, o chamador de base pode receber as intensidades a partir do chamador de pulsos.
[0066] Uma intensidade pode ser normalizada para a duração do evento de incorporação identificado pelo chamador de pulsos. Por exemplo, se um evento de incorporação durar duas vezes mais do que um intervalo de medição, a intensidade pode ser calculada ao somar os intervalos de tempo para os dois intervalos de medição e dividir por 2. Por exemplo, se um evento de incorporação durar 20 ms, o período de medição é de 10 ms e os fótons são agrupados em dois intervalos de tempo, a intensidade pode ser calculada ao somar os fótons coletados nos dois intervalos de tempo da primeira medição, bem como os fótons coletados nos dois intervalos de tempo da segunda medição, depois dividir por dois. Tal cálculo também pode ser considerado como o cálculo de uma intensidade média durante o evento de incorporação de 20 ms.
[0067] Na etapa S12, pode ser determinado um parâmetro temporal para cada evento de incorporação. O parâmetro temporal pode representar o declínio na probabilidade de emissão de fótons por um marcador ao longo do tempo após excitação. Qualquer parâmetro temporal adequado pode ser usado. Em algumas modalidades, a durabilidade da luminância pode ser calculada ao ajustar um exponencial aos intervalos de tempo (consulte, por exemplo, a Figura 1B) e a durabilidade da luminância pode ser usada como o parâmetro temporal. Em algumas modalidades, a contagem de fótons para diferentes intervalos de tempo (ou um valor representativo dos mesmos) pode ser comparada para determinar um parâmetro temporal que representa o declínio na probabilidade de emissão de fótons ao longo do tempo. Por exemplo, se a chegada de fótons incidentes é colocada em dois intervalos de tempo, a proporção entre a contagem de fótons para os dois intervalos pode ser calculada e a proporção pode ser usada como o parâmetro temporal. Em algumas modalidades, a proporção dos intervalos pode ser uma aproximação para calcular uma durabilidade de luminância. A proporção pode ser calculada de qualquer forma adequada. Em algumas modalidades, se forem usados dois intervalos de tempo, a contagem de fótons para o intervalo de tempo mais próximo do tempo para o evento de excitação pode ser dividida pela contagem de fótons para o segundo intervalo de tempo para produzir a proporção. Em algumas modalidades, a contagem de fótons dos intervalos de tempo ou o valor representativo dos mesmos pode ser normalizado (por exemplo, pela soma da intensidade em um conjunto de intervalos de tempo) e os valores normalizados podem ser usados para determinar o parâmetro temporal. Em algumas modalidades, o intervalo de tempo com a contagem máxima de fótons pode ser usado como o parâmetro temporal. Para determinar o intervalo de tempo com a contagem máxima de fótons, as contagens de fótons para os intervalos de tempo podem ser comparadas entre si. Como um exemplo com dois intervalos de tempo, a contagem de fótons para um primeiro intervalo pode ser comparada com a contagem de fótons para um segundo intervalo. O intervalo com a maior contagem de fótons pode ser selecionado como um parâmetro temporal e pode ser usado para discriminar moléculas luminescentes. Por exemplo, uma molécula luminescente pode ter uma durabilidade relativamente curta, o que pode resultar no primeiro intervalo (mais próximo do momento do evento de excitação) com a contagem máxima de fótons e outra molécula luminescente pode ter uma durabilidade relativamente longa, o que pode resultar em outro intervalo de tempo (mais distante do momento do evento de excitação) com a contagem máxima de fótons.
[0068] Embora a Figura 3 mostre a etapa S11 como sendo executada antes da etapa S12, isto é meramente a título de ilustração, uma vez que a etapa S12 pode ser executada antes da etapa S11 ou as etapas S11 e S12 podem ser realizadas concorrentemente.
[0069] A Figura 4 mostra que a intensidade e o parâmetro temporal para cada evento de incorporação podem ser representados como um ponto no espaço bidimensional, com a intensidade e o parâmetro temporal estando nos respectivos eixos. Neste exemplo, o parâmetro temporal é representado no eixo horizontal (x) e a intensidade é representada no eixo vertical (y). Quatro diferentes marcadores podem ser usados para nucleotídeos que podem ser distinguidos uns dos outros com base na intensidade, no parâmetro temporal ou ambos. Conforme mostrado na Figura 4, a representação da intensidade e o parâmetro temporal medidos para cada evento de incorporação resulta em quatro grupos de pontos que correspondem aos quatro nucleotídeos A, C, G e T.
[0070] Na etapa S13, os pontos podem ser atribuídos a grupos (também denominados aqui como "agrupamentos"). Em algumas modalidades, um algoritmo de agrupamento pode ser executado nos pontos para atribuir os pontos a cada evento de incorporação a um dos quatro agrupamentos. Por exemplo, o algoritmo de agrupamento pode executar agrupamento por K-média dos pulsos no espaço n- dimensional, onde k é 4 (A, C, G, T) e n é o número de métricas usadas para a chamada de base. No entanto, em algumas modalidades, mais de quatro agrupamentos podem ser atribuídos. Se mais de quatro agrupamentos são atribuídos, pode ser usado o agrupamento no qual é maior do que 4. Os inventores reconheceram e apreciaram que, em alguns casos, os agrupamentos podem não ser bem resolvidos e pode ser vantajoso agrupar os pontos em mais de quatro agrupamentos. Neste caso, mais de um agrupamento pode ser atribuído ao mesmo nucleotídeo. Em algumas modalidades, filtragem pode ser realizada para eliminar pontos que são remotos. Por exemplo, se um ponto tiver um parâmetro temporal e/ou intensidade que esteja fora de um intervalo esperado, ele poderá ser excluído do algoritmo de agrupamento e/ou não poderá ser atribuído a nenhum grupo de nucleotídeos.
[0071] Qualquer número adequado de pontos pode ser fornecido ao algoritmo de agrupamento, tal como mais de 50, mais de 100, mais de 500, etc. O resultado do algoritmo de agrupamento é agrupar cada ponto em um dos quatro (ou mais) agrupamentos. No exemplo da Figura 4, n = 2 porque são usadas duas métricas, intensidade e parâmetro temporal. Um exemplo bidimensional com proporção de intensidade e intervalo de tempo como um parâmetro temporal é representado na Figura 4. No entanto, outras métricas podem ser usadas.
[0072] Outro exemplo bidimensional envolve obter tanto um parâmetro temporal como um parâmetro espectral, o parâmetro espectral estando no eixo vertical (y) da Figura 4 em vez da intensidade. Neste exemplo, a informação espectral é obtida em relação à luz emitida para cada evento de incorporação e usada para distinguir os nucleotídeos.
[0073] No entanto, qualquer número de métricas pode ser usado, não limitado a duas. Por exemplo, em algumas modalidades, informações espectrais para um evento de incorporação podem ser obtidas, além da intensidade e um parâmetro temporal, as quais podem ser representadas como pontos no espaço tridimensional, com a intensidade, parâmetro temporal e informação espectral estando nos respectivos eixos.
[0074] Após agrupar os pontos, pode ser benéfico refinar ainda mais os grupos, potencialmente com mais métricas do que aquelas usadas na etapa inicial de agrupamento. Para esta finalidade, uma máquina de vetores de suporte (eu SVM) ou outro classificador supervisionado pode ser usado. O agrupamento de marcadores pode ser usado como dados de treinamento inicial. Este processo pode ser repetido usando os resultados da iteração mais recente do classificador como o treinamento para a próxima iteração, até convergir.
[0075] Embora um algoritmo de agrupamento possa ser usado para atribuir pontos a agrupamentos, em algumas modalidades, os pontos podem ser atribuídos a grupos sem usar um algoritmo de agrupamento. Em algumas modalidades, os limites entre grupos de pontos podem ser determinados sem executar um algoritmo de agrupamento.
[0076] Na etapa S14, os grupos de pontos podem ser atribuídos a nucleotídeos. Esta atribuição pode ser realizada com base nas características conhecidas dos marcadores. Por exemplo, no gráfico da Figura 4, pode-se saber que o marcador para uma T tem uma elevada intensidade e menor durabilidade, o marcador para A tem uma baixa intensidade e durabilidade moderada, o marcador para G tem uma elevada intensidade e duração moderada e o marcador para C tem a maior durabilidade e uma elevada intensidade. Os agrupamentos de pontos podem ser atribuídos às bases usando a posição dos agrupamentos uns em relação aos outros. Por exemplo, o agrupamento com a menor durabilidade pode ser atribuído à T, o agrupamento com a maior durabilidade pode ser atribuído à C, o agrupamento com a menor intensidade pode ser atribuído à A e o agrupamento restante pode ser atribuído à G. Os pontos em cada agrupamento podem ser atribuídos ao nucleotídeo em seu agrupamento. Ao armazenar informações sobre o tempo no qual cada medição de intensidade e característica temporal foi realizada, a fita de nucleotídicos pode ser sequenciada.
[0077] Se o método for usado para executar o sequenciamento, o método poderá terminar neste ponto. Se o método for usado para calibração, o método pode continuar na etapa S15. Os inventores reconheceram e apreciaram que, se for executada uma calibração inicial, não é necessário executar um algoritmo de agrupamento para atribuir todos os pontos aos nucleotídeos. Em algumas modalidades, os critérios de calibração podem ser determinados para atribuir um ponto a um tipo de nucleotídeo. Como um exemplo, após agrupamento na etapa S13 ou atribuição dos nucleotídeos na etapa S14, podem ser determinados os limites entre os diferentes tipos de nucleotídeos. Os limites podem ser funções que definem regiões de um espaço de fase, conforme ilustrado na Figura 5. Os eixos do espaço de fase podem incluir intensidade, parâmetro temporal, comprimento de onda de emissão e/ou comprimento de onda de excitação dos pulsos do laser de excitação. Como um exemplo, segmentos de linha ou curvas no espaço bidimensional podem ser selecionados para delinear os limites 51 entre os diferentes nucleotídeos, conforme mostrado na Figura 5. No espaço dimensional superior, os limites podem ser superfícies ou objetos de dimensão superior (denominados "hiperplanos"). Uma vez que os limites 51 sejam determinados, os pontos podem ser atribuídos aos nucleotídeos ao avaliar suas posições em relação aos limites e o agrupamento não precisa ser executado. Consequentemente, em algumas modalidades, um instrumento de sequenciamento pode ser calibrado para delinear os limites 51. O processo de calibração pode ser realizado usando o mesmo conjunto de marcadores que durante o sequenciamento de um ácido nucleico. Como outro exemplo de realização de calibração na etapa S15, os centroides dos agrupamentos podem ser determinados, o que pode permitir atribuir os pontos aos nucleotídeos com base nos quais o agrupamento tem um centroide que é mais próximo de um ponto individual. Independentemente do tipo de critério de calibração determinado, os critérios de calibração são, então, armazenados (por exemplo, em uma memória do instrumento) para uso posterior.
[0078] A calibração pode ser realizada em qualquer momento adequado. Em algumas modalidades, a calibração pode ser desejável antes do primeiro uso do instrumento, ao usar um novo conjunto de marcadores quando de uma mudança nas condições ambientais nas quais o instrumento é usado ou após um período de uso que leva em conta o envelhecimento dos componentes do instrumento. A calibração pode ser executada em resposta a uma solicitação de um usuário, tal como ao pressionar um botão no instrumento ou enviar um comando de calibração para o instrumento a partir de outro dispositivo ou automaticamente com base em um cronograma ou conforme a necessidade em resposta à determinação, pelo software do instrumento, de que o desempenho está abaixo do ideal. Uma vez obtidos os critérios de calibração, o sequenciamento pode ser realizado mais rapidamente ao avaliar os pontos detectados em relação aos critérios de calibração.
[0079] A Figura 6 mostra um fluxograma de um algoritmo que pode ser usado pelo chamador de base para identificar nucleotídeos com base em um ou mais critérios de calibração. Os parâmetros da luz (por exemplo, intensidade e um parâmetro temporal) podem ser determinados nas etapas S11 e S12, as quais podem ser as mesmas conforme aquelas mostradas na Figura 3 e as etapas S11 e S12 podem ser realizadas em qualquer ordem, conforme discutido acima. Na etapa S33, os nucleotídeos podem ser identificados ao avaliar os parâmetros medidos da luz (por exemplo, o parâmetro temporal e intensidade) usando a informação sobre calibração armazenada. Por exemplo, se as informações sobre calibração armazenadas incluem um ou mais limites entre os agrupamentos de nucleotídeos, os pontos podem ser atribuídos a nucleotídeos ao comparar os pontos com os limites, o que é mais computacionalmente eficiente do que realizar agrupamento. Como outro exemplo, os pontos podem ser atribuídos aos nucleotídeos ao calcular a distância de um ponto para cada um dos quatro centroides dos agrupamentos de nucleotídeos, então, atribuir o ponto ao nucleotídeo com o centroide que está mais próximo. Esta técnica é ilustrada na Figura 7, a qual mostra um ponto 61 que representa uma intensidade medida e um parâmetro temporal. Também mostrado na Figura 6 são os centroides dos marcadores que correspondem aos quatro nucleotídeos. Para determinar qual centroide está mais próximo, a distância do ponto 61 para cada um dos quatro centroides pode ser calculada e o nucleotídeo é atribuído ao ponto 61 que tem seu centroide a menor distância do ponto 61. Conforme mostrado, o ponto 61 é o mais próximo do centroide para o marcador que corresponde ao nucleotídeo "A". Assim, o ponto 61 é determinado como correspondendo ao nucleotídeo "A".
[0080] Em algumas modalidades, a identificação de nucleotídeos inclui executar agrupamento em uma primeira porção de pontos associados a eventos de incorporação e ao uso de critérios de calibração para executar as chamadas de base em uma segunda porção de pontos. A primeira porção pode incluir qualquer número adequado de pontos para fornecer um nível desejado de precisão nos critérios de calibração.
[0081] Em algumas modalidades, um nível de confiança de que um ponto corresponde a um tipo particular de nucleotídeo pode ser determinado. Como um exemplo, a distância de um ponto a partir de um centroide de uma região, tal como os centroides mostrados na Figura 5, pode ser usada para determinar um nível de confiança para o ponto. Pontos com uma pequena distância do centroide podem ter um alto nível de confiança, indicando que o ponto é muito provavelmente identificado corretamente como correspondendo a um nucleotídeo, enquanto que é menos provável que pontos que têm uma distância maior do centroide, ou que estão um pouco mais próximos de um centroide do que outros, sejam corretamente identificados. Neste exemplo, o nível de confiança pode ser quantificado com base na distância entre o ponto e o centroide ou com base na comparação da distância entre o ponto e o centroide com a distância entre o ponto e um ou mais de outros centroides. Como outro exemplo, se os critérios de calibração incluem um ou mais limites entre os agrupamentos, o nível de confiança pode ser quantificado ao determinar a distância entre o ponto e um ou mais limites. Pontos que estão mais próximos de um limite podem receber um nível de confiança menor. Em algumas modalidades, o nível de confiança para cada identificação de nucleotídeos pode ser armazenado além do armazenamento da própria identificação de nucleotídeos.
[0082] Em algumas modalidades, o nível de confiança depende dos critérios de calibração e de quão bem os critérios de calibração se ajustam aos dados de calibração. Quanto mais precisamente os critérios de calibração se ajustarem aos dados de calibração, maiores serão os níveis de confiança para diferentes pontos.
[0083] Em algumas modalidades, o nível de confiança pode depender da duração do momento do evento de incorporação associado a um ponto, uma vez que o nível de confiança pode depender da relação sinal-ruído do pulso identificado pelo chamador de pulsos. Como um exemplo, uma longa duração pode indicar que o chamador de pulsos não identificou dois eventos de incorporação subsequentes como eventos de incorporação do mesmo tipo de nucleotídeo. Em algumas modalidades, o chamador de base pode se comunicar com o chamador de pulsos para solicitar que o chamador reavalie a duração de tempo do evento de incorporação.
[0084] Em algumas modalidades, limites anteriormente derivados (por exemplo, um modelo SVM) podem ser aplicados a novas chamadas de pulso para determinar as sequências de nucleotídeos apropriadas incorporadas em cada evento de chamada de pulso. As métricas da chamada de pulsos são primeiramente escalonadas e, portanto, os limites anteriormente derivados podem ser aplicados para classificar este evento de incorporação.
[0085] Para obter limites que generalizam os dados de chamadas de pulso de vários pixels, pode ser necessário escalonar (ou normalizar) cada conjunto de dados de chamadas de pulso de cada pixel na matriz antes de incluir estes dados no conjunto de dados de calibragem. Ao escalonar a métrica de intensidade ao agrupar apenas a intensidade e usar um ou mais destes grupos como a média ou a mediana da intensidade, pode-se normalizar a métrica da intensidade de todas as chamadas de pulso recebidas. Este escalonamento, ou normalização, é aplicado durante a fase de calibração, bem como durante a fase de chamada de base, usando os dados de calibração armazenados. Isto tem o benefício de não requerer que limites sejam gerados para cada pixel na matriz, o que é um aprimoramento no desempenho e permite escalonamento para matrizes muito grandes, onde todos os dados podem, tipicamente, não se ajustar à RAM de uma só vez. Um benefício adicional é uma redução no tempo de execução, já que um número menor de pulsos precisaria ser separado por intensidade e escalonado ou normalizado para o conjunto de dados de calibração. Esta abordagem também permite que menos pulsos sejam armazenados e agrupados antes de estabelecer os fatores de escalonamento ou normalização, deste modo, permitindo enviar chamadas de base quase em tempo real à medida que os dados são adquiridos a partir da matriz de pixels.
[0086] Tendo descrito técnicas que podem ser implementadas por um chamador de pulsos e um chamador de base para realizar o sequenciamento e/ou calibração de um instrumento de sequenciamento, um exemplo de um instrumento de sequenciamento adequado será descrito agora. Em algumas modalidades, o instrumento é configurado para interagir com um dispositivo integrado que inclui uma matriz de pixels. Uma superfície do dispositivo integrado tem uma pluralidade de cavidades de amostra, onde uma cavidade de amostras é configurada para receber uma amostra de um espécime colocado na superfície do dispositivo integrado. Um espécime pode conter múltiplas amostras e, em algumas modalidades, diferentes tipos de amostras. A pluralidade de cavidades de amostra pode ter um tamanho e formato adequados, de modo que pelo menos uma parte das cavidades de amostra receba uma amostra de um espécime. Em algumas modalidades, o número de amostras dentro de uma cavidade de amostras pode ser distribuído entre as cavidades de amostra, de modo que algumas cavidades de amostra contenham uma amostra, com outras contendo zero, duas ou mais amostras.
[0087] Em algumas modalidades, uma amostra pode conter múltiplos modelos de DNA fita simples e cavidades de amostra individuais sobre uma superfície de um dispositivo integrado podem ser dimensionadas e moldadas para receber um modelo de DNA fita simples. Os modelos de DNA fita simples podem ser distribuídos entre as cavidades de amostras do dispositivo integrado, de modo que pelo menos uma parte das cavidades de amostras do dispositivo integrado contenha um padrão de DNA fita simples. A amostra também pode conter dNTPs marcados que entram na cavidade da amostra e podem permitir a identificação de um nucleotídeo à medida que ele é incorporado em uma fita de DNA complementar ao modelo de DNA fita simples na cavidade de amostras. Em tal exemplo, a "amostra" pode se referir tanto ao DNA fita simples quanto ao dNTP marcado que está sendo atualmente incorporado por uma polimerase. Em algumas modalidades, a amostra pode conter modelos de DNA fita simples e os dNTPS marcados podem ser subsequentemente introduzidos em uma amostra, bem como os nucleotídeos são incorporados em uma fita de DNA complementar dentro da cavidade da amostra. Deste modo, o momento de incorporação dos nucleotídeos pode ser controlado quando os dNTP marcados são introduzidos nas cavidades de amostra de um dispositivo integrado.
[0088] A energia de excitação é fornecida a partir de uma fonte de excitação localizada separada da matriz de pixels do dispositivo integrado. A energia de excitação é direcionada, pelo menos em parte, por elementos do dispositivo integrado em direção a um ou mais pixels para iluminar uma região de iluminação dentro da cavidade de amostras. Um marcador pode, então, emitir energia de emissão quando localizado dentro da região de iluminação e em resposta ao ser iluminado pela energia de excitação. Em algumas modalidades, uma ou mais fontes de excitação fazem parte do instrumento do sistema onde os componentes do instrumento e o dispositivo integrado estão configurados para direcionar a energia de excitação para um ou mais pixels.
[0089] A energia de emissão emitida por uma amostra pode, então, ser detectada por um ou mais sensores dentro de um pixel do dispositivo integrado. As características da energia de emissão detectada podem fornecer uma indicação para identificar o marcado associado à energia de emissão. Tais características podem incluir qualquer tipo adequado de característica, incluindo um tempo de chegada de fótons detectados por um sensor, uma quantidade de fótons acumulados ao longo do tempo por um sensor e/ou uma distribuição de fótons através de dois ou mais sensores. Em algumas modalidades, um sensor pode ter uma configuração que permita a detecção de uma ou mais características de periodicidade associadas à energia de emissão proveniente de uma amostra (por exemplo, durabilidade de fluorescência). O sensor pode detectar uma distribuição dos tempos de chegada de fótons depois que um pulso de energia de excitação se propaga através do dispositivo integrado e a distribuição dos tempos de chegada pode fornecer uma indicação de uma característica de tempo da energia de emissão da amostra (por exemplo, uma aproximação para a durabilidade da fluorescência). Em algumas modalidades, um ou mais sensores fornecem uma indicação da probabilidade de emissão de energia emitida pelo marcador (por exemplo, intensidade de fluorescência). Em algumas modalidades, uma pluralidade de sensores pode ser dimensionada e arranjada para capturar uma distribuição espacial da energia de emissão. Os sinais produzidos a partir de um ou mais sensores podem, então, ser usados para distinguir um marcador dentre uma pluralidade de marcadores, onde a pluralidade de marcadores pode ser usada para identificar uma amostra dentro do espécime.
[0090] Uma vista geral esquemática do sistema 2-100 é ilustrada nas Figuras 2-1A e 2-1B. O sistema compreende um dispositivo integrado 2-102 que faz interface com um instrumento 2-104. Em algumas modalidades, o instrumento 2-104 pode incluir uma ou mais fontes de excitação 2-106 integradas como parte do instrumento 2-104. Em algumas modalidades, uma fonte de excitação pode ser externa tanto ao instrumento 2-104 como ao dispositivo integrado 2-102 e o instrumento 2-104 pode ser configurado para receber energia de excitação a partir da fonte de excitação e direcioná-la para o dispositivo integrado. O dispositivo integrado pode interagir com o instrumento usando qualquer tomada adequada para receber o dispositivo integrado e mantê-lo em alinhamento óptico preciso com a fonte de excitação. A fonte de excitação 2-106 pode ser configurada para fornecer energia de excitação ao dispositivo integrado 2-102. Conforme ilustrado esquematicamente na Figura 2-1B,o dispositivo integrado 2-102 tem vários pixels, em que pelo menos uma parte dos pixels 2-112 pode executar uma análise independente de uma amostra. Tais pixels 2-112 podem ser denominados como "pixels de fonte passiva", uma vez que um pixel recebe energia de excitação de uma fonte 2-106 separada do pixel, onde a fonte excita uma pluralidade de pixels. Um pixel 2-112 tem uma cavidade de amostras 2-108 configurada para receber uma amostra e um sensor 2-110 para detectar a energia de emissão emitida pela amostra em resposta à iluminação da amostra com a energia de excitação fornecida pela fonte de excitação 2-106. A cavidade da amostra 2-108 pode reter a amostra na proximidade de uma superfície do dispositivo integrado 2-102 para permitir facilidade na distribuição da energia de excitação para a amostra e detecção da energia de emissão a partir da amostra.
[0091] Elementos ópticos para orientar e acoplar a energia de excitação à cavidade de amostras 2-108 estão localizados tanto no dispositivo integrado 2-102 como no instrumento 2-104. Estes elementos fonte-para-cavidade podem compreender um ou mais dispositivos de acoplamento de grade localizados no dispositivo integrado 2-102 para acoplar a energia de excitação ao dispositivo integrado e guias de onda para fornecer a energia de excitação do instrumento 2-104 para as cavidades de amostras nos pixels 2-112. Em algumas modalidades, os elementos localizados no dispositivo integrado podem atuar para direcionar a energia de emissão da amostra para o sensor. A cavidade de amostras 2-108, uma parte da óptica de fonte-para-cavidade de excitação e a óptica de cavidade-para-sensor da amostra estão localizadas no dispositivo integrado 2-102. A fonte de excitação 2-106 e uma parte dos componentes fonte-para-cavidade estão localizados no instrumento 2-104. Em algumas modalidades, um único componente pode desempenhar um papel tanto acoplamento da energia de excitação à cavidade de amostras 2-108 como no fornecimento da energia de emissão proveniente da cavidade de amostras 2-108 para o sensor 2-110. Exemplos de componentes adequados para acoplar a energia de excitação a uma cavidade de amostras e/ou direcionar a energia de emissão para um sensor a serem incluídos em um dispositivo integrado são descritos no Pedido de Patente dos Estados Unidos 14/821.688, intitulado "INTEGRATED DEVICE FOR PROBING, DETECTING AND ANALYZING MOLECULES" e Pedido de Patente dos Estados Unidos 14/543.865 intitulado "INTEGRATED DEVICE WITH EXTERNAL LIGHT SOURCE FOR PROBING, DETECTING, AND ANALYZING MOLECULES", ambos os quais são incorporados por referência na íntegra.
[0092] Conforme ilustrado na Figura 2-1B, o dispositivo integrado compreende uma pluralidade de pixels onde um pixel 2-112 está associado à sua própria cavidade de amostras 2-108 individual e pelo menos um sensor 2-110. A pluralidade de pixels pode ser organizada em uma matriz e pode haver qualquer número adequado de pixels na matriz. O número de pixels no dispositivo integrado 2-102 pode estar na faixa de aproximadamente 10.000 pixels a 1.000.000 pixels ou qualquer valor ou faixa de valores dentro desta faixa. Em algumas modalidades, os pixels podem estar arranjados em uma matriz de 512 pixels por 512 pixels. O dispositivo integrado 2-102 e o instrumento 2-104 podem incluir links de comunicação multicanal de alta velocidade para manipular dados associados a matrizes de pixels grandes (por exemplo, mais de 10.000 pixels).
[0093] O instrumento 2-104 interage com o dispositivo integrado 2 102 através da interface do dispositivo integrado 2-114. A interface do dispositivo integrado 2-114 pode incluir componentes para posicionar e/ou alinhar o dispositivo integrado 2-102 ao instrumento 2-104 para melhorar o acoplamento da energia de excitação da fonte de excitação 2-106 para o dispositivo integrado 2-102. A fonte de excitação 2-106 pode ser qualquer fonte de luz adequada que esteja posicionada para fornecer energia de excitação para pelo menos uma cavidade de amostras. Exemplos de fontes de excitação adequadas são descritos no Pedido de Patente dos Estados Unidos 14/821688 intitulado "INTEGRATED DEVICE FOR PROBING, DETECTING AND ANALYZING MOLECULES", o qual é incorporado por referência na íntegra. Em algumas modalidades, a fonte de excitação 2-106 inclui múltiplas fontes de excitação que são combinadas para fornecer a energia de excitação ao dispositivo integrado 2-102. As múltiplas fontes de excitação podem ser configuradas para produzir múltiplas energias de excitação ou comprimentos de onda. A interface do dispositivo integrado 2-114 pode receber sinais de leitura dos sensores nos pixels localizados no dispositivo integrado. A interface do dispositivo integrado 2-114 pode ser concebida de modo que o dispositivo integrado se ligue ao instrumento ao prender o dispositivo integrado à interface do dispositivo integrado 2-114.
[0094] O instrumento 2-104 inclui uma interface de usuário 2-116 para controlar a operação do instrumento 2-104. A interface de usuário 2-116 é configurada para permitir que um usuário insira informações no instrumento, tais como comandos e/ou configurações usadas para controlar o funcionamento do instrumento. Em algumas modalidades, a interface de usuário 2-116 pode incluir botões, chaves, discadores e um microfone para comandos de voz. Além disso, a interface de usuário 2116 pode permitir que um usuário receba feedback sobre o desempenho do instrumento e/ou dispositivo integrado, tal como o alinhamento adequado e/ou informações obtidas por sinais de leitura dos sensores no dispositivo integrado. Em algumas modalidades, a interface de usuário 2-116 pode fornecer feedback usando um alto-falante para fornecer feedback audível e luzes indicadoras e/ou tela de exibição para fornecer feedback visual. Em algumas modalidades, o instrumento 2104 inclui uma interface de computador 2-118 usada para conectar com um dispositivo de computação 2-120. Qualquer interface de computador 2-118 e dispositivo de computação 2-120 adequados podem ser usados. Por exemplo, a interface do computador 2-118 pode ser uma interface USB ou uma interface FireWire. O dispositivo de computação 2-120 pode ser qualquer computador de uso geral, tal como um laptop ou desktop. A interface de computador 2-118 facilita a comunicação de informações entre o instrumento 2-104 e o dispositivo de computação 2-120. As informações de entrada para controlar e/ou configurar o instrumento 2-104 podem ser fornecidas através do dispositivo de computação 2-120 conectado à interface de computador 2-118 do instrumento. A informação produzida pode ser recebida pelo dispositivo de computação 2-120 através da interface de computador 2-118. Tal informação produzida pode incluir informação sobre o desempenho do instrumento 2-104 e/ou dispositivo integrado 2-112 e informação sobre os sinais de leitura do sensor 2-110. O instrumento 2-104 também pode incluir um dispositivo de processamento 2-122 para analisar dados recebidos a partir do sensor 2-110 e/ou enviar sinais de controle para a fonte de excitação 2-106. Em algumas modalidades, o dispositivo de processamento 2-122 pode compreender um processador de uso geral, um processador especialmente adaptado (por exemplo, uma unidade de processamento central (em inglês, CPU), tal como um ou mais núcleos de microprocessador ou microcontrolador, um FPGA (Field- Programmable Gate Array), um ASIC (Application-Specific Integrated Circuit), um circuito integrado personalizado e um processador digital de sinais (em inglês, DSP)) ou uma combinação dos mesmos). Em algumas modalidades, o processamento de dados do sensor 2-110 pode ser realizado tanto pelo dispositivo de processamento 2-122 como pelo dispositivo de computação externo 2-120. Em outras modalidades, o dispositivo de computação 2-120 pode ser omitido e o processamento de dados do sensor 2-110 pode ser realizado apenas pelo dispositivo de processamento 2-122.
[0095] Um esquema seccional transversal do dispositivo integrado 3-102 que ilustra uma linha de pixels é mostrado na Figura 3-1A. Cada pixel 3-112 inclui uma cavidade de amostras 3-108 e um sensor 3110. O sensor 3-110 pode ser alinhado e posicionado em relação à cavidade de amostras 3-112, de modo que o sensor 3-110 receba a energia de emissão emitida por uma amostra dentro da cavidade de amostras 3-112. Exemplos de sensores adequados são descritos no Pedido de Patente dos Estados Unidos 14/821.656, intitulado "INTEGRATED DEVICE FOR TEMPORAL BINNING OF RECEIVED PHOTONS", o qual é incorporado por referência na íntegra.
[0096] Uma fonte de excitação acoplada ao dispositivo integrado pode fornecer a energia de excitação para um ou mais pixels do dispositivo integrado 3-102. A Figura 3-1B é um esquema que ilustra o acoplamento da fonte de excitação 3-106 ao dispositivo integrado 3-102 para fornecer a energia de excitação 3-130 (mostrada em linhas tracejadas) para o dispositivo integrado 3-102. A Figura 3-1B ilustra o percurso da energia de excitação da fonte de energia de excitação 3106 para uma cavidade de amostras 3-108 no pixel 3112. Componentes localizados fora do dispositivo integrado podem ser usados para posicionar e alinhar a fonte de excitação 3-106 ao dispositivo integrado. Tais componentes podem incluir componentes ópticos, incluindo lentes, espelhos, prismas, aberturas, atenuadores e/ou fibras ópticas. Componentes mecânicos adicionais podem ser incluídos no instrumento para permitir o controle de um ou mais componentes de alinhamento. Tais componentes mecânicos podem incluir acionadores, motores de passo e/ou botões.
[0097] O dispositivo integrado inclui componentes que direcionam a energia de excitação 3-130 para os pixels no dispositivo integrado. Dentro de cada pixel 3-112, a energia de excitação é acoplada à cavidade de amostras 3-108 associada ao pixel. Embora a Figura 3-1B ilustre o acoplamento da energia de excitação a cada cavidade de amostras em uma fila de pixels, em algumas modalidades, a energia de excitação pode não ser acoplada a todos os pixels em uma linha. Em algumas modalidades, a energia de excitação pode ser acoplada a uma parte dos pixels ou cavidades de amostras em uma linha de pixels do dispositivo integrado. A energia de excitação pode iluminar uma amostra localizada dentro de uma cavidade de amostras. A amostra pode atingir um estado excitado em resposta a ser iluminada pela energia de excitação. Quando uma amostra está em um estado excitado, a amostra pode emitir energia de emissão e a energia de emissão pode ser detectada por um sensor. A Figura 3-1B ilustra esquematicamente o percurso da energia de emissão 3-140 (mostrada como linhas sólidas) da cavidade de amostras 3-108 para o sensor 3110 do pixel 3-112. O sensor 3-110 no pixel 3-112 pode ser configurado e posicionado para detectar a energia de emissão proveniente da cavidade das amostras 3-108. Em algumas modalidades, o sensor 3110 pode incluir múltiplos sensores secundários.
[0098] Uma amostra a ser analisada pode ser introduzida na cavidade de amostras 3-108 do pixel 3-112. A amostra pode ser uma amostra biológica ou qualquer outra amostra adequada, tal como uma amostra química. A amostra pode incluir múltiplas moléculas e a cavidade de amostras pode ser configurada para isolar uma única molécula. Em alguns casos, as dimensões da cavidade de amostras podem atuar para confinar uma molécula individual dentro da cavidade de amostras ao permitir que as medições sejam realizadas na molécula individual. Uma fonte de excitação 3-106 pode ser configurada para fornecer a energia de excitação para a cavidade de amostras 3-108 de modo a excitar a amostra ou pelo menos um marcador luminescente ligado à amostra ou, de outra forma, associado à amostra enquanto ela estiver dentro de uma área de iluminação dentro da cavidade de amostras 3-108.
[0099] Quando uma fonte de excitação fornece a energia de excitação para uma cavidade de amostras, pelo menos uma amostra dentro da cavidade pode se iluminar e a emissão resultante pode ser detectada por um sensor. Conforme usado aqui, as frases "uma amostra pode se iluminar" ou "uma amostra pode emitir radiação" ou "emissão proveniente de uma amostra" significa que uma etiqueta, marcador ou repórter luminescente, a própria amostra ou um produto de reação associado à amostra que possa produzir a radiação emitida.
[00100] Um ou mais componentes de um dispositivo integrado podem direcionar a energia de emissão para um sensor. A energia ou energias de emissão podem ser detectadas pelo sensor e convertidas em pelo menos um sinal elétrico. Os sinais elétricos podem ser transmitidos ao longo de linhas condutoras no circuito do dispositivo integrado ligado ao instrumento através da interface do dispositivo integrado, tal como a interface do dispositivo integrado 2-114 do instrumento 2-104 mostrada na Figura 2-1B. Os sinais elétricos podem ser posteriormente processados e/ou analisados. O processamento ou análise de sinais elétricos pode ocorrer em um dispositivo de computação adequado ou localizado no instrumento 2-104 ou fora do instrumento, tal como o dispositivo de computação 2-120 mostrado na Figura 2-1B.
[00101] Em funcionamento, análises paralelas de amostras dentro das cavidades de amostras são realizadas ao excitar as amostras dentro das cavidades usando a fonte de excitação e detectar sinais da emissão da amostra com os sensores. A energia de emissão proveniente de uma amostra pode ser detectada por um sensor correspondente e convertida em pelo menos um sinal elétrico. O sinal ou sinais resultantes podem ser processados no dispositivo integrado em algumas modalidades ou transmitidos para o instrumento para processamento pelo dispositivo de processamento e/ou dispositivo de computação. Os sinais de uma amostra podem ser recebidos e processados independentemente dos sinais associados aos outros pixels.
[00102] Em algumas modalidades, uma amostra pode ser marcada com um ou mais marcadores e a emissão associada aos marcadores é discernível pelo instrumento. Por exemplo, o sensor pode ser configurado para converter os fótons da energia de emissão em elétrons para formar um sinal elétrico que pode ser usado para discernir uma durabilidade que é dependente da energia de emissão de um marcador específico. Ao usar marcadores com diferentes durabilidades para marcar as amostras, amostras específicas podem ser identificadas com base no sinal elétrico resultante detectado pelo sensor.
[00103] Uma amostra pode conter vários tipos de moléculas e diferentes marcadores luminescentes podem se associar exclusivamente a um tipo de molécula. Durante ou após excitação, o marcador luminescente pode emitir energia de emissão. Uma ou mais propriedades da energia de emissão podem ser usadas para identificar um ou mais tipos de moléculas na amostra. As propriedades da energia de emissão usada para distinguir entre tipos de moléculas podem incluir um valor de duração da fluorescência, intensidade e/ou comprimento de onda de emissão. Um sensor pode detectar fótons, incluindo fótons de energia de emissão, e fornecer sinais elétricos indicativos de uma ou mais destas propriedades. Em algumas modalidades, os sinais elétricos de um sensor podem fornecer informações sobre uma distribuição dos tempos de chegada de fótons através de um ou mais intervalos de tempo. A distribuição dos tempos de chegada dos fótons pode corresponder a quando um fóton é detectado depois que um pulso de energia de excitação é emitido por uma fonte de excitação. Um valor para um intervalo de tempo pode corresponder a um número de fótons detectados durante o intervalo de tempo. Valores relativos em múltiplos intervalos de tempo podem fornecer uma indicação de uma característica temporal da energia de emissão (por exemplo, durabilidade). A análise de uma amostra pode incluir distinguir entre marcadores ao comparar os valores para dois ou mais intervalos de tempo diferentes dentro de uma distribuição. Em algumas modalidades, uma indicação da intensidade pode ser fornecida pela determinação de um número de fótons em todas as posições de tempo em uma distribuição.
[00104] O termo "ácido nucleico", conforme usado aqui se refere, em geral, a uma molécula que compreende uma ou mais subunidades de ácido nucleico. Um ácido nucleico pode incluir uma ou mais subunidades selecionadas a partir de adenosina (A), citosina (C), guanina (G), timina (T) e uracila (U), ou variantes das mesmas. Em alguns exemplos, um ácido nucleico é ácido desoxirribonucleico (DNA) ou ácido ribonucleico (RNA) ou derivados dos mesmos. Um ácido nucleico pode ser fita simples ou fita dupla. Um ácido nucleico pode ser circular.
[00105] O termo "nucleotídeo", conforme usado aqui se refere, em geral, a uma subunidade de ácido nucleico a qual pode incluir A, C, G, T ou U, ou variantes ou análogos dos mesmos. Um nucleotídeo pode incluir qualquer subunidade que possa ser incorporada em uma fita de ácidos nucleicos em crescimento. Esta subunidade pode ser A, C, G, T ou U ou qualquer outra subunidade específica de um ou mais A, C, G, T ou U, ou complementar a uma purina (isto é, A ou G, ou variante ou análogos dos mesmos) ou uma pirimidina (isto é, C, T ou U, ou variante ou análogos dos mesmos).
[00106] Um nucleotídeo inclui, em geral, um nucleosídeo e pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais grupos fosfato (PO3). Um nucleotídeo pode incluir uma nucleobase, um açúcar com cinco carbonos (ribose ou desoxirribose) e um ou mais grupos fosfato. Os ribonucleotídeos são nucleotídeos nos quais o açúcar é ribose. Os desoxirribonucleotídeos são nucleotídeos nos quais o açúcar é desoxirribose. Um nucleotídeo pode ser um monofosfato de nucleosídeo ou um polifosfato de nucleosídeo. Um nucleotídeo pode ser um polifosfato de desoxirribonucleosídeo tal como, por exemplo, um trifosfato de desoxirribonucleosídeo, o qual pode ser selecionado a partir de trifosfato de desoxiadenosina (dATP), trifosfato de desoxicitidina (dCTP), trifosfato de desoxiguanosina (dGTP), trifosfato de desoxiuridina (dUTP) e dNTPs de trifosfato de desoxitimidina (dTTP), os quais incluem marcadores detectáveis (por exemplo, fluoroforos).
[00107] Em algumas modalidades, as técnicas descritas aqui podem ser realizadas usando um ou mais dispositivos de computação. As modalidades não estão limitadas a operar com qualquer tipo particular de dispositivo de computação.
[00108] A Figura 8 é um diagrama de blocos de um dispositivo de computação 1000 ilustrativo. O dispositivo de computação 1000 pode incluir um ou mais processadores 1001 e um ou mais meios de armazenamento legíveis em computador, não transitórios (por exemplo, memória 1003). A memória 1003 pode armazenar, em um meio gravável em computador não transitório tangível, instruções de programas de computador as quais, quando executadas, implementam qualquer uma das funcionalidades descritas acima. O(s) processador(es) 1001 pode(m) ser acoplado(s) à memória 1003 e pode(m) executar tais instruções de programa de computador para fazer com que a funcionalidade seja realizada e executada.
[00109] O dispositivo de computação 1000 também pode incluir uma interface de entrada/saída de rede (I/O) 1005 através da qual o dispositivo de computação pode se comunicar com outros dispositivos de computação (por exemplo, através de uma rede) e também pode incluir uma ou mais interfaces de I/O de usuário através das quais o dispositivo de computação pode fornecer a saída e receber a entrada de um usuário. As interfaces de I/O do usuário podem incluir dispositivos tais como teclado, mouse, microfone, dispositivo de exibição (por exemplo, monitor ou tela sensível ao toque), alto-falantes, câmera e/ou vários outros tipos de dispositivos de I/O.
[00110] As modalidades descritas acima podem ser implementadas de várias maneiras. Por exemplo, as modalidades podem ser implementadas usando hardware, software ou uma combinação dos mesmos. Quando implementadas em software, o código do software pode ser executado em qualquer processador adequado (por exemplo, um microprocessador) ou conjunto de processadores, seja em um único dispositivo de computação ou distribuído entre vários dispositivos de computação. Será apreciado que qualquer componente ou coleção de componentes que executam as funções descritas acima pode ser genericamente considerada como um ou mais controladores que controlam as funções discutidas acima. Um ou mais controladores podem ser implementados de várias maneiras, tal como com hardware dedicado ou com hardware de uso geral (por exemplo, um ou mais processadores) o qual é programado usando microcódigos ou software para executar as funções citadas acima.
[00111] A este respeito, será observado que uma implementação das modalidades descritas aqui compreende pelo menos um meio de armazenamento legível em computador (por exemplo, RAM, ROM e EPROM, memória flash ou outra tecnologia de memória, CD-ROM, discos digitais versáteis (DVD) ou outro armazenamento em disco óptico, cassetes magnéticos, fita magnética, armazenamento em disco magnético ou outros dispositivos de armazenamento magnético ou outro meio de armazenamento legível em computador não transitório) codificado com um programa de computador (isto é, uma pluralidade de instruções executáveis) quando executado em um ou mais processadores que executam as funções discutidas acima de uma ou mais modalidades. O meio legível em computador pode ser portátil, de modo que o programa armazenado no mesmo possa ser carregado em qualquer dispositivo de computação para implementar aspectos das técnicas discutidas aqui. Além disso, será apreciado que referência a um programa de computador o qual, quando executado, executa qualquer uma das funções discutidas acima, não está limitada a um programa de aplicativos em execução em um computador hospedeiro. Em vez disso, os termos programa de computador e software são usados aqui em um sentido genérico para se referir a qualquer tipo de código de computador (por exemplo, software de aplicativo, firmware, microcódigo ou qualquer outra forma de instrução de computador) que possa ser empregado para programar um ou mais processadores para implementar os aspectos das técnicas discutidas aqui.
[00112] Vários aspectos da presente invenção podem ser usados individualmente, em combinação ou em uma variedade de configurações não especificamente discutidas nas modalidades descritas no precedente e, portanto, sua aplicação não está limitada aos detalhes e configuração dos componentes apresentados na descrição anterior ou ilustrada nos desenhos. Por exemplo, os aspectos descritos em uma modalidade podem ser combinados de qualquer maneira com aspectos descritos em outras modalidades.
[00113] Além disso, a invenção pode ser incorporada como um método do qual um exemplo foi fornecido. Os atos realizados como parte do método podem ser ordenados de qualquer maneira adequada. Consequentemente, podem ser construídas modalidades nas quais os atos são realizados em uma ordem diferente daquela ilustrada, o que pode incluir a realização de alguns atos simultaneamente, mesmo que eles sejam mostrados como atos sequenciais em modalidades ilustrativas.
[00114] O uso de termos ordinais como "primeiro", "segundo", "terceiro", etc., nas reivindicações para modificar um elemento de reivindicação não denota, por si só, qualquer prioridade, precedência ou ordem de um elemento reivindicado sobre outro ou a ordem temporal na qual os atos de um método são executados, mas são usados meramente como marcadores para distinguir um elemento reivindicado que tem um determinado nome de outro elemento com um mesmo nome (mas para uso do termo ordinal) para distinguir os elementos reivindicados.
[00115] Além disso, a fraseologia e terminologia usadas aqui são para fins de descrição e não devem ser consideradas como limitativos. O uso de "incluindo", "compreendendo", "tendo", " contendo", "envolvendo" e variações dos mesmos aqui se destina a abranger os itens listados a seguir e seus equivalentes, bem como itens adicionais.

Claims (50)

1. Método de identificação de nucleotídeos, caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz; e agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente; e atribuir os grupos de pontos a nucleotídeos individuais.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que que a característica temporal compreende uma durabilidade de luminância ou uma proporção de fótons detectados em diferentes intervalos de tempo.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que que o agrupamento dos pontos é realizado por um algoritmo de agrupamento.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que que o algoritmo de agrupamento realiza o agrupamento por k-média, em que k é maior do que ou igual a quatro.
5. Método, de acordo com qualquer uma das reivindicação 1 a 4, caracterizado pelo fato de que os grupos de pontos individuais são atribuídos aos nucleotídeos individuais com base em características de emissão de luz predeterminadas de marcadores luminescentes.
6. Método para calibrar um instrumento de sequenciamento, caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz; agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente; atribuir grupos individuais de pontos a nucleotídeos individuais; determinar um ou mais critérios que distinguem os grupos de pontos; e armazenar o um ou mais critérios.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que que o um ou mais critérios compreendem um ou mais limites entre os grupos de pontos.
8. Método, de acordo com a reivindicação 6 ou 7, caracterizado pelo fato de que que o um ou mais critérios compreendem os centroides dos grupos de pontos.
9. Método, de acordo com qualquer uma das reivindicações 6 a 8, caracterizado pelo fato de que os um ou mais critérios são armazenados na memória não volátil.
10. Método, de acordo com qualquer uma das reivindicação 6 a 9, caracterizado pelo fato de que o agrupamento de pontos compreende a execução de um algoritmo de agrupamento de pontos.
11. Método de identificação de nucleotídeos, o método caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: 1. uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e 11. uma característica de intensidade da luz; e atribuir os nucleotídeos aos eventos de incorporação aos nucleotídeos ao avaliar a característica temporal e a característica da intensidade levando em consideração os critérios armazenados para um instrumento de sequenciamento que distingue as características da luz para os marcadores luminescentes.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que os critérios armazenados compreendem um ou mais limites entre as características dos marcadores luminescentes para diferentes nucleotídeos e a atribuição dos eventos de incorporação de nucleotídeos compreende comparar um ponto que representa a característica temporal e a característica de intensidade com um ou mais limites.
13. Método, de acordo com a reivindicação 11 ou 12, caracterizado pelo fato de que o um ou mais critérios armazenados compreendem centroides de grupos de pontos, cada grupo correspondendo a um respectivo nucleotídeo, e a atribuição dos eventos de incorporação de nucleotídeos compreende: determinar as distâncias entre um ponto que representa a característica temporal e a característica de intensidade para um evento de incorporação aos centroides; e atribuir o evento de incorporação de nucleotídeos a um nucleotídeo com um centroide mais próximo do ponto.
14. Método, de acordo com qualquer uma das reivindicação de 11 a 13, caracterizado pelo fato de que os armazenados critérios são os critérios de calibração armazenados na memória não-volátil.
15. Método de identificação de nucleotídeos, caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma segunda característica da luz; e agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente; e atribuir os grupos de pontos a nucleotídeos individuais.
16. Método para calibrar um instrumento de sequenciamento, caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma segunda característica da luz; agrupar pontos que representam as características dos eventos de incorporação de nucleotídeos em grupos de pontos, os pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente; atribuir grupos individuais de pontos a nucleotídeos individuais; determinar um ou mais critérios que distinguem os grupos de pontos; e armazenar o um ou mais critérios.
17. Método de identificação de nucleotídeos, o método caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz; e atribuir os nucleotídeos aos eventos de incorporação aos nucleotídeos ao avaliar a característica temporal e a segunda característica levando em consideração os critérios armazenados para um instrumento de sequenciamento que distingue as características da luz para os marcadores luminescentes.
18. Método, caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma característica de intensidade da luz; e determinar um ou mais critérios que distinguem grupos de pontos que representam as características dos eventos de incorporação de nucleotídeos, os pontos individuais representando a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeos correspondente.
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que ainda compreende atribuir os grupos aos respectivos nucleotídeos para produzir atribuições de nucleotídeos para os grupos.
20. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que ainda compreende atribuir os pontos aos nucleotídeos com base em um ou mais critérios e atribuições de nucleotídeos aos grupos.
21. Método, caracterizado pelo fato de que compreende: obter características da luz detectada a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características para cada evento de incorporação de nucleotídeos incluindo: i) uma característica temporal da luz, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons por um marcador luminescente após excitação; e ii) uma segunda característica da luz; e determinar um ou mais critérios que distinguem grupos de pontos que representam as características dos eventos de incorporação de nucleotídeos, os pontos individuais representando a característica temporal e a segunda característica para um evento de incorporação de nucleotídeos correspondente.
22. Método, caracterizado pelo fato de que compreende: receber primeira informação sobre intervalo de tempo em relação aos tempos nos quais um primeiro marcador luminescente emite luz em resposta a excitações do primeiro marcador luminescente; calcular a primeira informação sobre intensidade da luz com base na primeira informação sobre intervalo de tempo; receber segunda informação sobre intervalo de tempo em relação aos tempos nos quais um segundo marcador luminescente emite luz em resposta a excitações do segundo marcador luminescente; calcular a segunda informação sobre intensidade da luz com base na segunda informação sobre intervalo de tempo; e calcular os tempos nos quais ocorrem eventos de incorporação de nucleotídeos usando as primeira e segunda informações sobre intensidade da luz.
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que o cálculo dos tempos nos quais ocorrem os eventos de incorporação de nucleotídeos é realizado usando um algoritmo de identificação de pulsos.
24. Método, de acordo com a reivindicação 23, caracterizado pelo fato de que o algoritmo de identificação de pulsos compreende um algoritmo de pontos de mudança, um algoritmo de média/mediana e variância em execução ou um algoritmo de máquina de estados.
25. Método, de acordo com qualquer uma das reivindicações 22 a 24, caracterizado pelo fato de que o cálculo da informação sobre a primeira intensidade da luz compreende somar a primeira informação sobre intervalo de tempo e o cálculo da informação sobre a segunda intensidade da luz compreende somar a segunda informação sobre intervalo de tempo.
26. Método, caracterizado pelo fato de que compreende: receber primeira informação sobre intervalo de tempo em relação a tempos nos quais um primeiro marcador luminescente emite a primeira luz em resposta a excitações do primeiro marcador luminescente; calcular uma primeira característica temporal da primeira luz com base na primeira informação sobre intervalo de tempo, a característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons pelo primeiro marcador luminescente após excitação; receber segunda informação sobre intervalo de tempo em relação a tempos nos quais um segundo marcador luminescente emite uma segunda luz em resposta a excitações do segundo marcador luminescente; calcular uma segunda característica temporal da segunda luz com base na segunda informação sobre intervalo de tempo, a segunda característica temporal representando uma velocidade de declínio de uma probabilidade de emissão de fótons pelo segundo marcador luminescente após excitação; e calcular os tempos nos quais ocorrem eventos de incorporação de nucleotídeos usando as primeira e segunda características temporais.
27. Método, de acordo com a reivindicação 26, caracterizado pelo fato de que o cálculo dos tempos nos quais ocorrem os eventos de incorporação de nucleotídeos é realizado usando um algoritmo de identificação de pulsos.
28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que que o algoritmo de identificação de pulsos compreende um algoritmo de ponto de mudanças, um algoritmo de média/mediana e variância em execução ou um algoritmo de máquina de estados.
29. Método, caracterizado pelo fato de que compreende: determinar uma ou mais características temporais que representam uma velocidade de declínio de uma probabilidade de emissão de fótons por um ou mais marcadores luminescentes após excitação; e calcular os tempos nos quais ocorrem os eventos de incorporação de nucleotídeos usando pelo menos uma característica temporal.
30. Método, de acordo com a reivindicação 29, caracterizado pelo fato de que o cálculo dos tempos nos quais ocorrem os eventos de incorporação de nucleotídeos também é realizado usando uma intensidade da luz emitida por um ou mais marcadores luminescentes.
31. Método, caracterizado pelo fato de que compreende: receber informação sobre o intervalo de tempo em relação a tempos nos quais um marcador luminescente emite luz em resposta a excitações do marcador luminescente; calcular a informação sobre intensidade da luz com base na informação sobre intervalo de tempo; e calcular um tempo no qual pelo menos um evento de incorporação de nucleotídeos ocorre usando a informação sobre intensidade da luz.
32. Método, de acordo com a reivindicação 31, caracterizado pelo fato de que que o cálculo do tempo no qual ocorre pelo menos um evento de incorporação de nucleotídeos também é realizado usando uma característica temporal da luz.
33. Meio de armazenamento legível em computador não transitório, caracterizado pelo fato de que tem instruções armazenadas as quais, quando executadas por um processador, executam o método de acordo com qualquer reivindicação anterior.
34. Dispositivo, caracterizado pelo fato de que compreende: um processador configurado para executar o método de acordo com qualquer reivindicação anterior.
35. Instrumento de sequenciamento, caracterizado pelo fato de que compreende: um fotodetector configurado para receber luz proveniente de marcadores luminescentes durante uma reação de sequenciamento; e um processador configurado para executar o método de acordo com qualquer reivindicação anterior.
36. Método implementado por computador para identificar nucleotídeos, caracterizado pelo fato de que compreende: obter (S1, S11) de características de luz detectadas a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, incluindo as características, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de decaimento de uma probabilidade de emissão de fótons por um rótulo luminescente após excitação; e ii) uma intensidade característica da luz; e agrupar (S13) pontos representando as características dos eventos de incorporação de nucleotídeos em grupos de pontos, pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeo correspondente; e atribuir (S14) os grupos de pontos a nucleotídeos individuais.
37. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a característica temporal compreende um tempo de vida de luminância ou uma razão de fótons detectados em diferentes intervalos de tempo.
38. Método de acordo com a reivindicação 36 ou 37, caracterizado pelo fato de que o agrupamento dos pontos é realizado por um algoritmo de agrupamento.
39. Método, de acordo com a reivindicação 38, caracterizado pelo fato de que o algoritmo de agrupamento executa o agrupamento do meio k no qual k é maior ou igual a quatro.
40. Método, de acordo com qualquer uma das reivindicações 36 a 39, caracterizado pelo fato de que os grupos individuais de pontos são atribuídos a nucleotídeos individuais com base em características de emissão de luz predeterminadas dos marcadores luminescentes.
41. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que compreende ainda calibrar um instrumento de sequenciamento pelo menos em parte por: determinar um ou mais critérios que distinguem os grupos de pontos; e armazenar um ou mais critérios.
42. Método, de acordo com a reivindicação 41, caracterizado pelo fato de que um ou mais critérios compreendem um ou mais limites entre os grupos de pontos.
43. Método, de acordo com a reivindicação 41 ou 42, caracterizado pelo fato de que um ou mais critérios compreendem centróides dos grupos de pontos.
44. Método, de acordo com qualquer uma das reivindicações 36 a 43, caracterizado pelo fato de que um ou mais critérios são armazenados em memória não volátil.
45. Método, de acordo com qualquer uma das reivindicações 36 a 44, caracterizado pelo fato de que agrupar os pontos compreende executar um algoritmo de agrupamento nos pontos.
46. Aparelho, caracterizado pelo fato de que compreende: um processador (2-122, 1001) configurado para executar um método de identificação de nucleotídeos, o método compreendendo: obter características de luz detectadas a partir de marcadores luminescentes associados aos nucleotídeos durante eventos de incorporação de nucleotídeos, as características incluindo, para cada evento de incorporação de nucleotídeos: i) uma característica temporal da luz, a característica temporal representando uma velocidade de decaimento de uma probabilidade de emissão de fótons por um rótulo luminescente após excitação; e ii) uma intensidade característica da luz; e agrupar pontos representando as características dos eventos de incorporação de nucleotídeos em grupos de pontos, pontos individuais representando pelo menos a característica temporal e a característica de intensidade para um evento de incorporação de nucleotídeo correspondente; e atribuir os grupos de pontos a nucleotídeos individuais.
47. Aparelho, de acordo com a reivindicação 46, caracterizado pelo fato de que a característica temporal compreende um tempo de vida de luminância ou uma razão de fótons detectados em diferentes intervalos de tempo.
48. Aparelho de acordo com a reivindicação 46 ou 47, caracterizado pelo fato de que o agrupamento dos pontos é realizado por um algoritmo de agrupamento.
49. Aparelho, de acordo com a reivindicação 48, caracterizado pelo fato de que o algoritmo de agrupamento executa o agrupamento k-means no qual k é maior ou igual a quatro.
50. Aparelho, de acordo com qualquer uma das reivindicações 46 a 49, caracterizado pelo fato de que os grupos individuais de pontos são atribuídos a nucleotídeos individuais com base em características de emissão de luz predeterminadas dos marcadores luminescentes.
BR112018074572-3A 2016-06-01 2017-06-01 Métodos de identificação de nucleotídeos e para calibrar um instrumento de sequenciamento, meio de armazenamento legível em computador não transitório, dispositivo e instrumento de sequenciamento BR112018074572B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662343997P 2016-06-01 2016-06-01
US62/343,997 2016-06-01
PCT/US2017/035420 WO2017210413A1 (en) 2016-06-01 2017-06-01 Pulse caller and base caller

Publications (2)

Publication Number Publication Date
BR112018074572A2 BR112018074572A2 (pt) 2019-03-12
BR112018074572B1 true BR112018074572B1 (pt) 2024-02-27

Family

ID=59055317

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112018074572-3A BR112018074572B1 (pt) 2016-06-01 2017-06-01 Métodos de identificação de nucleotídeos e para calibrar um instrumento de sequenciamento, meio de armazenamento legível em computador não transitório, dispositivo e instrumento de sequenciamento

Country Status (11)

Country Link
US (2) US10711299B2 (pt)
EP (2) EP3465503B1 (pt)
JP (1) JP6931665B2 (pt)
KR (1) KR102425257B1 (pt)
CN (1) CN109313925B (pt)
AU (1) AU2017274412B2 (pt)
BR (1) BR112018074572B1 (pt)
CA (1) CA3026061A1 (pt)
MX (1) MX2018014856A (pt)
TW (1) TWI755400B (pt)
WO (1) WO2017210413A1 (pt)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2957540A1 (en) 2014-08-08 2016-02-11 Quantum-Si Incorporated Integrated device for temporal binning of received photons
US10441174B2 (en) 2016-02-17 2019-10-15 Tesseract Health, Inc. Sensor and device for lifetime imaging and detection applications
EP4113104A3 (en) * 2016-06-01 2023-02-22 Quantum-si Incorporated Integrated device for detecting and analyzing molecules
US10731209B2 (en) 2016-12-19 2020-08-04 Quantum-Si Incorporated Loading molecules into sample wells for analysis
BR112019012540A2 (pt) 2016-12-22 2019-11-12 Quantum-Si Incorporated fotodetector integrado com pixel de acondicionamento direto
US11120104B2 (en) 2017-03-01 2021-09-14 Stmicroelectronics (Research & Development) Limited Method and apparatus for processing a histogram output from a detector sensor
MX2019013111A (es) 2017-05-05 2019-12-16 Quantum Si Inc Sustratos que tienen reactividad de superficie modificada y propiedades antiincrustantes en reacciones biologicas.
KR102370055B1 (ko) * 2018-01-08 2022-03-03 일루미나, 인코포레이티드 반도체-기반 검출을 사용하는 고-처리율 서열분석용 시스템 및 디바이스
US11561196B2 (en) 2018-01-08 2023-01-24 Illumina, Inc. Systems and devices for high-throughput sequencing with semiconductor-based detection
MX2020007904A (es) * 2018-01-26 2020-09-07 Quantum Si Inc Llamado de pulso y base habilitado por maquina de aprendizaje para dispositivos de secuenciacion.
EP3811610A1 (en) 2018-06-22 2021-04-28 Quantum-Si Incorporated Integrated photodetector with charge storage bin of varied detection time
CA3109816A1 (en) * 2018-08-29 2020-03-05 Quantum-Si Incorporated System and methods for detecting lifetime using photon counting photodetectors
US11783917B2 (en) 2019-03-21 2023-10-10 Illumina, Inc. Artificial intelligence-based base calling
US11210554B2 (en) 2019-03-21 2021-12-28 Illumina, Inc. Artificial intelligence-based generation of sequencing metadata
US11593649B2 (en) 2019-05-16 2023-02-28 Illumina, Inc. Base calling using convolutions
EP4028570A1 (en) 2019-10-11 2022-07-20 Quantum-Si Incorporated Surface modification in the vapor phase
CA3168138A1 (en) 2020-01-14 2021-07-22 Quantum-Si Incorporated Integrated sensor for lifetime characterization
TW202145595A (zh) 2020-01-14 2021-12-01 美商寬騰矽公司 用於壽命及光譜特性分析之感應器
AU2021224871A1 (en) 2020-02-20 2022-09-08 Illumina, Inc. Artificial intelligence-based many-to-many base calling
EP4111178A1 (en) * 2020-03-02 2023-01-04 Quantum-si Incorporated Integrated sensor for multi-dimensional signal analysis
EP4133524A2 (en) 2020-04-08 2023-02-15 Quantum-si Incorporated Integrated sensor with reduced skew
CA3199745A1 (en) * 2020-10-27 2022-05-05 Quantum-Si Incorporated Calibration of single-molecule detection system
US20220336054A1 (en) 2021-04-15 2022-10-20 Illumina, Inc. Deep Convolutional Neural Networks to Predict Variant Pathogenicity using Three-Dimensional (3D) Protein Structures

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2155186A1 (en) * 1993-02-01 1994-08-18 Kevin M. Ulmer Methods and apparatus for dna sequencing
DE19744490A1 (de) * 1997-10-08 1999-04-15 Temp Rite International Gmbh Trinkwasseraufbereitungsanlage
JP4566299B2 (ja) * 1998-04-09 2010-10-20 シスメックス株式会社 赤芽球の分類計数方法
WO2000009753A1 (en) * 1998-08-11 2000-02-24 Caliper Technologies Corp. Methods and systems for sequencing dna by distinguishing the decay times of fluorescent probes
DE19844931C1 (de) * 1998-09-30 2000-06-15 Stefan Seeger Verfahren zur DNS- oder RNS-Sequenzierung
US7056661B2 (en) * 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
GB2382648B (en) * 2001-12-11 2003-11-12 Amersham Pharm Biotech Uk Ltd System and method for time correlated multi-photon counting measurements
WO2005120204A2 (en) * 2004-06-07 2005-12-22 The Regents Of The University Of California Method for single molecule fluorescence analysis
AU2008261935B2 (en) * 2007-06-06 2013-05-02 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
US8775092B2 (en) 2007-11-21 2014-07-08 Cosmosid, Inc. Method and system for genome identification
US20110165652A1 (en) * 2008-01-14 2011-07-07 Life Technologies Corporation Compositions, methods and systems for single molecule sequencing
CA2767521A1 (en) * 2009-07-10 2011-01-13 Perkinelmer Health Sciences, Inc. Detecting multinucleotide repeats
US9670243B2 (en) * 2010-06-02 2017-06-06 Industrial Technology Research Institute Compositions and methods for sequencing nucleic acids
US20140235474A1 (en) * 2011-06-24 2014-08-21 Sequenom, Inc. Methods and processes for non invasive assessment of a genetic variation
US9145623B2 (en) * 2011-07-20 2015-09-29 Thermo Fisher Scientific Oy Transposon nucleic acids comprising a calibration sequence for DNA sequencing
JP5790242B2 (ja) * 2011-07-25 2015-10-07 富士ゼロックス株式会社 故障予測装置及びプログラム
EP2831283A4 (en) * 2012-03-30 2015-11-04 Pacific Biosciences California METHODS AND COMPOSITION FOR SEQUENCING MODIFIED NUCLEIC ACIDS
SG11201408478QA (en) * 2012-06-18 2015-02-27 Nugen Technologies Inc Compositions and methods for negative selection of non-desired nucleic acid sequences
US10278624B2 (en) * 2013-05-23 2019-05-07 Iphenotype Llc Method and system for maintaining or improving wellness
JP6673843B2 (ja) 2013-11-17 2020-03-25 クアンタム−エスアイ インコーポレイテッドQuantum−Si Incorporated 分子をプローブし、検出し、分析するための光学システム及びアッセイ・チップ
WO2015095066A1 (en) 2013-12-16 2015-06-25 Complete Genomics, Inc. Basecaller for dna sequencing using machine learning
EP3143537B1 (en) 2014-05-12 2023-03-01 Roche Diagnostics GmbH Rare variant calls in ultra-deep sequencing
CN106796176B (zh) 2014-08-08 2021-02-05 宽腾矽公司 用于对分子进行探测、检测和分析的带外部光源的集成装置
BR112017002489B1 (pt) 2014-08-08 2023-02-14 Quantum-Si Incorporated Instrumento configurado para fazer interface com um chip de teste, aparelho, método de análise de um espécime, método para sequenciar uma molécula-alvo de ácido nucleico e método para sequenciamento de ácido nucleico
CA2957540A1 (en) * 2014-08-08 2016-02-11 Quantum-Si Incorporated Integrated device for temporal binning of received photons
US10185803B2 (en) 2015-06-15 2019-01-22 Deep Genomics Incorporated Systems and methods for classifying, prioritizing and interpreting genetic variants and therapies using a deep neural network
US9922285B1 (en) 2017-07-13 2018-03-20 HumanCode, Inc. Predictive assignments that relate to genetic information and leverage machine learning models

Also Published As

Publication number Publication date
KR20190015371A (ko) 2019-02-13
JP6931665B2 (ja) 2021-09-08
TWI755400B (zh) 2022-02-21
TW201800739A (zh) 2018-01-01
AU2017274412A1 (en) 2018-12-06
JP2019529865A (ja) 2019-10-17
KR102425257B1 (ko) 2022-07-27
US20170349944A1 (en) 2017-12-07
CN109313925B (zh) 2022-09-02
BR112018074572A2 (pt) 2019-03-12
EP3465503B1 (en) 2021-09-29
AU2017274412B2 (en) 2022-07-21
EP3465503A1 (en) 2019-04-10
MX2018014856A (es) 2019-03-07
CA3026061A1 (en) 2017-12-07
CN109313925A (zh) 2019-02-05
US20200291467A1 (en) 2020-09-17
EP4009330A1 (en) 2022-06-08
US10711299B2 (en) 2020-07-14
WO2017210413A1 (en) 2017-12-07

Similar Documents

Publication Publication Date Title
BR112018074572B1 (pt) Métodos de identificação de nucleotídeos e para calibrar um instrumento de sequenciamento, meio de armazenamento legível em computador não transitório, dispositivo e instrumento de sequenciamento
US20230207062A1 (en) Machine learning enabled pulse and base calling for sequencing devices
RU2736384C1 (ru) Секвенирование с помощью одиночного источника света и двух оптических каналов
ES2808824T3 (es) Métodos y sistemas para analizar datos de imagen
KR102515638B1 (ko) 뉴클레오타이드 서열분석 데이터의 이차 분석을 위한 시스템 및 방법
JP2019529865A5 (pt)
US20220238389A1 (en) Sample well fabrication techniques and structures for integrated sensor devices
BR112021009040A2 (pt) técnicas de fabricação de poço de amostra e estruturas para dispositivos sensores integrados
JPWO2020047272A5 (pt)

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: G06F 19/22

Ipc: C12Q 1/68 (2018.01), G01N 21/64 (2006.01), G16B 30

B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 01/06/2017, OBSERVADAS AS CONDICOES LEGAIS